在 Pandas 中執行 T 檢驗

Preet Sanghavi 2022年5月16日
在 Pandas 中執行 T 檢驗

本教程將討論如何在 Pandas 中找到 T 檢驗值。

在 Pandas 中執行 T 檢驗的步驟

以下是在 Pandas 中執行 T 檢驗的步驟。

匯入相關庫

我們必須從 scipy.stats 匯入 Pandas 庫和 ttest_ind 才能開始。

import pandas as pd
from scipy.stats import ttest_ind

建立一個 Pandas DataFrame

讓我們建立一個示例 DataFrame 來對同一 DataFrame 執行 T 檢驗操作。

data = {
    "Category": [
        "type2",
        "type1",
        "type2",
        "type1",
        "type2",
        "type1",
        "type2",
        "type1",
        "type1",
        "type1",
        "type2",
    ],
    "values": [1, 2, 3, 1, 2, 3, 1, 2, 3, 5, 1],
}
df = pd.DataFrame(data)

我們建立了一個 DataFrame,其中包含一個包含兩種類別的類別列,併為每個類別例項分配了一個值。

讓我們在下面檢視我們的 DataFrame。

print(df)

輸出:

   Category  values
0     type2       1
1     type1       2
2     type2       3
3     type1       1
4     type2       2
5     type1       3
6     type2       1
7     type1       2
8     type1       3
9     type1       5
10    type2       1

我們現在將使用以下程式碼為這兩種類別型別建立一個單獨的 DataFrame。此步驟有助於 T 檢驗查詢過程。

type1 = my_data[my_data["Category"] == "type1"]
type2 = my_data[my_data["Category"] == "type2"]

在 Pandas 中獲取 T 檢驗值

我們現在將找到 T 檢驗結果並使用 ttest_ind() 函式將它們儲存在一個變數中。我們通過以下方式使用此功能。

res = ttest_ind(type1["values"], type2["values"])

在上面的程式碼中,我們將 DataFrame 作為引數傳遞給函式,我們得到了 T 檢驗結果,包括一個具有 t 統計量和 p 值的元組。

現在讓我們列印 res 變數以檢視結果。

print(res)

輸出:

Ttest_indResult(statistic=1.4927289925706944, pvalue=0.16970867501294376)

在上面的輸出中,我們找到了具有 t 統計量和 p 值的 T 檢驗值。因此,我們可以通過上述方法成功找到 Pandas 中的 T 檢驗值。

作者: Preet Sanghavi
Preet Sanghavi avatar Preet Sanghavi avatar

Preet writes his thoughts about programming in a simplified manner to help others learn better. With thorough research, his articles offer descriptive and easy to understand solutions.

LinkedIn GitHub

相關文章 - Pandas DataFrame