Pandas축 의미

Suraj Joshi 2021년2월9일
Pandas축 의미

이 튜토리얼에서는 DataFrames 및Series와 같은 Pandas 객체의 다양한 메서드에서 사용되는axis 매개 변수의 의미를 설명합니다.

import pandas as pd

empl_df = pd.DataFrame(
    {
        "Name": ["Jon", "Willy", "Mike", "Luna", "Sam", "Aliza"],
        "Age": [30, 33, 35, 30, 30, 31],
        "Weight(KG)": [75, 75, 80, 70, 73, 70],
        "Height(meters)": [1.7, 1.7, 1.85, 1.75, 1.8, 1.75],
        "Salary($)": [3300, 3500, 4000, 3050, 3500, 3700],
    }
)

print(empl_df)

출력:

    Name  Age  Weight(KG)  Height(meters)  Salary($)
0    Jon   30          75            1.70       3300
1  Willy   33          75            1.70       3500
2   Mike   35          80            1.85       4000
3   Luna   30          70            1.75       3050
4    Sam   30          73            1.80       3500
5  Aliza   31          70            1.75       3700

Pandas 메서드에서axis 매개 변수를 사용하는 방법을 설명하기 위해 DataFrame empl_df를 사용합니다.

Pandas 메서드에서axis 매개 변수 사용

axis 매개 변수는 특정 메소드 또는 함수가 DataFrame에 적용되는 방향을 지정합니다. axis = 0은 함수가 열 단위로 적용되었음을 나타내고, axis = 1은 함수가 DataFrame에서 행 단위로 적용됨을 의미합니다.

열 방식으로 함수를 적용하면 단일 행으로 결과를 얻을 수 있습니다. 행 방식으로 함수를 적용하면 단일 열이있는 DataFrame이 생성됩니다.

예 : Pandas 메서드에서axis = 0 사용

import pandas as pd

empl_df = pd.DataFrame(
    {
        "Name": ["Jon", "Willy", "Mike", "Luna", "Sam", "Aliza"],
        "Age": [30, 33, 35, 30, 30, 31],
        "Weight(KG)": [75, 75, 80, 70, 73, 70],
        "Height(meters)": [1.7, 1.7, 1.85, 1.75, 1.8, 1.75],
        "Salary($)": [3300, 3500, 4000, 3050, 3500, 3700],
    }
)
print("The Employee DataFrame is:")
print(empl_df, "\n")

print("The DataFrame with mean values of each column is:")
print(empl_df.mean(axis=0))

출력:

The Employee DataFrame is:
    Name  Age  Weight(KG)  Height(meters)  Salary($)
0    Jon   30          75            1.70       3300
1  Willy   33          75            1.70       3500
2   Mike   35          80            1.85       4000
3   Luna   30          70            1.75       3050
4    Sam   30          73            1.80       3500
5  Aliza   31          70            1.75       3700

The DataFrame with mean values of each column is:
Age                 31.500000
Weight(KG)          73.833333
Height(meters)       1.758333
Salary($)         3508.333333
dtype: float64

DataFrame empl_df의 열 단위 평균을 계산합니다. 평균은 숫자 값이있는 열에 대해서만 계산됩니다.

axis = 0을 설정하면 해당 특정 열의 행 값을 평균하여 각 열의 평균을 계산합니다.

예 : Pandas 메서드에서axis = 1 사용

import pandas as pd

empl_df = pd.DataFrame(
    {
        "Name": ["Jon", "Willy", "Mike", "Luna", "Sam", "Aliza"],
        "Age": [30, 33, 35, 30, 30, 31],
        "Weight(KG)": [75, 75, 80, 70, 73, 70],
        "Height(meters)": [1.7, 1.7, 1.85, 1.75, 1.8, 1.75],
        "Salary($)": [3300, 3500, 4000, 3050, 3500, 3700],
    }
)
print("The Employee DataFrame is:")
print(empl_df, "\n")

print("The DataFrame with mean values of each row is:")
print(empl_df.mean(axis=1))

출력:

The Employee DataFrame is:
    Name  Age  Weight(KG)  Height(meters)  Salary($)
0    Jon   30          75            1.70       3300
1  Willy   33          75            1.70       3500
2   Mike   35          80            1.85       4000
3   Luna   30          70            1.75       3050
4    Sam   30          73            1.80       3500
5  Aliza   31          70            1.75       3700

The DataFrame with mean values of each row is:
0     851.6750
1     902.4250
2    1029.2125
3     787.9375
4     901.2000
5     950.6875
dtype: float64

DataFrame empl_df에 대한 행 단위 평균을 계산합니다. 즉, 해당 행에 대한 숫자 유형의 열 값을 평균화하여 각 행의 평균 값을 계산합니다. 마지막에 각 행의 평균 값이있는 단일 열을 얻습니다.

작가: Suraj Joshi
Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

관련 문장 - Pandas DataFrame Row

관련 문장 - Pandas DataFrame Column