Pandas축 의미
 
이 튜토리얼에서는 DataFrames 및Series와 같은 Pandas 객체의 다양한 메서드에서 사용되는axis 매개 변수의 의미를 설명합니다.
import pandas as pd
empl_df = pd.DataFrame(
    {
        "Name": ["Jon", "Willy", "Mike", "Luna", "Sam", "Aliza"],
        "Age": [30, 33, 35, 30, 30, 31],
        "Weight(KG)": [75, 75, 80, 70, 73, 70],
        "Height(meters)": [1.7, 1.7, 1.85, 1.75, 1.8, 1.75],
        "Salary($)": [3300, 3500, 4000, 3050, 3500, 3700],
    }
)
print(empl_df)
출력:
    Name  Age  Weight(KG)  Height(meters)  Salary($)
0    Jon   30          75            1.70       3300
1  Willy   33          75            1.70       3500
2   Mike   35          80            1.85       4000
3   Luna   30          70            1.75       3050
4    Sam   30          73            1.80       3500
5  Aliza   31          70            1.75       3700
Pandas 메서드에서axis 매개 변수를 사용하는 방법을 설명하기 위해 DataFrame empl_df를 사용합니다.
Pandas 메서드에서axis 매개 변수 사용
axis 매개 변수는 특정 메소드 또는 함수가 DataFrame에 적용되는 방향을 지정합니다. axis = 0은 함수가 열 단위로 적용되었음을 나타내고, axis = 1은 함수가 DataFrame에서 행 단위로 적용됨을 의미합니다.
열 방식으로 함수를 적용하면 단일 행으로 결과를 얻을 수 있습니다. 행 방식으로 함수를 적용하면 단일 열이있는 DataFrame이 생성됩니다.
예 : Pandas 메서드에서axis = 0 사용
    
import pandas as pd
empl_df = pd.DataFrame(
    {
        "Name": ["Jon", "Willy", "Mike", "Luna", "Sam", "Aliza"],
        "Age": [30, 33, 35, 30, 30, 31],
        "Weight(KG)": [75, 75, 80, 70, 73, 70],
        "Height(meters)": [1.7, 1.7, 1.85, 1.75, 1.8, 1.75],
        "Salary($)": [3300, 3500, 4000, 3050, 3500, 3700],
    }
)
print("The Employee DataFrame is:")
print(empl_df, "\n")
print("The DataFrame with mean values of each column is:")
print(empl_df.mean(axis=0))
출력:
The Employee DataFrame is:
    Name  Age  Weight(KG)  Height(meters)  Salary($)
0    Jon   30          75            1.70       3300
1  Willy   33          75            1.70       3500
2   Mike   35          80            1.85       4000
3   Luna   30          70            1.75       3050
4    Sam   30          73            1.80       3500
5  Aliza   31          70            1.75       3700
The DataFrame with mean values of each column is:
Age                 31.500000
Weight(KG)          73.833333
Height(meters)       1.758333
Salary($)         3508.333333
dtype: float64
DataFrame empl_df의 열 단위 평균을 계산합니다. 평균은 숫자 값이있는 열에 대해서만 계산됩니다.
axis = 0을 설정하면 해당 특정 열의 행 값을 평균하여 각 열의 평균을 계산합니다.
예 : Pandas 메서드에서axis = 1 사용
    
import pandas as pd
empl_df = pd.DataFrame(
    {
        "Name": ["Jon", "Willy", "Mike", "Luna", "Sam", "Aliza"],
        "Age": [30, 33, 35, 30, 30, 31],
        "Weight(KG)": [75, 75, 80, 70, 73, 70],
        "Height(meters)": [1.7, 1.7, 1.85, 1.75, 1.8, 1.75],
        "Salary($)": [3300, 3500, 4000, 3050, 3500, 3700],
    }
)
print("The Employee DataFrame is:")
print(empl_df, "\n")
print("The DataFrame with mean values of each row is:")
print(empl_df.mean(axis=1))
출력:
The Employee DataFrame is:
    Name  Age  Weight(KG)  Height(meters)  Salary($)
0    Jon   30          75            1.70       3300
1  Willy   33          75            1.70       3500
2   Mike   35          80            1.85       4000
3   Luna   30          70            1.75       3050
4    Sam   30          73            1.80       3500
5  Aliza   31          70            1.75       3700
The DataFrame with mean values of each row is:
0     851.6750
1     902.4250
2    1029.2125
3     787.9375
4     901.2000
5     950.6875
dtype: float64
DataFrame empl_df에 대한 행 단위 평균을 계산합니다. 즉, 해당 행에 대한 숫자 유형의 열 값을 평균화하여 각 행의 평균 값을 계산합니다. 마지막에 각 행의 평균 값이있는 단일 열을 얻습니다.
        튜토리얼이 마음에 드시나요? DelftStack을 구독하세요 YouTube에서 저희가 더 많은 고품질 비디오 가이드를 제작할 수 있도록 지원해주세요. 구독하다
    
작가: Suraj Joshi
    Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn관련 문장 - Pandas DataFrame Row
- Pandas DataFrame의 행 수를 얻는 방법
- Pandas에서 DataFrame 행을 무작위로 섞는 방법
- Pandas의 열 값을 기반으로 데이터 프레임 행을 필터링하는 방법
- Pandas에서 DataFrame의 행을 반복하는 방법
- Pandas에서 특정 열이 주어진 조건을 만족하는 모든 행의 색인을 얻는 방법
- Pandas를 사용하여 DataFrame에서 중복 행 찾기
