Pandas DataFrame.describe() Função

Minahil Noor 30 janeiro 2023 Pandas Pandas DataFrame

Sintaxe de pandas.DataFrame.describe():
Códigos de exemplo: DataFrame.describe() Método para encontrar as estatísticas de uma moldura de dados
Códigos de exemplo: DataFrame.describe() Método para encontrar as estatísticas de cada coluna
Códigos de exemplo: DataFrame.describe() Método para encontrar as estatísticas das colunas numéricas

Python Pandas DataFrame.describe() função informa sobre os dados estatísticos de uma moldura de dados.

Sintaxe de `pandas.DataFrame.describe()`:

DataFrame.describe(
    percentiles=None, include=None, exclude=None, datetime_is_numeric=False
)

Parâmetros


`percentiles`	Este parâmetro diz respeito aos percentis a incluir na produção. Todos os valores devem estar entre 0 e 1. O padrão é `[.25, .5, .75]`, que devolve os percentis 25, 50, e 75.
`include`	Fala sobre os tipos de dados a incluir na produção. Tem três opções. `tudo`: todas as colunas da entrada serão incluídas na saída. Uma lista semelhante à dos tipos de dados: limita os resultados aos tipos de dados fornecidos. `None`: O resultado incluirá todas as colunas numéricas.
`exclude`	Informa sobre os tipos de dados a excluir da produção. Tem duas opções. Uma lista semelhante aos tipos de dados: exclui os tipos de dados fornecidos do resultado. `None`: O resultado não exclui nada.
`datetime_is_numeric`	Um parâmetro booleano. Diz se deve tratar os tipos de dados de data e hora como numéricos.

Devolver

Retorna o resumo das estatísticas da Series ou Dataframe aprovado.

Códigos de exemplo: `DataFrame.describe()` Método para encontrar as estatísticas de uma moldura de dados

import pandas as pd

dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})

print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.describe()
print("Statistics are: \n")
print(dataframe1)

Resultado:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
Statistics are: 

       Attendance  Obtained Marks
count    5.000000        5.000000
mean    82.600000       71.200000
std     15.773395       17.484279
min     60.000000       45.000000
25%     78.000000       64.000000
50%     80.000000       75.000000
75%     95.000000       82.000000
max    100.000000       90.000000

A função devolveu o resumo das estatísticas do quadro de dados. Não passámos nenhum parâmetro, pelo que a função utilizou todos os valores por defeito.

Códigos de exemplo: `DataFrame.describe()` Método para encontrar as estatísticas de cada coluna

Encontraremos as estatísticas de todas as colunas utilizando o parâmetro include.

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.describe(include='all')
print("Statistics are: \n")
print(dataframe1)

Resultado:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
Statistics are: 

        Attendance   Name  Obtained Marks
count     5.000000      5        5.000000
unique         NaN      5             NaN
top            NaN  Kevin             NaN
freq           NaN      1             NaN
mean     82.600000    NaN       71.200000
std      15.773395    NaN       17.484279
min      60.000000    NaN       45.000000
25%      78.000000    NaN       64.000000
50%      80.000000    NaN       75.000000
75%      95.000000    NaN       82.000000
max     100.000000    NaN       90.000000

A função devolveu o resumo das estatísticas de todas as colunas da moldura de dados.

Códigos de exemplo: `DataFrame.describe()` Método para encontrar as estatísticas das colunas numéricas

Agora vamos encontrar as estatísticas das colunas numéricas utilizando apenas o parâmetro exclude.

import pandas as pd

dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.describe(exclude=[object])
print("Statistics are: \n")
print(dataframe1)

Resultado:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
Statistics are: 

       Attendance  Obtained Marks
count    5.000000        5.000000
mean    82.600000       71.200000
std     15.773395       17.484279
min     60.000000       45.000000
25%     78.000000       64.000000
50%     80.000000       75.000000
75%     95.000000       82.000000
max    100.000000       90.000000

Excluímos o tipo de dados object.

Está gostando dos nossos tutoriais? Inscreva-se no DelftStack no YouTube para nos apoiar na criação de mais vídeos tutoriais de alta qualidade. Inscrever-se

Sintaxe de pandas.DataFrame.describe():

Parâmetros

Devolver

Códigos de exemplo: DataFrame.describe() Método para encontrar as estatísticas de uma moldura de dados

Códigos de exemplo: DataFrame.describe() Método para encontrar as estatísticas de cada coluna

Códigos de exemplo: DataFrame.describe() Método para encontrar as estatísticas das colunas numéricas

Artigo relacionado - Pandas DataFrame

Sintaxe de `pandas.DataFrame.describe()`:

Códigos de exemplo: `DataFrame.describe()` Método para encontrar as estatísticas de uma moldura de dados

Códigos de exemplo: `DataFrame.describe()` Método para encontrar as estatísticas de cada coluna

Códigos de exemplo: `DataFrame.describe()` Método para encontrar as estatísticas das colunas numéricas