Obtenir la liste de la série Pandas DataFrame

Luqman Khan 14 avril 2022
Obtenir la liste de la série Pandas DataFrame

Python est un langage bien connu pour l’analyse de données, principalement en raison des packages Python. Pandas est l’un de ces packages qui nous aide à analyser les données beaucoup plus facilement.

La méthode tolist() de Pandas convertit une série en une série ou une liste intégrée de Python. Par défaut, la série est du type de données pandas.core.series.Series et de la méthode tolist(), convertie en une liste de données.

Utilisez la méthode tolist() pour obtenir la liste de la série Pandas DataFrame

Cet article explique comment obtenir une liste à partir de la colonne Pandas Dataframe. Nous allons d’abord lire un fichier CSV dans un Pandas DataFrame.

import pandas as pd

# read csv file
df = pd.read_csv("home_price.csv")
# display 3 rows
df = df.head(3)
print(df)

Production :

   Area  Home price
0  1000       10000
1  1200       12000
2  1300       13000

Maintenant, nous allons extraire la valeur de la colonne et la convertir en liste car nous savons que tolist() aide.

list1 = df["Home price"].values.tolist()
print("extract the value of series and converting into the list")
print(list1)

Production :

extract the value of series and converting into the list
[10000, 12000, 13000, 14000, 15000]

La liste est un conteneur Python ordonné et flexible, l’une des structures de données les plus courantes en Python. Les éléments sont insérés entre crochets [], séparés par des virgules pour créer une liste. La liste peut contenir des valeurs en double ; c’est pourquoi nous utilisons principalement des listes dans les ensembles de données.

import numpy as np
import pandas as pd

# read csv file
df = pd.read_csv("home_price.csv")
# extract the value of series and converting into the list
list1 = df["Home price"].values.tolist()
list1 = np.array(list1)
# type casting in list data type
updated = list(list1 * 1.5)
print("after include 1.5 % tax\n")
print(updated, "new home price")
df["Home price"] = updated
# create new csv
df.to_csv("home prices after 1 year.csv")
df2 = pd.read_csv("home prices after 1 year.csv")
print(df2)

Dans ce cas, les prix sont majorés de 1.5 taxe de nos jours. Maintenant, nous créons une liste nommée liste “mise à jour” et mettons à jour la colonne existante ; de plus, nous créons un nouveau fichier CSV en utilisant la méthode to_csv().

Production :

after include 1.5 % tax

[15000.0, 18000.0, 19500.0, 21000.0, 22500.0] new home price
   Unnamed: 0  Area  Home price
0           0  1000     15000.0
1           1  1200     18000.0
2           2  1300     19500.0
3           3  1400     21000.0
4           4  1500     22500.0

Prenons un autre exemple simple :

import pandas as pd

df = pd.DataFrame(
    {
        "Country": ["Pakistan", "India", "America", "Russia", "China"],
        "Immigrants": ["2000", "2500", "6000", "4000", "1000"],
        "Years": ["2010", "2008", "2011", "2018", "2016"],
    }
)
print(df, "\n")
list = df.columns.tolist()
print(type(df.columns))
print("\n", list, "\n")
print("After type cast into the list")
print(type(list))

Veuillez noter que le type de données de la série est modifié par tolist(), et nous avons obtenu une liste avec toutes les colonnes de Dataframe.

Production :

    Country Immigrants Years
0  Pakistan       2000  2010
1     India       2500  2008
2   America       6000  2011
3    Russia       4000  2018
4     China       1000  2016 

<class 'pandas.core.indexes.base.Index'>

 ['Country', 'Immigrants', 'Years'] 

After type cast into the list
<class 'list'>

Tous les codes sont ici.

import numpy as np
import pandas as pd

# read csv file
df = pd.read_csv("home_price.csv")
# display 3 rows
df = df.head(3)
print(df)

list1 = df["Home price"].values.tolist()
print("extract the value of series and converting into the list")
print(list1)

# another example
# read csv file
df = pd.read_csv("home_price.csv")
# extract the value of series and converting into the list
list1 = df["Home price"].values.tolist()
list1 = np.array(list1)
# type casting in list data type
updated = list(list1 * 1.5)
print("after include 1.5 % tax\n")
print(updated, "new home price")
df["Home price"] = updated
# create new csv
df.to_csv("home prices after 1 year.csv")
df2 = pd.read_csv("home prices after 1 year.csv")
print(df2)

# another example
df = pd.DataFrame(
    {
        "Country": ["Pakistan", "India", "America", "Russia", "China"],
        "Immigrants": ["2000", "2500", "6000", "4000", "1000"],
        "Years": ["2010", "2008", "2011", "2018", "2016"],
    }
)
print(df, "\n")
list = df.columns.tolist()
print(type(df.columns))
print("\n", list, "\n")
print("After type cast into the list")
print(type(list))

Production :

   Area  Home price
0  1000       10000
1  1200       12000
2  1300       13000
extract the value of series and converting into the list
[10000, 12000, 13000]
after include 1.5 % tax

[15000.0, 18000.0, 19500.0, 21000.0, 22500.0] new home price
   Unnamed: 0  Area  Home price
0           0  1000     15000.0
1           1  1200     18000.0
2           2  1300     19500.0
3           3  1400     21000.0
4           4  1500     22500.0
    Country Immigrants Years
0  Pakistan       2000  2010
1     India       2500  2008
2   America       6000  2011
3    Russia       4000  2018
4     China       1000  2016 

<class 'pandas.core.indexes.base.Index'>

 ['Country', 'Immigrants', 'Years'] 

After type cast into the list
<class 'list'>

Article connexe - Pandas DataFrame