Obtener lista de Pandas DataFrame Series

Luqman Khan 14 abril 2022
Obtener lista de Pandas DataFrame Series

Python es un lenguaje muy conocido para el análisis de datos, principalmente debido a los paquetes de Python. Pandas es uno de esos paquetes que nos ayudan a analizar datos mucho más fácilmente.

El método tolist() de Pandas convierte una serie en una serie o lista integrada de Python. Por defecto, la serie es del tipo de datos pandas.core.series.Series y método tolist(), convertida a una lista de datos.

Use el método tolist() para obtener la lista de la serie Pandas DataFrame

Este artículo discutirá cómo obtener una lista de la columna Pandas Dataframe. Primero leeremos un archivo CSV en un Pandas DataFrame.

import pandas as pd

# read csv file
df = pd.read_csv("home_price.csv")
# display 3 rows
df = df.head(3)
print(df)

Producción :

   Area  Home price
0  1000       10000
1  1200       12000
2  1300       13000

Ahora extraeremos el valor de la columna y lo convertiremos en la lista, ya que sabemos que tolist() ayuda.

list1 = df["Home price"].values.tolist()
print("extract the value of series and converting into the list")
print(list1)

Producción :

extract the value of series and converting into the list
[10000, 12000, 13000, 14000, 15000]

La lista es un contenedor Python ordenado y flexible, una de las estructuras de datos más comunes en Python. Los elementos se insertan entre corchetes [], separados por comas para crear una lista. La lista puede contener valores duplicados; es por eso que usamos principalmente listas en conjuntos de datos.

import numpy as np
import pandas as pd

# read csv file
df = pd.read_csv("home_price.csv")
# extract the value of series and converting into the list
list1 = df["Home price"].values.tolist()
list1 = np.array(list1)
# type casting in list data type
updated = list(list1 * 1.5)
print("after include 1.5 % tax\n")
print(updated, "new home price")
df["Home price"] = updated
# create new csv
df.to_csv("home prices after 1 year.csv")
df2 = pd.read_csv("home prices after 1 year.csv")
print(df2)

En este caso, los precios se incrementan en 1.5 de impuesto en los días actuales. Ahora creamos una lista llamada lista actualizada y actualizamos la columna existente; Además, creamos un nuevo archivo CSV utilizando el método to_csv().

Producción :

after include 1.5 % tax

[15000.0, 18000.0, 19500.0, 21000.0, 22500.0] new home price
   Unnamed: 0  Area  Home price
0           0  1000     15000.0
1           1  1200     18000.0
2           2  1300     19500.0
3           3  1400     21000.0
4           4  1500     22500.0

Consideremos otro ejemplo simple:

import pandas as pd

df = pd.DataFrame(
    {
        "Country": ["Pakistan", "India", "America", "Russia", "China"],
        "Immigrants": ["2000", "2500", "6000", "4000", "1000"],
        "Years": ["2010", "2008", "2011", "2018", "2016"],
    }
)
print(df, "\n")
list = df.columns.tolist()
print(type(df.columns))
print("\n", list, "\n")
print("After type cast into the list")
print(type(list))

Tenga en cuenta que el tipo de datos de la serie se cambia por tolist(), y obtuvimos una lista con todas las columnas de Dataframe.

Producción :

    Country Immigrants Years
0  Pakistan       2000  2010
1     India       2500  2008
2   America       6000  2011
3    Russia       4000  2018
4     China       1000  2016 

<class 'pandas.core.indexes.base.Index'>

 ['Country', 'Immigrants', 'Years'] 

After type cast into the list
<class 'list'>

Todos los códigos están aquí.

import numpy as np
import pandas as pd

# read csv file
df = pd.read_csv("home_price.csv")
# display 3 rows
df = df.head(3)
print(df)

list1 = df["Home price"].values.tolist()
print("extract the value of series and converting into the list")
print(list1)

# another example
# read csv file
df = pd.read_csv("home_price.csv")
# extract the value of series and converting into the list
list1 = df["Home price"].values.tolist()
list1 = np.array(list1)
# type casting in list data type
updated = list(list1 * 1.5)
print("after include 1.5 % tax\n")
print(updated, "new home price")
df["Home price"] = updated
# create new csv
df.to_csv("home prices after 1 year.csv")
df2 = pd.read_csv("home prices after 1 year.csv")
print(df2)

# another example
df = pd.DataFrame(
    {
        "Country": ["Pakistan", "India", "America", "Russia", "China"],
        "Immigrants": ["2000", "2500", "6000", "4000", "1000"],
        "Years": ["2010", "2008", "2011", "2018", "2016"],
    }
)
print(df, "\n")
list = df.columns.tolist()
print(type(df.columns))
print("\n", list, "\n")
print("After type cast into the list")
print(type(list))

Producción :

   Area  Home price
0  1000       10000
1  1200       12000
2  1300       13000
extract the value of series and converting into the list
[10000, 12000, 13000]
after include 1.5 % tax

[15000.0, 18000.0, 19500.0, 21000.0, 22500.0] new home price
   Unnamed: 0  Area  Home price
0           0  1000     15000.0
1           1  1200     18000.0
2           2  1300     19500.0
3           3  1400     21000.0
4           4  1500     22500.0
    Country Immigrants Years
0  Pakistan       2000  2010
1     India       2500  2008
2   America       6000  2011
3    Russia       4000  2018
4     China       1000  2016 

<class 'pandas.core.indexes.base.Index'>

 ['Country', 'Immigrants', 'Years'] 

After type cast into the list
<class 'list'>

Artículo relacionado - Pandas DataFrame