Función read_csv() de los pandas

Suraj Joshi 30 enero 2023
  1. La sintaxis de pandas.read_csv():
  2. Códigos de ejemplo: Los pandas leen el archivo CSV usando la función pandas.read_csv()
  3. Códigos de ejemplo:Establecer el parámetro usecols en la función pandas.read_csv()
  4. Códigos de ejemplo: pandas.read_csv() Función con cabecera
  5. Códigos de ejemplo: pandas.read_csv() Función con salto de filas
Función read_csv() de los pandas

El método Pandas read_csv() lee el archivo de valores separados por comas (CSV) especificado en el DataFrame.

La sintaxis de pandas.read_csv():

pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~ AnyStr]],
                sep=',',
                delimiter=None,
                header='infer',
                names=None,
                index_col=None,
                usecols=None,
                squeeze=False,
                prefix=None,
                mangle_dupe_cols=True,
                dtype=None,
                engine=None,
                converters=None,
                true_values=None,
                false_values=None,
                skipinitialspace=False,
                skiprows=None,
                skipfooter=0,
                nrows=None,
                na_values=None,
                keep_default_na=True,
                na_filter=True,
                verbose=False,
                skip_blank_lines=True,
                parse_dates=False,
                infer_datetime_format=False,
                keep_date_col=False,
                date_parser=None,
                dayfirst=False,
                cache_dates=True,
                iterator=False,
                chunksize=None,
                compression='infer',
                thousands=None,
                decimal: str='.',
                lineterminator=None,
                quotechar='"',
                quoting=0,
                doublequote=True,
                escapechar=None,
                comment=None,
                encoding=None,
                dialect=None,
                error_bad_lines=True,
                warn_bad_lines=True,
                delim_whitespace=False,
                low_memory=True,
                memory_map=False,
                float_precision=None)

Parámetros

filepath_or_buffer ubicación del archivo csv que se va a importar
delimiter Delimitador para usar para analizar el contenido del archivo CSV.
usecols Los nombres de las columnas sólo se incluirán mientras se forma el DataFrame del archivo CSV.
header qué fila o filas utilizar como nombres de columna del encabezamiento
squeeze devuelve la serie de Pandas si los datos analizados sólo contienen una columna.
skiprows qué fila o filas saltar

Retorna

DataFrame formado por un archivo CSV con ejes etiquetados.

Códigos de ejemplo: Los pandas leen el archivo CSV usando la función pandas.read_csv()

import pandas as pd
df = pd.read_csv("dataset.csv")
print(df)

Producción:

       Country      Item Type Sales Channel Order Priority
0       Tuvalu      Baby Food       Offline              H
1   East Timor           Meat        Online              L
2       Norway      Baby Food        Online              L
3     Portugal      Baby Food        Online              H
4     Honduras         Snacks        Online              L
5  New Zealand         Fruits        Online              H
6     Moldova   Personal Care        Online              L

Este método carga el archivo CSV en el DataFrame. Aquí, podemos usar tanto la ruta absoluta como la relativa para proporcionar una ruta de archivo como argumento a la función pandas.read_csv().

En este caso, el dataset.csv está en el mismo directorio que el archivo del programa; esto significa que puedes usar el nombre del archivo CSV como una ruta de archivo.

Códigos de ejemplo:Establecer el parámetro usecols en la función pandas.read_csv()

import pandas as pd
df = pd.read_csv("dataset.csv",usecols=["Country","Sales Channel","Order Priority"])
print(df)

Producción:

       Country Sales Channel Order Priority
0       Tuvalu       Offline              H
1   East Timor        Online              L
2       Norway        Online              L
3     Portugal        Online              H
4     Honduras        Online              L
5  New Zealand        Online              H
6     Moldova         Online              L

Este caso carga el archivo CSV en el DataFrame incluyendo sólo las columnas especificadas en el parámetro usecols.

Las columnas Country, Sales Channel y Order Priority sólo se pasan como parámetros, por lo que sólo se incluyen en el DataFrame.

Códigos de ejemplo: pandas.read_csv() Función con cabecera

import pandas as pd
df = pd.read_csv("dataset.csv",header=1)
print(df)

Producción:

        Tuvalu      Baby Food Offline  H
0   East Timor           Meat  Online  L
1       Norway      Baby Food  Online  L
2     Portugal      Baby Food  Online  H
3     Honduras         Snacks  Online  L
4  New Zealand         Fruits  Online  H
5     Moldova   Personal Care  Online  L

Este proceso carga el archivo CSV en el DataFrame poniendo la primera fila como encabezamiento.

Aquí, los elementos de la primera fila sirven como los nombres de las columnas para todo el DataFrame.

Códigos de ejemplo: pandas.read_csv() Función con salto de filas

import pandas as pd
df = pd.read_csv("dataset.csv",skiprows=3)
print(df)

Producción:

        Norway      Baby Food  Online  L
0     Portugal      Baby Food  Online  H
1     Honduras         Snacks  Online  L
2  New Zealand         Fruits  Online  H
3     Moldova   Personal Care  Online  L

Este procedimiento carga el archivo CSV en el DataFrame saltando las 3 primeras filas.

Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

Artículo relacionado - Pandas Core