Función read_csv() de los pandas
-
La sintaxis de
pandas.read_csv(): -
Códigos de ejemplo: Los pandas leen el archivo
CSVusando la funciónpandas.read_csv() -
Códigos de ejemplo:Establecer el parámetro
usecolsen la funciónpandas.read_csv() -
Códigos de ejemplo:
pandas.read_csv()Función con cabecera -
Códigos de ejemplo:
pandas.read_csv()Función con salto de filas
El método Pandas read_csv() lee el archivo de valores separados por comas (CSV) especificado en el DataFrame.
La sintaxis de pandas.read_csv():
pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~ AnyStr]],
sep=',',
delimiter=None,
header='infer',
names=None,
index_col=None,
usecols=None,
squeeze=False,
prefix=None,
mangle_dupe_cols=True,
dtype=None,
engine=None,
converters=None,
true_values=None,
false_values=None,
skipinitialspace=False,
skiprows=None,
skipfooter=0,
nrows=None,
na_values=None,
keep_default_na=True,
na_filter=True,
verbose=False,
skip_blank_lines=True,
parse_dates=False,
infer_datetime_format=False,
keep_date_col=False,
date_parser=None,
dayfirst=False,
cache_dates=True,
iterator=False,
chunksize=None,
compression='infer',
thousands=None,
decimal: str='.',
lineterminator=None,
quotechar='"',
quoting=0,
doublequote=True,
escapechar=None,
comment=None,
encoding=None,
dialect=None,
error_bad_lines=True,
warn_bad_lines=True,
delim_whitespace=False,
low_memory=True,
memory_map=False,
float_precision=None)
Parámetros
filepath_or_buffer |
ubicación del archivo csv que se va a importar |
delimiter |
Delimitador para usar para analizar el contenido del archivo CSV. |
usecols |
Los nombres de las columnas sólo se incluirán mientras se forma el DataFrame del archivo CSV. |
header |
qué fila o filas utilizar como nombres de columna del encabezamiento |
squeeze |
devuelve la serie de Pandas si los datos analizados sólo contienen una columna. |
skiprows |
qué fila o filas saltar |
Retorna
DataFrame formado por un archivo CSV con ejes etiquetados.
Códigos de ejemplo: Los pandas leen el archivo CSV usando la función pandas.read_csv()
import pandas as pd
df = pd.read_csv("dataset.csv")
print(df)
Producción:
Country Item Type Sales Channel Order Priority
0 Tuvalu Baby Food Offline H
1 East Timor Meat Online L
2 Norway Baby Food Online L
3 Portugal Baby Food Online H
4 Honduras Snacks Online L
5 New Zealand Fruits Online H
6 Moldova Personal Care Online L
Este método carga el archivo CSV en el DataFrame. Aquí, podemos usar tanto la ruta absoluta como la relativa para proporcionar una ruta de archivo como argumento a la función pandas.read_csv().
En este caso, el dataset.csv está en el mismo directorio que el archivo del programa; esto significa que puedes usar el nombre del archivo CSV como una ruta de archivo.
Códigos de ejemplo:Establecer el parámetro usecols en la función pandas.read_csv()
import pandas as pd
df = pd.read_csv("dataset.csv",usecols=["Country","Sales Channel","Order Priority"])
print(df)
Producción:
Country Sales Channel Order Priority
0 Tuvalu Offline H
1 East Timor Online L
2 Norway Online L
3 Portugal Online H
4 Honduras Online L
5 New Zealand Online H
6 Moldova Online L
Este caso carga el archivo CSV en el DataFrame incluyendo sólo las columnas especificadas en el parámetro usecols.
Las columnas Country, Sales Channel y Order Priority sólo se pasan como parámetros, por lo que sólo se incluyen en el DataFrame.
Códigos de ejemplo: pandas.read_csv() Función con cabecera
import pandas as pd
df = pd.read_csv("dataset.csv",header=1)
print(df)
Producción:
Tuvalu Baby Food Offline H
0 East Timor Meat Online L
1 Norway Baby Food Online L
2 Portugal Baby Food Online H
3 Honduras Snacks Online L
4 New Zealand Fruits Online H
5 Moldova Personal Care Online L
Este proceso carga el archivo CSV en el DataFrame poniendo la primera fila como encabezamiento.
Aquí, los elementos de la primera fila sirven como los nombres de las columnas para todo el DataFrame.
Códigos de ejemplo: pandas.read_csv() Función con salto de filas
import pandas as pd
df = pd.read_csv("dataset.csv",skiprows=3)
print(df)
Producción:
Norway Baby Food Online L
0 Portugal Baby Food Online H
1 Honduras Snacks Online L
2 New Zealand Fruits Online H
3 Moldova Personal Care Online L
Este procedimiento carga el archivo CSV en el DataFrame saltando las 3 primeras filas.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn