Fonction Pandas read_csv()

Suraj Joshi 30 janvier 2023
  1. Syntaxe de pandas.read_csv() :
  2. Exemples de codes : Pandas Lire le fichier CSV en utilisant pandas.read_csv() Fonction
  3. Exemples de codes : Définir le paramètre usecols dans pandas.read_csv() Fonction
  4. Exemples de codes : pandas.read_csv() Fonction avec en-tête
  5. Exemples de codes : pandas.read_csv() Fonction avec saut de ligne
Fonction Pandas read_csv()

La méthode Pandas read_csv() lit le fichier de valeurs séparées par des virgules (CSV) spécifié dans le DataFrame.

Syntaxe de pandas.read_csv() :

pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~ AnyStr]],
                sep=',',
                delimiter=None,
                header='infer',
                names=None,
                index_col=None,
                usecols=None,
                squeeze=False,
                prefix=None,
                mangle_dupe_cols=True,
                dtype=None,
                engine=None,
                converters=None,
                true_values=None,
                false_values=None,
                skipinitialspace=False,
                skiprows=None,
                skipfooter=0,
                nrows=None,
                na_values=None,
                keep_default_na=True,
                na_filter=True,
                verbose=False,
                skip_blank_lines=True,
                parse_dates=False,
                infer_datetime_format=False,
                keep_date_col=False,
                date_parser=None,
                dayfirst=False,
                cache_dates=True,
                iterator=False,
                chunksize=None,
                compression='infer',
                thousands=None,
                decimal: str='.',
                lineterminator=None,
                quotechar='"',
                quoting=0,
                doublequote=True,
                escapechar=None,
                comment=None,
                encoding=None,
                dialect=None,
                error_bad_lines=True,
                warn_bad_lines=True,
                delim_whitespace=False,
                low_memory=True,
                memory_map=False,
                float_precision=None)

Paramètres

filepath_or_buffer emplacement du fichier csv à importer
delimiter Délimiteur à utiliser pour l’analyse du contenu d’un fichier csv
usecols Les noms de colonnes à inclure uniquement lors de la formation de la DataFrame à partir du fichier csv.
header la ou les lignes à utiliser comme noms de colonne de l’en-tête
squeeze retourne les séries Pandas si les données analysées ne contiennent qu’une colonne.
skiprows quelle(s) ligne(s) sauter

Renvoie

Dataframe formé à partir d’un fichier CSV avec des axes étiquetés.

Exemples de codes : Pandas Lire le fichier CSV en utilisant pandas.read_csv() Fonction

import pandas as pd
df = pd.read_csv("dataset.csv")
print(df)

Production:

       Country      Item Type Sales Channel Order Priority
0       Tuvalu      Baby Food       Offline              H
1   East Timor           Meat        Online              L
2       Norway      Baby Food        Online              L
3     Portugal      Baby Food        Online              H
4     Honduras         Snacks        Online              L
5  New Zealand         Fruits        Online              H
6     Moldova   Personal Care        Online              L

Cette méthode charge le fichier CSV dans la DataFrame. Ici, nous pouvons utiliser à la fois les chemins absolu et relatif pour fournir un chemin de fichier comme argument à la fonction pandas.read_csv().

Dans ce cas, le fichier dataset.csv se trouve dans le même répertoire que le fichier programme ; cela signifie que vous pouvez utiliser le nom du fichier CSV comme chemin de fichier.

Exemples de codes : Définir le paramètre usecols dans pandas.read_csv() Fonction

import pandas as pd
df = pd.read_csv("dataset.csv",usecols=["Country","Sales Channel","Order Priority"])
print(df)

Production:

       Country Sales Channel Order Priority
0       Tuvalu       Offline              H
1   East Timor        Online              L
2       Norway        Online              L
3     Portugal        Online              H
4     Honduras        Online              L
5  New Zealand        Online              H
6     Moldova         Online              L

Ce cas charge le fichier CSV dans le DataFrame en incluant seulement les colonnes spécifiées dans le paramètre usecols.

Les colonnes Country, Sales Channel, et Order Priority sont seulement passées en tant que paramètres, donc elles sont seulement incluses dans le DataFrame.

Exemples de codes : pandas.read_csv() Fonction avec en-tête

import pandas as pd
df = pd.read_csv("dataset.csv",header=1)
print(df)

Production:

        Tuvalu      Baby Food Offline  H
0   East Timor           Meat  Online  L
1       Norway      Baby Food  Online  L
2     Portugal      Baby Food  Online  H
3     Honduras         Snacks  Online  L
4  New Zealand         Fruits  Online  H
5     Moldova   Personal Care  Online  L

Ce processus charge le fichier CSV dans le DataFrame en définissant la 1ère ligne comme en-tête.

Ici, les éléments de la première ligne servent de noms de colonnes pour l’ensemble du DataFrame.

Exemples de codes : pandas.read_csv() Fonction avec saut de ligne

import pandas as pd
df = pd.read_csv("dataset.csv",skiprows=3)
print(df)

Production:

        Norway      Baby Food  Online  L
0     Portugal      Baby Food  Online  H
1     Honduras         Snacks  Online  L
2  New Zealand         Fruits  Online  H
3     Moldova   Personal Care  Online  L

Cette procédure charge le fichier CSV dans le DataFrame en sautant les 3 premières lignes.

Auteur: Suraj Joshi
Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

Article connexe - Pandas Core