Pandas read_csv()-Funktion

Suraj Joshi 30 Januar 2023
  1. Syntax von pandas.read_csv():
  2. Beispiel-Codes: Pandas lesen CSV-Datei mit der Funktion pandas.read_csv()
  3. Beispiel-Codes: Setzen Sie den Parameter usecols in der Funktion pandas.read_csv()
  4. Beispiel-Codes: pandas.read_csv() Funktion mit Header
  5. Beispiel-Codes: pandas.read_csv() Funktion mit Zeilenüberspringen
Pandas read_csv()-Funktion

Die MethodePandas read_csv() liest die angegebene Datei mit durch Kommata getrennten Werten (CSV) in DataFrame ein.

Syntax von pandas.read_csv():

pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~ AnyStr]],
                sep=',',
                delimiter=None,
                header='infer',
                names=None,
                index_col=None,
                usecols=None,
                squeeze=False,
                prefix=None,
                mangle_dupe_cols=True,
                dtype=None,
                engine=None,
                converters=None,
                true_values=None,
                false_values=None,
                skipinitialspace=False,
                skiprows=None,
                skipfooter=0,
                nrows=None,
                na_values=None,
                keep_default_na=True,
                na_filter=True,
                verbose=False,
                skip_blank_lines=True,
                parse_dates=False,
                infer_datetime_format=False,
                keep_date_col=False,
                date_parser=None,
                dayfirst=False,
                cache_dates=True,
                iterator=False,
                chunksize=None,
                compression='infer',
                thousands=None,
                decimal: str='.',
                lineterminator=None,
                quotechar='"',
                quoting=0,
                doublequote=True,
                escapechar=None,
                comment=None,
                encoding=None,
                dialect=None,
                error_bad_lines=True,
                warn_bad_lines=True,
                delim_whitespace=False,
                low_memory=True,
                memory_map=False,
                float_precision=None)

Parameter

filepath_or_buffer Speicherort der zu importierenden csv-Datei
delimiter Begrenzer zur Verwendung beim Parsen des Inhalts einer csv-Datei
usecols Die Spaltennamen dürfen nur beim Bilden von DataFrame aus der Datei csv einbezogen werden.
header welche Zeile/Zeilen als Spaltennamen der Kopfzeile verwendet werden sollen
squeeze gibt Pandas-Reihen zurück, wenn die geparsten Daten nur eine Spalte enthalten.
skiprows welche Zeile/Zeilen übersprungen werden sollen

Zurück

Dataframe gebildet aus CSV Datei mit beschrifteten Achsen.

Beispiel-Codes: Pandas lesen CSV-Datei mit der Funktion pandas.read_csv()

import pandas as pd
df = pd.read_csv("dataset.csv")
print(df)

Ausgabe:

       Country      Item Type Sales Channel Order Priority
0       Tuvalu      Baby Food       Offline              H
1   East Timor           Meat        Online              L
2       Norway      Baby Food        Online              L
3     Portugal      Baby Food        Online              H
4     Honduras         Snacks        Online              L
5  New Zealand         Fruits        Online              H
6     Moldova   Personal Care        Online              L

Diese Methode lädt die CSV Datei in den DataFrame. Hier können wir sowohl den absoluten als auch den relativen Pfad verwenden, um einen Dateipfad als Argument für die Funktion pandas.read_csv() bereitzustellen.

In diesem Fall befindet sich der dataset.csv im gleichen Verzeichnis wie die Programmdatei; das bedeutet, daß Sie den Namen der CSV-Datei als Dateipfad verwenden können.

Beispiel-Codes: Setzen Sie den Parameter usecols in der Funktion pandas.read_csv()

import pandas as pd
df = pd.read_csv("dataset.csv",usecols=["Country","Sales Channel","Order Priority"])
print(df)

Ausgabe:

       Country Sales Channel Order Priority
0       Tuvalu       Offline              H
1   East Timor        Online              L
2       Norway        Online              L
3     Portugal        Online              H
4     Honduras        Online              L
5  New Zealand        Online              H
6     Moldova         Online              L

In diesem Fall wird die CSV-Datei in den DataFrame geladen, indem nur die angegebenen Spalten in den usecols-Parameter aufgenommen werden.

Die Spalten Country, Sales Channel und Order Priority werden nur als Parameter übergeben, so daß sie nur im DataFrame enthalten sind.

Beispiel-Codes: pandas.read_csv() Funktion mit Header

import pandas as pd
df = pd.read_csv("dataset.csv",header=1)
print(df)

Ausgabe:

        Tuvalu      Baby Food Offline  H
0   East Timor           Meat  Online  L
1       Norway      Baby Food  Online  L
2     Portugal      Baby Food  Online  H
3     Honduras         Snacks  Online  L
4  New Zealand         Fruits  Online  H
5     Moldova   Personal Care  Online  L

Dieser Prozeß lädt die CSV Datei in den DataFrame, indem die 1. Zeile als Header gesetzt wird.

Hier dienen die Elemente der ersten Zeile als Spaltennamen für den gesamten DataFrame.

Beispiel-Codes: pandas.read_csv() Funktion mit Zeilenüberspringen

import pandas as pd
df = pd.read_csv("dataset.csv",skiprows=3)
print(df)

Ausgabe:

        Norway      Baby Food  Online  L
0     Portugal      Baby Food  Online  H
1     Honduras         Snacks  Online  L
2  New Zealand         Fruits  Online  H
3     Moldova   Personal Care  Online  L

Diese Prozedur lädt die CSV Datei in den DataFrame, indem die ersten 3 Zeilen übersprungen werden.

Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

Verwandter Artikel - Pandas Core