Pandas read_csv()-Funktion
-
Syntax von
pandas.read_csv(): -
Beispiel-Codes: Pandas lesen
CSV-Datei mit der Funktionpandas.read_csv() -
Beispiel-Codes: Setzen Sie den Parameter
usecolsin der Funktionpandas.read_csv() -
Beispiel-Codes:
pandas.read_csv()Funktion mit Header -
Beispiel-Codes:
pandas.read_csv()Funktion mit Zeilenüberspringen
Die MethodePandas read_csv() liest die angegebene Datei mit durch Kommata getrennten Werten (CSV) in DataFrame ein.
Syntax von pandas.read_csv():
pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~ AnyStr]],
sep=',',
delimiter=None,
header='infer',
names=None,
index_col=None,
usecols=None,
squeeze=False,
prefix=None,
mangle_dupe_cols=True,
dtype=None,
engine=None,
converters=None,
true_values=None,
false_values=None,
skipinitialspace=False,
skiprows=None,
skipfooter=0,
nrows=None,
na_values=None,
keep_default_na=True,
na_filter=True,
verbose=False,
skip_blank_lines=True,
parse_dates=False,
infer_datetime_format=False,
keep_date_col=False,
date_parser=None,
dayfirst=False,
cache_dates=True,
iterator=False,
chunksize=None,
compression='infer',
thousands=None,
decimal: str='.',
lineterminator=None,
quotechar='"',
quoting=0,
doublequote=True,
escapechar=None,
comment=None,
encoding=None,
dialect=None,
error_bad_lines=True,
warn_bad_lines=True,
delim_whitespace=False,
low_memory=True,
memory_map=False,
float_precision=None)
Parameter
filepath_or_buffer |
Speicherort der zu importierenden csv-Datei |
delimiter |
Begrenzer zur Verwendung beim Parsen des Inhalts einer csv-Datei |
usecols |
Die Spaltennamen dürfen nur beim Bilden von DataFrame aus der Datei csv einbezogen werden. |
header |
welche Zeile/Zeilen als Spaltennamen der Kopfzeile verwendet werden sollen |
squeeze |
gibt Pandas-Reihen zurück, wenn die geparsten Daten nur eine Spalte enthalten. |
skiprows |
welche Zeile/Zeilen übersprungen werden sollen |
Zurück
Dataframe gebildet aus CSV Datei mit beschrifteten Achsen.
Beispiel-Codes: Pandas lesen CSV-Datei mit der Funktion pandas.read_csv()
import pandas as pd
df = pd.read_csv("dataset.csv")
print(df)
Ausgabe:
Country Item Type Sales Channel Order Priority
0 Tuvalu Baby Food Offline H
1 East Timor Meat Online L
2 Norway Baby Food Online L
3 Portugal Baby Food Online H
4 Honduras Snacks Online L
5 New Zealand Fruits Online H
6 Moldova Personal Care Online L
Diese Methode lädt die CSV Datei in den DataFrame. Hier können wir sowohl den absoluten als auch den relativen Pfad verwenden, um einen Dateipfad als Argument für die Funktion pandas.read_csv() bereitzustellen.
In diesem Fall befindet sich der dataset.csv im gleichen Verzeichnis wie die Programmdatei; das bedeutet, daß Sie den Namen der CSV-Datei als Dateipfad verwenden können.
Beispiel-Codes: Setzen Sie den Parameter usecols in der Funktion pandas.read_csv()
import pandas as pd
df = pd.read_csv("dataset.csv",usecols=["Country","Sales Channel","Order Priority"])
print(df)
Ausgabe:
Country Sales Channel Order Priority
0 Tuvalu Offline H
1 East Timor Online L
2 Norway Online L
3 Portugal Online H
4 Honduras Online L
5 New Zealand Online H
6 Moldova Online L
In diesem Fall wird die CSV-Datei in den DataFrame geladen, indem nur die angegebenen Spalten in den usecols-Parameter aufgenommen werden.
Die Spalten Country, Sales Channel und Order Priority werden nur als Parameter übergeben, so daß sie nur im DataFrame enthalten sind.
Beispiel-Codes: pandas.read_csv() Funktion mit Header
import pandas as pd
df = pd.read_csv("dataset.csv",header=1)
print(df)
Ausgabe:
Tuvalu Baby Food Offline H
0 East Timor Meat Online L
1 Norway Baby Food Online L
2 Portugal Baby Food Online H
3 Honduras Snacks Online L
4 New Zealand Fruits Online H
5 Moldova Personal Care Online L
Dieser Prozeß lädt die CSV Datei in den DataFrame, indem die 1. Zeile als Header gesetzt wird.
Hier dienen die Elemente der ersten Zeile als Spaltennamen für den gesamten DataFrame.
Beispiel-Codes: pandas.read_csv() Funktion mit Zeilenüberspringen
import pandas as pd
df = pd.read_csv("dataset.csv",skiprows=3)
print(df)
Ausgabe:
Norway Baby Food Online L
0 Portugal Baby Food Online H
1 Honduras Snacks Online L
2 New Zealand Fruits Online H
3 Moldova Personal Care Online L
Diese Prozedur lädt die CSV Datei in den DataFrame, indem die ersten 3 Zeilen übersprungen werden.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn