Wie man Daten aus einer Textdatei in Pandas lädt
-
read_csv()Methode zum Laden von Daten aus einer Textdatei -
read_fwf()Methode zum Laden einer Textdatei im Breitenformat in PandasDataFrame -
read_table()Methode zum Laden einer Textdatei in PandasDataFrame
Wir werden die Methoden zum Laden der Daten aus einer txt Datei mit Pandas DataFrame vorstellen. Wir werden auch die verfügbaren Optionen durchgehen.
Zuerst werden wir eine einfache Textdatei namens sample.txt erstellen und der Datei die folgenden Zeilen hinzufügen:
45 apple orange banana mango
12 orange kiwi onion tomato
Wir müssen sie im gleichen Verzeichnis speichern, in dem das Python-Skript ausgeführt wird.
read_csv() Methode zum Laden von Daten aus einer Textdatei
read_csv() ist der beste Weg, eine text-Datei in Pandas DataFrame zu konvertieren. Wir müssen header=None setzen, da wir keine header in der oben erstellten Datei haben. Wir können auch keep_default_na=False innerhalb der Methode setzen, wenn wir leere Werte durch NaN ersetzen wollen.
Beispiel-Codes:
# python 3.x
import pandas as pd
df = pd.read_csv("sample.txt", sep=" ", header=None)
print(df)
Ausgabe:
0 1 2 3 4
0 45 apple orange banana mango
1 12 orange kiwi onion tomato
Wir setzen sep=" ", weil die Werte durch ein einzelnes Leerzeichen getrennt sind. In ähnlicher Weise können wir sep="," setzen, wenn wir Daten aus einer durch Komma getrennten Datei lesen. Ersetzen Sie die Leerzeichen in sample.txt durch , und lassen Sie den Code laufen, nachdem Sie sep=" " durch sep="," ersetzt haben.
Beispiel.txt
45,apple,orange,banana,mango
12,orange,kiwi,,tomato
Kodex:
# python 3.x
import pandas as pd
df = pd.read_csv("sample.txt", sep=",", header=None)
print(df)
Ausgabe:
0 1 2 3 4
0 45 apple orange banana mango
1 12 orange kiwi NaN tomato
read_fwf() Methode zum Laden einer Textdatei im Breitenformat in Pandas DataFrame
read_fwf() ist sehr hilfreich, um eine in der Breite formatierte Textdatei zu laden. Wir können sep nicht benutzen, weil unterschiedliche Werte unterschiedliche Trennzeichen haben können. Betrachten Sie die folgende Textdatei:
Beispiel.txt
45 apple orange banana mango
12 orange kiwi onion tomato
In Beispiel.text ist der Begrenzer nicht für alle Werte gleich. Daher wird read_fwf() hier die Arbeit erledigen.
Code:
# python 3.x
import pandas as pd
df = pd.read_fwf("sample.txt", header=None)
print(df)
Ausgabe:
0 1 2 3 4
0 45 apple orange banana mango
1 12 orange kiwi onion tomato
read_table() Methode zum Laden einer Textdatei in Pandas DataFrame
read_table() ist ein anderer Ansatz, um Daten aus einer Textdatei in Pandas DataFrame zu laden.
Beispiel.txt:
45 apple orange banana mango
12 orange kiwi onion tomato
Der Code:
# python 3.x
import pandas as pd
df = pd.read_table("sample.txt", header=None, sep=" ")
print(df)
Ausgabe:
0 1 2 3 4
0 45 apple orange banana mango
1 12 orange kiwi onion tomato