JSON-Datei in Pandas laden

Suraj Joshi 17 Februar 2021
  1. JSON-Datei in Pandas DataFrame laden
  2. Laden einer indexorientierten JSON-Datei in Pandas DataFrame
  3. Laden einer spaltenorientierten JSON-Datei in Pandas DataFrame
JSON-Datei in Pandas laden

Dieses Tutorial erklärt, wie wir eine JSON-Datei in den Pandas DataFrame laden können, indem wir die Methode pandas.read_json() verwenden.

JSON-Datei in Pandas DataFrame laden

Wir können eine JSON-Datei mit der Funktion pandas.read_json() in einen Pandas DataFrame laden, indem wir den Pfad der JSON-Datei als Parameter an die Funktion pandas.read_json() übergeben.

{
    "Name": {"1": "Anil", "2": "Biraj", "3": "Apil", "4": "Kapil"},
    "Age": {"1": 23, "2": 25, "3": 28, "4": 30},
}

Der Inhalt der Beispieldatei data.json ist oben dargestellt. Wir werden einen DataFrame aus der obigen JSON-Datei erstellen.

import pandas as pd

df = pd.read_json("data.json")

print("DataFrame generated using JSON file:")
print(df)

Ausgabe:

DataFrame generated using JSON file:
    Name  Age
1   Anil   23
2  Biraj   25
3   Apil   28
4  Kapil   30

Es wird der DataFrame angezeigt, der aus den Daten in der Datei data.json erzeugt wurde. Wir müssen sicherstellen, dass wir die Datei data.json in unserem aktuellen Arbeitsverzeichnis haben, um den DataFrame zu generieren; andernfalls müssen wir den vollständigen Pfad der JSON-Datei als Argument für die Methode pandas.read_json() angeben.

Der DataFrame, der aus der JSON-Datei gebildet wird, hängt von der Ausrichtung der JSON-Datei ab. Es gibt drei verschiedene Ausrichtungen der JSON-Datei im Allgemeinen.

  • Indexorientiert
  • Werteorientiert
  • Spaltenorientiert

Laden einer indexorientierten JSON-Datei in Pandas DataFrame

{
    "0": {"Name": "Anil", "Age": 23},
    "1": {"Name": "Biraj", "Age": 25},
    "2": {"Name": "Apil", "Age": 26},
}

Dies ist ein Beispiel für eine indexorientierte JSON-Datei, bei der die Schlüssel der obersten Ebene die Indizes der Daten darstellen.

import pandas as pd

df = pd.read_json("data.json")

print("DataFrame generated from Index Oriented JSON file:")
print(df)

Ausgabe:

DataFrame generated from Index Oriented JSON file:
         0      1     2
Name  Anil  Biraj  Apil
Age     23     25    26

Es wird ein DataFrame aus der Datei data.json erstellt, wobei die Schlüssel der obersten Ebene als Spalten im DataFrame dargestellt werden.

Laden einer wertorientierten JSON-Datei in Pandas DataFrame

[["Anil", 23], ["Biraj", 25], ["Apil", 26]]

Dies ist ein Beispiel für eine wertorientierte JSON-Datei, bei der jedes Element des Arrays die Werte der einzelnen Zeilen repräsentiert.

import pandas as pd

df = pd.read_json("data.json")

print("DataFrame generated from Value Oriented JSON file:")
print(df)

Ausgabe:

DataFrame generated from Value Oriented JSON file:
       0   1
0   Anil  23
1  Biraj  25
2   Apil  26

Es wird ein DataFrame aus der Datei data.json erstellt, wobei jedes Element des Arrays in der JSON-Datei als eine Zeile im DataFrame dargestellt wird.

Laden einer spaltenorientierten JSON-Datei in Pandas DataFrame

{"Name": {"1": "Anil", "2": "Biraj", "3": "Apil"}, "Age": {"1": 23, "2": 25, "3": 28}}

Dies ist ein Beispiel für einen spaltenorientierten JSON-Datei-Top-Level-Index, der den Namen der Spalte für die Daten darstellt.

import pandas as pd

df = pd.read_json("data.json")

print("DataFrame generated from  Column Oriented JSON file:")
print(df)

Ausgabe:

DataFrame generated from Column Oriented JSON file:
    Name  Age
1   Anil   23
2  Biraj   25
3   Apil   28

Es wird ein DataFrame aus der Datei data.json erstellt, wobei der Top-Level-Schlüssel der JSON-Datei als Spaltenname im DataFrame dargestellt wird.

Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

Verwandter Artikel - Pandas DataFrame