Pandas ermitteln die erste Zeile eines DataFrame

Suraj Joshi 30 Januar 2023
  1. Die erste Zeile eines Pandas DataFrame mit der Eigenschaft pandas.DataFrame.iloc holen
  2. Die erste Zeile aus einem Pandas DataFrame basierend auf einer spezifizierten Bedingung holen
Pandas ermitteln die erste Zeile eines DataFrame

Dieses Tutorial erklärt, wie wir die erste Zeile aus einem Pandas DataFrame mit Hilfe der Eigenschaft pandas.DataFrame.iloc und der Methode pandas.DataFrame.head() abrufen können.

Wir werden den DataFrame im folgenden Beispiel verwenden, um zu erklären, wie wir die erste Zeile aus einem Pandas DataFrame erhalten können.

import pandas as pd


df = pd.DataFrame(
    {
        "C_1": ["A", "B", "C", "D"],
        "C_2": [40, 34, 38, 45],
        "C_3": [430, 980, 200, 350],
    }
)

print(df)

Ausgabe:

  C_1  C_2  C_3
0   A   40  430
1   B   34  980
2   C   38  200
3   D   45  350

Die erste Zeile eines Pandas DataFrame mit der Eigenschaft pandas.DataFrame.iloc holen

import pandas as pd


df = pd.DataFrame(
    {
        "C_1": ["A", "B", "C", "D"],
        "C_2": [40, 34, 38, 45],
        "C_3": [430, 980, 200, 350],
    }
)

row_1 = df.iloc[0]

print("The DataFrame is:")
print(df, "\n")

print("The First Row of the DataFrame is:")
print(row_1)

Ausgabe:

The DataFrame is:
  C_1  C_2  C_3
0   A   40  430
1   B   34  980
2   C   38  200
3   D   45  350

The First Row of the DataFrame is:
C_1      A
C_2     40
C_3    430
Name: 0, dtype: object

Es wird die erste Zeile des DataFrame df angezeigt. Um die erste Zeile auszuwählen, verwenden wir den Standardindex der ersten Zeile, d.h. 0 mit der Eigenschaft iloc des DataFrame.

Abrufen der ersten Zeile aus einem Pandas DataFrame mit der Methode pandas.DataFrame.head()

Die Methode pandas.DataFrame.head() gibt einen DataFrame mit den obersten 5 Zeilen des DataFrame zurück. Wir können auch eine Zahl als Argument an die Methode pandas.DataFrame.head() übergeben, die die Anzahl der obersten Zeilen angibt, die ausgewählt werden sollen. Wir können 1 als Argument an die Methode pandas.DataFrame.head() übergeben, um nur die erste Zeile des DataFrame auszuwählen.

import pandas as pd


df = pd.DataFrame(
    {
        "C_1": ["A", "B", "C", "D"],
        "C_2": [40, 34, 38, 45],
        "C_3": [430, 980, 200, 350],
    }
)

row_1 = df.head(1)

print("The DataFrame is:")
print(df, "\n")

print("The First Row of the DataFrame is:")
print(row_1)

Ausgabe:

The DataFrame is:
  C_1  C_2  C_3
0   A   40  430
1   B   34  980
2   C   38  200
3   D   45  350

The First Row of the DataFrame is:
  C_1  C_2  C_3
0   A   40  430

Die erste Zeile aus einem Pandas DataFrame basierend auf einer spezifizierten Bedingung holen

Um die erste Zeile, die bestimmte Bedingungen erfüllt, aus einem DataFrame zu extrahieren, filtern wir zunächst die Zeilen, die bestimmte Bedingungen erfüllen, und wählen dann die erste Zeile aus dem gefilterten DataFrame mit Hilfe der oben beschriebenen Methoden aus.

import pandas as pd


df = pd.DataFrame(
    {
        "C_1": ["A", "B", "C", "D"],
        "C_2": [40, 34, 38, 45],
        "C_3": [430, 980, 500, 350],
    }
)

filtered_df = df[(df.C_2 < 40) & (df.C_3 > 450)]

row_1_filtered = filtered_df.head(1)

print("The DataFrame is:")
print(df, "\n")

print("The Filtered DataFrame is:")
print(filtered_df, "\n")


print("The First Row with C_2 less than 45 and C_3 greater than 450 is:")
print(row_1_filtered)

Ausgabe:

The DataFrame is:
  C_1  C_2  C_3
0   A   40  430
1   B   34  980
2   C   38  500
3   D   45  350

The Filtered DataFrame is:
  C_1  C_2  C_3
1   B   34  980
2   C   38  500

The First Row with C_2 less than 45 and C_3 greater than 450 is:
  C_1  C_2  C_3
1   B   34  980

Es wird die erste Zeile angezeigt, bei der der Wert der Spalte C_2 kleiner als 45 und der Wert der Spalte C_3 größer als 450 ist.

Wir können auch die Methode query() verwenden, um die Zeilen aus dem DataFrame zu filtern.

import pandas as pd


df = pd.DataFrame(
    {
        "C_1": ["A", "B", "C", "D"],
        "C_2": [40, 34, 38, 45],
        "C_3": [430, 980, 500, 350],
    }
)

filtered_df = df.query("(C_2 < 40) & (C_3 > 450)")

row_1_filtered = filtered_df.head(1)

print("The DataFrame is:")
print(df, "\n")

print("The Filtered DataFrame is:")
print(filtered_df, "\n")


print("The First Row with C_2 less than 45 and C_3 greater than 450 is:")
print(row_1_filtered)

Ausgabe:

The DataFrame is:
  C_1  C_2  C_3
0   A   40  430
1   B   34  980
2   C   38  500
3   D   45  350

The Filtered DataFrame is:
  C_1  C_2  C_3
1   B   34  980
2   C   38  500

The First Row with C_2 less than 45 and C_3 greater than 450 is:
  C_1  C_2  C_3
1   B   34  980

Es werden alle Zeilen mit dem Wert der Spalte C_2 kleiner als 45 und dem Wert der Spalte C_3 größer als 450 mit der Methode query() gefiltert und dann die erste Zeile aus dem filtered_df mit der Methode head() ausgewählt.

Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

Verwandter Artikel - Pandas DataFrame Row