Erstellen Sie einen großen DataFrame in R

Jinku Hu 30 Januar 2023
  1. Verwenden von Vektoren und Faktoren zum Erstellen eines DataFrames in R
  2. Verwenden Sie Liste, um einen DataFrame in R . zu erstellen
  3. Verwenden Sie Matrix, um einen DataFrame in R . zu erstellen
Erstellen Sie einen großen DataFrame in R

In diesem Artikel werden verschiedene Methoden zum Erstellen eines großen DataFrames in R erläutert.

Verwenden von Vektoren und Faktoren zum Erstellen eines DataFrames in R

Ein DataFrame ist die mächtigste integrierte Datenstruktur der R-Sprache und ähnelt der Tabellenmatrix, in der jede Spalte die gleiche Länge hat und Namen haben muss. Darunter hat es jedoch mehr listen-ähnliche Funktionen, da jede Spalte des DataFrames so behandelt wird, als ob sie ein Element der Liste-Datenstruktur wäre. Auf der positiven Seite können wir einen DataFrame mit der Mischung aus Vektoren und Faktoren erstellen, wie im folgenden Codeausschnitt gezeigt. Wir verwenden die Funktion data.frame, um aus Vektoren und Faktoren ein Data-Frame-Objekt zu erstellen.

v1 <- c(1.1, 1.2, 1.3, 2.1, 2.2, 2.3)
v2 <- c(11, 12, 13, 21, 22, 23)
v3 <- c(1, 2, 3, 1, 2, 3)
wday <- factor(c("Wed", "Thu", "Mon", "Wed", "Thu", "Fri"))

df2 <- data.frame(v1, v2, v3, wday)

Ausgabe:

v1 v2 v3 wday
1 1.1 11  1  Wed
2 1.2 12  2  Thu
3 1.3 13  3  Mon
4 2.1 21  1  Wed
5 2.2 22  2  Thu
6 2.3 23  3  Fri

Verwenden Sie Liste, um einen DataFrame in R . zu erstellen

Alternativ kann mit dem Listenobjekt ein DataFrameobjekt erstellt werden. Allerdings erfordert diese Methode eine andere Funktion namens as.data.frame, die ein einzelnes Listenobjekt in einen DataFrame umwandelt. Beachten Sie, dass wir im folgenden Beispiel das Listenobjekt mit der Funktion list konstruieren und den Aufruf als Argument des as.data.frame verketten. Da der DataFrame die Spaltenbeschriftungen haben muss, werden diese normalerweise automatisch ausgewählt, wenn der Benutzer sie nicht vorgibt. Wenn bei der Konvertierung die unerwünschten Namen gewählt werden, kann man immer die Funktion colnames aufrufen und ihr einen Vektor von Spaltennamen zuweisen.

v1 <- c(1.1, 1.2, 1.3, 2.1, 2.2, 2.3)
v2 <- c(11, 12, 13, 21, 22, 23)
v3 <- c(1, 2, 3, 1, 2, 3)
wday <- factor(c("Wed", "Thu", "Mon", "Wed", "Thu", "Fri"))

df1 <- as.data.frame(list(v1, v2, v3, wday))
colnames(df1) <- c("v1", "v2", "v3", "wday")
df1

Ausgabe:

v1 v2 v3 wday
1 1.1 11  1  Wed
2 1.2 12  2  Thu
3 1.3 13  3  Mon
4 2.1 21  1  Wed
5 2.2 22  2  Thu
6 2.3 23  3  Fri

Verwenden Sie Matrix, um einen DataFrame in R . zu erstellen

Manchmal muss es eine riesige DataFramezuweisung geben, deren Initialisierung mit den Vektoren oder Listen unpraktisch ist. Glücklicherweise bietet die Funktion matrix eine einfache und schnelle Möglichkeit, große DataFrame durch Angabe der Zeilen-/Spaltennummern zu konstruieren. Optional können die Werte im DataFrame mit dem als erstes Argument übergebenen Vektor initialisiert werden. Andernfalls haben die Elemente NA-Werte.

m1 <- matrix(1:1000, ncol = 10, nrow = 100)
df1 <- as.data.frame(m1)
df1

Ausgabe:

V1  V2  V3  V4  V5  V6  V7  V8  V9  V10
1     1 101 201 301 401 501 601 701 801  901
2     2 102 202 302 402 502 602 702 802  902
....
Autor: Jinku Hu
Jinku Hu avatar Jinku Hu avatar

Founder of DelftStack.com. Jinku has worked in the robotics and automotive industries for over 8 years. He sharpened his coding skills when he needed to do the automatic testing, data collection from remote servers and report creation from the endurance test. He is from an electrical/electronics engineering background but has expanded his interest to embedded electronics, embedded programming and front-/back-end programming.

LinkedIn Facebook

Verwandter Artikel - R Data Frame