Créer un grand bloc de données dans R

Jinku Hu 30 janvier 2023
  1. Utiliser des vecteurs et des facteurs pour créer un bloc de données dans R
  2. Utiliser la liste pour créer un bloc de données dans R
  3. Utiliser Matrix pour créer un bloc de données dans R
Créer un grand bloc de données dans R

Cet article expliquera plusieurs méthodes de création d’un grand bloc de données dans R.

Utiliser des vecteurs et des facteurs pour créer un bloc de données dans R

Une DataFrame est la structure de données intégrée la plus puissante du langage R, et elle ressemble à la matrice tabulaire, où chaque colonne a la même longueur et doit avoir des noms. En dessous, cependant, il a plus de fonctionnalités de type liste, car chaque colonne du bloc de données est traitée comme si elle était un élément de la structure de données liste. Du côté positif, nous pouvons construire un bloc de données en utilisant la combinaison de vecteurs et de facteurs, comme illustré dans l’extrait de code suivant. Nous utilisons la fonction data.frame pour construire un objet data frame à partir de vecteurs et de facteurs.

v1 <- c(1.1, 1.2, 1.3, 2.1, 2.2, 2.3)
v2 <- c(11, 12, 13, 21, 22, 23)
v3 <- c(1, 2, 3, 1, 2, 3)
wday <- factor(c("Wed", "Thu", "Mon", "Wed", "Thu", "Fri"))

df2 <- data.frame(v1, v2, v3, wday)

Production:

v1 v2 v3 wday
1 1.1 11  1  Wed
2 1.2 12  2  Thu
3 1.3 13  3  Mon
4 2.1 21  1  Wed
5 2.2 22  2  Thu
6 2.3 23  3  Fri

Utiliser la liste pour créer un bloc de données dans R

Alternativement, un objet de bloc de données peut être créé à l’aide de l’objet liste. Bien que cette méthode nécessite une fonction différente appelée as.data.frame qui convertit un seul objet de liste en un bloc de données. Notez que nous construisons l’objet liste avec la fonction list dans l’exemple suivant et la chaîne qui appelle comme argument du as.data.frame. Étant donné que le bloc de données doit avoir les étiquettes de colonne, elles sont généralement choisies automatiquement si l’utilisateur ne les spécifie pas. Si les noms indésirables sont choisis lors de la conversion, on peut toujours appeler la fonction colnames et lui affecter un vecteur de noms de colonnes.

v1 <- c(1.1, 1.2, 1.3, 2.1, 2.2, 2.3)
v2 <- c(11, 12, 13, 21, 22, 23)
v3 <- c(1, 2, 3, 1, 2, 3)
wday <- factor(c("Wed", "Thu", "Mon", "Wed", "Thu", "Fri"))

df1 <- as.data.frame(list(v1, v2, v3, wday))
colnames(df1) <- c("v1", "v2", "v3", "wday")
df1

Production:

v1 v2 v3 wday
1 1.1 11  1  Wed
2 1.2 12  2  Thu
3 1.3 13  3  Mon
4 2.1 21  1  Wed
5 2.2 22  2  Thu
6 2.3 23  3  Fri

Utiliser Matrix pour créer un bloc de données dans R

Parfois, il doit y avoir une énorme allocation de DataFrame qui est peu pratique à initialiser avec les vecteurs ou les listes. Heureusement, la fonction matrix fournit un moyen simple et rapide de construire de grandes trames de données en spécifiant les numéros de ligne/colonne. Optionnellement, on peut initialiser les valeurs dans la DataFrame en utilisant le vecteur passé en premier argument. Sinon, les éléments auront des valeurs NA.

m1 <- matrix(1:1000, ncol = 10, nrow = 100)
df1 <- as.data.frame(m1)
df1

Production:

V1  V2  V3  V4  V5  V6  V7  V8  V9  V10
1     1 101 201 301 401 501 601 701 801  901
2     2 102 202 302 402 502 602 702 802  902
....
Auteur: Jinku Hu
Jinku Hu avatar Jinku Hu avatar

Founder of DelftStack.com. Jinku has worked in the robotics and automotive industries for over 8 years. He sharpened his coding skills when he needed to do the automatic testing, data collection from remote servers and report creation from the endurance test. He is from an electrical/electronics engineering background but has expanded his interest to embedded electronics, embedded programming and front-/back-end programming.

LinkedIn Facebook

Article connexe - R Data Frame