Compter le nombre de lignes dans R

  1. Utilisez la fonction data.frame(table()) pour compter le nombre de lignes dans R
  2. Utilisez la fonction count() pour compter le nombre de lignes dans R
  3. Utilisation de la fonction ddply() pour compter le nombre de lignes dans R

Dans des exemples concrets, nous rencontrons de grands ensembles de données contenant des centaines et des milliers de lignes et de colonnes. Pour travailler sur de telles quantités de données, nous devons nous familiariser avec les lignes, les colonnes et les types de données.

Ce tutoriel présente la façon de compter le nombre de lignes par groupe dans R.

Utilisez la fonction data.frame(table()) pour compter le nombre de lignes dans R

La fonction data.frame(table()) crée un tableau avec le compte des différentes valeurs de facteurs. Elle compte le total des lignes uniques d’une colonne. On peut facilement passer la colonne requise du DataFrame à la fonction. Voir l’extrait de code suivant.

df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
                  Month = c("Jan","Jan","May","July"),
                  Age = c(12,10,15,13))
data.frame(table(df$Month))

Production :

 Var1 Freq
1  Jan    2
2 July    1
3  May    1

Utilisez la fonction count() pour compter le nombre de lignes dans R

La bibliothèque plyr dans R effectue des tâches de manipulation de données de base comme la division des données, l’exécution de certaines fonctions, et leur fusion par la suite. Elle possède une fonction count() qui renvoie la fréquence des lignes uniques d’une DataFrame. Nous devons passer le DataFrame et le nom de la colonne comme paramètre, comme indiqué ci-dessous :

df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
                  Month = c("Jan","Jan","May","July"),
                  Age = c(12,10,15,13))
library(plyr)
count(df, "Month")

Production :

  Month freq
1   Jan    2
2  July    1
3   May    1

Utilisation de la fonction ddply() pour compter le nombre de lignes dans R

Une autre fonction intéressante fournie dans la bibliothèque plyr est la fonction ddply(). Elle divise les données en un sous-ensemble, spécifie une fonction à appliquer aux données, et combine le résultat. Dans l’exemple ci-dessous, nous allons passer le DataFrame et le nom de la colonne à la fonction et à la fonction nrow comme paramètres :

df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
                  Month = c("Jan","Jan","May","July"),
                  Age = c(12,10,15,13))
library(plyr)
ddply(df, .(Month), nrow)

Production :

  Month V1
1   Jan  2
2  July  1
3   May  1