Créer un histogramme empilé en R

Nous savons que R est considéré comme un puissant langage de programmation pour l’analyse des données et des statistiques. Pour cette raison, R est équipé de nombreuses fonctions pour différents types de graphiques et de tracés. Ces graphiques sont très utiles et peuvent fournir un bon aperçu des données.

L’un de ces graphiques disponibles est l’histogramme. Un histogramme est utilisé pour tracer une distribution avec différentes barres. Ce tutoriel montrera comment créer un histogramme simple en utilisant la fonction hist() et couvrira également les histogrammes empilés avec plusieurs populations en utilisant les fonctions hist() et ggplot().

Le code suivant montre un histogramme simple en utilisant la fonction hist().

value1 = c(20,20,25,25,40,35,30,20,35)
hist(value1,col = "red")

L'histogramme dans R

De nombreuses autres personnalisations peuvent être ajoutées au graphique en utilisant différents paramètres disponibles dans la fonction hist(). Nous pouvons également utiliser ggplot() dans le même but.

Lorsque nous traitons des histogrammes empilés, nous avons soit deux ou plusieurs populations tracées sur le même graphique. Nous pouvons le faire de deux façons, soit nous avons deux variables différentes qui doivent être tracées sur le même graphique, soit nous avons une variable avec des catégories différentes.

Pour la première approche, nous utiliserons la fonction hist(). L’extrait de code suivant explique comment faire :

value1 = c(20,20,25,25,40,35,30,20,35)
value2 = c(15,25,30,25,25,20,40,40,40)

hist(value1,col = "red")
hist(value3, add = T, col = "blue")

histogramme empilé dans R

Dans cette méthode, nous avons créé un simple histogramme et ajouté le second graphe au premier en utilisant le paramètre add.

Pour la deuxième approche, nous utiliserons un ensemble de données d’échantillon intégré appelé iris. Il contient les détails de 3 espèces de plantes. Nous allons tracer la colonne Sepal.Width en utilisant la fonction ggplot(). Nous devrions charger la bibliothèque ggplot2 pour utiliser la fonction ggplot().

library(ggplot2)
ggplot(data=iris, aes(x=Sepal.Width,fill = Species)) + geom_histogram()

histogramme empilé dans R avec ggplot2

Le geom_histogram spécifie le type de parcelle comme un histogramme. Dans la fonction ggplot(), nous spécifions la variable à tracer, et nous colorons l’histogramme en fonction de la variable catégorielle, Species.

Article connexe - R Plot

  • Définir l'épaisseur des parcelles en R