Contagem Número de observações em R

Em situações da vida real, lidamos com grandes conjuntos de dados. Isto pode exceder centenas de observações, e por vezes pode haver a necessidade de extrair alguns dados específicos do todo.

Para tais situações, temos alguns métodos em R, que podem ajudar na contagem do total de observações destes dados filtrados. Iremos trabalhar no seguinte DataFrame neste tutorial.

df <- data.frame( gender = c("M","F","M","M"),
                  age = c(18,19,14,22),
                  stream = c("Arts","Science","Arts","Commerce"))
print(df)

Resultado:

  gender age   stream
1      M  18     Arts
2      F  19  Science
3      M  14     Arts
4      M  22 Commerce

O primeiro método envolve as funções with() e o sum().

A função with() devolve um vector lógico baseado em alguma expressão após a sua aplicação a todo o array de dados, e a função sum() devolverá a soma de todas as observações True.

O seguinte trecho de código mostrará como isto funciona.

df <- data.frame( gender = c("M","F","M","M"),
                  age = c(18,19,14,22),
                  stream = c("Arts","Science","Arts","Commerce"))
                  
sum(with(df,gender == "M"))
[1] 3

Podemos também adicionar múltiplas expressões utilizando o operador &.

sum(with(df,gender == "M" & stream == "Commerce"))
[1] 1

Outro método envolve a utilização da função nrow(), que devolve o número de linhas de um array de dados. Podemos filtrar as observações necessárias do DataFrame, como se mostra abaixo:

nrow(df[df$gender == "M",])
[1] 3

Mais uma vez, podemos adicionar múltiplas expressões como o que fazemos na função with().

nrow(df[df$gender == "M" & df$stream == "Commerce",])
[1] 1

Podemos também utilizar a função filer() fornecida na biblioteca dplyr. Isto devolve um subconjunto de dados com base em alguma condição. O exemplo seguinte explica como:

library(dplyr)
nrow(filter(df,gender == "M"))
[1] 3
nrow(filter(df,gender == "M" & stream == "Commerce"))
[1] 1

Artigo relacionado - R DataFrame

  • Contagem Número de filas em R