Neste post, aprenderemos como contar valores no Python. Contar valores equivale a observar a frequência de ocorrências em uma determinada variável. Esse procedimento também poderia se chamar “tabelas de frequências no python”. Esse procedimento é geralmente aplicado a variáveis categóricas para determinar quantas vezes cada categoria aparece em nosso dataframe. Por exemplo, se tivermos uma variável categórica para renda, podemos desejar saber quantos indivíduos são considerados ricos, quantos são de classe média, entre outros. Para realizar essa tarefa, podemos utilizar a função value_counts()
da biblioteca Pandas.
Sumário
Importação da biblioteca e do dataset
O primeiro passo é importar as bibliotecas e os dados que serão utilizados no exemplo. A biblioteca pandas é a mais adequada para esse tipo de tarefa, já que trabalharemos com dados estruturados, conhecidos como dataframes. Se desejar, você pode utilizar seus próprios dados para executar o exemplo. Para isso, confira neste post como importar dados no Pandas.
Para executar o exemplo, o primeiro passo é importar a biblioteca Pandas e o conjunto de dados que será utilizado. Para fazer isso, utilize o comando import pandas as pd
e, em seguida, execute o comando pd.read_csv()
para ler o arquivo CSV contendo os dados.
# Importa a biblioteca pandas para contar valores no Python
import pandas as pd
# Faz a leitura do dataset em que iremos utilizar para contar valores no Python
df = pd.read_csv('https://raw.githubusercontent.com/balaiocientifico/dataset/main/taxis.csv')
Após executar o comando mencionado anteriormente, é recomendável imprimir as primeiras linhas do dataframe para confirmar que a importação ocorreu corretamente. Para isso, utilize o comando df.head()
e você visualizará um resultado semelhante ao exemplo abaixo.
No exemplo acima, é possível constatar que os dados foram importados com sucesso e as colunas foram devidamente separadas. O comando foi executado no Google Colab, um ambiente online que eu recomendo para iniciantes em Python. Se você deseja conhecer e aprender como começar a utilizar o Google Colab, assista a este vídeo onde ensino tudo sobre essa plataforma gratuita.
Como contar valores no Python
Agora que importamos corretamente o conjunto de dados e a biblioteca pandas, vamos aprender como contar valores no Python para todas as colunas categóricas do nosso dataset. Se você está curioso(a) para saber como seria o equivalente para variáveis numéricas, confira este post onde ensino a realizar a análise de estatística descritiva dessas variáveis no Python.
Para contar os valores no python em cada coluna categórica do nosso conjunto de dados, podemos utilizar a função value_counts()
do Pandas. Essa função retorna uma série que contém contagens de valores únicos em uma coluna do dataframe em ordem decrescente. É possível também especificar a ordem crescente, se desejado.
Além disso, é importante lembrar que os dados categóricos podem ser representados de diversas formas, como strings ou números inteiros. Para evitar erros na contagem, é preciso verificar se os valores da coluna categórica estão no formato correto e converter, se necessário.
Com isso em mente, vamos agora aplicar a função value_counts()
em todas as colunas categóricas do nosso conjunto de dados. A primeira variável que iremos aplicar a função value_counts()
será a variável color. Para isso execute o comando a seguir:
df['color'].value_counts()
Ao executar o comando acima, os resultados aparecerão abaixo. Na coluna da esquerda, você poderá visualizar a categoria, enquanto na coluna da direita, será possível observar o número de ocorrências do valor em questão.
yellow | 5421 |
green | 982 |
Viu como é fácil contar valores no python? Você pode realizar o teste com outras variáveis, alterando apenas o nome da coluna entre os colchetes. Dessa forma, você terá a frequência dos valores para cada coluna. Se surgirem dificuldades, não hesite em deixar um comentário.