Neste post, vamos explorar como adicionar e modificar colunas em DataFrames no R. Utilizando o pacote dplyr
, você pode criar novas colunas ou modificar colunas existentes de forma eficiente. Vamos criar um DataFrame de exemplo e abordar várias técnicas para manipular dados.
Sumário
Por que Usar a Função mutate
?
A função mutate
permite realizar transformações nas colunas de um DataFrame de forma eficiente e intuitiva. Com ela, é possível criar novas colunas, modificar colunas existentes e aplicar funções de transformação de maneira simples. Isso facilita a manipulação de dados e torna o código mais legível e organizado.
Como Modificar Colunas no R
Criando um DataFrame de Exemplo
Vamos começar criando um DataFrame com alguns dados de exemplo:
# Modificar Colunas no R
# Carregando o pacote necessário
library(dplyr)
# Criando um DataFrame de exemplo
data <- data.frame(
Nome = c('João', 'Ana', 'Carlos', 'Marta', 'Pedro'),
Idade = c(23, 45, 35, 41, 29),
Salario = c(5000, 7000, 8000, 6200, 5400)
)
Como Adicionar Novas Colunas no R
Criando uma Coluna com a Função mutate
Podemos usar a função mutate
para adicionar uma nova coluna ao DataFrame. Vamos criar uma coluna que indica se o salário é acima da média:
# Modificar Colunas no R
# Adicionando uma coluna que indica se o salário é acima da média
data <- data %>%
mutate(Salario_Acima_Media = Salario > mean(Salario))
Como Modificar Colunas Existentes no R
Modificando uma Coluna com mutate
Podemos usar mutate
para modificar colunas existentes. Vamos converter a coluna Nome
para letras minúsculas:
# Modificar Colunas no R
# Convertendo a coluna Nome para letras minúsculas
data <- data %>%
mutate(Nome = tolower(Nome))
Aplicando Funções a Colunas no R
Usando Funções de Transformação com mutate
Podemos aplicar funções a colunas para transformar os dados. Vamos criar uma nova coluna com o salário anual (multiplicando o salário mensal por 12):
# Modificar Colunas no R
# Criando uma coluna com o salário anual
data <- data %>%
mutate(Salario_Anual = Salario * 12)
Criando Colunas Condicionais no R
Usando if_else
com mutate
Podemos criar colunas condicionais usando a função if_else
. Vamos criar uma coluna que indica se a pessoa está próxima da aposentadoria (idade maior ou igual a 60 anos):
# Modificar Colunas no R
# Criando uma coluna que indica se a pessoa está próxima da aposentadoria
data <- data %>%
mutate(Proximo_Aposentadoria = if_else(Idade >= 60, TRUE, FALSE))
Analisando Dados no R
Estatísticas Descritivas
Para obter uma visão geral dos dados, podemos usar a função summary()
:
# Modificar Colunas no R
# Estatísticas descritivas
summary(data)
Visualizando Dados no R
Criando Gráficos com ggplot2
Visualizar dados pode ajudar a identificar padrões e tendências. Vamos criar um gráfico de barras mostrando a distribuição dos salários:
# Modificar Colunas no R
library(ggplot2)
# Criando um gráfico de barras da distribuição dos salários
ggplot(data, aes(x = Nome, y = Salario)) +
geom_bar(stat = "identity") +
ggtitle('Distribuição de Salários')
Links Úteis e Mais Conteúdo
Para mais informações sobre como utilizar o R para análise de dados, confira outros conteúdos no meu blog:
- Seleção de Colunas no R
- Leitura de Dados em R
- Matriz de Distância Rodoviária por Tempo em R
- Matriz de Distância dos Municípios Brasileiros
- Primeiros Passos com o R – Parte 1
- Como Instalar o RStudio
Considerações Finais
Espero que este guia tenha sido útil para aprender como manipular dados com a função mutate
do pacote dplyr
no R. A prática é essencial para dominar essas técnicas, então encorajo você a experimentar e aplicar esses métodos em seus próprios projetos de análise de dados.
Para aprimorar suas habilidades com o R e se tornar mais eficiente na manipulação de dados, é importante também fortalecer sua compreensão em ciência de dados. Recomendamos o livro Fundamentos em R: Guia Completo para Iniciantes, disponível na Amazon, que oferece uma introdução abrangente ao R.
Junte-se à nossa comunidade no Twitter e inscreva-se no nosso canal do YouTube para acessar mais tutoriais, dicas e recursos. Continue praticando e explorando novas maneiras de manipular dados com o R, e fique atento para mais guias e tutoriais que compartilharemos.