R

Como Adicionar e Modificar Colunas no R

Escrito por Erick Faria · 2 min. >
Modificar Colunas no R

Neste post, vamos explorar como adicionar e modificar colunas em DataFrames no R. Utilizando o pacote dplyr, você pode criar novas colunas ou modificar colunas existentes de forma eficiente. Vamos criar um DataFrame de exemplo e abordar várias técnicas para manipular dados.

Por que Usar a Função mutate?

A função mutate permite realizar transformações nas colunas de um DataFrame de forma eficiente e intuitiva. Com ela, é possível criar novas colunas, modificar colunas existentes e aplicar funções de transformação de maneira simples. Isso facilita a manipulação de dados e torna o código mais legível e organizado.

Como Modificar Colunas no R

Criando um DataFrame de Exemplo

Vamos começar criando um DataFrame com alguns dados de exemplo:

# Modificar Colunas no R
# Carregando o pacote necessário
library(dplyr)

# Criando um DataFrame de exemplo
data <- data.frame(
  Nome = c('João', 'Ana', 'Carlos', 'Marta', 'Pedro'),
  Idade = c(23, 45, 35, 41, 29),
  Salario = c(5000, 7000, 8000, 6200, 5400)
)

Como Adicionar Novas Colunas no R

Criando uma Coluna com a Função mutate

Podemos usar a função mutate para adicionar uma nova coluna ao DataFrame. Vamos criar uma coluna que indica se o salário é acima da média:

# Modificar Colunas no R
# Adicionando uma coluna que indica se o salário é acima da média
data <- data %>%
  mutate(Salario_Acima_Media = Salario > mean(Salario))

Como Modificar Colunas Existentes no R

Modificando uma Coluna com mutate

Podemos usar mutate para modificar colunas existentes. Vamos converter a coluna Nome para letras minúsculas:

# Modificar Colunas no R
# Convertendo a coluna Nome para letras minúsculas
data <- data %>%
  mutate(Nome = tolower(Nome))

Aplicando Funções a Colunas no R

Usando Funções de Transformação com mutate

Podemos aplicar funções a colunas para transformar os dados. Vamos criar uma nova coluna com o salário anual (multiplicando o salário mensal por 12):

# Modificar Colunas no R
# Criando uma coluna com o salário anual
data <- data %>%
  mutate(Salario_Anual = Salario * 12)

Criando Colunas Condicionais no R

Usando if_else com mutate

Podemos criar colunas condicionais usando a função if_else. Vamos criar uma coluna que indica se a pessoa está próxima da aposentadoria (idade maior ou igual a 60 anos):

# Modificar Colunas no R
# Criando uma coluna que indica se a pessoa está próxima da aposentadoria
data <- data %>%
  mutate(Proximo_Aposentadoria = if_else(Idade >= 60, TRUE, FALSE))

Analisando Dados no R

Estatísticas Descritivas

Para obter uma visão geral dos dados, podemos usar a função summary():

# Modificar Colunas no R
# Estatísticas descritivas
summary(data)

Visualizando Dados no R

Criando Gráficos com ggplot2

Visualizar dados pode ajudar a identificar padrões e tendências. Vamos criar um gráfico de barras mostrando a distribuição dos salários:

# Modificar Colunas no R
library(ggplot2)

# Criando um gráfico de barras da distribuição dos salários
ggplot(data, aes(x = Nome, y = Salario)) +
  geom_bar(stat = "identity") +
  ggtitle('Distribuição de Salários')

Para mais informações sobre como utilizar o R para análise de dados, confira outros conteúdos no meu blog:

Considerações Finais

Espero que este guia tenha sido útil para aprender como manipular dados com a função mutate do pacote dplyr no R. A prática é essencial para dominar essas técnicas, então encorajo você a experimentar e aplicar esses métodos em seus próprios projetos de análise de dados.

Para aprimorar suas habilidades com o R e se tornar mais eficiente na manipulação de dados, é importante também fortalecer sua compreensão em ciência de dados. Recomendamos o livro Fundamentos em R: Guia Completo para Iniciantes, disponível na Amazon, que oferece uma introdução abrangente ao R.

Junte-se à nossa comunidade no Twitter e inscreva-se no nosso canal do YouTube para acessar mais tutoriais, dicas e recursos. Continue praticando e explorando novas maneiras de manipular dados com o R, e fique atento para mais guias e tutoriais que compartilharemos.

Escrito por Erick Faria
Engenheiro de Dados com Ph.D. em Geografia e experiência em análise espacial e geoprocessamento. Expertise em processamento de grandes volumes de dados geoespaciais, imagens de satélite e dados de mercado, utilizando ferramentas como Spark, Databricks e Google Earth Engine. Experiência em projetos de mercado de carbono, modelos preditivos para investimentos agrícolas e liderança de projetos de dados em saúde pública. Habilidades em Python, R, SQL e diversas ferramentas de engenharia de dados. Profile