본문 바로가기

데이터분석/R

[R 프로그래밍] 데이터 가공 - 컬럼 추가하기 : mutate() (dplyr)

1. 기본 함수로 열 추가하기

#기본 함수로 열을 추가할 수 있다.

#기존 데이터 연산해서 열 추가하기

dataSample$total <- dataSample$AAA + dataSample$BBB + dataSample$CCC


2. dplyr 패키지의 mutate()로 열 추가하기


#dplyr라이브러리 추가

library(dplyr)


#mutate() 함수로 열 추가 가능. (기존 데이터에 파생 변수를 만들어서 추가한다.)

#기존 데이터를 연산해서 열 추가

dataSample %>% 

  mutate ( total = AAA + BBB + CCC)


#여러 개의 컬럼을 추가할 때는 콤마로 구분한다.

dataSample %>% 

  mutate ( total = AAA + BBB + CCC,

                 mean = (AAA + BBB + CCC)/3 )

  head(3)


#mutate 함수를 쓰고 <- 로 저장해야 함

dataSample <- dataSample %>% 

  mutate ( total = AAA + BBB + CCC,

                 mean = (AAA + BBB + CCC)/3 )

<-를 사용해서 저장할 때는 head를 쓰면 해당 개수만 저장되니 주의하자 





#ifelse 구문으로 추가하는 컬럼에 조건 별 값 설정 가능

dataSample %>%

  mutate(test = ifelse(AAA >= 100, "pass","fail")) %>%

  arrange(test) %>%

  head


dplyr 패키지의 함수를 사용할 경우 컬럼 이름만 입력해서 사용한다.

기본 함수는 dataSample$AAA 라고 쓴다면, dplyr패키지의 함수들을 사용하면 AAA만 사용해도 됨