1. 기본 함수로 열 추가하기
#기본 함수로 열을 추가할 수 있다.
#기존 데이터 연산해서 열 추가하기
dataSample$total <- dataSample$AAA + dataSample$BBB + dataSample$CCC
2. dplyr 패키지의 mutate()로 열 추가하기
#dplyr라이브러리 추가
library(dplyr)
#mutate() 함수로 열 추가 가능. (기존 데이터에 파생 변수를 만들어서 추가한다.)
#기존 데이터를 연산해서 열 추가
dataSample %>%
mutate ( total = AAA + BBB + CCC)
#여러 개의 컬럼을 추가할 때는 콤마로 구분한다.
dataSample %>%
mutate ( total = AAA + BBB + CCC,
mean = (AAA + BBB + CCC)/3 )
head(3)
#mutate 함수를 쓰고 <- 로 저장해야 함
dataSample <- dataSample %>%
mutate ( total = AAA + BBB + CCC,
mean = (AAA + BBB + CCC)/3 )
<-를 사용해서 저장할 때는 head를 쓰면 해당 개수만 저장되니 주의하자 |
#ifelse 구문으로 추가하는 컬럼에 조건 별 값 설정 가능
dataSample %>%
mutate(test = ifelse(AAA >= 100, "pass","fail")) %>%
arrange(test) %>%
head
dplyr 패키지의 함수를 사용할 경우 컬럼 이름만 입력해서 사용한다. 기본 함수는 dataSample$AAA 라고 쓴다면, dplyr패키지의 함수들을 사용하면 AAA만 사용해도 됨
|
'데이터분석 > R' 카테고리의 다른 글
[R 프로그래밍] 데이터 가공 - 데이터 합치기 : left_join(), bind_rows() (dplyr) (1) | 2018.09.01 |
---|---|
[R 프로그래밍] 데이터 가공 - 그룹 별로 나눠서 요약 정보 보기 group_by(), summarise() (dplyr) (0) | 2018.08.26 |
[R 프로그래밍] 데이터 가공 - arrange()로 정렬하기 (dplyr) (0) | 2018.08.24 |
[R 프로그래밍] 데이터 가공 - select()로 필요한 변수만 추출하자 (dplyr) (0) | 2018.08.24 |
[R 프로그래밍] 컬럼 이름 바꾸기 : names(), rename() (0) | 2018.08.24 |