본문 바로가기

데이터분석/R

[R 프로그래밍] 데이터 가공 - select()로 필요한 변수만 추출하자 (dplyr)

#dplyr 패키지 로드 필요

library(dplyr)


#select()는 데이터에 있는 수 많은 변수들 중 일부 변수만 추출해서 쓸 때 사용한다.


#dataSample에서 AAA컬럼만 출력하기 (변수 추출하기)

dataSample %>% select(AAA)


#dataSample에서 여러 컬럼 출력하기 (여러 변수 추출하기)

#dataSample에서 AAA,BBB,CCC컬럼을 출력해보자

dataSample %>% select(AAA,BBB,CCC)


#dataSample에서 특정 컬럼 제외하기 (특정 변수 제외하기)

#dataSample에서 AAA컬럼을 제외하고 출력해보자

dataSample %>% select (-AAA)

#컬럼 이름이 한글이어도 문제없음

dataSample %>% head

names(dataSample)


names(dataSample) <- c("아이디","클래스","국어","영어","수학")

dataSample %>% select(아이디) %>% head

dataSample %>% select(-클래스) %>% head 



#다른 dplyr함수와 조합해도 OK

dataSample %>%

  filter (class == 1) %>%

  select (math)