dplyr 패키지를 통해 데이터 가공하기
# filter() : 조건에 맞는 데이터 추출
#dataSample 에서 aaa 컬럼의 값이 100 이상인 내용만 추출
dataSample %>% filter ( aaa > 100 )
# --> 등호, 부등호를 이용해서 추출 가능
# &와 |를 사용해서 and 조건과 or조건 지정 가능
# dataSample 에서 aaa가 1이고, bbb 컬럼 값이 50 이하거나 aaa컬럼 값이 2이고 ccc컬럼 값이 80 초과인 행만 추출
dataSample %>% filter ((aaa == 1 & bbb <= 50) | (aaa == 2 & ccc > 80))
#filter() 에서 부등호 말고, %in%과 c()조합으로 이용하기
#dataSample 에서 aaa 컬럼의 값이 1, 3, 4인 내용만 추출
dataSample %>% filter ( aaa %in% c(1,3,4))
#dataSample 에서 aaa의 값이 50, 60, 70이거나, bbb가 80이면 추출한다
dataSample %>% filter (aaa %in% c(50,60,70) | bbb %in% c(80))
'데이터분석 > R' 카테고리의 다른 글
[R 프로그래밍] 데이터 가공 - select()로 필요한 변수만 추출하자 (dplyr) (0) | 2018.08.24 |
---|---|
[R 프로그래밍] 컬럼 이름 바꾸기 : names(), rename() (0) | 2018.08.24 |
[R 프로그래밍] R에서 사용하는 연산자들 (논리 연산자, 산술 연산자) (0) | 2018.08.19 |
[R 프로그래밍] 평균 구하기, 머릿말만 보기...등 (0) | 2018.08.19 |
[R 프로그래밍] 컬럼 삭제하기 (0) | 2018.08.19 |