본문 바로가기

전체 글

[R 프로그래밍] 데이터 가공 - select()로 필요한 변수만 추출하자 (dplyr) #dplyr 패키지 로드 필요library(dplyr) #select()는 데이터에 있는 수 많은 변수들 중 일부 변수만 추출해서 쓸 때 사용한다. #dataSample에서 AAA컬럼만 출력하기 (변수 추출하기)dataSample %>% select(AAA) #dataSample에서 여러 컬럼 출력하기 (여러 변수 추출하기)#dataSample에서 AAA,BBB,CCC컬럼을 출력해보자dataSample %>% select(AAA,BBB,CCC) #dataSample에서 특정 컬럼 제외하기 (특정 변수 제외하기)#dataSample에서 AAA컬럼을 제외하고 출력해보자dataSample %>% select (-AAA)#컬럼 이름이 한글이어도 문제없음dataSample %>% headnames(dataSamp.. 더보기
[R 프로그래밍] 컬럼 이름 바꾸기 : names(), rename() #name()을 사용해서 컬럼 이름 바꾸기 #library는 아래 두개 사용 중 library(ggplot2) library(dplyr) #examName 데이터에 id 컬럼의 이름이 "X...id"로 되어 있음 X...id class math english science 1 1 1 50 98 50 2 2 1 60 97 60 #X...id라니, 마음에 들지 않는다. examName의 컬럼 이름을 바꿔보자 #names 함수 사용 가능. #열 이름을 출력하기 names(examName) #아래와 같이 모든 이름의 컬럼을 바꿀 수 있다. #모든 컬럼의 이름 바꾸기. 단, 이 경우 입력하지 않는 컬럼은 NA로 표시된다. names(examName) test3 id midterm 1 6 30 2 7 40 #ren.. 더보기
[R 프로그래밍] 데이터 가공 - filter ()로 조건에 맞는 데이터 추출 (dplyr) dplyr 패키지를 통해 데이터 가공하기 # filter() : 조건에 맞는 데이터 추출 #dataSample 에서 aaa 컬럼의 값이 100 이상인 내용만 추출dataSample %>% filter ( aaa > 100 ) # --> 등호, 부등호를 이용해서 추출 가능# &와 |를 사용해서 and 조건과 or조건 지정 가능 # dataSample 에서 aaa가 1이고, bbb 컬럼 값이 50 이하거나 aaa컬럼 값이 2이고 ccc컬럼 값이 80 초과인 행만 추출dataSample %>% filter ((aaa == 1 & bbb 80)) #filter() 에서 부등호 말고, %in%과 c()조합으로 이용하기 #dataSample 에서 aaa 컬럼의 값이 1, 3, 4인 내용만 추출dataSample %.. 더보기