본문 바로가기

전체 글

[R 프로그래밍] 데이터 가공 - 그룹 별로 나눠서 요약 정보 보기 group_by(), summarise() (dplyr) #group_by()#데이터를 그룹 별로 묶기#데이터에서 특정 컬럼을 지정해서 그룹 별로 묶을 수 있다. #dataSample에서 class 별로 묶기dataSample %>% group_by(class)> exam %>% group_by(class)# A tibble: 20 x 5# Groups: class [5] id class math english science 1 1 1 50 98 50 2 2 1 60 97 60 3 3 1 45 86 78 4 4 1 30 98 58 5 5 2 25 80 65... -> A ttible : 데이터가 5열, 20행으로 이루어졌다는 것을 표시-> Group : class별 그룹이 5개가 생긴다. 그룹을 나눠서 보여주지는 않지만...group_by()는 출력한 결과를 .. 더보기
[R 프로그래밍] 데이터 가공 - 컬럼 추가하기 : mutate() (dplyr) 1. 기본 함수로 열 추가하기#기본 함수로 열을 추가할 수 있다.#기존 데이터 연산해서 열 추가하기dataSample$total % mutate ( total = AAA + BBB + CCC) #여러 개의 컬럼을 추가할 때는 콤마로 구분한다.dataSample %>% mutate ( total = AAA + BBB + CCC, mean = (AAA + BBB + CCC)/3 ) head(3) #mutate 함수를 쓰고 = 100, "pass","fail")) %>% arrange(test) %>% head dplyr 패키지의 함수를 사용할 경우 컬럼 이름만 입력해서 사용한다.기본 함수는 dataSample$AAA 라고 쓴다면, dplyr패키지의 함수들을 사용하면 AAA만 사용해도 됨 더보기
[R 프로그래밍] 데이터 가공 - arrange()로 정렬하기 (dplyr) #dplyr패키지를 사용함library(dplyr) #arrange()를 이용해서 AAA 컬럼 값 순서대로 정렬하기 (오름차순)dataSample %>% arrange(AAA) #내림차순으로 하려면 desc()를 적용하자dataSample %>% arrange(desc(AAA)) #콤마로 여러 개 지정 가능dataSample %>% arrange(AAA,BBB)--> AAA를 기준으로 오름차순으로 정렬 후, 그 안에서 BBB를 기준으로 오름차순 정렬--> AAA를 기준으로 정렬하되, 값이 같을 경우 BBB를 기준으로 정렬한다. #arrange도 다른 dplyr패키지의 명령어와 조합해서 사용 가능examName %>% filter (클래스 == 2) %>% arrange(desc(수학)) %>% head(.. 더보기