본문 바로가기

전체 글

[R 프로그래밍] 데이터 보기 - table() 함수 #table()함수는 데이터의 빈도를 보여준다.> test id test1 test21 1 10 252 2 10 353 3 20 254 4 30 355 5 30 456 5 30 45 > str(test)'data.frame':6 obs. of 3 variables: $ id : num 1 2 3 4 5 5 $ test1: num 10 10 20 30 30 30 $ test2: num 25 35 25 35 45 45 #table함수를 써서 test 데이터의 test1의 컬럼을 출력해보면, 값들이 다음 빈도 수를 보여준다.table(test$test1) > table(test$test1) 10 20 30 2 1 3 ###자세한 건...더 알아가면 보완하는 걸로.. 더보기
[R 프로그래밍] dplyr 패키지 함수들 #dplyr함수들은 %>%로 여러 함수를 조합해서 사용 가능 # 여러 함수 조합하기dataSample %>% select (test, test1, test2) %>% filter ( test >= 30) %>% head (3) #head()함수 # 해당 데이터의 일부만 출력한다.dataSample %>% head(5) #filter() 함수http://realab.tistory.com/7 # 특정 조건 만족 데이터 추출dataSample %>% filter ( test > = 30) # AND 조건 체크 (조건 모두 만족)dataSample %>% filter ( id == 1 & test > 30) # OR 조건 체크 (조건들 중 하나 이상 만족)dataSample %>% filter ( test1 >.. 더보기
[R 프로그래밍] 데이터 가공 - distinct() 함수로 유니크한 값 추출하기 (dplyr) #dplyr 패키지library(dplyr) #distinct() 함수로 유니크한 값 추출하기#distinct(데이터, 컬럼) 입력 시 입력한 컬럼의 유니크 값만 추출한다. > test id test1 test21 1 10 252 2 10 353 3 20 254 4 30 355 5 30 45 #test1에서 중복된 값은 모두 제거하고 유니크한 값만 표시한다.distinct (test, test1) test11 102 203 30 #id와 test1의 값을 모두 체크해서 유니크 한 값만 표시한다.distinct (test, id, test1) id test11 1 102 2 103 3 204 4 305 5 30 #####base 패키지의 unique() 함수와 duplicated() 함수도 유사하게 사용할.. 더보기