[Data Science With R] 7. 데이터 변형 with tidyr (202405)
·
Data Science/Manipulation
1. 타이디한 데이터의 특성변수마다 대응되는 열이 있어야 한다.관측마다 대응되는 행이 있어야 한다.값마다 대응되는 하나의 셀이 있어야 한다 (= 두 개 이상의 값이 하나의 셀에 있으면 Tidy 하지 않음! )데이터 분석에 사용할 tidyverse 라이브러리의 대부분의 함수는 Tidy한 데이터에서 효율적으로 작동하기 때문에 이러한 특성은 중요합니다. (tidyverse 패키지를 사용하면보면 왜 타이디한 데이터가 편한지 자연스럽게 알게 될 겁니다.) 2. Pivot_longer( ) 열(Columns)로 흩어진 값들을 하나의 열로 나타낼 때 사용하는 함수로 기존 gather 보다 업그레이드 됨pivot_longer(data, cols, names_to="name", values_to="value") col..