
[Data Science With R] 3. 탐색적 데이터 분석 (Exploratory Data Analysis) (202405)
·
Data Science/Manipulation
0. Overview 1. 정의데이터를 체계적으로 탐색하기 위해 시각화 및 탐색을 활용하는 과정데이터를 이해하고 그 속에서 인사이트를 발굴하기 위해 중요한 과정 2. 방법데이터에 대한 질문을 만든다데이터를 시각화, 변형 및 모델링하여 질문에 대한 답을 찾는다질문을 개선하거나 새로운 질문을 만든다 3. 질문단변량 변수 내에서 어떤 유형의 변동(Variation)이 발생하는지이변량 & 다변량 변수 간에 어떤 유형의 공변동(Covariation)이 발생하는지 4. 시각화범주형 변수의 분포 개수 : count(x), table(x)시각화 : geom_bar, geom_col연속형 변수의 분포범주화 : cut, cut_width, cut_interval, cut_number, case_when시각화 ..