제가 제일 애용하는 Tidyverse 패키지는 데이터 분석을 위한 체계적인 패키지입니다.
챕터 2에서는 tidyverse 패키지가 왜 중요한지에 대해서 논의하며 이를 어떻게 적용하는지에 대해 서술하고 있습니다.
1. Tidyverse Principles
- Design for Humans : 다양한 사람들이 쉽게 이해하고 사용할 수 있는 R패키지와 기능을 설계
- Reuse existing Data Structures : 기존에 존재하는 데이터 구조를 반환하여 인지 부하를 줄일 수 있음
- Design for Pipe and Functional Programming : 파이프 라인은 가독성이 좋으며 함수형 프로그래밍은 반복문을 대체할 수 있음
2. Examples of Tidyverse Syntax
2절에서는 Tidyverse를 한 챕터에 설명하고 있는데 전부를 다루고 있지 않습니다. 그 중에 티블에 대해 간단하게 설명하고 있으며 대표적으로 유효하지 않은 열이름 가질 수 있다거나 데이터프레임과 다르게 부분매칭을 지원하지 않는다와 같은 내용을 다루고 있습니다.
나중에 접하는 챕터에서는 tidyverse에 능숙하다고 가정한 코드들이 많으므로 R for Data Science 서적을 참고하거나 적어도 purrr, readr, dplyr 패키지와 파이프를 이용한 코드 작성을 많이 접해보셨으면 좋겠습니다.
2 A Tidyverse Primer | Tidy Modeling with R
The tidymodels framework is a collection of R packages for modeling and machine learning using tidyverse principles. This book provides a thorough introduction to how to use tidymodels, and an outline of good methodology and statistical practice for phases
www.tmwr.org
'Data Science > Modeling' 카테고리의 다른 글
[Tidy Modeling with R] 5. Data Spliting (데이터 분할) (0) | 2023.09.10 |
---|---|
[Tidy Modeling with R] 4. Ames Housing Data (0) | 2023.09.10 |
[Tidy Modeling with R] 3. R Modeling Fundamentals (0) | 2023.09.09 |
[Tidy Modeling with R] 1. Software for modeling (0) | 2023.09.07 |
[Tidy Modeling with R] 0. 서론 (1) | 2023.09.07 |