안녕하세요.『Tidy modeling with R』의 서론에 대한 간단한 정리를 포스팅하려고 합니다.
https://www.tmwr.org/ 사이트를 통해 영문 원서를 확인할 수 있습니다.

Tidymodels는 모델링과 관련한 패키지들을 모아놓았으며
(통계, 머신러닝) 모델을 생성하기 위한 실용적인 방법을 소개합니다.
또한 통계적 문제에 집중해 문제를 해결하는데 도움을 줍니다.
Chapter 1에서는 모델을 어떻게 분류하는지 알아보고 모델링을 위한 좋은 소프트웨어가 무엇인지 설명합니다.
Chapter 2에서 <Tidyverse>의 철학과 구문에 대해 소개합니다. <Tidymodels> 패키지를 사용하는데 기본이 됩니다.
Chapter 3에서는 기존 Base R의 모델링 함수를 살펴보고 어떤 점이 부족한지에 대해 설명합니다.
Chapter 4~9에서는 Ames housing price 데이터 셋을 소개하고, <recipe>, <parsnip>, <workflows>, <yardstick>과 같은 <Tidymodels>에 포함된 패키지를 활용하는 방법을 배웁니다.
Chapter 10~15에서는 더욱 효율적인 모델을 만드는 과정에 대해 집중하며 특히 리샘플링을 통한 모델 성능의 추정과 하이퍼파라미터 튜닝에 대해 알아봅니다.
마지막으로 Chapter 16~21은 모델 구축에 필요한 다른 중요한 주제들을 다루고 있습니다. 구체적으로 차원축소와 같은 feature engineering, 인코딩에 대해 논의합니다.
+ 25.09 내용 수정 (오타 및 문구)
한국어 번역본이 나와있지 않아서, 중요한 부분만 의역하고 정리하였습니다.
또한, 챕터 17 ~ 21 부분은 따로 포스팅하지는 않았습니다.
여러번 정독하면서 느낀건데 <Tidymodels> 패키지를 사용하는데 있어서 <Tidyverse>의 사용방법과 유사한 점이 많아 『R For Data Science - Hadley』를 읽어보면 많은 도움이 될 것 같습니다.
R for Data Science의 2번째 버전이 공개되었으며 1판에서 있는 코드와 파트의 보완, 추가, 제거가 진행되었다고 합니다. 아직 한글 번역본은 나오지 않았지만 관심있는 분은 참고해보세요.
R for Data Science (2e)
Welcome This is the website for the 2nd edition of “R for Data Science”. This book will teach you how to do data science with R: You’ll learn how to get your data into R, get it into the most useful structure, transform it and visualize. In this book
r4ds.hadley.nz
'Data Science > Modeling' 카테고리의 다른 글
| [Tidy Modeling with R] 5. 데이터 분할 (1) | 2023.09.10 |
|---|---|
| [Tidy Modeling with R] 4. 부동산 데이터 탐색적 분석 (1) | 2023.09.10 |
| [Tidy Modeling with R] 3. 모델링 기본 원리 (0) | 2023.09.09 |
| [Tidy Modeling with R] 2. Tidyverse (0) | 2023.09.07 |
| [Tidy Modeling with R] 1. 모델링을 위한 소프트웨어 (0) | 2023.09.07 |