[Tidy Modeling with R] 0. 서론

2023. 9. 7. 17:17·Data Science/Modeling

안녕하세요. "Tidy modeling with R"의 서론에 대한 간단한 정리를 포스팅하려고 합니다.

https://www.tmwr.org/ 사이트를 통해 영문 원서를 확인할 수 있습니다.

 

Tidy Modeling with R - Max Kuhn & Julia Silge

Tidymodels는 모델 구축과 관련한 패키지들을 모아놓았으며
(통계, 머신러닝) 모델을 생성하기 위한 실용적인 방법을 소개합니다.
또한 통계적 문제에 집중하여 사소한 문제들을 해결하도록 합니다.

 

 

Chapter 1에서는 모델 분류에 대한 개요를 살펴보고 모델링을 위한 좋은 소프트웨어가 무엇인지 설명합니다.

Chapter 2에서 tidyverse의 아이디어와 구문(Syntax)에 대해 소개합니다. tidyverse는 tidymodels 패키지를 사용하는데 기초가 됩니다. (정말 많이!)

Chapter 3에서는 기존 Base 패키지의 R 모델링 함수를 살펴보고 베이스 패키지에서 충족되지 않은 사항에 대해 얘기합니다. 또한 타이디(정리된)한 데이터 원칙에 따라 모델링의 기초를 소개합니다.

 

Chapter 4~9에서는 Ames housing price 데이터 셋을 소개하고, recipe, parsnip, workflows, yardstick과 같은 tidymodels의 기본적인 패키지를 알아보는 시간을 가집니다.

Chapter 10~15에서는 효과적인 모델을 만드는 과정에 대해 집중하며 특히 리샘플링을 통한 모델 성능의 추정과 하이퍼파라미터 튜닝에 대해 알아봅니다.

마지막으로 마지막 챕터인 Chapter 16~21까지는 모델 구축에 필요한 다른 중요한 주제들을 다루고 있습니다. 차원축소와 같은 feature engineering 접근, 예측 변수 인코딩, 모델의 예측 동작 방식과 언제 모델 예측을 신뢰할 수 있는지에 대해 논의합니다.

 

한국어 번역본이 나와있지 않아서, 앞으로 복습 겸 공부하면서 중요한 부분만 의역하고 정리할 생각합니다...

tidymodels 패키지는 tidyverse의 기본 아이디어를 계승한 패키지라서 "R For Data Science - Hadley"를 읽어보면 더욱 도움이 될 것 같네요.

 

공부하면서 느낀점은 10장부터는 ML 및 통계적 지식을 필요로 하므로 개인적으로 머신러닝과 통계 관련 서적을 읽어보시면 좋을 것 같습니다.
머신러닝은 https://www.statlearning.com/, 통계관련서적은 Categorical Data Analysis 읽어보면 내용을 이해하는데 좋아보입니다.

 

+ R for Data Science의 2번째 버전이 공개되었으며 1판에서 있는 코드와 파트의 보완, 추가, 제거가 진행되었다고 합니다.

아직 한글 번역본은 나오지 않았지만 관심있으신분들은 참고해보세요. (https://r4ds.hadley.nz/)

저작자표시 비영리 변경금지 (새창열림)

'Data Science > Modeling' 카테고리의 다른 글

[Tidy Modeling with R] 5. Data Spliting (데이터 분할)  (0) 2023.09.10
[Tidy Modeling with R] 4. Ames Housing Data  (0) 2023.09.10
[Tidy Modeling with R] 3. R Modeling Fundamentals  (0) 2023.09.09
[Tidy Modeling with R] 2. Tidyverse  (0) 2023.09.07
[Tidy Modeling with R] 1. Software for modeling  (0) 2023.09.07
'Data Science/Modeling' 카테고리의 다른 글
  • [Tidy Modeling with R] 4. Ames Housing Data
  • [Tidy Modeling with R] 3. R Modeling Fundamentals
  • [Tidy Modeling with R] 2. Tidyverse
  • [Tidy Modeling with R] 1. Software for modeling
임파카
임파카
[ML & Statistics] 모바일 버전에서 수식 오류가 있어 PC 환경에서 접속하는 것을 권장합니다.
  • 임파카
    무기의 스탯(Stat)
    임파카
  • 전체
    오늘
    어제
    • Study (149)
      • Data Science (44)
        • Modeling (18)
        • Manipulation (21)
        • Visualization (4)
      • Statistics (59)
        • Mathmetical Statistics (53)
        • Categorical DA (1)
      • Web Programming (17)
      • AI (26)
        • Machine Learning (16)
        • Deep Learning (10)
      • 활동 및 프로젝트 (3)
  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
임파카
[Tidy Modeling with R] 0. 서론
상단으로

티스토리툴바