ggplot2에서 geom_rect의 투명도(alpha)가 적용되지 않는 이유와 해결법
·
Data Science/Visualization
데이터 시각화에서는 특정 부분을 강조하기 위해 사각형, 라벨, 선 등을 추가하는 경우가 많습니다. 특히 geom_rect()는 그래프 위에 사각형을 그릴 때 유용하게 사용되는데요.  그런데 alpha 값을 설정해도 투명도가 적용되지 않는 경우가 있습니다. 왜 이런 일이 발생하는지, 어떻게 해결할 수 있을지에 대해 알아보겠습니다.  geom_rect의 alpha(투명도) 값이 적용안됨먼저, 베이스라인 코드는 다음과 같습니다.mpg |> ggplot(aes(x=displ, y=hwy)) + geom_point() + geom_text_repel(data = potential_outliers, aes(label=model)) + geom_point(data = pot..
[Visualization with R] 1. Bar Chart (막대 그래프)
·
Data Science/Visualization
안녕하세요. R로 하는 시각화 첫번째 포스팅으로 막대 그래프에 대해 알아보려고 합니다. 막대 그래프는 시각화에서 많이 사용하는 그래프 중 하나로 주로 그룹(범주형)별 빈도, 비율, 값을 나타낼 때 많이 사용됩니다. 예를 들면, 부서별 판매실적이나 연령대에 따른 선호도, 실험에 참여한 사람들의 MBTI 빈도를 나타낼 때 효과적입니다. 막대그래프는 크게 범주별 빈도를 나타낼 때와 범주에 따른 값이 주어졌을 때 시각적으로 표현할 수 있습니다. 예를 들면, 다음과 같이 Iris의 행을 랜덤으로 추출하였을 때, 종(Species)별 빈도가 어떻게 나타날 지 궁금할 수 있겠죠? iris_sample % slice_sample(n=50) 해당 데이터에서는 종은 versicolor, setosa, virginica 3..
[R] Scatterplot Matrix (산점도행렬)
·
Data Science/Visualization
안녕하세요! 이번 포스팅에서는 산점도행렬에 대해 다루어 보려고 합니다. 많은 데이터 사이언티스트들이 본격적인 데이터 분석에 앞서 EDA를 하고 있습니다. EDA에서는 스키마 점검, 이상치 제거, 변동과 공변동 인사이트 도출을 포함해서 데이터를 이해하기 위해서 여러가지 도구들을 사용합니다. 이때, 시각화 역시 EDA에서 빠질 수 없는데요! 일반적으로 분석 할 데이터에는 많은 변수들이 포함되어 있고, 이를 한번에 표현하면 한 눈에 대략적인 관계를 파악할 수 있을 정도로 효과적이라서 많이 사용합니다. 처음으로 산점도행렬을 표현하기 위해서 데이터셋이 필요한데요. 저는 mtcars 데이터 셋을 사용해서 코드를 작성하였습니다. mtcars 11개의 변수와 32개의 데이터가 있는 mtcars 데이터셋입니다. 간단하게..
[R] ggplot2 Visualization
·
Data Science/Visualization
Data Science의 첫 글을 시각화로 시작하게 되었습니다. 20년도에 스터디하면서 제작한 자료로 ggplot2의 geom_function에 대해 다루고 있습니다.