bottomNavigator: null
disqus: false

🏠 스마트 플롯 메뉴

1. 기본 사용 방법

X축에 범주형 변수를 지정한 경우 각 범주에 대한 Y축 값의 분포를 확인할 수 있습니다. 오른쪽 상단에 다음과 같은 6개의 버튼(바 차트, 상자그림, 95% 신뢰구간, 추세선, 분포, 히트맵)이 표시됩니다.

스크린샷 2022-06-19 오후 3.26.09.png

2. 바 차트(Bar Chart)

<aside> 💡 서로 다른 범주가 갖는 변수값의 크기(Quantitative Amount)를 효과적으로 비교하기 위해 바차트를 사용하여 시각화할 수 있습니다.

</aside>

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/46647bf6-b74f-44b9-b9ce-e4a08df16da4/.jpg

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/67f801c9-34f2-4579-be4c-1cdf833a9607/.jpg

Grouped Bar Plot

두가지 범주들 간의 차이를 비교하기 위해 Grouped/Stacked Bar Plot을 사용할 수 있습니다.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/5970e81e-e0c1-4974-9551-0ce65de824d9/.jpg

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/c3fa2822-bbee-430b-9fc6-a65cbde7eaeb/.jpg

Stacked Bar Plot

Stacked Bar Plot은 막대그래프를 가로로 놓지 않고 세로로 차곡차곡 쌓는 것이 더 효과적일 때 사용하는 시각화 방법입니다.

아래 그림은 Y축을 [불량건수]로 선택, 변수에 대한 계산을 [합]으로 변경한 뒤 내림차순으로 정렬한 그림입니다.

관심있는 세그먼트를 클릭하면 해당 세그먼트에 대한 상세정보를 볼 수 있습니다.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/5b7112e0-4dc9-44cf-83f6-7b74394e8953/.jpg

<aside> 📌 비율 표현하기

X축과 하위그룹을 설정하면 Y축 값 리스트 상단에 레코드 개수 버튼이 생성됩니다.

레코드 개수 를 클릭하여 Y축을 레코드 개수 또는 비율로 설정할 수 있습니다.

그림1.png

</aside>

3. 상자그림

상자그림(boxplot)이란 최댓값, 최솟값, 중앙값, 사분편차를 사용하여 자료의 측정값들이 어떤 모양으로 분포되어 있는지 쉽게 알 수 있는 그래프입니다.

오른쪽 상단의 상자그림 아이콘을 누르면 시각화 화면에 상자 그림이 표시됩니다. 그 중 하나의 상자그림을 클릭하면 각 범주에 대한 자세한 값을 확인할 수 있습니다.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/38d428aa-28f8-4371-8e3c-34855abb4cbf/.jpg

4. 95% 신뢰구간

95% 신뢰구간은 같은 방법으로 100회 측정했을 때, 특정 구간 내 95회가 들어가는 수치라고 할 수 있습니다. 각 범주마다 평균과 신뢰구간의 범위가 표시되며 각 범주 값의 차이를 파악할 수 있습니다.

아래의 분석 화면을 활용하면, 전체 복사기 매출의 평균은 2,080원이며, 복사기 매출의 평균이 95%의 확률만큼 측정된 구간은 1250원부터 2910원이라고 이해할 수 있겠네요.

참고로 모든 변수의 신뢰구간이 같을 경우 통상적으로 무의미한 결과라고 판단합니다.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/1e012614-4e32-4f11-9f70-b2fc28fcf379/.jpg

5. 추세선

각 범주의 평균값을 이어 전체 추세선을 파악할 수 있습니다. 오른쪽 컨트롤창을 사용하여 X축 정렬방식을 바꾸어 추세를 한눈에 볼 수 있습니다. 데이터를 클릭하면 해당되는 범주의 평균값이 나타납니다.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/81c471b2-b06a-4656-8219-2418a0436a52/.jpg

6. 분포

분포는 데이터의 빈도를 파란색 선으로 표현하는 시각화 기능입니다. 파란색 선이 길수록 해당하는 값에 데이터가 많이 존재한다는 의미입니다.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/40dd7c0a-e437-4e3c-ba9c-819cf30e8c13/.jpg

7. 히트맵

데이터의 값을 컬러로 변환시켜 시각적인 분석을 가능하게 하는 데이터 시각화 기법으로 색이 짙어 질수록(보라색) 높은 밀도를 나타냅니다.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/4a0a7267-2f1a-41b8-a36d-a5d60a00feb1/.jpg