1. 기술 통계 : 수집된 데이터의 경향성 파악
| 범주형 데이터 | 수치형 데이터 |
| 주로 백분율, 빈도 산출 | 주로 평균, 표준편차 산출 |
| • 원 그래프 (pie chart) 직관적인 비율 확인 가능 / 과분류 지양하기 • 누적 막대 그래프 여러 데이터 집합을 한 번에 표시 가능 |
• 막대 그래프 (bar chart) 막대길이로 비교 • 선 그래프 (line chart) 다중 범주 비교 + 흐름 파악 가능 |
+ 방사형 그래프 특정 대상에 대해 여러 지표로 나누어 전체적인 경향성을 파악
+ 산점도 x,y축(비교 기준 2개) 상의 좌표 값으로 점찍어 표현
2. 추론 통계 : 표본으로부터 모집단 추론 / 가설 검증
✅ 용어 정리
- 모집단(population) : 전체 사용자 집단
- 표본(Sample) : 모집단을 대표하는 일부 사용자
- 정규 분포
: 평균을 중심으로 좌우대칭 모양을 그리는 그래프
: 표본 데이터가 모집단을 대치할 수 있는지 확인하기 위해 활용
- 통계적 유의성
: 정규분포로 정규성을 확인한 후 분석 결과가 통계적으로 유의미한지를 검증
: * 기호로 표시 (정도에 따라 * , ** )
: 통계적으로 유의미하다 = p-value 가 0.05 이하이다
= 모집단으로 다시 분석해봐도 20번 중에 1번 빼고 일치한 결과가 나온다.
✅ 추론 통계 방법
- t 검정 : 지금보다 다른 것이 더 효과적일 것이다 라는 가설을 세우고 그 효과를 통계적으로 검증하는 방법
- 분산분석 : t 검정 하고 싶은데 비교 대상이 3개 이상일 때
- 상관 분석, 회귀 분석 : 통계적 차이 비교 + 변수들 간의 관계 파악할 때 활용
- 어떤 데이터인지에 따라 효과적인 분석방법 및 시각화 방법이 다르므로 그 특성을 파악하는 것이 우선이다.
- 상황에 따라 통계적으로 유의미한 지표가 다를 수 있기 때문에 고차원적으로 해석할 줄 알아야 한다.
- 분석결과를 공유할 때에는 왜곡된 해석을 줄이고, 양상을 보다 직관적으로 보여줄 수 있는 적합한 그래프를 선택해야 한다. 각 그래프의 특성을 잘 파악해두자.
'데이터 분석 > 아티클 미션' 카테고리의 다른 글
| [아티클 미션] -15 데이터의 신뢰성 (0) | 2025.03.14 |
|---|---|
| [아티클 미션] -14 가설 검증 (0) | 2025.03.07 |
| [아티클 미션] -12 데이터 아키텍처 (0) | 2025.02.27 |
| [아티클 미션] -11 Data Analytics Engineer가 하는 일 (0) | 2025.02.10 |
| [아티클 미션] -10 좋은 데이터 분석가는 데이터 기반 사고와 직관의 균형을 유지한다. (0) | 2025.02.10 |