데이터 분석/아티클 미션

[아티클 미션] -13 사용자데이터 통계 분석

경 민 2025. 3. 4. 14:55

1. 기술 통계 : 수집된 데이터의 경향성 파악

범주형 데이터 수치형 데이터
주로 백분율, 빈도 산출 주로 평균, 표준편차 산출
원 그래프 (pie chart)
직관적인 비율 확인 가능 / 과분류 지양하기

 누적 막대 그래프
여러 데이터 집합을 한 번에 표시 가능
 막대 그래프 (bar chart)
막대길이로 비교

선 그래프 (line chart)
다중 범주 비교 + 흐름 파악 가능

 

+ 방사형 그래프 특정 대상에 대해 여러 지표로 나누어 전체적인 경향성을 파악

+ 산점도 x,y축(비교 기준 2개) 상의 좌표 값으로 점찍어 표현

 

2.  추론 통계 : 표본으로부터 모집단 추론 / 가설 검증

용어 정리

  • 모집단(population) : 전체 사용자 집단
  • 표본(Sample) : 모집단을 대표하는 일부 사용자
  • 정규 분포

: 평균을 중심으로 좌우대칭 모양을 그리는 그래프

: 표본 데이터가 모집단을 대치할 수 있는지 확인하기 위해 활용

  • 통계적 유의성

: 정규분포로 정규성을 확인한 후 분석 결과가 통계적으로 유의미한지를 검증

: * 기호로 표시 (정도에 따라 * , ** )

: 통계적으로 유의미하다 = p-value 가 0.05 이하이다

= 모집단으로 다시 분석해봐도 20번 중에 1번 빼고 일치한 결과가 나온다.

 

추론 통계 방법

  • t 검정 : 지금보다 다른 것이 더 효과적일 것이다 라는 가설을 세우고 그 효과를 통계적으로 검증하는 방법
  • 분산분석 : t 검정 하고 싶은데 비교 대상이 3개 이상일 때
  • 상관 분석, 회귀 분석 : 통계적 차이 비교 + 변수들 간의 관계 파악할 때 활용

  1. 어떤 데이터인지에 따라 효과적인 분석방법 및 시각화 방법이 다르므로 그 특성을 파악하는 것이 우선이다.
  2. 상황에 따라 통계적으로 유의미한 지표가 다를 수 있기 때문에 고차원적으로 해석할 줄 알아야 한다.
  3. 분석결과를 공유할 때에는 왜곡된 해석을 줄이고, 양상을 보다 직관적으로 보여줄 수 있는 적합한 그래프를 선택해야 한다. 각 그래프의 특성을 잘 파악해두자.