데이터 분석/아티클 미션

[아티클 미션] -3 데이터 리터러시 & 잘못된 데이터 해석

경 민 2025. 2. 7. 16:29
문제 해결에 적합한 핵심 데이터를 선택, 추출할 줄 아는가?

 


💡데이터 리터러시란?

데이터를 활용해 문제를 해결할 수 있는 능력

 

✅ 데이터 리터러시를 기르는 Cycle

문제 정의 → 해결책 제시 → 검증 측정 지표 선택

 

✅ 데이터를 효과적으로 활용하기 위한 3가지

1️⃣ 데이터/실험 기반의 사고방식

  • 문제 정의 : 어떤 걸 해결하려고 하는가
  • 목표 및 핵심 결과지표(OKR) : 비즈니스 목표와 관련있는가
  • 측정 지표 : 문제해결에 유의미한 지표를 선택했나
  • 가설 검증 기준 : 성공 여부 판단 기준은 무엇인가
  • 검증 후 변화될 것이라고 예상하는 액션 : 기대하는 액션이 나오는가
  • 결과 : 검증 기준대로 결과가 나왔는가
  • 인사이트 : 이번 싸이클에서 배운 점은 무엇이고, 보완할 사항은?

2️⃣ 분석 흐름대로 데이터를 탐색할 수 있는 환경

✔️ 데이터맵

: 전사적으로 중요한 Input/Output Metrics 간의 관계도

: 지표들 간의 연결관계를 잘 이해하고, 핵심 지표가 무엇인지 쉽게 파악하기 위함

: Input Metrics은 측정 가능하고, 직접적으로 컨트롤 가능한 것으로 설정한다.

✔️ 대시보드

: 지표가 어떻게 진행되고 있는지 현재 수준을 확인할 수 있도록 시각화한 공간

: 중요한 지표의 변동사항과 그 원인을 파악하기 유용함

 

3️⃣ 조력

✔️ 데이터 사이언티스트

✔️ 데이터 플랫폼

  • 데이터 레이크 : 모든 원시데이터를 적재
  • 데이터 웨어하우스 : 신속 정확하게 추출할 수 있도록 원시데이터를 구조화해 둔 저장공간
  • 데이터 카탈로그 : 레이크/웨어하우스에 어떤 데이터가 있는지 확인 할 수 있는 시스템

✅ 데이터를 잘못 해석하는 상황별 유형

1️⃣ 생존자 편향의 오류

기준을 남아있는 고객이 아니라 전체 대상으로 잡아야 한다.

 

2️⃣ 심슨의 역설

: 전체 지표와 그룹을 나눈 지표의 방향성이 다른 상황

: 전체 지표 + 그룹별 지표 모두 진행하는 세밀한 분석이 필요하다.

 

3️⃣ 성급한 일반화

: 비슷한 패턴이라도 무조건적인 일반화 지양해야 한다.

: 원인과 결과에 집중해서 객관적으로 해석해야 한다.

 

4️⃣ 목적에 맞지 않는 지표 선택

ex) 아래 두 가지는 전혀 다른 의미를 가진다.

CTA 버튼을 조회한 유저수 대비 클릭까지 한 유저수

CTA 버튼 조회수 대비 클릭수

 


역시 데이터 분석을 잘 하려면 쿼리 작성을 할 줄 안다고 다가 아니라 <목표에 맞는 적절한 데이터를 취사선택할 줄 아는가>가 중요하다는 것을 느꼈다. 또한, 데이터 플랫폼이 세분화되어 있다는 것을 새롭게 배웠다. 데이터 추출의 효율성을 높이기 위해 만들어진 기술적인 환경을 잘 활용해서 원하는 데이터를 쉽고 빠르게 추출해 데이터 리터러시를 길러야겠다.