👩🏻💻 Point of Today I LEARNED
📌 SQL
↗ 코드카타 3문제
📌 Tableau
↗ 특강 2,3회차 복습
↗ 실습으로 배우는 태블로 4주차
📌 Python
↗ 통계+머신러닝 개인과제 해설 듣고 복습
통계.. 머신러닝.. 어려운 거 다 지나가고
시각화 재밌는 거 남았구나 ~
라고 생각했던 나야 정신차려 아직 한 발 남았어.

^^
2. Tableau
2-1. 특강 2,3회차 복습
1) 계산된 필드 만들기
- COUNTD : count distinct
- SUM(if [Event Type]='purchase' then [Price] else 0 end) SQL과 굉장히 유사하다.
2-2. 실습으로 배우는 태블로 4주차
1) 필터 적용 순서

- 지역별 매출 Top 10 고객을 알고싶다면
- TOP N, 차원 필터를 이용해야 한다.
- 이 때 TOP N이 차원필터보다 먼저 적용되기 때문에 지역별 분류가 제대로 되지 않는 현상이 나타난다.
- 이를 해결하기 위해서는 차원 필터를 컨텍스트 필터에 추가하면 된다.
- 작동 순서 : 컨텍스트 필터 → Top N → 차원 필터
2) 퀵테이블 계산
시계열 데이터의 지표 변동성 확인을 위한 계산 기능
YTD (연초 대비 증감률), YoY (전년 대비 증감률), MoM (전월 대비 증감률), WoW (전주 대비 증감률)
3) LOD식으로 세부 집계하기
- FIXED : 뷰에서 현재 사용 중인 차원에 영향받지 않고, 지정한 차원으로 고정된 값을 계산
- 뷰에 차원이 추가/삭제되어도 결과값 동일
- { FIXED [고객명] : SUM([매출]) } 은 지역 필터 (일반필터)의 영향 받지 않음
- 컨텐스트 필터의 영향은 받을 수 있음.
- INCLUDE : 뷰에서 사용 중인 차원 + 추가적으로 지정한 차원을 포함하여 세부적으로 계산한 뒤, 최종적으로 다시 뷰 수준으로 재집계
- 뷰에 차원이 추가/삭제되면 그 차원에 따라 평균을 다시 구해야 하기 때문에 결과값이 달라짐
- 합계는 사실상 의미 없고, 평균/중위값 구할 때 많이 사용
- ex) 지역별 고객별 매출 평균 구하고 → 다시 지역별 평균
- EXCLUDE : 현재 뷰에서 특정 차원을 제외하고 나머지 차원으로만 계산 수행
3. Python
통계+머신러닝 개인과제 해설
▼ 제출한 코드 ▼▼ 튜터님 해설 ▼필수 1번 statistics csv 파일을 읽고, Category 기준 Customer ID 컬럼은 Count, Purchase Amount(USD) 컬럼은 Sum 연산을 진행해주세요. 동시에 2가지 연산을 진행해주세요. (한
rosenps3.tistory.com
여기에 따로 정리해두었다.
'데이터 분석' 카테고리의 다른 글
| [250526] Spark 1주차, Product Data Scientist 직무소개 (5) | 2025.05.27 |
|---|---|
| [250511] 실전 프로젝트, 5분 기록보드 시작 (0) | 2025.05.11 |
| [250501, 250502] 태블로 (0) | 2025.05.02 |
| [250417] 군집, 차원축소 (0) | 2025.04.17 |
| [250416] 이상탐지, 회귀 (0) | 2025.04.16 |