데이터 아키텍처란?
조직이 데이터를 수집, 저장, 처리 및 관리하는 방법을 설계하고 구현하는 과정 혹은 체계
☑️ 데이터의 원천
- OLTP 데이터베이스 : 세션별 모든 트랜잭션 데이터 (구매 내역, 입출금 내역 등)
- 기업 어플리케이션 : ERP/CRM 등과 같은 데이터 관리 시스템 (고객 정보, 재고, 매출 등)
- 서드파티 : 외부 데이터 (시장 조사, 경쟁사 동향 분석 등)
- 웹/로그 데이터 : 유입 경로, 랜딩 페이지, 가장 오래 머무른 페이지 등의 정보
- loT 데이터 : loT 기기들이 생성하는 데이터
raw-data를 용도에 맞게 잘 가공해서 쓸만한 데이터로 만들어준 다음 활용해야 한다.
이러한 과정을 ETL 이라고 한다.
✳️ ETL (Extraction Transformation Load)
- Extraction 추출 : 원천에서 데이터를 가져오기
- Transformation 변환 : 중복/오류값 등 제거 혹은 일정한 형식으로 변환하기 (칼럼별 결합, 분류 가능) 데이터 품질 향상!
- Load : 정제된 데이터를 데이터 웨어하우스/레이크에 저장
| 데이터 웨어하우스 | 데이터 레이크 |
| 필요한 형식으로 변환 후 저장 | 모든 원시 데이터를 그대로 저장 |
| ✔️ 정형 데이터 ✔️ 신속 정확하게 원하는 데이터 추출 ✔️ 데이터 무결성, 신뢰성 보장 |
✔️ 정형, 비정형, 반정형 데이터 ✔️ 스토리지 비용이 비교적 낮음 ✔️ 다양한 실험과 탐색적인 분석 가능 ex) 머신러닝 모델 훈련, 새로운 패턴 발견 |
➕ 데이터 마트
데이터 웨어하우스에서 특정 주제나 부서에 필요한 데이터만 따로 뽑아 놓은 데이터 집합
✔️ 장점
- 효율적인 데이터 관리 및 접근성
- 쿼리 처리 성능 향상
- 사용자 맞춤형
- 보안, 데이터 보호 강화
☑️ 데이터 활용
기업 내부 핵심 부서별, 개발 및 테스트, 데이터 전문가, 일반적인 운영 및 보고, 기타 분야에서 다양하게 활용된다.
'데이터 분석 > 아티클 미션' 카테고리의 다른 글
| [아티클 미션] -14 가설 검증 (0) | 2025.03.07 |
|---|---|
| [아티클 미션] -13 사용자데이터 통계 분석 (0) | 2025.03.04 |
| [아티클 미션] -11 Data Analytics Engineer가 하는 일 (0) | 2025.02.10 |
| [아티클 미션] -10 좋은 데이터 분석가는 데이터 기반 사고와 직관의 균형을 유지한다. (0) | 2025.02.10 |
| [아티클 미션] -9 데이터 사이언티스트 직무를 희망하는 주니어들에게 하는 조언 (0) | 2025.02.10 |