데이터 웨어하우스(DW)에서 STG(Staging)와 ODS(Operational Data Store) 영역은 데이터 처리와 저장 과정에서 중요한 역할을 합니다. 이들 각각의 역할과 특성을 설명드립니다.
STG (Staging Area)
1. 역할 :
- 임시 저장소: STG는 다양한 소스 시스템에서 데이터를 추출한 후, 데이터 웨어하우스에 로드하기 전에 임시로 저장하는 공간입니다.
- 데이터 변환: 데이터를 정제하고 변환하는 단계가 이루어지는 곳입니다. 여기서는 데이터 클렌징, 필터링, 변환, 병합 등의 작업이 수행됩니다.
2. 특성 :
- 단기 저장 : 데이터는 짧은 기간 동안만 저장됩니다. 보통 ETL(Extract, Transform, Load) 프로세스가 완료되면 삭제됩니다.
- 비즈니스 규칙 미적용 : 데이터는 원본 상태에 가깝게 저장됩니다. 변환과정에서만 비즈니스 규칙이 적용됩니다.
- 빠른 데이터 로딩 : 대량의 데이터를 빠르게 로드할 수 있도록 최적화되어 있습니다.
3. 예시 :
- 소스 시스템에서 매일 밤 데이터를 추출하여 STG에 로드한 후, 이 데이터를 정제하고 변환하여 데이터 웨어하우스의 주요 테이블에 로드하는 과정.
ODS (Operational Data Store)
1. 역할 :
- 중간 저장소 : ODS는 소스 시스템과 데이터 웨어하우스 사이의 중간 저장소로, 운영 데이터의 통합 뷰를 제공합니다.
- 실시간 데이터 통합 : ODS는 주로 실시간 또는 거의 실시간 데이터 통합을 위해 사용됩니다. 운영 데이터의 최신 상태를 반영합니다.
2. 특성 :
- 단기 및 중기 저장 : 데이터는 중단기적으로 저장되며, 최신 운영 데이터를 포함합니다.
- 통합 데이터 : 다양한 소스 시스템의 데이터를 통합하여 운영 보고서와 쿼리에 사용할 수 있습니다.
- 높은 가용성 : 실시간 또는 근실시간 데이터 접근을 제공하며, 빠른 데이터 조회를 위해 최적화되어 있습니다.
3. 예시 :
- 여러 운영 시스템(예: ERP, CRM)에서 데이터를 실시간으로 수집하여 ODS에 저장하고, 이 데이터를 실시간 대시보드나 운영 보고서에 활용하는 경우.
요약
- STG (Staging Area) : 다양한 소스에서 데이터를 추출하여 임시로 저장하고, 데이터를 정제하고 변환하는 공간입니다. 주로 ETL 프로세스 중간 단계에 사용됩니다.
- ODS (Operational Data Store) : 운영 데이터를 실시간 또는 거의 실시간으로 통합하여 저장하는 공간입니다. 운영 보고서나 실시간 데이터 조회를 위해 사용됩니다.
이 두 영역은 데이터 웨어하우스의 데이터 처리 및 저장 과정에서 중요한 역할을 하며, 각각의 목적과 특성에 따라 적절히 사용됩니다.
'공부는 평생하는 것이다 > SQL' 카테고리의 다른 글
ORA-01017 "invalid username/password; logon denied" (0) | 2024.10.25 |
---|---|
[오라클] SQL Loader (Field in data file exceeds maximum length) (0) | 2024.10.10 |
[IT] Distinct와 Count 함께 사용하는 방법 (0) | 2023.07.03 |