데이터 웨어하우스란?
데이터 웨어하우스(Data Warehouse)는 운영 시스템 및 외부 데이터 소스에서 파생된 기업 정보 및 데이터의 모음이다. 데이터 웨어하우스는 다양한 집계 수준에서 데이터를 통합, 분석 및 보고할 수 있도록 하여 비즈니스 의사 결정을 지원하도록 설계되었다. 데이터는 추출, 변환 및 로드 프로세스를 통해 데이터 웨어하우스에 채워진다.
테코피디아가 설명하는 데이터 웨어하우스
데이터 웨어하우스 아키텍처는 운영 시스템에서 의사 결정 지원 시스템으로의 데이터 흐름을 지원하기 위해 설계된 아키텍처 모델로 1980년대에 탄생했다. 이러한 시스템에는 기업이 오랫동안 동안 축적해 온 대량의 이기종 데이터를 분석해야 한다.
데이터 웨어하우스에서는 여러 이기종 소스의 데이터를 단일 영역으로 추출하고 의사 결정 지원 시스템의 필요에 따라 변환하여 웨어하우스에 저장한다. 예를 들어, 한 회사에서 직원, 급여, 개발 제품, 고객 정보, 매출 및 송장 관련 정보를 저장한다. CEO는 최신 비용 절감 방안과 관련된 질문을 할 수 있으며, 이에 대한 답변에는 이 모든 데이터의 분석이 포함된다. 경영진은 이러한 모든 이질적인 원시 데이터 항목을 기반으로 비즈니스 의사 결정을 내릴 수 있다.
따라서 데이터 웨어하우스는 미래의 의사 결정에 기여한다. 위의 예에서처럼, 회사 관리자는 웨어하우스 데이터를 쿼리하여 특정 제품의 시장 수요, 지역별 판매 데이터 또는 기타 문의에 대한 답변을 찾을 수 있다. 이를 통해 특정 제품을 보다 효과적으로 마케팅하기 위해 필요한 단계에 대한 인사이트를 얻을 수 있다. 운영 데이터 저장소와 달리 데이터 웨어하우스에는 중요한 비즈니스 의사결정에 도달하기 위해 분석할 수 있는 총체적인 과거 데이터가 포함되어 있다. 관련 비용과 노력에도 불구하고 대부분 주요 기업은 데이터 웨어하우스를 사용한다.