데이터웨어하우스 / Data Warehouse / DW 정의 및 설명

데이터웨어하우스 / Data Warehouse / DW 정의 및 설명


데이터웨어 하우스는 기업의 대량 데이터를 축적하고 상호 간의 관련성을 분석하는 시스템. 데이터웨어 하우스는 정리 유지 기능 외에도 분석도 가능하기 때문에, 종래와 같은 단순 집계보다 발전된 분석을 제공합니다.

 

 

DWH 및 데이터베이스의 차이

기존의 "회계"와 "판매"등의 시스템에 데이터베이스 기능은 그만한 양의 데이터를 축적 할 수 있고, 서류 작성 등의 기능도 포함되어 있습니다. "고객 데이터를 얻기 위해서는 고객 관리 시스템에서 가져 오면 좋지 않을까?"라고 생각하는 사람도 있을 것입니다.

왜 "DWH '라는 전용 시스템이 필요할까요? 일반 데이터베이스와의 차이는 어디에 있을까요?

분석의 용이성

가장 큰 차이점은 "DWH 분석에 최적화" 된 것입니다. 왜냐하면 일반적으로 시스템이 다르면 데이터의 저장 형태도 다르기 때문에 한 시스템에서 다른 시스템으로 데이터를 전송하는 데 큰 부하가 걸립니다. 데이터베이스에서 이렇게 하면 작업에 막대한 시간이 소요될 것입니다.

비록 시간이 지남에 하나의 시스템에 데이터를 통합해서 이번에는 집계와 분석에 시간이 걸립니다. 컴퓨터에게 엄청난 부하가 되어, 일반적인 데이터베이스에서이를 시도하면 본업인 회계 또는 판매 등의 처리 업무를 할 수 없게 될 우려도 있습니다.

 

데이터 저장 용량

DWH는 저장 용량이 많은 것도 특징입니다. 일반적으로 데이터베이스를 이용하면 데이터 량이 커지면 용량의 한계를 넘기 때문에 세부 데이터가 아닌 집계 한 요약 데이터의 형태로 보관하지 않을 수 없습니다. 이것으로는 장기간 "고객 동향" "매상 추이"등의 분석을 할 수 없게 되어 버립니다.

데이타웨어하우스의 필요성

DWH 및 데이터베이스의 차이점에 대해 정리했지만, DWH이 기업에 주목 한 것은 어떤 배경이 있었기 때문일까요. 여기에서 DWH의 필요성을 설명하고 있습니다.

목적별 · 시계열 데이터의 유용성

DWH는 옹호가 있습니다. 미국의 컨설턴트인 빌 인몬 (William H. Inmon) 씨라는 사람이 1990 년 자신의 논문에서 데이터웨어 하우스를 "의사 결정을 위한 목적별로 편성된 시계열에 통합된 데이터의 집합체" 라고 정의하고 있습니다.

목적을 "결정"이라고 해명하고 있는 곳이 포인트입니다. 그냥 "데이터 창고"가 아니라 의사 결정을 목적으로 정연 (시계열)에 축적 된 「집합체」가 아니면 안된다는 것을 의미합니다.

 

 

시스템 횡단형 분석의 유용성

한국은 물론 서양 기업에서도 이미 컴퓨터에 의한 시스템화가 진행되고 있었습니다. 작은 것은 PC에서 대형화되면 사무실 컴퓨터 나 메인 프레임에서 다양한 업무를 시스템화하고 있습니다.

예를 들어 「회계」 「판매」 「고객」 「생산」 「재고」 「구매」라는 식입니다. 그런데 이러한 시스템화된 업무는 단독으로 구축되어 있기 때문에, 여러 시스템의 데이터를 함께 분석 할 수 없습니다. 따라서 데이터의 통합적인 분석을 가능하게 하는 분석 특화 형 데이터 집합체의 필요성이 나온 것입니다.

그리드형(광고전용)

댓글

Designed by JB FACTORY