資料倉儲(Data Warehouse)是為了查詢與分析為目的建置的系統,系統中包括所有對組織做決定有用處,
且經過整合的資料。資料倉儲是存放與整合各部門、各系統的資料,並提供多維度的方式進行查詢與分析報表。
資料倉儲有四種特性:
1. 主題導向(Subject-Oriented):資料倉儲是為了對不同的主題來做分析,因此,資料的儲存是以主題為準,
且一個資料倉儲可以有多個主題。
2. 整合性(Integration):資料倉儲會包含許多不同來源的資料,這些資料是被整合過後,才存放於資料倉儲。
3. 時間變化性(Time-Variant):資料倉儲中的每一筆資料是與某個時間點有關的。
4. 非暫存性(Non-Volatile):資料一旦進入資料倉儲後,就不會再被修改與異動。
然而,也有學者指出,資料倉儲若存放太陳舊的資料,這些資料將可能不具分析價值,
因此應要適當的把這些資料搬移至其它地方。
資料倉儲與資料庫的差異:
1. 資料庫:資料量相對較少、資料可異動、日常操作的交易資料、新增資料較即時、用於交易處理系統、
資料量若變多則查詢報表速度會變慢。
2. 資料倉儲:資料量較大、資料不可異動、整合性的匯總資料、新增資料通常為批次處理、用於線上分析系統、
因資料都已事先匯整與處理所以查詢報表速度快。
沒有留言:
張貼留言