データ分析を強化したい企業の間で、データ・ウェアハウスとデータ・レークの良さを組み合わせた新コンセプト:データ・レークハウスが注目されています。アイテ・ノバリカ・グループでは、保険業界顧客に対してデータ・レークハウスに対する関心をヒアリングし、レポート「The Data Lakehouse: How Past Data Architectures Produced a New Paradigm」としてまとめました。ここではその概要をご紹介します。
■ 全社データ分析基盤の歴史
企業のデータ分析基盤の始まりは、1980年代に登場したデータ・ウエアハウスにさかのぼる。
(データ・ウエアハウス)
ビジネス・トランザクションで発生したデータを全社で集約し、データ分析に活用しやすいよう分類し正規化、保持するテクノロジーをデータウエアハウスと称する。この加工には一定の手間が必要だが(時間的遅れも生じる)、一旦データがデータウエアハウスへ収納されれば、効率良く分析/活用できるため、現在でも多くの企業で利用されている。弱点としては、当初の想定になかったデータ利用が必要となったり、新たなデータ項目を追加して分析したい場合、対応に手間取るケースが多いことが挙げられる。