備忘録的にデータウェアハウス構築の際の注意点というか失敗談。

データ分析システムを構築する際は、分析の切り口と実際の分析項目を考えながらディメンジョン、ファクトを構成していく。分析だけを考えた場合、これで問題無いのだが、実運用を考えた場合、そのデータの保持期間も考えておく必要がある。
一応、データウェアハウスの定義としてはデータは不揮発性ということにはなっているが、リソースを無限に取るわけにはいかないので、実際は古いデータから消していったり、必要なデータだけをデータマートという形で切り出したりする。その消去の際に、例えば時間項目をキーにしてdelete文を発行したりするととんでもない時間がかかったりするので、物理設計の際は、きちんとデータ削除のことまで考えた上で領域を切り分け、drop文などを使ってデータの整理ができるようにしておこう。

Follow me!