データマイニングというのは、膨大なデータの中から意味のある仮説やデータの相関関係、パターンを見つけ出す技術です。
例えば、データマイニング技術がよく使われるビジネス分野に「需要予測」があります。
それは過去の様々なデータ(直前の売り上げや季節変動性、イベントの有無、天候、気温など)からパターンを見つけ出し、需要の予測を行います。
予測モデルを作り出す際に用いられる基礎データは、過去の実績値となるわけですが、今回の震災によって、モデルを用いる際のベースとなる環境データが大きく変わり、今までのモデルが使えなくなってしまったというケースが少なくないはずです。過去データに基づいたモデルというのは、言わば経験則であり、前提条件が違ってしまうと、役に立たないものになってしまいます。
今までは、同じ条件、同じ環境の下でのデータの変化・相関を見ていたため、モデルの中に出てこなかった環境変数が一気に表面化したものもあるはずです。例えるなら、富士山の山頂で、平地と同じ方法でご飯を炊いても、美味しく炊けないようなものです(気圧が低く、沸点が違うので)。
では、これから先、データマイニングというのは役に立たなくなってくるのでしょうか?
対応策は2つあります。
まず、改めてデータを収集し、モデルを再構築すること。
これはいずれにせよ必要となる作業です。
使えなくなってしまったモデルを作り上げたのと同じ手順でモデルを作り直すには、また膨大なデータ収集が必要になってくるかもしれません。
もうひとつは、今までのモデルを見直し、変わってしまったのはどこなのか?新たな環境で考慮しなければならないパラメータは何なのか考え直すこと。
実は、こちらの方が重要な作業です。
少なくとも、今までの環境の中で有用だったモデルが、異なる環境の中で使えなくなるということは、何か考慮すべき点が足りないということです。そこを見つけ出すことができれば、今までのモデルの改良版ということで、より精度の高いモデルを作り上げることが可能になります。
以前、勤めていた会社でもビジネスインテリジェンスやデータマイニング関係で仕事をしていて、お客様先に行くことが多かったのですが、何度か、お客様に言われたことは
「モデルの構築ではなく、効果が出る結果が知りたい」
ということでした。
確かに気持ちはわかります。費用と時間をかけてモデルを構築するよりも、例えばカタログの背景が白の方が売り上げが伸びるのか、黒の方が売り上げが伸びるのか、結論がわかっているならそれだけが欲しいということです。
しかし、モデルを作るということは「何故、そのような結果が出るのか?」という本質を掴むということです。
世の中には、理論がわからなくても結果が出せるかのように謳っているソリューションもたくさんあります。もちろん、学者で無い限り、詳細な理論まで知らなくてもコンピュータが補佐して結果を出してくれますが、問題の本質を掴むというのは、どうしても人間がやらなくてはならない部分です。
先の例のように、結果だけを追い求めてきた人、会社は、今のように背景・前提条件が変わってしまった時にはどのような対処をすべきか良くわかっていないかもしれません。
逆に言えば、データマイニングというのは、今回のように社会の大きな変化が発生したときにこそ、その真価を発揮するといえるのかもしれません。