最近、ビジネス視点からのデータモデル活用に興味がある。経営者・企画担当者に対して既存のデータからどんな情報を提供できるか、また、経営層が欲しいデータはどんなデータモデルを作れば提供できるのかといったことを考えるのが楽しいのだ。
データは企業の礎であるから、そこに蓄積された欠片を組み合わせて新しい視点、分析軸などを生み出せるはずだ。その辺はデータサイエンティストの仕事ではあるのだが、彼らが正しく扱えるようにデータを整える、いわゆる「データの前捌き」の重要性はさらに高まっている。
前捌きとは、端的に言ってしまえば、データ品質の担保、コード体系の統一化であろうか。
もちろん、データ品質を担保するには、データそのものの発生からアーカイブ化までの一生を監視する体制や、データの重複や不正コピー、混入の有無をチェックするシステムなど、恐ろしい量の作業が必要だろう。しかもこの作業を、現行システムの稼働状況を損なわずに実行していかなければならない。…なんと気が遠くなることか。