データに対する態度が変わってきた

2012年02月17日 15:30

EMCが2011年12月に発表した調査レポート「Data Science Revealed: A Data-Driven Glimpse into th e Burgeoning New Field」が興味深かったのでご紹介。

EMCはデータ管理の各種ソリューションを提供する会社なので、データ管理の現状や重要性を浮き彫りにするような項目が並んでいますが、オマケ的なコンテンツが個人的には最も興味深かったので、そこだけご紹介します。

最近の膨大なデータの管理と伝統的なデータ管理を、以下の5つの点で対比しています。

BIGデータサイエンス 伝統的なデータ
不完全なデータでも問題なく扱える データは漏れなく揃えておきたい
うちのデータはいつも散らかっている 私の管理するデータは常にクリーンな状態である
データは探索し、意味を見つけ出すものだ データが語ることをレポートするのが大事
データ量が多すぎて管理が大変だ データは多いが、今のところ管理できている
私が見つける知見は製品や業務の意思決定に影響を与える 私は過去のパフォーマンスを計測する

面白いですねぇ。「データ量が増えたことによって管理の負担が増えたが、意思決定につなげることが重要なので、データをキレイな状態に保つことを諦めて割り切ろう。データを受動的に集めて分析するだけでは意味が無く、仮説に基づいてアグレッシブに探索することが重要」という最近のトレンドが反映されています。

アクセス解析に限らず、今後データは増える一方で減ることはありませんが、データの種類と量が増えたからといってスゴイことが分かるようになるわけではありません。バズワードに惑わされないようにしたいところですが、とはいえ変化は変化。感度を高くして変化を察知・理解し、柔軟かつ上手に向き合っていきたいものです。

私自身は、そろそろ狭義の「アクセス解析」に飽きてきたので、ビジネスインテリジェンス(BI)などの分野とデジタルマーケティングがどう統合していくか、USの動向を見ながら模索しているところです。3月上旬にサンフランシスコで開催されるeMetricsに参加する予定なので、またMarkeZineでレポートを公開したいと思っています。

2/18追記:データの種類と量が増えた結果、管理や分析の負荷が高まってきたらホドホドに管理しつつ、でも実りのある分析をしよう、という意味です。「データの精度を高めるのが不要」「大量データには意味が無い」という意味ではありません。