ニュース
第4回 データマイニングで陥りがちな「分析のワナ」:【連載】実践! ケーススタディから学ぶテキストマイニング
過去3回目の連載では、テキストマイニングの概論と、意図したインサイトを導き出す手法をご紹介した。しかしこれだけですべて上手く分析できる、というわけではない。テキストマイニングには、分析結果の信頼性を大きく左右するさまざまなワナが存在するのだ。第4回は、正確なインサイトを導き出すため、分析のプロセスにおいて注意すべきポイントについてお伝えしよう。
先月実施されたアンケートで、インターネットの利用率が100%となっていたことが明らかになった。評論家は「これは政府主導によるIT政策の効果の現れと言っていいだろう」とのコメントを発表した。調査したのは◯◯センターなど。インターネット上でアンケートを実施し、約2万3000人から回答を得た。
ギョッとされた方もいるかもしれないが、これは10年以上前にインターネット上で流行したジョークだ。実際のところ現在の日本におけるインターネット普及率は82.8%である(総務省:「通信利用動向調査」2014年6月発表)。インターネットで行ったアンケートでの利用率調査なのだから、利用率が100%になるのは当たり前だ。しかし、一瞬それらしい調査結果に見えてしまう。少し極端な例であるが、このような「ワナ」は実は我々の周りに溢れている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 「データドリブンマーケティング」とは本当にリーチしたいターゲットを探し出すための戦略
米Turnは2014年10月7日、電通にデータマネージメントプラットフォームとプログラマティック広告の実行、分析などのサービス提供元として採用されたと発表した。数多くの実績やハイレベルなソリューションを強みに、データドリブンマーケティングプラットフォームとして高い評価を得る同社。データドリブンマーケティングのインパクトについて、CEOのビル・デマス氏に話を聞いた。 - 第3回 データドリブンマーケティングと「カイゼン」
データドリブンマーケティングは、「見える化」「分析」「仮説設定」「テスト」「改善」という一連の活動をPDCAで展開する手法である。これらの活動のうち、特に重要なのが日本人に馴染みの深い「改善=カイゼン」だ。 - 第5回 マーケティングでデータを活用するための最重要ポイント
第4回では具体的にデータを活用するプロセスについて解説しました。今回はデータ活用を成功させるための「ビッグデータへの対応」「ITを活用してスピードアップ」「オートメーション」という3つのポイントについて解説します。 - 第3回 データは溜まった、という人に真っ先に見て欲しい「相関」
アドテクの進化は止まらず、もはや計測できない領域はないとも言える。しかし、どのように調理すればいいかに困っている人は多い。マスとデジタルをどのように分析すべきか、その導入を紹介する。 - 第4回 購買データの新たな挑戦
マーケティング活動の基本指標となる購買データ。今回は既存のPOSデータや消費者スキャンパネルデータを振りかえるとともに、全く異なる分野であるスマートフォン・タブレット用アプリの最前線から、新たな購買データ活用の可能性を探る。 - SAS、新世代データ・ビジュアライゼーション・ソフト「SAS Visual Analytics」を発表
SAS Institute Japanは10月21日、同社が提供するデータ・ビジュアライゼーション・ソフトウェア「SAS Visual Analytics」が4コア・サーバをサポートし、小規模ユーザーでの利用に対応したことを発表した。