データマイニング/テキストマイニング
- 【カテゴリー】 ソフトウェア
- 【よみ】でーたまいにんぐ/てきすとまいにんぐ
- 【英名】Data Mining/Text Mining
2005年12月1日掲載
大規模なデータの「鉱脈」から「採掘(mining)」によって有用なデータを生産する技術。データマイニングとは、販売データや通話履歴など、大量蓄積されるデータを解析することにより、項目間の相関関係などを探し出すことを指す。たとえば「週末の早朝」であるのに「弁当類がよく売れる」という情報の相関から、近辺環境を考えて「釣り客が多い」という状況が読みとれ、これに合わせた品揃えをさらに検討することが可能となる。これに対しテキストマイニングも、文章データに対する多角的な観点からの分析によって役立つ知識や情報を取り出そうという点は同様である。しかしデータマイニングで扱うデータがデータベーススキーマによって整理されているのに対し、テキストマイニングでは形式化されていないテキストという生データを扱う。従来は単純な文書検索であったが、膨大な文書の中に記述されている「内容の傾向や相関関係」などを分析することで、既存の知識にはなかった発想や営業戦略立案などに役立つ知識や情報獲得をめざす技術に変化しつつある。









