

【 テキストマイニング 】
テキストマイニング
テキストマイニング とは、通常の文章 (自然文) の集まりを自然言語解析の手法を使って単語やフレーズに分割し、その出現頻度や相関関係、出現傾向などを分析することで、知見や発想に役立つ有用な情報を抽出する、テキストデータの分析方法。文字列を対象としたデータマイニングの手法の一種で、「マイニング」 は「発掘」という意味で、テキストの山から価値ある情報を掘り出す、といった意味が込められている。
テキストマイニングの対象としては、自由記述式のアンケート回答、コールセンターにウェブのお問合せ窓口などに寄せられた質問や意見、電子掲示板への書き込みやメーリングリストのログに蓄積されたテキストデータなどがある。定性情報を解析することによって、顧客や市場のニーズを抽出ししたり、自社製品への不満点を分析するといった使い方が期待されている。例えば商品の評価や顧客サービスの問題点などを把握することができる。
単語の境界(区切り)判別や文法のゆらぎが多い日本語において形態素解析が困難であったが、自然言語処理の発展により実用的な水準の分析が可能となった。従来、単語ごとに分かち書きする英語に比べて、日本語のテキストマイニングにおいては文章を単語ごとに切り分ける処理(形態素解析)が必要であることから“遅れている”とされていたが、近年技術的な進化により、ある程度ビジネスでも実用レベルに達するようになってきた。
自然文の蓄積の形で存在する業務関連データは多く存在する。これらは意味のある形で数値化や定型化することが難しく、担当者が一つ一つ目を通して分析するのは時間ばかりかかってしまい効率的に活用することが難しかった。テキストマイニングでは膨大に蓄積されたテキストデータを単語やフレーズに分解し、これらの関係を一定のルールに従って分析することにより、単語間の関係や時系列の変化などを抽出する。これにより、業務上の問題点を把握したり、製品の評価を調べたり、特に多い問い合わせやクレームを見出したり、これらが時系列にどう変遷しているかを調べたりすることができる。
{relatednews}
Hot Topics
Now Boarding★相乗り募集!
マルチクライアント調査
特定分野に共通するテーマに焦点を当て、参画者を事前に募集し、市場調査を実施するプロジェクト形式のマルチクライアント調査サービスのご提供を開始いたします。
複数の参画者からの共同出資 (共同発注/共同購入) により調査プロジェクトを実現させると共に、調査作業工数の効率化を図ることで、個々の委託調査と比べた場合の1社あたりコスト負担の軽減も可能になります。