JP4870448B2

JP4870448B2 - 情報処理装置、顧客ニーズ分析方法、およびプログラム

Info

Publication number: JP4870448B2
Application number: JP2006047341A
Authority: JP
Inventors: 哲朗足立; 努津山; 亜子庄勢
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2006-02-23
Filing date: 2006-02-23
Publication date: 2012-02-08
Anticipated expiration: 2026-02-23
Also published as: US20070198249A1; US7698129B2; JP2007226568A

Description

本発明は、情報処理の技術に関し、特に、テキストデータを単語などに分割し、その出現頻度や相関関係などを解析するテキストマインニングの技術に関する。

顧客に支持される商品開発のためには、従来のプロダクトアウト型の視点からの企画・開発ではなく、実際に商品を購買・利用する顧客の立場に立った、即ちマーケットイン志向による商品開発によって他社製品との差別化を実現することで製品の魅力度を高めることが課題となっている。この課題をクリアするために多くの企業は、市場調査を行って顧客意見を収集し、その顧客意見を分析することで市場のトレンドや顧客ニーズを把握したり、或いは、ターゲット顧客を特定したりするマーケッティング活動を行っている。また、企業では、コールセンタに寄せられる製品やサービスに対するクレーム（苦情）や自社のＷｅｂサイトの掲示板への書き込み等でよせられる顧客の意見も、顧客ニーズを把握するための重要な情報として利用している。

そして、上述のようなマーケッティング活動やコールセンタで収集される顧客意見（ＶＯＣ：Ｖｏｉｃｅｏｆｃｕｓｔｏｍｅｒ）には、数値ではなく自然言語のテキスト形式の文書データが多く含まれている。例えば、アンケート調査の自由回答欄の記載や、コールセンタで受けた苦情等は、テキスト形式で記述されている。そのため、顧客ニーズの把握や市場のトレンドを把握するためには、このテキスト形式のデータ（テキストデータ）を正確に分析することが求められている。そして、電子化された大量のテキストデータを分析する手法として、数値データを分析するデータマイニングを応用したテキストマイニングといわれる手法が知られている。

例えば、特許文献１には、大量のテキストデータを客観的に提示するためのテキストマイニングシステムが開示されている。特許文献1のテキストマイニングシステムでは、検索対象とする文書に含まれる特定単語の出現頻度をカウントする定量化手法や、これらの特定単語と類似する言葉を含む文書件数をカウントする定量化手法がとられている。

また、特許文献２には、分析対象製品ごとの概念辞書を作成し、予め語句の好評・不評のパタンを定義したデータベースと評価対象である文書を照合し、文書の好感度および不満度を算出する手法が示されている。

特開２００４−２１４４５号公報特開２００５−１１５４６８号公報

しかしながら、上記各特許文献に記載されている技術は、以下の問題点を有している。具体的には、特許文献１のシステムは、個々の単語及び文書を出現頻度だけで評価しているため、本来重要視すべき顧客意見とそうではない顧客意見を同一のものとして扱ってしまう可能性がある。例えば、特定の顧客ニーズに関する特定単語に対し大きい頻度を得る結果が得られた場合、それは、顧客にとって関心のある意見であると想定できる。しかし、その特定単語は、必ずしも重要な顧客ニーズであるとは限らない。それは、特定単語だけでは、回答者が好意を持っているのか、不満を抱いているのか、事実を述べているだけなのかは特定できず、本当に重要視すべき意見かどうかを判断することができないためである。すなわち、特許文献１の手法では、顧客ニーズを正確に把握できない可能性がある。したがって、このような出現頻度の高い顧客意見だけを頼りに新商品開発をしたとしても、実際には顧客にとって魅力のあるものではなく当たり前の機能の商品になることがある。

特許文献２では、ある特定単語に対して、肯定的な意見か否定的な意見かを抽出することで、特定の顧客意見の詳細分析を行っている。商品企画では、特定顧客意見を重要視する場合もある。しかし、特定の顧客意見が特異な意見である場合もあり、それを鵜呑みに企画をすることのリスクを含んでいる。特許文献２の手法では、個々の意見を分析するため、顧客意見個別に好評・不評の判定はできるが、多種類の顧客意見を総合して判定するのは難しい。例えば、ある特定単語に対し、満足を示す顧客と不満を示す顧客がいた場合、その特定単語に対する評価は相殺されるため評価値が算出されないという問題が生じる恐れがある。

本発明は、上記事情に鑑みてなされたものであり、本発明の目的は、顧客意見を肯定や否定の観点ではなく、重要度の視点から定量的に指し示すことにより顧客ニーズを高精度に分析することにある。

上記課題を解決するため、本発明の一態様は、複数の顧客意見情報が登録されているデータベースを記憶している記憶部を備え、該顧客意見情報を用いて顧客ニーズを分析する処理を行う情報処理装置に適用される。ここで、前記顧客意見情報には、分析対象の製品またはサービスに対する顧客からの意見を自然言語で表現したテキスト形式の文書データが含まれている。

そして、前記情報処理装置は、前記データベースに登録されている顧客意見情報に含まれる文書データに対し、該文書データを単語に分解する分かち書き処理、および分解された単語毎に品詞を関連付け、該単語毎に品詞を関連付けたデータを出力する形態素解析部と、前記形態素解析部が出力したデータを利用して、単語の係り受けによる文書の内容を解析する構文解析部と、前記構文解析部の処理結果を用いて、前記複数の顧客意見情報を所定の顧客ニーズ毎に分類し、該顧客ニーズ毎に分類した顧客意見情報を出力するクラスタリング部と、利用者から、顧客ニーズを評価するためのキーワードの設定を受け付けると共に、該受け付けたキーワードに対応付けて該キーワードの評価レベルを示す評価値の入力を受け付ける評価語句定義部と、前記顧客ニーズ毎に該分類した顧客意見情報を取得し、該顧客意見情報毎に、該顧客意見情報に含まれる文書データから前記キーワードを抽出し、該抽出したキーワードに対応付けられている評価値を合計して、その合計値を該顧客意見情報の重要度を示すスコアとして算出する評価部と、前記顧客ニーズ毎に、該分類した各顧客意見情報の前記スコアに所定の統計処理を施して、該顧客ニーズの統計値を算出する集計部と、を備え、前記評価語句定義部は、前記形態素解析部から前記単語毎に品詞を関連付けたデータを取得し、該取得したデータを品詞毎にソートし、該品詞毎にソートした単語を利用者に提示し、利用者からの要求にしたがい、前記提示した単語の中からキーワードの設定を受け付ける。

このように本発明では、利用者に分析するキーワードと、その評価レベルを示す評価値を設定させ、キーワードおよび評価値を用いて顧客ニーズ毎に顧客意見情報の重要度を求めるようにしている。すなわち、本発明では、分析対象の顧客意見情報の種類に応じて、キーワードおよび評価値を設定しているため、正確に顧客ニーズを分析することができるようになる。その結果、多くの顧客意見を製品やサービスに反映させることが可能になり、製品やサービスの市場への訴求力を高めることができる。

以下、本発明の実施形態について図面を用いて説明する。

先ず、本発明の実施形態の概略構成について図１を用いて説明する。図１は、本発明の実施形態が適用された顧客ニーズ分析システムの機能ブロック図である。

図示するように、顧客ニーズ分析システムは、自然言語で記述された顧客意見（ＶＯＣ：Ｖｏｉｃｅｏｆｃｕｓｔｏｍｅｒ）を示すテキストデータを用いて、顧客ニーズを分析する処理を行う情報処理装置１０と、キーボードやマウス等の入力装置２０と、液晶ディスプレイ等により構成される表示装置３０とを有する。顧客ニーズ分析システムは、入力装置２０や図示しない外部装置を介し、アンケート結果やコールセンタで寄せられたクレーム等の顧客意見（ＶＯＣ）を示したデータの入力を受け付ける。顧客ニーズ分析システムは、受け付けた顧客意見を示したデータを用いて、顧客ニーズの分析を行い、表示装置３０に分析結果を表示する。

具体的には、情報処理装置１０は、テキストマイニング処理部１００と、評価語句定義部１１０と、ＶＯＣスコア集計処理部１２０と、集計処理部１３０と、ＶＯＣデータベース部２００と、専門用語辞書データベース部２１０と、評価語句データベース部２２０と、ＶＯＣテーブル記憶部２３０と、を有する。

ＶＯＣデータベース部２００には、エンドユーザアンケートや、コールセンタで収集された意見、各種報告書などの顧客意見（ＶＯＣ）を示すデータ（以下、単に「ＶＯＣデータ」ということもある）が格納されている。図示する例では、ＶＯＣデータベース部２００には、アンケート結果を集計して纏めた（ファイル化した）ＶＯＣデータ２０１ａ、コールセンタで受け付けた顧客意見をファイル化したＶＯＣデータ２０１ｂ、業務報告書を集計してファイル化したＶＯＣデータ２０１ｃ等が顧客意見として格納されている。以下では、ＶＯＣデータ２０１ａのファイル名を「アンケートデータ」とする。また、ＶＯＣデータ２０１ｂのファイル名を「コールセンタ」として、ＶＯＣデータ２０１ｃのファイル名を「業務報告」とする。

なお、ＶＯＣデータ２０１の一例として業務報告書を挙げたのは、業務日報等の報告書には、他社製品やサービスと差別化を図るための意見、自社製品の問題点（不良箇所）、会議における製品化のアイデア等が記述されていることがあるためである。したがって、収集した業務報告書を分析することにより、他社との差別化に繋がる製品仕様・アイデアのヒントを得ることができると考えられる。

ここで、ＶＯＣデータベース部２００に格納されるＶＯＣデータ２０１のデータ構成を図３に示す。

図３は、本実施形態で利用されるＶＯＣデータのデータ構成の一例を模擬的に示した図である。なお、図３では、ＶＯＣデータとして、製品（ここでは昇降機Ａ）に対するユーザからのアンケート結果を集計したデータを例示している。

図示するように、ＶＯＣデータ２０１ａは、昇降機Ａに対するアンケート結果を収集して登録したデータベースである。具体的には、ＶＯＣデータ２０１ａは、集計した顧客意見を識別する「ＶＯＣ−ＩＤ」を登録するためのフィールド３０１と、顧客意見の「属性情報」を登録するためのフィールド３０２、３０３と、「昇降機Ａに対するアンケートの回答内容（単に「回答内容」ということもある）」を登録するためのフィールド３０４とを備えて１つのレコードが構成されている。なお、図示する例では、顧客意見の属性情報として、フィールド３０２に、昇降機Ａが設置されている地域を識別する「地域番号」が登録され、フィールド３０３に、昇降機Ａが設置されている建物の用途（マンションに利用されているのか、雑居ビルとして利用されているか等を示すデータ）が登録されている。

なお、図示する顧客の属性情報は、例示に過ぎない。本実施形態において、顧客意見の属性情報とは、アンケートを回答した顧客を特徴付けるデータのことをいう。例えば、属性情報として、顧客の性別、体格的特性、趣味嗜好、職業などのプロフィールと呼ばれるデータを用いるようにしてもよい。また、属性情報として、プロフィール以外のデータ、例えば、報告内容の種類や重要・緊急性など業務の特徴を示すデータを用いるようにしてもよい。そして、これらの属性情報は、分析者（利用者）があらかじめ分析を想定して、回答者・記述者に入力を強いるものであり、顧客意見収集後に追加することはできない。これら属性情報は、新開発製品によって収集すべき項目が異なるため、ＶＯＣデータベース部２００に格納されている全てのＶＯＣデータ２０１において共通するものではない。そこで、後述の評価結果を受けた詳細分析を考慮して任意の項目を設定することが重要である。属性情報の記述方法としては後の分析効率を考えて、０・１などといったコード化されていることが望ましい。

図１に戻り、説明を続ける。テキストマイニング処理部１００は、既存のテキストマイニングの手法を利用して、ＶＯＣデータベース部２００に格納されているＶＯＣデータ２０１を用いてデータ分析処理を行う。具体的には、テキストマイニング処理部１００は、形態素解析部１０１、構文解析部１０２、およびクラスタリング部１０３を有する。形態素解析部１０１は、テキスト形式の文書データの分かち書き処理（単語分解処理）と、分解された単語に品詞を関連付ける処理とを行う。構文解析部１０２は、単語の係り受けによる意味理解の解析を行う。クラスタリング部１０３は、分析対象のＶＯＣデータ２０１に登録されているレコードを内容が類似する文書毎に分類する。具体的には、クラスタリング部１０３は、予め分析者が設定した顧客ニーズ毎（見た目、乗り心地等）にＶＯＣデータ２０１を分類したＶＯＣテーブルを作成し、作成したＶＯＣテーブルをＶＯＣテーブル記憶部２３０に格納する。ここで、ＶＯＣテーブル記憶部２３０に格納されるＶＯＣテーブルのデータ構成の一例を図４に示す。

図４は、本実施形態の顧客ニーズ分析システムが顧客ニーズの重要度のスコアの算出に利用するＶＯＣテーブルを例示した図である。なお、図４では、昇降機Ａに対するアンケート調査の回答の分析処理に利用するためのＶＯＣテーブル２３００を示している。

図示するように、ＶＯＣテーブル２３００は、所定の顧客ニーズの項目（「見た目」、「乗り心地」、「速さ」、「待ち時間」等）毎に分類され、顧客ニーズの項目毎に、エントリ２３１〜２３３が設けられている。エントリ２３１には、「ＶＯＣ−ＩＤ」が登録される。エントリ２３２には、エントリ２３１に登録された「ＶＯＣ−ＩＤ」により特定される「回答内容」が登録される。エントリ２３３には、エントリ２３２に登録された「回答内容」を評価したスコアの値が登録される。なお、クラスタリング部１０３がＶＯＣテーブル２３００を作成する段階では、「回答内容」を評価したスコアが算出されていないため、エントリ２３３には、「ＮＵＬＬ（または空白）値」が登録されている。

図１に戻り説明を続ける。専門用語辞書データベース部２１０は、製品毎にその製品特有の表現・語句が登録されている専門用語辞書データ２１１が格納されている。図１では、昇降機Ａに関する専門用語辞書データ２１１ａと、昇降機Ｂに関する専門用語辞書データ２１１ｂとが格納されている。そして、専門用語辞書データベース部２１０は、テキストマイニング処理部１００がＶＯＣデータを分析する処理を行う際に利用される。具体的には、テキストマイニング処理部１００は、自身が所持する辞書データに加え、専門用語辞書データベース部２１０に格納されている専門用語辞書データ２１１を参照して、分析対象の製品特有の表現・語句を考慮した上でデータ処理を行う。また、テキストマイニング処理部１００は、分析者からの要求に応じて、形態素解析結果である単語リストにピックアップされた語句に関連する品詞情報を専門用語辞書データベース部２１０に登録する。

評価語句定義部１１０は、表示装置３０に評価語句設定画面（図９、図１０）を表示し、顧客ニーズを評価するためのキーワードとして利用する評価語句と、その重要度を示す数値を分析者に定義させる処理を行う。具体的には、評価語句定義部１１０は、評価語句設定画面（図９、１０）で分析者を誘導し、入力装置２０を介して、分析者に顧客ニーズの評価語句とその重要度を入力させる。評価語句定義部１１０は、分析者が入力した顧客ニーズの評価語句とその重要度を受け付け、受け付けたデータを評価語句データベース部２２０に格納する。

評価語句データベース部２２０には、受け付けた顧客ニーズの評価語句とその重要度を示すデータが格納される。なお、以下の説明では、受け付けた顧客ニーズの評価語句とその重要度を示すデータがテーブル形式のデータ（以下、「評価語句テーブル２２１」）として評価語句データベース部２２０に格納される場合を例にして説明する。また、評価語句テーブル２２１は、評価対象毎（例えば、製品毎）のデータベースとして構成されている。ここで、評価語句テーブル２２１のデータ構成を図５に示す。

図５は、本実施形態の評価語句データベース部２２０に格納される評価語句テーブルのデータ構造を模擬的に示した図である。なお、図５では、昇降機Ａに対する評価語句テーブル２２１ａを例示している。

図示するように、評価語句テーブル２２１ａは、評価対象のＶＯＣデータ２２１のファイル名を登録するエントリ２２１１と、そのＶＯＣデータ２２１が対象としている機種名を登録するエントリ２２１２と、評価語句を登録するためのエントリ２２１３と、重要度を登録するためのエントリ２２１４とを有する。なお、エントリ２２１４に登録される顧客ニーズの評価語句の重要度とは、分析者が市場のトレンドや、過去の顧客の嗜好の動向を統計的に判断して入力する値である。顧客のニーズの実現要求が高い評価語句ほど重要度は、大きな値をとることとする。ここでは、顧客ニーズの評価語句の重要度は１、２、３の三段階の幅をもたせているが、この値のおき方についての制約はないものとする。

図１に戻り、説明を続ける。ＶＯＣスコア集計処理部１２０は、評価対象のＶＯＣデータ２０１（例えば、アンケート情報２０１ａ）に対して、点数をつける処理（スコア算出処理）を行う。具体的には、ＶＯＣスコア集計処理部１２０は、評価語句抽出部１２１と、スコア算出部１２２とを有する。評価語句抽出部１２１は、評価語句データベース部２２０の評価語句テーブル２２１を参照し、ＶＯＣテーブル記憶部２３０に格納されているＶＯＣテーブル２３００（図４）のエントリ２３２に登録されている「回答内容」の中から評価語句を抽出する。スコア算出部１２２は、「ＶＯＣ−ＩＤ」により特定される「回答内容」毎に、抽出した評価語句の重要度を集計する。ＶＯＣスコア集計処理部１２０により算出されたスコアは、ＶＯＣテーブル２３００（図４）のエントリ２３３に登録される。なお、ＶＯＣスコア集計処理部１２０の処理は後段で詳細に説明する。

集計処理部１３０は、ＶＯＣテーブル２３００に格納されたデータに各種の統計処理を施し、その結果を分析者に提示する。例えば、集計処理部１３０は、分析結果の表示した画面を表示装置に表示する。具体的には、集計処理部１３０は、分析者からの指示を受けて、分析対象のＶＯＣテーブル２３００をＶＯＣテーブル記憶部２３０から取得するデータ入力部１３１と、ＶＯＣテーブル記憶部２３０に格納されているデータを用いて、統計処理を行う集計部１３２と、集計部１３２の処理結果を表示する画像データを生成して、表示装置３０に処理結果の画像データを表示する出力処理部１３３とを有する。

続いて、本実施形態の情報処理装置１０のハードウェア構成を図２に示す。

図２は、本実施形態の情報処理装置１０のハードウェア構成図である。図示するように、情報処理装置１０は、各種のデータ処理を実行するＣＰＵ１１と、データを一時的に記憶するＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）などの主記憶装置１２と、プログラムや各種のデータを記憶するハードディスク装置などの補助記憶装置１３と、外部装置との間で行われるデータの送受信を制御するＩＯＩ／Ｆ部１４と、を有する。

補助記憶装置１３には、上述した各部（テキストマイニング処理部１００、評価語句定義部１１０、ＶＯＣスコア集計処理部１２０、集計処理部１３０）の機能を実現するためのプログラムが記憶されている。

そして、図１に示した各部（テキストマイニング処理部１００、評価語句定義部１１０、ＶＯＣスコア集計処理部１２０、集計処理部１３０）の機能は、ＣＰＵ１１が補助記憶装置１３に記憶されているプログラムを主記憶装置１２にロードして実行することにより実現される。

また、ＶＯＣデータベース部２００、専門用語辞書データベース部２１０、評価語句データベース部２２０、およびＶＯＣテーブル記憶部２３０は、主記憶装置１２および補助記憶装置１３の所定の領域に格納されている。

次に、本実施形態の顧客ニーズ分析システムが行う処理について図６および図７を用いて説明する。

図６は、本実施形態の顧客ニーズ分析システムが行う処理のフローを説明するための図である。図７は、本実施形態の顧客ニーズ分析システムが行う評価語句定義処理のフローを説明するための図である。

図示するように、本実施形態の顧客ニーズ分析システムが行う処理は、３つの処理フェーズに分類される。具体的には、顧客ニーズ分析システムが行う処理は、顧客ニーズ評価キーワード設定処理フェーズＡ１０００と、顧客ニーズ定量化処理フェーズＡ２０００と、集計・出力処理フェーズＡ３０００と、に分類される。

顧客ニーズ分析システムは、最初に、顧客ニーズ評価キーワード設定処理フェーズＡ１０００により、分析対象のＶＯＣデータ２０１の分析に利用する評価語句、および評価語句の重要度（評価基準値）を決定する。次に、顧客ニーズ分析システムは、顧客ニーズ定量化処理フェーズＡ２０００により、顧客ニーズ評価キーワード設定処理フェーズＡ１０００で設定した「評価語句および重要度」を用いて、分析対象のＶＯＣデータ２０１を定量化する。最後に、顧客ニーズ分析システムは、集計・出力処理フェーズＡ３０００により、顧客ニーズ定量化処理フェーズＡ２０００で定量化されたデータに統計処理を施し、それを分析者に提示する。以下、各処理フェーズについて説明する。

顧客ニーズ評価キーワード設定処理フェーズＡ１０００は、ＶＯＣデータベース部２００から分析対象のＶＯＣデータ２０１を読み出す分析対象文書入力処理（Ｓ１００）と、読み出したＶＯＣデータ２０１に含まれる文書データを解析する形態素解析処理（Ｓ２００）と、ＶＯＣデータ２０１を評価するための評価語句をおよびその重要度の設定を行う評価語句定義処理（Ｓ３００）とで構成される。なお、分析対象文書入力処理（Ｓ１００）および形態素解析処理（Ｓ２００）は、テキストマイニング処理部１００により行われる。また、評価語句定義処理（Ｓ３００）は、評価語句定義部１１０により行われる。

Ｓ１００では、形態素解析部１０１が、ＶＯＣデータベース部２００からＶＯＣデータ２０１を読み出す。具体的には、形態素解析部１０１は、分析者が入力装置２０を介して入力する分析対象のＶＯＣデータ２０１の指定を受付け、その指定された対象のＶＯＣデータ２０１をＶＯＣデータベース部２００から読み出す。なお以下の説明では、評価対象のＶＯＣデータ２０１が、昇降機Ａに対するアンケートデータ（図３のデータ）である場合を例にする。

Ｓ２００では、形態素解析部１０１が、Ｓ１００で読み出したＶＯＣデータ２０１に含まれるテキスト形式の文書データ（図３のフィールド３０４のデータ）に対して、文書の分かち書き処理（単語分解処理）と、分解された単語に品詞を関連付ける処理とを行う。形態素解析部１０１は、形態素解析処理の処理結果を表示装置３０に画面表示したり、或いは、評価語句定義部１１０に出力したりする。なお、形態素解析部１０１により行われる形態素解析技術に関しては、適切な単語分解と関連付けられる品詞の精度がある程度保たれることを条件とし、既存の技術（例えば、「テキストマイニング活用法」（石井哲著，2002，リックテレコム）に記載）により実現されるため、ここでの説明は省略する。

ここで、形態素解析部１０１による形態素解析処理（Ｓ２００）の処理結果の出力について、画面表示した場合を例にして説明する。

図８は、本実施形態の形態素解析処理の処理結果を表示装置に表示した際の表示画面を例示した図である。図示するように画面４００は、処理対象ＶＯＣデータ２０１のファイル名を表示する領域４０５と、分析対象のＶＯＣデータ２０１に含まれるテキスト形式の文書データを表示する領域４０１と、形態素解析処理の処理結果を表示する領域４０２とを有する。領域４０２には、処理対象の文書から抽出した単語が属する品詞を表示する領域４０３と、抽出した単語を表示する領域４０４とが設けられている。そして、領域４０２では、領域４０１に表示している分析対象のテキスト形式の文書に含まれる単語を品詞ごとに記述した抽出結果が表示される。

なお、本実施形態では、形態素解析処理部１０１は、専門用語辞書データベース部２１０のデータを利用して形態素解析処理を行う。このようにするのは、以下の理由による。すなわち、分析対象のＶＯＣデータに含まれる一般的な語句は、テキストマイニング処理部１００が所持する辞書（図示しない）によって品詞を特定することが可能である。しかし、特定の製品の間で使われる専門用語や、一般的な単語であっても製品によっては使用意味の異なる単語が存在するケースがある。そのため、テキストマイニング処理部１００が所持する辞書では正確に品詞を関連付けることができないケースが発生することも考えられる。そこで、形態素解析結果である単語リストにピックアップされた語句を画面４００で表示し、分析者から品詞情報の変更・関連付けを受け付ける。形態素解析処理部１０１は、その結果をユーザ辞書である専門用語辞書データベース部２１０に格納する。

図６に戻り、説明を続ける。Ｓ３００では、評価語句定義部１１０は、形態素解析部１０１から形態素解析結果である「品詞毎に分類された単語リストのデータ（例えば、図８の領域４０２に表示されているデータ）」を取得する。なお、評価語句定義部１１０は、「品詞毎に分類された単語リストのデータ」に対応付けて、単語リストの抽出元のＶＯＣデータの名称（ファイル名）、および対象製品名を示すデータも取得する。そして、評価語句定義部１１０は、「品詞毎に分類された単語リスト」の中から顧客ニーズの評価に利用する評価語句（キーワード）を分析者に抽出させると共に、その抽出された顧客ニーズの評価語句毎に、その重要度を設定する。

ここで、顧客ニーズ定量化処理フェーズＡ２０００を説明する前に、Ｓ３００の処理について、図７を用いて詳細に説明する。

先ず、評価語句定義部１１０は、抽出対象の評価語句をリストアップする（Ｓ３００１）。具体的には、評価語句定義部１１０は、形態素解析部１０１から「品詞毎に分類された単語リストのデータ」を受け取る。評価語句定義部１１０は、受け取った「品詞毎に分類された単語リストのデータ」の中から、重複して出現する語句（単語）を取り除いた語句一覧をリストアップする。

次に、評価語句定義部１１０は、Ｓ３００１でリストアップしたデータを品詞毎にソートする（Ｓ３００２）。このようにするのは、以下の理由による。すなわち、一般的に顧客ニーズの重要度評価の対象となる語句（単語）は、形容詞、副詞、動詞、名詞等の特定の品詞に含まれることが多いと考えられる。そこで、本実施形態では、分析者の評価語句見落とし防止を目的として、Ｓ３００１でリストアップした語句一覧を品詞ごとにソートする。

なお、評価語句定義部１１０は、品詞をソートする際に所定の品詞（例えば、形容詞、副詞、動詞、名詞等の品詞）の単語だけを抽出した上で、分析者に提示するようにしてもよい。すなわち、評価語句定義部１１０は、顧客ニーズの重要度評価の対象とならない品詞に属する語句を取り除いてから、語句一覧を表示する。このようにすることで、分析者の設定作業の手間を軽減することができる。ここで、所定の品詞については、評価語句定義部１１０に予め設定されていることとしてもよいし、分析者が設定できるようにしてもよい。

そして、評価語句定義部１１０は、表示装置３０に、図９に例示するような評価語句設定画面５００を表示する。分析者は、評価語句設定画面５００上で、リスト表示された語句の中から顧客ニーズの重要度の評価に利用する評価語句（単語）を抽出（選択）する。評価語句定義部１１０は、分析者が抽出した評価語句を受け付ける（Ｓ３００３）。

図９は、本実施形態の顧客ニーズ分析システムの評価語句設定画面を例示した図である。図示するように、評価語句設定画面５００は、評価語句の抽出（選択）を受け付けるためのチェックボックスを表示する領域５０１と、リストアップした語句およびその品詞を表示する領域５０２、５０３とが設けられている。また、評価語句設定画面５００には、リストアップした語句が、所定の品詞別にソートされて表示されている。分析者は、マウス等の入力装置２０を操作し、画面上のチェックボックスをチェックして、リスト表示されている語句の中から顧客ニーズの重要度の評価に利用する評価語句を抽出（選択）する。評価語句定義部１１０は、抽出された評価語句を受け付ける。

さらに、評価語句設定画面５００には、評価語句の抽出元であるＶＯＣデータ２０１の名称（ファイル名）と、評価対象（ここでは製品名）も表示するようにしている。これは、ＶＯＣデータ２０１の種類や、評価対象により評価ニーズの分析する方向性が異なることがあることを考慮したためである。なお、図示する例では、分析者からの評価語句の選択を受け付けるためのユーザーインタフェースとしてチェックボックスを表示するようにしたがこれは例示に過ぎない。

そして、このような評価語句設定画面５００を表示することにより、分析者に、所望する内容の顧客ニーズを特定できる語句を抽出させることができる。例えば、既存製品に対する不満や要求・要望といった意見は、新開発製品に積極的に反映させるべき機能・仕様である。そこで、これらを示す語句として、「欲しい」という語句をＶＯＣデータ２０１の評価語句に設定するようにする。また、既存製品を利用した顧客が満足であったと感じているようなポジティブなニーズを特定する語句として、例えば、「嬉しく」をＶＯＣデータ２０１の評価語句に設定するようにしてもよい。また、問い合わせや質問・疑問といった意見は、顕在化された不満だけでなく潜在的な不満である可能性も考えられる。そのため、このような意見を特定できるような語句も対象としてもよい。

図７の説明に戻る。評価語句定義部１１０は、評価語句データベース部２２０に登録する評価語句テーブル２２１を作成（図５参照）し、評価語句データベース部２２０に格納する（Ｓ３００４）。具体的には、評価語句定義部１１０は、Ｓ３００３で抽出された評価語句の抽出元であるデータベースの名称（ＶＯＣデータ２０１のファイル名）と、評価対象の機種名と、Ｓ３００３で抽出された評価語句と、その重要度とを登録するエントリ２２１１〜２２１４を備える評価語句テーブルを作成する。

具体的には、評価語句定義部１１０は、Ｓ３００３で抽出された評価語句（分析者からの設定を受け付けた評価語句）をエントリ２２１３に登録し、エントリ２２１３に登録した評価語句の評価対象の機種名をエントリ２２１２に登録し、エントリ２２１３に登録した評価語句の抽出元のＶＯＣデータ２０１のファイル名をエントリ２２１１に登録する。評価語句定テーブル２２１に評価対象の機種名を登録するようにしたのは、評価語句が対象となる製品によって評価の意味の方向や程度に違いがあるためである。なお、本処理ステップでは、まだ、重要度が設定されてない。したがって、重要度を登録するエントリ２２１４には、「ｎｕｌｌ（または空白）」を登録しておく。

次に、評価語句定義部１１０は、評価語句に対する重要度を定量的に定義するために、評価語句テーブルから分析者が任意に指定する製品をキーとして評価語句を読み出す（Ｓ３００５）。この動作により、評価語句データベース部２２０に同一の製品に対する評価語句に複数の重要度が定義されることを防ぐ。

評価語句定義部１１０は、表示装置３０に、評価語句に対する重要度を受け付けるための評価語句設定画面６００を表示して、抽出語句の重要度を受け付ける（Ｓ３００６）。ここで、抽出語句の重要度を受け付けるための評価画面６００を図１０に例示する。

図１０は、本実施形態の顧客ニーズ分析システムの評価語句設定画面を例示した図である。

図示するように、評価語句設定画面６００には、Ｓ３００５で読み出した評価語句を表示する領域６０１と、領域６０１に表示されている評価語句の重要度を入力する領域６０２とが設けられている。分析者は、入力装置２０を介して、評価語句毎に重要度を入力する。評価語句定義部１１０は、分析者が入力する重要度を受け付ける。

そして、評価語句定義部１１０は、評価語句データベースの評価語句テーブル２２１（図５）の対応するエントリ２２１４に受け付けた重要度を格納する（Ｓ３００７）。

このように、顧客ニーズ評価キーワード設定処理フェーズＡ１０００により、評価語句データベース２２０に、対象製品ごとにＶＯＣデータ２０１の評価語句とその重要度を対応付けた評価語句テーブル２２１が格納される。なお、評価語句テーブル２２１は、その評価語句テーブル２２１と異なる製品のＶＯＣデータを評価する場合であっても利用できることがある。例えば、作成した評価対象テーブルの対象製品が昇降機Ａである場合において、同じような仕様の昇降機ＢのＶＯＣデータを評価する際、「昇降機Ａ」の評価語句テーブル２２１を転用することが出来ると考えられる。したがって、本実施形態では、ＶＯＣデータ２０１を評価する際、その都度、顧客ニーズの評価キーワードとその重要度とを定義する必要が無い。また、既存の評価語句テーブル２２１に格納されたデータを基礎にして、評価語句とその重要度を拡張することが可能である。例えば、昇降機Ａに対するアンケート結果を集めたＶＯＣデータ２０１ａにより評価語句テーブル２２１を作成したが、今後昇降機Ｂに関係するアンケート結果を集めたＶＯＣデータ２０１を評価対象にした場合、必要に応じて昇降機Ａの評価語句テーブル２２１を拡張利用する。そのため、一度、評価語句データベース２２１を作成しておけば、次に分析する際、分析時間短縮させることができるようになる。

図６に戻り、顧客ニーズ定量化処理フェーズＡ２０００について説明する。

具体的には、顧客ニーズ定量化処理フェーズＡ２０００は、ＶＯＣデータベース部２００から分析対象のＶＯＣデータ２０１を読み出す評価対象文書入力処理（Ｓ４００）と、読み出したＶＯＣデータ２０１を顧客ニーズごとに分類するテキストマイニング処理（Ｓ５００）と、評価語句データベース２２０を参照して、評価対象のＶＯＣデータに含まれる評価語句を抽出して、評価対象のＶＯＣデータに対するスコアを算出するＶＯＣスコア集計処理（Ｓ６００）とで構成される。なお、評価対象文書入力処理（Ｓ４００）およびテキストマイニング処理（Ｓ５００）は、いずれも、テキストマイニング処理部１００により行われる。ＶＯＣスコア集計処理は、ＶＯＣスコア集計処理部１２０により行われる。

Ｓ４００では、テキストマイニング処理部１００の形態素解析部１０１が、上述したＳ１００と同様の手順にしたがい、ＶＯＣデータベース部２００からＶＯＣデータ２０１を読み出す。なお、以下の説明では、評価対象のＶＯＣデータ２０１が、昇降機Ａに対するアンケートデータである場合を例にする。

また、本処理ステップで読み出す評価対象のＶＯＣデータ２０１と、Ｓ１００で読み出した分析対象のＶＯＣデータ２０１とが共通のデータのこともある。この場合、上述したＳ２００の処理結果を利用するようにしてもよい（Ｓ２００の処理結果を利用すれば、Ｓ４００および以下で説明するＳ５１０の処理を省略することもできる）。

Ｓ５００では、形態素解析部１０１による形態素解析処理（Ｓ５１０）と、構文解析部１０２による構文解析処理（Ｓ５２０）と、クラスタリング部１０３によるクラスタリング処理（Ｓ５３０）とが行われる。

具体的には、Ｓ５１０において、形態素解析処理部１０１は、上述したＳ２００と同様の手順にしたがい、Ｓ４００で読み出したＶＯＣデータ２０１に含まれるテキスト形式の文書データに対して、文書の分かち書き処理（単語分解処理）と、分解された単語に品詞を関連付ける処理とを行う。構文解析処理部１０２が、単語の係り受けによる意味理解の解析処理を行う（Ｓ５２０）。また、クラスタリング部１０３によるＶＯＣデータを内容が類似する文書に分類するクラスタリング処理が行われる。

なお、テキストマイニング処理部１００は、評価対象のＶＯＣデータ２０１をテキストマイニング処理する際、テキストマイニング処理部１００が所持する辞書データ（図示しない）に加え、上述で定義した専門用語辞書データベース部２１０を用いて、製品特有の表現・語句を考慮して検索を実施し、評価対象のＶＯＣデータ２０１を顧客ニーズの項目（見た目、乗り心地等）ごとに分類する。なお、顧客ニーズの項目は、予め分析者が想定して、テキストマイニング処理部１００に入力しておくものとする。

クラスタリング処理部１０３は、顧客ニーズの項目毎（見た目、乗り心地等）にＶＯＣデータ２０１を分類したＶＯＣテーブル２３００を作成し、作成したＶＯＣテーブル２３００（図４参照）をＶＯＣテーブル記憶部２３０に格納する。
さらに、クラスタリング処理部１０３は、顧客ニーズの項目毎に分類したＶＯＣデータが表示されている画面７００（図１１）を表示装置３０に表示する。

図１１は、本実施形態の顧客ニーズ分析システムが表示する顧客ニーズ毎に分類したＶＯＣデータ２０１の画面例である。図示するように、画面７００では、顧客ニーズの項目７１０毎に、「ＶＯＣ−ＩＤ」に対応付けて、その「ＶＯＣ−ＩＤ」により特定されるＶＯＣデータ２０１の中の「回答内容（テキスト形式のデータ）」が表示されている。

図６に戻り、ＶＯＣスコア集計処理（Ｓ６００）について説明する。ＶＯＣスコア集計処理（Ｓ６００）では、評価語抽出部１２１による評価対象文書入力処理（Ｓ６１０）と、スコア算出部１２２によるスコア算出処理（Ｓ６２０）と、が行われる。

Ｓ６１０では、評価語抽出部１２１がＶＯＣテーブル記憶部２３０に格納されているＶＯＣテーブル２３００（図４参照）を読み出す。評価語抽出部１２１は、評価語句データベース部２２０に格納されている対象製品の評価語句テーブル２２１（図５）を参照し、読み出したＶＯＣテーブル２３００の中のテキスト形式のデータ（エントリ２３２に登録されている「回答内容」を示すデータ）の中から評価語句を抽出する。

Ｓ６２０では、スコア算出部１２２がＶＯＣテーブル２３００に含まれるＶＯＣデータ２０１の重要度を算出する処理を行う。具体的には、スコア算出部１２２は、ＶＯＣテーブル２３００に格納されている「ＶＯＣ−ＩＤ」により特定されるＶＯＣデータ２０１の「回答内容」毎に、評価語抽出部１２１が抽出した評価語句の重要度の値を集計する処理を行う。この処理によって評価対象のＶＯＣデータ２０１の一件毎に重要度の総計が算出される（ＶＯＣ-ＩＤにより特定される回答内容（顧客意見）毎に重要度の総計が算出される）。スコア算出部１２２は、ＶＯＣテーブル記憶部２３０に、集計した重要度をスコアとして値を返す。すなわち、スコア算出部１２２は、ＶＯＣテーブル２３００（図４参照）のエントリ４０２に登録されている「ＶＯＣ−ＩＤ」により特定される「回答内容」毎にスコアを算出し、その「ＶＯＣ−ＩＤ」に対応するエントリ２３３に算出したスコアを登録する。

ここで、ＶＯＣテーブル２３００に、スコアを格納した例を図１２に示す。図１２は、本実施形態の顧客ニーズ分析システムが顧客ニーズの分析に利用するＶＯＣテーブルを例示した図である。なお、図１２は、図４に示したＶＯＣテーブル２３００に重要度のスコアを登録したものである。

図示するように、エントリ２３３には、スコア算出部１２２が算出した重要度のスコアが登録されている。具体的には、ＶＯＣテーブル２３００の中の「ＶＯＣ−ＩＤ」として「００００１」が格納されているエントリ２３１に対応するエントリ２３２の「回答内容」を見てみると、評価語句は、「あまり」、「良い」、「もっと」等である。これを、図５の評価語句テーブル２２１の重要度を用いて集計してみると、「良い」に関連付けられた重要度は「１」であり、同様に他の評価語句とその重要度を合計すると（他の評価語句の重要度は図示しない）、「ＶＯＣ−ＩＤ」が「００００１」の「回答内容」のスコアは「６」となる。次に、「ＶＯＣ−ＩＤ」が「００００２」の「回答内容」は、評価語句として「ない」を含む。これに関連する重要度を参照すると、「１」であり，「ＶＯＣ−ＩＤ」が「００００２」の「回答内容」のスコアを「１」と評価する。この一連の処理を、ＶＯＣテーブル２３００に格納されている全ての「回答内容」について実施する。

次に、集計・出力処理フェーズＡ３０００について説明する。集計・出力処理フェーズＡ３０００は、集計・出力処理の対象データを取得するための出力条件入力処理（Ｓ７００）と、受け付けた対象データを用いて、ＶＯＣテーブルのデータに各種の統計処理を行う集計処理（Ｓ８００）と、表示装置３０に集計結果を表示する出力処理（Ｓ９００）とで構成されている。なお、出力条件入力処理（Ｓ７００）は、データ入力部１３１により行われる。集計処理（Ｓ８００）は、集計部１３２により行われる。出力処理（Ｓ９００）は、出力処理部１３３により行われる。

具体的には、Ｓ７００では、データ入力部１３１が、ＶＯＣテーブル記憶部２３０からＶＯＣテーブル２３００（図１２）を読み出す。また、読み出したＶＯＣテーブル２３００の「ＶＯＣ−ＩＤ」をキーにして、ＶＯＣデータベース部２００から「ＶＯＣ−ＩＤ」に対応する属性情報を取得する。データ入力部１３１は、読み出したＶＯＣテーブル２３００および受け付けた属性情報を集計部１３２に出力する。

Ｓ８００では、集計部１３２は、データ入力部１３１から出力されたＶＯＣテーブル２３００および受け付けた属性情報を用いて、ＶＯＣデータ２０１を構成するレコード一件あたりの評価語句の重要度の総和から、「顧客ニーズごとの件数」、「スコアの総和」、「スコアの平均値」、および「スコアの分散値」を算出する。また、集計部１３２は、算出結果をファイル化した集計テーブルを作成する。ここで、集計テーブルの例を図１３に示す。

図１３は、本実施形態の評価語句データベース部２２０の集計テーブルのデータ構造を模擬的に示した図である。

図示するように、集計テーブル８００は、ＶＯＣデータ２０１毎に作成される（ファイル毎に作成される）。集計テーブル８００は、エントリ８０１〜８０５を備える。エントリ８０１には、「顧客ニーズ（ニーズ項目）」が登録される。エントリ８０２には、エントリ８０１に登録される「顧客ニーズ（ニーズ項目）」に分類されるＶＯＣデータ２０１のレコードの「件数」が登録される。エントリ８０３には、エントリ８０１に登録される「顧客ニーズ（ニーズ項目）」に分類されるレコードの重要度の「スコアの総和」が登録される。エントリ８０４には、エントリ８０１に登録される「顧客ニーズ（ニーズ項目）」に分類されるレコードの重要度の「スコアの平均値」が登録される。エントリ８０５には、エントリ８０１に登録される「顧客ニーズ（ニーズ項目）」に分類されるレコードの重要度の「スコアの分散値」が登録される。

さらに、集計部１３２は、属性情報が付加された集計テーブル９００を作成する。ここで、集計テーブル９００の例を図１４に示す。

図１４は、本実施形態の評価語句データベース部２２０の集計テーブルのデータ構造を模擬的に示した図である。

図示するように、集計テーブル９００は、ＶＯＣデータ２０１毎に作成される。具体的には、集計テーブル９００では、エントリ９０１〜９０５を備える。エントリ９０１には、「ＶＯＣ−ＩＤ」が登録される。エントリ９０２、９０３には、エントリ９０１に登録される「ＶＯＣ−ＩＤ」により特定されるレコードの属性情報（ここでは、「地域」、「用途」）が登録される。エントリ９０４には、エントリ９０１に登録される「ＶＯＣ−ＩＤ」により特定されるレコードが分類された「顧客ニーズ」が登録される。エントリ９０５には、エントリ９０１に登録される「ＶＯＣ−ＩＤ」により特定されるレコードに対する重要度が登録される。

図６に戻り、Ｓ９００の出力処理を説明する。具体的には、Ｓ９００では、出力処理部１３３が、出力条件設定画面（例えば、図１５、図１７）を表示し、分析者が入力する出力条件を受け付ける。出力条件の具体的な内容について特に限定しないが、出力処理部１３３は、例えば、（ａ）評価対象を顧客意見ごとのスコアにするかＶＯＣデータ２０１をニーズごとに分類したスコアにするかの選択、（ｂ）出力方法の選択（すなわちグラフの種類の選択）、（ｃ）グラフの軸の選択の情報の入力等を受け付ける。

そして、出力処理部１３３は、受け付けた出力条件と、集計テーブル８００、９００とを利用して、ＶＯＣデータ２０１を構成する個々のレコードのスコアと属性情報との関係を分析し、単にスコアの高いレコードの顧客意見（回答内容）を特定するだけではなく、スコアの高い（低い）顧客ニーズを特徴付ける因子の特定等を行う。すなわち、出力処理部１３３は、顧客ニーズのスコア（重要度）を可視化させることを主目的としている。出力処理部１３３は、集計部１３２が集計処理したデータを用いて、顧客ニーズのスコア（重要度）を、各種グラフ等で表現する。ここで、出力処理部１３３が分析者に提示する出力処理を２つの例を挙げて説明する。

１つ目の例は、出力処理部１３３が顧客ニーズの重要度のスコアを３Ｄバーチャートで表示する場合を示す。

具体的には、出力処理部１３３は、表示装置３０に、図１５に示すような出力指定画面１０００を表示する。図１５は、本実施形態の顧客ニーズ分析システムが表示する顧客ニーズのスコアの出力指定画面の一例を示した図である。

図示するように、出力指定画面１０００は、評価単位を設定するための領域１００１と、表示するグラブの種類を設定するための領域１００２と、グラフのＸ軸に規定する項目を設定する領域１００３と、グラフのＹ軸に規定する項目を設定する領域１００４と、領域１００１〜１００４で指定された条件でグラフを作成した結果を表示するための領域１００５とを有する。

出力処理部１３３は、出力指定画面１０００を表示する共に、集計部１３２が作成した集計テーブル８００、集計テーブル９００のデータを用いて、スコアの評価単位、グラフの種類、およびグラフの軸にとるデータの設定を受け付ける。具体的には、分析者が出力指定画面１０００を見ながら、画面１０００上の領域１００１〜１００４に出力条件を設定する。そして、出力処理部１３３は、分析者からの出力条件を受け付けて、その出力条件のグラフを作成して領域１００５に表示する。

ここで、出力処理部１３３が、図示する条件を受け付けた場合、すなわち、評価単位が「顧客意見」であり、グラフの種類が「３Ｄバーチャート」であり、Ｘ軸が「ニーズ項目」であり、Ｙ軸が「地域」である出力条件を受けたとする。この場合、出力処理部１３３は、集計テーブル８００、集計テーブル９００のデータを用いて、図１６に示すような３Ｄバーチャートを領域１００５に表示する。

図１６は、本実施形態の顧客ニーズ分析システムの顧客ニーズの重要度を３Ｄバーチャートで示した例である。図示するように、３Ｄバーチャートでは、評価単位を顧客意見に設定し、Ｘ軸に「顧客ニーズ項目」、Ｙ軸に「地域属性」、Ｚ軸に「重要度のスコア」が設定されている。この結果から、想定したニーズに対しどのような顧客セグメントの感度が敏感かを判断できる。図示する例では、ニーズに対しての顧客属性として地域を設定している。分析者は、３Ｄバーチャートを見ることで、例えば、「速さ」に関するニーズが近畿地方で重要である点を把握することができる。その結果、近畿地方に対して、「速さ」を訴求する製品を開発するという製品開発の方向性を定めることができる。あるいは、近畿地方の顧客には、「速さ」をアピールしたプロモーションを強化するといった施策を取るようにすることも考えられる。分析者は、このような出力を利用して大量にある顧客意見から、商品開発上重要な顧客ニーズを定量的に把握することができるようになる。またこの結果を設計や営業などにも定量的に論理的に指し示すことができる。

次に、２つ目の例について説明する。２つ目は、出力処理部１３３が顧客ニーズの重要度をレーダーチャートで示す場合の例である。

具体的には、出力処理部１３３は、表示装置３０に、図１７に示すような出力指定画面１１００を表示する。図１７は、本実施形態の顧客ニーズ分析システムが表示する顧客ニーズのスコアの出力指定画面の一例を示した図である。

図示するように、出力指定画面１１００は、評価単位を設定するための領域１１０１と、表示するグラブの種類を設定するための領域１１０２と、分析者の任意でグラフの第２軸の選択させるための領域１１０３とを有する。領域１１０３には、領域１１０１で設定される評価単位（例えば、顧客ニーズの重要度）と比較するための評価項目が登録される。例えば、領域１１０３には、評価対象のＶＯＣデータに含まれる特定単語の出現頻度（頻度）を登録してもよい。なお、特定単語の頻度は、顧客ニーズ単位で所持する量的なデータを用いることで算出することが可能である。

出力処理部１３３は、出力指定画面１１００を表示する共に、集計部１３２が作成した集計テーブル８００、集計テーブル９００のデータを用いて、「評価単位」、「グラフの種類」、および「第２軸」の設定を受け付ける。具体的には、分析者が出力指定画面１１００を見ながら、画面１１００上の領域１１０１〜１１０３に出力条件を設定する。そして、出力処理部１３３は、分析者からの出力条件を受け付けて、その出力条件のグラフを作成して領域１１０５に表示する。

出力処理部１３３が、図１７に示す条件を受け付けた場合、すなわち、評価単位が「顧客ニーズの重要度」であり、グラフの種類が「レーダーチャート」であり、第２軸が「頻度」である出力条件を受けたとする。この場合、出力処理部１３３は、集計テーブル８００、集計テーブル９００のデータを用いて、図１８に示すようなレーダーチャートを領域１１０５に表示する。

図１８は、本実施形態の顧客ニーズ分析システムの顧客ニーズの重要度をレーダーチャートで示した例である。図示するように、レーダーチャートは、
待ち時間に関しては、頻度は低い（つまり関心は無い或いは表面化していない）ものの、スコアは高いといったギャップが発生している。従って、待ち時間に関しては顕在化している声は少ないものの、現状に対する何らかの不満や期待の割合が高いと解釈することもできる。

このように、本実施形態によれば、大量に蓄積された自然言語で記述された顧客意見を定量的に評価することができるようになる。すなわち、本実施形態によれば、分析者の勘や経験に頼らない客観的な評価が可能となる。そのため、商品企画・開発を行うプロダクトライフサイクルの初期段階において、顧客意見を的確に反映した製品開発が行えるようになる。

なお、本発明は、以上で説明した実施形態に限定されるものではなく、本発明の要旨の範囲内において種々の変形が可能である。例えば、本実施形態の評価語句定義部１１０に、予め顧客ニーズの評価に必要であると想定した所定数の重要単語を登録しておく。そして、評価語句定義部１１０は、形態素解析部１０１から取得した単語の中に重要単語がある場合、その重要単語を重要単語以外の単語と識別可能な状態でキーワード設定画面上に表示するようにしてもよい（例えば、重要単語を強調表示したり、目立つ色（例えば、赤色）で表示する）。或いは、評価語句定義部１１０は、形態素解析部１０１から取得した単語の中から所定の品詞に属する単語だけを抽出し、その抽出した単語の中に重要単語がある場合、その重要単語を重要単語以外の単語と識別可能な状態でキーワード設定画面上に表示するようにしてもよい。このようにすれは、重要単語の設定の見落としを防止することができる。

また、本実施形態では、評価語句およびその重要度を用いて顧客ニーズのスコア値を算出するようにしたが他の項目で評価した値をスコア値に加えるようにしてもよい。例えば、アンケートの回答欄に記載されている文書の長さに応じて定めた値をスコアに加算するようにしてもよい。このように構成するのは、以下の理由による。すなわち、アンケート欄に記載された長い文書は、回答者の思い入れ、願望・要求・不満が丁寧に記述されていると考えられる。このような意見と、単に単語のみで記述されたような意見とでは、結果的に同じ意味を表すニーズであったとしても重要度の度合いが異なると考えられる。そのため、アンケートの回答欄に記載されている文書の長さに応じてスコアを加算するようにすれば、顧客ニーズを精度高く算出することができる。

また、本実施形態では、１台の情報処理装置１０の中に各部（ＶＯＣデータテキストマイニング処理部１００、評価語句定義部１１０、ＶＯＣスコア集計処理部１２０、集計処理部１３０、ＶＯＣデータベース部２００、専門用語辞書データベース部２１０、評価語句データベース部２２０、ＶＯＣテーブル記憶部２３０）の機能を設けたがこれは例示に過ぎない。例えば、複数の装置に各部の機能が分散して構成されていてもよい。

本発明の実施形態が適用された顧客ニーズ分析システムの機能ブロック図である。本発明の実施形態の情報処理装置のハードウェア構成図である。本発明の実施形態で利用されるＶＯＣデータのデータ構成の一例を模擬的に示した図である。本発明の実施形態の顧客ニーズ分析システムが顧客ニーズの重要度のスコアの算出に利用するＶＯＣテーブルを例示した図である。本発明の実施形態の評価語句テーブルのデータ構造を模擬的に示した図である。本発明の実施形態の顧客ニーズ分析システムが行う処理のフローを説明するための図である。本発明の実施形態の顧客ニーズ分析システムが行う評価語句定義処理のフローを説明するための図である。本発明の実施形態の形態素解析処理の処理結果を表示装置に表示した際の表示画面を例示した図である。本発明の実施形態の顧客ニーズ分析システムの評価語句設定画面を例示した図である。本発明の実施形態の顧客ニーズ分析システムの評価語句設定画面を例示した図である。本発明の実施形態の顧客ニーズ分析システムが表示する顧客ニーズ毎に分類したＶＯＣデータの画面例を示す図である。本発明の実施形態の顧客ニーズ分析システムが顧客ニーズの重要度のスコアの算出に利用するＶＯＣテーブルを例示した図である。本発明の実施形態の集計テーブルのデータ構造を模擬的に示した図である。本発明の集計テーブルのデータ構造を模擬的に示した図である。本発明の実施形態の顧客ニーズ分析システムが表示する顧客ニーズのスコアの出力指定画面の一例を示した図である。本発明の実施形態の顧客ニーズ分析システムの顧客ニーズの重要度を３Ｄバーチャートで示した例である。本発明の実施形態の顧客ニーズ分析システムが表示する顧客ニーズのスコアの出力指定画面の一例を示した図である。本実施形態の顧客ニーズ分析システムの顧客ニーズの重要度をレーダーチャートで示した例である。

符号の説明

１０…情報処理装置、１１…ＣＰＵ、１２…主記憶装置、１３…補助記憶装置、１４…ＩＯＩ／Ｆ、２０…入力装置、３０…表示装置、１００…テキストマイニング処理部、１０１…形態素解析部、１０２…構文解析部、１０３…クラスタリング部、１１０…評価語句定義部、１２０…ＶＯＣスコア集計処理部、１２１…評価語句抽出部、１２２…スコア算出部、１３０…集計処理部、１３１…出力データ処理部、１３２…集計部、１３３…出力処理部、２００…ＶＯＣデータベース部、２１０…専門用語辞書データベース部、２２０…評価語句データベース部、２３０…ＶＯＣテーブル記憶部２３０、

Claims

複数の顧客意見情報が登録されているデータベースを記憶している記憶部を備え、該顧客意見情報を用いて顧客ニーズを分析する処理を行う情報処理装置であって、
前記顧客意見情報には、分析対象の製品またはサービスに対する顧客からの意見を自然言語で表現したテキスト形式の文書データが含まれていて、
前記データベースに登録されている顧客意見情報に含まれる文書データに対し、該文書データを単語に分解する分かち書き処理、および分解された単語毎に品詞を関連付け、該単語毎に品詞を関連付けたデータを出力する形態素解析部と、
前記形態素解析部が出力したデータを利用して、単語の係り受けによる文書の内容を解析する構文解析部と、
前記構文解析部の処理結果を用いて、前記複数の顧客意見情報を所定の顧客ニーズ毎に分類し、該顧客ニーズ毎に分類した顧客意見情報を出力するクラスタリング部と、
利用者から、顧客ニーズを評価するためのキーワードの設定を受け付けると共に、該受け付けたキーワードに対応付けて該キーワードの評価レベルを示す評価値の入力を受け付ける評価語句定義部と、
前記顧客ニーズ毎に該分類した顧客意見情報を取得し、該顧客意見情報毎に、該顧客意見情報に含まれる文書データから前記キーワードを抽出し、該抽出したキーワードに対応付けられている評価値を合計して、その合計値を該顧客意見情報の重要度を示すスコアとして算出する評価部と、
前記顧客ニーズ毎に、該分類した各顧客意見情報の前記スコアに所定の統計処理を施して、該顧客ニーズの統計値を算出する集計部と、を備え、
前記評価語句定義部は、
前記形態素解析部から前記単語毎に品詞を関連付けたデータを取得し、該取得したデータを品詞毎にソートし、該品詞毎にソートした単語を利用者に提示し、利用者からの要求にしたがい、前記提示した単語の中からキーワードの設定を受け付けること
を特徴とする情報処理装置。
請求項１に記載の情報処理装置であって、
前記情報処理装置には、表示装置が接続されていて、
前記評価語句定義部は、
前記取得した単語毎に品詞を関連付けたデータの中から所定の品詞に属する単語を抽出して、該抽出した単語を品詞毎にソートし、
前記表示装置に、前記ソートした単語および該単語の品詞をリスト形式で示したキーワード設定画面を表示し、キーワード設定画面上に示した単語の中からキーワードとして利用する単語の選択を受け付けると共に、該キーワードとして選択された単語に対応付けて前記評価値の入力を受け付けること
を特徴とする情報処理装置。
請求項２に記載の情報処理装置であって、
前記評価語句定義部は、予め、顧客ニーズの評価に必要であると想定した所定数の重要単語を保持していて、
前記評価語句定義部は、
前記抽出した単語の中に重要単語がある場合、該重要単語を該重要単語以外の単語と識別可能な状態で前記キーワード設定画面上に表示すること
を特徴とする情報処理装置。
請求項１〜３のいずれか一項に記載の情報処理装置であって、
前記集計部が算出した前記顧客ニーズ毎の統計値を利用者に提示する出力部を有すること
を特徴とする情報処理装置。
請求項１〜４のいずれか一項に記載の情報処理装置であって、
前記文書データには、前記製品またはサービスに関連する属性情報が含まれていて、
前記出力部は、前記属性情報を用いて前記顧客意見情報を所定の属性毎に分類した上で、利用者に提示すること
を特徴とする情報処理装置。
請求項１〜５のいずれか一項に記載の情報処理装置であって、
前記製品またはサービスに関する専門用語であって、一般的に用いる意味と異なる意味を有する語句とそれに関係する品詞情報を格納した専門用語辞書データベースを備え、
前記構文解析部は、前記専門用語辞書データベースを参照して文書の内容を解析すること
を特徴とする情報処理装置。
複数の顧客意見情報が登録されているデータベースを記憶している記憶部を備えた情報処理装置が行う顧客ニーズ分析方法であって、
前記顧客意見情報には、分析対象の製品またはサービスに対する顧客からの意見を自然言語で表現したテキスト形式の文書データが含まれていて、
前記情報処理装置は、
前記記憶部からデータベースを読み出し、該データベースに登録されている顧客意見情報に含まれる文書データに対し、該文書データを単語に分解し、該分解された単語毎に品詞を関連付け、該単語毎に品詞を関連付けたデータを出力するステップと、
前記単語毎に品詞を関連付けたデータを利用して、単語の係り受けによる文書の内容を解析するステップと、
前記解析された結果を用いて、前記複数の顧客意見情報を所定の顧客ニーズ毎に分類し、該顧客ニーズ毎に分類した顧客意見情報を出力するステップと、
利用者から、顧客ニーズを評価するためのキーワードの設定を受け付けると共に、該受け付けたキーワードに対応付けて該キーワードの評価レベルを示す評価値の入力を受け付ける評価語句定義ステップと、
前記顧客ニーズ毎に該分類した顧客意見情報を取得し、該顧客意見情報毎に、該顧客意見情報に含まれる文書データから前記キーワードを抽出し、該抽出したキーワードに対応付けられている評価値を合計して、その合計値を該顧客意見情報の重要度を示すスコアとして算出するステップと、
前記顧客ニーズ毎に、該分類した各顧客意見情報の前記スコアに所定の統計処理を施して、該顧客ニーズの統計値を算出するステップと、を行い、
前記評価語句定義ステップは、
前記単語毎に品詞を関連付けたデータを品詞毎にソートし、該品詞毎にソートした単語を利用者に提示し、利用者からの要求にしたがい、前記提示した単語の中からキーワードの設定を受け付けること
を特徴とする顧客ニーズ分析方法。
複数の顧客意見情報が登録されているデータベースを記憶している記憶部を備えた情報処理装置に顧客ニーズを分析する処理を実行させるプログラムであって、
前記顧客意見情報には、分析対象の製品またはサービスに対する顧客からの意見を自然言語で表現したテキスト形式の文書データが含まれていて、
前記プログラムは、
前記記憶部からデータベースを読み出し、該データベースに登録されている顧客意見情報に含まれる文書データに対し、該文書データを単語に分解し、該分解された単語毎に品詞を関連付け、該単語毎に品詞を関連付けたデータを出力するステップと、
前記単語毎に品詞を関連付けたデータを利用して、単語の係り受けによる文書の内容を解析するステップと、
前記解析された結果を用いて、前記複数の顧客意見情報を所定の顧客ニーズ毎に分類し、該顧客ニーズ毎に分類した顧客意見情報を出力するステップと、
利用者から、顧客ニーズを評価するためのキーワードの設定を受け付けると共に、該受け付けたキーワードに対応付けて該キーワードの評価レベルを示す評価値の入力を受け付ける評価語句定義ステップと、
前記顧客ニーズ毎に該分類した顧客意見情報を取得し、該顧客意見情報毎に、該顧客意見情報に含まれる文書データから前記キーワードを抽出し、該抽出したキーワードに対応付けられている評価値を合計して、その合計値を該顧客意見情報の重要度を示すスコアとして算出するステップと、
前記顧客ニーズ毎に、該分類した各顧客意見情報の前記スコアに所定の統計処理を施して、該顧客ニーズの統計値を算出するステップと、を前記情報処理装置に実行させ、
前記評価語句定義ステップは、
前記単語毎に品詞を関連付けたデータを品詞毎にソートし、該品詞毎にソートした単語を利用者に提示し、利用者からの要求にしたがい、前記提示した単語の中からキーワードの設定を受け付けること
を特徴とするプログラム。