JP4870448B2 - 情報処理装置、顧客ニーズ分析方法、およびプログラム - Google Patents

情報処理装置、顧客ニーズ分析方法、およびプログラム Download PDF

Info

Publication number
JP4870448B2
JP4870448B2 JP2006047341A JP2006047341A JP4870448B2 JP 4870448 B2 JP4870448 B2 JP 4870448B2 JP 2006047341 A JP2006047341 A JP 2006047341A JP 2006047341 A JP2006047341 A JP 2006047341A JP 4870448 B2 JP4870448 B2 JP 4870448B2
Authority
JP
Japan
Prior art keywords
customer
evaluation
word
data
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006047341A
Other languages
English (en)
Other versions
JP2007226568A (ja
Inventor
哲朗 足立
努 津山
亜子 庄勢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006047341A priority Critical patent/JP4870448B2/ja
Priority to US11/675,748 priority patent/US7698129B2/en
Publication of JP2007226568A publication Critical patent/JP2007226568A/ja
Application granted granted Critical
Publication of JP4870448B2 publication Critical patent/JP4870448B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

本発明は、情報処理の技術に関し、特に、テキストデータを単語などに分割し、その出現頻度や相関関係などを解析するテキストマインニングの技術に関する。
顧客に支持される商品開発のためには、従来のプロダクトアウト型の視点からの企画・開発ではなく、実際に商品を購買・利用する顧客の立場に立った、即ちマーケットイン志向による商品開発によって他社製品との差別化を実現することで製品の魅力度を高めることが課題となっている。この課題をクリアするために多くの企業は、市場調査を行って顧客意見を収集し、その顧客意見を分析することで市場のトレンドや顧客ニーズを把握したり、或いは、ターゲット顧客を特定したりするマーケッティング活動を行っている。また、企業では、コールセンタに寄せられる製品やサービスに対するクレーム(苦情)や自社のWebサイトの掲示板への書き込み等でよせられる顧客の意見も、顧客ニーズを把握するための重要な情報として利用している。
そして、上述のようなマーケッティング活動やコールセンタで収集される顧客意見(VOC:Voice of customer)には、数値ではなく自然言語のテキスト形式の文書データが多く含まれている。例えば、アンケート調査の自由回答欄の記載や、コールセンタで受けた苦情等は、テキスト形式で記述されている。そのため、顧客ニーズの把握や市場のトレンドを把握するためには、このテキスト形式のデータ(テキストデータ)を正確に分析することが求められている。そして、電子化された大量のテキストデータを分析する手法として、数値データを分析するデータマイニングを応用したテキストマイニングといわれる手法が知られている。
例えば、特許文献1には、大量のテキストデータを客観的に提示するためのテキストマイニングシステムが開示されている。特許文献1のテキストマイニングシステムでは、検索対象とする文書に含まれる特定単語の出現頻度をカウントする定量化手法や、これらの特定単語と類似する言葉を含む文書件数をカウントする定量化手法がとられている。
また、特許文献2には、分析対象製品ごとの概念辞書を作成し、予め語句の好評・不評のパタンを定義したデータベースと評価対象である文書を照合し、文書の好感度および不満度を算出する手法が示されている。
特開2004−21445号公報 特開2005−115468号公報
しかしながら、上記各特許文献に記載されている技術は、以下の問題点を有している。具体的には、特許文献1のシステムは、個々の単語及び文書を出現頻度だけで評価しているため、本来重要視すべき顧客意見とそうではない顧客意見を同一のものとして扱ってしまう可能性がある。例えば、特定の顧客ニーズに関する特定単語に対し大きい頻度を得る結果が得られた場合、それは、顧客にとって関心のある意見であると想定できる。しかし、その特定単語は、必ずしも重要な顧客ニーズであるとは限らない。それは、特定単語だけでは、回答者が好意を持っているのか、不満を抱いているのか、事実を述べているだけなのかは特定できず、本当に重要視すべき意見かどうかを判断することができないためである。すなわち、特許文献1の手法では、顧客ニーズを正確に把握できない可能性がある。したがって、このような出現頻度の高い顧客意見だけを頼りに新商品開発をしたとしても、実際には顧客にとって魅力のあるものではなく当たり前の機能の商品になることがある。
特許文献2では、ある特定単語に対して、肯定的な意見か否定的な意見かを抽出することで、特定の顧客意見の詳細分析を行っている。商品企画では、特定顧客意見を重要視する場合もある。しかし、特定の顧客意見が特異な意見である場合もあり、それを鵜呑みに企画をすることのリスクを含んでいる。特許文献2の手法では、個々の意見を分析するため、顧客意見個別に好評・不評の判定はできるが、多種類の顧客意見を総合して判定するのは難しい。例えば、ある特定単語に対し、満足を示す顧客と不満を示す顧客がいた場合、その特定単語に対する評価は相殺されるため評価値が算出されないという問題が生じる恐れがある。
本発明は、上記事情に鑑みてなされたものであり、本発明の目的は、顧客意見を肯定や否定の観点ではなく、重要度の視点から定量的に指し示すことにより顧客ニーズを高精度に分析することにある。
上記課題を解決するため、本発明の一態様は、複数の顧客意見情報が登録されているデータベースを記憶している記憶部を備え、該顧客意見情報を用いて顧客ニーズを分析する処理を行う情報処理装置に適用される。ここで、前記顧客意見情報には、分析対象の製品またはサービスに対する顧客からの意見を自然言語で表現したテキスト形式の文書データが含まれている。
そして、前記情報処理装置は、前記データベースに登録されている顧客意見情報に含まれる文書データに対し、該文書データを単語に分解する分かち書き処理、および分解された単語毎に品詞を関連付け、該単語毎に品詞を関連付けたデータを出力する形態素解析部と、前記形態素解析部が出力したデータを利用して、単語の係り受けによる文書の内容を解析する構文解析部と、前記構文解析部の処理結果を用いて、前記複数の顧客意見情報を所定の顧客ニーズ毎に分類し、該顧客ニーズ毎に分類した顧客意見情報を出力するクラスタリング部と、利用者から、顧客ニーズを評価するためのキーワードの設定を受け付けると共に、該受け付けたキーワードに対応付けて該キーワードの評価レベルを示す評価値の入力を受け付ける評価語句定義部と、前記顧客ニーズ毎に該分類した顧客意見情報を取得し、該顧客意見情報毎に、該顧客意見情報に含まれる文書データから前記キーワードを抽出し、該抽出したキーワードに対応付けられている評価値を合計て、その合計値を該顧客意見情報の重要度を示すスコアとして算出する評価部と、前記顧客ニーズ毎に、該分類した各顧客意見情報の前記スコアに所定の統計処理を施して、該顧客ニーズの統計値を算出する集計部と、を備え、前記評価語句定義部は、前記形態素解析部から前記単語毎に品詞を関連付けたデータを取得し、該取得したデータを品詞毎にソートし、該品詞毎にソートした単語を利用者に提示し、利用者からの要求にしたがい、前記提示した単語の中からキーワードの設定を受け付ける。
このように本発明では、利用者に分析するキーワードと、その評価レベルを示す評価値を設定させ、キーワードおよび評価値を用いて顧客ニーズ毎に顧客意見情報の重要度を求めるようにしている。すなわち、本発明では、分析対象の顧客意見情報の種類に応じて、キーワードおよび評価値を設定しているため、正確に顧客ニーズを分析することができるようになる。その結果、多くの顧客意見を製品やサービスに反映させることが可能になり、製品やサービスの市場への訴求力を高めることができる。
以下、本発明の実施形態について図面を用いて説明する。
先ず、本発明の実施形態の概略構成について図1を用いて説明する。図1は、本発明の実施形態が適用された顧客ニーズ分析システムの機能ブロック図である。
図示するように、顧客ニーズ分析システムは、自然言語で記述された顧客意見(VOC:Voice of customer)を示すテキストデータを用いて、顧客ニーズを分析する処理を行う情報処理装置10と、キーボードやマウス等の入力装置20と、液晶ディスプレイ等により構成される表示装置30とを有する。顧客ニーズ分析システムは、入力装置20や図示しない外部装置を介し、アンケート結果やコールセンタで寄せられたクレーム等の顧客意見(VOC)を示したデータの入力を受け付ける。顧客ニーズ分析システムは、受け付けた顧客意見を示したデータを用いて、顧客ニーズの分析を行い、表示装置30に分析結果を表示する。
具体的には、情報処理装置10は、テキストマイニング処理部100と、評価語句定義部110と、VOCスコア集計処理部120と、集計処理部130と、VOCデータベース部200と、専門用語辞書データベース部210と、評価語句データベース部220と、VOCテーブル記憶部230と、を有する。
VOCデータベース部200には、エンドユーザアンケートや、コールセンタで収集された意見、各種報告書などの顧客意見(VOC)を示すデータ(以下、単に「VOCデータ」ということもある)が格納されている。図示する例では、VOCデータベース部200には、アンケート結果を集計して纏めた(ファイル化した)VOCデータ201a、コールセンタで受け付けた顧客意見をファイル化したVOCデータ201b、業務報告書を集計してファイル化したVOCデータ201c等が顧客意見として格納されている。以下では、VOCデータ201aのファイル名を「アンケートデータ」とする。また、VOCデータ201bのファイル名を「コールセンタ」として、VOCデータ201cのファイル名を「業務報告」とする。
なお、VOCデータ201の一例として業務報告書を挙げたのは、業務日報等の報告書には、他社製品やサービスと差別化を図るための意見、自社製品の問題点(不良箇所)、会議における製品化のアイデア等が記述されていることがあるためである。したがって、収集した業務報告書を分析することにより、他社との差別化に繋がる製品仕様・アイデアのヒントを得ることができると考えられる。
ここで、VOCデータベース部200に格納されるVOCデータ201のデータ構成を図3に示す。
図3は、本実施形態で利用されるVOCデータのデータ構成の一例を模擬的に示した図である。なお、図3では、VOCデータとして、製品(ここでは昇降機A)に対するユーザからのアンケート結果を集計したデータを例示している。
図示するように、VOCデータ201aは、昇降機Aに対するアンケート結果を収集して登録したデータベースである。具体的には、VOCデータ201aは、集計した顧客意見を識別する「VOC−ID」を登録するためのフィールド301と、顧客意見の「属性情報」を登録するためのフィールド302、303と、「昇降機Aに対するアンケートの回答内容(単に「回答内容」ということもある)」を登録するためのフィールド304とを備えて1つのレコードが構成されている。なお、図示する例では、顧客意見の属性情報として、フィールド302に、昇降機Aが設置されている地域を識別する「地域番号」が登録され、フィールド303に、昇降機Aが設置されている建物の用途(マンションに利用されているのか、雑居ビルとして利用されているか等を示すデータ)が登録されている。
なお、図示する顧客の属性情報は、例示に過ぎない。本実施形態において、顧客意見の属性情報とは、アンケートを回答した顧客を特徴付けるデータのことをいう。例えば、属性情報として、顧客の性別、体格的特性、趣味嗜好、職業などのプロフィールと呼ばれるデータを用いるようにしてもよい。また、属性情報として、プロフィール以外のデータ、例えば、報告内容の種類や重要・緊急性など業務の特徴を示すデータを用いるようにしてもよい。そして、これらの属性情報は、分析者(利用者)があらかじめ分析を想定して、回答者・記述者に入力を強いるものであり、顧客意見収集後に追加することはできない。これら属性情報は、新開発製品によって収集すべき項目が異なるため、VOCデータベース部200に格納されている全てのVOCデータ201において共通するものではない。そこで、後述の評価結果を受けた詳細分析を考慮して任意の項目を設定することが重要である。属性情報の記述方法としては後の分析効率を考えて、0・1などといったコード化されていることが望ましい。
図1に戻り、説明を続ける。テキストマイニング処理部100は、既存のテキストマイニングの手法を利用して、VOCデータベース部200に格納されているVOCデータ201を用いてデータ分析処理を行う。具体的には、テキストマイニング処理部100は、形態素解析部101、構文解析部102、およびクラスタリング部103を有する。形態素解析部101は、テキスト形式の文書データの分かち書き処理(単語分解処理)と、分解された単語に品詞を関連付ける処理とを行う。構文解析部102は、単語の係り受けによる意味理解の解析を行う。クラスタリング部103は、分析対象のVOCデータ201に登録されているレコードを内容が類似する文書毎に分類する。具体的には、クラスタリング部103は、予め分析者が設定した顧客ニーズ毎(見た目、乗り心地等)にVOCデータ201を分類したVOCテーブルを作成し、作成したVOCテーブルをVOCテーブル記憶部230に格納する。ここで、VOCテーブル記憶部230に格納されるVOCテーブルのデータ構成の一例を図4に示す。
図4は、本実施形態の顧客ニーズ分析システムが顧客ニーズの重要度のスコアの算出に利用するVOCテーブルを例示した図である。なお、図4では、昇降機Aに対するアンケート調査の回答の分析処理に利用するためのVOCテーブル2300を示している。
図示するように、VOCテーブル2300は、所定の顧客ニーズの項目(「見た目」、「乗り心地」、「速さ」、「待ち時間」等)毎に分類され、顧客ニーズの項目毎に、エントリ231〜233が設けられている。エントリ231には、「VOC−ID」が登録される。エントリ232には、エントリ231に登録された「VOC−ID」により特定される「回答内容」が登録される。エントリ233には、エントリ232に登録された「回答内容」を評価したスコアの値が登録される。なお、クラスタリング部103がVOCテーブル2300を作成する段階では、「回答内容」を評価したスコアが算出されていないため、エントリ233には、「NULL(または空白)値」が登録されている。
図1に戻り説明を続ける。専門用語辞書データベース部210は、製品毎にその製品特有の表現・語句が登録されている専門用語辞書データ211が格納されている。図1では、昇降機Aに関する専門用語辞書データ211aと、昇降機Bに関する専門用語辞書データ211bとが格納されている。そして、専門用語辞書データベース部210は、テキストマイニング処理部100がVOCデータを分析する処理を行う際に利用される。具体的には、テキストマイニング処理部100は、自身が所持する辞書データに加え、専門用語辞書データベース部210に格納されている専門用語辞書データ211を参照して、分析対象の製品特有の表現・語句を考慮した上でデータ処理を行う。また、テキストマイニング処理部100は、分析者からの要求に応じて、形態素解析結果である単語リストにピックアップされた語句に関連する品詞情報を専門用語辞書データベース部210に登録する。
評価語句定義部110は、表示装置30に評価語句設定画面(図9、図10)を表示し、顧客ニーズを評価するためのキーワードとして利用する評価語句と、その重要度を示す数値を分析者に定義させる処理を行う。具体的には、評価語句定義部110は、評価語句設定画面(図9、10)で分析者を誘導し、入力装置20を介して、分析者に顧客ニーズの評価語句とその重要度を入力させる。評価語句定義部110は、分析者が入力した顧客ニーズの評価語句とその重要度を受け付け、受け付けたデータを評価語句データベース部220に格納する。
評価語句データベース部220には、受け付けた顧客ニーズの評価語句とその重要度を示すデータが格納される。なお、以下の説明では、受け付けた顧客ニーズの評価語句とその重要度を示すデータがテーブル形式のデータ(以下、「評価語句テーブル221」)として評価語句データベース部220に格納される場合を例にして説明する。また、評価語句テーブル221は、評価対象毎(例えば、製品毎)のデータベースとして構成されている。ここで、評価語句テーブル221のデータ構成を図5に示す。
図5は、本実施形態の評価語句データベース部220に格納される評価語句テーブルのデータ構造を模擬的に示した図である。なお、図5では、昇降機Aに対する評価語句テーブル221aを例示している。
図示するように、評価語句テーブル221aは、評価対象のVOCデータ221のファイル名を登録するエントリ2211と、そのVOCデータ221が対象としている機種名を登録するエントリ2212と、評価語句を登録するためのエントリ2213と、重要度を登録するためのエントリ2214とを有する。なお、エントリ2214に登録される顧客ニーズの評価語句の重要度とは、分析者が市場のトレンドや、過去の顧客の嗜好の動向を統計的に判断して入力する値である。顧客のニーズの実現要求が高い評価語句ほど重要度は、大きな値をとることとする。ここでは、顧客ニーズの評価語句の重要度は1、2、3の三段階の幅をもたせているが、この値のおき方についての制約はないものとする。
図1に戻り、説明を続ける。VOCスコア集計処理部120は、評価対象のVOCデータ201(例えば、アンケート情報201a)に対して、点数をつける処理(スコア算出処理)を行う。具体的には、VOCスコア集計処理部120は、評価語句抽出部121と、スコア算出部122とを有する。評価語句抽出部121は、評価語句データベース部220の評価語句テーブル221を参照し、VOCテーブル記憶部230に格納されているVOCテーブル2300(図4)のエントリ232に登録されている「回答内容」の中から評価語句を抽出する。スコア算出部122は、「VOC−ID」により特定される「回答内容」毎に、抽出した評価語句の重要度を集計する。VOCスコア集計処理部120により算出されたスコアは、VOCテーブル2300(図4)のエントリ233に登録される。なお、VOCスコア集計処理部120の処理は後段で詳細に説明する。
集計処理部130は、VOCテーブル2300に格納されたデータに各種の統計処理を施し、その結果を分析者に提示する。例えば、集計処理部130は、分析結果の表示した画面を表示装置に表示する。具体的には、集計処理部130は、分析者からの指示を受けて、分析対象のVOCテーブル2300をVOCテーブル記憶部230から取得するデータ入力部131と、VOCテーブル記憶部230に格納されているデータを用いて、統計処理を行う集計部132と、集計部132の処理結果を表示する画像データを生成して、表示装置30に処理結果の画像データを表示する出力処理部133とを有する。
続いて、本実施形態の情報処理装置10のハードウェア構成を図2に示す。
図2は、本実施形態の情報処理装置10のハードウェア構成図である。図示するように、情報処理装置10は、各種のデータ処理を実行するCPU11と、データを一時的に記憶するRAM(Random Access Memory)などの主記憶装置12と、プログラムや各種のデータを記憶するハードディスク装置などの補助記憶装置13と、外部装置との間で行われるデータの送受信を制御するIOI/F部14と、を有する。
補助記憶装置13には、上述した各部(テキストマイニング処理部100、評価語句定義部110、VOCスコア集計処理部120、集計処理部130)の機能を実現するためのプログラムが記憶されている。
そして、図1に示した各部(テキストマイニング処理部100、評価語句定義部110、VOCスコア集計処理部120、集計処理部130)の機能は、CPU11が補助記憶装置13に記憶されているプログラムを主記憶装置12にロードして実行することにより実現される。
また、VOCデータベース部200、専門用語辞書データベース部210、評価語句データベース部220、およびVOCテーブル記憶部230は、主記憶装置12および補助記憶装置13の所定の領域に格納されている。
次に、本実施形態の顧客ニーズ分析システムが行う処理について図6および図7を用いて説明する。
図6は、本実施形態の顧客ニーズ分析システムが行う処理のフローを説明するための図である。図7は、本実施形態の顧客ニーズ分析システムが行う評価語句定義処理のフローを説明するための図である。
図示するように、本実施形態の顧客ニーズ分析システムが行う処理は、3つの処理フェーズに分類される。具体的には、顧客ニーズ分析システムが行う処理は、顧客ニーズ評価キーワード設定処理フェーズA1000と、顧客ニーズ定量化処理フェーズA2000と、集計・出力処理フェーズA3000と、に分類される。
顧客ニーズ分析システムは、最初に、顧客ニーズ評価キーワード設定処理フェーズA1000により、分析対象のVOCデータ201の分析に利用する評価語句、および評価語句の重要度(評価基準値)を決定する。次に、顧客ニーズ分析システムは、顧客ニーズ定量化処理フェーズA2000により、顧客ニーズ評価キーワード設定処理フェーズA1000で設定した「評価語句および重要度」を用いて、分析対象のVOCデータ201を定量化する。最後に、顧客ニーズ分析システムは、集計・出力処理フェーズA3000により、顧客ニーズ定量化処理フェーズA2000で定量化されたデータに統計処理を施し、それを分析者に提示する。以下、各処理フェーズについて説明する。
顧客ニーズ評価キーワード設定処理フェーズA1000は、VOCデータベース部200から分析対象のVOCデータ201を読み出す分析対象文書入力処理(S100)と、読み出したVOCデータ201に含まれる文書データを解析する形態素解析処理(S200)と、VOCデータ201を評価するための評価語句をおよびその重要度の設定を行う評価語句定義処理(S300)とで構成される。なお、分析対象文書入力処理(S100)および形態素解析処理(S200)は、テキストマイニング処理部100により行われる。また、評価語句定義処理(S300)は、評価語句定義部110により行われる。
S100では、形態素解析部101が、VOCデータベース部200からVOCデータ201を読み出す。具体的には、形態素解析部101は、分析者が入力装置20を介して入力する分析対象のVOCデータ201の指定を受付け、その指定された対象のVOCデータ201をVOCデータベース部200から読み出す。なお以下の説明では、評価対象のVOCデータ201が、昇降機Aに対するアンケートデータ(図3のデータ)である場合を例にする。
S200では、形態素解析部101が、S100で読み出したVOCデータ201に含まれるテキスト形式の文書データ(図3のフィールド304のデータ)に対して、文書の分かち書き処理(単語分解処理)と、分解された単語に品詞を関連付ける処理とを行う。形態素解析部101は、形態素解析処理の処理結果を表示装置30に画面表示したり、或いは、評価語句定義部110に出力したりする。なお、形態素解析部101により行われる形態素解析技術に関しては、適切な単語分解と関連付けられる品詞の精度がある程度保たれることを条件とし、既存の技術(例えば、「テキストマイニング活用法」(石井 哲 著,2002,リックテレコム)に記載)により実現されるため、ここでの説明は省略する。
ここで、形態素解析部101による形態素解析処理(S200)の処理結果の出力について、画面表示した場合を例にして説明する。
図8は、本実施形態の形態素解析処理の処理結果を表示装置に表示した際の表示画面を例示した図である。図示するように画面400は、処理対象VOCデータ201のファイル名を表示する領域405と、分析対象のVOCデータ201に含まれるテキスト形式の文書データを表示する領域401と、形態素解析処理の処理結果を表示する領域402とを有する。領域402には、処理対象の文書から抽出した単語が属する品詞を表示する領域403と、抽出した単語を表示する領域404とが設けられている。そして、領域402では、領域401に表示している分析対象のテキスト形式の文書に含まれる単語を品詞ごとに記述した抽出結果が表示される。
なお、本実施形態では、形態素解析処理部101は、専門用語辞書データベース部210のデータを利用して形態素解析処理を行う。このようにするのは、以下の理由による。すなわち、分析対象のVOCデータに含まれる一般的な語句は、テキストマイニング処理部100が所持する辞書(図示しない)によって品詞を特定することが可能である。しかし、特定の製品の間で使われる専門用語や、一般的な単語であっても製品によっては使用意味の異なる単語が存在するケースがある。そのため、テキストマイニング処理部100が所持する辞書では正確に品詞を関連付けることができないケースが発生することも考えられる。そこで、形態素解析結果である単語リストにピックアップされた語句を画面400で表示し、分析者から品詞情報の変更・関連付けを受け付ける。形態素解析処理部101は、その結果をユーザ辞書である専門用語辞書データベース部210に格納する。
図6に戻り、説明を続ける。S300では、評価語句定義部110は、形態素解析部101から形態素解析結果である「品詞毎に分類された単語リストのデータ(例えば、図8の領域402に表示されているデータ)」を取得する。なお、評価語句定義部110は、「品詞毎に分類された単語リストのデータ」に対応付けて、単語リストの抽出元のVOCデータの名称(ファイル名)、および対象製品名を示すデータも取得する。そして、評価語句定義部110は、「品詞毎に分類された単語リスト」の中から顧客ニーズの評価に利用する評価語句(キーワード)を分析者に抽出させると共に、その抽出された顧客ニーズの評価語句毎に、その重要度を設定する。
ここで、顧客ニーズ定量化処理フェーズA2000を説明する前に、S300の処理について、図7を用いて詳細に説明する。
先ず、評価語句定義部110は、抽出対象の評価語句をリストアップする(S3001)。具体的には、評価語句定義部110は、形態素解析部101から「品詞毎に分類された単語リストのデータ」を受け取る。評価語句定義部110は、受け取った「品詞毎に分類された単語リストのデータ」の中から、重複して出現する語句(単語)を取り除いた語句一覧をリストアップする。
次に、評価語句定義部110は、S3001でリストアップしたデータを品詞毎にソートする(S3002)。このようにするのは、以下の理由による。すなわち、一般的に顧客ニーズの重要度評価の対象となる語句(単語)は、形容詞、副詞、動詞、名詞等の特定の品詞に含まれることが多いと考えられる。そこで、本実施形態では、分析者の評価語句見落とし防止を目的として、S3001でリストアップした語句一覧を品詞ごとにソートする。
なお、評価語句定義部110は、品詞をソートする際に所定の品詞(例えば、形容詞、副詞、動詞、名詞等の品詞)の単語だけを抽出した上で、分析者に提示するようにしてもよい。すなわち、評価語句定義部110は、顧客ニーズの重要度評価の対象とならない品詞に属する語句を取り除いてから、語句一覧を表示する。このようにすることで、分析者の設定作業の手間を軽減することができる。ここで、所定の品詞については、評価語句定義部110に予め設定されていることとしてもよいし、分析者が設定できるようにしてもよい。
そして、評価語句定義部110は、表示装置30に、図9に例示するような評価語句設定画面500を表示する。分析者は、評価語句設定画面500上で、リスト表示された語句の中から顧客ニーズの重要度の評価に利用する評価語句(単語)を抽出(選択)する。評価語句定義部110は、分析者が抽出した評価語句を受け付ける(S3003)。
図9は、本実施形態の顧客ニーズ分析システムの評価語句設定画面を例示した図である。図示するように、評価語句設定画面500は、評価語句の抽出(選択)を受け付けるためのチェックボックスを表示する領域501と、リストアップした語句およびその品詞を表示する領域502、503とが設けられている。また、評価語句設定画面500には、リストアップした語句が、所定の品詞別にソートされて表示されている。分析者は、マウス等の入力装置20を操作し、画面上のチェックボックスをチェックして、リスト表示されている語句の中から顧客ニーズの重要度の評価に利用する評価語句を抽出(選択)する。評価語句定義部110は、抽出された評価語句を受け付ける。
さらに、評価語句設定画面500には、評価語句の抽出元であるVOCデータ201の名称(ファイル名)と、評価対象(ここでは製品名)も表示するようにしている。これは、VOCデータ201の種類や、評価対象により評価ニーズの分析する方向性が異なることがあることを考慮したためである。なお、図示する例では、分析者からの評価語句の選択を受け付けるためのユーザーインタフェースとしてチェックボックスを表示するようにしたがこれは例示に過ぎない。
そして、このような評価語句設定画面500を表示することにより、分析者に、所望する内容の顧客ニーズを特定できる語句を抽出させることができる。例えば、既存製品に対する不満や要求・要望といった意見は、新開発製品に積極的に反映させるべき機能・仕様である。そこで、これらを示す語句として、「欲しい」という語句をVOCデータ201の評価語句に設定するようにする。また、既存製品を利用した顧客が満足であったと感じているようなポジティブなニーズを特定する語句として、例えば、「嬉しく」をVOCデータ201の評価語句に設定するようにしてもよい。また、問い合わせや質問・疑問といった意見は、顕在化された不満だけでなく潜在的な不満である可能性も考えられる。そのため、このような意見を特定できるような語句も対象としてもよい。
図7の説明に戻る。評価語句定義部110は、評価語句データベース部220に登録する評価語句テーブル221を作成(図5参照)し、評価語句データベース部220に格納する(S3004)。具体的には、評価語句定義部110は、S3003で抽出された評価語句の抽出元であるデータベースの名称(VOCデータ201のファイル名)と、評価対象の機種名と、S3003で抽出された評価語句と、その重要度とを登録するエントリ2211〜2214を備える評価語句テーブルを作成する。
具体的には、評価語句定義部110は、S3003で抽出された評価語句(分析者からの設定を受け付けた評価語句)をエントリ2213に登録し、エントリ2213に登録した評価語句の評価対象の機種名をエントリ2212に登録し、エントリ2213に登録した評価語句の抽出元のVOCデータ201のファイル名をエントリ2211に登録する。評価語句定テーブル221に評価対象の機種名を登録するようにしたのは、評価語句が対象となる製品によって評価の意味の方向や程度に違いがあるためである。なお、本処理ステップでは、まだ、重要度が設定されてない。したがって、重要度を登録するエントリ2214には、「null(または空白)」を登録しておく。
次に、評価語句定義部110は、評価語句に対する重要度を定量的に定義するために、評価語句テーブルから分析者が任意に指定する製品をキーとして評価語句を読み出す(S3005)。この動作により、評価語句データベース部220に同一の製品に対する評価語句に複数の重要度が定義されることを防ぐ。
評価語句定義部110は、表示装置30に、評価語句に対する重要度を受け付けるための評価語句設定画面600を表示して、抽出語句の重要度を受け付ける(S3006)。ここで、抽出語句の重要度を受け付けるための評価画面600を図10に例示する。
図10は、本実施形態の顧客ニーズ分析システムの評価語句設定画面を例示した図である。
図示するように、評価語句設定画面600には、S3005で読み出した評価語句を表示する領域601と、領域601に表示されている評価語句の重要度を入力する領域602とが設けられている。分析者は、入力装置20を介して、評価語句毎に重要度を入力する。評価語句定義部110は、分析者が入力する重要度を受け付ける。
そして、評価語句定義部110は、評価語句データベースの評価語句テーブル221(図5)の対応するエントリ2214に受け付けた重要度を格納する(S3007)。
このように、顧客ニーズ評価キーワード設定処理フェーズA1000により、評価語句データベース220に、対象製品ごとにVOCデータ201の評価語句とその重要度を対応付けた評価語句テーブル221が格納される。なお、評価語句テーブル221は、その評価語句テーブル221と異なる製品のVOCデータを評価する場合であっても利用できることがある。例えば、作成した評価対象テーブルの対象製品が昇降機Aである場合において、同じような仕様の昇降機BのVOCデータを評価する際、「昇降機A」の評価語句テーブル221を転用することが出来ると考えられる。したがって、本実施形態では、VOCデータ201を評価する際、その都度、顧客ニーズの評価キーワードとその重要度とを定義する必要が無い。また、既存の評価語句テーブル221に格納されたデータを基礎にして、評価語句とその重要度を拡張することが可能である。例えば、昇降機Aに対するアンケート結果を集めたVOCデータ201aにより評価語句テーブル221を作成したが、今後昇降機Bに関係するアンケート結果を集めたVOCデータ201を評価対象にした場合、必要に応じて昇降機Aの評価語句テーブル221を拡張利用する。そのため、一度、評価語句データベース221を作成しておけば、次に分析する際、分析時間短縮させることができるようになる。
図6に戻り、顧客ニーズ定量化処理フェーズA2000について説明する。
具体的には、顧客ニーズ定量化処理フェーズA2000は、VOCデータベース部200から分析対象のVOCデータ201を読み出す評価対象文書入力処理(S400)と、読み出したVOCデータ201を顧客ニーズごとに分類するテキストマイニング処理(S500)と、評価語句データベース220を参照して、評価対象のVOCデータに含まれる評価語句を抽出して、評価対象のVOCデータに対するスコアを算出するVOCスコア集計処理(S600)とで構成される。なお、評価対象文書入力処理(S400)およびテキストマイニング処理(S500)は、いずれも、テキストマイニング処理部100により行われる。VOCスコア集計処理は、VOCスコア集計処理部120により行われる。
S400では、テキストマイニング処理部100の形態素解析部101が、上述したS100と同様の手順にしたがい、VOCデータベース部200からVOCデータ201を読み出す。なお、以下の説明では、評価対象のVOCデータ201が、昇降機Aに対するアンケートデータである場合を例にする。
また、本処理ステップで読み出す評価対象のVOCデータ201と、S100で読み出した分析対象のVOCデータ201とが共通のデータのこともある。この場合、上述したS200の処理結果を利用するようにしてもよい(S200の処理結果を利用すれば、S400および以下で説明するS510の処理を省略することもできる)。
S500では、形態素解析部101による形態素解析処理(S510)と、構文解析部102による構文解析処理(S520)と、クラスタリング部103によるクラスタリング処理(S530)とが行われる。
具体的には、S510において、形態素解析処理部101は、上述したS200と同様の手順にしたがい、S400で読み出したVOCデータ201に含まれるテキスト形式の文書データに対して、文書の分かち書き処理(単語分解処理)と、分解された単語に品詞を関連付ける処理とを行う。構文解析処理部102が、単語の係り受けによる意味理解の解析処理を行う(S520)。また、クラスタリング部103によるVOCデータを内容が類似する文書に分類するクラスタリング処理が行われる。
なお、テキストマイニング処理部100は、評価対象のVOCデータ201をテキストマイニング処理する際、テキストマイニング処理部100が所持する辞書データ(図示しない)に加え、上述で定義した専門用語辞書データベース部210を用いて、製品特有の表現・語句を考慮して検索を実施し、評価対象のVOCデータ201を顧客ニーズの項目(見た目、乗り心地等)ごとに分類する。なお、顧客ニーズの項目は、予め分析者が想定して、テキストマイニング処理部100に入力しておくものとする。
クラスタリング処理部103は、顧客ニーズの項目毎(見た目、乗り心地等)にVOCデータ201を分類したVOCテーブル2300を作成し、作成したVOCテーブル2300(図4参照)をVOCテーブル記憶部230に格納する。
さらに、クラスタリング処理部103は、顧客ニーズの項目毎に分類したVOCデータが表示されている画面700(図11)を表示装置30に表示する。
図11は、本実施形態の顧客ニーズ分析システムが表示する顧客ニーズ毎に分類したVOCデータ201の画面例である。図示するように、画面700では、顧客ニーズの項目710毎に、「VOC−ID」に対応付けて、その「VOC−ID」により特定されるVOCデータ201の中の「回答内容(テキスト形式のデータ)」が表示されている。
図6に戻り、VOCスコア集計処理(S600)について説明する。VOCスコア集計処理(S600)では、評価語抽出部121による評価対象文書入力処理(S610)と、スコア算出部122によるスコア算出処理(S620)と、が行われる。
S610では、評価語抽出部121がVOCテーブル記憶部230に格納されているVOCテーブル2300(図4参照)を読み出す。評価語抽出部121は、評価語句データベース部220に格納されている対象製品の評価語句テーブル221(図5)を参照し、読み出したVOCテーブル2300の中のテキスト形式のデータ(エントリ232に登録されている「回答内容」を示すデータ)の中から評価語句を抽出する。
S620では、スコア算出部122がVOCテーブル2300に含まれるVOCデータ201の重要度を算出する処理を行う。具体的には、スコア算出部122は、VOCテーブル2300に格納されている「VOC−ID」により特定されるVOCデータ201の「回答内容」毎に、評価語抽出部121が抽出した評価語句の重要度の値を集計する処理を行う。この処理によって評価対象のVOCデータ201の一件毎に重要度の総計が算出される(VOC-IDにより特定される回答内容(顧客意見)毎に重要度の総計が算出される)。スコア算出部122は、VOCテーブル記憶部230に、集計した重要度をスコアとして値を返す。すなわち、スコア算出部122は、VOCテーブル2300(図4参照)のエントリ402に登録されている「VOC−ID」により特定される「回答内容」毎にスコアを算出し、その「VOC−ID」に対応するエントリ233に算出したスコアを登録する。
ここで、VOCテーブル2300に、スコアを格納した例を図12に示す。図12は、本実施形態の顧客ニーズ分析システムが顧客ニーズの分析に利用するVOCテーブルを例示した図である。なお、図12は、図4に示したVOCテーブル2300に重要度のスコアを登録したものである。
図示するように、エントリ233には、スコア算出部122が算出した重要度のスコアが登録されている。具体的には、VOCテーブル2300の中の「VOC−ID」として「00001」が格納されているエントリ231に対応するエントリ232の「回答内容」を見てみると、評価語句は、「あまり」、「良い」、「もっと」等である。これを、図5の評価語句テーブル221の重要度を用いて集計してみると、「良い」に関連付けられた重要度は「1」であり、同様に他の評価語句とその重要度を合計すると(他の評価語句の重要度は図示しない)、「VOC−ID」が「00001」の「回答内容」のスコアは「6」となる。次に、「VOC−ID」が「00002」の「回答内容」は、評価語句として「ない」を含む。これに関連する重要度を参照すると、「1」であり,「VOC−ID」が「00002」の「回答内容」のスコアを「1」と評価する。この一連の処理を、VOCテーブル2300に格納されている全ての「回答内容」について実施する。
次に、集計・出力処理フェーズA3000について説明する。集計・出力処理フェーズA3000は、集計・出力処理の対象データを取得するための出力条件入力処理(S700)と、受け付けた対象データを用いて、VOCテーブルのデータに各種の統計処理を行う集計処理(S800)と、表示装置30に集計結果を表示する出力処理(S900)とで構成されている。なお、出力条件入力処理(S700)は、データ入力部131により行われる。集計処理(S800)は、集計部132により行われる。出力処理(S900)は、出力処理部133により行われる。
具体的には、S700では、データ入力部131が、VOCテーブル記憶部230からVOCテーブル2300(図12)を読み出す。また、読み出したVOCテーブル2300の「VOC−ID」をキーにして、VOCデータベース部200から「VOC−ID」に対応する属性情報を取得する。データ入力部131は、読み出したVOCテーブル2300および受け付けた属性情報を集計部132に出力する。
S800では、集計部132は、データ入力部131から出力されたVOCテーブル2300および受け付けた属性情報を用いて、VOCデータ201を構成するレコード一件あたりの評価語句の重要度の総和から、「顧客ニーズごとの件数」、「スコアの総和」、「スコアの平均値」、および「スコアの分散値」を算出する。また、集計部132は、算出結果をファイル化した集計テーブルを作成する。ここで、集計テーブルの例を図13に示す。
図13は、本実施形態の評価語句データベース部220の集計テーブルのデータ構造を模擬的に示した図である。
図示するように、集計テーブル800は、VOCデータ201毎に作成される(ファイル毎に作成される)。集計テーブル800は、エントリ801〜805を備える。エントリ801には、「顧客ニーズ(ニーズ項目)」が登録される。エントリ802には、エントリ801に登録される「顧客ニーズ(ニーズ項目)」に分類されるVOCデータ201のレコードの「件数」が登録される。エントリ803には、エントリ801に登録される「顧客ニーズ(ニーズ項目)」に分類されるレコードの重要度の「スコアの総和」が登録される。エントリ804には、エントリ801に登録される「顧客ニーズ(ニーズ項目)」に分類されるレコードの重要度の「スコアの平均値」が登録される。エントリ805には、エントリ801に登録される「顧客ニーズ(ニーズ項目)」に分類されるレコードの重要度の「スコアの分散値」が登録される。
さらに、集計部132は、属性情報が付加された集計テーブル900を作成する。ここで、集計テーブル900の例を図14に示す。
図14は、本実施形態の評価語句データベース部220の集計テーブルのデータ構造を模擬的に示した図である。
図示するように、集計テーブル900は、VOCデータ201毎に作成される。具体的には、集計テーブル900では、エントリ901〜905を備える。エントリ901には、「VOC−ID」が登録される。エントリ902、903には、エントリ901に登録される「VOC−ID」により特定されるレコードの属性情報(ここでは、「地域」、「用途」)が登録される。エントリ904には、エントリ901に登録される「VOC−ID」により特定されるレコードが分類された「顧客ニーズ」が登録される。エントリ905には、エントリ901に登録される「VOC−ID」により特定されるレコードに対する重要度が登録される。
図6に戻り、S900の出力処理を説明する。具体的には、S900では、出力処理部133が、出力条件設定画面(例えば、図15、図17)を表示し、分析者が入力する出力条件を受け付ける。出力条件の具体的な内容について特に限定しないが、出力処理部133は、例えば、(a)評価対象を顧客意見ごとのスコアにするかVOCデータ201をニーズごとに分類したスコアにするかの選択、(b)出力方法の選択(すなわちグラフの種類の選択)、(c)グラフの軸の選択の情報の入力等を受け付ける。
そして、出力処理部133は、受け付けた出力条件と、集計テーブル800、900とを利用して、VOCデータ201を構成する個々のレコードのスコアと属性情報との関係を分析し、単にスコアの高いレコードの顧客意見(回答内容)を特定するだけではなく、スコアの高い(低い)顧客ニーズを特徴付ける因子の特定等を行う。すなわち、出力処理部133は、顧客ニーズのスコア(重要度)を可視化させることを主目的としている。出力処理部133は、集計部132が集計処理したデータを用いて、顧客ニーズのスコア(重要度)を、各種グラフ等で表現する。ここで、出力処理部133が分析者に提示する出力処理を2つの例を挙げて説明する。
1つ目の例は、出力処理部133が顧客ニーズの重要度のスコアを3Dバーチャートで表示する場合を示す。
具体的には、出力処理部133は、表示装置30に、図15に示すような出力指定画面1000を表示する。図15は、本実施形態の顧客ニーズ分析システムが表示する顧客ニーズのスコアの出力指定画面の一例を示した図である。
図示するように、出力指定画面1000は、評価単位を設定するための領域1001と、表示するグラブの種類を設定するための領域1002と、グラフのX軸に規定する項目を設定する領域1003と、グラフのY軸に規定する項目を設定する領域1004と、領域1001〜1004で指定された条件でグラフを作成した結果を表示するための領域1005とを有する。
出力処理部133は、出力指定画面1000を表示する共に、集計部132が作成した集計テーブル800、集計テーブル900のデータを用いて、スコアの評価単位、グラフの種類、およびグラフの軸にとるデータの設定を受け付ける。具体的には、分析者が出力指定画面1000を見ながら、画面1000上の領域1001〜1004に出力条件を設定する。そして、出力処理部133は、分析者からの出力条件を受け付けて、その出力条件のグラフを作成して領域1005に表示する。
ここで、出力処理部133が、図示する条件を受け付けた場合、すなわち、評価単位が「顧客意見」であり、グラフの種類が「3Dバーチャート」であり、X軸が「ニーズ項目」であり、Y軸が「地域」である出力条件を受けたとする。この場合、出力処理部133は、集計テーブル800、集計テーブル900のデータを用いて、図16に示すような3Dバーチャートを領域1005に表示する。
図16は、本実施形態の顧客ニーズ分析システムの顧客ニーズの重要度を3Dバーチャートで示した例である。図示するように、3Dバーチャートでは、評価単位を顧客意見に設定し、X軸に「顧客ニーズ項目」、Y軸に「地域属性」、Z軸に「重要度のスコア」が設定されている。この結果から、想定したニーズに対しどのような顧客セグメントの感度が敏感かを判断できる。図示する例では、ニーズに対しての顧客属性として地域を設定している。分析者は、3Dバーチャートを見ることで、例えば、「速さ」に関するニーズが近畿地方で重要である点を把握することができる。その結果、近畿地方に対して、「速さ」を訴求する製品を開発するという製品開発の方向性を定めることができる。あるいは、近畿地方の顧客には、「速さ」をアピールしたプロモーションを強化するといった施策を取るようにすることも考えられる。分析者は、このような出力を利用して大量にある顧客意見から、商品開発上重要な顧客ニーズを定量的に把握することができるようになる。またこの結果を設計や営業などにも定量的に論理的に指し示すことができる。
次に、2つ目の例について説明する。2つ目は、出力処理部133が顧客ニーズの重要度をレーダーチャートで示す場合の例である。
具体的には、出力処理部133は、表示装置30に、図17に示すような出力指定画面1100を表示する。図17は、本実施形態の顧客ニーズ分析システムが表示する顧客ニーズのスコアの出力指定画面の一例を示した図である。
図示するように、出力指定画面1100は、評価単位を設定するための領域1101と、表示するグラブの種類を設定するための領域1102と、分析者の任意でグラフの第2軸の選択させるための領域1103とを有する。領域1103には、領域1101で設定される評価単位(例えば、顧客ニーズの重要度)と比較するための評価項目が登録される。例えば、領域1103には、評価対象のVOCデータに含まれる特定単語の出現頻度(頻度)を登録してもよい。なお、特定単語の頻度は、顧客ニーズ単位で所持する量的なデータを用いることで算出することが可能である。
出力処理部133は、出力指定画面1100を表示する共に、集計部132が作成した集計テーブル800、集計テーブル900のデータを用いて、「評価単位」、「グラフの種類」、および「第2軸」の設定を受け付ける。具体的には、分析者が出力指定画面1100を見ながら、画面1100上の領域1101〜1103に出力条件を設定する。そして、出力処理部133は、分析者からの出力条件を受け付けて、その出力条件のグラフを作成して領域1105に表示する。
出力処理部133が、図17に示す条件を受け付けた場合、すなわち、評価単位が「顧客ニーズの重要度」であり、グラフの種類が「レーダーチャート」であり、第2軸が「頻度」である出力条件を受けたとする。この場合、出力処理部133は、集計テーブル800、集計テーブル900のデータを用いて、図18に示すようなレーダーチャートを領域1105に表示する。
図18は、本実施形態の顧客ニーズ分析システムの顧客ニーズの重要度をレーダーチャートで示した例である。図示するように、レーダーチャートは、
待ち時間に関しては、頻度は低い(つまり関心は無い或いは表面化していない)ものの、スコアは高いといったギャップが発生している。従って、待ち時間に関しては顕在化している声は少ないものの、現状に対する何らかの不満や期待の割合が高いと解釈することもできる。
このように、本実施形態によれば、大量に蓄積された自然言語で記述された顧客意見を定量的に評価することができるようになる。すなわち、本実施形態によれば、分析者の勘や経験に頼らない客観的な評価が可能となる。そのため、商品企画・開発を行うプロダクトライフサイクルの初期段階において、顧客意見を的確に反映した製品開発が行えるようになる。
なお、本発明は、以上で説明した実施形態に限定されるものではなく、本発明の要旨の範囲内において種々の変形が可能である。例えば、本実施形態の評価語句定義部110に、予め顧客ニーズの評価に必要であると想定した所定数の重要単語を登録しておく。そして、評価語句定義部110は、形態素解析部101から取得した単語の中に重要単語がある場合、その重要単語を重要単語以外の単語と識別可能な状態でキーワード設定画面上に表示するようにしてもよい(例えば、重要単語を強調表示したり、目立つ色(例えば、赤色)で表示する)。或いは、評価語句定義部110は、形態素解析部101から取得した単語の中から所定の品詞に属する単語だけを抽出し、その抽出した単語の中に重要単語がある場合、その重要単語を重要単語以外の単語と識別可能な状態でキーワード設定画面上に表示するようにしてもよい。このようにすれは、重要単語の設定の見落としを防止することができる。
また、本実施形態では、評価語句およびその重要度を用いて顧客ニーズのスコア値を算出するようにしたが他の項目で評価した値をスコア値に加えるようにしてもよい。例えば、アンケートの回答欄に記載されている文書の長さに応じて定めた値をスコアに加算するようにしてもよい。このように構成するのは、以下の理由による。すなわち、アンケート欄に記載された長い文書は、回答者の思い入れ、願望・要求・不満が丁寧に記述されていると考えられる。このような意見と、単に単語のみで記述されたような意見とでは、結果的に同じ意味を表すニーズであったとしても重要度の度合いが異なると考えられる。そのため、アンケートの回答欄に記載されている文書の長さに応じてスコアを加算するようにすれば、顧客ニーズを精度高く算出することができる。
また、本実施形態では、1台の情報処理装置10の中に各部(VOCデータテキストマイニング処理部100、評価語句定義部110、VOCスコア集計処理部120、集計処理部130、VOCデータベース部200、専門用語辞書データベース部210、評価語句データベース部220、VOCテーブル記憶部230)の機能を設けたがこれは例示に過ぎない。例えば、複数の装置に各部の機能が分散して構成されていてもよい。
本発明の実施形態が適用された顧客ニーズ分析システムの機能ブロック図である。 本発明の実施形態の情報処理装置のハードウェア構成図である。 本発明の実施形態で利用されるVOCデータのデータ構成の一例を模擬的に示した図である。 本発明の実施形態の顧客ニーズ分析システムが顧客ニーズの重要度のスコアの算出に利用するVOCテーブルを例示した図である。 本発明の実施形態の評価語句テーブルのデータ構造を模擬的に示した図である。 本発明の実施形態の顧客ニーズ分析システムが行う処理のフローを説明するための図である。 本発明の実施形態の顧客ニーズ分析システムが行う評価語句定義処理のフローを説明するための図である。 本発明の実施形態の形態素解析処理の処理結果を表示装置に表示した際の表示画面を例示した図である。 本発明の実施形態の顧客ニーズ分析システムの評価語句設定画面を例示した図である。 本発明の実施形態の顧客ニーズ分析システムの評価語句設定画面を例示した図である。 本発明の実施形態の顧客ニーズ分析システムが表示する顧客ニーズ毎に分類したVOCデータの画面例を示す図である。 本発明の実施形態の顧客ニーズ分析システムが顧客ニーズの重要度のスコアの算出に利用するVOCテーブルを例示した図である。 本発明の実施形態の集計テーブルのデータ構造を模擬的に示した図である。 本発明の集計テーブルのデータ構造を模擬的に示した図である。 本発明の実施形態の顧客ニーズ分析システムが表示する顧客ニーズのスコアの出力指定画面の一例を示した図である。 本発明の実施形態の顧客ニーズ分析システムの顧客ニーズの重要度を3Dバーチャートで示した例である。 本発明の実施形態の顧客ニーズ分析システムが表示する顧客ニーズのスコアの出力指定画面の一例を示した図である。 本実施形態の顧客ニーズ分析システムの顧客ニーズの重要度をレーダーチャートで示した例である。
符号の説明
10…情報処理装置、11…CPU、12…主記憶装置、13…補助記憶装置、14…IOI/F、20…入力装置、30…表示装置、100…テキストマイニング処理部、101…形態素解析部、102…構文解析部、103…クラスタリング部、110…評価語句定義部、120…VOCスコア集計処理部、121…評価語句抽出部、122…スコア算出部、130…集計処理部、131…出力データ処理部、132…集計部、133…出力処理部、200…VOCデータベース部、210…専門用語辞書データベース部、220…評価語句データベース部、230…VOCテーブル記憶部230、

Claims (8)

  1. 複数の顧客意見情報が登録されているデータベースを記憶している記憶部を備え、該顧客意見情報を用いて顧客ニーズを分析する処理を行う情報処理装置であって、
    前記顧客意見情報には、分析対象の製品またはサービスに対する顧客からの意見を自然言語で表現したテキスト形式の文書データが含まれていて、
    前記データベースに登録されている顧客意見情報に含まれる文書データに対し、該文書データを単語に分解する分かち書き処理、および分解された単語毎に品詞を関連付け、該単語毎に品詞を関連付けたデータを出力する形態素解析部と、
    前記形態素解析部が出力したデータを利用して、単語の係り受けによる文書の内容を解析する構文解析部と、
    前記構文解析部の処理結果を用いて、前記複数の顧客意見情報を所定の顧客ニーズ毎に分類し、該顧客ニーズ毎に分類した顧客意見情報を出力するクラスタリング部と、
    利用者から、顧客ニーズを評価するためのキーワードの設定を受け付けると共に、該受け付けたキーワードに対応付けて該キーワードの評価レベルを示す評価値の入力を受け付ける評価語句定義部と、
    前記顧客ニーズ毎に該分類した顧客意見情報を取得し、該顧客意見情報毎に、該顧客意見情報に含まれる文書データから前記キーワードを抽出し、該抽出したキーワードに対応付けられている評価値を合計て、その合計値を該顧客意見情報の重要度を示すスコアとして算出する評価部と、
    前記顧客ニーズ毎に、該分類した各顧客意見情報の前記スコアに所定の統計処理を施して、該顧客ニーズの統計値を算出する集計部と、を備え、
    前記評価語句定義部は、
    前記形態素解析部から前記単語毎に品詞を関連付けたデータを取得し、該取得したデータを品詞毎にソートし、該品詞毎にソートした単語を利用者に提示し、利用者からの要求にしたがい、前記提示した単語の中からキーワードの設定を受け付けること
    を特徴とする情報処理装置。
  2. 請求項1に記載の情報処理装置であって、
    前記情報処理装置には、表示装置が接続されていて、
    前記評価語句定義部は、
    前記取得した単語毎に品詞を関連付けたデータの中から所定の品詞に属する単語を抽出して、該抽出した単語を品詞毎にソートし、
    前記表示装置に、前記ソートした単語および該単語の品詞をリスト形式で示したキーワード設定画面を表示し、キーワード設定画面上に示した単語の中からキーワードとして利用する単語の選択を受け付けると共に、該キーワードとして選択された単語に対応付けて前記評価値の入力を受け付けること
    を特徴とする情報処理装置。
  3. 請求項2に記載の情報処理装置であって、
    前記評価語句定義部は、予め、顧客ニーズの評価に必要であると想定した所定数の重要単語を保持していて、
    前記評価語句定義部は、
    前記抽出した単語の中に重要単語がある場合、該重要単語を該重要単語以外の単語と識別可能な状態で前記キーワード設定画面上に表示すること
    を特徴とする情報処理装置。
  4. 請求項1〜3のいずれか一項に記載の情報処理装置であって、
    前記集計部が算出した前記顧客ニーズ毎の統計値を利用者に提示する出力部を有すること
    を特徴とする情報処理装置。
  5. 請求項1〜4のいずれか一項に記載の情報処理装置であって、
    前記文書データには、前記製品またはサービスに関連する属性情報が含まれていて、
    前記出力部は、前記属性情報を用いて前記顧客意見情報を所定の属性毎に分類した上で、利用者に提示すること
    を特徴とする情報処理装置。
  6. 請求項1〜5のいずれか一項に記載の情報処理装置であって、
    前記製品またはサービスに関する専門用語であって、一般的に用いる意味と異なる意味を有する語句とそれに関係する品詞情報を格納した専門用語辞書データベースを備え、
    前記構文解析部は、前記専門用語辞書データベースを参照して文書の内容を解析すること
    を特徴とする情報処理装置。
  7. 複数の顧客意見情報が登録されているデータベースを記憶している記憶部を備えた情報処理装置が行う顧客ニーズ分析方法であって、
    前記顧客意見情報には、分析対象の製品またはサービスに対する顧客からの意見を自然言語で表現したテキスト形式の文書データが含まれていて、
    前記情報処理装置は、
    前記記憶部からデータベースを読み出し、該データベースに登録されている顧客意見情報に含まれる文書データに対し、該文書データを単語に分解し、該分解された単語毎に品詞を関連付け、該単語毎に品詞を関連付けたデータを出力するステップと、
    前記単語毎に品詞を関連付けたデータを利用して、単語の係り受けによる文書の内容を解析するステップと、
    前記解析された結果を用いて、前記複数の顧客意見情報を所定の顧客ニーズ毎に分類し、該顧客ニーズ毎に分類した顧客意見情報を出力するステップと、
    利用者から、顧客ニーズを評価するためのキーワードの設定を受け付けると共に、該受け付けたキーワードに対応付けて該キーワードの評価レベルを示す評価値の入力を受け付ける評価語句定義ステップと、
    前記顧客ニーズ毎に該分類した顧客意見情報を取得し、該顧客意見情報毎に、該顧客意見情報に含まれる文書データから前記キーワードを抽出し、該抽出したキーワードに対応付けられている評価値を合計て、その合計値を該顧客意見情報の重要度を示すスコアとして算出するステップと、
    前記顧客ニーズ毎に、該分類した各顧客意見情報の前記スコアに所定の統計処理を施して、該顧客ニーズの統計値を算出するステップと、を行い、
    前記評価語句定義ステップは、
    前記単語毎に品詞を関連付けたデータを品詞毎にソートし、該品詞毎にソートした単語を利用者に提示し、利用者からの要求にしたがい、前記提示した単語の中からキーワードの設定を受け付けること
    を特徴とする顧客ニーズ分析方法。
  8. 複数の顧客意見情報が登録されているデータベースを記憶している記憶部を備えた情報処理装置に顧客ニーズを分析する処理を実行させるプログラムであって、
    前記顧客意見情報には、分析対象の製品またはサービスに対する顧客からの意見を自然言語で表現したテキスト形式の文書データが含まれていて、
    前記プログラムは、
    前記記憶部からデータベースを読み出し、該データベースに登録されている顧客意見情報に含まれる文書データに対し、該文書データを単語に分解し、該分解された単語毎に品詞を関連付け、該単語毎に品詞を関連付けたデータを出力するステップと、
    前記単語毎に品詞を関連付けたデータを利用して、単語の係り受けによる文書の内容を解析するステップと、
    前記解析された結果を用いて、前記複数の顧客意見情報を所定の顧客ニーズ毎に分類し、 該顧客ニーズ毎に分類した顧客意見情報を出力するステップと、
    利用者から、顧客ニーズを評価するためのキーワードの設定を受け付けると共に、該受け付けたキーワードに対応付けて該キーワードの評価レベルを示す評価値の入力を受け付ける評価語句定義ステップと、
    前記顧客ニーズ毎に該分類した顧客意見情報を取得し、該顧客意見情報毎に、該顧客意見情報に含まれる文書データから前記キーワードを抽出し、該抽出したキーワードに対応付けられている評価値を合計て、その合計値を該顧客意見情報の重要度を示すスコアとして算出するステップと、
    前記顧客ニーズ毎に、該分類した各顧客意見情報の前記スコアに所定の統計処理を施して、該顧客ニーズの統計値を算出するステップと、を前記情報処理装置に実行させ、
    前記評価語句定義ステップは、
    前記単語毎に品詞を関連付けたデータを品詞毎にソートし、該品詞毎にソートした単語を利用者に提示し、利用者からの要求にしたがい、前記提示した単語の中からキーワードの設定を受け付けること
    を特徴とするプログラム。
JP2006047341A 2006-02-23 2006-02-23 情報処理装置、顧客ニーズ分析方法、およびプログラム Expired - Fee Related JP4870448B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006047341A JP4870448B2 (ja) 2006-02-23 2006-02-23 情報処理装置、顧客ニーズ分析方法、およびプログラム
US11/675,748 US7698129B2 (en) 2006-02-23 2007-02-16 Information processor, customer need-analyzing method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006047341A JP4870448B2 (ja) 2006-02-23 2006-02-23 情報処理装置、顧客ニーズ分析方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2007226568A JP2007226568A (ja) 2007-09-06
JP4870448B2 true JP4870448B2 (ja) 2012-02-08

Family

ID=38429409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006047341A Expired - Fee Related JP4870448B2 (ja) 2006-02-23 2006-02-23 情報処理装置、顧客ニーズ分析方法、およびプログラム

Country Status (2)

Country Link
US (1) US7698129B2 (ja)
JP (1) JP4870448B2 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7752043B2 (en) 2006-09-29 2010-07-06 Verint Americas Inc. Multi-pass speech analytics
US8099429B2 (en) * 2006-12-11 2012-01-17 Microsoft Corporation Relational linking among resoures
US8732603B2 (en) * 2006-12-11 2014-05-20 Microsoft Corporation Visual designer for non-linear domain logic
US20080215571A1 (en) * 2007-03-01 2008-09-04 Microsoft Corporation Product review search
US20080312985A1 (en) * 2007-06-18 2008-12-18 Microsoft Corporation Computerized evaluation of user impressions of product artifacts
US20090006085A1 (en) * 2007-06-29 2009-01-01 Microsoft Corporation Automated call classification and prioritization
US8239189B2 (en) * 2008-02-26 2012-08-07 Siemens Enterprise Communications Gmbh & Co. Kg Method and system for estimating a sentiment for an entity
US20090265307A1 (en) * 2008-04-18 2009-10-22 Reisman Kenneth System and method for automatically producing fluent textual summaries from multiple opinions
WO2010036012A2 (ko) * 2008-09-23 2010-04-01 주식회사 버즈니 인터넷을 이용한 의견 검색 시스템, 의견 검색 및 광고 서비스 시스템과 그 방법
US8103962B2 (en) * 2008-11-04 2012-01-24 Brigham Young University Form-based ontology creation and information harvesting
US8719016B1 (en) 2009-04-07 2014-05-06 Verint Americas Inc. Speech analytics system and system and method for determining structured speech
WO2010117031A1 (ja) 2009-04-10 2010-10-14 日本電気株式会社 類型化装置、類型化方法及び類型化プログラム
US20110044447A1 (en) * 2009-08-21 2011-02-24 Nexidia Inc. Trend discovery in audio signals
JP5386288B2 (ja) * 2009-09-30 2014-01-15 株式会社日立製作所 トレンド分析装置の表示方法
JP5366140B2 (ja) * 2009-10-14 2013-12-11 学校法人近畿大学 情報処理装置、情報処理方法、およびプログラム
JP5547599B2 (ja) 2010-09-30 2014-07-16 インターナショナル・ビジネス・マシーンズ・コーポレーション 検索クエリーの作成を支援する装置、グラフィカルユーザインターフェース生成システム、方法及びプログラム
US9530167B2 (en) 2011-08-12 2016-12-27 Facebook, Inc. Coefficients attribution for different objects based on natural language processing
SG11201402943WA (en) * 2011-12-06 2014-07-30 Perception Partners Inc Text mining analysis and output system
US9436758B1 (en) 2011-12-27 2016-09-06 Google Inc. Methods and systems for partitioning documents having customer feedback and support content
US9396179B2 (en) * 2012-08-30 2016-07-19 Xerox Corporation Methods and systems for acquiring user related information using natural language processing techniques
JP5963312B2 (ja) * 2013-03-01 2016-08-03 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理方法、及びプログラム
CN104216880B (zh) * 2013-05-29 2017-06-16 北京信息科技大学 基于互联网的术语定义辨析方法
WO2016077299A1 (en) * 2014-11-10 2016-05-19 Unitedhealth Group Incorporated Systems and methods for predictive personalization and intelligent routing
US10594866B2 (en) * 2014-11-10 2020-03-17 Unitedhealth Group Incorporated Systems and methods for predictive personalization and intelligent routing
US9690772B2 (en) 2014-12-15 2017-06-27 Xerox Corporation Category and term polarity mutual annotation for aspect-based sentiment analysis
WO2018015986A1 (ja) * 2016-07-22 2018-01-25 株式会社Fronteo 顧客評価データ分類システム、方法、プログラムおよびその記録媒体
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US10026092B2 (en) * 2016-12-09 2018-07-17 Nuance Communications, Inc. Learning and automating agent actions
JP6445632B1 (ja) * 2017-08-09 2018-12-26 ヤフー株式会社 抽出装置、抽出方法、及び抽出プログラム
US10963688B2 (en) * 2017-12-10 2021-03-30 Walmart Apollo, Llc Systems and methods for a customer feedback classification system
WO2020051431A1 (en) * 2018-09-06 2020-03-12 Unitedhealth Group Incorporated Systems and methods for predictive personalization and intelligent routing
JP6664593B1 (ja) * 2018-12-21 2020-03-13 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
US11568137B2 (en) * 2020-02-05 2023-01-31 Sap Se Mapping text content feedback to a process via a synonym graph
CN111414455B (zh) * 2020-03-20 2024-03-01 北京百度网讯科技有限公司 舆情分析方法、装置、电子设备及可读存储介质
US10841424B1 (en) 2020-05-14 2020-11-17 Bank Of America Corporation Call monitoring and feedback reporting using machine learning
US11797586B2 (en) * 2021-01-19 2023-10-24 Accenture Global Solutions Limited Product presentation for customer relationship management
CN117909502A (zh) * 2024-02-02 2024-04-19 青岛冠成软件有限公司 一种客户信息管理方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4887212A (en) * 1986-10-29 1989-12-12 International Business Machines Corporation Parser for natural language text
US5020019A (en) * 1989-05-29 1991-05-28 Ricoh Company, Ltd. Document retrieval system
US6181909B1 (en) * 1997-07-22 2001-01-30 Educational Testing Service System and method for computer-based automatic essay scoring
US6553347B1 (en) * 1999-01-25 2003-04-22 Active Point Ltd. Automatic virtual negotiations
US7120865B1 (en) * 1999-07-30 2006-10-10 Microsoft Corporation Methods for display, notification, and interaction with prioritized messages
US6539372B1 (en) * 1999-11-17 2003-03-25 International Business Machines Corporation Method for providing automated user assistance customized output in the planning, configuration, and management of information systems
US7143089B2 (en) * 2000-02-10 2006-11-28 Involve Technology, Inc. System for creating and maintaining a database of information utilizing user opinions
JP4018356B2 (ja) * 2000-07-28 2007-12-05 株式会社東芝 製品設計方法、製品設計装置および製品設計プログラムを格納する記憶媒体
US7272617B1 (en) * 2001-11-30 2007-09-18 Ncr Corp. Analytic data set creation for modeling in a customer relationship management system
JP2003223461A (ja) * 2002-01-29 2003-08-08 Webstar Co Ltd 知的労働者の知的創造支援のための検索システム
JP2004021445A (ja) 2002-06-14 2004-01-22 Nri & Ncc Co Ltd テキストデータ分析システム、テキストデータ分析方法およびコンピュータプログラム
US7269544B2 (en) * 2003-05-20 2007-09-11 Hewlett-Packard Development Company, L.P. System and method for identifying special word usage in a document
US7363214B2 (en) * 2003-08-08 2008-04-22 Cnet Networks, Inc. System and method for determining quality of written product reviews in an automated manner
JP4423004B2 (ja) 2003-10-03 2010-03-03 三菱電機株式会社 テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム
JP4259303B2 (ja) * 2003-12-05 2009-04-30 東京電力株式会社 顧客サービス向上支援システム
US7454716B2 (en) * 2003-12-22 2008-11-18 Microsoft Corporation Clustering messages
US7533090B2 (en) * 2004-03-30 2009-05-12 Google Inc. System and method for rating electronic documents
US7437382B2 (en) * 2004-05-14 2008-10-14 Microsoft Corporation Method and system for ranking messages of discussion threads
US20070073751A1 (en) * 2005-09-29 2007-03-29 Morris Robert P User interfaces and related methods, systems, and computer program products for automatically associating data with a resource as metadata

Also Published As

Publication number Publication date
US20070198249A1 (en) 2007-08-23
US7698129B2 (en) 2010-04-13
JP2007226568A (ja) 2007-09-06

Similar Documents

Publication Publication Date Title
JP4870448B2 (ja) 情報処理装置、顧客ニーズ分析方法、およびプログラム
Chau et al. Finding People with Emotional Distress in Online Social Media: A Design Combining Machine Learning and Rule-Based Classification.
Coussement et al. Improving customer complaint management by automatic email classification using linguistic style features as predictors
Coussement et al. Integrating the voice of customers through call center emails into a decision support system for churn prediction
US20050120009A1 (en) System, method and computer program application for transforming unstructured text
JP3917629B2 (ja) 自然文処理装置及び自然文処理用プログラム
JPWO2012132388A1 (ja) テキスト分析装置、問題言動抽出方法および問題言動抽出プログラム
US20150199427A1 (en) Document analysis apparatus and program
US11403654B2 (en) Identifying competitors of companies
Lee et al. Service chatbot: Co-citation and big data analysis toward a review and research agenda
US10248648B1 (en) Determining whether a comment represented as natural language text is prescriptive
Lekkas et al. Using the COVID-19 pandemic to assess the influence of news affect on online mental health-related search behavior across the United States: integrated sentiment analysis and the circumplex model of affect
KR101401225B1 (ko) 문서 분석 시스템
EP3089053A1 (en) Data evaluation system, data evaluation method, and data evaluation program
Oka et al. Extracting topics from weblogs through frequency segments
CN104881446A (zh) 搜索方法及装置
US20220327445A1 (en) Workshop assistance system and workshop assistance method
JP4269698B2 (ja) 意見分析方法、意見分析装置、および意見分析プログラム
JP2002140465A (ja) 自然文処理装置及び自然文処理用プログラム
JP5703629B2 (ja) 同義語辞書生成装置、データ解析装置、データ検出装置、同義語辞書生成方法及び同義語辞書生成プログラム
Qian et al. Evaluating quality-in-use of FLOSS through analyzing user reviews
Nguyen et al. Auditing financial statements in insurance enterprises: The case of Vietnam
JP2003281161A (ja) 情報分類方法、情報分類装置、プログラムおよび記録媒体
JP2012093870A (ja) システム開発における要求獲得支援システム、要求獲得支援方法およびプログラム
JP2004164079A (ja) データ分析装置及び方法、並びにプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111108

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111117

R151 Written notification of patent or utility model registration

Ref document number: 4870448

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141125

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees