JP2003203136A - 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム - Google Patents

意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム

Info

Publication number
JP2003203136A
JP2003203136A JP2002001873A JP2002001873A JP2003203136A JP 2003203136 A JP2003203136 A JP 2003203136A JP 2002001873 A JP2002001873 A JP 2002001873A JP 2002001873 A JP2002001873 A JP 2002001873A JP 2003203136 A JP2003203136 A JP 2003203136A
Authority
JP
Japan
Prior art keywords
opinion
object name
analysis
input
document set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002001873A
Other languages
English (en)
Other versions
JP4410970B2 (ja
Inventor
Kenji Tateishi
健二 立石
Kenji Yamanishi
健司 山西
Satoshi Morinaga
聡 森永
Shunichi Fukushima
俊一 福島
Yoshihide Ishiguro
義英 石黒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2002001873A priority Critical patent/JP4410970B2/ja
Publication of JP2003203136A publication Critical patent/JP2003203136A/ja
Application granted granted Critical
Publication of JP4410970B2 publication Critical patent/JP4410970B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】 インタネット等に存在する文書集合から人の
意見を自動抽出し、その意見をさまざまな観点で比較分
析する。 【解決手段】 入出力装置1の対象物名集合入力手段1
は利用者が複数の対象物名を入力する。対象物名選択手
段12は利用者が対象物名集合入力手段11で入力した
対象物名集合のうち分析対象の対象物名を選択する。デ
ータ処理装置2の文書集合記憶部21は文書集合を記憶
し、意見抽出手段22は文書集合記憶部21に記憶され
た文書集合に含まれ、対象物名集合入力手段11から入
力された対象物名に関連する意見を抽出する。対象物比
較分析手段23は当該意見抽出手段22で抽出し、対象
物名集合入力手段11で入力された対象物名に関する意
見(全体の意見)に対して、その中で対象物名選択手段
12で選択した対象物名に関する意見(部分の意見)の
特徴を分析する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は及びそれに用いる意
見収集分析装置方法並びにそのプログラムに関し、特に
文書集合から抽出した意見をさまざまな観点で比較分析
する意見収集分析装置に関する。
【0002】
【従来の技術】市場調査や顧客満足度調査のためには消
費者からの意見を収集・分析することが重要である。従
来、この意見を収集・分析するための方法としては、ア
ンケートを用いて消費者から意見を収集し、その回答文
から全体的な特徴や傾向を分析するという方法が使われ
ている。
【0003】例えば、特開2001−266060号公
報に開示されたアンケート回答分析システムでは、消費
者からの自由回答文から、テキスト分類エンジンによっ
てルール形式の知識を自動的に抽出し、その抽出結果を
利用者に分析結果として提示している。
【0004】一方、意見を収集するという点に注目する
と、インタネットのWebページに記述されている情報
から意見を抽出する方法がある。例えば、立石健二、石
黒義英、福島俊一による“インターネットからの評判情
報検索”[情報処理学会第62回全国大会予稿集
(3),p123−124,2001]には、Webペ
ージに記述されたさまざまな情報の中からユーザが入力
した商品に関する意見を自動的に抽出してユーザに検索
結果として提示している。
【0005】
【発明が解決しようとする課題】しかしながら、上述し
たアンケート回答分析システムでは、人の意見をアンケ
ート調査票を用いて収集しているが、アンケート実施者
がアンケート調査票作成にかかるコストや、良質の回答
モニタを選別してアンケートを依頼するコストが多く必
要であり、またそのように労力をかけて調査を行っても
十分な数の自由回答文の意見が得られないケースが多く
存在するという問題がある。
【0006】また、上記の評判情報検索システムでは、
意見の収集自体を自動的に行うことが可能であるが、収
集した意見を単純に検索結果に列挙しただけでは、ユー
ザがその商品のどのような点が良くどのような点が悪い
のか、または他の商品と比較してどのぐらい良いのかと
いった全体的な特徴や傾向を知ることができないという
問題がある。
【0007】さらに、上記のアンケート回答分析システ
ムと評判情報検索システムとを組合わせた場合、単純に
評判情報検索システムの出力をアンケート回答分析シス
テムに入力したのでは、抽出した意見を比較分析するこ
とができないという問題がある。
【0008】さらにまた、上記のアンケート回答分析シ
ステムと評判情報検索システムとを組合わせた場合、評
判情報検索システムの意見抽出精度が十分でないため、
単純に評判情報検索システムの出力をアンケート回答分
析システムに入力したのでは、精度の高い分析結果が得
られないこともあるという問題がある。
【0009】そこで、本発明の目的は上記の問題点を解
消し、抽出した意見全体の中で利用者が選択した対象物
に関する意見の特徴を分析した結果を依頼者に提示する
ことができる意見収集分析装置及びそれに用いる意見収
集分析方法並びにそのプログラムを提供することにあ
る。
【0010】本発明の他の目的は、正確な意見抽出を実
現することができ、その抽出した意見の高精度の分析結
果を依頼者に提示することができる意見収集分析装置及
びそれに用いる意見収集分析方法並びにそのプログラム
を提供することにある。
【0011】本発明の別の目的は、抽出した意見全体の
中で利用者が選択したカテゴリに関する意見の特徴を分
析した結果を依頼者に提示することができる意見収集分
析装置及びそれに用いる意見収集分析方法並びにそのプ
ログラムを提供することにある。
【0012】
【課題を解決するための手段】本発明による意見収集分
析装置は、複数の対象物名を入力するための対象物名集
合入力手段と、前記対象物名集合入力手段から入力され
た対象物名集合のうちの分析対象の対象物名を選択する
対象物名選択手段と、文書集合を記憶する文書集合記憶
手段と、前記文書集合記憶手段に記憶された文書集合に
含まれかつ前記対象物名集合入力手段から入力された対
象物名に関連する意見を抽出する意見抽出手段と、前記
意見抽出手段で抽出した意見の中で前記対象物名選択手
段で選択された対象物名に関する意見の特徴を分析する
対象物比較分析手段とを備えている。
【0013】本発明による他の意見収集分析装置は、一
つ以上の対象物名を入力するための対象物名入力手段
と、前記対象物名入力手段から入力された対象物名集合
のうちの分析対象の対象物名を選択する対象物名選択手
段と、前記対象物名入力手段から入力された対象物名を
基にそれに関連する対象物名を展開する対象物名拡張手
段と、文書集合を記憶する文書集合記憶手段と、前記文
書集合記憶手段に記憶された文書集合に含まれかつ前記
対象物名集合入力手段から入力された対象物名及び前記
対象物名拡張手段で拡張された対象物名に関連する意見
を抽出する意見抽出手段と、前記意見抽出手段で抽出さ
れた意見の中で前記対象物名選択手段で選択した対象物
名に関する意見の特徴を分析する対象物比較分析手段と
を備えている。
【0014】本発明による別の意見収集分析装置は、一
つ以上の対象物名を入力するための対象物名入力手段
と、分析条件を入力する分析条件入力手段と、文書集合
を記憶する文書集合記憶手段と、前記文書集合記憶手段
に記憶された文書集合に含まれかつ前記対象物名入力手
段から入力された対象物名に関連する意見を抽出する意
見抽出手段と、前記意見抽出手段で抽出された意見に様
々なカテゴリを設定するカテゴリ設定手段と、前記意見
抽出手段で抽出された意見の中で前記分析条件入力手段
から指定された条件を満たす意見の特徴を分析する比較
分析手段とを備えている。
【0015】本発明による意見収集分析方法は、複数の
対象物名を入力するステップと、その入力された対象物
名集合のうちの分析対象の対象物名を選択するステップ
と、文書集合を記憶する文書集合記憶手段に記憶された
文書集合に含まれかつ前記入力された対象物名に関連す
る意見を抽出するステップと、この抽出した意見の中で
前記選択された対象物名に関する意見の特徴を分析する
ステップとを備えている。
【0016】本発明による他の意見収集分析方法は、一
つ以上の対象物名を入力するステップと、その入力され
た対象物名集合のうちの分析対象の対象物名を選択する
ステップと、前記入力された対象物名を基にそれに関連
する対象物名を展開するステップと、文書集合を記憶す
る文書集合記憶手段に記憶された文書集合に含まれかつ
前記入力された対象物名及び前記拡張された対象物名に
関連する意見を抽出するステップと、この抽出された意
見の中で前記選択した対象物名に関する意見の特徴を分
析するステップとを備えている。
【0017】本発明による別の意見収集分析方法は、一
つ以上の対象物名を入力するステップと、分析条件を入
力するステップと、文書集合を記憶する文書集合記憶手
段に記憶された文書集合に含まれかつ前記入力された対
象物名に関連する意見を抽出するステップと、この抽出
された意見に様々なカテゴリを設定するステップと、前
記抽出された意見の中で前記分析条件を満たす意見の特
徴を分析するステップとを備えている。
【0018】本発明による意見収集分析方法のプログラ
ムは、コンピュータに、複数の対象物名を入力する処理
と、その入力された対象物名集合のうちの分析対象の対
象物名を選択する処理と、文書集合を記憶する文書集合
記憶手段に記憶された文書集合に含まれかつ前記入力さ
れた対象物名に関連する意見を抽出する処理と、この抽
出した意見の中で前記選択された対象物名に関する意見
の特徴を分析する処理とを実行させている。
【0019】本発明による他の意見収集分析方法のプロ
グラムは、コンピュータに、一つ以上の対象物名を入力
する処理と、その入力された対象物名集合のうちの分析
対象の対象物名を選択する処理と、前記入力された対象
物名を基にそれに関連する対象物名を展開する処理と、
文書集合を記憶する文書集合記憶手段に記憶された文書
集合に含まれかつ前記入力された対象物名及び前記拡張
された対象物名に関連する意見を抽出する処理と、この
抽出された意見の中で前記選択した対象物名に関する意
見の特徴を分析する処理とを実行させている。
【0020】本発明による別の意見収集分析方法のプロ
グラムは、コンピュータに、一つ以上の対象物名を入力
する処理と、分析条件を入力する処理と、文書集合を記
憶する文書集合記憶手段に記憶された文書集合に含まれ
かつ前記入力された対象物名に関連する意見を抽出する
処理と、この抽出された意見に様々なカテゴリを設定す
る処理と、前記抽出された意見の中で前記分析条件を満
たす意見の特徴を分析する処理とを実行させている。
【0021】すなわち、本発明の意見収集分析装置は、
利用者が複数の対象物名を入力する対象物名集合入力手
段と、利用者が当該対象物名集合入力手段で入力した対
象物名集合のうち分析対象の対象物名を選択する対象物
名選択手段と、文書集合を記憶する文書集合記憶部と、
当該文書集合記憶部に記憶された文書集合に含まれる当
該対象物名集合入力手段から入力された対象物名に関連
する意見を抽出する意見抽出手段と、当該意見抽出手段
で抽出した当該対象物名集合入力手段で入力された対象
物名に関する意見(全体の意見)に対して、その中で当
該対象物名選択手段で選択した対象物名に関する意見
(部分の意見)の特徴を分析する対象物比較分析手段と
から構成されている。
【0022】このような構成を採用することによって、
本発明の意見収集分析装置では、文書集合から複数の対
象物名の意見を抽出することによって、抽出した意見全
体の中で利用者が選択した対象物に関する意見の特徴を
分析した結果が依頼者に提示可能となる。
【0023】また、本発明の意見収集分析装置は、物事
に対する評価を示す表現である評価表現の集合が登録さ
れた評価表現記憶部と、入力された対象物と評価表現記
憶部に記憶された評価表現が一定の関係にある場合に対
象物と評価表現とを含む文字列又は文章を意見候補とし
て抽出する意見候補抽出手段と、意見候補抽出手段で抽
出された意見候補の意見らしさを判定する意見判定手段
とを有している。
【0024】このような構成を採用することによって、
本発明の意見収集分析装置では、インタネットから抽出
した意見候補の意見らしさを構文的適性もしくは客観的
適性といった方法によって判定することによって、正確
な意見抽出を実現し、それによって抽出した意見の高精
度の分析結果が依頼者に提示可能となる。
【0025】さらに、本発明の意見収集分析装置は、利
用者が一つ以上の対象物名を入力する対象物名入力手段
と、利用者が分析条件を入力する分析条件入力手段と、
文書集合を記憶する文書集合記憶部と、当該文書集合記
憶部に記憶された文書集合に含まれる当該対象物名入力
手段から入力された対象物名に関連する意見を抽出する
意見抽出手段と、当該意見抽出手段で抽出された意見に
様々なカテゴリを設定するカテゴリ設定手段と、当該意
見抽出手段で抽出された当該対象物名入力手段で入力さ
れた対象物名に関する意見(全体の意見)に対して、そ
の中で当該分析条件指定選択手段で指定された条件を満
たす意見(部分の意見)の特徴を分析する比較分析手段
とから構成されている。
【0026】このような構成を採用することによって、
本発明の意見収集分析装置では、文書集合から抽出した
意見に様々なカテゴリを自動的に設定することによっ
て、抽出した意見全体の中で利用者が選択したカテゴリ
に関する意見の特徴を分析した結果が依頼者に提示可能
となる。
【0027】
【発明の実施の形態】次に、本発明の実施例について図
面を参照して説明する。図1は本発明の第1の実施例に
よる意見収集分析装置の構成を示すブロック図である。
図1において、本発明の第1の実施例による意見収集分
析装置は入出力装置1と、データ処理装置2とから構成
されている。
【0028】入出力装置1は利用者が複数の対象物名を
入力する対象物名集合入力手段11と、利用者が対象物
名集合入力手段11で入力した対象物名集合のうち分析
対象の対象物名を選択する対象物名選択手段12と、対
象物比較分析手段23の分析結果を出力する出力手段1
3とから構成されている。
【0029】また、データ処理装置2は主にコンピュー
タから構成され、文書集合を記憶する文書集合記憶部2
1と、文書集合記憶部21に記憶された文書集合に含ま
れる対象物名集合入力手段11から入力された対象物名
に関連する意見を抽出する意見抽出手段22と、意見抽
出手段22で抽出した対象物名集合入力手段11で入力
された対象物名に関する意見(全体の意見)に対する、
その中で対象物名選択手段12で選択した対象物名に関
する意見(部分の意見)の特徴を分析する対象物比較分
析手段23と、データ処理装置2の各手段を実現するた
めのプログラムを格納する記録媒体24とを備えてい
る。尚、データ処理装置2の各手段はハードウェアで構
成可能である。
【0030】対象物集合入力手段11における対象物名
は、例えば『商品「M」』、『商品「K」』、『商品
「S」』、『商品「R」』というように同分野[例え
ば、コンピュータやPDA(Personal Dig
ital Assistans)等の分野]の複数の対
象物名を入力することが効果的である。また、対象物名
は商品名に限ることなく、例えば「N社」のような企業
・組織名、「山田太郎」のような人名であってもよい。
【0031】文書記憶部21における文書集合とは、デ
ィジタル化された文書集合であればどのような形態でも
よいが、様々な人が自由に情報を発信しているインタネ
ット上の文書が意見収集分析には効果的である。
【0032】対象物比較分析手段23における特徴は、
対象物と意見とのペアの複数個を入力として、分析結果
出力を、例えば「1)if−then−else型のル
ールで意見を対象物に分類する分類ルールとしての表
現」、「2)if−then−or型のルールで意見を
対象物に対応させる相関ルールとしての表現」、「3)
対象物とその特徴語をポジショニングマップでの表
現」、「4)意見を対象物に関して典型的な順に並べた
リストでの表現」のいずれかを行うことである。
【0033】特に、1)のif−then−else型
のルールは特開2001−266060号公報の「アン
ケート回答分析システム」に開示された方法によって得
ることができる。
【0034】図2は図1の意見抽出手段22の構成例を
示すブロック図である。図2において、意見抽出手段2
2は物事に対する評価を示す表現である評価表現の集合
が登録された評価表現記憶部221と、入力された対象
物名と評価表現記憶部221に記憶された評価表現とが
一定の関係にある場合に対象物名と評価表現とを含む文
字列または文章を意見候補としてWeb文書記憶部25
(文書集合記憶部21)から抽出する意見候補抽出手段
222と、意見候補抽出手段222で抽出された意見候
補が意見と認められるかを判定する意見判定手段223
とから構成されている。
【0035】評価表現記憶部221に記憶される評価表
現は、物事に対する評価を示す表現である。商品に関す
る評価表現の例を図3に示す。図3において、商品分野
「共通」に対応する評価表現には「いい」、「好き」、
「最高」、「勧め」、「満足だ」があり、商品分野「書
籍」に対応する評価表現には「面白い」、「名作」、
「読みにくい」、「分かりやすい」があり、商品分野
「コンピュータ」に対応する評価表現には「速い」、
「重い」、「壊れやすい」、「うるさい」、「不安定」
があり、商品分野「食品」に対応する評価表現には「美
味い」、「不味い」、「しつこい」がある。
【0036】一方、「遊ぶ」、「動く」、「研究する」
といった物事に対する評価を示さない表現は、評価表現
ではない。また、評価表現の種類としては、「良い」、
「好き」、「美味い」といった人の感情や感情を示す表
現と、「速い」、「重い」といった人の物における性質
や特徴を示す表現とがある。評価表現の記憶形式は、各
評価表現の活用による表記の違いを吸収する単位で記憶
する方式が記憶容量節約の面で効果的であるが、この方
式に限定されるものではない。
【0037】意見候補抽出手段222において対象物と
評価表現とが一定の関係にある場合とは、例えば対象物
と評価表現とが一定の文字数またはバイト数にある場合
や、対象物と評価表現に構文的依存関係がある場合であ
る。
【0038】意見判定手段223において意見と認めら
れるかを判定する方法には、構文的適性判定手段223
aによる意見候補の構文的な意見らしさの判定する方法
と、客観的適性判定手段223bによる意見候補が客観
的であるかを判定する方法とがある。
【0039】構文的適性判定手段223aにおける意見
候補の構文的意見らしさは、図4に示すような意見が持
つ構文的特性を用いて判定する。図4において、意見の
構文的特性には、「(1)対象物名と評価表現とが同一
文内に存在する」、「(2)対象物名が評価表現の主部
に存在する」、「(3)評価表現が文の述部に存在す
る」、「(4)文の述部に不必要な文末表現が存在しな
い」がある。
【0040】尚、(4)の不必要な文末表現とは、例え
ば、『商品「M」は良いの?』のような疑問表現、『商
品「M」はもう少し軽いとよいのに』のような仮定表現
が考えられる。
【0041】構文的適正判定手段223aは上記のよう
な意見の構文的特性を、意見候補がどの程度満たすかを
数値にし、その数値が予め定めた閾値を超える場合に
は、構文的に意見らしいと判定する。数値にする方法と
しては、例えば、意見候補が全構文的特性数に対して満
たす構文的特性の数の割合とする方法が考えられる。ま
た、各構文的特性に重みを付与して、意見候補が満たす
構文的特性の重みの総和とする方法も考えられる。
【0042】客観的適性判定手段223bにおいて意見
候補が客観的であるとは、意見が第3者によって記述さ
れていることをいう。例えば、『商品「M」はお勧めで
す』が意見候補である場合を考えると、この意見候補は
構文的適正判定手段223aにおける4つの構文的特性
を全て満たすので、構文的に意見らしいと判定される。
しかしながら、この意見候補が『商品「M」』の開発者
または『商品「M」』の販売者によって記述されている
場合には、意見として信頼することができない。
【0043】客観的適正判定手段223bはこのような
第3者とは認められない記述者のリストを用意し、意見
候補の記述者がこのリストに一致もしくは部分一致を含
む場合には意見候補が客観的でないと判定し、そうでな
い場合には意見候補が客観的であると判定する。このリ
ストは文書がインタネット上の文書であればURL(U
niform Resource Locator)で
表すことができ、コンピュータの分野のURLリストの
例を図5に示す。
【0044】図5において、上記のリストには「So
社」のURLとして「soo.co.jp」、「Ib
社」のURLとして「ibb.co.jp」、「T社」
のURLとして「ttt.co.jp」、「N社」のU
RLとして「nnn.co.jp」、「A社」のURL
として「aaa.co.jp」、「Sh社」のURLと
して「shh.co.jp」、「C社」のURLとして
「ccc.co.jp」、「F社」のURLとして「f
ff.co.jp」、「Io社」のURLとして「io
o.co.jp」、「J社」のURLとして「jjj.
co.jp」」がそれぞれ掲載されている。
【0045】図6は本発明の第1の実施例による意見収
集分析装置の処理動作を示すフローチャートであり、図
7は図6の意見抽出の処理動作を示すフローチャートで
ある。これら図1〜図7を参照して本発明の第1の実施
例による意見収集分析装置の処理動作について説明す
る。尚、図6及び図7に示す処理はデータ処理装置2が
記録媒体24に格納されたプログラムを実行することで
実現される。
【0046】まず、利用者は意見収集分析装置に対し
て、対象物名集合入力手段11から対象物名の集合を、
対象物名選択手段12から分析対象の対象物名を選択す
る(図6ステップS1)。ここでは、対象物名集合入力
手段11で『商品「M」』、『商品「K」』、『商品
「S」』、『商品「R」』を入力し、対象物名選択手段
12で『商品「M」』を選択した場合について説明す
る。
【0047】次に、意見抽出手段22によって文書集合
記憶部21に記憶された文書集合に含まれる対象物名集
合入力手段11で入力された対象物名に関連する意見を
抽出する(図6ステップS2)。
【0048】この意見抽出処理は意見候補抽出手段22
2によって物事に対する評価を示す表現である評価表現
の集合が登録された評価表現記憶部221と、入力され
た対象物と評価表現記憶部221に記憶された評価表現
とが一定の関係にある場合には、対象物と評価表現とを
含む文字列または文章を意見候補として抽出する処理
(図7ステップS11)と、意見判定手段223によっ
て意見候補抽出手段222で抽出された意見候補の意見
らしさを判定する処理(図7ステップS12)とからな
る。
【0049】上記の意見抽出処理によって抽出した意見
の例を図8に示す。この例では、まず意見候補抽出手段
222における対象物名と評価表現との一定の関係を、
両者が80Byte以内という条件として意見候補を抽
出し、その後、意見判定手段223によって意見の構文
的適性、客観的適正を判定した結果である。
【0050】構文的特性については、上記の4つの特性
のうち3つ以上満たすことを条件としている。例えば、
図8の1行目は、対象物名商品「M」、評価表現名「い
い」で抽出された意見であり、4つの意見の構文的特性
も全て満たしている。
【0051】次に、意見収集分析装置は対象物比較分析
手段23によって意見抽出手段22で抽出した対象物名
集合入力手段11で入力された対象物名に関する意見
(全体の意見)に対する、その中で対象物名選択手段1
2で選択した対象物名に関する意見(部分の意見)の特
徴を分析し、その結果を出力手段13を介して出力する
(図6ステップS3)。
【0052】すなわち、対象物とこれに関する意見との
ペアの複数個を入力として、例えば、1)分類ルール、
2)相関ルール、3)ポジショニングマップ、4)典型
文リストの4つの比較分析結果のうちの1つを出力す
る。
【0053】1)の分類ルールとは、if−then−
else形式で意見と対象物の関係を表したものであ
る。例えば、図9に示すように、OS「D」→商品
「M」(70%)、モノクロ→商品「M」(70%)、
電子メール→商品「M」(100%)、ワープロ→商品
「M」(100%)、送信→商品「M」(90%)、そ
れ以外→商品「M」でない(78.9%)は『もしOS
「D」という単語が意見中に現れれば、その意見は商品
「M」に関するものであり、そうでなければ、もしモノ
クロという単語が意見中に現れれば、その意見は商品
「M」に関するものであり』と読む。
【0054】ここで、上記の場合には『OS「D」』、
「モノクロ」等が商品「M」という対象物に関する特徴
語である。これらの特徴語は、その上位の言葉が現れた
意見を全て全体から取り除いた意見の集合に出現した単
語の中から情報量尺度の高い順に選ばれる。
【0055】また、情報量尺度とは次のように計算す
る。例えば、意見の数がN個あって、対象物がAのもの
とA以外のものとがそれぞれN1個とN0個であったと
し、単語または単語の組合わせである「w」が現れる意
見の数がT、その中で対象物がAのものとA以外のもの
とがそれぞれT1個とT0個であったとし、単語「w」
が現れない意見の数がS、その中で対象物がAのものと
A以外のものとがそれぞれS1個とS0個であったとす
ると、T+S=N,T1+S1=N1,T0+S0=N
0の関係があり、「w」のもつ情報量尺度は、例えば、
「w」の出現を通じて分類する前に意見の集合がもって
いた情報量Iから「w」の出現を通じて分類した後の意
見の集合がもっていた情報量I(w)を引いた値とし
て、つまり、 ΔI(w)=I−I(w) ……(1) という式で計算される。
【0056】ここで、Iは例えば、文献「J.Riss
anen:Fisher Information a
nd Stochastic Complexity.
IEEE Trans.on Information
Theory,42(1),pp:40−47,19
96」で提案されている確率的コンプレキシテイ(st
ochastic complexity)という量を
用いて、 I=N・H(N1/N)+(1/2)log[N(π/2)] ……(2) という式で計算することができる。また、H(x)=
[(−x)log(x)]−[(1−x)log(1−
x)]であり、πは円周率、対数の底は2である。
【0057】同様に、I(w)は、 I(w)=T・H(T1/T)+(1/2)log [T(π/2)] +S・H(S1/S)+(1/2)log[S(π/2)] ……(3) という式で計算される。ΔI(w)が最も大きい値をも
つような「w」が選ばれる。
【0058】また、確率的コンプレキシティの代わり
に、例えば、文献「K.Yamanishi:A De
cision−theoretic Extensio
n of Stochastic Complexit
y and Its Applications to
Learning,IEEE Trans.on I
nformation Theory,44(4),p
p:1424−1439,1998」で提案されている
拡張型確率的コンプレキシティを用いて、 I=min{N1,N−N1}+B√NlogN ……(4) I(w)=min{T1,T−T1}+B√TlogT +min{S1,S−S1}+B√SlogS ……(5) という式で計算してから、情報量尺度を、 ΔI(w)=I−I(w) ……(6) という式で計算することもできる。
【0059】このような分類ルールを出力する対象物比
較分析手段23としては、図10に示すように、形態素
解析手段231と属性抽出手段232と情報量尺度計算
手段233とからなる。
【0060】形態素解析手段231は意見の文章を単語
に分解する。例えば、「形態素解析手段は意見の文章を
単語に分解する」は「形態素/解析/手段/は/意見/
の/文章/を/単語/に/分解する」と分解される。
【0061】属性抽出手段232は形態素解析によって
得られた各単語wについて(1)式の値を計算して、そ
の値が与えられたある閾値以上のものだけを選択する。
情報量尺度計算手段233は単語または単語の複数の組
合わせに対して、全体の意見集合を対象にして(1)式
の値を計算し、最大のものを選ぶ。
【0062】選ばれた単語を含む意見を全体から取り除
いて、残りの意見を対象として、単語または単語の複数
の組合わせに対して、(1)式の値を計算し、その値か
ら最大のものを選ぶ。以下、これを繰り返す。
【0063】2)の相関ルールは、if−then−o
r形式で意見と対象物の関係を表したものである。例え
ば、上記の分類ルールと同じ図は相関ルールとして読む
こともできる。その場合、『もしOS「D」という単語
が意見中に現れれば、その意見は商品「M」に関するも
のであり、または、もしモノクロという単語が意見中に
現れれば、その意見は商品「M」に関するものであり』
と読む。
【0064】ここで、上記の場合には『OS「D」』、
「モノクロ」等が商品「M」という対象物に関する特徴
語である。これら特徴語は全体の意見の集合に出現した
単語の中から(1)式の情報量尺度Δ(w)の大きい順
に選ばれる。
【0065】このような相関ルールを出力する対象物比
較分析手段23としては、図11に示すように、形態素
解析手段234と属性抽出手段235と情報量尺度計算
手段236とからなる。
【0066】形態素解析手段234は意見の文章を単語
に分解する。属性抽出手段235は形態素解析によって
得られた各単語「w」について(1)式の値を計算し、
その値が与えられたある閾値以上のものだけを選択す
る。
【0067】情報量尺度計算手段236は単語または単
語の複数の組合わせに対して、全体の意見集合を対象に
して(1)式の値を計算し、その値を最大のものから順
に並べていく。
【0068】3)のポジショニングマップは、複数の対
象物と、それらに関する特徴語とを2次元のマップ図に
配置したものである。例えば、図12は商品「M」、商
品「K」、商品「S」、商品「R」といった複数の対象
物と、2)の相関ルール等で計算された、それらの特徴
語とからなるポジショニングマップを表している。具体
的には、図12に示す×印はそれぞれ、商品「M」、商
品「K」、商品「S」、商品「R」の軸上での位置を示
し、商品「M」に対する特徴語として「パス」・「突き
止める」・「送信」が、商品「K」に対する特徴語とし
て「デビュー」・「FIVA」・「MD」・「意外」・
「残念」が、商品「S」に対する特徴語として『商品
「J」』・『商品「C」』・「メモリカード」が、商品
「R」に対する特徴語として「フロッピー(R)」・
「熱」・『CPU「P」』が軸上のそれぞれの位置関係
で存在することを示している。
【0069】このようなポジショニングマップは、ひと
たび対象物とそれらの特徴語が得られたら、文献「J.
P.Benzecri:Correspondence
Analysis Handbook,Mercel
Dekker,1992」にも記載されているような
標準的なコレスポンデンス分析の方法にしたがって作成
される。
【0070】すなわち、分析対象となる対象物全体にわ
たって特徴語の頻度を並べたマトリックスに適当な対称
化をほどこして得られたマトリックスから、最大固有値
に対応する固有ベクトルと、二番目に大きい固有値に対
応する固有ベクトルとを算出し、これらの第一成分、第
二成分を縦軸、横軸としてプロットして得られる。
【0071】このようなポジショニングマップを出力す
る対象物比較分析手段23としては、図13に示すよう
に、形態素解析手段237と属性抽出手段238と情報
量尺度計算手段239と対応分析手段240とからな
る。
【0072】形態素解析手段237は意見の文章を単語
に分解する。属性抽出手段238は形態素解析によって
得られた各単語「w」について(1)式の値を計算し、
その値が与えられたある閾値以上のものだけを選択す
る。
【0073】情報量尺度計算手段239は単語または単
語の複数の組合わせに対して、全体の意見集合を対象に
して(1)式の値を計算し、その値を最大のものから順
に与えられた数だけ、あるいは与えられた閾値以上の情
報量尺度をもつ単語を抽出する。
【0074】対応分析手段240は抽出された単語と分
析対象との対応マトリックスを作り、その要素は各単語
の出現頻度であるとし、この行列の第一固有ベクトル及
び第二固有ベクトルの第一成分及び第二成分を求めてプ
ロットすることによってポジショニングマップを作成す
る。
【0075】4)の典型文リストは各対象物に対して、
各意見の代表度(対象物の意見として典型的である度合
い)を計算し、その値を代表度の大きい降順にソートし
たものである。
【0076】商品「M」を対象物とする場合について
は、例えば、 1.商品「M」は使いにくい、遅い 2.商品「M」は大きくなってしまった、小さいほうが
よい 3.この商品「M」、気に入った、マーベラスである 4.この商品「M」の弱点は暗いことだ の順に並ぶ。
【0077】文章Bの対象物cにおける代表度合いは、
例えば、文章B=w1,....,wMのように、単語
の列として見なすと、ベイズの事後確率は、 p(c|B)=p(c)(Πjp(wj|c)) /(Σc p(c)(Πjp(wj|c))) ……(7) という式で与えられる。
【0078】ここで、p(c)は対象物cの出現確率で
あり、データから、 p(c)=(Nc+1/2)/(N+J/2) ……(8) という式で計算される。ここで、Jは対象物の総数、N
は意見の総数、Ncはその中で対象物cの出現数であ
る。
【0079】また、p(wj|c)は単語wjが出現す
る確率であり、これはラプラス型の推定量、 p(wj|c)=(Kj+1/2)/(K+J/2) ……(9) という式で計算される。ここで、Jは単語総数、Kは意
見データに現れた全ての単語の総数であり、重複を含め
て計算している。Kjはその中の単語wjの出現数であ
る。
【0080】このような典型文リストを出力する対象物
比較分析手段23としては、図14に示すように、形態
素解析手段241と属性抽出手段242と代表度計算手
段243とソート手段244とからなる。
【0081】形態素解析手段241は意見の文章を単語
に分解する。属性抽出手段242は形態素解析によって
得られた各単語wについて(1)式の値を計算し、その
値が与えられたある閾値以上のものだけを選択する。
【0082】代表度計算手段243は上記の形態素解析
手段241で選ばれた単語全体に対して、各意見文章B
について(7)式の値を計算する。ソート手段244は
それらの意見文章を(7)式の値にしたがって降順ある
いは昇順にソートした結果を出力する。
【0083】図15は本発明の第2の実施例による意見
収集分析装置の構成を示すブロック図である。図15に
おいて、本発明の第2の実施例による意見収集分析装置
は、入出力装置3に対象物名集合入力手段11の代わり
として利用者が一つ以上の対象物名を入力する対象物名
入力手段31を設け、データ処理装置4に対象物名入力
手段31で入力された対象物名を基にそれに関連する対
象物名を展開する対象物名拡張手段41を設けた以外は
本発明の第1の実施例による意見収集分析装置と同様の
構成となっており、同一構成要素には同一符号を付して
ある。また、同一構成要素の動作は本発明の第1の実施
例と同様である。
【0084】対象物名拡張手段41は予め類似する対象
物名同士をグループとして登録した辞書を用いて対象物
名入力手段12で入力された対象物名を自動的に拡張す
る。例えば、『商品「M」』、『商品「K」』、『商品
「S」』、『商品「R」』をグループとして登録し、対
象物名入力手段12で『商品「M」』と入力された時
に、『商品「K」』、『商品「S」』、『商品「R」』
を拡張する。
【0085】尚、本発明の第2の実施例でも、データ処
理装置4は主にコンピュータから構成され、記録媒体4
2に格納されたプログラムをデータ処理装置4が実行す
ることで装置内の各手段が実現される。また、データ処
理装置4の各手段はハードウェアで構成可能である。
【0086】図16は本発明の第3の実施例による意見
収集分析装置の構成を示すブロック図である。図16に
おいて、本発明の第3の実施例による意見収集分析装置
は入出力装置5と、データ処理装置6とから構成されて
いる。
【0087】入出力装置5は利用者が一つ以上の対象物
名を入力する対象物名入力手段31と、利用者が分析条
件を入力する分析条件入力手段51と、比較分析手段6
2の分析結果を出力する出力手段13とから構成されて
いる。
【0088】また、データ処理装置6は主にコンピュー
タから構成され、文書集合を記憶する文書集合記憶部2
1と、文書集合記憶部21に記憶された文書集合に含ま
れかつ対象物名入力手段31から入力された対象物名に
関連する意見を抽出する意見抽出手段22と、意見抽出
手段22で抽出された意見に様々なカテゴリを設定する
カテゴリ設定手段61と、意見抽出手段22で抽出され
かつ対象物名入力手段31で入力された対象物名に関す
る意見(全体の意見)に対する、その中で分析条件入力
手段51で指定された条件を満たす意見(部分の意見)
の特徴を分析する比較分析手段62と、データ処理装置
6の各手段を実現するためのプログラムを格納する記録
媒体63とを備えている。尚、データ処理装置6の各手
段はハードウェアで構成可能である。
【0089】カテゴリ設定手段61におけるカテゴリに
は、(a)対象物の機能のカテゴリ、(b)対象物の機
種のカテゴリ、(c)意見の評価のカテゴリ、(d)意
見の評価表現のカテゴリ、(e)意見の記述時刻のカテ
ゴリ、(f)意見の記載場所のカテゴリがある。カテゴ
リを設定するとは、それぞれのカテゴリにラベルを付与
することを意味する。
【0090】分析条件入力手段51における分析条件
は、カテゴリとその意見のラベルとを指定することによ
って記述する。カテゴリとしては、カテゴリ設定手段6
1で設定される(a)〜(f)のカテゴリに加え、対象
物名入力手段31で入力された対象物名も(g)対象物
名のカテゴリとして扱う。例えば、分析条件として『対
象物名=商品「M」&意見の評価=肯定』というように
指定する。これは「対象物名のカテゴリ」のラベルが
『商品「M」』でかつ「意見の評価のカテゴリ」のラベ
ルが「肯定」である意見を分析対象とすることを意味す
る。
【0091】比較分析手段62における特徴は、ルール
形式の知識として表現する。例えば、特開2001−2
66060号公報に記載された「アンケート回答分析シ
ステム」におけるテキスト分類エンジンを用いると、全
体の意見に対する部分の意見の特徴をif−then−
else型のルールによって学習することができる。
【0092】図17は本発明の第3の実施例による意見
収集分析装置の処理動作を示すフローチャートであり、
図18は図17のカテゴリ生成の処理動作を示すフロー
チャートである。これら図16〜図18を参照して本発
明の第3の実施例による意見収集分析装置の処理動作に
ついて説明する。尚、図17及び図18に示す処理はデ
ータ処理装置6が記録媒体63に格納されたプログラム
を実行することで実現される。
【0093】まず、利用者が対象物名入力手段31によ
って一つ以上の対象物名を入力すると(図17ステップ
S21)、意見抽出手段22は文書集合記憶部21に記
憶された文書集合に含まれかつ対象物名入力手段31で
入力された対象物名に関連する意見を抽出する(図17
ステップS22)。
【0094】次に、カテゴリ設定手段61は意見抽出手
段22で抽出された意見に様々なカテゴリを設定する
(図17ステップS23)。さらに、利用者は分析条件
指定手段51によって分析条件を入力すると(図17ス
テップS24)、比較分析手段61は意見抽出手段22
で抽出されかつ対象物名入力手段31で入力された対象
物名に関する意見(全体の意見)に対する、その中で分
析条件指定手段51で指定された条件を満たす意見(部
分の意見)の特徴を分析する(図17ステップS2
5)。
【0095】尚、上記のカテゴリ設定処理の具体的な動
作としては、本発明の第1の実施例による意見収集分析
装置のステップS3の動作において、「対象物」を「カ
テゴリ」と読み替えた場合の動作と同様である。
【0096】カテゴリ設定手段61の動作は、まず用意
された一つ以上のカテゴリの内の1つを選択する(図1
8ステップS31)。用意されたカテゴリとしては、
(a)対象物の機能のカテゴリ、(b)対象物の機種の
カテゴリ、(c)意見の評価のカテゴリ、(d)意見の
評価表現のカテゴリ、(e)意見の記述時刻のカテゴ
リ、(f)意見の記載場所のカテゴリがある。
【0097】(a)対象物の機能のカテゴリは、意見を
対象物の機能という視点から分類する。対象物の機能と
は、例えば対象物が携帯電話であれば「電話機能」、
「充電機能」、「メール機能」、「カレンダ機能」、
「電話帳機能」、「スケジュール管理機能」等が考えら
れる。
【0098】(b)対象物の機種のカテゴリは、意見を
対象物の機種という視点から分類する。対象物の機種と
は、例えば商品名『商品「M」』が『商品「MII−55
0」』『商品「M−K1」』、企業名「N」が「Nソフ
トウェア」、「Nシステム建設」というように、入力さ
れた対象物名を含む下位の対象物名のことである。
【0099】(c)意見の評価のカテゴリは、意見をそ
の評価という視点から分類する。意見の評価は意見の記
述者がその対象物を肯定的に捉えているか、否定的に捉
えているかを示すものである。したがって、「肯定」ま
たは「否定」という2つの値、あるいはそれらの度合い
といった形式で表すことができる。
【0100】(d)意見の評価表現のカテゴリは、意見
をその評価表現という視点から分類する。意見の評価表
現とは、意見抽出手段22で用いた評価表現記憶部22
1に記憶される評価表現である。
【0101】(e)意見の記述時刻のカテゴリは、意見
をその記述時刻という視点から分類する。意見の記述時
間とは、意見の記述者がその意見をいつ記述したかを示
すものである。
【0102】(f)意見の記載場所のカテゴリは、意見
をその記載場所という視点から分類する。意見の記載場
所とは、意見の記述者がその意見をどのような場所で記
述したかを示すものである。
【0103】次に、カテゴリ設定手段61は選択したカ
テゴリに対する意見のラベルを付与する(図18ステッ
プS32)。意見のラベルを付与する方法は、選択した
カテゴリによって異なる。
【0104】(a)対象物の機能のカテゴリの場合、意
見のラベルを付与する方法としては、例えば機能を示す
表現のリストを用意し、意見抽出部22で抽出した意見
の中にその表現が含まれる場合には、その表現を意見の
ラベルとして付与する方法がありうる。機能を示す表現
としては、例えば対象物が携帯電話ならば「電話」、
「充電」、「メール」、「カレンダ」、「電話帳」、
「スケジュール管理」等が考えられる。
【0105】また、意見のラベルを付与する方法とし
て、例えば上記の機能を示す表現を共起語を用いて自動
的に収集する方法もありうる。共起語とは、例えば「機
能」である。つまり、機能を示す表現は「○○機能」の
ように、共起語の前方に隣接する名詞やサ変名詞の連続
として規則的に表現されることを利用して自動収集す
る。
【0106】(b)対象物の機種のカテゴリの場合、意
見のラベルを付与する方法としては、例えば対象物名と
機種名とを対応させたテーブルを用意する方法がある。
この場合、対象物名入力手段31で入力された対象物名
をキーとしてこのテーブルから機種名を展開し、次に、
意見抽出部21で抽出された意見にこの機種名が含まれ
る場合には、その機種名を分類ラベルとして付与する。
【0107】対象物名と機種名との対応としては、例え
ば、「N社」→「Nソフト」・「Nシステム建設」、
『商品「M」』→『商品「MII−R550」』・『商品
「M−K1」』が該当する。
【0108】(c)意見の評価のカテゴリの場合、意見
のラベルを付与する方法としては、例えば評価表現とそ
の基本評価とを対応させたテーブル(基本評価テーブ
ル)と、否定表現のリスト(否定表現リスト)とを用い
る方法がある。
【0109】この場合、まず、意見抽出部22で抽出さ
れた意見に含まれる評価表現から基本評価テーブルを用
いて意見の基本評価を求める。次に、意見に含まれる評
価表現の近傍に否定表現テーブルに含まれる否定表現が
含まれる場合には、その基本評価を反転させた評価を意
見のラベルとして付与する。逆に、否定表現が含まれな
い場合には、その基本評価を意見のラベルとして付与す
る。
【0110】ここで、基本評価テーブルにおける評価表
現とその基本評価との対応として「良い」→「肯定」、
「悪い」→「否定」、「速い」→「肯定」、「重い」→
「否定」が該当する。また、否定表現としては、「な
い」、「なかった」、「ません」のように文法によって
述語を否定する文法的否定表現と、「不」、「疑問であ
る」、「言いかねる」のように語彙によって述語を否定
する語彙的否定表現とがあり、それらを登録する。
【0111】(d)意見の評価表現のカテゴリの場合、
意見のラベルを付与する方法としては、例えば意見抽出
手段22で抽出した意見に含まれる評価表現を分類ラベ
ルとして付与する方法がある。
【0112】(e)意見の記述時間に基づくカテゴリの
場合、意見のラベルを付与する方法としては、例えば文
書がインタネット上の文書であれば、意見抽出手段22
で抽出した意見を含む文書の更新時刻を意見のラベルと
して付与する方法がある。
【0113】(f)意見の記載場所に基づくカテゴリの
場合、意見のラベルを付与する方法としては、例えば文
書がインタネット上の文書であれば、意見抽出手段22
で抽出した意見を含む文書のURLを意見のラベルとし
て付与する方法がある。
【0114】また、意見のラベルを付与する方法として
は、例えば文書がインタネット上の文書であれば、意見
抽出手段22で抽出した意見を含む文書のURLのドメ
インを意見のラベルとして付与する方法がある。
【0115】最後に、もし、まだ選択していないカテゴ
リがある場合には、ステップS31に戻り、すべてのカ
テゴリを選択している場合には処理を終了する(図18
ステップS33)。
【0116】このように、文書集合から複数の対象物名
の意見を抽出することによって、抽出した意見全体に対
する、その中で利用者が選択した対象物に関する意見の
特徴を分析し、その結果を依頼者に提示することができ
る。
【0117】また、文書集合から抽出した意見候補の意
見らしさを構文的適性もしくは客観的適性といった方法
によって判定することによって、正確な意見抽出を実現
し、それによって抽出した意見の高精度の分析結果を依
頼者に提示することができる。
【0118】さらに、文書集合から抽出した意見に様々
なカテゴリを自動的に設定することによって、抽出した
意見全体に対する、その中で利用者が選択したカテゴリ
に関する意見の特徴を分析し、その結果を依頼者に提示
することができる。
【0119】
【発明の効果】以上説明したように本発明の意見収集分
析装置は、複数の対象物名を入力し、その入力された対
象物名集合のうちの分析対象の対象物名を選択し、文書
集合を記憶する文書集合記憶手段に記憶された文書集合
に含まれかつ入力された対象物名に関連する意見を抽出
し、この抽出した意見の中で選択された対象物名に関す
る意見の特徴を分析することによって、抽出した意見全
体の中で利用者が選択した対象物に関する意見の特徴を
分析した結果を依頼者に提示することができるという効
果が得られる。
【0120】本発明の他の意見収集分析装置は、一つ以
上の対象物名を入力し、その入力された対象物名集合の
うちの分析対象の対象物名を選択し、入力された対象物
名を基にそれに関連する対象物名を展開し、文書集合を
記憶する文書集合記憶手段に記憶された文書集合に含ま
れかつ入力された対象物名及び拡張された対象物名に関
連する意見を抽出し、この抽出された意見の中で選択し
た対象物名に関する意見の特徴を分析することによっ
て、正確な意見抽出を実現することができ、その抽出し
た意見の高精度の分析結果を依頼者に提示することがで
きるという効果が得られる。
【0121】本発明の別の意見収集分析装置は、一つ以
上の対象物名を入力し、分析条件を入力し、文書集合を
記憶する文書集合記憶手段に記憶された文書集合に含ま
れかつ入力された対象物名に関連する意見を抽出し、こ
の抽出された意見に様々なカテゴリを設定し、抽出され
た意見の中で分析条件を満たす意見の特徴を分析するこ
とによって、抽出した意見全体の中で利用者が選択した
カテゴリに関する意見の特徴を分析した結果を依頼者に
提示することができるという効果が得られる。
【図面の簡単な説明】
【図1】本発明の第1の実施例による意見収集分析装置
の構成を示すブロック図である。
【図2】図1の意見抽出手段の構成例を示すブロック図
である。
【図3】図2の評価表現辞書記憶部の内容例を示す図で
ある。
【図4】図2の構文的適性判定手段における構文的特性
の例を示す図である。
【図5】図2の客観的適性判定手段におけるURLリス
トの例を示す図である。
【図6】本発明の第1の実施例による意見収集分析装置
の処理動作を示すフローチャートである。
【図7】図6の意見抽出の処理動作を示すフローチャー
トである。
【図8】図1の意見抽出手段の出力例を示す図である。
【図9】図1の対象物比較分析手段の分類ルールによる
出力例を示す図である。
【図10】図1の対象物比較分析手段の分類ルールによ
る構成例を示すブロック図である。
【図11】図1の対象物比較分析手段の相関ルールによ
る構成例を示すブロック図である。
【図12】図1の対象物比較分析手段のポジショニング
マップによる出力例を示す図である。
【図13】図1の対象物比較分析手段のポジショニング
マップによる構成例を示すブロック図である。
【図14】図1の対象物比較分析手段の典型文リストに
よる構成例を示すブロック図である。
【図15】本発明の第2の実施例による意見収集分析装
置の構成を示すブロック図である。
【図16】本発明の第3の実施例による意見収集分析装
置の構成を示すブロック図である。
【図17】本発明の第3の実施例による意見収集分析装
置の処理動作を示すフローチャートである。
【図18】図17のカテゴリ生成の処理動作を示すフロ
ーチャートである。
【符号の説明】
1,3,5 入出力装置 2,4,6 データ処理装置 11 対象物名集合入力手段 12 対象物名選択手段 13 出力手段 21 文書集合記憶部 22 意見抽出手段 23 対象物比較分析手段 24,42,63 記録媒体 31 対象物名入力手段 41 対象物名拡張手段 51 分析条件入力手段 61 カテゴリ設定手段 62 比較分析手段 221 評価表現記憶部 222 意見候補抽出手段 223 意見判定手段 223a 構文的適性判定手段 223b 客観的適性判定手段 231,234,237, 241 形態素解析手段 232,235,238, 242 属性選択手段 233,236,239 情報量尺度計算手段 240 対応分析手段 243 代表度分析手段 244 ソート手段
フロントページの続き (72)発明者 森永 聡 東京都港区芝五丁目7番1号 日本電気株 式会社内 (72)発明者 福島 俊一 東京都港区芝五丁目7番1号 日本電気株 式会社内 (72)発明者 石黒 義英 東京都港区芝五丁目7番1号 日本電気株 式会社内

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 複数の対象物名を入力するための対象物
    名集合入力手段と、 前記対象物名集合入力手段から入力された対象物名集合
    のうちの分析対象の対象物名を選択する対象物名選択手
    段と、 文書集合を記憶する文書集合記憶手段と、 前記文書集合記憶手段に記憶された文書集合に含まれか
    つ前記対象物名集合入力手段から入力された対象物名に
    関連する意見を抽出する意見抽出手段と、 前記意見抽出手段で抽出した意見の中で前記対象物名選
    択手段で選択された対象物名に関する意見の特徴を分析
    する対象物比較分析手段とを有することを特徴とする意
    見収集分析装置。
  2. 【請求項2】 一つ以上の対象物名を入力するための対
    象物名入力手段と、 前記対象物名入力手段から入力された対象物名集合のう
    ちの分析対象の対象物名を選択する対象物名選択手段
    と、 前記対象物名入力手段から入力された対象物名を基にそ
    れに関連する対象物名を展開する対象物名拡張手段と、 文書集合を記憶する文書集合記憶手段と、 前記文書集合記憶手段に記憶された文書集合に含まれか
    つ前記対象物名集合入力手段から入力された対象物名及
    び前記対象物名拡張手段で拡張された対象物名に関連す
    る意見を抽出する意見抽出手段と、 前記意見抽出手段で抽出された意見の中で前記対象物名
    選択手段で選択した対象物名に関する意見の特徴を分析
    する対象物比較分析手段とを有することを特徴とする意
    見収集分析装置。
  3. 【請求項3】 一つ以上の対象物名を入力するための対
    象物名入力手段と、 分析条件を入力する分析条件入力手段と、 文書集合を記憶する文書集合記憶手段と、 前記文書集合記憶手段に記憶された文書集合に含まれか
    つ前記対象物名入力手段から入力された対象物名に関連
    する意見を抽出する意見抽出手段と、 前記意見抽出手段で抽出された意見に様々なカテゴリを
    設定するカテゴリ設定手段と、 前記意見抽出手段で抽出された意見の中で前記分析条件
    入力手段から指定された条件を満たす意見の特徴を分析
    する比較分析手段とを有することを特徴とする意見収集
    分析装置。
  4. 【請求項4】 物事に対する評価を示す表現である評価
    表現の集合が登録された評価表現記憶手段と、入力され
    た対象物と前記評価表現記憶手段に記憶された評価表現
    とが一定の関係にある場合に前記対象物と前記評価表現
    とを含む文字列及び文章のいずれかを意見候補として抽
    出する意見候補抽出手段と、前記意見候補抽出手段で抽
    出された意見候補の意見らしさを判定する意見判定手段
    とを前記意見抽出手段に含むことを特徴とする請求項1
    から請求項3のいずれか記載の意見収集分析装置。
  5. 【請求項5】 前記意見候補の構文的な意見らしさを
    「対象物名と評価表現が同一文内にある」、「対象物が
    評価表現の主部にある」、「評価表現が文の述部に存在
    する」、「文の述部に不必要な文末表現が存在しない」
    という構文的特性のいずれか一つ以上を用いて判定する
    構文的適性判定手段と、 前記意見候補が客観的であるかを判定する客観的適性判
    定手段とのうちの少なくとも一方を前記意見判定手段に
    含むことを特徴とする請求項4記載の意見収集分析装
    置。
  6. 【請求項6】 前記カテゴリ設定手段は、対象物の機能
    のカテゴリ、対象物の機種のカテゴリ、意見の評価のカ
    テゴリ、意見の評価表現のカテゴリ、意見の記述時刻の
    カテゴリ、意見の記載場所のカテゴリのうちの少なくと
    も一つ以上を用いて前記カテゴリを設定することを特徴
    とする請求項3記載の意見収集分析装置。
  7. 【請求項7】 前記対象物比較分析手段は、その分析結
    果を、if−then−else型のルールで意見を対
    象物に分類する分類ルールとしての表現、if−the
    n−or型のルールで意見を対象物に対応させる相関ル
    ールとしての表現、対象物とその特徴語とをポジショニ
    ングマップでの表現、意見を対象物に関して典型的な順
    に並べたリストでの表現のうちのいずれかで出力するこ
    とを特徴とする請求項1または請求項2記載の意見収集
    分析装置。
  8. 【請求項8】 前記比較分析手段は、その分析結果を、
    if−then−else型のルールで意見をカテゴリ
    に分類する分類ルールとしての表現、if−then−
    or型のルールで意見をカテゴリに対応させる相関ルー
    ルとしての表現、カテゴリとその特徴語とをポジショニ
    ングマップでの表現、意見をカテゴリに関して典型的な
    順に並べたリストでの表現のうちのいずれかで出力する
    ことを特徴とする請求項3記載の意見収集分析装置。
  9. 【請求項9】 複数の対象物名を入力するステップと、
    その入力された対象物名集合のうちの分析対象の対象物
    名を選択するステップと、文書集合を記憶する文書集合
    記憶手段に記憶された文書集合に含まれかつ前記入力さ
    れた対象物名に関連する意見を抽出するステップと、こ
    の抽出した意見の中で前記選択された対象物名に関する
    意見の特徴を分析するステップとを有することを特徴と
    する意見収集分析方法。
  10. 【請求項10】 一つ以上の対象物名を入力するステッ
    プと、その入力された対象物名集合のうちの分析対象の
    対象物名を選択するステップと、前記入力された対象物
    名を基にそれに関連する対象物名を展開するステップ
    と、文書集合を記憶する文書集合記憶手段に記憶された
    文書集合に含まれかつ前記入力された対象物名及び前記
    拡張された対象物名に関連する意見を抽出するステップ
    と、この抽出された意見の中で前記選択した対象物名に
    関する意見の特徴を分析するステップとを有することを
    特徴とする意見収集分析方法。
  11. 【請求項11】 一つ以上の対象物名を入力するステッ
    プと、分析条件を入力するステップと、文書集合を記憶
    する文書集合記憶手段に記憶された文書集合に含まれか
    つ前記入力された対象物名に関連する意見を抽出するス
    テップと、この抽出された意見に様々なカテゴリを設定
    するステップと、前記抽出された意見の中で前記分析条
    件を満たす意見の特徴を分析するステップとを有するこ
    とを特徴とする意見収集分析方法。
  12. 【請求項12】 前記意見を抽出するステップは、物事
    に対する評価を示す表現である評価表現の集合が登録さ
    れた評価表現記憶手段に記憶された評価表現と入力され
    た対象物とが一定の関係にある場合に前記対象物と前記
    評価表現とを含む文字列及び文章のいずれかを意見候補
    として抽出するステップと、その抽出された意見候補の
    意見らしさを判定するステップとを含むことを特徴とす
    る請求項9から請求項11のいずれか記載の意見収集分
    析方法。
  13. 【請求項13】 前記意見候補の構文的な意見らしさを
    「対象物名と評価表現が同一文内にある」、「対象物が
    評価表現の主部にある」、「評価表現が文の述部に存在
    する」、「文の述部に不必要な文末表現が存在しない」
    という構文的特性のいずれか一つ以上を用いて判定する
    ステップと、前記意見候補が客観的であるかを判定する
    ステップとのうちの少なくとも一方を前記意見らしさを
    判定するステップに含むことを特徴とする請求項12記
    載の意見収集分析方法。
  14. 【請求項14】 前記カテゴリを設定するステップは、
    対象物の機能のカテゴリ、対象物の機種のカテゴリ、意
    見の評価のカテゴリ、意見の評価表現のカテゴリ、意見
    の記述時刻のカテゴリ、意見の記載場所のカテゴリのう
    ちの少なくとも一つ以上を用いて前記カテゴリを設定す
    ることを特徴とする請求項11記載の意見収集分析方
    法。
  15. 【請求項15】 前記意見の特徴を分析するステップ
    は、その分析結果を、if−then−else型のル
    ールで意見を対象物に分類する分類ルールとしての表
    現、if−then−or型のルールで意見を対象物に
    対応させる相関ルールとしての表現、対象物とその特徴
    語とをポジショニングマップでの表現、意見を対象物に
    関して典型的な順に並べたリストでの表現のうちのいず
    れかで出力することを特徴とする請求項9または請求項
    10記載の意見収集分析方法。
  16. 【請求項16】 前記分析条件を満たす意見の特徴を分
    析するステップは、その分析結果を、if−then−
    else型のルールで意見をカテゴリに分類する分類ル
    ールとしての表現、if−then−or型のルールで
    意見をカテゴリに対応させる相関ルールとしての表現、
    カテゴリとその特徴語とをポジショニングマップでの表
    現、意見をカテゴリに関して典型的な順に並べたリスト
    での表現のうちのいずれかで出力することを特徴とする
    請求項11記載の意見収集分析方法。
  17. 【請求項17】 コンピュータに、複数の対象物名を入
    力する処理と、その入力された対象物名集合のうちの分
    析対象の対象物名を選択する処理と、文書集合を記憶す
    る文書集合記憶手段に記憶された文書集合に含まれかつ
    前記入力された対象物名に関連する意見を抽出する処理
    と、この抽出した意見の中で前記選択された対象物名に
    関する意見の特徴を分析する処理とを実行させるための
    プログラム。
  18. 【請求項18】 コンピュータに、一つ以上の対象物名
    を入力する処理と、その入力された対象物名集合のうち
    の分析対象の対象物名を選択する処理と、前記入力され
    た対象物名を基にそれに関連する対象物名を展開する処
    理と、文書集合を記憶する文書集合記憶手段に記憶され
    た文書集合に含まれかつ前記入力された対象物名及び前
    記拡張された対象物名に関連する意見を抽出する処理
    と、この抽出された意見の中で前記選択した対象物名に
    関する意見の特徴を分析する処理とを実行させるための
    プログラム。
  19. 【請求項19】 コンピュータに、一つ以上の対象物名
    を入力する処理と、分析条件を入力する処理と、文書集
    合を記憶する文書集合記憶手段に記憶された文書集合に
    含まれかつ前記入力された対象物名に関連する意見を抽
    出する処理と、この抽出された意見に様々なカテゴリを
    設定する処理と、前記抽出された意見の中で前記分析条
    件を満たす意見の特徴を分析する処理とを実行させるた
    めのプログラム。
JP2002001873A 2002-01-09 2002-01-09 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム Expired - Lifetime JP4410970B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002001873A JP4410970B2 (ja) 2002-01-09 2002-01-09 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002001873A JP4410970B2 (ja) 2002-01-09 2002-01-09 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2006206235A Division JP4539616B2 (ja) 2006-07-28 2006-07-28 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム

Publications (2)

Publication Number Publication Date
JP2003203136A true JP2003203136A (ja) 2003-07-18
JP4410970B2 JP4410970B2 (ja) 2010-02-10

Family

ID=27641883

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002001873A Expired - Lifetime JP4410970B2 (ja) 2002-01-09 2002-01-09 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム

Country Status (1)

Country Link
JP (1) JP4410970B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007018285A (ja) * 2005-07-07 2007-01-25 Cac:Kk 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム
US7546310B2 (en) 2004-11-19 2009-06-09 International Business Machines Corporation Expression detecting system, an expression detecting method and a program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7546310B2 (en) 2004-11-19 2009-06-09 International Business Machines Corporation Expression detecting system, an expression detecting method and a program
JP2007018285A (ja) * 2005-07-07 2007-01-25 Cac:Kk 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム

Also Published As

Publication number Publication date
JP4410970B2 (ja) 2010-02-10

Similar Documents

Publication Publication Date Title
JP4464975B2 (ja) コンピュータネットワーク上の電子文書の重要度を、当該電子文書に関係付けられた他の電子文書の当該電子文書に対する批評に基づいて、計算するためのコンピュータ装置、コンピュータプログラム及び方法
CN109844742B (zh) 分析系统
Thorleuchter et al. Web mining based extraction of problem solution ideas
JP4904496B2 (ja) 文書類似性導出装置及びそれを用いた回答支援システム
US20040236566A1 (en) System and method for identifying special word usage in a document
WO2009096523A1 (ja) 情報分析装置、検索システム、情報分析方法及び情報分析用プログラム
Wang et al. Customer-driven product design selection using web based user-generated content
JP4347226B2 (ja) 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
JP5391632B2 (ja) ワードと文書の深さの決定
WO2012096388A1 (ja) 意外性判定システム、意外性判定方法およびプログラム
JP4539616B2 (ja) 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム
Krishnan et al. Machine learning based sentiment analysis of coronavirus disease related twitter data
JP2008146293A (ja) 閲覧対象情報の評価システム、方法、およびプログラム
JP5138621B2 (ja) 情報処理装置及び不満解決商品発見方法及びプログラム
Nazemi et al. Comparison of full-text articles and abstracts for visual trend analytics through natural language processing
JP5197491B2 (ja) 行動推薦装置及び方法及びプログラム
JP2003203136A (ja) 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム
JP2005092443A (ja) クラスター分析装置およびクラスター分析方法
Kurashima et al. Ranking entities using comparative relations
JP2004246491A (ja) テキストマイニング装置及びテキストマイニングプログラム
JP2003006221A (ja) 予測分析型検索システム、予測分析型検索方法およびコンピュータプログラム
JP5614687B2 (ja) 時系列情報とテキスト情報とを含む時系列的テキストデータを解析する情報解析装置
JP2007241635A (ja) 文書検索装置、情報処理装置、検索結果出力方法、検索結果表示方法およびプログラム
JP2002215642A (ja) フィードバック型インターネット検索方法及びその方法を実施するためのシステムとプログラム記録媒体
Wambsganss et al. Using Deep Learning for Extracting User-Generated Knowledge from Web Communities.

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051226

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060530

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060728

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060803

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20060922

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070117

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080604

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20090508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090917

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091116

R150 Certificate of patent or registration of utility model

Ref document number: 4410970

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121120

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121120

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131120

Year of fee payment: 4

EXPY Cancellation because of completion of term