JP4269698B2 - 意見分析方法、意見分析装置、および意見分析プログラム - Google Patents
意見分析方法、意見分析装置、および意見分析プログラム Download PDFInfo
- Publication number
- JP4269698B2 JP4269698B2 JP2003015277A JP2003015277A JP4269698B2 JP 4269698 B2 JP4269698 B2 JP 4269698B2 JP 2003015277 A JP2003015277 A JP 2003015277A JP 2003015277 A JP2003015277 A JP 2003015277A JP 4269698 B2 JP4269698 B2 JP 4269698B2
- Authority
- JP
- Japan
- Prior art keywords
- opinion
- description
- sentence
- analysis
- strength
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004458 analytical method Methods 0.000 title claims description 75
- 238000004364 calculation method Methods 0.000 claims description 35
- 238000000605 extraction Methods 0.000 claims description 14
- 230000014509 gene expression Effects 0.000 claims description 12
- 238000009826 distribution Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 3
- 238000000034 method Methods 0.000 description 36
- 238000012545 processing Methods 0.000 description 20
- 238000007796 conventional method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
【発明の属する技術分野】
本発明は、アンケート回答分析に関し、特に自由記述回答を含む複数のアンケート回答文から、回答者の持つ意見や要望などの全体的な傾向の分析結果を提示する技術に関する。
【0002】
【従来の技術】
インターネットを利用した電子メールや、Webページなどを介して収集される自然言語による自由記述を含むアンケート回答文を分析して、回答者の持つ意見や要望の全体的な特徴や傾向を得るためには、従来は人手によってアンケートの自由記述回答文を分析し、その結果を提示するようにしたものが一般的であった。ところが、膨大なアンケートの自由記述回答文を人手によって解析することは多大な労力やコストを必要とするため、例えば、アンケートの自由記述回答文に対して、テキスト分類エンジンを利用して多数派の意見をルール形式で自動で提示するという技術(例えば、特許文献1参照。)や、アンケートの自由記述回答文を解析してキーワードおよびその係り受け関係を抽出することによって、各回答文がある評価対象について肯定的評価を与えているか否定的評価を与えているかを判断し、その結果を評価対象ごとに集計してグラフを作成して提示する技術(例えば、特許文献2参照。)など、コンピュータを利用したアンケートの自由記述回答文の分析作業の自動化に関する技術が提案されている。
【0003】
また、関連する技術として、文書を分類する際に得られる特徴表現の間の関係やクラスタ間の関係を活用させて、効率的な分類結果の提示や操作手段を提供する技術について開示されている(例えば、特許文献3参照)。
【0004】
【特許文献1】
特開2001−266060号公報 (第2−3頁)
【0005】
【特許文献2】
特開2002−140465号公報 (第2−3頁)
【0006】
【特許文献3】
特開2000−259658号公報 (第2−3頁)
【0007】
【発明が解決しようとする課題】
しかしながら、前述のテキスト分類による方法では、テキスト分類はキーワードベースで行われるため、自由記述回答が比較的長い文となると、キーワードとして抽出される語が多くなってしまい、高い精度での分類を行うことは困難であった。
【0008】
一方、回答文ごとに肯定意見か否定意見かを判断する方法では、与えられたアンケート回答文が全体として肯定意見か否定意見かを判定することしかできない。例えば道路行政に関する要望を求めるアンケートにおいて「○○付近の渋滞が激しいので、バイパス道路を設置するべきだ思う。」という回答文が与えられた場合、「バイパス道路の設置」に肯定的という情報は得られても、この意見はどの程度肯定的なのか、あるいはこの意見が具体的な根拠に基づいているのか、などの情報までを得るのは不可能であった。
【0009】
また、収集された回答文から、例えば「少数派でも具体的な根拠に基づく強硬な意見」のような条件に合った回答文だけを取り出したい場合がある。しかしながら、テキスト分類による方法においては多数派の意見は容易に取り出すことはできるが、少数派の意見を取り出すことは困難である。一方、回答文ごとに肯定意見か否定意見かを判断する方法においても、このような条件に合うものを取り出すことは困難であるため、全ての回答文を実際に読んで人手で選別せざるを得ず、多大な労力やコストが必要であった。
【0010】
本発明は、上記のような事情に鑑みて提案されたものであり、テキスト分類による論点抽出処理前に各アンケート回答文を文書解析して「意見や要望の記述」を抽出して、それらの記述だけを論点抽出処理に用いることによって、利用者に対してより高精度な論点に着目した意見分析結果の提示を可能とすることを第1の課題としている。
【0011】
本発明の第2の課題は、個々のアンケート回答文に対して、ある論点に対する関連度および根拠の具体性などに基づく意見の強さを数値化することにより、単に肯定か否定かを判断するだけでなく、その度合いを与えた意見分析結果の提示を可能とすることである。
本発明の第3の課題は、収集されたアンケート回答文の中から、例えば「少数派でも強硬な意見」のように従来の技術では取り出しにくい条件に合致した回答文を少ないコストで機械的に取り出し、利用者への提示を可能とすることである。
【0012】
【課題を解決するための手段】
図1は、本発明の実施の形態1の全体構成図を示すものである。アンケート回答者クライアント5,6,7からインターネットなどのネットワーク4を介して、アンケートの回答として自由記述文が電子メール、またはWebフォームへの書き込みなどによって、意見分析装置1に送信されると、意見分析プログラム10の自由記述文入力手段11は送信された自由記述文を受信し、意見分析装置1に入力する。意見解析手段12は、解析規則データベース2に格納されている解析規則に基づき、入力した自由記述文からアンケート回答者の意見として認識した意見記述部分を抽出し、解析結果として入力した自由記述文と共に記憶装置に記憶させ、論点抽出手段13は、前記意見記述部分解から出現頻度の多い順に単語を論点として抽出し、意見チャート作成手段14は、前記論点ごとに前記意見記述部分の分布図表を作成し、意見チャート出力手段15は、前記分布図表を意見集計者クライアント8に出力することにより、アンケート自由記述回答文に対して、意見や要望の記述のみを抽出することが可能となるため、利用者に対してより高精度な論点に着目した分析結果の提示が可能となる。
【0013】
また、意見分析プログラム10に、論点抽出手段13が抽出した論点に対する関連度を計算する論点関連度計算手段16、前記意見記述部分における特定の語の出現頻度を数えることにより計算される意見記述の断定性を示す数値と、意見解析手段12はさらに前記意見の根拠と認識した根拠記述部分を抽出し、前記根拠記述部分における特定の語の出現頻度を数えることにより計算される根拠記述の具体性を示す数値とを用いて前記自由記述文における意見の強さの度合いを示す意見強度を計算する意見強度計算手段17を備えることにより、単なる肯定か否定かだけでなく、その度合いをいくつかの観点から評価することや、例えば「少数派でも強硬な意見」のような従来の技術では取り出しにくい条件に合う意見文を提示することも可能となる。
【0014】
【発明の実施の形態】
図1は、本発明の実施の形態1の全体構成図を示すものである。本発明の意見分析装置1では、図示しないが通常と同じくCPU( Central Processing Unit)、RAM( Random Access Memory )、ハードディスクドライブ(HDD:Hard Disk Drive)、グラフィック処理装置、入力インタフェースなどがバスを介して接続された構成からなるコンピュータ上で意見分析プログラム10が動くことによって各手段として機能する。
【0015】
意見分析プログラム10は、アンケート回答者クライアント5,6,7から送信された自由記述文を受信し、意見分析装置1に入力する自由記述文入力手段11、解析規則データベース2に格納されている解析規則に基づき、入力した自由記述文から意見記述部分と根拠記述部分を抽出し、解析結果として入力した自由記述文と共に記憶装置に記憶させる意見解析手段12、前記意見記述部分から出現頻度の多い順に単語を論点として抽出する論点抽出手段13、前記論点ごとに前記意見記述部分の分布図表を作成する意見チャート作成手段14、作成された分布図表を意見集計者クライアント8に出力する意見チャート出力手段15、論点抽出手段13が抽出した論点に対する関連度を計算する論点関連度計算手段16、前記意見記述部分における特定の語の出現頻度を数えることにより計算される意見記述の断定性を示す数値と、前記根拠記述部分における特定の語の出現頻度を数えることにより計算される根拠記述の具体性を示す数値とを用いて前記自由記述文における意見の強さの度合いを示す意見強度を計算する意見強度計算手段17から構成されている。
【0016】
解析規則データベース2は、意見文解析装置1に入力されたアンケート自由記述回答文を解析するための規則が記憶されている。意見文データベース3は、個々のアンケート自由記述回答文に対する意見解析手段12による解析結果、論点関連度計算手段16により求められた論点と関連度、および意見強度計算手段17により計算された意見強度が、意見文データとして記憶されている。
【0017】
図2は、本発明に係る実施の形態1における意見文解析処理概要の流れを示すフローチャートである。アンケート回答者クライアントからインターネットなどのネットワークを介して、自由記述回答文が電子メール、またはWebフォームへの書き込みなどによって、意見分析装置に送信されると、意見分析プログラムは、アンケート回答者のアンケート回答を受信・受け付けを行い(S201)、解析規則データベース2に記憶させてある解析規則に基づいて解析・整理を行い、その結果を意見データベース3に記憶させる(S202)。本処理については、後述の図5に基づいて詳細に説明する。次に、他に処理が終了していない自由記述回答文があるかどうかを判定し、アンケート回答者からのアンケート回答すべてに対して行う(S203)。
【0018】
図3、および図4は、入力されるアンケート自由記述回答文の例である。このアンケート回答文は「道路行政についてご意見があればお書き下さい」という質問に対して書かれたものである。ここで、回答文にはID番号が付与されているが、これはネットワークを通じて回答文が入力されてきた際に、各回答文に対して一意に付与されるものとする。
【0019】
図5は自由記述回答文を解析して、意見文データとして意見文データベースに記憶させる意見文データの記憶処理の流れを示すフローチャートである。本処理が開始されると、まずID番号と自由記述回答文の全文が意見文データベース3に格納する(S501)。次に、自由記述回答文が複数の文で構成されている場合は、回答文中の句点、および疑問符を区切れ目にして、文単位に分割する(S502)。次に、分割された文の最初の1文を読み込み(S503)、解析規則データベース2(図6に解析規則データ例が示してある。)から適用順序に従って1つの解析規則を読み込んで(S504)照合を行う(S505)。
【0020】
照合はパターンマッチングによって行れ、マッチすれば次の処理に進み、マッチしない場合は、適用順序に従って次の解析規則があるかどうかを判断し(S507)、他に規則があればそれを読み込み(S504)、再度照合処理(S505)が行われる。照合処理(S505)においてマッチした場合は、解析規則中の談話要素名とそれぞれ切り出された部分を意見データベース3に格納する(S506)。1文に対する処理が終了すれば、他に未処理の文があるかどうかを判定し(S508)、あれば次の文の読み込み処理に戻る(S503)。なければ処理を終了する。
【0021】
図6は解析規則データベース2に記憶させてある解析規則データの例を示してある。個々のデータは適用順序と解析規則によって構成されており、適用順序は個々の解析規則を適用する順序を、解析規則は自由記述回答文との照合を行うためのパターンを示している。解析規則の表記のうち、例えば<根拠記述>は、任意の表現にマッチして、その箇所の談話要素を「根拠記述」とするという意味である。従って、例えば適用順序1の「<根拠記述>ので、<賛成意見記述>すべきだと思う。」という規則は、「〜ので、…すべきだと思う。」という表現の任意の文とマッチして、マッチした場合は「ので、」から前の部分を「根拠記述」の談話要素として切り出し、「ので、」から後ろかつ「すべきだと思う。」から前の部分を「賛成意見記述」の談話要素として切り出す、ということを示している。なお、解析規則データベース2に記憶させてある解析規則データは、必要に応じて変更・追加が可能である。
【0022】
図7は、図3および図4に示した自由記述回答文が、図6に示した解析規則データに基づいた意見文解析処理によって、意見文データベース3に格納する意見文データ例が示してある。意見文データベース3中の各意見文データは「ID番号」「談話要素」「記述内容」の項目で構成されている。図3に示したIDが0001の自由記述回答文は、適用順序1の解析規則にマッチし 、「根拠記述」の談話要素に対応する記述内容として「○○市△△付近の渋滞が激しいので、」が、「賛成意見記述」の談話要素に対応する記述内容として「バイパス道路を絶対に整備すべきだと思う。」がそれぞれ切り出されて意見文データベース3に格納される。
【0023】
また、図5に示したIDが0002の自由記述回答文は、2 文で構成されているが、1 文目が適用順序2の解析規則にマッチし、「根拠記述」の談話要素に対応する記述内容として「△△付近の商店街離れが深刻な現状です。」が切り出されている。また、2 文目は適用順序3の解析規則にマッチし、「反対意見記述」の談話要素に対応する記述内容として「さらなるバイパス道路は必要ないと思います。」が切り出されて意見文データベース3に格納される。
【0024】
図8は、論点抽出・関連度計算処理の流れを示すフローチャートである。本発明の意見分析装置において分析の対象となる全てのアンケート回答文に対して、意見文解析処理が完了し、意見文データベース3に意見文データとして格納されている状態にあるときに、例えば意見集計者の指示により本処理が開始されるものとする。
【0025】
本処理が開始されると、まず意見文データベース3から、各意見文データのうち談話要素が「賛成意見記述」または「反対意見記述」に対応する記述内容を取り出す(S801)。次に、取り出された記述内容を用いて論点抽出および関連度計算処理を行う(S802)。この処理は、従来の文書クラスタリングに関する技術を用いることにより実現が可能である。例えば、特開2000−259658号公報には、文書クラスタリングの結果を効率よく提示するための技術が記載されている。該公報に記載されている技術を用いることにより、各クラスタに対しては、それらのクラスタを特徴づける表現を付与することができる。さらに、各文書に対しては、属するクラスタの持つ特徴に対する類似度を与えることができる。
【0026】
本実施例では、1つの意見文データに対して先のステップにより取り出された記述内容を1つの文書データとして、該公報に記載されている技術を用いてクラスタリング処理を行う。そして各クラスタを特徴づける表現を論点、各文書データの属するクラスタの持つ特徴に対する類似度を論点関連度として求め、その結果を意見文データベース3に書き込む(S803)。
【0027】
図9は、意見文データベース3から前述のステップで取り出された記述内容を用いて文書クラスタリング処理を行った結果の例が示してある。本図では、抽出されたクラスタのうち2つが示されており、各クラスタを特徴づける表現として「バイパス道路、整備」と「駐車場、増やす」が示してある。これらのクラスタを特徴づける表現が論点となる。さらに、各クラスタの中には複数の意見文データがあり、それぞれの意見文データにはクラスタの特徴に対する類似度が与えられている。この類似度が、各意見文データの論点関連度になる。
【0028】
図10は、論点抽出・関連度計算処理が終了した時点での意見文データベース3の記憶内容の例を示してある。本図では、ID番号0001の意見文データの論点が「バイパス道路、整備」、論点関連度が0.9、ID番号0002の意見文データの論点が「バイパス道路、整備」、論点関連度が0.8と求められた場合の例を示してある。各意見文データの論点および論点関連度は、談話要素が「全文」となっている行に書き込むものとする。
【0029】
図11は、意見強度計算処理の流れを示すフローチャートである。本発明の意見分析装置において分析の対象となる全てのアンケート回答文に対して、意見文解析処理が完了し、意見文データベース3に意見文データとして格納されている状態にあるときに、例えば意見集計者の指示により本処理が開始されるものとする。
【0030】
本処理が開始されると、まず図12で示すような意見強度計算ダイアログが表示し、意見強度の計算条件に関する意見集計者の指示を受け付ける(S1101)。次に、意見文データベース3から、各意見文データにおいて談話要素が「根拠記述」に対応する記述内容を取り出す(S1102)。次に、意見文データごとに、取り出された記述内容を形態素解析し、形態素解析処理の結果品詞が「数値」あるいは「固有名詞」に判断された単語の出現回数を数える(S1103)。実際には、意見強度計算ダイアログで根拠記述具体性として考慮する語としてチェックされている品詞についてのみ出現頻度を数えるものとする。
【0031】
次に、意見文データベース3から、各意見文データにおいて談話要素が「賛成意見記述」あるいは「反対意見記述」に対応する記述内容を取り出す(S1104)。次に、意見文データごとに、取り出された記述内容から、意見記述断定性として考慮する語の出現回数を数える(S1105)。出現回数を数える語は、意見強度ダイアログで「システムによる定義語」がチェックされている場合は予め登録されている語であるが、「語を指定」がチェックされている場合は、後続のテキストボックスに入力されている語も加えるものとする。
【0032】
次に、前述のステップで数えられた各品詞や語の出現頻度に基づき、与えられた式に従って意見強度を計算し(S1106)、計算結果を意見文データベース3に書き込む(S1107)。なお、意見強度の計算式は、意見強度計算ダイアログに設定された根拠記述具体性のウエイトをa、意見記述断定性のウエイトをbとすると例えば以下のように表すことができる。
【0033】
【数1】
【0034】
意見強度の具体的な計算方法について、図10に示した意見文データを例に説明する。なお、計算条件の設定は図12に示したダイアログの通りとする。ID番号が0001の意見文データについては、談話要素が「根拠記述」に対応する記述内容には、根拠記述具体性として考慮する語として固有名詞が2回(「○○市」と「△△」、ともに地名とする)出現する。従って根拠記述具体性は2となる。
【0035】
意見記述断定性については、図13で示すようにシステムによる定義語として予め「べきだ」という語が登録されていたとすると、談話要素が「賛成意見記述」に対応する記述内容には1 回出現する。さらに、意見分析者による指定語として「絶対」という語が入力されており、これも1 回出現している。さらに重みが1.5と指定されているので、意見記述断定性は(2)式より1+1×1.5 =2.5となる。また、根拠記述具体性と意見記述断定性のウエイトが図12で示す意見強度計算ダイアログで2:3と設定されているため、意見強度は(3)式に、aに2を、bに3を、根拠記述具体性に2を、意見記述断定性に2.5を代入し、2.3と計算される。
【0036】
また、ID番号が0002の意見文データについては、談話要素が「根拠記述」に対応する記述内容には、根拠記述具体性として考慮する語として固有名詞が1回(「△△」)出現する。従って根拠記述具体性は1となる。意見記述断定性については、システムによる定義語の中に、「反対意見記述」に対応する記述内容中に出現するものがないとすると、意見記述断定性は0となる。従って、意見強度は(3)式に、aに2を、bに3を、根拠記述具体性に1を、意見記述断定性に0を代入し、0.4と計算される。
【0037】
図12は、意見強度計算ダイアログの例が示してある。本図において、意見強度計算条件は、根拠記述具体性の計算条件設定、意見記述断定性の計算条件設定、および根拠記述具体性と意見記述断定性のウエイト設定の3つで構成されている。根拠記述具体性の計算条件設定では、根拠記述具体性の度合いを計算するために考慮する語の品詞を選択する。本図のダイアログでは数値と固有名詞が選択できるようになっており、両方を選択することも可能である。
【0038】
意見記述断定性の計算条件設定では、意見記述断定性の度合いを計算するために考慮する語を選択する。本図のダイアログでは、あらかじめ用意された語を使用する(図13で示すような「システムによる定義語」をチェック)か、意見集計者が指定するか(「語を指定」をチェック)の何れか、または両方を選択することができる。意見集計者による指定を選択した場合は、考慮する語をテキストボックスに入力する。この場合、コンマで区切ることにより、複数の語を指定することも可能である。また、その下のテキストボックスに、指定した語に対する考慮の度合いを重みとして入力することができる。重みは、システムによる定義語を1としたときの値として任意の数値を入力した後、「意見強度計算開始」と書かれたボタンを押すことにより意見分析装置に入力される。
【0039】
図14は、計算結果が意見文データベースに書き込まれた状態の例が示してある。本図において、各意見文データに対して、談話要素が「全文」の行には意見強度、「根拠記述」の行には根拠記述具体性、「賛成意見記述」あるいは「反対意見記述」の行には意見記述断定性の数値がそれぞれ書き込まれている。
図15は、意見チャート作成処理の流れを示すフローチャートである。本処理が開始されると、まず意見文データベース3から各意見文データに対する論点の項目を読み込み、論点ごとの意見文データの頻度を数える(S1501)。次に、図16で示すような意見チャート作成ダイアログを表示して、意見集計者から意見チャートを作成する論点の指定を受ける(S1502)。
【0040】
次に、指定された論点のうちの1つについてグラフを作成するために、グラフの横軸に意見記述強度、縦軸に論点関連度をとる(S1503)。次に、意見文データベース3から意見文データを1つ読み込み(S1504)、読み込んだ意見文データの論点が現在グラフを作成中のものかどうかを判定し(S1505)、そうであれば意見記述度と論点関連度を読み込み、グラフ中の適切な位置にプロットする(S1506)。
【0041】
プロットが終了すると、意見文データベース3中の全ての意見文データについて処理が終了したかどうかを判定し(S1507)、終了していなければ次の意見文データの読み込み処理に戻る(S1504)。終了していれば、他にグラフを作成する論点があるかどうかを判定し(S1508)、他に論点があれば次のグラフの作成処理に移る(S1503)。なければ処理を終了し、作成した意見チャートとしてのグラフデータを、意見集計者クライアントに送信する。
【0042】
図16は意見チャート作成ダイアログの例が示してある。この例では、前出のステップにおいて数えられた論点別の頻度が「バイパス道路、整備」が22、「駐車場、増やす」が15、「高速道路、無料」が8であった場合を示している。各論点の前にはチェックボックスが設けてあり、ここをクリックすることにより意見チャートを作成する論点を指定することが出来る。複数の論点を指定することも可能である。
【0043】
図17は意見データがプロットされた意見チャートの例が示してある。このように賛成意見か反対意見かでプロットする点の種類を区別することも可能である。この場合、意見文データの談話要素の項目にあるのが「賛成意見記述」であるか「反対意見記述」であるかにより判断される。この例では、賛成意見が「●」、反対意見が「×」でプロットされている。また、図18に示してあるように、プロットされた点の横に各意見の根拠を示すキーワードを付与することも可能である。このキーワードは例えば、意見文データにおいて根拠記述に対応する記述内容を形態素解析時に最初に出現するものを取り出す、という方法で付与することが可能である。
【0044】
図19は、図18の意見チャートに2本の目安線を加えたものである。目安線うちの1本は、例えば論点関連度が最大のものから数えて上位半分になるところで、意見強度の軸に平行になるように引く。もう1本は、例えば意見強度が最大のものから数えて上位半分になるところで、論点関連度の軸に平行になるように引く。このように意見チャートを構成することにより、例えばチャートの右上の領域は「比較的多数派の意見」の集合、左上の領域は「多数派ではあるが単なる希望や要望」の集合、右下の領域は「ユニークな意見ではあるが強硬な意見」の集合のように、プロットされた点が存在する領域で個々の意見の特徴がつかめるようになる。
【0045】
また、プロットされた点と意見文データベース中の個々の意見文データとのリンクを張ることによって、例えば図20に示すようにプロットされた点をディスプレイ上で指示(クリック)することにより対応する意見文データの談話要素が「全文」に相当する記述内容を表示することができる。このようにすることによって、例えば「『バイパスの整備』に関する少数派ではあるが強硬な意見」という意見文データを容易に取り出して見ることができるようになる。
【0046】
図21は、意見チャート作成ダイアログにおいて、複数の論点が指定された場合において、意見チャートを作成した例が示してある。これは、1つの論点について作成されるグラフを、円グラフのようにして組み合わせたものである。各論点におけるグラフにおいて、論点関連度の軸と意見強度の軸のなす角は、例えば次式によって計算することが出来る。
【0047】
【数2】
【0048】
このように意見チャートを作成することにより、複数の論点に関する意見の分布を効率よく見ることが可能であると同時に、座標軸のなす角が論点の属する意見文データの数に比例するため、どの論点に関する意見が多いかということについても容易に把握することが可能になる。
(付記1) 自由記述文を所定の解析規則に基づいて、意見と認識した意見記述部分抽出するステップと、
前記意見記述部分から出現頻度の多い順に単語を抽出するステップと
を有することを特徴とする意見分析方法。
【0049】
(付記2) 自由記述文を所定の解析規則に基づいて、意見と認識した意見記述部分抽出する意見解析手段と、
前記意見記述部分から出現頻度の多い順に単語を抽出する論点抽出手段と
を有することを特徴とする意見分析装置。
(付記3) 自由記述文を所定の解析規則に基づいて、意見と認識した意見記述部分抽出する意見解析手段と、
前記意見記述部分から出現頻度の多い順に単語を抽出する論点抽出手段と
してコンピュータを機能させる意見分析プログラム。
【0050】
(付記4) 前記論点抽出手段が抽出した単語に対する関連度を計算する論点関連度計算手段をさらに備えることを特徴とする請求項3記載の意見分析プログラム。
(付記5) 前記意見記述部分における特定の語の出現頻度を数えることにより計算される意見記述の断定性を示す数値と、前記意見解析手段はさらに前記意見の根拠と認識した根拠記述部分を抽出し、前記根拠記述部分における特定の語の出現頻度を数えることにより計算される根拠記述の具体性を示す数値とを用いて前記自由記述文における意見の強さの度合いを示す意見強度を計算する意見強度計算手段をさらに備えることを特徴とする請求項3、および請求項4記載の意見分析プログラム。
【0051】
(付記6) 前記意見チャート作成手段は、前記自由記述文に対して前記論点関連度計算手段により計算された論点関連度と、前記意見強度計算手段により計算された意見強度とを2次元の座標系上にプロットすることにより意見の分布を示す図を作成することを特徴とする付記3記載の意見分析プログラム。
(付記7) 前記意見チャート作成手段は、前記2次元の座標系にプロットされた点の存在する領域により、意見の特徴が判別できるように前記2次元の座標系を複数の領域に分割することを特徴とする付記3記載の意見分析プログラム。
【0052】
(付記8) 前記意見チャート作成手段は、各自由記述文に対して前記抽出された論点以外に記述内容を代表する語を抽出して前記作成された意見の分布を示す図追加することを特徴とする付記3記載の意見分析プログラム。
【0053】
【発明の効果】
以上のように、本発明によれば、アンケート自由記述回答文に対して文書解析により意見や要望の記述だけを取り出すことができるので、それらの記述だけを文書クラスタリング処理に用いることによって、利用者に対してより高精度な論点に着目した意見分析結果の提示が可能となる。
【0054】
また、個々の意見文データに対して論点関連度および根拠の具体性などに基づく意見強度を計算することによって、単なる肯定か否定かだけでなく、その度合いをいくつかの観点から評価することが可能になる。
さらに、論点関連度と意見強度をグラフにプロットして意見チャートとして提示することにより、例えば「少数派でも強硬な意見」のような従来の技術では取り出しにくい条件に合う意見文を取り出すことも、意見チャート上の点を指示するという簡単な操作で行うことが可能になる。
【図面の簡単な説明】
【図1】実施の形態1の全体構成図
【図2】本発明に係る意見文解析処理概要の流れを示すフローチャート
【図3】アンケート自由記述回答文の例1
【図4】アンケート自由記述回答文の例2
【図5】本発明に係る意見文データの記憶処理の流れを示すフローチャート
【図6】解析規則データベースに格納されている解析規則データの例
【図7】意見文データベースに格納されている意見文データの例
【図8】本発明に係る論点抽出・関連度計算処理の流れを示すフローチャート
【図9】クラスタリング結果の例
【図10】意見文データベースに論点と論点関連度を書き込んだ例
【図11】本発明に係る意見強度計算処理の流れを示すフローチャート
【図12】意見強度計算ダイアログの例
【図13】意見記述断定性に用いるシステムによる定義語の例
【図14】意見文データベースに意見強度を書き込んだ例
【図15】本発明に係る意見チャート作成処理の流れを示すフローチャート
【図16】意見チャート作成ダイアログの例
【図17】意見チャートの例1
【図18】意見チャートの例2
【図19】意見チャートの例3
【図20】意見チャートの例4
【図21】意見チャートの例5
【符号の説明】
1 意見分析装置
2 解析規則データベース
3 意見文データベース
4 通信ネットワーク
5 アンケート回答者クライアント
6 アンケート回答者クライアント
7 アンケート回答者クライアント
8 意見集計者クライアント
10 意見分析プログラム
11 自由記述文入力手段
12 意見解析手段
13 論点抽出手段
14 意見チャート作成手段
15 意見チャート出力手段
16 論点関連度計算手段
17 意見強度計算手段
Claims (4)
- コンピュータを、
文字列データ中に所定の表現パターンが存在する場合、該所定の表現パターンを除く所定箇所の記述を根拠記述部分または意見記述部分として認識する複数の解析規則データ列からなる解析規則を備え、入力された自由記述文と前記複数の解析規則データ列の間でパターンマッチ動作を行ない、入力された自由記述文中の任意の箇所が前記複数の解析規則データ列の中のいずれか一つの解析規則データ列中の前記所定の表現パターンと一致したことに基づいて当該解析規則データ列の解析規則にしたがって、前記入力された自由記述文から、意見と認識した意見記述部分を抽出するとともに、前記意見の根拠と認識した根拠記述部分を抽出する意見解析手段と、
前記意見記述部分から出現頻度の多い順に単語を抽出する論点抽出手段と、
前記論点抽出手段が抽出した単語に対する関連度を計算する論点関連度計算手段と、
前記意見記述部分における特定の語の出現頻度を数えることにより計算される意見記述の断定性を示す数値と、前記根拠記述部分における特定の語の出現頻度を数えることにより計算される根拠記述の具体性を示す数値とを用いて前記自由記述文における意見の強さの度合いを示す意見強度を計算する意見強度計算手段と
して機能させることを特徴とする意見分析プログラム。 - 前記自由記述文に対して前記論点関連度計算手段により計算された論点関連度と、前記意見強度計算手段により計算された意見強度とを2次元の座標系上にプロットすることにより意見の分布を示す図を作成する意見チャート作成手段をさらに備えたことを特徴とする請求項1記載の意見分析プログラム。
- 前記意見チャート作成手段は、前記2次元の座標系にプロットされた点の存在する領域により、意見の特徴が判別できるように前記2次元の座標系を複数の領域に分割することを特徴とする請求項2記載の意見分析プログラム。
- 前記意見チャート作成手段は、各自由記述文に対して前記抽出された論点以外に記述内容を代表する語を抽出して前記作成された意見の分布を示す図を追加することを特徴とする請求項2記載の意見分析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003015277A JP4269698B2 (ja) | 2003-01-23 | 2003-01-23 | 意見分析方法、意見分析装置、および意見分析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003015277A JP4269698B2 (ja) | 2003-01-23 | 2003-01-23 | 意見分析方法、意見分析装置、および意見分析プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2004227343A JP2004227343A (ja) | 2004-08-12 |
JP2004227343A5 JP2004227343A5 (ja) | 2006-03-09 |
JP4269698B2 true JP4269698B2 (ja) | 2009-05-27 |
Family
ID=32903081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003015277A Expired - Fee Related JP4269698B2 (ja) | 2003-01-23 | 2003-01-23 | 意見分析方法、意見分析装置、および意見分析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4269698B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4677563B2 (ja) * | 2006-03-10 | 2011-04-27 | 国立大学法人 筑波大学 | 意思決定支援システム及び意思決定支援方法 |
JP5212604B2 (ja) * | 2007-01-29 | 2013-06-19 | 日本電気株式会社 | リスク検知システム、リスク検知方法及びそのプログラム |
JP5130900B2 (ja) * | 2007-12-19 | 2013-01-30 | 大日本印刷株式会社 | 意見抽出装置 |
JP5369813B2 (ja) * | 2009-03-25 | 2013-12-18 | 富士通株式会社 | 説得支援装置、説得支援プログラム及び説得支援方法 |
AU2010236718B2 (en) | 2009-04-12 | 2016-06-09 | Thomas M. Cates | Emotivity and vocality measurement |
JP2011113400A (ja) * | 2009-11-27 | 2011-06-09 | Fujitsu Ltd | 説得支援装置、説得支援プログラム及び説得支援方法 |
JP6047903B2 (ja) | 2012-03-27 | 2016-12-21 | 富士通株式会社 | グループ作業支援方法、グループ作業支援プログラム、グループ作業支援サーバ及びグループ作業支援システム |
JP6192166B2 (ja) * | 2013-12-20 | 2017-09-06 | 日本放送協会 | 意見種別推定装置及びそのプログラム |
JP7257825B2 (ja) * | 2019-03-14 | 2023-04-14 | 日本放送協会 | 投票集計装置及びプログラム |
KR102419648B1 (ko) * | 2019-11-15 | 2022-07-12 | 한국과학기술원 | 언어의 구체성 및 설득 전략 나열에 기반하여 문서의 설득력을 판단하고 향상시키는 방법 및 시스템 |
-
2003
- 2003-01-23 JP JP2003015277A patent/JP4269698B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004227343A (ja) | 2004-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8073865B2 (en) | System and method for content extraction from unstructured sources | |
US20180121430A1 (en) | Determination of content score | |
US8355997B2 (en) | Method and system for developing a classification tool | |
JP4896071B2 (ja) | キーワード比較を用いた広告評価方法、広告評価システム、記録媒体 | |
JP5083669B2 (ja) | 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム | |
CN101681251A (zh) | 从文档到排名短语的语义分析 | |
JP2007226568A (ja) | 情報処理装置、顧客ニーズ分析方法、およびプログラム | |
US11023503B2 (en) | Suggesting text in an electronic document | |
CN103038769A (zh) | 用于将内容导引到社交网络引擎用户的系统和方法 | |
JP4269698B2 (ja) | 意見分析方法、意見分析装置、および意見分析プログラム | |
TWI461942B (zh) | An ad management apparatus, an advertisement selecting apparatus, an advertisement management method, an advertisement management program, and a recording medium on which an advertisement management program is recorded | |
CN103198118A (zh) | 一种商品网页回溯方法及系统 | |
JP6003637B2 (ja) | 情報処理装置、ノード抽出プログラムおよびノード抽出方法 | |
KR20160091756A (ko) | 키워드 검색을 통한 웹 페이지의 상대적 품질 지수 평가 장치 | |
JP2022035314A (ja) | 情報処理装置及びプログラム | |
CN110196941A (zh) | 一种资讯推荐方法、装置、服务器与存储介质 | |
Upreti et al. | Online content match-making in B2B markets: Application of neural content modeling | |
KR102477893B1 (ko) | 토픽 선정을 위한 자동화된 정보 처리 방법 | |
Soliman et al. | Utilizing support vector machines in mining online customer reviews | |
JP4883644B2 (ja) | リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法 | |
JP5559750B2 (ja) | 広告処理装置、情報処理システム及び広告処理方法 | |
TW201241775A (en) | Advertisement management device, advertisement selection device, advertisement management method, advertisement management program and storage medium storing advertisement management program | |
Luo et al. | A novel method based on knowledge adoption model and non-kernel SVM for predicting the helpfulness of online reviews | |
JP6554306B2 (ja) | 情報処理システム、情報処理方法、およびコンピュータプログラム | |
JP6960553B2 (ja) | ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040610 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040610 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060125 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080909 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090203 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090216 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120306 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130306 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140306 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |