JP3917629B2 - 自然文処理装置及び自然文処理用プログラム - Google Patents

自然文処理装置及び自然文処理用プログラム Download PDF

Info

Publication number
JP3917629B2
JP3917629B2 JP2005133969A JP2005133969A JP3917629B2 JP 3917629 B2 JP3917629 B2 JP 3917629B2 JP 2005133969 A JP2005133969 A JP 2005133969A JP 2005133969 A JP2005133969 A JP 2005133969A JP 3917629 B2 JP3917629 B2 JP 3917629B2
Authority
JP
Japan
Prior art keywords
opinion
information
knowledge
determination
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2005133969A
Other languages
English (en)
Other versions
JP2005322239A (ja
Inventor
孝広 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005133969A priority Critical patent/JP3917629B2/ja
Publication of JP2005322239A publication Critical patent/JP2005322239A/ja
Application granted granted Critical
Publication of JP3917629B2 publication Critical patent/JP3917629B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は自由記述式で書かれた自然文処理装置及び自然文処理用プログラムに係り、例えば市場調査等の際に行われるアンケートの回答が自然文で行われたとき、これをアンケートの結果として分析する文書処理装置及び文書処理用プログラムに関する。
各種の調査を行うための手段の1つとしてアンケートが行われている。アンケートには、回答の一部あるいは全部が自由記述式文書である自由記述式のアンケート方式と、アンケート調査票に設問に関して予め幾つかの選択肢を用意しておき、アンケート回答者にその中から選ばせる選択方式がある。
自由記述式のアンケート方式は、回答結果が自然文であり、多数の回答者から有用な情報を得るためには人手による集計及び分析が必要であり、非常にコストがかかるといった問題がある。
この問題を解決する手段として前記選択方式がある。しかしこの方式の場合は、予め作成された選択肢以外に関する情報は得ることができず、アンケート実施者の予期していなかったニーズ等の重要な知識を得ることができないという問題がある。
この自由記述式アンケートの集計時のコストの軽減を目的として、集計時にコンピュータによる自動集計を行う、アンケート集計システムが提案(例えば特許文献1参照)されている。
このアンケート集計システムでは、装置内にシソーラス辞書を具備し、自由記述文内の単語単位でシソーラス辞書を検索し、その上位語で結果を統合する装置である。例えば「硬式野球」と「軟式野球」を、上位語の「野球」として集計するといった処理を行う装置である。
特開平09−190454号公報
しかし、この統合はあくまでも単語単位で行われるので、例えばこの装置の説明で挙げられているアンケートの質問項目「生涯学習の内容は」に対する回答として、「硬式野球。」と「軟式野球。」を単語のみで記述されている文を正しく「野球」として集計することは可能であるが、しかし、「若い頃は野球だと思っていましたが、今ではやはりゴルフの方が良いと思います」等の否定的な対象として記述されている場合には正確な集計が行えないという問題がある。
またこの方法では正確な集計が殆ど不可能となる様な質問もある。例えば、「本製品についてご意見をお聞かせ下さい」といった質問に関しては、アンケート記述者は単語のみで回答を行うことはなく、さらにその記述が否定的内容なのか、肯定的内容なのかをアンケートの趣旨からいえば集計時に区別する必要があるが、それもこの装置では行えない。
つまり、この装置においては、本来の意味での自由記述式アンケートを、すなわちアンケート実施者側としてはどんな質問文でも許容し、アンケート記述側としてはどのような記述も許容するような場合を、正確に集計することはできない。
またアンケート以外にも多数の人間が各々の意見を述べている例としては、パソコン通信やウェブページにおける掲示板における記事や、ヘルプデスクに寄せられる顧客の問い合わせなどが挙げられるが、そこでも各個人の意見は自然文で記述されており、それらから有用な情報を得るためには自由記述式アンケートの分析作業と同様のコストがかかるという問題があった。
したがって本発明の目的は、前記の如き自由記述式アンケート等における問題点を解決し、有用な情報を低コストでかつ正確に獲得するようにしたものである。
また本発明では自由記述式アンケートに限らず、各個人の意見が自然文の形で記述されている情報源より有用の情報を低コストでかつ正確に獲得するようにしたものである。
前記本発明の目的を達成するための原理構成を図1に示す。図1において、1は入力部、2は回答抽出部、3は意見抽出部、4は意見集計部、5は結果提示部、6は意見判定部、7は判定知識獲得部、8は集計知識データベース、9は判定知識データベース、10は集計結果格納データベースである。
本発明の前記課題は下記(1)〜(5)の構成により達成することができる。
(1)意見情報が肯定的な情報か・否定的な情報かの判定情報を蓄積した判定知識データベースと、
到来する電子テキストデータ中を構文解析し主語と述語の対もしくは被修飾語と修飾語の対を抽出し、その二項関係を意見情報として集計する意見抽出処理部と、
前記意見抽出処理部によって集計された意見情報の各々に対し、前記判定データベースを元に肯定的な意見か否定的な意見かを判定する判定部を備え、
前記意見抽出処理部は、さらに、
反意語の肯定表現を蓄積した反意語知識データベースにアクセス可能で、前記集計を行うに当たり、述語もしくは修飾語の表記が、否定意見と肯定表現だが反意語を利用している意見とで同じ意味であるものは、同じ意見として集計する
事を特徴とする自然文処理装置。
(2)意見情報が肯定的な情報か・否定的な情報かの判定情報を蓄積した判定知識データベースにアクセス可能なコンピュータを、
到来する電子テキストデータ中を構文解析し主語と述語の対もしくは被修飾語と修飾語の対を抽出し、その二項関係を意見情報として集計する意見抽出処理手段と、
前記意見抽出処理部によって集計された意見情報の各々に対し、前記判定データベースを元に肯定的な意見か否定的な意見かを判定する判定手段と、
して機能させ
前記意見抽出処理手段、さらに、
反意語の肯定表現を蓄積した反意語知識データベースにアクセス可能で、前記集計を行うに当たり、述語もしくは修飾語の表記が、否定意見と肯定表現だが反意語を利用している意見とで同じ意味であるものは、同じ意見として集計する手段として機能する
事を特徴とする自然文処理プログラム。
これにより下記の作用効果を奏することができる。
(1)複数の意見提供者から提出された自由記述部分の回答文より、意見提供者の主張・見解・感想など単語対を意見として自動的に抽出することができるので、多数の自由記述部分の回答文より正確に短時間で意見を抽出することができる。
(2)抽出した意見が対象物に関する肯定的評価を与えているものか、それとも否定的評価を与えているものかを、これらを判定するための知識を格納する判定知識データベースを検索することにより、正確に、自動判定することができる。
(3)一つの回答文から肯定意見と否定意見の両方が得られたときに、その評価の強さを比較してその回答文における総合的なきめ細かな判定結果を自動的に得ることができる。
(4)提示情報を、全体集合を変化させた複数のグラフで順次表示することができるので、分析結果をわかり易く提示することができる。
(5)抽出した意見を判定する際の知識を、特定形式の意見調査票における回答結果より自動的に獲得するので、事前に判定する際の知識を用意することなく、意見判定を行うことができる。しかも学習する程正確な結果を得ることができる。
(6)抽出した意見を判定する際の知識を、特定形式の意見調査票を使用することなく、自動的に獲得することができるので、これまた事前に判定する際の知識を用意することなく、意見判定を行うことができる。しかも学習する程正確な結果を得ることができる。
(7)コンピュータに、提供された意見から意見提供者の自由記述部分の電子化データを意見提供の回答文として抽出する回答抽出手段、抽出した回答文より、単語対を抽出する意見抽出手段、抽出した意見内容毎の集計を行う意見集計手段、この意見内容毎の集計結果を提供する結果提供手段として機能するプログラムをインストールすることにより、通常のコンピュータを、複数の意見提供者から提供された意見を解析する自然文処理機能を遂行させることができる。
本発明の一実施の形態を図1〜図6にもとづきアンケート回答の分析を例として説明する。図1は本発明の実施の形態、図2は意見抽出説明図、図3は本発明における意見集計結果の一例を示す意見集計結果説明図、図4は本発明における集計結果の一例を示す集計結果説明図、図5は本発明のグラフ状態説明図、図6は本発明の回答文解析例である。
図中、1は入力部、2は回答抽出部、3は意見抽出部、4は意見集計部、5は結果提示部、6は意見判定部、7は判定知識獲得部であって第1判定知識獲得部7−1及び第2判定知識獲得部7−2を具備するもの、8は集計知識データベース、9は判定知識データベース、10は集計結果格納データベース、20はプロセッサ、21は表示部、Aはアンケート回答者、Bはアンケート分析者である。
入力部1は、アンケート回答者Aがアンケート用紙に各々の回答を入力し、この回答を装置に回収する処理を行うものである。この回答を回収する処理としては、例えば紙媒体のアンケート調査票をアンケート対象者に直接配布したり、あるいはファックスなどで配布し、そこに回答を記入させて結果を回収する手法や、電子メールやウェブ掲示板を用いて調査票の配布と回答記入及び回収を行うこと等で実現可能である。
アンケート調査票の回答回収やファックスによる回答回収の場合は、回答記入欄が固定されているので、用紙の座標位置により検出できる。このような回答を回収する処理には、従来のアンケート結果回収のための手段をそのまま流用可能である。
なお入力部1としては以上のような文字情報によるものを扱うもののみに限定されるものでてはなく、電話応答などによって対象者の回答を音声データの形で回収することも可能であり、インターネットを使用したウェブ上のデータでもよく、回答のメディアとしてあらゆる情報伝達手段が利用可能である。もし翻訳手段が具備されていれば外国語で入力することもできる。
回答抽出部2は、回収された個々のアンケート回答結果の中の自由記述部分を電子テキスト化し、回答文として抽出する処理を行うものである。この処理は、例えば回収した紙媒体によるアンケート回答をアンケート実施者側のオペレータがキーボードなどの電子化データ入力手段で電子化テキストを作成する方法や、回答メディアに応じて適当な自動電子化手段、例えば文字認識装置や音声認識装置を用いて入手をかけることなく電子化テキストを作成する方法などで実現される。
またアンケートの入力部1に採用した手段によっては、回収した回答が既に電子化されている場合があるが、このような場合はその電子化されている自由記述部分をそのまま意見抽出部3に送出することができる。
意見抽出部3は、回答抽出部2が作成した電子化された回答文を解析し、回答文のいわんとする情報を意見として抽出する処理を行うものである。
ここで抽出される意見とは、例えばノートパソコンにおける製品アンケートについて、「本体は小さいのに画面が大きい。」という回答文の中に含まれている、「本体は小さい」、「画面は大きい」といったアンケート集計の際にアンケート実施者が知りたい情報である。
この意見抽出処理は、図2に示す如く、回答文を構文解析手段3−2を用いて構文木に変換してその主語と述語を抽出し、その二項関係「本体−小さい」、「画面−大きい」を集計処理単位とすることで実現される。
なお、意見として抽出する情報としては、上記の「主語−述語」の組に限らず、「被修飾語−修飾語」の関係から例えば「見やすい画面」から「画面−見やすい」を抽出するなど、種々のものが考えられる。
また以上のような二項関係に限らず、構文木の中の三項以上の関係、例えば「主語−目的語−述語」を意見とすることもできるし、抽出した表記による関係をさらに意味解釈手段3−1によって意味構造に変換してそれを意見とすることも可能である。
例えば「♯画面→♯美しい」と表す。ここで♯はその後方の単語の意味を表す演算子であって、テキスト中に出てきた画面のみではなく、例えばその分野の画面の同義語全体を表すものであり、モニタ、スクリーン、画面、液晶等全体を示す。また→は推論結果を表す演算子であり、この例では「画面であれば美しいもの」ということを示す。なお、これらの処理は全てコンピュータを用いて行い、人手をかけることなく実現可能である。
意見集計部4は、意見抽出部3が抽出した意見、例えば「本体−小さい」や「画面−大きい」といった二項関係毎にその出現頻度を集計する処理を行うものである。これにより、例えば図3に示す如く、二項関係毎の出現頻度を集計することができる。
集計方法としては、例えば意見を上記の如き二項関係とした場合、各意見毎にその数を集計することに加えて、第一項(「本体−小さい」なら「本体」)のみによる集計や、第二項(前記の例における「小さい」)のみによる集計を行い、それらの集計結果を結果提示部5に送出することで、分析者Bの分析目的に合致した情報提示を行うことができる。
また意見の表現の揺れを吸収した結果を集計する機能を付与した集計方式もできる。これは、例えば否定文から抽出された意見、「本体−大きくない」に関して、「本体−大きくない」という意見を「本体−小さい」と同意見として集計を行うといった機能である。
これは例えば、意見集計部4に反意語の肯定表現を示す反意語データベースを含む集計知識データベース8を接続し、意見の第二項が否定を含む場合、例えば「大きくない」の肯定表現「大きい」でこの反意語データベースを検索し、その反意語「小さい」を獲得して第一項と組み合わせて「本体−小さい」として集計に用いることで実現できる。
同様の方式で、集計知識データベース8に同義語データベースを備え、同義語の統一を行うことも可能である。この処理は、例えば「画面−綺麗」、「スクリーン−美しい」といった意見を「画面−美しい」として集計することができる。
その他シソーラス、実世界知識等を集計知識データベース8に備えることもできる。実世界知識とは、例えば「前のものが良かった」という意見を「今のものは悪い」と判断し、「操作性は前のものが良かった」という回答文から抽出すべき知識として「操作性は悪い」と分析するものである。
以上の処理を行った結果は、例えば図3に示す表の様に表される。図3はノートパソコンに関するものであり、意見としては「本体−小さい」、「画面−大きい」、「画面−小さい」・・・が抽出され、その集計数は200、50、150・・・であり、「本体−小さい」、「画面−大きい」は好判定結果を示し、「画面−小さい」は否判定結果を示している。
そして「本体−小さい」の同義意見としては「本体−コンパクト」、「ボディ−小さい」・・・が、「画面−大きい」の同義意見としては「画面−広い」・・・が、「画面−小さい」の同義意見としては「画面−狭い」、「画面−大きくない」・・・が存在したことを示している。
結果提示部5に送出するデータ形式は、種々の表形式ソフトの扱う形式に変換して図3のような表の形で送ってもよいし、他の形式で送ることもできる。なおこれらの意見集計部に関する処理は全てコンピュータで実現可能である。
結果提示部5は、意見集計部4が作成した集計結果をアンケート分析者Bに提示する処理を行うものである。集計結果の提示方法としては、図4に示す如き表の形でアンケート分析者Bに提示してもよいし、その他、種々の表計算ソフトの機能を利用して、アンケート分析者Bの分析目的に合致した表やグラフを作成して提示してもよい。
図4によれば、回答者は対象商品について、本体が綺麗とか汚いということよりも、大きいとか小さいということに関心のあることもわかる。
提示手段としては、例えば図1に示す表示部21にモニタ用の図表をアンケート分析者に提示できるものである必要があるが、本発明では必ずしも図表情報を提示手段に限定する必要はなく、例えば結果読み挙げ手段としスピ−カ等を用いて音声情報に変換してアンケート分析者に提示してもよい。
グラフとして提示する場合は、図5に示す如く、最初の図表として、長さを第一項で集計した意見の総数とした棒グラフで表現する。例えば本体については、図4に示す如く、好意的意見数が500、否定的意見数が20あるので、520の総数を示す棒グラフを作成し、それに対する肯定評価意見(500)と否定評価意見(20)の割合を各々色分けして提示し、例えばアンケート分析者がその肯定評価部分をマウスの如きポインテングデバイスで指定すると、肯定意見における第二項目の各割合を円グラフで提示し、さらに円グラフ内にある項目にポインテングデバイスで指示するとその意見が抽出された回答文を表示するというような方法である。
図5において、本体に関する棒グラフの肯定評価部分をポインテングデバイスでポインテングすると、3つに区分された円グラフが表示され、領域(a)をポインテングすると、回答文「小さい」が表示される。また領域(b)をポインテングすると「便利」が表示され、領域(c)をポインテングすると「軽い」が表示される。
さらに1つの回答文から肯定意見と否定意見の両方が得られたときに、その評価の強さを比較してその回答文における総合的な判定結果を推定する。このためこの2つの意見が出たとき、それぞれにあらかじめ点数をつけ、重み付けする。
このようにして、意見単位の集計結果だけでなく、回答文単位の評価の集計も行えるので、それをグラフの割合で色分けして最初にアンケート分析者に提示し、例えばその肯定意見の割合の部分をポインテングデバイスで指定すると、総合的に肯定評価を与えている回答文における意見の割合などもグラフィカルに提示することができる。
意見判定部6は、意見抽出部3が抽出した各意見情報について、判定知識データベース9に格納された意見判定知識を用いて、その意見が肯定的意見か否定的意見かを判定する処理を行うものである。
判定知識データベース9に格納される意見判定知識とは、例えば意見が例としてあげた二項関係で表現可能なものである場合は「本体−小さい−肯定的評価」といった三項関係で記述可能な情報である。またこの判定知識データベース9における対象物依存性をなくし、他の対象物に関するアンケートも同じデータベースを使うことを考えて、さらに対象物に関する情報を加えた「本体−小さい−肯定的評価、対象物:情報機器」等の4項関係で記述してもよい。
このような判定知識を格納した判定知識データベースを具備し、抽出した各意見、例えば「本体−小さい」に対してこの判定知識データベースを検索し、例えば「本体−小さい−肯定的評価」を得ることで、この処理が実現できる。
また、例えば肯定的意見に+1、否定的意見に−1という得点(重み)を与えて一つの回答文において得られた複数の意見の得点の和をある一つの回答文について総合的な評価とみなすことで回答文単位の対象物の評価を求めることができる。
さらに、判定結果を肯定的評価/否定的評価といった2値ではなく、多値をとるものとして、例えば評価にさらに「強い肯定」、「強い否定」を加えて4値として、評価の強さに応じた得点を与えることで、より精度の良い判定を図ることもできる。また各評価値を評価関数で表現し、束値論理に基づく合成、いわゆる「ファジー推論」を行って総合評価を算出することも可能である。
判定知識獲得部7は、判定知識を、人手を用いることなく、自動的に獲得するものである。意見判定部6で使用される判定知識は対象物依存の知識であり、その整備にはコストがかかる。この問題を解決するためには、アンケート回答文より自動的に判定知識を獲得すればよい。
第1の手法として、特に抽出した意見を判定する際の知識を判定形式のアンケート調査票におけるアンケート回答結果より自動的に獲得して蓄積するものである。
運用初期においては、判定知識データベース9内に十分な判定知識が格納されていないので、アンケートの各質問については、例えば「本製品について、良いと思われた点をご記入下さい」といった、質問に対する回答結果の評価が明らかになるような設問とし、そこに記載された回答文より意見を抽出して、回答に予想される評価を合わせて判定知識として判定知識データベースに格納するものである。
また対象物に対してその評価すべき属性が予め判明している場合には、設問として「本製品の以下の事項について、感じたことを以下より選択し、そう感じた理由をご記入下さい」などとし、次に「画面」、「キーボード」・・・といった評価すべき属性を並べて、回答箇所には「大変良い−良い−普通−悪い−大変悪い」といった選択肢記入項目とその理由を記入する自由記述項目の2つを設け、アンケート結果を電子化した結果より、事項例えば「画面」と自由記述部分からの術語、例えば「大きくて見やすいから」という記述から、「大きい」、「見やすい」を抽出し、その組をもって意見を作成し、それに選択部分の評価値、例えば良い、を合わせて判定知識を作成する。例えば「画面−大きい−肯定的評価」及び「画面−見やすい−肯定的評価」を作成する。このような処理で獲得された知識を判定知識データベース9に格納することで、以後の処理で利用することが可能となる。前記各処理は、図1に示す第1判定知識獲得部7−1が行う。
第2の手法としては、前記のように、運用初期に特別の設問を設定しなくとも判定知識を獲得するようにしたものであり、図1に示す第2判定知識獲得部7−2が処理を行うものである。
これは、例えば「画面が見やすくて良い」という回答文からは「画面−見やすい」、「画面−良い」という2つの意見が抽出できるが、その一つの第二項が予め与えてある評価を表している語である場合、この例では「良い」が予め与えられている評価を表しているので、この知識を「良い−肯定的評価」という二項関係で表現する。そしてこの2つをマージして「画面−見やすい−肯定的評価」という判定知識情報を獲得することができる。
この手法は、判定知識の抽出だけでなく、運用の初期状態で装置に与えていない評価を表している語を獲得することも可能である。これは、例えば「良い−肯定的評価」という知識を予め装置に与えて、前記の例文より「画面−見やすい−肯定的評価」という判定知識を獲得したとする。
次に「画面が見やすくて素晴らしい」という回答文より「画面−見やすい」、「画面−素晴らしい」といった二つの意見が抽出されるが、前記獲得した判定知識より「画面−見やすい」は肯定的評価であることが分かるので、「素晴らしい−肯定的評価」といった新たな知識を得ることができる。このように「見やすい」「素晴らしい」は肯定的評価であることを判定知識データベース9に格納し、以後の処理に利用することで、知識の学習機能を実現することができる。
以上で述べた処理はすべてコンピュータで人手を要せずに処理可能である。なお前記第1の手法、第2の手法の判定知識獲得方式は排反ではなく、この両方を組み合わせたものも構成できる。
集計知識データベース8には、回答文を集計するために必要なデータが格納されるものであり、例えば、反意語データベース、同義語データベース、シソーラス、実世界知識等が格納されている。
判定知識データベース9には回答文が肯定的(好意的)意見なのか否定的意見なのかを判定するために必要なデータが格納されるものであり、例えば品詞、意見判定知識、「第1項+第2項+評価」、「第1項+第2項+評価+対象分野」、肯定的意見と否定的意見が混在するときの各意見に対する点数(重みづけ)等が格納されている。
集計結果格納データベース10は、本発明により得られた集計結果を一時格納するものであり、図3、図4に示す集計データや、図5に示す表示データ等が格納されるものである。
プロセッサ20は、本発明の自然処理装置を構成するものであり、例えば回答抽出部2、意見抽出部3、意見集計部4、結果提示部5、意見判定部6、判定知識獲得部7等を具備している。
表示部21は、本発明の処理結果をアンケート分析者Bが表示して、その処理結果を見るためのものであり、ディスプレイやプリンタ等で構成される。
図1に示す本発明の実施の形態の動作を図7に示すフローチャートに従って説明する。
S1.アンケート回答者Aからアンケートに対する回答が、例えばファクシミリや電子情報で入力部1に入力される。入力部1では、この回答結果を回答抽出部2に送出する。
S2.回答抽出部2は、この回答結果、特に自由記述部分を電子テキスト化し、回答文として抽出する処理を行う。そしてこの電子化された回答文を意見抽出部3に送出する。
S3.意見抽出部3は、この電子化された回答文を形態素解析し、構文解析手段3−2を用いて構文木に変換し、二項関係あるいは三項関係等を作成し、回答文より意見の抽出を行う。そしてこれを意見集計部4に送出する。
S4.意見集計部4は、前記意見抽出部3が抽出した意見を、例えば二項関係毎にその出現頻度を集計する。このとき意見抽出部3が抽出した意見が肯定的意見か、否定的意見かを意見判定部6が判定知識データベースに格納された意見判定知識を用いて判定する。
S5.意見集計部4は、このように意見抽出部3が抽出した意見の出現頻度を集計し、意見判定部6を介して意見抽出部3が抽出した意見が肯定的か否定的かを判定し、また集計知識データベース8の同義語データベースをアクセスして同義意見を認識する。そして図3に示す如き、意見集計表を作成する。
S6.このようにして作成された意見集計が結果提示部5に送出されると、結果提示部5では、これを加工してアンケート分析者Bがアンケート結果を分析し易い形で提示する処理を行う。例えば、図4に示す如く、表形式にして提示してもよく、またアンケート分析者の解析目的に合致した表やグラフを作成して提示してもよい。また図5に示す如く、ポインテングデバイスで指定されたときその部分を更に詳述表示するように提示してもよい。
ところで、図6に示す回答文が入力されたとき、本発明では意見抽出部3が意見判定部6とともに、この回答文を形態素解析して、前半の文の主語−述語が「野球−思って」であり、「が」が否定接続詞であることを認識して、「野球−思って−否定」を認識する。
そして後半の文の主語−述語が「ゴルフ−良い」であり良いの評価が肯定であることより「ゴクフ−良い−肯定」を認識する。このようにして図6の回答文は「野球ではなく−ゴルフ」ということを得る。
なお、前記説明では、本発明をアンケート回答文の処理の例について説明したが、本発明は勿論これに限定されるものではない。
なお前記回答抽出部2、意見抽出部3、意見集計部4、結果提示部5、意見判定部6、判定知識獲得部7等は、例えばプログラムで構成処理することが出来る。
本発明の形態を付記に記載する。
(付記1)複数の意見提供者から提供された意見を解析する自然文処理装置において、提供された意見から意見提供者の自由記述部分の電子化データを意見提供の回答文として抽出する回答抽出手段と、抽出した回答文より、単語対を抽出する意見抽出手段と、抽出した意見内容毎の集計を行う意見集計手段と、この意見内容毎の集計結果を提供する結果提供手段を具備したことを特徴とする自然文処理装置。
(付記2)前記付記1に記載の自然文処理装置において、抽出した意見が肯定的評価を与えているのか否定的評価を与えているのかを判定する意見判定手段と、意見を判定するための知識を格納する判定知識データベースを具備したことを特徴とする自然文処理装置。
(付記3)前記付記2に記載の自然文処理装置において、一つの回答文において、肯定意見と否定意見の2つが得られた場合、その強さを判定し、回答文の総合的な肯定・否定を判定する意見判定手段を具備したことを特徴とする自然文処理装置。
(付記4)前記付記1、付記2記載の自然文処理装置において、提示情報を全体集合を変化させた複数のグラフで表示する提示手段を具備したことを特徴とする自然文処理装置。
(付記5)前記付記2、付記3記載の自然文処理装置において、特に抽出した意見を判定する際の知識を、特定形式の意見調査票における回答結果より自動的に獲得して蓄積する判定知識獲得手段を具備したことを特徴とする自然文処理装置。
(付記6)前記付記2、付記3記載の自然文処理装置において、特に抽出した意見を判定する際の知識を、回答文内の特定の表現パターンより自動的に獲得して蓄積する判定知識獲得手段を具備したことを特徴とする自然文処理装置。
(付記7)コンピュータを、複数の意見提供者から提供された意見を解析する自然文処理手段として動作させるために、提供された意見から意見提供者の自由記述部分の電子化データを意見提供の回答文として抽出する回答抽出手段、抽出した回答文より、単語対を抽出する意見抽出手段、抽出した意見内容毎の集計を行う意見集計手段、この意見内容毎の集計結果を提供する結果提供手段として機能させるための自然文処理用プログラム。
本発明の実施の形態である。 本発明における意見抽出説明図である。 本発明における意見集計結果説明図である。 本発明における集計結果説明図である。 本発明におけるグラフ状態説明図である。 本発明における回答文解析例である。 本発明の動作状態説明図である。
符号の説明
1 入力部
2 回答抽出部
3 意見抽出部
4 意見集計部
5 結果提示部
6 意見判定部
7 判定知識獲得部
8 集計知識データベース
9 判定知識データベース
10 集計結果格納データベース
20 プロセッサ
21 表示部

Claims (2)

  1. 意見情報が肯定的な情報か・否定的な情報かの判定情報を蓄積した判定知識データベースと、
    到来する電子テキストデータ中を構文解析し主語と述語の対もしくは被修飾語と修飾語の対を抽出し、その二項関係を意見情報として集計する意見抽出処理部と、
    前記意見抽出処理部によって集計された意見情報の各々に対し、前記判定データベースを元に肯定的な意見か否定的な意見かを判定する判定部を備え、
    前記意見抽出処理部は、さらに、
    反意語の肯定表現を蓄積した反意語知識データベースにアクセス可能で、前記集計を行うに当たり、述語もしくは修飾語の表記が、否定意見と肯定表現だが反意語を利用している意見とで同じ意味であるものは、同じ意見として集計する
    事を特徴とする自然文処理装置。
  2. 意見情報が肯定的な情報か・否定的な情報かの判定情報を蓄積した判定知識データベースにアクセス可能なコンピュータを、
    到来する電子テキストデータ中を構文解析し主語と述語の対もしくは被修飾語と修飾語の対を抽出し、その二項関係を意見情報として集計する意見抽出処理手段と、
    前記意見抽出処理部によって集計された意見情報の各々に対し、前記判定データベースを元に肯定的な意見か否定的な意見かを判定する判定手段と、
    して機能させ
    前記意見抽出処理手段は、さらに、
    反意語の肯定表現を蓄積した反意語知識データベースにアクセス可能で、前記集計を行うに当たり、述語もしくは修飾語の表記が、否定意見と肯定表現だが反意語を利用している意見とで同じ意味であるものは、同じ意見として集計する手段として機能する
    事を特徴とする自然文処理プログラム。
JP2005133969A 2000-08-21 2005-05-02 自然文処理装置及び自然文処理用プログラム Expired - Lifetime JP3917629B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005133969A JP3917629B2 (ja) 2000-08-21 2005-05-02 自然文処理装置及び自然文処理用プログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2000249313 2000-08-21
JP2005133969A JP3917629B2 (ja) 2000-08-21 2005-05-02 自然文処理装置及び自然文処理用プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001245870A Division JP2002140465A (ja) 2000-08-21 2001-08-14 自然文処理装置及び自然文処理用プログラム

Publications (2)

Publication Number Publication Date
JP2005322239A JP2005322239A (ja) 2005-11-17
JP3917629B2 true JP3917629B2 (ja) 2007-05-23

Family

ID=35469437

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005133969A Expired - Lifetime JP3917629B2 (ja) 2000-08-21 2005-05-02 自然文処理装置及び自然文処理用プログラム

Country Status (1)

Country Link
JP (1) JP3917629B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010036012A2 (ko) * 2008-09-23 2010-04-01 주식회사 버즈니 인터넷을 이용한 의견 검색 시스템, 의견 검색 및 광고 서비스 시스템과 그 방법
KR101007284B1 (ko) 2008-09-23 2011-01-13 주식회사 버즈니 인터넷을 이용한 의견 검색 시스템 및 그 방법
KR101158860B1 (ko) * 2009-12-31 2012-06-25 에이든 정일 조 주관적 해석에 대한 심리단계별 검색방법 및 시스템

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007219880A (ja) * 2006-02-17 2007-08-30 Fujitsu Ltd 評判情報処理プログラム、方法及び装置
JP2007226460A (ja) * 2006-02-22 2007-09-06 Just Syst Corp データ処理装置およびデータ処理方法
JP2010079826A (ja) * 2008-09-29 2010-04-08 Nec Biglobe Ltd 情報処理装置、対比情報出力方法およびプログラム
WO2010120679A2 (en) * 2009-04-12 2010-10-21 The Brookeside Group, Inc. Emotivity and vocality measurement
JP5857648B2 (ja) * 2011-11-11 2016-02-10 富士通株式会社 受信メール分類装置、受信メール分類プログラム及び受信メール分類方法
WO2017203681A1 (ja) * 2016-05-27 2017-11-30 楽天株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010036012A2 (ko) * 2008-09-23 2010-04-01 주식회사 버즈니 인터넷을 이용한 의견 검색 시스템, 의견 검색 및 광고 서비스 시스템과 그 방법
WO2010036012A3 (ko) * 2008-09-23 2010-07-22 주식회사 버즈니 인터넷을 이용한 의견 검색 시스템, 의견 검색 및 광고 서비스 시스템과 그 방법
KR101007284B1 (ko) 2008-09-23 2011-01-13 주식회사 버즈니 인터넷을 이용한 의견 검색 시스템 및 그 방법
KR101158860B1 (ko) * 2009-12-31 2012-06-25 에이든 정일 조 주관적 해석에 대한 심리단계별 검색방법 및 시스템

Also Published As

Publication number Publication date
JP2005322239A (ja) 2005-11-17

Similar Documents

Publication Publication Date Title
JP3917629B2 (ja) 自然文処理装置及び自然文処理用プログラム
JP4870448B2 (ja) 情報処理装置、顧客ニーズ分析方法、およびプログラム
Aureli A comparison of content analysis usage and text mining in CSR corporate disclosure.
US8606815B2 (en) Systems and methods for analyzing electronic text
CN100461183C (zh) 网络搜索中基于多种规则的元数据自动抽取方法
US8893024B2 (en) User evaluation in a collaborative online forum
US20130198195A1 (en) System and method for identifying one or more resumes based on a search query using weighted formal concept analysis
WO2019203156A1 (ja) チャットボット検索システム、チャットボット検索方法、およびプログラム
JP4547500B2 (ja) 検索装置及びプログラム
US20060078862A1 (en) Answer support system, answer support apparatus, and answer support program
US20040029085A1 (en) Summarisation representation apparatus
US20020062302A1 (en) Methods for document indexing and analysis
Demir et al. Interactive sight into information graphics
JP2002140465A (ja) 自然文処理装置及び自然文処理用プログラム
KR20100069118A (ko) 질의어 색인 데이터베이스 구축 방법과 그 질의어 색인 데이터베이스를 이용한 질의어 추천 방법
JP5213098B2 (ja) 質問応答方法及びシステム
US20220327445A1 (en) Workshop assistance system and workshop assistance method
JP3583631B2 (ja) 情報マイニング方法、情報マイニング装置、および情報マイニングプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2010198142A (ja) 文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム
CN111460119A (zh) 经济知识智能问答方法、系统及智能设备
JP3955522B2 (ja) データ分析装置及び方法、並びにプログラム
JP4711556B2 (ja) 文章自動分類装置、文章自動分類プログラム、文章自動分類方法及び文章自動分類プログラムを記録したコンピュータ読取可能な記録媒体
Ciuffreda et al. A usability Study of multimodal interfaces for the presentation of Internet Search Results
JP2012093870A (ja) システム開発における要求獲得支援システム、要求獲得支援方法およびプログラム
JP2002189845A (ja) 評価システム及び評価方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060425

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060718

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060914

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061003

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061030

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070208

R150 Certificate of patent or registration of utility model

Ref document number: 3917629

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120216

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130216

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140216

Year of fee payment: 7

EXPY Cancellation because of completion of term