JP4513098B2 - 評判情報取得装置、評判情報取得方法、プログラムおよび記憶媒体 - Google Patents

評判情報取得装置、評判情報取得方法、プログラムおよび記憶媒体 Download PDF

Info

Publication number
JP4513098B2
JP4513098B2 JP2005066572A JP2005066572A JP4513098B2 JP 4513098 B2 JP4513098 B2 JP 4513098B2 JP 2005066572 A JP2005066572 A JP 2005066572A JP 2005066572 A JP2005066572 A JP 2005066572A JP 4513098 B2 JP4513098 B2 JP 4513098B2
Authority
JP
Japan
Prior art keywords
expression
attribute
similarity
attribute expression
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005066572A
Other languages
English (en)
Other versions
JP2006252090A (ja
Inventor
伸章 廣嶋
節夫 山田
雅博 奥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005066572A priority Critical patent/JP4513098B2/ja
Publication of JP2006252090A publication Critical patent/JP2006252090A/ja
Application granted granted Critical
Publication of JP4513098B2 publication Critical patent/JP4513098B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、製品等の対象事物に関する評判が書かれた文から、評判情報を取得する評判情報取得装置、評判情報取得方法、プログラムおよび記憶媒体に関する。
Webページには、製品や人物等(以下、「対象事物」という)についての評判が書かれている文を含むページが数多く存在する。たとえば携帯電話については、「電池の持ちがよい」や、「デザインがかわいい」等の評判を含む文が書かれている。このような評判を含む文から、「電池の持ち」等、対象事物の属性を表す属性表現と、「よい」のような評価表現との組を評判情報として取得することができれば、製品を購入する際の参考情報等として、上記取得した評判情報が役立つ。そのため、評判を含む文の中から評判情報を取得する研究が行われている。
従来の技術では、「色」や「重さ」等、対象事物の属性を表す属性表現のリストと、「よい」や「美しい」のような属性表現に対する評価を表す評価表現のリストとを参照し、評判が含まれている文からパターンマッチングによって、属性表現と評価表現との組を、評判情報として取得する方法が採られている(たとえば、非特許文献1、特許文献1参照)。
立石健二、他著「Web文書集合からの意見情報抽出と着眼点に基づく要約生成」言語処理学会第10回年次大会、2004年3月、p.644−647 特許第3402599号公報
しかし、属性表現の種類は多岐にわたるので、全ての属性表現を属性表現リストに登録することはできない。このために、非特許文献1、特許文献1記載の発明では、評判を含む文中に、対象事物の属性を示す表現が含まれていても、上記対象事物の属性を示す表現が属性表現リストに登録されていなければ、属性表現と評価表現との組み合わせを構成することができず、したがって、評判情報を取得することができない。また、属性表現は、文中に明示的に書かれていないことが多く、非特許文献1、特許文献1記載の発明では、上記属性表現を明示的に含まない文からは、評判情報を取得することができない。たとえば、「ボタンが押し易い」という文には操作性がよいという評判が含まれているが、「操作性」という属性表現が明示的には記載されていないので、上記所定の文から、評判情報を取得することができないという問題がある。
本発明は、属性表現リスト中の属性表現が、所定の文に含まれていない場合でも、上記所定の文に含まれている単語列に基づいて、評判情報を取得することができる評判情報取得装置、評判情報取得方法、プログラムおよび記憶媒体を提供することを目的とするものである。
本発明は、所定の対象事物に関する評判が書かれている所定の文から、評判情報を取得する評判情報取得装置において、文を単語に分割する単語分割手段と、上記所定の対象事物の属性に関する評価である評価表現が記載されている評価表現リストを参照して、上記所定の文に含まれている単語列から、上記評価表現を取得し、記憶装置に記憶する評価表現取得手段と、上記対象事物の属性である属性表現が記載されている属性表現リストと、単語とこの単語に関する類似性判定用データが格納されている記憶装置である単語間類似性判定用データベースとを参照し、上記所定の文に含まれている単語列と上記属性表現リスト中の属性表現との類似度を計算し、上記所定の文に含まれている単語列との類似度が最も高い属性表現を取得し、記憶装置に記憶する属性表現取得手段と、上記属性表現取得手段が取得した属性表現と上記評価表現取得手段が取得した評価表現との組である評判情報を取得し、記憶装置に記憶する評判情報取得手段とを有し、上記属性表現取得手段は、単語とこの単語の意味を表現する単語ベクトルとの組を、単語間類似性判定用データベースに格納している記憶装置である概念ベースを用いる手段であることを特徴とする評判情報取得装置である。
本発明は、所定の文に含まれている単語列から、属性表現を取得するので、属性表現リスト中の属性表現が、上記所定の文に含まれていなくても、上記所定の文に含まれている単語列に基づいて、評判情報を取得することができ、したがって、従来例よりも多くの評判情報を取得することができるという効果を奏する。
発明を実施するための最良の形態は、以下の実施例である。
図1は、本発明の実施例1である評判情報取得装置100の構成を示す図である。
評判情報取得装置100は、単語分割部10と、評価表現取得部20と、属性表現取得部30と、評判情報取得部40と、評価表現リスト50と、属性表現リスト60と、評価−属性対応テーブル70と、単語間類似性判定用データベース80とを有する。
単語分割部10は、文を単語に分割し、単語列を得る。
評価表現取得部20は、「評価表現」が記載されている評価表現リスト50を参照して、所定の文に含まれている単語列から評価表現を検索し、この検索された評価表現を取得し、記憶装置に記憶する。
なお、上記「評価表現」は、対象事物の属性に関する評価である。また、上記「対象事物」は、製品や人物等、評判情報を取得する対象である。
属性表現取得部30は、「属性表現」が記載されている属性表現リスト60と、単語間の類似性を判定するための単語と単語ベクトルとが格納されている記憶装置である単語間類似性判定用データベース80とを参照し、所定の文に含まれている単語列と、属性表現リスト60に含まれている属性表現との類似度を計算し、所定の文に含まれている単語列との類似度が最も高い属性表現を取得し、記憶装置に記憶する。
なお、上記「属性表現」は、対象事物の属性である。なお、上記「属性」は、対象事物が物である場合には、その物に関する色、重さ、形状、価格、触感、厚み、構成部品、耐久性、硬さ等、その物に備わっている全ての性質、状態、現象を含み、対象事物が人である場合には、その人の性格、容姿、スタイル、ファッションセンス、演技力、歌唱力、表情、思想、好み等、その人に備わっている全ての性質、状態、現象を含むものである。つまり、製品等の物に限らず、サービスのような無形のものも対象事物に含まれる。
次に、実施例1の動作について説明する。
図2は、本発明の実施例1における評判情報取得装置100の全体の動作を示すフローチャートである。
まず、S10では、単語分割部10が、文を単語に分割し、単語列を得る。
次に、S20では、評価表現取得部20が、対象事物の属性に関する評価である評価表現が記載されている評価表現リスト50を参照し、所定の文に含まれている単語列から評価表現を検索し、検索された評価表現を取得し、記憶装置に記憶する。
次に、S30では、属性表現取得部30が、対象事物の属性である属性表現が記載されている属性表現リスト60と、単語とこの単語に関する類似性判定用データが格納されている記憶装置である単語間類似性判定用データベース80とを参照し、所定の文に含まれている単語列と、属性表現リスト60に含まれている属性表現との類似度を計算し、所定の文に含まれている単語列との類似度が最も高い属性表現を取得し、記憶装置に記憶する。これらの詳細な動作については、後述の図3において説明する。
最後に、S40では、評判情報取得部40が、属性表現と評価表現との組を作り、この作られた組を、「評判情報」として取得し、記憶装置に記憶する。
次に、実施例1において、属性表現取得部30の動作(S30)を、より具体的に説明する。
図3は、本発明の実施例1における属性表現を取得する動作(S30)を示すフローチャートである。
まず、S31では、所定の文に含まれている単語列と、属性表現リスト60に含まれている属性表現との類似度を計算し、S32では、属性表現リスト60に含まれている属性表現の中から、所定の文に含まれている単語列との類似度が最も高い属性表現を選択する。S33では、この選択された属性表現の類似度が、所定の閾値以上であるかどうかを判定し、S34では、選択された属性表現の類似度が、閾値以上であれば、上記選択された属性表現を取得し、記憶装置に記憶する。
次に、実施例1をより具体的に説明する。
図4は、評判情報を取得する対象の文の一例を示す図である。
実施例1は、図2に示すフローチャートにおける属性表現取得処理(S30)として、図3のフローチャートに示す処理を使用した場合における実施例である。
S10では、単語分割部10が、図4に示す文「通話ボタンが押しやすい。」を単語に分割し、単語列を得、記憶装置に記憶する。この場合、従来の形態素解析技術を用いて、単語分割し、各単語の表記、品詞の情報を得るようにしてもよい。
図5は、単語分割部10が、図4に示す文を単語に分割した結果を示す図である。
図6は、評価表現リスト50の例を示す図である。図6において、評価表現リスト50を構成する評価表現が10個、記載されているが、実際には、評価表現リスト50を構成する評価表現は多数である。
図2に示すS20では、評価表現取得部20が、対象事物の属性に関する評価である評価表現が記載されている評価表現リスト50を参照し、所定の文に含まれている単語列から評価表現を検索し、検索された評価表現を取得する。この検索の処理の詳細については、後述する。
図6に示す評価表現リスト50に記載されている各評価表現が、単語分割された単語列(図5に示す単語列)に、含まれているかどうかを調べ、評価表現リスト50中の評価表現が、単語分割された単語列に含まれていれば、上記含まれている評価表現を取得し、記憶装置に記憶する。
ここでは、図5に示す単語列の全体の中から評価表現が含まれているかどうかを調べているが、図5に示す単語列の一部の中に、評価表現が含まれているかどうかを調べるようにしてもよい。つまり、たとえば、レイアウトを整えるための記号の連続からなる単語列が文中に含まれている場合、その文から上記記号の連続の部分を除いた一部の単語列から、評価表現が含まれているかどうかを調べることが考えられる。
図5に示す単語列の中に、図6に記載されている9番目の「押しやす(い)」という評価表現が含まれているので、評価表現として、「押しやす(い)」を取得し、記憶装置に記憶する。
S30では、属性表現取得部30が、所定の対象事物の属性である属性表現が記載されている属性表現リスト60と、単語間の類似性を判定するための単語と単語ベクトルとが格納されている記憶装置である単語間類似性判定用データベース80とを参照し、属性表現を取得する。
図7は、属性表現リスト60の例を示す図である。図7において、属性表現リスト60を構成する属性表現が6個、記載されているが、実際には、属性表現リスト60を構成する評価表現は多数である。
単語間類似性判定用データベース80として、ここでは概念ベースを用いる。上記「概念ベース」は、単語と、その単語に対して付与されている単語ベクトルとの組によって構成されているデータベースであり、単語同士が類似している程、それらの単語ベクトル間の距離が近くなるので、単語ベクトル間の距離を、単語間の類似度として用いる。
また、シソーラス等を利用して、単語間の類似度を計算するようにしてもよい。シソーラスを利用する場合、予め登録されている単語間でしか類似度を計算することができないが、概念ベースを利用する場合、所定の単語が学習用コーパスに含まれていれば、単語ベクトルを学習することができるので、より多くの単語について類似度を計算することができる。
図8は、単語間類似判定用データベース80である概念ベースの例を示す図である。
図8において、「単語ベクトル」の下に記載されている1、2、3、…、100は、ベクトルの何番目の成分であるかを示す数字である。概念ベースの作成方法として、「Hinrich Schutze, Dimensions of Meaning, Proceedings of Supercomputing 92, PP. 787-796, 1992」に示す方法がある。
なお、単語間の類似度を計算することができれば、概念ベース、シソーラス以外のものを、単語間類似性判定用データベース80として使用するようにしてもよい。
S31では、所定の文に含まれている単語列と属性表現リスト60に含まれている属性表現との類似度を、概念ベースを使用して計算する。ここでは、所定の文に含まれている単語列と、属性表現リスト60中の属性表現との類似度は、所定の文に含まれている単語列と、属性表現リスト60中の属性表現のそれぞれの単語との類似度の平均値であるとする。また、所定の文に含まれている単語列と、属性表現リスト60中の属性表現中の単語との類似度は、所定の文に含まれている単語列中のそれぞれの単語と属性表現中の単語との類似度の平均値であるとする。また、所定の文に含まれている単語列中の単語と、属性表現リスト60中の属性表現中の単語との類似度は、単語の概念ベクトル間のコサイン距離であるとする。
各類似度の計算方法は、上記計算方法に限定する必要はない。また、ここでは、各類似度を計算する場合、名詞、動詞、形容詞のいずれかの品詞を持つ単語のみを用いて類似度を計算し、動詞と形容詞とについては、語幹のみを用いて類似度を計算する。類似度の計算に用いる単語の種類は、これに限るものではなく、品詞が名詞である単語だけを用いて類似度を計算するようにしてもよい。
類似度を計算する場合、まず、図5に示す単語分割した単語列と、図7に示す属性表現リスト60中の1番目の属性表現である「電池の持ち」との類似度を計算する。
図5に示す単語列「通話ボタンが押しやすい。」のうちで、類似度の計算に用いる単語は、名詞、動詞、形容詞のいずれかの品詞を持つ単語のみを用いて類似度を計算しまた動詞と形容詞とについては語幹のみを用いて類似度を計算するので、「通話」、「ボタン」、「押」の3単語であり、上記1番目の属性表現である「電池の持ち」という属性表現のうちで、類似度の計算に用いる単語は、上記と同様の理由で、「電池」、「持ち」の2単語である。
よって、図5に示す単語列「通話ボタンが押しやすい。」と、図7に示す属性表現リスト60中の1番目の属性表現である「電池の持ち」との類似度を計算する場合、図5に示す単語列と「電池」との類似度と、図5に示す単語列と「持ち」との類似度との平均値を計算する。また、図5に示す単語列中の単語と「電池」との類似度は、「通話」と「電池」とについて計算した類似度と、「ボタン」と「電池」とについて計算したの類似度と、「押」と「電池」とについて計算した類似度との平均値である。
図9は、図8に示す概念ベースに基づいて、単語ベクトル間のコサイン距離を、類似度として、所定の文に含まれている単語列中の単語と属性表現リスト60中の単語との類似度を計算した結果を示す図である。
図9に示す結果によれば、「通話」と「電池」との類似度、「ボタン」と「電池」との類似度、「押」と「電池」との類似度は、それぞれ、0.30、0.03、0.01であり、したがって、図5に示す単語列と「電池」との類似は、これらの平均値であるので、(0.30+0.03+0.01)/3≒0.11である。
これと同様に、「通話」と「持ち」との類似度、「ボタン」と「持ち」との類似度、「押」と「持ち」との類似度が、それぞれ、0.15、0.10、0.16であり、したがって、図5に示す単語列と「持ち」との類似度は、これらの平均値であるので、(0.15+0.10+0.16)/3≒0.14である。
以上によって、図5に示す単語列と「電池の持ち」との類似度は、これらの平均値であるので、(0.11+0.14)/2≒0.13である。残りの属性表現に関しても、上記と同様に、図5に示す単語列との類似度を計算する。
図10は、実施例1において、所定の文に含まれている単語列と、属性表現リスト60中の属性表現との類似度を計算した結果を示す図である。
S32では、所定の文に含まれている単語列との類似度が最も高い属性表現を選択する。図10に示す結果によれば、類似度が最も高い属性表現は、図10における2番目の属性表現である「操作性」であるので、この表記「操作性」を、所定の文に含まれている単語列との類似度が最も高い属性表現として、選択する。
S33では、選択した属性表現の類似度が、閾値以上であるかどうかを判定する。ここで、閾値を0.15であるとすると、選択した属性表現「操作性」の類似度が0.20であるので、選択した属性表現「操作性」の類似度は、上記閾値以上である。
S34では、類似度が最大である属性表現の類似度が、所定の閾値以上であれば、属性表現を取得する。上記「操作性」の類似度が閾値以上であるので、上記「操作性」を、評判情報を取得するための属性表現として取得する。
所定の文に書かれている評判が、どの属性表現にも該当しなければ、どの属性表現との類似度も低い値となり、類似度が最大である属性表現の類似度が、閾値を超えていなければ、属性表現が取得されない。したがって、閾値を所定の値に設定することによって、所定の文に書かれている評判がどの属性表現にも該当しない場合に、誤って属性表現が取得されることを防ぐことができる。
S40では、評判情報取得部40が、属性表現と評価表現との組を、最初に求めようとしていた評判情報として取得する。実施例1では、属性表現「操作性」と、評価表現「押しやす(い)」との組が、最初に求めようとしていた評判情報として取得される。
上記のように、所定の文に含まれている単語列に基づいて属性表現を取得するので、属性表現リスト60中に含まれている属性表現が、上記所定の文中に含まれていなくても、評判情報を取得することができる。したがって、実施例1では、所定の文から、従来例よりも多くの評判情報を取得することができる。
図11は、評価表現と評価との対応を示すテーブルの例である。
なお、評価表現が、肯定的な評価であるのか、否定的な評価であるのかを知りたい場合、一例として、図11に示す評価表現と評価との対応を示すテーブルを用意し、評価表現に対応する評価を取得し、その評価が肯定的であるのか、否定的であるのかを知るようにしてもよい。
本発明の実施例2は、図2に示すフローチャートにおける属性表現取得処理として、図12に示すフローチャートを用いた実施例である。
実施例2の構成は、図1に示す評判情報取得装置100の構成と同様である。
ただし、実施例2における属性表現取得部30は、評価表現と属性表現との対応関係が記載されている評価−属性対応テーブル70を参照し、属性表現リスト60に含まれている属性表現の候補を絞り込み、所定の文に含まれている単語列と、候補になる属性表現との類似度を計算し、所定の文に含まれている単語列との類似度が最も高い属性表現を取得し、記憶装置に記憶する。
図12は、本発明の実施例2における属性表現取得処理の動作(S30)を示すフローチャートである。
図13は、本発明の実施例2における評価−属性対応テーブル70の例を示す図である。
まず、S35では、評価表現と属性表現との対応関係が記載されている評価−属性対応テーブル70を参照し、図7に示す属性表現リスト60から、属性表現の候補を得る。
図13に示す各行は、所定の文において、評価表現がどのような属性表現を伴って出現するかを表している。つまり、1行目に記載されている1、2、5、6は、図6に示す評価表現リスト50における1番目の評価表現である「良(い)」が、図7に示す属性表現リスト60における1番目、2番目、5番目、6番目の属性表現である「電池の持ち」、「操作性」、「使い勝手」、「デザイン」を伴って出現することを示す。
図2に示すS20で取得した評価表現は、図6に示す評価表現リスト50における9番目の評価表現である「押しやす」であるので、この評価表現である「押しやす」を伴って出現する属性表現を、図13に示す例から検索し、属性表現の候補として、図7に示す属性表現リスト60における2番目、5番目の属性表現である「操作性」、「使い勝手」の2つを得る。このように、評価表現と属性表現との対応に基づいて、属性表現の候補の絞り込みを行うことによって、より確実に正しい属性表現を取得することができる。
次に、S36では、所定の文に含まれている単語列と属性表現の候補との類似度を計算し、S37では、上記属性表現の候補のうちで、所定の文に含まれている単語列との類似度が最も高い属性表現を選択する。
そして、S38では、この選択した属性表現の類似度が、閾値以上であるかどうかを判定し、S39では、上記類似度が閾値以上であれば、その属性表現を取得し、記憶装置に記憶する。
図2に示すS10とS20とにおける処理は、実施例1における処理と同様であるので、その説明を省略する。
実施例2において、S30では、属性表現取得部30が、対象事物の属性である属性表現が記載されている属性表現リスト60と、単語とこの単語に関する類似性判定用データが格納されている記憶装置である単語間類似性判定用データベース80とを参照し、属性表現を取得する。
S35では、評価表現と属性表現との対応関係が記載されている評価−属性対応テーブル70を参照し、属性表現リスト60から属性表現の候補を得る。
なお、上記実施例における一連の動作をプログラムとして構築し、評判情報取得装置100として利用されるコンピュータにインストールし、CPU等の制御手段によって実行させるようにしてもよく、または、ネットワークを介して流通させるようにしてもよい。
また、構築されたプログラムを評判情報取得装置100として利用されるコンピュータに接続されるハードディスク装置、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールして実行させるようにしてもよい。
本発明は、製品についての顧客満足度の調査等に利用可能である。
本発明の実施例1である評判情報取得装置100の構成を示す図である。 本発明の実施例1における評判情報取得装置100の全体の動作を示すフローチャートである。 本発明の実施例1における属性表現を取得する動作(S30)を示すフローチャートである。 評判情報を取得する対象の文の一例を示す図である。 単語分割部10が、図4に示す文を単語に分割した結果を示す図である。 評価表現リスト50の例を示す図である。 属性表現リスト60の例を示す図である。 単語間類似判定用データベース80である概念ベースの例を示す図である。 図8に示す概念ベースに基づいて、単語ベクトル間のコサイン距離を、類似度として、所定の文に含まれている単語列中の単語と属性表現リスト60中の単語との類似度を計算した結果を示す図である。 実施例1において、所定の文に含まれている単語列と、属性表現リスト60中の属性表現との類似度を計算した結果を示す図である。 評価表現と評価との対応を示すテーブルの例である。 本発明の実施例2における属性表現取得処理の動作(S30)を示すフローチャートである。 本発明の実施例2における評価−属性対応テーブル70の例を示す図である。
符号の説明
100…評判情報取得装置、
10…単語分割手段、
20…評価表現取得手段、
30…属性表現取得手段、
40…評判情報取得手段、
50…評価表現リスト、
60…属性表現リスト、
70…評価−属性対応テーブル、
80…単語間類似性判定用データベース。

Claims (10)

  1. 所定の対象事物に関する評判が書かれている所定の文から、評判情報を取得する評判情報取得装置において、
    文を単語に分割する単語分割手段と;
    上記所定の対象事物の属性に関する評価である評価表現が記載されている評価表現リストを参照して、上記所定の文に含まれている単語列から、上記評価表現を取得し、記憶装置に記憶する評価表現取得手段と;
    上記対象事物の属性である属性表現が記載されている属性表現リストと、単語とこの単語に関する類似性判定用データが格納されている記憶装置である単語間類似性判定用データベースとを参照し、上記所定の文に含まれている単語列と上記属性表現リスト中の属性表現との類似度を計算し、上記所定の文に含まれている単語列との類似度が最も高い属性表現を取得し、記憶装置に記憶する属性表現取得手段と;
    上記属性表現取得手段が取得した属性表現と上記評価表現取得手段が取得した評価表現との組である評判情報を取得し、記憶装置に記憶する評判情報取得手段と;
    有し、上記属性表現取得手段は、単語とこの単語の意味を表現する単語ベクトルとの組を、単語間類似性判定用データベースに格納している記憶装置である概念ベースを用いる手段であることを特徴とする評判情報取得装置。
  2. 請求項1において、
    上記属性表現取得手段は、文中の単語列と属性表現との類似度を、概念ベースを用いて計算し、単語列との類似度が最も高い属性表現を選択し、選択した属性表現の類似度が閾値以上であるかどうかを判定し、類似度が最大である属性表現の類似度が閾値以上であればその属性表現を取得する手段であることを特徴とする評判情報取得装置。
  3. 請求項1において、
    上記属性表現取得手段は、評価表現と属性表現との対応関係が記載されている評価−属性対応テーブルを参照し、上記属性表現リストの中から、属性表現の候補を絞り込み、上記所定の文に含まれている単語列と候補になる属性表現との類似度を計算し、上記所定の文に含まれている単語列との類似度が最も高い属性表現を取得する手段であることを特徴とする評判情報取得装置
  4. 請求項1または請求項2において、
    上記属性表現取得手段は、文中の単語列と候補になる属性表現との類似度を計算し、この計算された類似度が、所定の閾値を越えている属性表現であって、上記所定の文に含まれている単語列との類似度が最も高い属性表現を取得する手段であることを特徴とする評判情報取得装置。
  5. 所定の対象事物に関する評判が書かれている所定の文から、評判情報を取得する評判情報取得方法において、
    単語分割手段が、文を単語に分割し、記憶装置に記憶する単語分割工程と;
    評価表現取得手段が、上記所定の対象事物の属性に関する評価である評価表現が記載されている評価表現リストを参照して、上記所定の文に含まれている単語列から、上記評価表現を取得し、記憶装置に記憶する評価表現取得工程と;
    属性表現取得手段が、上記対象事物の属性である属性表現が記載されている属性表現リストと、単語とこの単語に関する類似性判定用データが格納されている記憶装置である単語間類似性判定用データベースとを参照し、上記所定の文に含まれている単語列と上記属性表現リスト中の属性表現との類似度を計算し、上記所定の文に含まれている単語列との類似度が最も高い属性表現を取得し、記憶装置に記憶する属性表現取得工程と;
    評判情報取得手段が、上記属性表現取得手段が取得した属性表現と上記上記評価表現取得手段が取得した評価表現との組である評判情報を取得し、記憶装置に記憶する評判情報取得工程と;
    有し、上記属性表現取得工程は、単語とこの単語の意味を表現する単語ベクトルとの組を、単語間類似性判定用データベースに格納している記憶装置である概念ベースを用いる工程であることを特徴とする評判情報取得方法。
  6. 請求項5において、
    上記属性表現取得工程は、文中の単語列と属性表現との類似度を、概念ベースを用いて計算し、単語列との類似度が最も高い属性表現を選択し、選択した属性表現の類似度が閾値以上であるかどうかを判定し、類似度が最大である属性表現の類似度が閾値以上であればその属性表現を取得する工程であることを特徴とする評判情報取得方法。
  7. 請求項5において、
    上記属性表現取得工程は、評価表現と属性表現との対応関係が記載されている評価−属性対応テーブルを参照し、上記属性表現リストの中から、属性表現の候補を絞り込み、上記所定の文に含まれている単語列と候補になる属性表現との類似度を計算し、上記所定の文に含まれている単語列との類似度が最も高い属性表現を取得する工程であることを特徴とする評判情報取得方法。
  8. 請求項5または請求項6において、
    上記属性表現取得工程は、文中の単語列と候補になる属性表現との類似度を計算し、この計算された類似度が、所定の閾値を越えている属性表現であって、上記所定の文に含まれている単語列との類似度が最も高い属性表現を取得する工程であることを特徴とする評判情報取得方法。
  9. 請求項5〜請求項8のいずれか1項に記載の評判情報取得方法における各工程をコンピュータに実行させるプログラム。
  10. 請求項5〜請求項8のいずれか1項に記載の評判情報取得方法における各工程をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2005066572A 2005-03-10 2005-03-10 評判情報取得装置、評判情報取得方法、プログラムおよび記憶媒体 Expired - Fee Related JP4513098B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005066572A JP4513098B2 (ja) 2005-03-10 2005-03-10 評判情報取得装置、評判情報取得方法、プログラムおよび記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005066572A JP4513098B2 (ja) 2005-03-10 2005-03-10 評判情報取得装置、評判情報取得方法、プログラムおよび記憶媒体

Publications (2)

Publication Number Publication Date
JP2006252090A JP2006252090A (ja) 2006-09-21
JP4513098B2 true JP4513098B2 (ja) 2010-07-28

Family

ID=37092527

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005066572A Expired - Fee Related JP4513098B2 (ja) 2005-03-10 2005-03-10 評判情報取得装置、評判情報取得方法、プログラムおよび記憶媒体

Country Status (1)

Country Link
JP (1) JP4513098B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4573358B2 (ja) * 2007-03-23 2010-11-04 日本電信電話株式会社 評判情報検索装置、その方法およびプログラム
KR101110336B1 (ko) 2009-05-29 2012-02-15 (주)엠더블유스토리 댓글에 대한 평판도 분석 방법
JP5286298B2 (ja) * 2010-01-28 2013-09-11 日本電信電話株式会社 評判分析装置、評判分析方法及び評判分析プログラム
JP5395827B2 (ja) * 2011-02-23 2014-01-22 日本電信電話株式会社 苦情検索装置、苦情検索方法、及びそのプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1027181A (ja) * 1996-07-11 1998-01-27 Fuji Xerox Co Ltd 文書評価装置
JP2000163437A (ja) * 1998-11-27 2000-06-16 Seiko Epson Corp 文書分類方法および文書分類装置ならびに文書分類処理プログラムを記録した記録媒体
JP2001243230A (ja) * 2000-02-25 2001-09-07 Nippon Telegr & Teleph Corp <Ntt> 類似性判別方法
JP2002092004A (ja) * 2000-09-13 2002-03-29 Nec Corp 情報分類装置
JP2002140465A (ja) * 2000-08-21 2002-05-17 Fujitsu Ltd 自然文処理装置及び自然文処理用プログラム
JP2002175330A (ja) * 2000-12-06 2002-06-21 Nec Corp 情報検索装置,スコア決定装置,情報検索方法,スコア決定方法及びプログラム記録媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1027181A (ja) * 1996-07-11 1998-01-27 Fuji Xerox Co Ltd 文書評価装置
JP2000163437A (ja) * 1998-11-27 2000-06-16 Seiko Epson Corp 文書分類方法および文書分類装置ならびに文書分類処理プログラムを記録した記録媒体
JP2001243230A (ja) * 2000-02-25 2001-09-07 Nippon Telegr & Teleph Corp <Ntt> 類似性判別方法
JP2002140465A (ja) * 2000-08-21 2002-05-17 Fujitsu Ltd 自然文処理装置及び自然文処理用プログラム
JP2002092004A (ja) * 2000-09-13 2002-03-29 Nec Corp 情報分類装置
JP2002175330A (ja) * 2000-12-06 2002-06-21 Nec Corp 情報検索装置,スコア決定装置,情報検索方法,スコア決定方法及びプログラム記録媒体

Also Published As

Publication number Publication date
JP2006252090A (ja) 2006-09-21

Similar Documents

Publication Publication Date Title
Grover et al. Use of the Edinburgh geoparser for georeferencing digitized historical collections
US9355179B2 (en) Visual-cue refinement of user query results
JP6828335B2 (ja) 検索プログラム、検索装置および検索方法
JP2003248676A (ja) 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法
JP2005122726A5 (ja)
JP4347226B2 (ja) 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
JP2005157524A (ja) 質問応答システムおよび質問応答処理方法
JP2013519131A (ja) 特に小型キーボード装置向けのインターネットコーパスを用いた文脈感応型自動言語訂正
KR20100038378A (ko) 지능적인 텍스트 주석을 위한 방법, 시스템 및 컴퓨터 프로그램
CN105874427A (zh) 基于应用上下文识别帮助信息
JP5846959B2 (ja) 基本語彙抽出装置、及びプログラム
CN105786971B (zh) 一种面向国际汉语教学的语法点识别方法
JP4513098B2 (ja) 評判情報取得装置、評判情報取得方法、プログラムおよび記憶媒体
JP2008084193A (ja) インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム
JP5455232B2 (ja) 画像選定装置、方法及びプログラム
JPH1153394A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP5197491B2 (ja) 行動推薦装置及び方法及びプログラム
Ochs et al. Google Knows Who is Famous Today--Building an Ontology from Search Engine Knowledge and DBpedia
JP4106470B2 (ja) 解データ編集処理装置および処理方法
JP2020071678A (ja) 情報処理装置、制御方法、プログラム
JP7443667B2 (ja) 検索装置、辞書検索プログラム、辞書検索方法
JP6181890B2 (ja) 文献解析装置、文献解析方法およびプログラム
JP2009104475A (ja) 類似文書検索装置、類似文書検索方法およびプログラム
JP2010009237A (ja) 多言語間類似文書検索装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体
JP7439429B2 (ja) 検索装置、検索方法、検索プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100430

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100430

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140521

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees