JP2005309907A

JP2005309907A - ユーザコメントダイジェストの生成方法・装置・プログラム

Info

Publication number: JP2005309907A
Application number: JP2004127783A
Authority: JP
Inventors: Koji Miyauchi; 興治宮内; Shinya Nakagawa; 真也中川; Hiroyuki Shimizu; 裕之清水
Original assignee: Hewlett Packard Development Co LP
Current assignee: Hewlett Packard Development Co LP
Priority date: 2004-04-23
Filing date: 2004-04-23
Publication date: 2005-11-04

Abstract

【課題】
従来技術の商品推薦システムでは、製品を推薦する理由・根拠を示し難い、将来発売される製品を推薦する場合の予想し難い、他人と違った嗜好を持つ場合にはその意向を反映し難い、大量のデータと計算が必要である等の問題点がある。
【解決手段】
本願発明は、ユーザ個人が製品・サービス等を利用する前あるいは利用した後に、それらに対するユーザ個人の意見叉は感想等を収集・解析し、ユーザ個人の有する潜在的な嗜好情報を抽出することである。それらの情報を基に現在あるいは将来の製品・サービスを推薦することが出来る。
【選択図】図２

Description

本発明は、ユーザテキストから、ユーザの嗜好に関する情報を基に、ユーザコメントダイジェストを生成する方法・装置・プログラムに関する。

本発明と関連あるいは類似する従来技術としては、非特許文献１に示されるプロファイル・マッチング方式、ルールベース方式、及び、協調フィルタリング方式等がある。これらの方式は商品推薦システム等に利用されている。これらの推薦システムは個人の商品購入履歴、Webサイトへのアクセスなどの行動履歴を収集し、さらに、他の人に関する同様の情報との比較を行いながら、似た履歴を持つユーザを見つけ、似た履歴を持つユーザ同士は同様の行動をとるであろうと推測し、各個人が所望していると思われる商品を推薦していく。また、推薦システムとして出願公開されているものに特開2000-148864「製品推薦を提供する方法および装置」がある。

特開2000-148864、製品推薦を提供する方法および装置新井範子; 北川一裕、「ユーザーの好きと嫌いを聞き分けるパーソナライゼーション技術」日経エレクトロニクス, 2003-02-03 乾孝司、乾健太郎、松本祐治、「出来事の望ましさ判定を目的とした語彙知識獲得」言語処理学会第10回年次大会発表論文集、pp.91〜94、 2004年3月

非特許文献１に示されるプロファイル・マッチング方式、ルールベース方式、及び、協調フィルタリング方式等に示される従来技術には、以下のような問題点がある。
（ａ）個人の行動履歴を収集・分析し、他の顧客と行動履歴が似ているという理由で製品の推薦をする場合、その製品を推薦する理由・根拠に乏しい場合がある。
（ｂ）過去に購入した個人の行動履歴を収集・分析することは、過去に製品化された製品を勧めるのには役に立つ場合もあるが、将来発売される製品を推薦する場合は、予想が容易ではない。
（ｃ）特定の顧客が他人と違った嗜好を持つ場合、あるいは特別な好みを優先させて製品を選択したい場合、その意向を反映し難い。
（ｄ）信頼性の高い情報を得るためには、大量のデータと計算が必要になる。
従って本発明の目的は上記のような問題点を解決することである。

本願発明の課題は、ユーザ個人が製品・サービス等を利用する前あるいは利用した後に、それらに対するユーザ個人の意見叉は感想等を収集・解析し、ユーザ個人の有する潜在的な嗜好情報を抽出することである。また、それらの情報を基に、現在あるいは将来の製品・サービスを推薦することである。
以下に、これらの課題を解決する為の手段について説明する。
（ａ）ユーザ嗜好情報の収集
ユーザの嗜好に関する情報の事例の集合として、ユーザからの製品・サービス等に対するコメント等のテキストから自動獲得する。これらは製品購入時あるいはその後の使用に対するユーザからのコメント等から収集することが出来る。
（ｂ）ユーザ嗜好情報の前処理
収集されたユーザ嗜好情報について、形態素解析・構文解析などを行う。

（ｃ）ユーザ嗜好情報の解析
これらのユーザコメント等から、シソーラス格納部、製品オントロジー格納部、嗜好表現オントロジー格納部などを参照することにより表現上の多様性を吸収し、製品に関する知識や嗜好を表現する二つ叉は三つの語句の組合せ、叉は語句間の有向グラフとして表現することが出来る。これを本願明細書ではこれをPreference Primitiveと呼び、以下PPと略記する。
（ｄ）PP間の関連性の解析
いくつかのPP間に、PP間の関連性解析のための規則を適用し、より詳細にユーザの嗜好を解析する。これによって、一つのユーザコメントから、複数のPPとそれらの間の関係からなるユーザコメントダイジェストを作ることができる。
さらに、これらのユーザコメントダイジェストを製品オントロジー、嗜好表現オントロジー等を用いて、ユーザの嗜好に関する詳細な推論を行ない、より合理的な推薦製品の推論などを行うことが出来る。

本願発明により、以下のような効果が期待できる。
（ａ）ユーザの製品に対する信頼性の高い嗜好情報を集めることが出来る。
ユーザのコメントには、特定の製品に対する、印象、感想、評価等が含まれている場合が多く、これらをPPの形式で収集することによりマーケティング等市場調査、製品企画等に有効な情報を蓄積することが出来る。
（ｂ）ユーザの書いた感想テキストから、定量的・数値的に表現しにくい評価や、仕様に現れにくい部分の評価、例外的な現象の評価を得たり利用することが出来る。
例えば、「急坂を軽々と登れる車」、「さわやかな感じの絵」、「１kgは軽いと思っていたが、持ってみるとずっしりしている」、「この映画のこの俳優は、他の作品に比べてSpoilされている」等の表現は、感覚的には理解できるが、定量的・数値的には表現し難いが、本願発明によれば、このような表現から、ユーザの嗜好する製品等を推薦することが出来る。

（ｃ）特定分野の専門家の考え方や評価が得ることが出来る。
特定分野で著名なユーザ、あるいは、専門家などからユーザ嗜好情報を集めることにより、発言力ある人の意見を推定することが出来る。言換えると、これらの製品に対する影響力のある人物の見解・評価を知ることが可能になる。また、その製品を購入するかどうか決定しようとする人にとっては、有力な判断情報とすることが出来る。
（ｄ）同様のユーザ嗜好情報を持つユーザ同士をグループ化することで、ユーザの分類ができる。
複数のユーザからある分野の製品に対するユーザ嗜好情報を集めて比較して似た嗜好を持つユーザをクラスタリングすることによって、ユーザをグループに分類することが可能になる。また、多くのユーザの嗜好情報で共通しているものを見出すことによって、流行の動向、及び、それらの理由の推測に役立てられる。
（ｅ）ユーザのモデル化とユーザ情報の個人化が出来る。
特定のユーザの嗜好傾向、例えば、どの分野の製品、叉は、製品のどの特徴に対する嗜好情報が多いかを調べることによって、ユーザの関心分野を推定できる。さらに、詳しくユーザ嗜好情報を解析し、どの特徴に対して好意的な印象、あるいは、感想を持っているかを調べることで、ユーザの考え方、商品購入動機、商品購入動向等に関する情報を得ることができる。

図１は、本願発明を実施する装置を示している。筐体１００の中には、記憶部１１０、メインメモリー１２０、出力部１３０、中央制御部（ＣＰＵ）１４０、操作部１５０、データ入力部１６０が含まれている。使用者は操作部１５０を操作し本願発明を実施するために必要な情報をデータ入力部１６０から入力する。中央制御部１４０は、メインメモリーに本願発明を実行するプログラムをロードし、記憶部１１０に記憶されている情報を読み出し、入力された情報に対して本願発明によるデータ処理を行い表示部１３０に処理結果を出力する。
図２は本願発明の好適実施例を示すフローチャートである。
３１０：ユーザコメントなどのテキストデータ入力
３２０：テキストデータ前処理
３３０：PP（Preference Primitive）抽出
３４０：ユーザコメントダイジェスト生成

以下、本フローチャートについて詳細に説明する。本願発明は言語に依存しないので、日本語でも適用できるが、文書が単語ごとに区切られている英文のコメントテキストを例にとって説明する。
（１）ユーザコメントなどのテキストデータ入力（３１０）
嗜好に関する情報を事例の集合として、ユーザのコメントなどテキストから自動獲得する。これらの情報の収集方法としては、製品を購入した顧客からのアンケートによる方法、映画を見た顧客からの感想などによる方法が考えられる。これらの情報を提供した顧客に対して、所定のインセンティブ等を与えることにより、情報収集の効率化を図ることも考えられる。さらにウエブサイトの個人の書き込み日記を公開して貰うことも考えられる。これらのユーザからの情報を入力する。

（２）テキストデータ前処理（３２０）
テキストデータ処理系によって、形態素解析・構文解析などが行われる。以下にこれらの例を示す。
（ａ）「I like this movie.」の解析例
一例として、ある映画に対して「I like this movie.」なるユーザテキストが入力されたとする。ここで、形態素解析・構文解析など自然言語解析を行うと次のような情報が得られる。
（イ）形態素解析を行うと次の様になる。
I ＝＞ Pronoun（代名詞）
like ＝＞ Verb （動詞 )
this ＝＞ Determiner （限定詞 )
movie ＝＞ Noun （名詞）
. ＝＞ Punctuation （句読点 )
（ロ）構文解析を行うと次のようになる。
I ＝＞ Subject （主語 )
like ＝＞ Verb （動詞 )
this_movie ＝＞ Object （目的語 )

（ｂ）「Tom Hanks is great.」の解析例
同様にして、「Tom Hanks is great.」なるユーザテキストに対して解析を行う。（イ）形態素解析を行うと次のようになる。
Tom_Hanks ＝＞ Proper_Noun （固有名詞 )
is ＝＞ Verb （動詞 )
great ＝＞ Adjective （形容詞 )
. ＝＞ Punctuation （句読点）
（ロ）構文解析を行うと次のようになる。
Tom_Hanks ＝＞ Subject （主語 )
is ＝＞ Verb （動詞 )
great ＝＞ Complement （補語 )

（３）PP（Preference Primitive）抽出（３３０）
形態素解析、構文解析がなされた一つのテキストで使用されている製品に関する知識や嗜好を表現する語句から「評価主体」、「評価対象」、「評価動作」、「特徴」、「特徴の値」等に対応する三つのデータの組が選択されPPとして定義される。
これらのデータの組は、左右の二つの要素を矢印で結び、その矢印に真中の要素をラベルとして持たせることにより、有向グラフとして表現することができる。PPはユーザの嗜好情報を含むユーザテキストから一つ以上生成される。PP辞書格納部（図３）に格納されている「製品オントロジー格納部」、「嗜好表現オントロジー格納部」、「シソーラス格納部」、及び、「PP抽出規則格納部」を参照し、ユーザテキストの表現上の多様性を吸収しつつ、PP同士の比較・対照が容易に出来るようにPPを作成していく。以下、これらについて説明する。

(ａ)製品オントロジー
図４に「製品オントロジー」の例を示している。オントロジーには製品関係の語句がその語句間の関係とともに定義されている。語句間の関係としては、語句概念の上位下位関係 (is-a 関係)、語句の持つ特徴、性質を示す関係 (property-of 関係)、具体的な製品が持つ特徴や性質の値を示す関係(value-of 関係)などがあり、製品に関係のある語句がこれらの関係とともにオントロジーの各ノードに定義されている。
本実施例では、映画を例にとっているので、製品オントロジーの中の映画に関するオントロジーの例が図４に示されている。図４では映画「Toy Story」に対するオントロジーを示している。この図４によって、「show」は「movie」の上位概念(is-a 関係)であること、「title」、「cast」、「director」、「genre」などは「movie」のプロパティを示す語句であること (property-of 関係)、「Toy Story」、「Tom Hanks」などは、これらのプロパティの実際例(Value)であること (value-of 関係)がわかる。

（ｂ）嗜好表現オントロジー
図５には「嗜好表現オントロジー」が例を示されている。嗜好表現オントロジーにはユーザの嗜好に関する語句が定義されている。例えば、製品に対する評価を示す単語(evaluation)、製品に対する印象を表す単語(impression)、嗜好を表現する行動(activity)などがあり、これらがオントロジーの各ノードに定義されている。
本実施例では、映画を例にとっているので、映画に関する嗜好表現オントロジーの例が図５に示されている。「Preference（嗜好）」を表現するものには、「evaluation(評価)」や「impression (印象)」、「activity (振る舞い)」に関するものがあることを定義しこれらを「part-of関係」呼ぶ。さらにそれらに対応する具体的な語句として、「evaluation(評価)」には、「good」、「bad」、「great」、「dull」などが含まれている。また「impression (印象)」には「satisfied」が含まれており、「activity (振る舞い)」には、「like」、「recommend」等が含まれている。これらは「value-of関係」で表現される。

（ｃ）シソーラス
シソーラスとは、類義語／反意語などを集めた辞典であり、ユーザのコメントから抽出された語彙に対してその同意語・類義語等を調べることが出来る。例えば「映画」を表現する同義語集合として（「movie」、「film」、「picture」、...(娯楽の一つとしての映画)）などの語彙が格納されている。

（ｄ）PP（Preference Primitive）の抽出方法
PP抽出規則格納部（図３）には、PP抽出規則が格納されている。以下に、これらのPP抽出規則を使って、ユーザテキストを形態素解析、及び、構文解析して得られた語彙の中から、PPを抽出する例を示す。
（イ）PP抽出規則
PP抽出規則とは、ユーザのコメントデータから取り出された語彙情報、品詞情報、構文解析情報などを基に、PPを抽出するための規則である。人手によってこれらのPP抽出規則を作成することもできるが、PP例を収集してサンプルデータを作り、これを機械学習することによって、PP抽出規則を自動生成することも可能である。以下に、PP抽出規則の例を示す。
PP抽出規則１：
[話者の評価の動作を述べたユーザコメントを、形態素解析及び構文解析した結果得られた語彙の中からVerb(嗜好を表現する動詞)、及び、Object(映画関係語句)が検出されると、「Subject（主語）、Object(映画関係語句)、Verb(嗜好を表現する動詞)」なるPPを抽出する。]
PP抽出規則２：
[ユーザからのコメントを形態素解析、及び、構文解析した結果得られた語彙の中から、Subject(映画関係語句)、Verb (be動詞.「is」,「am」など), Complement(評価を示す形容詞)が検出されると、「(Subject(映画関係語句), *, Complement(評価を示す形容詞) 」なるPPを抽出する］。ここで「*」は特定されていないことを示す。

（ロ）「I like this movie.」からPPを抽出する例
「movie」は、構文解析により、this_movie ( Object / 目的語 )であることが解析されており、また、「製品オントロジー」を参照することにより、カテゴリ「show」の中の「Movie」が検出される。これらにより「movie」は「Object(映画関係語句)」であることがわかる。
次に、「like」は、構文解析により、like ( Verb / 動詞 )であることが解析されており、また、「嗜好表現オントロジー」を参照することにより、嗜好を表現する動詞であることがわかる。ここで、「I like this movie.」は、話者の評価の動作（この例では「like」）を述べたユーザコメントであるので、前述のPP抽出規則１を適用すると、
PP抽出規則１：[話者の評価の動作を述べたユーザコメントを、形態素解析及び構文解析した結果得られた語彙の中からVerb(嗜好を表現する動詞)、及び、Object(映画関係語句)が検出されると、「Subject（主語）, Object(映画関係語句), Verb(嗜好を表現する動詞)」なるPPを抽出する。]
PP1:「Subject（主語）, Object(映画関係語句), Verb(嗜好を表現する動詞)」
＝＞ (I, this movie, like)
のように抽出することが出来る。

（ハ）「Tom Hanks is great.」からPPを抽出する例
「Tom Hanks」は構文解析の結果から、Tom_Hanks(Subject／主語)であることが、解析されており、さらに映画オントロジーを参照することにより、「Tom Hanks」はSubject(映画関係語句)であることがわかる。また、嗜好表現オントロジーを参照すると、「great」は評価（evaluation）を示す語句であることが分かる。
同様に、「is」は構文解析の結果から、Verb（動詞）であること、及び、「great」は Complement（補語）であることがわかる。「Tom Hanks is great.」という文に対しては、評価対象(Tom Hanks)と特徴の値(great)はあるが、対象の特徴として何を指しているかがはっきりしていない。このときは、前述のPP抽出規則２を適用すると、
PP抽出規則２：[ユーザからのコメントを形態素解析、及び、構文解析した結果得られた語彙の中から、Subject(映画関係語句)、Verb (be動詞.「is」、「am」など)、Complement(評価を示す形容詞)が検出されると、「(Subject(映画関係語句) , *, Complement(評価を示す形容詞) )なるPPを抽出する。」
「Subject(映画関係語句), Verb (be動詞), Complement(評価を示す形容詞)」
＝＞ (Tom Hanks, *, great)
を抽出することが出来る。ここで「*」は特定されていないことを示す。

（４）ユーザコメントダイジェストの生成（３４０）
（ａ）PP間関係抽出規則の適用
PP間関係抽出規則格納部（図３）に、PP間関係抽出規則が格納されている。以下に、PP間関係抽出規則を使用して、複数のPP間の関係に基づき、ユーザコメントダイジェストを生成する例について説明する。複数のPP間を関係付けするための規則を適用してより詳細にユーザの嗜好情報を解析することができる。これによって、一つのユーザコメントをPP群とそれらの間の関係からなるユーザコメントのダイジェストを作ることができる。
（イ）PP間関係抽出規則の例
PP間関係抽出規則とは、複数のPP間の関係に基づき、ユーザコメントダイジェストを生成する為の規則である。人手によってこれらのPP間関係抽出規則を作成することもできるが、PP例を収集してサンプルデータを作り、これを機械学習することによって、PP間関係抽出規則を自動生成することも可能である。以下に、PP間関係抽出規則の例を示す。
PP間関係抽出規則１：
[PP-A(*, movie, 嗜好を表現する動詞) 及びPP-B(movie関連語句, *, 評価を示す形容詞)なる二つのPPが出現したとき、PP-BはPP-Aの評価の理由を表す関係がある]。
PP間関係抽出規則２：
[PP-A(映画名,*,評価を示す語句) 及びPP-B(映画関係の語句,*,評価を示す形容詞) なる二つのPPが一つのコメントの中で近くに出現したとき、PP-BはPP-Aの評価の理由を表す関係がある。

（ロ）ユーザコメントダイジェスト生成の例
例えば、「I like this movie. Tom Hanks is great.」なるユーザコメントは、「I like this movie」、及び、「Tom Hanks is great」のように分けることが出来る。前述のように「I like this movie」からは、 (I, this movie, like)なるPP1が抽出される。ここで、PP１の一番目の要素は「Subject（主語）」であり、二番目の要素は「Object(映画関係語句)」であり、三番目の要素は「Verb(嗜好を表現する動詞)」であり、一方、PP間関係抽出規則１のPP-Aの一番目の要素は「*」であり、二番目の要素は「movie」であり、三番目の要素は「嗜好を表現する動詞」であるので、前述のPP1は、PP間関係抽出規則１のPP-Aの要件を満足する。

同様に、前述のように「Tom Hanks is great」からは (Tom Hanks, *, great)なるPP２が抽出される。ここで、PP２の一番目の要素は「Subject(映画関係の語句)」であり、二番目の要素は「Verb (be動詞)」であり、三番目の要素は「Complement(評価を示す形容詞)」であり、一方、PP間関係抽出規則１のPP-Bの一番目の要素は「movie関連語句」であり、PP-Bの二番目の要素は「*」であり、PP-Bの三番目の要素は「評価を示す形容詞」であるので、前述のPP2は、PP間関係抽出規則１のPP-Bの要件を満足する。

従って、PP１とPP２の間にはPP間関係抽出規則１が適用され、PP２はのPP１の評価の理由を表す関係があることがわかる。このように複数のPP間の関係を見出すことによって、ユーザコメントのダイジェストが表現できる。上述のように生成したPP群を、既に用意されている製品オントロジーや嗜好オントロジーと組み合わせ、ユーザコメントのダイジェストを作成することができる。

（ｂ）ユーザコメントダイジェストの応用例
ユーザコメントダイジェストを製品オントロジー、製品オントロジーなどと一緒に用いると次のような応用が可能となる。特定のユーザのいろいろな製品に対するダイジェストを集め、それがどんな製品に関するものかを解析することによって、そのユーザの関心のある製品・分野などに関する情報を得ることが出来る。例えば、あるユーザによって作成された複数の映画のコメントから (I, this movie, like)なるPPを取り出したとするこのとき、「this movie」として具体的にどんな映画に対してコメントを書いたのかを調べることによって、このユーザの関心のある映画のカテゴリを推測できる。
特定のユーザの、特定の製品に対するダイジェストを集め、その製品のどの部分、特性に関するものであるかを解析することによって、そのユーザが重視した部分、抱いた印象や感想に関する情報を得る。例えば、前述のPP1,PP2のPPの元になったコメントを書いたユーザは、その映画が気に入ったのは、「Tom Hanks」が出演していたからであるということが推測され、「それでは、Tom Hanksが出演している別の映画を推薦したらどうか」といった推論が可能になる。

ここで、ユーザコメントのダイジェストを用いた推論の例を説明する。
ユーザコメント文の例を以下に示す。ここで Sxは、x番目の文であることを示す。
S1: Sabrina was to me the finest film of the 90's.
S2: The players were extremely charming and enjoyable to watch.
S3: Julia Ormond gave an outstanding performance and she looked so beautiful.
．．．
S6: Harrison Ford was absolutely splendid in a great role ....
．．．
S8: The soundtrack is outstanding, with many incredible fine tunes ...
．．．

次に、これらのユーザコメント文から抽出されるPP群を示す。ここでPPｘは、Sｘに対応するx番目のPPであることを示す。
PP1: (Sabrina, *, fine film)
PP2: (the players, *, charming)
PP3: (the players, to watch, enjoyable)
PP4: (Julia Ormond, outstanding performance, give)
PP5: (Julia Ormond, *, beautiful)
PP6: (Harrison Ford, great role, splendid)
PP7: (the soundtrack, with fine tunes, outstanding)

ここで、前述のPP間関係抽出規則２を適用する。
PP間関係抽出規則２：[PP_A (映画名,*,評価を示す語句) 及びとPP_B (映画関係の語句,*,評価を示す形容詞) なる二つのPPが一つのコメントの中で近くに出現したとき、PP_BはPP_Aの評価の理由を表す関係がある。]。
上記のPP間関係抽出規則を基に推論すると、PP1はPP間関係抽出規則２のPP_Aに相当し、同様にPP2, PP5, PP6, PP7はPP_Bに相当する。従って、PP2, PP5, PP6, PP7はPP1の理由を表現していると推論できる。

次に、この例を実際に応用すると次のようになる。映画オントロジーを参照することで、PP1にある「Sabrina」は映画のタイトルであることがわかるので、このコメントを書いたユーザは、この映画を気に入った理由は、PP2, PP5, PP6, PP7であることがわかる。映画オントロジーによってPP2, PP4, PP5, PP6に俳優に関するものが出現していることが分かるので、このユーザは出演者に関心があることが推測される。以上の応用結果を用いることによって、当該ユーザに、この映画に出演していて、良い評価をしている俳優が出演している別の映画を推薦すると良いことが推測できる。

商品推薦システムへの応用
特定のユーザのいろいろな製品に対するダイジェストを集め、それがどんな製品に関するものかを解析することによって、そのユーザの関心のある製品、分野などに関する情報を得る。例えば、あるユーザの複数の映画のコメントから「I, this movie, like」なるPPを取り出したとする。このとき、this movie として具体的にどんな映画に対してコメントを書いたのかを調べることによって、このユーザの関心のある映画のカテゴリを推測できる。
特定のユーザの、特定の製品に対するダイジェストを集め、その製品のどの部分、特性に関するものであるかを解析することによって、そのユーザがどういう部分を重視しており、どんな印象や感想を持ったかに関する情報を得る。例えば、前述のPP1,PP2のPPの元になったコメントを書いたユーザは、その映画が気に入ったのは、「Tom Hanks」が出演していたからであるということが推測され、「Tom Hanks」が出演している別の映画を推薦することによって、当該ユーザがさらに別の映画を見たいという要求を喚起でき、それによって映画興行の売上増に貢献できる。

本願発明を実施する装置のブロック図である。本願発明を実施するプログラムのフローチャートである。 PP辞書格納部を示す図である。製品オントロジーの例を示す図である。嗜好表現オントロジーの例を示す図である。

符号の説明

１００：コンピュータ筐体
１１０：記憶部
１２０：中央制御部（ＣＰＵ）
１３０：表示部
１４０：操作部
２００：ＰＰ辞書格納部
２１０：製品オントロジー格納部
２２０：嗜好表現オントロジー格納部
２３０：シソーラス格納部
２４０：PP抽出規則格納部
２５０：PP間関係抽出規則格納部

Claims

以下の（ａ）から（ｃ）のステップを有する、ユーザテキストに基づき、ユーザコメントダイジェストを生成する方法、
（ａ）前記ユーザテキストの前処理を行うステップ、
（ｂ）前記前処理されたテキストから、PP辞書格納部に格納されているPP抽出規則を参照し、PPを生成するステップ、
（ｃ）PP辞書格納部に格納されているPP間関係抽出規則を参照し、前記PP間の関係に基づきユーザコメントダイジェストを生成するステップ。
前記PP辞書格納部は、さらに、シソーラス格納部、製品オントロジー格納部、及び、嗜好表現オントロジー格納部のいずれか叉は全てを含み、
前記PPを生成するステップは、さらに、
（ａ）シソーラス格納部を参照し、同意語を検索するステップ、
（ｂ）製品オントロジー格納部を参照し、製品に関する語句間の関係を検索するステップ、
（ｃ）嗜好表現オントロジー格納部を参照し、ユーザの嗜好に関する語句の関係を検索するステップ、
のいずれか叉は全てを含む請求項１に記載の方法。
前記PP辞書格納部は、さらに、シソーラス格納部、製品オントロジー格納部、及び、嗜好表現オントロジー格納部のいずれか叉は全てを含み、
ユーザコメントダイジェストを生成するステップは、さらに、
（ａ）シソーラス格納部を参照し、同意語を検索するステップ、
（ｂ）製品オントロジー格納部を参照し、製品に関する語句間の関係を検索するステップ、
（ｃ）嗜好表現オントロジー格納部を参照し、ユーザの嗜好に関する語句の関係を検索するステップ、
のいずれか叉は全てを含む請求項１及び２に記載の方法。
前記PPは、前記ユーザテキストに基づき、多くとも３個のデータを含むことを特徴とする請求項１から３に記載の方法。
以下の（ａ）から（ｃ）の手段を有する、ユーザテキストに基づき、ユーザコメントダイジェストを生成する装置、
（ａ）前記ユーザテキストの前処理を行う手段、
（ｂ）前記前処理されたテキストから、PP辞書格納部に格納されているPP抽出規則を参照し、PPを生成する手段、
（ｃ）PP辞書格納部に格納されているPP間関係抽出規則を参照し、前記PP間の関係に基づきユーザコメントダイジェストを生成する手段。
前記PP辞書格納部は、さらに、シソーラス格納部、製品オントロジー格納部、及び、嗜好表現オントロジー格納部のいずれか叉は全てを含み、
前記PPを生成する手段は、さらに、
（ａ）シソーラス格納部を参照し、同意語を検索する手段、
（ｂ）製品オントロジー格納部を参照し、製品に関する語句間の関係を検索する手段、
（ｃ）嗜好表現オントロジー格納部を参照し、ユーザの嗜好に関する語句の関係を検索する手段、
のいずれか叉は全てを含む請求項５に記載の装置。
前記PP辞書格納部は、さらに、シソーラス格納部、製品オントロジー格納部、及び、嗜好表現オントロジー格納部のいずれか叉は全てを含み、
ユーザコメントダイジェストを生成する手段は、さらに、
（ａ）シソーラス格納部を参照し、同意語を検索する手段、
（ｂ）製品オントロジー格納部を参照し、製品に関する語句間の関係を検索する手段、
（ｃ）嗜好表現オントロジー格納部を参照し、ユーザの嗜好に関する語句の関係を検索する手段、
のいずれか叉は全てを含む請求項５及び６に記載の装置。
前記PPは、前記ユーザテキストに基づき、多くとも３個のデータを含むことを特徴とする請求項５から７に記載の装置。
ユーザテキストに基づき、ユーザコメントダイジェストを生成するために、コンピュータを、以下の（ａ）から（ｃ）の手段、として機能させる為のプログラム、
（ａ）前記ユーザテキストの前処理を行う手段、
（ｂ）前記前処理されたテキストから、PP辞書格納部に格納されているPP抽出規則を参照し、PPを生成する手段、
（ｃ）PP辞書格納部に格納されているPP間関係抽出規則を参照し、前記PP間の関係に基づきユーザコメントダイジェストを生成する手段。
前記PP辞書格納部は、さらに、シソーラス格納部、製品オントロジー格納部、及び、嗜好表現オントロジー格納部のいずれか叉は全てを含み、
前記PPを生成する手段は、さらに、
（ａ）シソーラス格納部を参照し、同意語を検索する手段、
（ｂ）製品オントロジー格納部を参照し、製品に関する語句間の関係を検索する手段、
（ｃ）嗜好表現オントロジー格納部を参照し、ユーザの嗜好に関する語句の関係を検索する手段、
のいずれか叉は全てを含む請求項９に記載のプログラム。
前記PP辞書格納部は、さらに、シソーラス格納部、製品オントロジー格納部、及び、嗜好表現オントロジー格納部のいずれか叉は全てを含み、
ユーザコメントダイジェストを生成する手段は、さらに、
（ａ）シソーラス格納部を参照し、同意語を検索する手段、
（ｂ）製品オントロジー格納部を参照し、製品に関する語句間の関係を検索する手段、
（ｃ）嗜好表現オントロジー格納部を参照し、ユーザの嗜好に関する語句の関係を検索する手段、
のいずれか叉は全てを含む請求項９及び１０に記載のプログラム。
前記PPは、前記ユーザテキストに基づき、多くとも３個のデータを含むことを特徴とする請求項９から１１に記載の装置。