JP2005309907A - ユーザコメントダイジェストの生成方法・装置・プログラム - Google Patents

ユーザコメントダイジェストの生成方法・装置・プログラム Download PDF

Info

Publication number
JP2005309907A
JP2005309907A JP2004127783A JP2004127783A JP2005309907A JP 2005309907 A JP2005309907 A JP 2005309907A JP 2004127783 A JP2004127783 A JP 2004127783A JP 2004127783 A JP2004127783 A JP 2004127783A JP 2005309907 A JP2005309907 A JP 2005309907A
Authority
JP
Japan
Prior art keywords
storage unit
user
product
relationship
searching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004127783A
Other languages
English (en)
Inventor
Koji Miyauchi
興治 宮内
Shinya Nakagawa
真也 中川
Hiroyuki Shimizu
裕之 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Priority to JP2004127783A priority Critical patent/JP2005309907A/ja
Publication of JP2005309907A publication Critical patent/JP2005309907A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】
従来技術の商品推薦システムでは、製品を推薦する理由・根拠を示し難い、将来発売される製品を推薦する場合の予想し難い、他人と違った嗜好を持つ場合にはその意向を反映し難い、大量のデータと計算が必要である等の問題点がある。
【解決手段】
本願発明は、ユーザ個人が製品・サービス等を利用する前あるいは利用した後に、それらに対するユーザ個人の意見叉は感想等を収集・解析し、ユーザ個人の有する潜在的な嗜好情報を抽出することである。それらの情報を基に現在あるいは将来の製品・サービスを推薦することが出来る。
【選択図】図2

Description

本発明は、ユーザテキストから、ユーザの嗜好に関する情報を基に、ユーザコメントダイジェストを生成する方法・装置・プログラムに関する。
本発明と関連あるいは類似する従来技術としては、非特許文献1に示されるプロファイル・マッチング方式、ルールベース方式、及び、協調フィルタリング方式等がある。これらの方式は商品推薦システム等に利用されている。これらの推薦システムは個人の商品購入履歴、Webサイトへのアクセスなどの行動履歴を収集し、さらに、他の人に関する同様の情報との比較を行いながら、似た履歴を持つユーザを見つけ、似た履歴を持つユーザ同士は同様の行動をとるであろうと推測し、各個人が所望していると思われる商品を推薦していく。また、推薦システムとして出願公開されているものに特開2000-148864「製品推薦を提供する方法および装置」がある。
特開2000-148864、製品推薦を提供する方法および装置 新井 範子; 北川 一裕、「 ユーザーの好きと嫌いを聞き分けるパーソナライゼーション技術」 日経エレクトロニクス, 2003-02-03 乾孝司、乾健太郎、松本祐治、「出来事の望ましさ判定を目的とした語彙知識獲得」言語処理学会第10回年次大会発表論文集、pp.91〜94、 2004年3月
非特許文献1に示されるプロファイル・マッチング方式、ルールベース方式、及び、協調フィルタリング方式等に示される従来技術には、以下のような問題点がある。
(a)個人の行動履歴を収集・分析し、他の顧客と行動履歴が似ているという理由で製品の推薦をする場合、その製品を推薦する理由・根拠に乏しい場合がある。
(b)過去に購入した個人の行動履歴を収集・分析することは、過去に製品化された製品を勧めるのには役に立つ場合もあるが、将来発売される製品を推薦する場合は、予想が容易ではない。
(c)特定の顧客が他人と違った嗜好を持つ場合、あるいは特別な好みを優先させて製品を選択したい場合、その意向を反映し難い。
(d)信頼性の高い情報を得るためには、大量のデータと計算が必要になる。
従って本発明の目的は上記のような問題点を解決することである。
本願発明の課題は、ユーザ個人が製品・サービス等を利用する前あるいは利用した後に、それらに対するユーザ個人の意見叉は感想等を収集・解析し、ユーザ個人の有する潜在的な嗜好情報を抽出することである。また、それらの情報を基に、現在あるいは将来の製品・サービスを推薦することである。
以下に、これらの課題を解決する為の手段について説明する。
(a)ユーザ嗜好情報の収集
ユーザの嗜好に関する情報の事例の集合として、ユーザからの製品・サービス等に対するコメント等のテキストから自動獲得する。これらは製品購入時あるいはその後の使用に対するユーザからのコメント等から収集することが出来る。
(b)ユーザ嗜好情報の前処理
収集されたユーザ嗜好情報について、形態素解析・構文解析などを行う。
(c)ユーザ嗜好情報の解析
これらのユーザコメント等から、シソーラス格納部、製品オントロジー格納部、嗜好表現オントロジー格納部などを参照することにより表現上の多様性を吸収し、製品に関する知識や嗜好を表現する二つ叉は三つの語句の組合せ、叉は語句間の有向グラフとして表現することが出来る。これを本願明細書ではこれをPreference Primitiveと呼び、以下PPと略記する。
(d)PP間の関連性の解析
いくつかのPP間に、PP間の関連性解析のための規則を適用し、より詳細にユーザの嗜好を解析する。これによって、一つのユーザコメントから、複数のPPとそれらの間の関係からなるユーザコメントダイジェストを作ることができる。
さらに、これらのユーザコメントダイジェストを製品オントロジー、嗜好表現オントロジー等を用いて、ユーザの嗜好に関する詳細な推論を行ない、より合理的な推薦製品の推論などを行うことが出来る。
本願発明により、以下のような効果が期待できる。
(a)ユーザの製品に対する信頼性の高い嗜好情報を集めることが出来る。
ユーザのコメントには、特定の製品に対する、印象、感想、評価等が含まれている場合が多く、これらをPPの形式で収集することによりマーケティング等市場調査、製品企画等に有効な情報を蓄積することが出来る。
(b)ユーザの書いた感想テキストから、定量的・数値的に表現しにくい評価や、仕様に現れにくい部分の評価、例外的な現象の評価を得たり利用することが出来る。
例えば、「急坂を軽々と登れる車」、「さわやかな感じの絵」、「1kgは軽いと思っていたが、持ってみるとずっしりしている」、「この映画のこの俳優は、他の作品に比べてSpoilされている」等の表現は、感覚的には理解できるが、定量的・数値的には表現し難いが、本願発明によれば、このような表現から、ユーザの嗜好する製品等を推薦することが出来る。
(c)特定分野の専門家の考え方や評価が得ることが出来る。
特定分野で著名なユーザ、あるいは、専門家などからユーザ嗜好情報を集めることにより、発言力ある人の意見を推定することが出来る。言換えると、これらの製品に対する影響力のある人物の見解・評価を知ることが可能になる。また、その製品を購入するかどうか決定しようとする人にとっては、有力な判断情報とすることが出来る。
(d)同様のユーザ嗜好情報を持つユーザ同士をグループ化することで、ユーザの分類ができる。
複数のユーザからある分野の製品に対するユーザ嗜好情報を集めて比較して似た嗜好を持つユーザをクラスタリングすることによって、ユーザをグループに分類することが可能になる。また、多くのユーザの嗜好情報で共通しているものを見出すことによって、流行の動向、及び、それらの理由の推測に役立てられる。
(e)ユーザのモデル化とユーザ情報の個人化が出来る。
特定のユーザの嗜好傾向、例えば、どの分野の製品、叉は、製品のどの特徴に対する嗜好情報が多いかを調べることによって、ユーザの関心分野を推定できる。さらに、詳しくユーザ嗜好情報を解析し、どの特徴に対して好意的な印象、あるいは、感想を持っているかを調べることで、ユーザの考え方、商品購入動機、商品購入動向等に関する情報を得ることができる。
図1は、本願発明を実施する装置を示している。筐体100の中には、記憶部110、メインメモリー120、出力部130、中央制御部(CPU)140、操作部150、データ入力部160が含まれている。使用者は操作部150を操作し本願発明を実施するために必要な情報をデータ入力部160から入力する。中央制御部140は、メインメモリーに本願発明を実行するプログラムをロードし、記憶部110に記憶されている情報を読み出し、入力された情報に対して本願発明によるデータ処理を行い表示部130に処理結果を出力する。
図2は本願発明の好適実施例を示すフローチャートである。
310:ユーザコメントなどのテキストデータ入力
320:テキストデータ前処理
330:PP(Preference Primitive)抽出
340:ユーザコメントダイジェスト生成
以下、本フローチャートについて詳細に説明する。本願発明は言語に依存しないので、日本語でも適用できるが、文書が単語ごとに区切られている英文のコメントテキストを例にとって説明する。
(1)ユーザコメントなどのテキストデータ入力(310)
嗜好に関する情報を事例の集合として、ユーザのコメントなどテキストから自動獲得する。これらの情報の収集方法としては、製品を購入した顧客からのアンケートによる方法、映画を見た顧客からの感想などによる方法が考えられる。これらの情報を提供した顧客に対して、所定のインセンティブ等を与えることにより、情報収集の効率化を図ることも考えられる。さらにウエブサイトの個人の書き込み日記を公開して貰うことも考えられる。これらのユーザからの情報を入力する。
(2)テキストデータ前処理(320)
テキストデータ処理系によって、形態素解析・構文解析などが行われる。以下にこれらの例を示す。
(a)「I like this movie.」の解析例
一例として、ある映画に対して「I like this movie.」なるユーザテキストが入力されたとする。ここで、形態素解析・構文解析など自然言語解析を行うと次のような情報が得られる。
(イ)形態素解析を行うと次の様になる。
I => Pronoun( 代名詞 )
like => Verb ( 動詞 )
this => Determiner ( 限定詞 )
movie => Noun ( 名詞 )
. => Punctuation ( 句読点 )
(ロ)構文解析を行うと次のようになる。
I => Subject ( 主語 )
like => Verb ( 動詞 )
this_movie => Object ( 目的語 )
(b)「Tom Hanks is great.」の解析例
同様にして、「Tom Hanks is great.」なるユーザテキストに対して解析を行う。(イ)形態素解析を行うと次のようになる。
Tom_Hanks => Proper_Noun ( 固有名詞 )
is => Verb ( 動詞 )
great => Adjective ( 形容詞 )
. => Punctuation ( 句読点 )
(ロ)構文解析を行うと次のようになる。
Tom_Hanks => Subject ( 主語 )
is => Verb ( 動詞 )
great => Complement ( 補語 )
(3)PP(Preference Primitive)抽出(330)
形態素解析、構文解析がなされた一つのテキストで使用されている製品に関する知識や嗜好を表現する語句から「評価主体」、「評価対象」、「評価動作」、「特徴」、「 特徴の値」等に対応する三つのデータの組が選択されPPとして定義される。
これらのデータの組は、左右の二つの要素を矢印で結び、その矢印に真中の要素をラベルとして持たせることにより、有向グラフとして表現することができる。PPはユーザの嗜好情報を含むユーザテキストから一つ以上生成される。PP辞書格納部(図3)に格納されている「製品オントロジー格納部」、「嗜好表現オントロジー格納部」、「シソーラス格納部」、及び、「PP抽出規則格納部」を参照し、ユーザテキストの表現上の多様性を吸収しつつ、PP同士の比較・対照が容易に出来るようにPPを作成していく。以下、これらについて説明する。
(a)製品オントロジー
図4に「製品オントロジー」の例を示している。オントロジーには製品関係の語句がその語句間の関係とともに定義されている。語句間の関係としては、語句概念の上位下位関係 (is-a 関係)、語句の持つ特徴、性質を示す関係 (property-of 関係)、具体的な製品が持つ特徴や性質の値を示す関係(value-of 関係)などがあり、製品に関係のある語句がこれらの関係とともにオントロジーの各ノードに定義されている。
本実施例では、映画を例にとっているので、製品オントロジーの中の映画に関するオントロジーの例が図4に示されている。図4では映画「Toy Story」に対するオントロジーを示している。この図4によって、「show」は「movie」の上位概念(is-a 関係)であること、「title」、「cast」、「director」、「genre」などは「movie」のプロパティを示す語句であること (property-of 関係)、「Toy Story」、「Tom Hanks」などは、これらのプロパティの実際例(Value)であること (value-of 関係)がわかる。
(b)嗜好表現オントロジー
図5には「嗜好表現オントロジー」が例を示されている。嗜好表現オントロジーにはユーザの嗜好に関する語句が定義されている。例えば、製品に対する評価を示す単語(evaluation)、製品に対する印象を表す単語(impression)、嗜好を表現する行動(activity)などがあり、これらがオントロジーの各ノードに定義されている。
本実施例では、映画を例にとっているので、映画に関する嗜好表現オントロジーの例が図5に示されている。 「Preference(嗜好)」を表現するものには、「evaluation(評価)」や「impression (印象)」、「activity (振る舞い)」に関するものがあることを定義しこれらを「part-of関係」呼ぶ。さらにそれらに対応する具体的な語句として、「evaluation(評価)」には、「good」、「bad」、「great」、「dull」などが含まれている。また「impression (印象)」には「satisfied」が含まれており、「activity (振る舞い)」には、「like」、「recommend」等が含まれている。これらは「value-of関係」で表現される。
(c)シソーラス
シソーラスとは、類義語/反意語などを集めた辞典であり、ユーザのコメントから抽出された語彙に対してその同意語・類義語等を調べることが出来る。例えば「映画」を表現する同義語集合として (「movie」、「film」、「picture」、...(娯楽の一つとしての映画))などの語彙が格納されている。
(d)PP(Preference Primitive)の抽出方法
PP抽出規則格納部(図3)には、PP抽出規則が格納されている。以下に、これらのPP抽出規則を使って、ユーザテキストを形態素解析、及び、構文解析して得られた語彙の中から、PPを抽出する例を示す。
(イ)PP抽出規則
PP抽出規則とは、ユーザのコメントデータから取り出された語彙情報、品詞情報、構文解析情報などを基に、PPを抽出するための規則である。人手によってこれらのPP抽出規則を作成することもできるが、PP例を収集してサンプルデータを作り、これを機械学習することによって、PP抽出規則を自動生成することも可能である。以下に、PP抽出規則の例を示す。
PP抽出規則1:
[話者の評価の動作を述べたユーザコメントを、形態素解析及び構文解析した結果得られた語彙の中からVerb(嗜好を表現する動詞)、及び、Object(映画関係語句)が検出されると、「Subject(主語)、Object(映画関係語句)、Verb(嗜好を表現する動詞)」なるPPを抽出する。]
PP抽出規則2:
[ユーザからのコメントを形態素解析、及び、構文解析した結果得られた語彙の中から、Subject(映画関係語句)、Verb (be動詞.「is」,「am」など), Complement(評価を示す形容詞)が検出されると、「(Subject(映画関係語句), *, Complement(評価を示す形容詞) 」なるPPを抽出する]。ここで「*」は特定されていないことを示す。
(ロ)「I like this movie.」からPPを抽出する例
「movie」 は、構文解析により、this_movie ( Object / 目的語 )であることが解析されており、また、「製品オントロジー」を参照することにより、カテゴリ「show」の中の「Movie」が検出される。これらにより「movie」は「Object(映画関係語句)」であることがわかる。
次に、「like」は、構文解析により、like ( Verb / 動詞 )であることが解析されており、また、「嗜好表現オントロジー」を参照することにより、嗜好を表現する動詞であることがわかる。ここで、「I like this movie.」は、話者の評価の動作(この例では「like」) を述べたユーザコメントであるので、前述のPP抽出規則1を適用すると、
PP抽出規則1:[話者の評価の動作を述べたユーザコメントを、形態素解析及び構文解析した結果得られた語彙の中からVerb(嗜好を表現する動詞)、及び、Object(映画関係語句)が検出されると、「Subject(主語), Object(映画関係語句), Verb(嗜好を表現する動詞)」なるPPを抽出する。]
PP1:「Subject(主語), Object(映画関係語句), Verb(嗜好を表現する動詞)」
=> (I, this movie, like)
のように抽出することが出来る。
(ハ)「Tom Hanks is great.」 からPPを抽出する例
「Tom Hanks」は構文解析の結果から、Tom_Hanks(Subject/主語)であることが、解析されており、さらに映画オントロジーを参照することにより、「Tom Hanks」はSubject(映画関係語句)であることがわかる。また、嗜好表現オントロジーを参照すると、「great」は評価(evaluation)を示す語句であることが分かる。
同様に、「is」は構文解析の結果から、Verb(動詞)であること、及び、「great」は Complement(補語)であることがわかる。「Tom Hanks is great.」という文に対しては、評価対象(Tom Hanks)と特徴の値(great)はあるが、対象の特徴として何を指しているかがはっきりしていない。このときは、前述のPP抽出規則2を適用すると、
PP抽出規則2:[ユーザからのコメントを形態素解析、及び、構文解析した結果得られた語彙の中から、Subject(映画関係語句)、Verb (be動詞.「is」、「am」など)、Complement(評価を示す形容詞)が検出されると、「(Subject(映画関係語句) , *, Complement(評価を示す形容詞) )なるPPを抽出する。」
「Subject(映画関係語句), Verb (be動詞), Complement(評価を示す形容詞)」
=> (Tom Hanks, *, great)
を抽出することが出来る。ここで「*」は特定されていないことを示す。
(4)ユーザコメントダイジェストの生成(340)
(a)PP間関係抽出規則の適用
PP間関係抽出規則格納部(図3)に、PP間関係抽出規則が格納されている。以下に、PP間関係抽出規則を使用して、複数のPP間の関係に基づき、ユーザコメントダイジェストを生成する例について説明する。複数のPP間を関係付けするための規則を適用してより詳細にユーザの嗜好情報を解析することができる。これによって、一つのユーザコメントをPP群とそれらの間の関係からなるユーザコメントのダイジェストを作ることができる。
(イ)PP間関係抽出規則の例
PP間関係抽出規則とは、複数のPP間の関係に基づき、ユーザコメントダイジェストを生成する為の規則である。人手によってこれらのPP間関係抽出規則を作成することもできるが、PP例を収集してサンプルデータを作り、これを機械学習することによって、PP間関係抽出規則を自動生成することも可能である。以下に、PP間関係抽出規則の例を示す。
PP間関係抽出規則1:
[PP-A(*, movie, 嗜好を表現する動詞) 及びPP-B(movie関連語句, *, 評価を示す形容詞)なる二つのPPが出現したとき、PP-BはPP-Aの評価の理由を表す関係がある]。
PP間関係抽出規則2:
[PP-A(映画名,*,評価を示す語句) 及びPP-B(映画関係の語句,*,評価を示す形容詞) なる二つのPPが一つのコメントの中で近くに出現したとき、PP-BはPP-Aの評価の理由を表す関係がある。
(ロ)ユーザコメントダイジェスト生成の例
例えば、「I like this movie. Tom Hanks is great.」なるユーザコメントは、「I like this movie」、及び、「Tom Hanks is great」のように分けることが出来る。前述のように「I like this movie」からは、 (I, this movie, like)なるPP1が抽出される。ここで、PP1の一番目の要素は「Subject(主語)」であり、二番目の要素は「Object(映画関係語句)」であり、三番目の要素は「Verb(嗜好を表現する動詞)」であり、一方、PP間関係抽出規則1のPP-Aの一番目の要素は「*」であり、二番目の要素は「movie」であり、三番目の要素は「嗜好を表現する動詞」であるので、前述のPP1は、PP間関係抽出規則1のPP-Aの要件を満足する。
同様に、前述のように「Tom Hanks is great」からは (Tom Hanks, *, great)なるPP2が抽出される。ここで、PP2の一番目の要素は「Subject(映画関係の語句)」であり、二番目の要素は「Verb (be動詞)」であり、三番目の要素は「Complement(評価を示す形容詞)」であり、一方、PP間関係抽出規則1のPP-Bの一番目の要素は「movie関連語句」であり、PP-Bの二番目の要素は「*」であり、PP-Bの三番目の要素は「評価を示す形容詞」であるので、前述のPP2は、PP間関係抽出規則1のPP-Bの要件を満足する。
従って、PP1とPP2の間にはPP間関係抽出規則1が適用され、PP2はのPP1の評価の理由を表す関係があることがわかる。このように複数のPP間の関係を見出すことによって、ユーザコメントのダイジェストが表現できる。上述のように生成したPP群を、既に用意されている製品オントロジーや嗜好オントロジーと組み合わせ、ユーザコメントのダイジェストを作成することができる。
(b)ユーザコメントダイジェストの応用例
ユーザコメントダイジェストを製品オントロジー、製品オントロジーなどと一緒に用いると次のような応用が可能となる。特定のユーザのいろいろな製品に対するダイジェストを集め、それがどんな製品に関するものかを解析することによって、そのユーザの関心のある製品・分野などに関する情報を得ることが出来る。例えば、あるユーザによって作成された複数の映画のコメントから (I, this movie, like)なるPPを取り出したとするこのとき、「this movie」 として具体的にどんな映画に対してコメントを書いたのかを調べることによって、このユーザの関心のある映画のカテゴリを推測できる。
特定のユーザの、特定の製品に対するダイジェストを集め、その製品のどの部分、特性に関するものであるかを解析することによって、そのユーザが重視した部分、抱いた印象や感想に関する情報を得る。例えば、前述のPP1,PP2のPPの元になったコメントを書いたユーザは、その映画が気に入ったのは、「Tom Hanks」が出演していたからであるということが推測され、「それでは、Tom Hanksが出演している別の映画を推薦したらどうか」といった推論が可能になる。
ここで、ユーザコメントのダイジェストを用いた推論の例を説明する。
ユーザコメント文の例を以下に示す。ここで Sxは、x番目の文であることを示す。
S1: Sabrina was to me the finest film of the 90's.
S2: The players were extremely charming and enjoyable to watch.
S3: Julia Ormond gave an outstanding performance and she looked so beautiful.
...
S6: Harrison Ford was absolutely splendid in a great role ....
...
S8: The soundtrack is outstanding, with many incredible fine tunes ...
...
次に、これらのユーザコメント文から抽出されるPP群を示す。ここでPPxは、Sxに対応するx番目のPPであることを示す。
PP1: (Sabrina, *, fine film)
PP2: (the players, *, charming)
PP3: (the players, to watch, enjoyable)
PP4: (Julia Ormond, outstanding performance, give)
PP5: (Julia Ormond, *, beautiful)
PP6: (Harrison Ford, great role, splendid)
PP7: (the soundtrack, with fine tunes, outstanding)
ここで、前述のPP間関係抽出規則2を適用する。
PP間関係抽出規則2:[PP_A (映画名,*,評価を示す語句) 及びとPP_B (映画関係の語句,*,評価を示す形容詞) なる二つのPPが一つのコメントの中で近くに出現したとき、PP_BはPP_Aの評価の理由を表す関係がある。]。
上記のPP間関係抽出規則を基に推論すると、PP1はPP間関係抽出規則2のPP_Aに相当し、同様にPP2, PP5, PP6, PP7はPP_Bに相当する。従って、PP2, PP5, PP6, PP7はPP1の理由を表現していると推論できる。
次に、この例を実際に応用すると次のようになる。映画オントロジーを参照することで、PP1にある 「Sabrina」 は映画のタイトルであることがわかるので、このコメントを書いたユーザは、この映画を気に入った理由は、PP2, PP5, PP6, PP7であることがわかる。映画オントロジーによってPP2, PP4, PP5, PP6に俳優に関するものが出現していることが分かるので、このユーザは出演者に関心があることが推測される。以上の応用結果を用いることによって、当該ユーザに、この映画に出演していて、良い評価をしている俳優が出演している別の映画を推薦すると良いことが推測できる。
商品推薦システムへの応用
特定のユーザのいろいろな製品に対するダイジェストを集め、それがどんな製品に関するものかを解析することによって、そのユーザの関心のある製品、分野などに関する情報を得る。例えば、あるユーザの複数の映画のコメントから「I, this movie, like」なるPPを取り出したとする。このとき、this movie として具体的にどんな映画に対してコメントを書いたのかを調べることによって、このユーザの関心のある映画のカテゴリを推測できる。
特定のユーザの、特定の製品に対するダイジェストを集め、その製品のどの部分、特性に関するものであるかを解析することによって、そのユーザがどういう部分を重視しており、どんな印象や感想を持ったかに関する情報を得る。例えば、前述のPP1,PP2のPPの元になったコメントを書いたユーザは、その映画が気に入ったのは、「Tom Hanks」が出演していたからであるということが推測され、「Tom Hanks」が出演している別の映画を推薦することによって、当該ユーザがさらに別の映画を見たいという要求を喚起でき、それによって映画興行の売上増に貢献できる。
本願発明を実施する装置のブロック図である。 本願発明を実施するプログラムのフローチャートである。 PP辞書格納部を示す図である。 製品オントロジーの例を示す図である。 嗜好表現オントロジーの例を示す図である。
符号の説明
100:コンピュータ筐体
110:記憶部
120:中央制御部(CPU)
130:表示部
140:操作部
200:PP辞書格納部
210:製品オントロジー格納部
220:嗜好表現オントロジー格納部
230:シソーラス格納部
240:PP抽出規則格納部
250:PP間関係抽出規則格納部

Claims (12)

  1. 以下の(a)から(c)のステップを有する、ユーザテキストに基づき、ユーザコメントダイジェストを生成する方法、
    (a)前記ユーザテキストの前処理を行うステップ、
    (b)前記前処理されたテキストから、PP辞書格納部に格納されているPP抽出規則を参照し、PPを生成するステップ、
    (c)PP辞書格納部に格納されているPP間関係抽出規則を参照し、前記PP間の関係に基づきユーザコメントダイジェストを生成するステップ。
  2. 前記PP辞書格納部は、さらに、シソーラス格納部、製品オントロジー格納部、及び、嗜好表現オントロジー格納部のいずれか叉は全てを含み、
    前記PPを生成するステップは、さらに、
    (a)シソーラス格納部を参照し、同意語を検索するステップ、
    (b)製品オントロジー格納部を参照し、製品に関する語句間の関係を検索するステップ、
    (c)嗜好表現オントロジー格納部を参照し、ユーザの嗜好に関する語句の関係を検索するステップ、
    のいずれか叉は全てを含む請求項1に記載の方法。
  3. 前記PP辞書格納部は、さらに、シソーラス格納部、製品オントロジー格納部、及び、嗜好表現オントロジー格納部のいずれか叉は全てを含み、
    ユーザコメントダイジェストを生成するステップは、さらに、
    (a)シソーラス格納部を参照し、同意語を検索するステップ、
    (b)製品オントロジー格納部を参照し、製品に関する語句間の関係を検索するステップ、
    (c)嗜好表現オントロジー格納部を参照し、ユーザの嗜好に関する語句の関係を検索するステップ、
    のいずれか叉は全てを含む請求項1及び2に記載の方法。
  4. 前記PPは、前記ユーザテキストに基づき、多くとも3個のデータを含むことを特徴とする請求項1から3に記載の方法。
  5. 以下の(a)から(c)の手段を有する、ユーザテキストに基づき、ユーザコメントダイジェストを生成する装置、
    (a)前記ユーザテキストの前処理を行う手段、
    (b)前記前処理されたテキストから、PP辞書格納部に格納されているPP抽出規則を参照し、PPを生成する手段、
    (c)PP辞書格納部に格納されているPP間関係抽出規則を参照し、前記PP間の関係に基づきユーザコメントダイジェストを生成する手段。
  6. 前記PP辞書格納部は、さらに、シソーラス格納部、製品オントロジー格納部、及び、嗜好表現オントロジー格納部のいずれか叉は全てを含み、
    前記PPを生成する手段は、さらに、
    (a)シソーラス格納部を参照し、同意語を検索する手段、
    (b)製品オントロジー格納部を参照し、製品に関する語句間の関係を検索する手段、
    (c)嗜好表現オントロジー格納部を参照し、ユーザの嗜好に関する語句の関係を検索する手段、
    のいずれか叉は全てを含む請求項5に記載の装置。
  7. 前記PP辞書格納部は、さらに、シソーラス格納部、製品オントロジー格納部、及び、嗜好表現オントロジー格納部のいずれか叉は全てを含み、
    ユーザコメントダイジェストを生成する手段は、さらに、
    (a)シソーラス格納部を参照し、同意語を検索する手段、
    (b)製品オントロジー格納部を参照し、製品に関する語句間の関係を検索する手段、
    (c)嗜好表現オントロジー格納部を参照し、ユーザの嗜好に関する語句の関係を検索する手段、
    のいずれか叉は全てを含む請求項5及び6に記載の装置。
  8. 前記PPは、前記ユーザテキストに基づき、多くとも3個のデータを含むことを特徴とする請求項5から7に記載の装置。
  9. ユーザテキストに基づき、ユーザコメントダイジェストを生成するために、コンピュータを、以下の(a)から(c)の手段、として機能させる為のプログラム、
    (a)前記ユーザテキストの前処理を行う手段、
    (b)前記前処理されたテキストから、PP辞書格納部に格納されているPP抽出規則を参照し、PPを生成する手段、
    (c)PP辞書格納部に格納されているPP間関係抽出規則を参照し、前記PP間の関係に基づきユーザコメントダイジェストを生成する手段。
  10. 前記PP辞書格納部は、さらに、シソーラス格納部、製品オントロジー格納部、及び、嗜好表現オントロジー格納部のいずれか叉は全てを含み、
    前記PPを生成する手段は、さらに、
    (a)シソーラス格納部を参照し、同意語を検索する手段、
    (b)製品オントロジー格納部を参照し、製品に関する語句間の関係を検索する手段、
    (c)嗜好表現オントロジー格納部を参照し、ユーザの嗜好に関する語句の関係を検索する手段、
    のいずれか叉は全てを含む請求項9に記載のプログラム。
  11. 前記PP辞書格納部は、さらに、シソーラス格納部、製品オントロジー格納部、及び、嗜好表現オントロジー格納部のいずれか叉は全てを含み、
    ユーザコメントダイジェストを生成する手段は、さらに、
    (a)シソーラス格納部を参照し、同意語を検索する手段、
    (b)製品オントロジー格納部を参照し、製品に関する語句間の関係を検索する手段、
    (c)嗜好表現オントロジー格納部を参照し、ユーザの嗜好に関する語句の関係を検索する手段、
    のいずれか叉は全てを含む請求項9及び10に記載のプログラム。
  12. 前記PPは、前記ユーザテキストに基づき、多くとも3個のデータを含むことを特徴とする請求項9から11に記載の装置。

JP2004127783A 2004-04-23 2004-04-23 ユーザコメントダイジェストの生成方法・装置・プログラム Withdrawn JP2005309907A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004127783A JP2005309907A (ja) 2004-04-23 2004-04-23 ユーザコメントダイジェストの生成方法・装置・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004127783A JP2005309907A (ja) 2004-04-23 2004-04-23 ユーザコメントダイジェストの生成方法・装置・プログラム

Publications (1)

Publication Number Publication Date
JP2005309907A true JP2005309907A (ja) 2005-11-04

Family

ID=35438594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004127783A Withdrawn JP2005309907A (ja) 2004-04-23 2004-04-23 ユーザコメントダイジェストの生成方法・装置・プログラム

Country Status (1)

Country Link
JP (1) JP2005309907A (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007226468A (ja) * 2006-02-22 2007-09-06 Nippon Telegr & Teleph Corp <Ntt> オントロジの近似度計測装置、オントロジの近似度計測方法およびオントロジの近似度計測ブログラム
JP2007226467A (ja) * 2006-02-22 2007-09-06 Nippon Telegr & Teleph Corp <Ntt> 興味情報生成装置、興味情報生成方法および興味情報生成ブログラム
JP2007241753A (ja) * 2006-03-09 2007-09-20 Nippon Telegr & Teleph Corp <Ntt> 興味情報提供装置、興味情報提供方法および興味情報提供プログラム
JP2007241754A (ja) * 2006-03-09 2007-09-20 Nippon Telegr & Teleph Corp <Ntt> コミュニティ形成支援装置、コミュニティ形成支援方法およびコミュニティ形成支援プログラム
JP2007272975A (ja) * 2006-03-30 2007-10-18 Toshiba Corp オーサリング支援装置、オーサリング支援方法及びプログラム、並びにオーサリング情報共有システム
JP2009064365A (ja) * 2007-09-10 2009-03-26 Sharp Corp お勧め情報提供方法
JP2009176302A (ja) * 2008-01-23 2009-08-06 Palo Alto Research Center Inc 推薦システム用の時間情報および場所情報の言語抽出
JP2009252145A (ja) * 2008-04-10 2009-10-29 Toshiba Corp データ作成装置及び方法
JP2011039811A (ja) * 2009-08-12 2011-02-24 Sony Corp 情報処理装置、情報処理方法、およびプログラム
JP2011180945A (ja) * 2010-03-03 2011-09-15 Dainippon Printing Co Ltd 推薦商品選定装置、推薦商品選定方法、推薦商品選定プログラム及び販売支援システム
JP2013069285A (ja) * 2011-09-23 2013-04-18 Fujitsu Ltd 顧客関係管理技術分野のためのユーザ中心の意見分析
JP2018092632A (ja) * 2013-03-15 2018-06-14 アドバンスド エレメンタル テクノロジーズ,インコーポレイティド 意図的コンピューティングのための方法及びシステム
JP2019125364A (ja) * 2018-01-03 2019-07-25 エヌイーシー ラボラトリーズ ヨーロッパ ゲーエムベーハー マルチモーダルレコメンデーション方法及びシステム
CN111813925A (zh) * 2020-07-14 2020-10-23 混沌时代(北京)教育科技有限公司 一种基于语义的无监督自动摘要方法及系统
JP2024130809A (ja) * 2023-03-15 2024-09-30 Lineヤフー株式会社 情報処理装置、情報処理方法、および情報処理プログラム

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007226467A (ja) * 2006-02-22 2007-09-06 Nippon Telegr & Teleph Corp <Ntt> 興味情報生成装置、興味情報生成方法および興味情報生成ブログラム
JP2007226468A (ja) * 2006-02-22 2007-09-06 Nippon Telegr & Teleph Corp <Ntt> オントロジの近似度計測装置、オントロジの近似度計測方法およびオントロジの近似度計測ブログラム
JP2007241753A (ja) * 2006-03-09 2007-09-20 Nippon Telegr & Teleph Corp <Ntt> 興味情報提供装置、興味情報提供方法および興味情報提供プログラム
JP2007241754A (ja) * 2006-03-09 2007-09-20 Nippon Telegr & Teleph Corp <Ntt> コミュニティ形成支援装置、コミュニティ形成支援方法およびコミュニティ形成支援プログラム
JP2007272975A (ja) * 2006-03-30 2007-10-18 Toshiba Corp オーサリング支援装置、オーサリング支援方法及びプログラム、並びにオーサリング情報共有システム
JP2009064365A (ja) * 2007-09-10 2009-03-26 Sharp Corp お勧め情報提供方法
JP2009176302A (ja) * 2008-01-23 2009-08-06 Palo Alto Research Center Inc 推薦システム用の時間情報および場所情報の言語抽出
US8589390B2 (en) 2008-04-10 2013-11-19 Kabushiki Kaisha Toshiba Data creating apparatus and data creating method
JP2009252145A (ja) * 2008-04-10 2009-10-29 Toshiba Corp データ作成装置及び方法
JP2011039811A (ja) * 2009-08-12 2011-02-24 Sony Corp 情報処理装置、情報処理方法、およびプログラム
JP2011180945A (ja) * 2010-03-03 2011-09-15 Dainippon Printing Co Ltd 推薦商品選定装置、推薦商品選定方法、推薦商品選定プログラム及び販売支援システム
JP2013069285A (ja) * 2011-09-23 2013-04-18 Fujitsu Ltd 顧客関係管理技術分野のためのユーザ中心の意見分析
JP2018092632A (ja) * 2013-03-15 2018-06-14 アドバンスド エレメンタル テクノロジーズ,インコーポレイティド 意図的コンピューティングのための方法及びシステム
JP2019125364A (ja) * 2018-01-03 2019-07-25 エヌイーシー ラボラトリーズ ヨーロッパ ゲーエムベーハー マルチモーダルレコメンデーション方法及びシステム
CN111813925A (zh) * 2020-07-14 2020-10-23 混沌时代(北京)教育科技有限公司 一种基于语义的无监督自动摘要方法及系统
JP2024130809A (ja) * 2023-03-15 2024-09-30 Lineヤフー株式会社 情報処理装置、情報処理方法、および情報処理プログラム

Similar Documents

Publication Publication Date Title
Rambocas et al. Online sentiment analysis in marketing research: a review
US11048882B2 (en) Automatic semantic rating and abstraction of literature
Menner et al. Topic detection: identifying relevant topics in tourism reviews
US20150150023A1 (en) Emotion processing systems and methods
JP2005309907A (ja) ユーザコメントダイジェストの生成方法・装置・プログラム
Raghupathi et al. Customer sentiment appraisal from user-generated product reviews: a domain independent heuristic algorithm
Kumar A multi-criteria decision making approach for recommending a product using sentiment analysis
Marzijarani et al. Opinion mining with reviews summarization based on clustering
Na et al. Comparing sentiment expression in movie reviews from four online genres
Cheng et al. A hybrid recommender system for the mining of consumer preferences from their reviews
JP5872183B2 (ja) 情報処理システム、嗜好可視化システム及び検閲システム並びに嗜好可視化方法
Kumar et al. A weighted sum method MCDM approach for recommending product using sentiment analysis
Alrababah et al. Mining opinionated product features using WordNet lexicographer files
Roshchina TWIN: Personality-based Recommender System
Ren et al. Resource recommendation algorithm based on text semantics and sentiment analysis
JP6735711B2 (ja) 学習装置、映像検索装置、方法、及びプログラム
Koolen et al. ‘This book makes me happy and sad and I love it’. A Rule-based Model for Extracting Reading Impact from English Book Reviews
Martina et al. A virtual assistant for the movie domain exploiting natural language preference elicitation strategies
Yu et al. Extracting and clustering of story events from a story corpus
Lee Use-centric mining of customer reviews
Pulikonda et al. Exploring the Applications, Challenges, and Issues of Sentiment Analysis
Roshchina et al. Evaluating the similarity estimator component of the TWIN personality-based recommender system
Abirami et al. Sentiment analysis
Kumar et al. Predicting depression by analysing user tweets
Alfrjani et al. Exploiting domain knowledge and public linked data to extract opinions from reviews

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070703