JP2012141837A - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP2012141837A
JP2012141837A JP2011000028A JP2011000028A JP2012141837A JP 2012141837 A JP2012141837 A JP 2012141837A JP 2011000028 A JP2011000028 A JP 2011000028A JP 2011000028 A JP2011000028 A JP 2011000028A JP 2012141837 A JP2012141837 A JP 2012141837A
Authority
JP
Japan
Prior art keywords
evaluator
text
opinion
information processing
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011000028A
Other languages
English (en)
Inventor
Shingo Takamatsu
慎吾 高松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2011000028A priority Critical patent/JP2012141837A/ja
Publication of JP2012141837A publication Critical patent/JP2012141837A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】単純な感想ではない作為的な意図が組み込まれたテキストを判別し、かかる作為的な文章が表示されてしまうことを防止することが可能な、情報処理装置、情報処理方法及びプログラムを提供すること。
【解決手段】本発明に係る情報処理装置は、評価対象事象に対する評価者の意見が記載されたテキストデータと、当該テキストデータに関するメタデータとを少なくとも含むテキスト関連データ群に基づいて、評価者の意見に含まれる当該評価者の意図、及び、評価対象事象の内容に依存しない評価者の意見の特徴に関する特徴量を算出する特徴量算出部と、算出された特徴量に基づいて、テキストデータを、評価者が作為的に生成した意見が記載された作為テキストと、評価者が作為的に生成した意見を含まない非作為テキストとに分類し、評価者の意見を閲覧する閲覧者に表示するテキストデータを選択する表示テキスト選択部と、を備える。
【選択図】図1

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。
近年、情報処理技術の発達に伴い、インターネット等のネットワーク上に存在するウェブサイトに対して、様々な対象に関してユーザが記述した感想がレビュー文として掲載されるようになってきている。このようなレビュー文は、他のユーザが感想の対象となっている事柄に対して行動をとる際に、有益な情報として参考にされることが多い。このようなレビュー文を効率良く収集することができれば、ユーザは、ある対象に対して行動を起こす際に、有益な情報を効率良く得ることが可能となる。
そのため、以下の特許文献1では、あるコンテンツに関する評判をウェブサイトから収集する方法が開示されている。
特開2009−15407号公報
Peter Turney,"Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews",In Proceedings of ACL−02,40th Annual Meeting of the Association for Computational Linguistics(2002),pp.417−424.
ところで、ある特定の動機を持ったユーザが偏ったレビュー文(以下、単にレビューともいう。)を記述してウェブサイト等に投稿することにより、レビューに単純な感想ではない意図が組み込まれてしまうという問題がある。このような作為的なレビュー文が投稿されることで、かかる投稿を閲覧したユーザは、作為的に投稿されたレビュー文により影響を受けてしまうこととなる。
上記特許文献1に記載されている技術では、ある話題に対して投稿されたレビューを収集して、閲覧者に全て提示してしまうため、上述のような問題に対して対応することができなかった。
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、単純な感想ではない作為的な意図が組み込まれたテキストを判別し、かかる作為的な文章が表示されてしまうことを防止することが可能な、情報処理装置、情報処理方法及びプログラムを提供することにある。
上記課題を解決するために、本発明のある観点によれば、評価対象事象に対する評価者の意見が記載されたテキストデータと、当該テキストデータに関するメタデータとを少なくとも含むテキスト関連データ群に基づいて、前記評価者の意見に含まれる当該評価者の意図、及び、前記評価対象事象の内容に依存しない前記評価者の意見の特徴に関する特徴量を算出する特徴量算出部と、算出された前記特徴量に基づいて、前記テキストデータを、前記評価者が作為的に生成した意見が記載された作為テキストと、前記評価者が作為的に生成した意見を含まない非作為テキストとに分類し、前記評価者の意見を閲覧する閲覧者に表示する前記テキストデータを選択する表示テキスト選択部と、を備える情報処理装置が提供される。
前記情報処理装置は、算出された前記特徴量を利用して選択された前記テキストデータ、及び、前記評価対象事象の内容に依存しない評価者の意見の特徴に基づいて生成された教師データと、算出された前記特徴量とに基づいて、前記作為テキストを分類するために用いられる分類器を生成するとともに、生成した前記分類器の管理を行う分類器管理部を更に備え、前記表示テキスト選択部は、算出された前記特徴量に基づく前記分類器の分類結果を利用して、前記閲覧者に表示するテキストデータを選択することが好ましい。
前記特徴量算出部は、前記評価者の意図に関する前記特徴量として、前記評価者の意見から示唆される当該評価者の感情を数値化した感情特徴量を算出することが好ましい。
前記特徴量算出部は、前記評価対象事象の内容に依存しない評価者の意見の特徴に関する前記特徴量として、前記テキストの長さを示す文長特徴量を算出することが好ましい。
前記特徴量算出部は、前記評価対象事象の内容に依存しない評価者の意見の特徴に関する前記特徴量として、前記評価者が生成した前回の意見との時間間隔を示すタイミング特徴量を算出することが好ましい。
前記特徴量算出部は、前記感情特徴量として、前記評価者の意見に含まれる肯定の度合いを示すポジティブ値と、前記評価者の意見に含まれる否定の度合いを示すネガティブ値と、を算出することが好ましい。
前記分類器管理部は、所定数以上の前記評価者の意見が登録されている前記評価対象事象を選択し、選択した当該評価対象事象に登録されている前記評価者の意見を算出された前記特徴量の少なくとも一つに基づいて順位付けし、順位付けの結果に基づいて前記教師データを生成してもよい。
前記分類器管理部は、算出された前記特徴量の少なくとも一つに基づいて全ての前記評価対象事象に関する前記評価者の意見を順位付けし、順位付けの結果に基づいて前記教師データを生成してもよい。
前記表示テキスト選択部は、前記閲覧者により行われた前記情報処理装置への操作に応じて、前記閲覧者に対して表示しないように選択した前記評価者の意見を、前記閲覧者へ表示するように設定を変更してもよい。
前記表示テキスト選択部は、前記評価者以外の閲覧者により投票された当該評価者の意見に対する同意の度合いを表す投票値が所定の閾値以上となった場合に、前記閲覧者に対して表示しないように選択した前記評価者の意見を、前記閲覧者へ表示するように設定を変更してもよい。
また、上記課題を解決するために、本発明の別の観点によれば、評価対象事象に対する評価者の意見が記載されたテキストデータと、当該テキストデータに関するメタデータとを少なくとも含むテキスト関連データ群に基づいて、前記評価者の意見に含まれる当該評価者の意図、及び、前記評価対象事象の内容に依存しない前記評価者の意見の特徴に関する特徴量を算出するステップと、算出された前記特徴量に基づいて、前記テキストデータを、前記評価者が作為的に生成した意見が記載された作為テキストと、前記評価者が作為的に生成した意見を含まない非作為テキストとに分類し、前記評価者の意見を閲覧する閲覧者に表示する前記テキストデータを選択するステップと、を含む情報処理方法が提供される。
また、上記課題を解決するために、本発明の更に別の観点によれば、コンピュータに、評価対象事象に対する評価者の意見が記載されたテキストデータと、当該テキストデータに関するメタデータとを少なくとも含むテキスト関連データ群に基づいて、前記評価者の意見に含まれる当該評価者の意図、及び、前記評価対象事象の内容に依存しない前記評価者の意見の特徴に関する特徴量を算出する特徴量算出機能と、算出された前記特徴量に基づいて、前記テキストデータを、前記評価者が作為的に生成した意見が記載された作為テキストと、前記評価者が作為的に生成した意見を含まない非作為テキストとに分類し、前記評価者の意見を閲覧する閲覧者に表示する前記テキストデータを選択する表示テキスト選択機能と、を実現させるためのプログラムが提供される。
以上説明したように本発明によれば、単純な感想ではない作為的な意図が組み込まれたテキストを判別し、かかる作為的な文章が表示されてしまうことを防止することができる。
本発明の第1の実施形態に係る情報処理装置の構成を示したブロック図である。 同実施形態に係るテキスト関連データ群の一例を示した説明図である。 同実施形態に係る特徴量算出部で算出される特徴用の一例を示した説明図である。 同実施形態に係る情報処理装置に表示される表示画面の一例を示した説明図である。 同実施形態に係る情報処理装置に表示される表示画面の一例を示した説明図である。 同実施形態に係る情報処理方法の全体的な流れの一例を示した流れ図である。 同実施形態に係る分類器の生成処理の流れの一例を示した流れ図である。 同実施形態に係る意見の表示処理の流れの一例を示した流れ図である。 本発明の実施形態に係る情報処理装置のハードウェア構成を示したブロック図である。
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
なお、説明は、以下の順序で行うものとする。
(1)作為的なレビュー文がユーザに与える影響について
(2)第1の実施形態
(2−1)情報処理装置の構成について
(2−2)表示画面の一例について
(2−3)情報処理方法の流れについて
(3)本発明の実施形態に係る情報処理装置のハードウェア構成について
(4)まとめ
(作為的なレビュー文がユーザに与える影響について)
本発明の実施形態に係る情報処理装置及び情報処理方法について説明するに先立ち、作為的なレビュー文がユーザに与える影響について、まず簡単に説明する。
インターネット等のネットワーク上に存在する各種のウェブサイトでは、様々な対象(例えば、各種の物品や各種のサービス等がある。以下、評価対象事象ともいう。)に対して、ユーザが記述した感想や評価がレビュー文として掲載されている。このようなレビュー文は、他のユーザが、評価対象事象に対して行動をとる際に参考にされるものとなる。
例えば「旅行」という対象を扱うウェブサイトでは、「ホテルA」に宿泊したユーザが、「ホテルA」の感想としてレビューを記述し、かかるレビュー文がウェブサイトに掲載されることとなる。「ホテルA」への宿泊を検討している他のユーザは、掲載されているレビュー文を参考にすることによって、「ホテルA」に宿泊するかどうかを決定することができる。
しかしながら、ある特定の動機を持ったユーザが偏ったレビュー文を記述して投稿することにより、レビュー文に単純な感想ではない作為的な意図が組み込まれてしまうという問題がある。以下の説明では、単純な感想ではない作為的な意図が組み込まれたレビュー文(おとりとして使われるような、いわゆるヤラセのレビュー文)を、作為レビューや作為テキストと称することとする。
上記の旅行に関する対象を例にとると、「ホテルA」の従業員が、「ホテルの宿泊客を増やしたい」という動機のもとで「ホテルA」を過剰に評価したレビューを投稿したり、競合している他のホテルを過剰に貶めるレビューを投稿したりすることが考えられる。このようなレビューが投稿されると、他のユーザは、純粋な「ホテルA」の感想ではない意図や、純粋な他のホテルの感想ではない意図により、影響を受けることとなる。
特に、いわゆる「ロングテール(long tail)」という概念のテールに属するレビュー対象では、その対象を利用するユーザ数が少ないため、作為レビューの比率が大きくなり、ユーザに与える影響がより大きくなってしまう。
本発明者らは、以上のような問題について検討を行った結果、ユーザが信頼感を持ってレビューを参考にするために、ユーザの利用が少ない対象であっても作為レビューを除去することが可能な技術が必要であることに想到した。
かかる技術を実現するために、本発明者らが検討を行った結果、作為レビューを除去するための方法として、レビューを読んだユーザがレビューを評価し、その評価を参考にして作為レビューを判定するような方法にまず着目した。しかしながら、かかる方法は、大多数のユーザが着目する「ロングテール」概念の「ヘッド」に属する対象には適用可能なものの、ごく一部のユーザが着目する「ロングテール」概念の「テール」に属する対象には適用することができないことに想到した。
例えば、「現在話題の映画」のように多数のレビューが投稿されうる対象については多数のユーザによる評価が期待できるが、ある都市の「ホテル」に関するレビューのように投稿されるレビューの数が多数とはならない対象物については、十分な評価を期待することができず、作為レビューの正確な除去の実現が困難になる可能性がある。
かかる技術を実現するための別の方法として、予め人手を用いて作為レビューを抽出し、抽出した作為レビューを用いて教師データを生成したうえで、かかる教師データを用いて作為レビューとそうではないレビューとを分類する分類器を構成する手法も考えられる。しかしながら、こうした教師データはレビュー対象の領域(すなわち、評価対象事象の内容)ごとに生成することが必要であり、多くの領域や新たな領域に対応するためには、膨大なコストが必要となる。
例えば、映画という領域で生成した分類器は、映画特有の単語等に依存するため、映画以外の領域(例えば、ホテルという領域)に適用すると、その性能が著しく悪化するという問題がある。
本発明者らは、以上のような検討に基づいたうえで更なる検討を行った結果、以下で説明するような、本発明の実施形態に係る情報処理装置及び情報処理方法に想到した。
(第1の実施形態)
<情報処理装置の構成について>
まず、図1〜図3を参照しながら、本発明の第1の実施形態に係る情報処理装置の構成について、詳細に説明する。図1は、本実施形態に係る情報処理装置の構成を示したブロック図であり、図2は、本実施形態に係るテキスト関連データ群の一例を示した説明図であり、図3は、本実施形態に係る特徴量算出部で算出される特徴用の一例を示した説明図である。
本実施形態に係る情報処理装置10は、図1に例示したように、テキスト関連データ群取得部101と、特徴量算出部103と、分類器管理部105と、表示テキスト選択部107と、表示制御部109と、通信制御部111と、記憶部113と、を主に備える。
テキスト関連データ群取得部101は、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等により実現される。テキスト関連データ群取得部101は、評価対象事象に対する評価者の意見が記載されたテキストデータと、当該テキストデータに関するメタデータとを少なくとも含むテキスト関連データ群を取得する。
テキスト関連データ群取得部101は、かかるテキスト関連データ群を、後述する通信制御部111を介して、ホームネットワークやインターネット等の各種ネットワーク3上に存在する情報処理装置や情報管理サーバ等から取得することが可能である。また、テキスト関連データ群取得部101は、テキスト関連データ群を、各種のケーブルや無線通信等を介して情報処理装置10に直接接続された各種の装置から取得することも可能である。また、本実施形態に係る情報処理装置10そのものが、かかるテキスト関連データ群を管理するテキスト関連データ群管理機能を有する装置(例えば情報管理サーバ等)である場合には、テキスト関連データ群取得部101は、自装置内の所定の箇所(例えば、記憶部113内の所定の格納領域)に格納されているテキスト関連データ群を取得することも可能である。
図2は、テキスト関連データ群取得部101が取得するテキスト関連データ群の一例を示した説明図である。図2に示したように、テキスト関連データ群には、評価者によって作成されたレビュー文に対応するテキストデータや、かかるテキストデータに関するメタデータが含まれている。テキストデータに関するメタデータの例として、図2に示したように、評価者(すなわち、レビュー文の投稿者)に関する情報や、レビュー文が投稿された日時に関する情報や、レビュー文に同意するユーザ数を示した値である投票数に関する情報等を挙げることができる。また、テキストデータに関するメタデータは、上記の例に限定されるわけではなく、上記のもの以外にも、例えば、投稿ユーザのレビュー文投稿履歴に関する情報や、投票数の増加履歴に関する情報等の各種情報を挙げることができる。
なお、図2に示した例では、テキストデータの本体と、テキストデータに関するメタデータとが、同一のテーブル内に記載されている状態で図示しているが、テキストデータの本体とメタデータとは、同一のデータ内に存在していてもよく、それぞれが異なるデータとして存在していてもよい。
テキスト関連データ群取得部101は、取得したテキスト関連データ群を、後述する特徴量算出部103に出力する。また、テキスト関連データ群取得部101は、取得したテキスト関連データ群を、後述する表示テキスト選択部107に出力してもよい。
また、テキスト関連データ群取得部101は、取得したテキスト関連データ群に、当該データ群を取得した日時等に関する時刻情報を関連付けて、後述する記憶部113に履歴情報として記録してもよい。
特徴量算出部103は、例えば、CPU、ROM、RAM等により実現される。特徴量算出部103は、テキスト関連データ群に基づいて、(i)評価者(すなわちレビュー文の寄稿者)の意見に含まれる評価者の意図、及び、(ii)評価対象事象の内容に依存しない評価者の意見(テキスト)の特徴、に関する特徴量を算出する。
ここで、本実施形態に係る特徴量算出部103は、レビュー文中に含まれる単語の出現頻度を特徴量として算出しない。単語の出現頻度を考慮する際に着目する単語は、評価対象領域(評価する対象物)の内容に大きく依存するものであり、作為テキストを判断する際の特徴量としてこのような特徴量を利用してしまうと、多くの領域(又は、新規の領域)にも適用可能な特徴量とすることができないからである。
本実施形態に係る特徴量算出部103は、評価対象事象の内容を特徴づける特徴量を算出するのではなく、意見に含まれる評価者の意図と、内容には依存しておらず、意見を特徴づけるものと、を組み合わせて特徴量とする。このような特徴量を用いることで、多くの領域(評価対象事象)や新たな領域にも、特徴量の算出方法を大幅に変更することなく、容易に適用が可能となる。
ここで、評価者の意図に関する特徴量として、評価者の意見から示唆される当該評価者の感情を数値化した感情特徴量を挙げることができる。この感情特徴量には、評価者の意見に含まれる肯定の度合いを示すポジティブ値と、評価者の意見に含まれる否定の度合いを示すネガティブ値とが含まれる。
ポジティブ値は、その文書を読んだユーザが、ポジティブな印象を受ける度合いが大きいほど大きな値になる感情特徴量である。逆に、ネガティブ値は、その文書を読んだユーザがネガティブな印象を受ける度合いが大きいほど大きな値になる感情特徴量である。
本実施形態で着目する作為テキスト(作為レビュー)は、文章を参照したユーザに意図的(作為的)にポジティブな印象あるいはネガティブな印象を与えることが目的であるため、これらの値に偏りを持つこととなる。また、これらの値は、レビュー文の感情的な度合いを示すため、レビュー対象の領域に依存するものではない。
本実施形態に係る特徴量算出部は、ある文書に対して、ポジティブ値及びネガティブ値を算出する公知の技術を利用して、テキスト関連データ群に含まれる各レビュー文に対してポジティブ値及びネガティブ値を算出する。かかる技術は、特に限定されるものではないが、例えば、上記非特許文献1に記載された技術を用いることが可能である。
また、本実施形態に係る特徴量算出部103は、評価対象事象の内容に依存しない評価者の意見(テキスト)の特徴に関する特徴量を算出する。かかる特徴量として、例えば、レビュー文の長さと、レビュー文が再投稿されたタイミングを挙げることができる。
ここで、特徴量算出部103が算出するレビューの長さは、例えばレビューの単語数とする。長さ(単語数)の短いレビュー文は、作為レビューである場合が多いため、かかる特徴量に着目することで、評価対象事象の内容にかかわらず効率良く作為レビューの抽出を行うことが可能となる。
また、レビュー文が再投稿されたタイミングとは、あるユーザが前回投稿したレビュー文と今回投稿したレビュー文との時間間隔である。どのユーザがいつレビュー文を投稿したかについては、テキスト関連データ群に含まれるメタデータを参照することで特定することができる。再投稿タイミング(投稿間隔)が短い場合には、機械的に書かれた文章である可能性が高いため、作為レビューである場合が多い。従って、かかる特徴量に着目することで、評価対象事象の内容にかかわらず効率良く作為レビューの抽出を行うことが可能となる。
なお、特徴量算出部103は、かかるタイミングに関する特徴量を常に算出するようにしてもよく、投稿間隔が一日未満の場合だけタイミングに関する特徴量を算出するものとし、投稿間隔が一日以上の場合は一定値を算出するようにしてもよい。
以上説明したような特徴量は、本実施形態に係る特徴量算出部103が算出する特徴量の主たるものであって、これらの特徴量以外にも様々な特徴量を算出することができる。例えば、本実施形態に係る特徴量算出部103は、レビュー文が投稿された時刻を特徴量として利用することも可能であり、レビュー文の内容に対して同意した参照ユーザの数を示す投票数の増加の割合や増加速度を特徴量としてもよい。
本実施形態に係る特徴量算出部103は、以上説明したような特徴量を算出すると、算出した特徴量を、後述する分類器管理部105及び表示テキスト選択部107に出力する。また、特徴量算出部103は、算出した特徴量を表すデータに、当該特徴量を算出した日時等に関する時刻情報を関連付けて、履歴情報として後述する記憶部113に格納してもよい。
なお、本実施形態に係る特徴量算出部103は、上述のような特徴量を算出するために、更に、形態素解析機能、構文解析機能及び意味解析機能といった各種の言語認識機能と、これら解析機能に利用される各種の辞書ファイル等を有していてもよい。
分類器管理部105は、例えば、CPU、ROM、RAM等により実現される。分類器管理部105は、(1a)算出された特徴量を利用して選択されたテキストデータ、及び、(1b)評価対象事象の内容に依存しない評価者の意見の特徴に基づいて生成された教師データと、(2)算出された特徴量と、に基づいて、作為テキストを分類するために用いられる分類器を生成するとともに、生成した分類器の管理を行う。
分類器管理部105は、まず、算出された特徴量を利用して選択されたテキストデータと、評価対象事象の内容に依存しない評価者の意見の特徴を表す特徴量に基づいて、いわゆる教師データを生成する。
教師データの生成には、各種の方法を利用することが可能であるが、例えば以下のような方法で、教師データを生成することができる。
例えば、分類器管理部105は、所定数以上のレビュー文が登録されている評価対象事象を選択し、選択した評価対象事象に登録されているレビュー文を、算出された特徴量の少なくとも一つに基づいて順位付けを行う。その後、分類器管理部105は、順位付けの結果に基づいて教師データを生成することができる。
先に説明したように、あまりにポジティブ値が高くネガティブ値が低いレビューは意図的である(すなわち、作為レビューである)と考えることができる。同様に、あまりにポジティブ値が低くネガティブ値が高いレビューについても意図的である(すなわち、作為レビューである)と考えることができる。
そこで、分類器管理部105は、所定数(例えば、5つ以上)のレビュー文が投稿されているレビュー対象について、ポジティブ値が最大であるレビュー文と、ネガティブ値が最大であるレビュー文と、を作為レビューであると判断する。また、分類器管理部105は、所定数(例えば、5つ以上)のレビュー文が投稿されているレビュー対象について、上記以外のレビュー文を、作為レビューではないレビュー文(すなわち、非作為レビュー・非作為テキスト)であると判断する。
分類器管理部105は、これら2種類のレビュー(作為レビュー及び非作為レビュー)を分類するように、算出した特徴量を利用して分類機を生成する。ここで、ポジティブ値及びネガティブ値以外の特徴量を利用するのは、レビューの長さとタイミングも作為レビューの手がかりとなりうるからである。
分類器管理部105は、分類器の学習・予測に、いわゆる機械学習の分野における公知の技術を適用可能であるが、例えば、サポートベクターマシン(Support Vector Machine)を利用する。
このようにして生成した分類器を利用することで、所定数未満(例えば、5つ未満)のレビューが投稿されているレビュー対象に関するレビュー文であっても、作為レビューか否かを判断することが可能となる。こうすることによって、本実施形態に係る情報処理装置10では、いわゆる「ロングテール」のテールに対応するレビュー文についても、作為レビューか否かを判断することができる。また、かかる分類器は、レビュー対象の領域に依存しないものであるため、新規の領域のレビュー文に対しても、作為レビューを精度よく抽出することが可能となる。
また、レビュー文が増えると、教師データも増えることとなる。そのため、分類器管理部105は、所定のタイミングで分類器を再学習させるような管理処理を行うことが好ましい。これにより、分類器の精度を更に向上させることが可能となる。また、後述するような表示テキストの選択処理結果に基づいて、分類器を再学習させることも可能である。
なお、分類器管理部105は、算出された特徴量の少なくとも一つに基づいて全ての評価対象事象に関するレビュー文を順位付けし、順位付けの結果に基づいて教師データを生成してもよい。
分類器管理部105は、以上説明したようにして生成及び管理を行っている各種の分類器に対応するプログラムやデータ群等を、後述する記憶部113に格納してもよい。
分類器管理部105は、以上説明したような分類器を利用して、後述する表示テキスト選択部107からの要請により、テキスト関連データ群及び算出された特徴量に基づいて、ある評価対象事象に関して投稿されているレビュー文の分類を行うことができる。分類器管理部105は、あるテキスト関連データ群について、レビュー文の分類処理が終了すると、得られた分類結果を、表示テキスト選択部107に出力する。
表示テキスト選択部107は、例えば、CPU、ROM、RAM等により実現される。表示テキスト選択部107は、算出された特徴量に基づいて、テキストデータを、作為テキストと非作為テキストとに分類し、閲覧者に表示するテキストデータを選択する。
本実施形態に係る表示テキスト選択部107は、より詳細には、算出された特徴量に基づく分類器の分類結果を利用して、閲覧者に表示するテキストデータを選択する。具体的には、表示テキスト選択部107は、分類器管理部105から出力された分類結果を参照して、非作為テキストに分類されているレビュー文を特定し、非作為テキストに分類されているレビュー文を、レビュー文をユーザに提示するための初期表示画面に表示するレビュー文として選択する。その後、表示テキスト選択部107は、レビュー文の選択結果を示すデータを表示制御部109に出力する。
これにより、以下で説明する表示制御部109では、非作為レビューと判断されたレビュー文を初期表示画面に表示させることが可能となる。
なお、表示テキスト選択部107は、レビュー文の選択結果を示すデータを、後述する通信制御部111を介して、情報処理装置10の外部に設けられた装置に提供することも可能である。
表示制御部109は、例えば、CPU、ROM、RAM等により実現される。表示制御部109は、本実施形態に係る情報処理装置10が備えるディスプレイ等の表示装置に表示される表示画面の制御を行う。また、表示制御部109は、情報処理装置10が備えるキーボード、マウス、タッチパネル等の入力装置に入力されるユーザ操作に対応するユーザ操作情報等に応じて、表示画面に表示されている内容を変更する。
具体的には、表示制御部109は、マウスポインタ等の位置指定オブジェクトが表示されている位置(表示画面における位置)や、当該位置指定オブジェクトにより選択された領域(表示画面における領域)等を特定することが可能である。
また、表示画面に表示されている各種のオブジェクト(例えば、各種処理を実施するためのアイコンやスライドバー等)が位置指定オブジェクト等により選択されたり、ドラッグ処理等の各種操作がなされたりした場合に、表示制御部109は、ユーザ操作情報に基づいて、どのオブジェクトが選択されたり操作されたりしたのかを特定することができる。
これにより、表示制御部109は、上述のようなユーザ操作により、ある評価対象事象に関するレビュー文を閲覧するための閲覧開始アイコン等のオブジェクトが操作されると、かかる操作がなされたことを特定して、表示テキスト選択部107が選択したテキストの表示を開始する。
また、表示制御部109は、表示画面内に表示している各種機能を実現するためのアイコン等のオブジェクトが操作されると、操作されたオブジェクトがどれであるかを特定して、操作されたオブジェクトに対応する機能を実現可能な処理部に対して、処理の開始を要請する。
なお、表示制御部109は、情報処理装置10の表示画面に表示する内容として、記憶部113等に格納されている各種の情報や、ネットワーク3を介して取得した各種の情報等を利用することが可能である。
通信制御部111は、例えば、CPU、ROM、RAM、通信装置等により実現される。通信制御部111は、本実施形態に係る情報処理装置10と、情報処理装置10の外部に設けられた装置との間で相互に行われる通信の制御を行う。情報処理装置10の外部に設けられた装置は、各種のケーブルや無線通信等により情報処理装置10に直接接続された装置であってもよく、ホームネットワークやインターネット等の各種のネットワーク3上に接続された、各種の情報処理装置や情報管理サーバ等であってもよい。
記憶部113は、本実施形態に係る情報処理装置10が備えるストレージ装置の一例である。記憶部113には、分類器管理部105が生成・管理している各種の分類器に対応するプログラムやデータ群等が格納される。また、記憶部113には、テキスト関連データ群取得部101が取得した各種のテキスト関連データ群や、特徴量算出部103が算出した特徴量等が格納されてもよい。また、記憶部113には、テキスト関連データ群の取得履歴、特徴量の算出履歴、分類器の更新(再学習)履歴など、各種の履歴情報が記録されていてもよい。さらに、記憶部113には、本実施形態に係る情報処理装置10が、何らかの処理を行う際に保存する必要が生じた様々なパラメータや処理の途中経過等、または、各種のデータベースやプログラム等が、適宜記録される。この記憶部113は、本実施形態に係る情報処理装置10が備える各処理部が自由に読み書きを行うことが可能である。
以上、本実施形態に係る情報処理装置10の機能の一例を示した。上記の各構成要素は、汎用的な部材や回路を用いて構成されていてもよいし、各構成要素の機能に特化したハードウェアにより構成されていてもよい。また、各構成要素の機能を、CPU等が全て行ってもよい。従って、本実施形態を実施する時々の技術レベルに応じて、適宜、利用する構成を変更することが可能である。
なお、上述のような本実施形態に係る情報処理装置の各機能を実現するためのコンピュータプログラムを作製し、パーソナルコンピュータ等に実装することが可能である。また、このようなコンピュータプログラムが格納された、コンピュータで読み取り可能な記録媒体も提供することができる。記録媒体は、例えば、磁気ディスク、光ディスク、光磁気ディスク、フラッシュメモリなどである。また、上記のコンピュータプログラムは、記録媒体を用いずに、例えばネットワークを介して配信してもよい。
<表示画面の一例について>
次に、図4及び図5を参照しながら、本実施形態に係る情報処理装置10が備えるディスプレイ等の表示装置に表示される表示画面の一例について、具体的に説明する。なお、以下の例では、情報処理装置10が備える表示装置に各種情報が表示される場合について説明を行うが、情報処理装置10の外部に設けられた表示装置についても、同様の表示画面が表示されるものとする。
なお、以下の説明では、情報処理装置10が図2に示した「ホテルA」に関するテキスト関連データ群を取得し、図3に示した特徴量を算出した場合について説明する。なお、以下の説明では、一つの表示画面内に表示されるレビュー文の最大数は、3であるものとするが、一画面内に表示される最大レビュー数は、かかる場合に限定されるわけではない。
ある評価対象事象に関するレビュー文の閲覧を開始する操作が行われると、例えば図4に示したような初期画面が表示制御部109により表示される。表示制御部109は、かかる初期画面として、表示画面201内に、表示を行っている評価対象事象を表示する評価対象事象表示領域203と、かかる評価対象事象に関するレビュー文のうち、表示テキスト選択部107により選択されたレビュー文に関する各種メタデータ等が表示されるメタデータ表示領域205とを生成する。また、表示制御部109は、レビュー文自体の表示が許可されているレビュー文が存在する場合には、かかるレビュー文に対して、レビュー文の内容が表示される文章表示領域207を生成する。
また、メタデータ表示領域205の内部には、レビュー文の内容に同意したユーザ数が表示されるとともに、寄稿者以外のユーザがレビュー文の内容に同意した旨を投票するための投票ボタン209が設けられる。また、レビュー文の内容の表示が許可されていないレビュー文に対しては、ユーザがレビュー文の表示を手動で指示するための表示ボタン211が設けられる。
図2及び図3に示したテキスト関連データ群の場合、最も新しいレビュー文から順に、上から3番目までのレビュー文が表示される可能性があるが、ユーザ「saburo」が記述した文章は、negative値が最大となったレビュー文であるため、作為テキストと判断されて表示されていない。また、ユーザ「jiro」が記述した文章は、分類器管理部105により生成された分類器により作為テキストと判断されたために、レビュー文の内容自体は表示されていないものとする。
かかる場合、非作為テキストに該当するレビュー文は、ユーザ「taro」が記述した文章であるため、ユーザ「taro」が記述したレビュー文の内容が、文章表示領域207内に表示されている。
ここで、他のユーザが操作した投票ボタン209により、ユーザ「jiro」のレビュー文に対する投票数が所定の投票数を超えたものとする。かかる場合には、図5に示したように、ユーザ「jiro」が記述した文章を表示するための文章表示領域207が新たに設けられ、ユーザ「jiro」が記載したレビュー文の内容が新たに表示されることとなる。
なお、本実施形態に係る表示画面が上述の例に限定されるわけではなく、他の表示態様についても、適宜実施することが可能である。
例えば、ユーザがレビュー表示モードを選択できるようにすることが可能である。上記例では、最大ポジティブ値及び最大ネガティブ値を有するレビュー文を表示しない場合について説明したが、その他にも、(a)すべてのレビュー文を表示する、(b)ポジティブ値が高いレビュー文のみを表示する、(c)ネガティブ値の高いレビュー文のみを表示する、等の表示モードをユーザが選択可能なようにしてもよい。また、例えば友人として登録しているユーザのレビュー文は無条件で表示するなどの表示モードをユーザが選択可能なようにしてもよい。
また、表示制御部109は、ポジティブ値又はネガティブ値の偏りが大きいレビュー文を表示画面201の下方に表示されるように表示制御を行ってもよい。かかる表示方法を行うことによって、作為テキストの可能性の高いレビュー文が、ユーザの目に入りにくくなるという効果を得ることができる。
また、表示制御部109は、ポジティブ値又はネガティブ値の偏りが大きいレビュー文を、他のレビュー分(すなわち、非作為テキスト)とは異なる表示方法となるように表示制御を行っても良い。かかる場合の表示例として、ポジティブ値又はネガティブ値の偏りが大きいレビュー文を文字色が薄くなるように表示させる等が考えられる。
<情報処理方法の流れについて>
続いて、図6〜図8を参照しながら、本実施形態に係る情報処理装置10で実施される情報処理方法(より詳細には、表示テキストの選択方法及びテキストの表示制御方法)について、その流れの一例を簡単に説明する。
[全体的な流れについて]
まず、図6を参照しながら、本実施形態に係る情報処理方法の全体的な流れについて説明する。
本実施形態に係る情報処理装置10のテキスト関連データ群取得部101は、生成/投稿された意見(レビュー)を含むテキスト関連データ群を、各種装置又は自装置から取得する(ステップS101)。その後、テキスト関連データ群取得部101は、取得したテキスト関連データ群を、特徴量算出部103に出力する。
次に、特徴量算出部103は、テキスト関連データ群取得部101からテキスト関連データ群が出力されると、テキスト関連データ群に基づいて上述のような特徴量を算出し(ステップS103)、分類器管理部105及び表示テキスト選択部107に出力する。
分類器管理部105は、テキスト関連データ群及び特徴量に基づいて教師データを生成し、分類器の生成及び管理を実施する(ステップS105)。また、分類器管理部105は、表示テキスト選択部107からの要請に応じて、かかる分類器を利用することで取得した意見(レビュー)の中から作為テキストを特定し(ステップS107)、特定結果を表示テキスト選択部107に出力する。
その後、表示テキスト選択部107は、分類器管理部105による作為テキストの特定結果に基づいて、閲覧者であるユーザに提示する意見(レビュー)を選択し(ステップS109)、選択結果を表示制御部109に出力する。
続いて、表示制御部109は、表示テキスト選択部107から出力された選択結果に基づいて、選択された意見を表示画面に表示する(ステップS111)。
[分類器の生成処理の流れ]
次に、図7を参照しながら、分類器管理部105で実施される分類器の生成処理の流れについて、簡単に説明する。
分類器管理部105は、分類器を生成する際に、まず、所定数以上の意見(レビュー)が登録されている評価対象事象について、登録されている意見を取得する(ステップS121)。その後、分類器管理部105は、かかる意見に対応する特徴量を参照して、ポジティブ値が最大である意見を作為テキストであると判定する(ステップS123)。同様にして、分類器管理部105は、特徴量を参照することで、ネガティブ値が最大である意見を作為テキストであると判断する(ステップS125)。
次に、分類器管理部105は、取得した意見のうち、作為テキストを一方のクラスとし、それ以外のテキストを他方のクラス(すなわち、非作為テキスト)として、教師データを生成する(ステップS127)。
その後、分類器管理部105は、教師データと、算出された特徴量とを利用して、例えばサポートベクターマシン等のような機械学習技術に基づいて、分類器を学習させる(ステップS129)。
分類器管理部105は、このような流れにより生成された分類器を利用して、全てのレビュー文の中から作為レビューを特定する。
[テキストの表示処理の流れ]
続いて、図8を参照しながら、表示制御部109で実施される意見(レビュー)の表示制御処理の流れについて、簡単に説明する。
表示制御部109は、まず、意見(レビュー)に対応するテキストデータと、分類結果(すなわち、表示テキスト選択部107による選択結果)とを取得する(ステップS131)。その後、表示制御部109は、着目しているレビュー毎に、かかるレビューが作為テキストと判定されたか否かを判断する(ステップS133)。作為テキストではないと判定されていた場合には、表示制御部109は、後述するステップS141を実施する。また、作為テキストであると判定されていた場合には、表示制御部109は、後述するステップS135を実施する。
表示制御部109は、着目しているレビューが作為テキストであると判定されていた場合、レビューに対応するメタデータを参照して、投票数が所定数未満か否かを判断する(ステップS135)。投票数が所定数以上であった場合には、表示制御部109は、後述するステップS141を実施する。また、投票数が所定数未満であった場合には、表示制御部109は、着目している意見(レビュー)を表示画面に表示しない(ステップS137)。
ここで、表示制御部109は、未表示の意見(レビュー)を表示させるためのユーザ操作がなされているかを判断する(ステップS139)。かかる操作がなされている場合には、表示制御部109は、後述するステップS141を実施する。また、かかる操作が実施されていない場合には、表示制御部109は、処理を終了する。
他方、ステップS133において作為テキストと判定されていないと判断された場合、ステップS135において投票数が所定数以上であった場合、及び、ステップS139において未表示の意見を表示させるユーザ操作が実施されていた場合には、表示制御部109は、着目している意見(レビュー)を表示画面に表示する(ステップS141)。これにより、表示画面には、ユーザが着目している評価対象事象について、他のユーザが投稿したレビュー文が表示されることとなる。
以上、図6〜図8を参照しながら、本実施形態に係る情報処理装置10で実施される情報処理方法の流れの一例について、簡単に説明した。
(ハードウェア構成について)
次に、図9を参照しながら、本発明の実施形態に係る情報処理装置10のハードウェア構成について、詳細に説明する。図9は、本発明の実施形態に係る情報処理装置10のハードウェア構成を説明するためのブロック図である。
情報処理装置10は、主に、CPU901と、ROM903と、RAM905と、を備える。また、情報処理装置10は、更に、ホストバス907と、ブリッジ909と、外部バス911と、インターフェース913と、入力装置915と、出力装置917と、ストレージ装置919と、ドライブ921と、接続ポート923と、通信装置925とを備える。
CPU901は、演算処理装置および制御装置として機能し、ROM903、RAM905、ストレージ装置919、またはリムーバブル記録媒体927に記録された各種プログラムに従って、情報処理装置10内の動作全般またはその一部を制御する。ROM903は、CPU901が使用するプログラムや演算パラメータ等を記憶する。RAM905は、CPU901が使用するプログラムや、プログラムの実行において適宜変化するパラメータ等を一次記憶する。これらはCPUバス等の内部バスにより構成されるホストバス907により相互に接続されている。
ホストバス907は、ブリッジ909を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス911に接続されている。
入力装置915は、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチおよびレバーなどユーザが操作する操作手段である。また、入力装置915は、例えば、赤外線やその他の電波を利用したリモートコントロール手段(いわゆる、リモコン)であってもよいし、情報処理装置10の操作に対応した携帯電話やPDA等の外部接続機器929であってもよい。さらに、入力装置915は、例えば、上記の操作手段を用いてユーザにより入力された情報に基づいて入力信号を生成し、CPU901に出力する入力制御回路などから構成されている。情報処理装置10のユーザは、この入力装置915を操作することにより、情報処理装置10に対して各種のデータを入力したり処理動作を指示したりすることができる。
出力装置917は、取得した情報をユーザに対して視覚的または聴覚的に通知することが可能な装置で構成される。このような装置として、CRTディスプレイ装置、液晶ディスプレイ装置、プラズマディスプレイ装置、ELディスプレイ装置およびランプなどの表示装置や、スピーカおよびヘッドホンなどの音声出力装置や、プリンタ装置、携帯電話、ファクシミリなどがある。出力装置917は、例えば、情報処理装置10が行った各種処理により得られた結果を出力する。具体的には、表示装置は、情報処理装置10が行った各種処理により得られた結果を、テキストまたはイメージで表示する。他方、音声出力装置は、再生された音声データや音響データ等からなるオーディオ信号をアナログ信号に変換して出力する。
ストレージ装置919は、情報処理装置10の記憶部の一例として構成されたデータ格納用の装置である。ストレージ装置919は、例えば、HDD(Hard Disk Drive)等の磁気記憶部デバイス、半導体記憶デバイス、光記憶デバイス、または光磁気記憶デバイス等により構成される。このストレージ装置919は、CPU901が実行するプログラムや各種データ、および外部から取得した各種のデータなどを格納する。
ドライブ921は、記録媒体用リーダライタであり、情報処理装置10に内蔵、あるいは外付けされる。ドライブ921は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体927に記録されている情報を読み出して、RAM905に出力する。また、ドライブ921は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体927に記録を書き込むことも可能である。リムーバブル記録媒体927は、例えば、DVDメディア、HD−DVDメディア、Blu−rayメディア等である。また、リムーバブル記録媒体927は、コンパクトフラッシュ(登録商標)(CompactFlash:CF)、フラッシュメモリ、または、SDメモリカード(Secure Digital memory card)等であってもよい。また、リムーバブル記録媒体927は、例えば、非接触型ICチップを搭載したICカード(Integrated Circuit card)または電子機器等であってもよい。
接続ポート923は、機器を情報処理装置10に直接接続するためのポートである。接続ポート923の一例として、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)ポート等がある。接続ポート923の別の例として、RS−232Cポート、光オーディオ端子、HDMI(High−Definition Multimedia Interface)ポート等がある。この接続ポート923に外部接続機器929を接続することで、情報処理装置10は、外部接続機器929から直接各種のデータを取得したり、外部接続機器929に各種のデータを提供したりする。
通信装置925は、例えば、通信網931に接続するための通信デバイス等で構成された通信インターフェースである。通信装置925は、例えば、有線または無線LAN(Local Area Network)、Bluetooth(登録商標)、またはWUSB(Wireless USB)用の通信カード等である。また、通信装置925は、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ、または、各種通信用のモデム等であってもよい。この通信装置925は、例えば、インターネットや他の通信機器との間で、例えばTCP/IP等の所定のプロトコルに則して信号等を送受信することができる。また、通信装置925に接続される通信網931は、有線または無線によって接続されたネットワーク等により構成され、例えば、インターネット、家庭内LAN、赤外線通信、ラジオ波通信または衛星通信等であってもよい。
以上、本発明の実施形態に係る情報処理装置10の機能を実現可能なハードウェア構成の一例を示した。上記の各構成要素は、汎用的な部材を用いて構成されていてもよいし、各構成要素の機能に特化したハードウェアにより構成されていてもよい。従って、本実施形態を実施する時々の技術レベルに応じて、適宜、利用するハードウェア構成を変更することが可能である。
(まとめ)
以上説明したように、本発明の実施形態に係る情報処理装置10では、ユーザがある対象の感想をレビューとして投稿するサイトにおいて、他のユーザに偏った印象を意図的に与えるための作為レビューが提示されることを避けることが可能となる。本発明の実施形態に係る情報処理装置10では、作為レビューが提示される可能性が少ないため、レビューを読むユーザは、信頼感を持ってレビューを参考にすることが可能となり、ユーザの利便性を向上させることができる。
また、本発明の実施形態に係る情報処理装置10では、教師データを作成し、レビュー対象の領域に依存せずに作為レビューを判定するため、レビュー対象の領域が多岐に渡る場合、あるいは、一部のユーザしかレビュー対象を利用しないような、いわゆるロングテールのテールに属するような事象に着目した場合であっても、作為レビューの判定を行うことが可能である。
また、本発明の実施形態に係る情報処理装置10で提供されるユーザインターフェースによれば、作為レビューがユーザの目に入りにくいため、ユーザがレビューを安心して参考にできる。さらに、投票により作為レビューと判定されたレビューもユーザに提示されるように表示を変更することができるため、作為レビュー判定におけるエラーを訂正することができる。
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
例えば、上記実施形態では、情報処理装置10が分類器管理部105を備え、表示テキスト選択部107が分類器管理部105により生成・管理されている分類器を利用して表示するテキストを選択する場合について説明したが、本発明はかかる例に限定されない。例えば、情報処理装置10に分類器管理部105を設けずに、表示テキスト選択部107が、特徴量算出部103により算出される特徴量を組み合わせた判別条件式を多数有しており、かかる判別条件式を組み合わせて利用することにより作為テキストを分類するようにしてもよい。
10 情報処理装置
101 テキスト関連データ群取得部
103 特徴量算出部
105 分類器管理部
107 表示テキスト選択部
109 表示制御部
111 通信制御部
113 記憶部

Claims (12)

  1. 評価対象事象に対する評価者の意見が記載されたテキストデータと、当該テキストデータに関するメタデータとを少なくとも含むテキスト関連データ群に基づいて、前記評価者の意見に含まれる当該評価者の意図、及び、前記評価対象事象の内容に依存しない前記評価者の意見の特徴に関する特徴量を算出する特徴量算出部と、
    算出された前記特徴量に基づいて、前記テキストデータを、前記評価者が作為的に生成した意見が記載された作為テキストと、前記評価者が作為的に生成した意見を含まない非作為テキストとに分類し、前記評価者の意見を閲覧する閲覧者に表示する前記テキストデータを選択する表示テキスト選択部と、
    を備える、情報処理装置。
  2. 前記情報処理装置は、算出された前記特徴量を利用して選択された前記テキストデータ、及び、前記評価対象事象の内容に依存しない評価者の意見の特徴に基づいて生成された教師データと、算出された前記特徴量とに基づいて、前記作為テキストを分類するために用いられる分類器を生成するとともに、生成した前記分類器の管理を行う分類器管理部を更に備え、
    前記表示テキスト選択部は、算出された前記特徴量に基づく前記分類器の分類結果を利用して、前記閲覧者に表示するテキストデータを選択する、請求項1に記載の情報処理装置。
  3. 前記特徴量算出部は、前記評価者の意図に関する前記特徴量として、前記評価者の意見から示唆される当該評価者の感情を数値化した感情特徴量を算出する、請求項2に記載の情報処理装置。
  4. 前記特徴量算出部は、前記評価対象事象の内容に依存しない評価者の意見の特徴に関する前記特徴量として、前記テキストの長さを示す文長特徴量を算出する、請求項2又は3に記載の情報処理装置。
  5. 前記特徴量算出部は、前記評価対象事象の内容に依存しない評価者の意見の特徴に関する前記特徴量として、前記評価者が生成した前回の意見との時間間隔を示すタイミング特徴量を算出する、請求項2〜4のいずれか1項に記載の情報処理装置。
  6. 前記特徴量算出部は、前記感情特徴量として、前記評価者の意見に含まれる肯定の度合いを示すポジティブ値と、前記評価者の意見に含まれる否定の度合いを示すネガティブ値と、を算出する、請求項3に記載の情報処理装置。
  7. 前記分類器管理部は、所定数以上の前記評価者の意見が登録されている前記評価対象事象を選択し、選択した当該評価対象事象に登録されている前記評価者の意見を算出された前記特徴量の少なくとも一つに基づいて順位付けし、順位付けの結果に基づいて前記教師データを生成する、請求項2に記載の情報処理装置。
  8. 前記分類器管理部は、算出された前記特徴量の少なくとも一つに基づいて全ての前記評価対象事象に関する前記評価者の意見を順位付けし、順位付けの結果に基づいて前記教師データを生成する、請求項2に記載の情報処理装置。
  9. 前記表示テキスト選択部は、前記閲覧者により行われた前記情報処理装置への操作に応じて、前記閲覧者に対して表示しないように選択した前記評価者の意見を、前記閲覧者へ表示するように設定を変更する、請求項1に記載の情報処理装置。
  10. 前記表示テキスト選択部は、前記評価者以外の閲覧者により投票された当該評価者の意見に対する同意の度合いを表す投票値が所定の閾値以上となった場合に、前記閲覧者に対して表示しないように選択した前記評価者の意見を、前記閲覧者へ表示するように設定を変更する、請求項1に記載の情報処理装置。
  11. 評価対象事象に対する評価者の意見が記載されたテキストデータと、当該テキストデータに関するメタデータとを少なくとも含むテキスト関連データ群に基づいて、前記評価者の意見に含まれる当該評価者の意図、及び、前記評価対象事象の内容に依存しない前記評価者の意見の特徴に関する特徴量を算出するステップと、
    算出された前記特徴量に基づいて、前記テキストデータを、前記評価者が作為的に生成した意見が記載された作為テキストと、前記評価者が作為的に生成した意見を含まない非作為テキストとに分類し、前記評価者の意見を閲覧する閲覧者に表示する前記テキストデータを選択するステップと、
    を含む、情報処理方法。
  12. コンピュータに、
    評価対象事象に対する評価者の意見が記載されたテキストデータと、当該テキストデータに関するメタデータとを少なくとも含むテキスト関連データ群に基づいて、前記評価者の意見に含まれる当該評価者の意図、及び、前記評価対象事象の内容に依存しない前記評価者の意見の特徴に関する特徴量を算出する特徴量算出機能と、
    算出された前記特徴量に基づいて、前記テキストデータを、前記評価者が作為的に生成した意見が記載された作為テキストと、前記評価者が作為的に生成した意見を含まない非作為テキストとに分類し、前記評価者の意見を閲覧する閲覧者に表示する前記テキストデータを選択する表示テキスト選択機能と、
    を実現させるためのプログラム。
JP2011000028A 2011-01-04 2011-01-04 情報処理装置、情報処理方法及びプログラム Pending JP2012141837A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011000028A JP2012141837A (ja) 2011-01-04 2011-01-04 情報処理装置、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011000028A JP2012141837A (ja) 2011-01-04 2011-01-04 情報処理装置、情報処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2012141837A true JP2012141837A (ja) 2012-07-26

Family

ID=46678061

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011000028A Pending JP2012141837A (ja) 2011-01-04 2011-01-04 情報処理装置、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2012141837A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016006583A (ja) * 2014-06-20 2016-01-14 株式会社エヌ・ティ・ティ・データ ソーシャルネットワークサービスにおけるノイズ投稿の分類方法およびシステム
JP2017151741A (ja) * 2016-02-25 2017-08-31 株式会社ぐるなび 情報処理装置、情報処理方法及びプログラム
CN111582832A (zh) * 2020-05-12 2020-08-25 海南大学 基于区块链的公平竞争审查方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006243857A (ja) * 2005-03-01 2006-09-14 Hitachi Ltd 口コミ情報共有システム及び情報提供装置
JP2007299071A (ja) * 2006-04-27 2007-11-15 Fuji Xerox Co Ltd 評判情報処理システム、評判情報処理方法及び評判情報処理プログラム
JP2008234580A (ja) * 2007-03-23 2008-10-02 Nomura Research Institute Ltd 投稿処理装置
JP2009508267A (ja) * 2005-09-13 2009-02-26 グーグル インコーポレイテッド ブログ文書のランク付け
JP2009230663A (ja) * 2008-03-25 2009-10-08 Kddi Corp ウェブページの異常検知装置、プログラム、および記録媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006243857A (ja) * 2005-03-01 2006-09-14 Hitachi Ltd 口コミ情報共有システム及び情報提供装置
JP2009508267A (ja) * 2005-09-13 2009-02-26 グーグル インコーポレイテッド ブログ文書のランク付け
JP2007299071A (ja) * 2006-04-27 2007-11-15 Fuji Xerox Co Ltd 評判情報処理システム、評判情報処理方法及び評判情報処理プログラム
JP2008234580A (ja) * 2007-03-23 2008-10-02 Nomura Research Institute Ltd 投稿処理装置
JP2009230663A (ja) * 2008-03-25 2009-10-08 Kddi Corp ウェブページの異常検知装置、プログラム、および記録媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG201000538207; '統計的手法を用いたレビューポートフォリオの構築' 第2回データ工学と情報マネジメントに関するフォーラムーDEIM 2010-論文集 , 20100525 *
JPN6014019412; '統計的手法を用いたレビューポートフォリオの構築' 第2回データ工学と情報マネジメントに関するフォーラムーDEIM 2010-論文集 , 20100525 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016006583A (ja) * 2014-06-20 2016-01-14 株式会社エヌ・ティ・ティ・データ ソーシャルネットワークサービスにおけるノイズ投稿の分類方法およびシステム
JP2017151741A (ja) * 2016-02-25 2017-08-31 株式会社ぐるなび 情報処理装置、情報処理方法及びプログラム
CN111582832A (zh) * 2020-05-12 2020-08-25 海南大学 基于区块链的公平竞争审查方法及系统

Similar Documents

Publication Publication Date Title
US11347963B2 (en) Systems and methods for identifying semantically and visually related content
Cappallo et al. New modality: Emoji challenges in prediction, anticipation, and retrieval
US9704185B2 (en) Product recommendation using sentiment and semantic analysis
US9892109B2 (en) Automatically coding fact check results in a web page
US9384214B2 (en) Image similarity from disparate sources
EP2192500B1 (en) System and method for providing robust topic identification in social indexes
US9460458B1 (en) Methods and system of associating reviewable attributes with items
US20180218080A1 (en) Conversational agent for search
US8805750B2 (en) Providing comparison experiences in response to search queries
US20110320423A1 (en) Integrating social network data with search results
US20100169331A1 (en) Online relevance engine
US9286379B2 (en) Document quality measurement
US8856109B2 (en) Topical affinity badges in information retrieval
CN111259192A (zh) 音频推荐方法和装置
US20140280120A1 (en) Interest graph-powered browsing
CN111091006A (zh) 一种实体意图体系的建立方法、装置、设备和介质
CN112328857B (zh) 一种产品知识聚合方法、装置、计算机设备及存储介质
Wang et al. Bilateral correspondence model for words-and-pictures association in multimedia-rich microblogs
Xiong et al. Affective impression: Sentiment-awareness POI suggestion via embedding in heterogeneous LBSNs
CN111552884A (zh) 用于内容推荐的方法和设备
Yang et al. Social tag embedding for the recommendation with sparse user-item interactions
CN111753052A (zh) 提供针对知识意图问题的知识性回答
CN106462588B (zh) 来自所提取的内容的内容创建
JP2012141837A (ja) 情報処理装置、情報処理方法及びプログラム
CN111488453A (zh) 资源分级方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140418

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140513

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140703

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140909

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141104

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150203