JPWO2013161510A1 - 評価の極性に基づいた文章の分類方法、コンピュータ・プログラム、コンピュータ - Google Patents

評価の極性に基づいた文章の分類方法、コンピュータ・プログラム、コンピュータ Download PDF

Info

Publication number
JPWO2013161510A1
JPWO2013161510A1 JP2014512437A JP2014512437A JPWO2013161510A1 JP WO2013161510 A1 JPWO2013161510 A1 JP WO2013161510A1 JP 2014512437 A JP2014512437 A JP 2014512437A JP 2014512437 A JP2014512437 A JP 2014512437A JP WO2013161510 A1 JPWO2013161510 A1 JP WO2013161510A1
Authority
JP
Japan
Prior art keywords
evaluation
sentence
degree
expression
review
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014512437A
Other languages
English (en)
Other versions
JP5607859B2 (ja
Inventor
博 金山
博 金山
拓真 村上
拓真 村上
大介 宅間
大介 宅間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2014512437A priority Critical patent/JP5607859B2/ja
Application granted granted Critical
Publication of JP5607859B2 publication Critical patent/JP5607859B2/ja
Publication of JPWO2013161510A1 publication Critical patent/JPWO2013161510A1/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

限られた時間・リソースの下で、効率的にレビュー文章の分析を行うために、大量のレビュー文章の中から、人(分析者)が参照すべき一部のレビュー文章を効率よく抽出する技術を提供する。コンピュータにより複数の文章から一部の文章を抽出する方法であり、各文章の肯定的な表現の程度及び否定的な表現の程度を一次評価するステップと、少なくとも一部は前記肯定的な表現の程度及び前記否定的な表現の程度を変数とする複数の評価関数に基づいて、各文章を二次評価するステップと、同一の評価関数に基づいた各評価結果のより高い文章を前記評価結果のより低い文章よりも優先して文章を抽出するステップとを含む。

Description

本発明は情報処理技術に関係し、より詳しくは、情報処理を用いて評判分析を支援する技術に係る。
情報通信技術の進展と共に、より多くの人々がインタネットを介して、意見を共有する形態がみられる。例えば、通信販売サイトでは、商品の購入者がその商品のレビューをポストしたり、いわゆる口コミサイトでは、ある飲食店の利用者がそのレビューをポストしたりする形態が見られる。いずれも、サイトの利用者はそのレビューを自由に閲覧することができる。このようなレビュー機能、レビューサイトは、サイトの利用者にとって、将来の製品購入、サービス利用について指針を与える点で有用であるばかりでなく、製品やサービスの提供者にとっても、購入者・利用者の貴重なフィードバックを得ることができ、有用である。大量のレビュー文章から有用な知見を得るために、従来から様々な技術手法が提案されてきた(特許文献、非特許文献参照)。
特開2007−299071号公報 特表2004−514220号公報 特開平10−27181号公報 特開2006−146567号公報 再公表WO2009−060829号公報 再公表WO2008−075524号公報
Turney, P. D.「Thumbsup or thumbs down? Semanticorientation applied to unsupervised classificationofreviews」、ACL '02 Proceedings of the 40th AnnualMeetingon Association forComputational Linguistics、2002年7月、417-424p, Association for ComputationalLinguistics Stroudsburg発行
ここで、人が大量のレビュー文章のすべてを読むのは非効率である。一方、レビュー文章の一部をランダムに読むのでは、有用なレビューを見落としてしまうリスクがある。
本発明はこのような課題に鑑みてなされたものであり、その目的の一つは、限られた時間・リソースの下で、効率的にレビュー文章の分析を行うために、大量のレビュー文章の中から、人(分析者)が参照すべき一部のレビュー文章を効率よく抽出する技術を提供することにある。
上記課題を解決するために、本発明者らは鋭意研究の結果、次のような発明に想到した。すなわち本発明は、コンピュータにより複数の文章から一部の文章を抽出する方法であり、各文章の肯定的な表現の程度及び否定的な表現の程度を一次評価するステップと、少なくとも一部は前記肯定的な表現の程度及び前記否定的な表現の程度を変数とする複数の評価関数に基づいて、各文章を二次評価するステップと、同一の評価関数に基づいた各評価結果のより高い文章を前記評価結果のより低い文章よりも優先して文章を抽出するステップとを含む方法である。
ここで、前記一部の評価関数の一は、肯定的及び否定的な表現を平均的に含む文章に対してより高い評結果を出力する関数とすることができる。この関数は、具体的には、次の式を採用することができる。p+nCpαp(1-α)n× (p+n) :但し、αは全文書中の好評の割合である。
他の評価関数としては、前記肯定的な表現の程度と前記否定的な表現の程度の和、前記肯定的な表現の程度と前記否定的な表現の程度の差を選択することもできる。
また、前記一次評価するステップは、各文章に含まれる肯定的な表現の数及び否定的な表現の数に基づいて、前記肯定的な表現の程度及び否定的な表現の程度を一次評価することもできる。
また、前記抽出するステップは、異なる評価関数に基づいた各評価結果の文章を予め定められた順序に基づいて抽出することもできる。
また、前記抽出された文章をユーザに出力するステップを更に備えることもできる。この場合、前記抽出された文章がいずれの評価関数の評価結果に基づいて抽出されたのかを併せてユーザに出力することができる。さらに、前記抽出された文章中の前記肯定的な表現と前記否定的な表現とを相異なる表現形態で出力することもできる。
本発明をこれらコンピュータ・プログラム、コンピュータ・システムとして把握した場合にも、上述した本発明を方法として把握した場合と実質的に同一の技術的特徴を備える事ができるのは当然である。
本発明によれば、大量のレビュー文書の中から人(分析者)が参照すべき一部のレビュー文章を効率よく抽出することができる。
レビューサイトシステムを説明する概念図 レビューサイト・サーバ内のハードディスク装置内に記憶されているデータのデータ構造の説明図 コンピュータのハードウェア構成を説明するブロック図 コンピュータの機能ブロック図 コンピュータが実行する処理を説明するフローチャート コンピュータが実行する処理の一部を説明する概念図 評価関数の意味を説明する概念図 出力画面の一例を示す図
実施形態
以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。また、本発明は多くの異なる態様で実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。また、実施の形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須とは限らないことに留意されたい。実施の形態の説明の全体を通じて(特段の断りのない限り)同じ要素には同じ番号を付している。
図1は、レビューサイトのシステムを説明する概念図である。本システムは、レビューサイト・サーバ2と、ユーザ端末とを含み、これらはインタネット4を介して互いに通信可能に接続されている。また、ユーザ端末としては、通信機能を備えたあらゆる形態のコンピュータを採用することができる。例えば、図示するスマートフォン31、タブレット32、(ノート型)パーソナル・コンピュータ33の他にも、図示しないパーソナル・データ・アシスタント(PDA、携帯情報端末)、車載コンピュータ、ネットブック等を採用することができる。
図2は、レビューサイト・サーバ2内のハードディスク装置20、21内に記憶されているデータのデータ構造を説明するものである。ハードディスク装置20に記憶されているレビューテーブル(図2(a))には、各レビュー文章が発信・ポストされた日時を示す発信日時 (created_at)、各レビューを特定するレビューID(id)と、そのレビューを発信したユーザを特定するユーザID(user_id)と、レビューの内容であるテキスト(text)を備えている。一方、ハードディスク装置21に記憶されているユーザテーブル(図2(b))には、ユーザを特定するユーザID(user_id)と、そのユーザの性別(gender)、年齢(age)、居住地(location)をそれぞれ特定する情報を備えている。なお、なお、レビューIDにレビュー対象の製品やサービスを特定するIDを付加してもよい。
図3は、パーソナル・コンピュータ1のハードウェア構成を説明するブロック図である。コンピュータ1のハードウェア構成は、(低速及び高速の)バス10、バス10に接続されるCPU(演算制御装置)11、RAM(ランダム・アクセス・メモリ:記憶装置)12、ROM(リード・オンリ・メモリ:記憶装置)13、HDD(ハード・ディスク・ドライブ:記憶装置)14、通信インタフェース15、入出力インタフェース16を備えている。さらに、入出力インタフェース16に接続されるマウス17、フラット・パネル・ディスプレイ(表示装置)18、キーボード19等を備えている。なお、コンピュータ1は一般的なパーソナル・コンピュータ・アーキテクチャを採用するものとして説明したが、例えば、より高いデータ処理能力や可用性を求めて、CPU11やHDD14等を多重化することができる。また、デスクトップ型の他、様々なタイプのコンピュータ・システムを採用することができる。
このコンピュータ1のソフトウェア構成は、基本的な機能を提供するオペレーティング・システム(OS)と、OSの機能を利用するアプリケーション・ソフトウェアと、入出力装置のドライバ・ソフトウェアとを備えている。これらの各ソフトウェアは、各種データと共にRAM12上にロードされ、CPU11等により実行され、コンピュータ1は全体として、図4に示す機能モジュールとして機能し、図5に示す処理を実行する。
図4は、実施例に係るコンピュータ1の機能モジュールを説明する機能ブロック図である。コンピュータ1は、一次評価モジュール101、二次評価モジュール102、抽出モジュール103、出力モジュール104として機能する。
図5は、このコンピュータ1が実行する処理を説明するフローチャートである。また、図6は、図5のフローチャートのステップS101からS103を説明する概念図である。まず、コンピュータ1が、それぞれに特定の固有名詞(ここではPPPと記す)が含まれる複数のレビュー文章D(1)〜D(N)を入手する(S101)。なお、Nはレビュー文章の一覧表示が困難なほど、十分に大きな値である。具体的には、コンピュータ1からレビューサイト・サーバ2に対して、条件を送信する。条件としては、例えば、レビュー文章中に固有名詞PPPを含み、かつ発信された期間が指定期間内のもの、という条件を付けることができる。次に、コンピュータ1はレビューサイト・サーバ2から上記条件に適合するレビュー文章群のデータを受信する。この際、上記条件に適合するレビュー群のデータ(図2(a)参照)およびレビューに関連付けられるユーザのプロフィール(図2(b)参照)を受信する。これら受信したデータは、コンピュータ1のHDD14に記憶される。また、上記期間が将来を含み、上記期間の終期が到来するまで、逐次レビューサイト・サーバ2からコンピュータ1にレビューが送られてもよい。さらに異なる態様としては、予め、コンピュータ1のHDD14にレビュー文章群のデータ(図2(a)参照)およびレビュー文章に関連付けられるユーザのプロフィール(図2(b)参照)が大量に記憶されている場合には、これらのデータの中から、上記条件に適合するレビュー群を検索することもできる。
次に、一次評価モジュール101により、各レビューの肯定的な表現の程度及び否定的な表現の程度を一次評価する(ステップS101)。ここでは、好評(肯定的な表現)を示すワードのリスト及び不評(否定的な表現)を示すワード・表現のリストを予めHDD14に記憶しておき、各レビュー文章中の好評数(p)と、不評数(n)とをカウントする。これらの評価ワード・表現は、評価対象の商品やサービスに応じて予め設定しておくことが好ましい。なお、この他にも、例えば、各好評ワード・表現に好評らしさに応じたスコア、各不評ワード・表現に不評らしさに応じたスコアをそれぞれ予め設定しておき、これらのスコアに基づいて一次評価を行うことも出来る。
以下、化粧品に対するレビュー文章4件を一次評価した結果を示す。()で囲んだ部分が好評ワード・表現、<>で囲んだ部分が不評ワード・表現である。
レビュー文章1:好評5・不評0
(分量が多く)、(安い)ので(いいですね)!他のスキンケア商品との(相性もいい)ので(安心しています)
レビュー文章2:好評5・不評1
特に、(ニキビに悩んでいるのではないです)が、(価格も手ごろ)だったので購入。(刺激も少なく)、若いうちには(良いと思います)。現在は、乾燥肌なので、化粧水などつけたとしても<潤いが不足します>…よって、現在は使用していません。ニキビに悩んでいる方の使用も(良さそう)です。
レビュー文章3:好評4・不評1
肌荒れ、ニキビに(安心して使えます)。普段は拭き取り化粧水を使っています。軽く顔にすべらせたあとパッティングします。ニキビができているところに多めに使うと、たしかに(よくなります)。潤いに関しては乾燥肌の方には<物足りないかもしれません>が、脂性肌の私には(ちょうどいい)です。(便利な化粧水です)。
レビュー文章4:好評2・不評3
<あまり効果判りません>。ニキビや吹き出物も最近は出来ないので<必要性を感じません>。肌にヒリヒリを感じたことは無いので、拭き取り用として使ってはいます。リピーと購入は<微妙かな>?でもお値段が(安く)て(いい)??
次に、二次評価モジュール102により、複数の評価関数に基づいて、各レビュー文章を二次評価する(ステップS102)。ここでは、以下の5つの評価関数を用いている。評価関数m1: p
評価関数m2: p+n
評価関数m3: p/(p+n)
評価関数m4: p-n
評価関数m5: p+nCpαp(1-α)n× (p+n)、αは全レビュー中の好評の割合
各評価関数の意味は、以下の通りである。すなわち、評価関数m1は、好評ワードを多く含むレビュー文章Dを高く評価する。評価関数m2は、好評・不評にかかわらず評価ワードを多く含むレビューを高く評価する。評価関数m3は、評価ワードのうち好評ワードの割合が高いレビューを高く評価する。評価関数m4は、不評ワードを最小限に、好評ワードの多いレビューを高く評価する。評価関数5は平均的に好評及び不評ワードを含むレビューをより高く評価する。さらに、評価関数m5は、以下のような背景で決定したものである。全文書中の評価表現の出現をP率 α=P/(P+N) のベルヌーイ試行と考える。ここで、P、Nはそれぞれ全文書中の好評数、不評数とする。k回の試行(k個の評価表現)でのP率の密度関数は、二項分布B(k,α) の密度関数を横軸方向に 1/k につぶした形になる。その分布において、文書xの好不評数Px、NxによるP率 Px/(Px+Nx)が観測される確率を文書xの評価表現の指標とする。なお、mCn の計算は、m、nが大きいと時間がかかるため、必要に応じて正規分布、ポアソン分布で近似しても良い。
図7は、評価関数m1,m2,m5を説明するグラフである。この二次元グラフは、縦軸に好評ワードの数Pを、横軸に不評ワードの数Nをとり、各レビュー文章Dをグラフ上の印×にプロットしたものである。さらに、評価関数m1の等高線を細線で、評価関数m2の等高線を点線で、評価関数m5の等高線を太線でそれぞれ表している。レビュー文章には評価表現の少ないレビュー、不満のレビュー等様々なものが含まれるが、評価関数m1によりファンのレビューを、評価関数m2により評価表現の多いレビューを、評価関数m5により平均的な意見で評価表現の多いレビューをそれぞれ効果的に切り分けることができることを示している。
次に、抽出モジュール103により、K件のレビュー文章が抽出される(ステップS103)。各レビュー文章Dには、評価関数m1〜m5による評価スコアが5つ付されている。抽出モジュール103は、評価関数毎に、最も評価スコアの高い文章から順に、各レビュー文章をソートする。そして、評価関数m1による評価スコアの最も高いレビュー文章、評価関数m2による評価スコアの最も高いレビュー文章、評価関数m3による評価スコアの最も高いレビュー文章、評価関数m4による評価スコアの最も高いレビュー文章、評価関数m5による評価スコアの最も高いレビュー文章(重複を廃して高々5件)を選択する。次に、評価関数m1による評価スコアの次に高いレビュー文章、評価関数m2による評価スコアの次に高いレビュー文章、評価関数m3による評価スコアの次に高いレビュー文章、評価関数m4による評価スコアの次に高いレビュー文章、評価関数m5による評価スコアの次に高いレビュー文章を(重複を廃して高々5件)選択する。以下同様に、K件に達するまで文章の選択を行う。
次に、出力モジュール104により、選択済みのK件のレビュー文章をディスプレイ18上に表示させる(ステップS104)。図8は、表示画面の一例を示すものである。この画面には、選択されたK件のレビュー文章の一部が表示されており、太い四角で囲んだ部分に注目すると、表示されているレビュー文章が、どの評価関数で高い評価スコアを獲得して選択されたのかが一目で分かるように表示されている。例えば、画面の一番上に表示されているレビュー文章は、m1、m2、m5の欄にチェックマークが付してあり、評価関数m1、m2、m5による評価結果に基づいて表示されていることが分かる。また、ユーザが不要と思う評価関数を消去し、新たな評価関数を追加することもできる。さらに、特定の評価関数による評価結果のみを表示させることもできる。さらに、評価結果をアイコンでより簡易に示すことも出来る。なお、出力モジュール104は、図7に示したグラフをディスプレイ18上に表示させることもできる。
このような処理を行うことで、好評の意見を持つレビュー文書を偏りなく取り出すことができる。すなわち、K件の中に、好評の意見だけのもの、不評も言及しているもの、などを含めることができる。その結果、ユーザ(分析者)が読み切れる量、または画面に一覧表示できる量の範囲内で、ユーザが本当に把握したい好評の情報にアクセスできる可能性が向上する。また、表示の際に、一次元の整序ではないことを分析者が直感的に理解することができる。さらに、興味のあるタイプの文書を重点的に参照することができる。
なお、本発明は、全体がハードウェアの実施形態、全体がソフトウェアの実施形態、またはハードウェアおよびソフトウェア両方のエレメントを包含する実施形態の形を取ることができる。ある好適な実施形態において、本発明は、以下に限らないが、ファームウェア、常駐ソフトウェア、マイクロコード、構文解析ピココードなどを含めた、ソフトウェアに実装される。
さらに、本発明は、コンピュータまたは任意の命令実行システムによってまたはこれに関連させて使用するプログラム・コードを備えるコンピュータ・プログラム、コンピュータ可読媒体の形態を採ることもできる。本説明目的の上で、コンピュータ可読媒体は、任意の命令実行システム、装置、またはデバイスによってまたはこれに関連させて使用するためのプログラムを、収容、格納、通信、伝搬、または伝送できる任意の装置であり得る。具体的には、前述の構文解析制御モジュールは、この意味で命令実行システム、またはコンピュータを構成する。
媒体は、電子的、磁気的、光学的、電磁気的、赤外的、または半導体のシステム(もしくは装置もしくはデバイス)または伝搬媒体とすることができる。コンピュータ可読媒体の例には、半導体または固体メモリ、磁気テープ、着脱可能コンピュータ・ディスケット、ランダム・アクセス・メモリ(RAM:random access memory)、読み取り専用メモリ(ROM:read−only memory)、剛体磁気ディスク、および光ディスクが含まれる。光ディスクの現時点での例には、コンパクト・ディスク読み取り専用メモリ(CD−ROM:compact disk read only memory)、コンパクト・ディスク読み取り/書き込み(CD−R/W:compact disk read/write)メモリ、およびDVDが含まれる。
プログラム・コードを格納もしくは実行またはその両方を行うのに適したデータ処理システムは、システム・バスを介して直接的または間接的にメモリ・エレメントに連結された少なくとも一つのプロセッサを含み得る。このメモリ・エレメントには、プログラム・コードの実際の実行の過程で使われるローカル・メモリ、バルク記憶装置、および、実行中にバルク記憶装置から読み出さねばならない回数を低減するために、少なくとも一部のプログラム・コードに一時的保管を提供するキャッシュ・メモリを含めることができる。
1…パーソナル・コンピュータ、
11…CPU(演算制御装置)
12…RAM(ランダム・アクセス・メモリ:記憶装置)
13…ROM(リード・オンリ・メモリ:記憶装置)
14…HDD(ハード・ディスク・ドライブ:記憶装置)
15…通信インタフェース
16…入出力インタフェース
17…マウス
18…フラット・パネル・ディスプレイ(表示装置)
2…レビューサイト・サーバ
20、21…ハード・ディスク・ドライブ
31…スマートフォン
32…タブレット
33…(ノート型)パーソナル・コンピュータ
101…一次評価モジュール
102…二次評価モジュール
103…抽出モジュール
104…出力モジュール

Claims (12)

  1. コンピュータにより複数の文章から一部の文章を抽出する方法であり、
    各文章の肯定的な表現の程度及び否定的な表現の程度を一次評価するステップと、
    少なくとも一部は前記肯定的な表現の程度及び前記否定的な表現の程度を変数とする複数の評価関数に基づいて、各文章を二次評価するステップと、
    同一の評価関数に基づいた各評価結果のより高い文章を前記評価結果のより低い文章よりも優先して文章を抽出するステップと
    を含む方法。
  2. 前記一部の評価関数の一は、肯定的及び否定的な表現を平均的に含む文章に対してより高い評結果を出力する関数である請求項1に記載の方法。
  3. 前記一部の評価関数の一は、p+nCpαp(1-α)n
    ×(p+n):pは肯定的な表現数、nは否定的な表現数、αは全文書中の好評の割合、で与えられる請求項1に記載の方法。
  4. 前記一部の評価関数の一は、前記肯定的な表現の程度と前記否定的な表現の程度の和である請求項1に記載の方法。
  5. 前記一部の評価関数の一は、前記肯定的な表現の程度と前記否定的な表現の程度の差である請求項1に記載の方法。
  6. 前記一次評価するステップは、各文章に含まれる肯定的な表現の数及び否定的な表現の数に基づいて、前記肯定的な表現の程度及び否定的な表現の程度を一次評価する請求項1に記載の方法。
  7. 前記抽出するステップは、異なる評価関数に基づいた各評価結果の文章を予め定められた順序に基づいて抽出する請求項1に記載の方法。
  8. 前記抽出された文章をユーザに出力するステップを更に備える請求項1に記載の方法。
  9. 前記出力するステップでは、前記抽出された文章がいずれの評価関数の評価結果に基づいて抽出されたのかを併せてユーザに出力する請求項8に記載の方法。
  10. 前記出力するステップでは、前記抽出された文章中の前記肯定的な表現と前記否定的な表現とを相異なる表現形態で出力する請求項8に記載の方法。
  11. コンピュータに請求項1に記載の方法の各ステップを実行させるコンピュータ・プログラム。
  12. 複数の文章から一部の文章を抽出するコンピュータであり、
    各文章の肯定的な表現の程度及び否定的な表現の程度を一次評価する手段と、
    少なくとも一部は前記肯定的な表現の程度及び前記否定的な表現の程度を変数とする複数の評価関数に基づいて、各文章を二次評価する手段と、
    同一の評価関数に基づいた各評価結果のより高い文章を前記評価結果のより低い文章よりも優先して文章を抽出する手段と
    を含むコンピュータ。
JP2014512437A 2012-04-25 2013-03-29 評価の極性に基づいた文章の分類方法、コンピュータ・プログラム、コンピュータ Expired - Fee Related JP5607859B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014512437A JP5607859B2 (ja) 2012-04-25 2013-03-29 評価の極性に基づいた文章の分類方法、コンピュータ・プログラム、コンピュータ

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2012100288 2012-04-25
JP2012100288 2012-04-25
PCT/JP2013/059472 WO2013161510A1 (ja) 2012-04-25 2013-03-29 評価の極性に基づいた文章の分類方法、コンピュータ・プログラム、コンピュータ
JP2014512437A JP5607859B2 (ja) 2012-04-25 2013-03-29 評価の極性に基づいた文章の分類方法、コンピュータ・プログラム、コンピュータ

Publications (2)

Publication Number Publication Date
JP5607859B2 JP5607859B2 (ja) 2014-10-15
JPWO2013161510A1 true JPWO2013161510A1 (ja) 2015-12-24

Family

ID=49478065

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014512437A Expired - Fee Related JP5607859B2 (ja) 2012-04-25 2013-03-29 評価の極性に基づいた文章の分類方法、コンピュータ・プログラム、コンピュータ

Country Status (5)

Country Link
US (1) US9740681B2 (ja)
JP (1) JP5607859B2 (ja)
CN (1) CN104272301B (ja)
DE (1) DE112013002187T5 (ja)
WO (1) WO2013161510A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6906430B2 (ja) * 2017-11-20 2021-07-21 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP6993955B2 (ja) * 2018-12-06 2022-01-14 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1027181A (ja) 1996-07-11 1998-01-27 Fuji Xerox Co Ltd 文書評価装置
JP2002140465A (ja) 2000-08-21 2002-05-17 Fujitsu Ltd 自然文処理装置及び自然文処理用プログラム
US6622140B1 (en) 2000-11-15 2003-09-16 Justsystem Corporation Method and apparatus for analyzing affect and emotion in text
US7346492B2 (en) * 2001-01-24 2008-03-18 Shaw Stroz Llc System and method for computerized psychological content analysis of computer and media generated communications to produce communications management support, indications, and warnings of dangerous behavior, assessment of media images, and personnel selection support
US7058566B2 (en) * 2001-01-24 2006-06-06 Consulting & Clinical Psychology, Ltd. System and method for computer analysis of computer generated communications to produce indications and warning of dangerous behavior
US7149804B2 (en) * 2001-04-30 2006-12-12 Sony Computer Entertainment America Inc. Method and system for providing evaluation of text-based products
JP3962382B2 (ja) * 2004-02-20 2007-08-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 表現抽出装置、表現抽出方法、プログラム及び記録媒体
JP4148522B2 (ja) * 2004-11-19 2008-09-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 表現検出システム、表現検出方法、及びプログラム
US20070078670A1 (en) * 2005-09-30 2007-04-05 Dave Kushal B Selecting high quality reviews for display
JP2007299071A (ja) 2006-04-27 2007-11-15 Fuji Xerox Co Ltd 評判情報処理システム、評判情報処理方法及び評判情報処理プログラム
US20100017391A1 (en) 2006-12-18 2010-01-21 Nec Corporation Polarity estimation system, information delivery system, polarity estimation method, polarity estimation program and evaluation polarity estimatiom program
JP5168961B2 (ja) * 2007-03-19 2013-03-27 富士通株式会社 最新評判情報通知プログラム、記録媒体、装置及び方法
US7996210B2 (en) * 2007-04-24 2011-08-09 The Research Foundation Of The State University Of New York Large-scale sentiment analysis
US20080288481A1 (en) * 2007-05-15 2008-11-20 Microsoft Corporation Ranking online advertisement using product and seller reputation
US8280885B2 (en) * 2007-10-29 2012-10-02 Cornell University System and method for automatically summarizing fine-grained opinions in digital text
JP5229504B2 (ja) 2007-11-05 2013-07-03 日本電気株式会社 広告提示方法、広告提示システム及びプログラム
US20100318526A1 (en) * 2008-01-30 2010-12-16 Satoshi Nakazawa Information analysis device, search system, information analysis method, and information analysis program
US8117207B2 (en) * 2008-04-18 2012-02-14 Biz360 Inc. System and methods for evaluating feature opinions for products, services, and entities
WO2010036012A2 (ko) * 2008-09-23 2010-04-01 주식회사 버즈니 인터넷을 이용한 의견 검색 시스템, 의견 검색 및 광고 서비스 시스템과 그 방법
JP4683394B2 (ja) * 2008-09-26 2011-05-18 Necビッグローブ株式会社 情報処理装置、情報処理方法およびプログラム
JP5359399B2 (ja) * 2009-03-11 2013-12-04 ソニー株式会社 テキスト分析装置および方法、並びにプログラム
US20110082687A1 (en) * 2009-10-05 2011-04-07 Marcelo Pham Method and system for taking actions based on analysis of enterprise communication messages
JP5273735B2 (ja) * 2009-10-13 2013-08-28 日本電信電話株式会社 テキスト要約方法、その装置およびプログラム
US8990124B2 (en) * 2010-01-14 2015-03-24 Microsoft Technology Licensing, Llc Assessing quality of user reviews
CN102163189B (zh) * 2010-02-24 2014-07-23 富士通株式会社 从评论性文本中提取评价性信息的方法和装置
US8402035B2 (en) * 2010-03-12 2013-03-19 General Sentiment, Inc. Methods and systems for determing media value
US20110320542A1 (en) * 2010-06-28 2011-12-29 Bank Of America Corporation Analyzing Social Networking Information
CN101894102A (zh) * 2010-07-16 2010-11-24 浙江工商大学 一种主观性文本情感倾向性分析方法和装置
US8949211B2 (en) * 2011-01-31 2015-02-03 Hewlett-Packard Development Company, L.P. Objective-function based sentiment
US8650023B2 (en) * 2011-03-21 2014-02-11 Xerox Corporation Customer review authoring assistant
US20120246054A1 (en) * 2011-03-22 2012-09-27 Gautham Sastri Reaction indicator for sentiment of social media messages
WO2012143069A1 (en) * 2011-04-21 2012-10-26 Sony Corporation A method for determining a sentiment from a text
US20120290606A1 (en) * 2011-05-11 2012-11-15 Searchreviews LLC Providing sentiment-related content using sentiment and factor-based analysis of contextually-relevant user-generated data
US20120290910A1 (en) * 2011-05-11 2012-11-15 Searchreviews LLC Ranking sentiment-related content using sentiment and factor-based analysis of contextually-relevant user-generated data
US8600796B1 (en) * 2012-01-30 2013-12-03 Bazaarvoice, Inc. System, method and computer program product for identifying products associated with polarized sentiments

Also Published As

Publication number Publication date
JP5607859B2 (ja) 2014-10-15
US9740681B2 (en) 2017-08-22
CN104272301A (zh) 2015-01-07
CN104272301B (zh) 2018-01-23
WO2013161510A1 (ja) 2013-10-31
DE112013002187T5 (de) 2015-01-08
US20130289978A1 (en) 2013-10-31

Similar Documents

Publication Publication Date Title
Nam et al. Harvesting brand information from social tags
Cacciatore et al. Coverage of emerging technologies: A comparison between print and online media
Lee et al. Mining perceptual maps from consumer reviews
Wang et al. Attribute embedding: Learning hierarchical representations of product attributes from consumer reviews
Harvey et al. Fear and derision: a quantitative content analysis of provaccine and antivaccine internet memes
Dahlstrom et al. Third-person perception of science narratives: The case of climate change denial
Han SimulCAT: Windows software for simulating computerized adaptive test administration
Moen et al. Online consumers reviews: Examining the moderating effects of product type and product popularity on the review impact on sales
Keshavarz et al. Credibility evaluation of scientific information on websites: Designing and evaluating an exploratory model
Aldous et al. What really matters?: characterising and predicting user engagement of news postings using multiple platforms, sentiments and topics
Paul et al. TexTonic: Interactive visualization for exploration and discovery of very large text collections
Karimi et al. Online news media website ranking using user-generated content
JP5607859B2 (ja) 評価の極性に基づいた文章の分類方法、コンピュータ・プログラム、コンピュータ
Salaba et al. Visualizations of bibliographic information: A user experience study
Downer et al. All work and no play: A text analysis
Zhang et al. Providing consumers with a representative subset from online reviews
Flaxton HD aesthetics
CN112802454B (zh) 一种唤醒词的推荐方法、装置、终端设备及存储介质
Liang et al. Exploring online reviews for user experience modeling
Fu The cultural influences of narrative content on consumers’ perceptions of helpfulness
Read et al. Labeling emotions in suicide notes: Cost-sensitive learning with heterogeneous features
Wang et al. Allocation of attention to metadata and retrieval functions: Implications for perceived value and open data discovery and reuse
Wang et al. When texts meet emoji: A multi-stage study of tourism brands
Okada et al. BMDS: A collection of R functions for Bayesian multidimensional scaling
Kaasch Conceptualizing global social policy

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20140729

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140805

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140828

R150 Certificate of patent or registration of utility model

Ref document number: 5607859

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees