JP3987934B2 - 社会的な関係を用いてユーザの評価コメントを要約する文書処理装置、その方法及びプログラム - Google Patents

社会的な関係を用いてユーザの評価コメントを要約する文書処理装置、その方法及びプログラム Download PDF

Info

Publication number
JP3987934B2
JP3987934B2 JP2003382769A JP2003382769A JP3987934B2 JP 3987934 B2 JP3987934 B2 JP 3987934B2 JP 2003382769 A JP2003382769 A JP 2003382769A JP 2003382769 A JP2003382769 A JP 2003382769A JP 3987934 B2 JP3987934 B2 JP 3987934B2
Authority
JP
Japan
Prior art keywords
evaluation
group
comment group
comment
document processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003382769A
Other languages
English (en)
Other versions
JP2005148936A (ja
Inventor
嘉徳 土方
華子 大野
幸貴 楠村
正吾 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Osaka University NUC
Original Assignee
Osaka University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Osaka University NUC filed Critical Osaka University NUC
Priority to JP2003382769A priority Critical patent/JP3987934B2/ja
Priority to US10/841,605 priority patent/US20050102619A1/en
Publication of JP2005148936A publication Critical patent/JP2005148936A/ja
Application granted granted Critical
Publication of JP3987934B2 publication Critical patent/JP3987934B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Description

本発明は、社会的な関係を用いてユーザの評価コメントを要約する文書処理装置、その方法及びプログラムに関するものであり、より、詳細には、ネットオークションなどの商取引における売り手(出品者)に対する評価を記述した評価コメントを、記述した買い手(落札者)ごとにその内容に関する統計量を調べることによって自動的に要約する装置、方法及びプログラムに関するものである。
現在、Web上では様々な商品やサービスに関して多くの電子商取引が行われつつある。中でもネットオークションは一般のユーザが商品を出品できるため大変盛んである。通常、ネットオークションのサイトでは、商品を購入した落札者に出品者に対する評価の文(以下、評価コメント)を記述させている。他のユーザはこの評価コメントを参考にして、入札する商品や入札相手の出品者を決定することができる。しかし、電子商取引が盛んな今日では、これらの評価コメントは大量に存在しているため、ユーザが全ての文章に目を通すには大変な労力及び時間を要する。
この問題を解決するには評価コメントの要約を作成し、ユーザに提示すればよい。しかし、評価コメントには、落札者が出品者を本心から評価した文だけでなく、単なるお礼や儀礼的な挨拶、決まり文句の文が多く含まれている。このような挨拶や決まり文句などは一般に有益な評価情報を含まないため、これらを削除して重要な部分のみを抽出して要約として提示することはユーザにとって有益である。
しかし、従来の一般的な要約の手法は数多く出現する記述を重要とみなし、それらを残して要約するものである。これでは、上述のような儀礼的な文を数多く残してしまう問題がある。また、ユーザにとって有益な文であっても、それが記述される回数が少なければ、削除されてしまい要約には含まれないという問題もある。
従来の文書要約技術は、要約対象となる文書に対して、又書中のキーワードの頻度やキーワードの出現位置、レイアウト情報、強調語などを利用して、文書部分に重要度をつけて、要約に使う文書部分を抽出していた。しかし、これらの手法では儀礼的な記述を除くことや、意図的に外した記述を推定することはできない。
ネット上の不特定多数のユーザが記述した文書を要約する従来の方式には、MHC(非特許文献1を参照されたい。)、佐藤らの研究(非特許文献2、3を参照されたい。)、梅木らのCIKLE(非特許文献4を参照されたい。)などがあるが、これらは特定のキーワードや記号などを手がかりとして情報を抽出または削除している。そのため、抽出するまたは削除する情報の内容も固定されている。このような方法をネットオークションの評価コメントに適用して、お礼や挨拶などの一般に儀礼的と見なされる記述を削除するという固定のルールを用いることも考えられる。しかし、固定のルールを用いた場合、落札者がある出品者に対して特別な思い入れを込めて記述した場合でも、その記述が一般に儀礼的な記述であればルールによって削除され、有益な記述を取り出せない。
乃村能成他著、「MHC-Message Harmonized Calendering Systemの設計と実装」(情報処理学会論文誌、Vol.42, No.10, pp. 2518-2525, 2001) 佐藤円他著、「電子ニュースのダイジェスト自動生成」(情報処理学会論文誌、Vol.36, No.10, pp. 2371-2379, 1995) 佐藤理史他著、「ネットニュースグループfj.wantedのダイジェスト自動生成」(自然言語処理、Vol.3, No.2, pp. 19-32, 1996) 梅木秀雄著、「コミュニケーションに埋もれた知識を活用するコミュニティウェア」(情報処理学会誌、Vol.43, No.10, pp. 1085-1092, 2002)
本発明の目的は、上述した従来技術の諸課題を解決した文書処理装置、方法及びプログラムを提供することである。
本発明による文書処理装置は、
社会的な関係を用いて評価コメントを要約する文書処理装置であって、
複数の評価対象に対する複数の評価者による評価コメントを格納するデータベースにネットワークを介してアクセスするアクセス手段と、
複数の評価対象に対する複数の評価者による評価コメントを格納するデータベースにアクセスして、評価対象別に評価コメントを要約するにあたり、前記データベースからある特定の評価対象に対する評価コメントを第1の評価コメント群として、当該特定の評価対象に対して評価コメントを提供した評価者のその他の評価対象に対する評価コメントを第2の評価コメント群として収集する収集手段と、
前記第1の評価コメント群と前記第2の評価コメント群とを前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する文を存在要約として抽出し、前記第2の評価コメント群のみに存在する文を非存在要約として抽出する抽出手段と、
前記抽出した存在要約と非存在要約とを要約として記憶装置に格納する格納手段と、
前記抽出した存在要約と非存在要約とを要約として表示する表示手段と、
を具える。
従来は個別の評価対象の情報を含む要約しか作成することができなかったが、本発明によれば、いままでにない視点で、「当該評価対象への評価」と、当該評価対象を評価した評価者が「その他の評価対象に行った評価」との差異から社会的な関係(即ち複数の評価対象と複数の評価者との間の相対的な関係)をも考慮に入れた要約を作成することが可能になる。即ち、評価者が特定の評価対象(例えば、製品、サービス、商取引業者、人物、会社、店、或いはレストランなど)にのみ記述した記述、即ち評価者が何らかの思い入れを込めている、つまり本心を述べていると推定される記述を存在要約として抽出することができ、また同時に、評価者が通常使用している言い回しを当該評価対象に対しては意識的に使用しなかった記述を非存在要約として抽出するため、電子商取引サイトなどの利用者はこれらを用いて、評価対象をより的確に把握することことが可能になる。即ち、非存在要約は、評価対象への間接的或いは潜在的な評価コメントであると理解することができる。例えば、非存在要約に含まれる情報が肯定的なものであれば、当該評価対象に対しては否定的な評価が下されていることを予想でき、逆に、非存在要約に含まれる情報が否定的なものであれば、当該評価対象に対しては肯定的な評価が下されていることを予想することが可能である。換言すれば、非存在要約によって、商取引を実行しようとしているユーザは、評価者の心理の裏側を読み取ることができるようになり、より的確に評価対象への評価を読み取ることができる。
また、本発明による文書処理装置は、
形態素解析技法を使用して前記第1のコメント群と前記第2のコメント群に含まれる文を文節(句)に分ける形態素解析手段をも具え、
前記抽出手段は、
前記形態素解析手段(装置)を使用して分けた文節を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する文節を存在要約として抽出し、前記第2の評価コメント群のみに存在する文節を非存在要約として抽出する、
ことを特徴とする。
本発明によれば、文単位ではなく、文を文節に分解して文節単位で処理を行うことができるようになり、より適切に要約を作成することができるようになる。
さらにまた、本発明による文書処理装置は、
形態素解析技法を使用して前記第1のコメント群と前記第2のコメント群に含まれる文を、予め定めた少なくとも1つのキーワードを含む属性とそれに関連する品詞を含む属性値との組に分ける形態素解析手段をも具え、
前記抽出手段は、
前記形態素解析手段(装置)を使用して分けた組を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する組を存在要約として抽出し、前記第2の評価コメント群のみに存在する組を非存在要約として抽出する、
ことを特徴とする文書処理装置。
本発明によれば、文や文節単位ではなく、単語(即ち形態素或いは品詞)に分解し、キーワードとそれを修飾する、或いは修飾される品詞との組み合わせの単位で処理を行うことができるようになり、より適切に要約を作成することができるようになる。即ち、言い回しの微妙な差異によって文単位や文節単位では適切に処理できなかったものが、文節を単語に分解して、さらにこれらの単語を「組」として1つの意味をなす塊として捉えることによって、さらに的確な要約を作成することが可能となる。
さらにまた、本発明による文書処理装置は、
前記抽出手段は、前記抽出した、文、文節、または組の出現頻度が所定の閾値よりも高いもののみを前記存在要約および/または前記非存在要約として抽出する、
ことを特徴とする。
本発明によれば、頻度の高いもののみを抽出できるため、対象の評価コメントの数が膨大である場合、或いは、1つ1つの評価コメントが冗長である場合でも、適正な文字数の要約を作成することが可能になる。即ち、閾値を適切に設定することにより、要約文章を所望の量に抑制することが可能となる。
さらにまた、本発明による文書処理装置は、
前記抽出手段は、予め定めた、文、文節、または、属性と属性値との組を除外する、或いは、出現頻度が予め定めた上位1個または数個の文、文節、または、属性と属性値との組を除外する、
ことを特徴とする。
本発明によれば、たいていの評価コメントに何らかの形で含まれるが、実質的に何ら有益な評価情報にならない儀礼的な文、文節或いは組(挨拶やお礼など)を的確かつ効率的に除外することが可能になる。一般的に評価コメントにおいては、儀礼的な挨拶などの出現頻度が最も高くなるため、頻度という統計量によって、定型的な文を予め用意せずにこれらの無駄なコメントを効率的に削除することも可能である。
さらにまた、本発明による文書処理装置は、
前記複数のユーザは電子商取引の売り手(オークションサイトの出品者など)であり、前記複数の評価者は買い手(オークションサイトの落札者など)であり、前記評価コメントは前記買い手による前記売り手に対する評価コメント(落札した商品や出品者の対応などへの評価)である、
ことを特徴とする。
電子商取引では、インターネットを介して多数の買い手が多数の売り手を評価した評価コメントが多数あり、本発明によれば、このような評価コメントを的確かつ効率的に要約することが可能となる。
上述したように本発明の解決手段を装置として説明してきたが、本発明はこれらに実質的に相当する方法、プログラム、プログラムを記録した記憶媒体としても実現され得るものであり、本発明の範囲にはこれらも包含されるものと理解されたい。
例えば、本発明を方法として実現すると本発明による文書処理方法は、
社会的な関係を用いて評価コメントを要約する文書処理方法であって、
複数の評価対象に対する複数の評価者による評価コメントが格納されているデータベースにネットワークを介してアクセスするアクセスステップと、
複数の評価対象に対する複数の評価者による評価コメントを格納するデータベースにアクセスして、評価対象別に評価コメントを要約するにあたり、前記データベースからある特定の評価対象に対する評価コメントを第1の評価コメント群として、当該特定の評価対象に対して評価コメントを提供した評価者のその他の評価対象に対する評価コメントを第2の評価コメント群として収集する収集ステップと、
演算手段(CPU、MPUなど)を用いて前記第1の評価コメント群と前記第2の評価コメント群とを前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する文を存在要約として抽出し、前記第2の評価コメント群のみに存在する文を非存在要約として抽出する抽出ステップと、
前記抽出した存在要約と非存在要約とを要約として記憶装置に格納する格納ステップと、
前記抽出した存在要約と非存在要約とを要約として表示する表示ステップと、
を含む。
また、本発明による方法は、前記収集ステップと前記抽出ステップとを全ての評価対象に対して繰り返すステップをも含む。
また、本発明による文書処理方法は、
演算手段を用いて形態素解析技法を使用して前記第1のコメント群と前記第2のコメント群に含まれる文を文節(句)に分ける形態素解析ステップをも含み、
前記抽出ステップは、
前記形態素解析ステップで分けた文節を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する文節を存在要約として抽出し、前記第2の評価コメント群のみに存在する文節を非存在要約として抽出する、
ことを特徴とする。
さらにまた、本発明による文書処理方法は、
演算手段を用いて形態素解析技法を使用して前記第1のコメント群と前記第2のコメント群に含まれる文を、予め定めた少なくとも1つのキーワードを含む属性とそれに関連する品詞を含む属性値との組に分ける形態素解析ステップをも含み、
前記抽出ステップは、
演算手段を用いて前記形態素解析ステップで分けた組を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する組を存在要約として抽出し、前記第2の評価コメント群のみに存在する組を非存在要約として抽出する、
ことを特徴とする。
さらにまた、本発明による文書処理方法は、
前記抽出ステップは、前記抽出した、文、文節、または組の出現頻度が所定の閾値よりも高いもののみを前記存在要約および/または前記非存在要約として抽出する、
ことを特徴とする。
さらにまた、本発明による文書処理方法は、
前記抽出ステップは、予め定めた、文、文節、または、属性と属性値との組を除外する、或いは、出現頻度が予め定めた上位1個または数個の文、文節、または、属性と属性値との組を除外する、
ことを特徴とする。
さらにまた、本発明による文書処理方法は、
前記複数のユーザは電子商取引の売り手であり、前記複数の評価者は買い手であり、前記評価コメントは前記買い手による前記売り手に対する評価コメントである、
ことを特徴とする。
また、本発明をプログラムとして実現すると、本発明によるプログラムは、
社会的な関係を用いて評価コメントを要約する文書処理方法をコンピュータに実行させるためのプログラムであって、
複数の評価対象に対する複数の評価者による評価コメントが格納されているデータベースにネットワークを介してアクセスするアクセスステップと、
複数の評価対象に対する複数の評価者による評価コメントを格納するデータベースにアクセスして、評価対象別に評価コメントを要約するにあたり、前記データベースからある特定の評価対象に対する評価コメントを第1の評価コメント群として、当該特定の評価対象に対して評価コメントを提供した評価者のその他の評価対象に対する評価コメントを第2の評価コメント群として収集する収集ステップと、
前記第1の評価コメント群と前記第2の評価コメント群とを前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する文を存在要約として抽出し、前記第2の評価コメント群のみに存在する文を非存在要約として抽出する抽出ステップと、
前記抽出した存在要約と非存在要約とを要約として記憶装置に格納する格納ステップと、
前記抽出した存在要約と非存在要約とを要約として表示する表示ステップと、
を含む具える。
また、本発明によるプログラムは、
形態素解析技法を使用して前記第1のコメント群と前記第2のコメント群に含まれる文を文節に分ける形態素解析ステップをも具え、
前記抽出ステップは、
前記形態素解析ステップで分けた文節を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する文節を存在要約として抽出し、前記第2の評価コメント群のみに存在する文節を非存在要約として抽出する、
ことを特徴とする。
さらにまた、本発明によるプログラムは、
形態素解析技法を使用して前記第1のコメント群と前記第2のコメント群に含まれる文を、予め定めた少なくとも1つのキーワードを含む属性とそれに関連する品詞を含む属性値との組に分ける形態素解析ステップをも含み、
前記抽出ステップは、
前記形態素解析ステップで分けた組を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する組を存在要約として抽出し、前記第2の評価コメント群のみに存在する組を非存在要約として抽出する、
ことを特徴とする。
さらにまた、本発明によるプログラムは、
前記抽出ステップが、前記抽出した、文、文節、または組の出現頻度が所定の閾値よりも高いもののみを前記存在要約および/または前記非存在要約として抽出する、
ことを特徴とする。
さらにまた、本発明によるプログラムは、
前記抽出ステップが、予め定めた、文、文節、または、属性と属性値との組を除外する、或いは、出現頻度が予め定めた上位1個または数個の文、文節、または、属性と属性値との組を除外する、
ことを特徴とする。
さらにまた、本発明によるプログラムは、
前記複数のユーザは電子商取引の売り手であり、前記複数の評価者は買い手であり、前記評価コメントは前記買い手による前記売り手に対する評価コメントである、
ことを特徴とする。
以降、諸図面を参照しながら、本発明の実施態様を詳細に説明する。
図1は、本発明による文書処理装置の基本的な構成を示すブロック図である。図に示すように、本発明による文書処理装置100は、アクセス手段110、収集手段120、形態素解析手段130、抽出手段140、格納手段150、及び表示手段160を具える。文書処理装置100は、ネットワーク170(LANやインターネットなど)を介して、データベース180及びユーザ端末190と接続している。
アクセス手段110は、ネットワーク170を介して、複数の評価対象に対する複数の評価者による多数の評価コメントが格納されているデータベース180にアクセスする。収集手段120は、評価対象別に評価コメントを要約するにあたり、データベース180からある特定の評価対象に対する評価コメントを第1の評価コメント群として、当該特定の評価対象に対して評価コメントを提供した評価者のその他の評価対象に対する評価コメントを第2の評価コメント群として収集する。
形態素解析手段130は、形態素解析技法を使用して前記第1のコメント群と前記第2のコメント群に含まれる文を、予め定めた少なくとも1つのキーワードを含む属性とそれに関連する品詞を含む属性値との組に分ける。抽出手段140は、態素解析手段を使用して分けた組を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する組を存在要約として抽出し、前記第2の評価コメント群のみに存在する組を非存在要約として抽出する。格納手段150は、抽出した要約を評価対象別に記憶装置に格納する。表示装置160は、重複部分を削除した要約をユーザ端末190に提示する。また、品詞から成る組のままではユーザが情報を直接的に理解しにくいため、表示手段160は、当該組に対応する文節に変換したたもの(例えば、「組:対応−迅速」から「文節:迅速に対応してもらえた」に変換したもの)を表示することもできる。或いは、当該組を含むオリジナルの文節または文を表示させることもできる。
図2は、オークションを例として本発明のコンセプトを説明する概念図である。
(1)ある出品者(評価対象、或いは被評価者と称する場合もある)の評価コメントの要約を作成する際に、要約対象の出品者の評価コメントだけを見るのではなく、その評価コメントを記述した落札者(即ち評価者)の一人一人に注目し、各落札者が他の出品者に対して記述した全ての評価コメントを収集する。
(2)(1)で収集した評価コメントと要約対象の出品者に対して記述された評価コメントを落札者ごとに比較して、要約対象の出品者に対してのみ記述されている記述と、要約対象の出品者に対してのみ記述されていない記述を抽出し、要約とする(それらを順に存在要約、非存在要約と呼ぶ)。
本発明の効果として、落札者が何らかの思い入れを込めている、つまり本心を述べている記述を、抽出することができる。また、落札者がいつも使いまわしている記述を、何らかの理由で意図的に外したことが推定できる。
図3は、オークションサイトを例にして、本発明の手法によって出品者Aの要約を作成するときの手順を示す図である。
ステップS1:評価コメントの検索
図に示すようにステップS1では、要約対象の出品者を評価したある落札者が記述した全評価コメントを検索する。評価コメントを検索するには、要約対象の出品者の評価コメントのページから落札者の名前と落札者の評価コメントのページのURLを取得する必要がある。これらは、テンプレートを基にHTML文書中から取り出す。このテンプレートは、オークションサイトに合わせて予め作成したもので、ここには「何番目の<A>エレメントのhref属性を取り出す」というようなルールが書いてある。
ステップS2:相違点の発見
図に示すようにステップS2では、要約対象の出品者に対する評価コメントとその他の出品者に対する評価コメントを比較して、相違点を見つけ取り出す。この相違点とは要約対象の出品者にのみある記述(例えば、文単位、文節単位、属性と属性値とからなる組単位など)か、または要約対象の出品者にのみない記述である。なお、相違点を見つける方法については後で詳細に述べる。なお、相違点とは、他の出品者に対してのコメントにはあまり出てこないが,要約対象の出品者へのコメントには存在する記述である。
ステップS3:要約の集合に追加
図に示すようにステップS3では、要約対象の出品者にのみある記述を集めて存在要約と呼ぶ集合に加え、要約対象の出品者にのみない記述を集めて非存在要約と呼ぶ集合に加える。
ステップ4:重複するものを削除
図に示すようにステップS4では、ステップS2とステップS3の作業を複数の落札者に対して行い、要約の各集合中に重複して存在するものを削除する。
図4は、オークションにおいてある落札者の評価コメントにおいて、要約対象の出品者とその他の出品者の評価コメントとの相違点を見つけるための処理の流れを示す図である。
図に示すようにステップK1では、落札者が記述した評価コメントのうち、要約対象の出品者に対する評価コメント以外の評価コメント中に存在するすべての記述の出現頻度を求める。実際には評価コメント中の記述は属性と属性値との組で表し、頻度はこの組ごとに算出する。属性と属性値の抽出方法については後で詳しく述べる。
ステップK2では、出現頻度の高い記述(閾値α以上)の集合(集合Sとする)を求める。
ステップK3では、以下の2種類の相違点を取り出す。
・要約対象の出品者の評価コメント中に存在する記述のうち、集合Sに存在しないものを見つけ取り出す。この例では記述Eが取り出され、これが被評価者Aにのみ存在する記述とみなされる、即ち、存在要約となる。
・集合Sの各記述で、要約対象の出品者の評価コメント中には存在しないものを見つけ取り出す。この例では記述Bが集合Sから取り出され、これが被評価者Aにのみ存在する記述とみなされる、即ち、非存在要約となる。
属性・属性値の抽出方法
評価コメント中の記述は、記述された内容のトピックを表すキーワードである属性とそのトピックについてそれがどうであったかを表すキーワードである属性値の組によって表す。本発明者らが実際にオークションにおける評価コメントを180件調査したところによると、属性は13種類に分けることができ、属性値は多種多様に存在することが確認できている。図5は、属性と属性値との例を示す図である。図に示すように、オークションサイトの場合の評価コメントにおける、全ての属性と、そのうちの「対応」に関連する属性値とを示してある。
評価コメント中の文から属性とそれに対する属性値を抽出する手順を以下に述べる。
(1) 評価コメントを形態素解析し、予め定めておいた属性のキーワード(同義語または類義語の辞書として持っておく)と評価コメント中の単語のキーワードマッチングを行い、抽出する属性とその位置を決定する。
(2)各属性に対して、予め定めておいた特定の品詞である単語のうち、属性の最も近い位置に存在するものを属性値とする。どの品詞が属性値になり得るかは、我々が評価コメントを180件調査したところ図6のようになることを碓認している。つまり、名詞の属性に対する属性値の品詞は、形容動詞、名詞、形容詞、動詞であり、動詞の属性に対する属性値の品詞は、名詞、形容動詞、副詞である。これらの品詞はこの調査で多く存在した順に示している。属性までの距離が等しくなる2つの属性値が見つかった場合はこの品詞の順に優先する。
図7は、本発明による文書処理装置をオークションサイトの評価コメントの要約に適用した場合のシステム構成図である。
図に示すように、本発明による文書作成装置を含む、要約を作成するための要約サーバ200を設ける。ユーザ270は、オークションサーバ280の代わりに要約サーバ200にアクセスして、評価コメントの要約を得る。これにより、ネットオークションの運営者だけでなく、そうでない人間もASPの形式で本サービス(要約文作成)を提供することができる。要約サーバ200側のプログラムは、Java(登録商標)で実装している部分とJava(登録商標)サーブレットで実装している部分の2種類から構成されている。Java(登録商標)で実装されているモジュールは本発明の手法を用いて要約する部分を担当し、Java(登録商標)サーブレットで実装されているモジュールはユーザのブラウザとの通信部分を担当する。ユーザに評価コメントの要約を提示するまでの流れを以下に述べる。
ユーザ270が、興味のある商品を検索するために検索キーワードを入力する(ステップJ1)。商品検索モジュール210がその検索キーワードを受け取ってそのままオークションサーバ280に送り(ステップJ2)、オークションサーバ280が検索結果のHTML文書を検索結果ページ作成モジュール220に送る(ステップJ3)。検索結果ページ作成モジュール220がこのHTML文書中に、出品者を選択するためのチェックボックスを埋め込み、検索結果ページとしてユーザに示す(ステップJ4)。
ユーザは検索結果ページから評価コメントの要約を閲覧したい出品者を選択し、チェックボックスをチェックする(ステップJ5)。評価コメント検索モジュール240は、選択された出品者の評価コメントのページから、要約をするのに必要な評価コメントの検索を開始する。必要なページをオークションサーバ280に要求し(ステップJ6)、HTML文書を受け取る(ステップJ7)という作業を評価コメントの検索が終了するまで繰り返す。評価コメントの検索が終了すると、評価コメント検索モジュール240は検索した全評価コメントを要約モジュールに渡す(ステップJ8)。その後、要約モジュール250が本発明の手法に基づいて評価コメントを要約し、要約結果のデータを要約結果ページ作成モジュール260に渡す(ステップJ9)。要約結果ページ作成モジュール260がこのデータから要約結果ページを作成し、ユーザ270に提示する(ステップJ10)。
本発明を使った時の要約結果の例として、あるネットオークションの評価コメントを対象として行ったものを図8に示す。また、要約対象の出品者へのオリジナルの評価コメントの一部を図9に示す。
この評価コメントをこのまま要約しようとすると、出品者の特徴を表す有益な記述がどれであるかがわかりにくく、要約することができない。そこで、図9)において○で囲まれた落札者(評価者)Bに注目する(この落札者が要約対象でないその他の出品者に対して記述した評価コメントを図10に示す)。まず、図9で評価者Bの記述した評価コメントと図10の全評価コメントを比較すると、図9で評価者Bの記述した評価コメントには「すべて綺麗にDVD再生機でも再生できましたよ」という記述が存在するが、図10中には存在しない。よって、この記述は要約対象の出品者にのみ記述された記述であり、図8の要約結果に存在要約として現れている。このようにして特別に思い入れを込めて記述された文は、要約として残ることがわかる。続いて図10の評価コメントを見ると、「商品がすぐに届きました」と「迅速な対応ありがとうございます」という記述が多く存在することがわかる。しかし、図9で評価者Bが記述した評価コメント中にはこれら2つの記述は存在しないため、これらは要約対象の出品者に対してのみ記述されていない記述であり、図8の要約結果に非存在要約として現れている。このように、他の出品者には記述されているが、この出品者に対しては記述されていない記述から、その出品者だけ違った(この場合、「対応が遅かった」、「商品到着遅れた」)かもしれないことが類推できる。
図10から、落札者(評価者)は全く同じまたは同じような記述(それらはたいてい儀礼的な記述)を繰り返し用いていることがわかる。これらは多くの場合、決まった文章を予め用意しておきコピーアンドペーストしているものと考えられる。従って、要約対象の出品者の評価コメントをそのまま要約するよりも、落札者ごとに要約対象の出品者の評価コメントとその他の出品者(評価対象)の評価コメントを比較すると、同じような記述を容易に除くことができる。また、他の出品者に対しては記述しておらず、要約対象の出品者にのみ記述している記述は、この落札者が何らかの思い入れを込めている、つまり本心を述べている記述であると思われる。この点でも、落札者ごとに比較する方が本心から記述された評価コメントを取り出すことができる。また、落札者が意図的に記載しなかった記述は、何らかの理由があって、記載しなかったと思われる。他の出品者に対して記述していた内容を記載しなかったことは、それを表示することで、その不記載の理由を推定することが可能となる。
本明細書では、様々な実施態様で本発明の原理を説明してきたが、本発明は上述した実施例に限定されず、当業者であれば幾多の変形および修正を施すことが可能であり、これら変形および修正されたものも本発明に含まれることを理解されたい。例えば、本発明を主としてオークションサイトのコメントの要約に適用して説明したきたが、本発明は、オークションサイトの要約には限定されず、複数の評価者(顧客)が複数の何らかの評価対象(人、会社、サービス、商品など)を評価した評価コメントに幅広く適用可能である。例えば、インターネット上の仮想商店、電子商取引において取引される商品やサービス、或いは、レストランに対する評価コメントなどにも適用可能である。
本発明による文書処理装置の基本的な構成を示すブロック図である。 本発明のコンセプトを説明する概念図である。 オークションを例にして、本発明の手法によって出品者Aの要約を作成するときの手順を示す図である。 ある落札者の評価コメントにおいて、要約対象の出品者とその他の出品者の評価コメントとの相違点を見つけるための処理の流れを示す図である。 属性と属性値との例を示す図である。 属性と属性値の品詞との組を表した図である。 本発明による文書処理装置をオークションサイトの評価コメントの要約に適用した場合のシステム構成図である。 本発明による装置で実際に作成した要約を示す図である。 要約対象の出品者へのオリジナルの評価コメントを示す図である。 要約対象でないその他の出品者に行った評価コメントを示す図である。
符号の説明
100 文書処理装置
110 アクセス手段
120 収集手段
130形態素解析手段
140 抽出手段
150 格納手段
160 表示手段
170 ネットワーク
180 データベース
190 ユーザ端末
200 要約サーバ
210 商品検索モジュール
220 検索結果ページ作成モジュール
240 評価コメント検索モジュール
250 要約モジュール
260 要約結果ページ作成モジュール
270 ユーザ
280 オークションサーバ

Claims (27)

  1. 社会的な関係を用いて評価コメントを要約する文書処理装置であって、
    複数の評価対象に対する複数の評価者による評価コメントが格納されているデータベースにアクセスして、評価対象別に評価コメントを要約するにあたり、前記データベースからある特定の評価対象に対する評価コメントを第1の評価コメント群として、当該特定の評価対象に対して評価コメントを提供した評価者のその他の評価対象に対する評価コメントを第2の評価コメント群として収集する収集手段と、
    前記第1の評価コメント群と前記第2の評価コメント群とを前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する文を存在要約として抽出し、前記第2の評価コメント群のみに存在する文を非存在要約として抽出する抽出手段と、
    を具える文書処理装置。
  2. 請求項1に記載の文書処理装置において、
    形態素解析技法を使用して前記第1のコメント群と前記第2のコメント群に含まれる文を文節に分ける形態素解析手段をも具え、
    前記抽出手段は、
    前記形態素解析手段を使用して分けた文節を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する文節を存在要約として抽出し、前記第2の評価コメント群のみに存在する文節を非存在要約として抽出する、
    ことを特徴とする文書処理装置。
  3. 請求項1に記載の文書処理装置において、
    形態素解析技法を使用して前記第1のコメント群と前記第2のコメント群に含まれる文を、予め定めた少なくとも1つのキーワードを含む属性とそれに関連する品詞を含む属性値との組に分ける形態素解析手段をも具え、
    前記抽出手段は、
    前記形態素解析手段を使用して分けた組を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する組を存在要約として抽出し、前記第2の評価コメント群のみに存在する組を非存在要約として抽出する、
    ことを特徴とする文書処理装置。
  4. 請求項3に記載の文書処理装置において、
    前記抽出手段が、
    前記形態素解析手段を使用して分けた組を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する組を含む文または文節を存在要約として抽出し、前記第1の評価コメント群のみに存在する組を含む文または文節を非存在要約として抽出する、
    ことを特徴とする文書処理装置。
  5. 請求項3に記載の文書処理装置において、
    前記抽出手段が、
    前記形態素解析手段を使用して分けた組の出現頻度を前記第2のコメント群について求め、前記第2の評価コメント群においてある閾値以上出現した組と、前記第1のコメント群に含まれる組とを比較して、前記第1のコメント群に含まれる組には存在せず、前記第2の評価コメント群においてある閾値以上出現した組にのみ存在する組を非存在要約とし、前記第2の評価コメント群においてある閾値以上出現した組には存在せず、前記第1のコメント群に含まれる組にのみ存在する組を存在要約として抽出する、
    ことを特徴とする文書処理装置。
  6. 請求項5に記載の文書処理装置において、
    前記抽出手段が、
    前記形態素解析手段を使用して分けた組の出現頻度を前記第2のコメント群について求め、前記第2の評価コメント群においてある閾値以上出現した組と、前記第1のコメント群に含まれる組とを比較して、前記第1のコメント群に含まれる組には存在せず、前記第2の評価コメント群においてある閾値以上出現した組にのみ存在する組を含む、第2のコメント群における文または文節を非存在要約とし、前記第2の評価コメント群においてある閾値以上出現した組には存在せず、前記第1のコメント群に含まれる組にのみ存在する組を含む、第1のコメント群における文または文節存在要約として抽出する、
    ことを特徴とする文書処理装置。
  7. 請求項1〜のいずれか1項に記載の文書処理装置において、
    前記抽出手段は、前記抽出した、文、文節、または組の出現頻度が所定の閾値よりも高いもののみを前記存在要約および/または前記非存在要約として抽出する、
    ことを特徴とする文書処理装置。
  8. 請求項1〜のいずれか1項に記載の文書処理装置において、
    前記抽出手段は、
    前記抽出した、文、文節、または属性と属性値との組から、予め定めた、文、文節、または、属性と属性値との組を除外する、或いは、出現頻度が予め定めた上位1個または数個の文、文節、または、属性と属性値との組を除外する、
    ことを特徴とする文書処理装置。
  9. 請求項1〜のいずれか1項に記載の文書処理装置において、
    前記複数のユーザは電子商取引の売り手であり、前記複数の評価者は買い手であり、前記評価コメントは前記買い手による前記売り手に対する評価コメントである、
    ことを特徴とする文書処理装置。
  10. コンピュータを用いて社会的な関係を用いて評価コメントを要約する文書処理方法であって、
    前記コンピュータが、複数の評価対象に対する複数の評価者による評価コメントを格納するデータベースにアクセスして、評価対象別に評価コメントを要約するにあたり、前記データベースからある特定の評価対象に対する評価コメントを第1の評価コメント群として、当該特定の評価対象に対して評価コメントを提供した評価者のその他の評価対象に対する評価コメントを第2の評価コメント群として収集する収集ステップと、
    前記コンピュータが、前記第1の評価コメント群と前記第2の評価コメント群とを前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する文を存在要約として抽出し、前記第2の評価コメント群のみに存在する文を非存在要約として抽出する抽出ステップと、
    を含む文書処理方法。
  11. 請求項10に記載の文書処理方法において、
    前記コンピュータが、形態素解析技法を使用して前記第1のコメント群と前記第2のコメント群に含まれる文を文節に分ける形態素解析ステップをも含み、
    前記抽出ステップは、
    前記コンピュータが、前記形態素解析ステップで分けた文節を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する文節を存在要約として抽出し、前記第2の評価コメント群のみに存在する文節を非存在要約として抽出する、
    ことを特徴とする文書処理方法。
  12. 請求項10に記載の文書処理方法において、
    前記コンピュータが、形態素解析技法を使用して前記第1のコメント群と前記第2のコメント群に含まれる文を、予め定めた少なくとも1つのキーワードを含む属性とそれに関連する品詞を含む属性値との組に分ける形態素解析ステップをも含み、
    前記抽出ステップは、
    前記コンピュータが、前記形態素解析ステップで分けた組を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する組を存在要約として抽出し、前記第2の評価コメント群のみに存在する組を非存在要約として抽出する、
    ことを特徴とする文書処理方法。
  13. 請求項12に記載の文書処理方法において、
    前記抽出ステップ
    前記コンピュータが、前記形態素解析ステップで分けた組を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する組を含む文または文節を存在要約として抽出し、前記第1の評価コメント群のみに存在する組を含む文または文節を非存在要約として抽出する、
    ことを特徴とする文書処理方法。
  14. 請求項12に記載の文書処理方法において、
    前記抽出ステップ
    前記コンピュータが、前記形態素解析ステップで分けた組の出現頻度を前記第2のコメント群について求め、前記第2の評価コメント群においてある閾値以上出現した組と、前記第1のコメント群に含まれる組とを比較して、前記第1のコメント群に含まれる組には存在せず、前記第2の評価コメント群においてある閾値以上出現した組にのみ存在する組を非存在要約とし、前記第2の評価コメント群においてある閾値以上出現した組には存在せず、前記第1のコメント群に含まれる組にのみ存在する組を存在要約として抽出する、
    ことを特徴とする文書処理方法。
  15. 請求項14に記載の文書処理方法において、
    前記抽出ステップ
    前記コンピュータが、前記形態素解析ステップで分けた組の出現頻度を前記第2のコメント群について求め、前記第2の評価コメント群においてある閾値以上出現した組と、前記第1のコメント群に含まれる組とを比較して、前記第1のコメント群に含まれる組には存在せず、前記第2の評価コメント群においてある閾値以上出現した組にのみ存在する組を含む、第2のコメント群における文または文節を非存在要約とし、前記第2の評価コメント群においてある閾値以上出現した組には存在せず、前記第1のコメント群に含まれる組にのみ存在する組を含む、第1のコメント群における文または文節存在要約として抽出する、ことを特徴とする文書処理方法。
  16. 請求項10〜15のいずれか1項に記載の文書処理方法において、
    前記抽出ステップは、
    前記コンピュータが、前記抽出した、文、文節、または組の出現頻度が所定の閾値よりも高いもののみを前記存在要約および/または前記非存在要約として抽出する、
    ことを特徴とする文書処理方法。
  17. 請求項10〜16のいずれか1項に記載の文書処理方法において、
    前記抽出ステップは、
    前記コンピュータが、前記抽出した、文、文節、または属性と属性値との組から、予め定めた、文、文節、または、属性と属性値との組を除外する、或いは、出現頻度が予め定めた上位1個または数個の文、文節、または、属性と属性値との組を除外する、
    ことを特徴とする文書処理方法。
  18. 請求項10〜17のいずれか1項に記載の文書処理方法において、
    前記複数のユーザは電子商取引の売り手であり、前記複数の評価者は買い手であり、前記評価コメントは前記買い手による前記売り手に対する評価コメントである、
    ことを特徴とする文書処理方法。
  19. 社会的な関係を用いて評価コメントを要約する文書処理方法をコンピュータに実行させるためのプログラムであって、
    複数の評価対象に対する複数の評価者による評価コメントを格納するデータベースにアクセスして、評価対象別に評価コメントを要約するにあたり、前記データベースからある特定の評価対象に対する評価コメントを第1の評価コメント群として、当該特定の評価対象に対して評価コメントを提供した評価者のその他の評価対象に対する評価コメントを第2の評価コメント群として収集する収集ステップと、
    前記第1の評価コメント群と前記第2の評価コメント群とを前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する文を存在要約として抽出し、前記第2の評価コメント群のみに存在する文を非存在要約として抽出する抽出ステップと、
    を含むプログラム。
  20. 請求項19に記載のプログラムにおいて、
    形態素解析技法を使用して前記第1のコメント群と前記第2のコメント群に含まれる文を文節に分ける形態素解析ステップをも含み、
    前記抽出ステップは、
    前記形態素解析ステップで分けた文節を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する文節を存在要約として抽出し、前記第2の評価コメント群のみに存在する文節を非存在要約として抽出する、
    ことを特徴とするプログラム。
  21. 請求項19に記載のプログラムにおいて、
    形態素解析技法を使用して前記第1のコメント群と前記第2のコメント群に含まれる文を、予め定めた少なくとも1つのキーワードを含む属性とそれに関連する品詞を含む属性値との組に分ける形態素解析ステップをも含み、
    前記抽出ステップは、
    前記形態素解析ステップで分けた組を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する組を存在要約として抽出し、前記第2の評価コメント群のみに存在する組を非存在要約として抽出する、
    ことを特徴とするプログラム。
  22. 請求項21に記載のプログラムにおいて、
    前記抽出ステップが、
    前記形態素解析ステップで分けた組を前記評価者ごとに比較して、前記第1の評価コメント群のみに存在する組を含む文または文節を存在要約として抽出し、前記第1の評価コメント群のみに存在する組を含む文または文節を非存在要約として抽出する、
    ことを特徴とするプログラム。
  23. 請求項21に記載のプログラムにおいて、
    前記抽出ステップが、
    前記形態素解析ステップで分けた組の出現頻度を前記第2のコメント群について求め、前記第2の評価コメント群においてある閾値以上出現した組と、前記第1のコメント群に含まれる組とを比較して、前記第1のコメント群に含まれる組には存在せず、前記第2の評価コメント群においてある閾値以上出現した組にのみ存在する組を非存在要約とし、前記第2の評価コメント群においてある閾値以上出現した組には存在せず、前記第1のコメント群に含まれる組にのみ存在する組を存在要約として抽出する、ことを特徴とするプログラム。
  24. 請求項23に記載のプログラムにおいて、
    前記抽出ステップが、
    前記形態素解析ステップで分けた組の出現頻度を前記第2のコメント群について求め、前記第2の評価コメント群においてある閾値以上出現した組と、前記第1のコメント群に含まれる組とを比較して、前記第1のコメント群に含まれる組には存在せず、前記第2の評価コメント群においてある閾値以上出現した組にのみ存在する組を含む、第2のコメント群における文または文節を非存在要約とし、前記第2の評価コメント群においてある閾値以上出現した組には存在せず、前記第1のコメント群に含まれる組にのみ存在する組を含む、第1のコメント群における文または文節存在要約として抽出する、ことを特徴とするプログラム。
  25. 請求項19〜24のいずれか1項に記載のプログラムにおいて、
    前記抽出ステップは、前記抽出した、文、文節、または組の出現頻度が所定の閾値よりも高いもののみを前記存在要約および/または前記非存在要約として抽出する、
    ことを特徴とするプログラム。
  26. 請求項19〜25のいずれか1項に記載のプログラムにおいて、
    前記抽出ステップは、
    前記抽出した、文、文節、または属性と属性値との組から、予め定めた、文、文節、または、属性と属性値との組を除外する、或いは、出現頻度が予め定めた上位1個または数個の文、文節、または、属性と属性値との組を除外する、
    ことを特徴とするプログラム。
  27. 請求項19〜26のいずれか1項に記載のプログラムにおいて、
    前記複数のユーザは電子商取引の売り手であり、前記複数の評価者は買い手であり、前記評価コメントは前記買い手による前記売り手に対する評価コメントである、
    ことを特徴とするプログラム。
JP2003382769A 2003-11-12 2003-11-12 社会的な関係を用いてユーザの評価コメントを要約する文書処理装置、その方法及びプログラム Expired - Lifetime JP3987934B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003382769A JP3987934B2 (ja) 2003-11-12 2003-11-12 社会的な関係を用いてユーザの評価コメントを要約する文書処理装置、その方法及びプログラム
US10/841,605 US20050102619A1 (en) 2003-11-12 2004-05-10 Document processing device, method and program for summarizing evaluation comments using social relationships

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003382769A JP3987934B2 (ja) 2003-11-12 2003-11-12 社会的な関係を用いてユーザの評価コメントを要約する文書処理装置、その方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2005148936A JP2005148936A (ja) 2005-06-09
JP3987934B2 true JP3987934B2 (ja) 2007-10-10

Family

ID=34544715

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003382769A Expired - Lifetime JP3987934B2 (ja) 2003-11-12 2003-11-12 社会的な関係を用いてユーザの評価コメントを要約する文書処理装置、その方法及びプログラム

Country Status (2)

Country Link
US (1) US20050102619A1 (ja)
JP (1) JP3987934B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060206806A1 (en) * 2004-11-04 2006-09-14 Motorola, Inc. Text summarization
US7725442B2 (en) * 2007-02-06 2010-05-25 Microsoft Corporation Automatic evaluation of summaries
JP5106898B2 (ja) * 2007-03-27 2012-12-26 キヤノン電子株式会社 情報処理装置及び情報処理方法
US20080249762A1 (en) * 2007-04-05 2008-10-09 Microsoft Corporation Categorization of documents using part-of-speech smoothing
US7925496B1 (en) * 2007-04-23 2011-04-12 The United States Of America As Represented By The Secretary Of The Navy Method for summarizing natural language text
CN102637165B (zh) * 2012-02-17 2014-08-20 清华大学 一种中文的观点、评价信息的属性-观点对抽取方法
US9552399B1 (en) * 2013-03-08 2017-01-24 Blab, Inc. Displaying information about distributed group discussions
CN105095179B (zh) * 2014-05-14 2019-03-26 腾讯科技(深圳)有限公司 对用户评价进行处理的方法及装置
US10572726B1 (en) * 2016-10-21 2020-02-25 Digital Research Solutions, Inc. Media summarizer
US11216578B2 (en) * 2016-12-26 2022-01-04 Osaka University Data analysis method and data analysis system
CN107481115A (zh) * 2017-08-18 2017-12-15 北京微影时代科技有限公司 一种在线购票方法及装置
CN110378798B (zh) * 2019-06-03 2022-04-01 中移互联网有限公司 异构社交网络构建方法、群组推荐方法、装置及设备
WO2021038827A1 (ja) * 2019-08-30 2021-03-04 富士通株式会社 情報処理方法、情報処理プログラムおよび情報処理装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6317708B1 (en) * 1999-01-07 2001-11-13 Justsystem Corporation Method for producing summaries of text document
US7428505B1 (en) * 2000-02-29 2008-09-23 Ebay, Inc. Method and system for harvesting feedback and comments regarding multiple items from users of a network-based transaction facility
US7251781B2 (en) * 2001-07-31 2007-07-31 Invention Machine Corporation Computer based summarization of natural language documents
US6904564B1 (en) * 2002-01-14 2005-06-07 The United States Of America As Represented By The National Security Agency Method of summarizing text using just the text
JP3682529B2 (ja) * 2002-01-31 2005-08-10 独立行政法人情報通信研究機構 要約自動評価処理装置、要約自動評価処理プログラム、および要約自動評価処理方法
US7346494B2 (en) * 2003-10-31 2008-03-18 International Business Machines Corporation Document summarization based on topicality and specificity

Also Published As

Publication number Publication date
US20050102619A1 (en) 2005-05-12
JP2005148936A (ja) 2005-06-09

Similar Documents

Publication Publication Date Title
US10748164B2 (en) Analyzing sentiment in product reviews
US9857946B2 (en) System and method for evaluating sentiment
Wang et al. Automatic online news topic ranking using media focus and user attention based on aging theory
US7587309B1 (en) System and method for providing text summarization for use in web-based content
US20090119275A1 (en) Method of monitoring electronic media
US20090030891A1 (en) Method and apparatus for extraction of textual content from hypertext web documents
JP3987934B2 (ja) 社会的な関係を用いてユーザの評価コメントを要約する文書処理装置、その方法及びプログラム
Ganeshbhai et al. Feature based opinion mining: A survey
EP1776666A2 (en) Active relationship management
JP2002245061A (ja) キーワード抽出
JP2008165284A (ja) 風説監視システム、風説監視方法及びプログラム
Yatani et al. Analysis of adjective-noun word pair extraction methods for online review summarization
JP4743766B2 (ja) 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム
Jha et al. Sentiment analysis for E-commerce products using natural language processing
JP4883644B2 (ja) リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法
Craven DESCRIPTION meta tags in public home and linked pages
JP2016197332A (ja) 情報処理システム、情報処理方法、およびコンピュータプログラム
He et al. Mining feature-opinion from reviews based on dependency parsing
Tanawongsuwan Part-of-speech approach to evaluation of textbook reviews
JP2002183175A (ja) テキストマイニング方法
Selvadurai A natural language processing based web mining system for social media analysis
Kanbur et al. Ontology based aspect oriented opinion summary methodology
JP2000105769A (ja) 文書表示方法
Sanda et al. Opinion mining feature-level using Naive Bayes and feature extraction based analysis dependencies
Hilal et al. Aspect based opinion mining of online reviews

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060905

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20060915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070208

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070531

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070619

R150 Certificate of patent or registration of utility model

Ref document number: 3987934

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

EXPY Cancellation because of completion of term