JP2006236379A - 情報分類装置 - Google Patents

情報分類装置 Download PDF

Info

Publication number
JP2006236379A
JP2006236379A JP2006122296A JP2006122296A JP2006236379A JP 2006236379 A JP2006236379 A JP 2006236379A JP 2006122296 A JP2006122296 A JP 2006122296A JP 2006122296 A JP2006122296 A JP 2006122296A JP 2006236379 A JP2006236379 A JP 2006236379A
Authority
JP
Japan
Prior art keywords
information
document
expression
reputation
reputation information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006122296A
Other languages
English (en)
Inventor
Kenji Tateishi
健二 立石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006122296A priority Critical patent/JP2006236379A/ja
Publication of JP2006236379A publication Critical patent/JP2006236379A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文書内における評判情報を分類する。
【解決手段】発信者グループ別分類手段512が、文書記憶部7と評判位置記憶部8を参照して、評判情報を含む文書における発信者を示す情報が出現する位置を特定し、更に、発信者対応関係記憶部511に記憶された対応関係を参照して、その評判情報を発信者グループ別に分類し、文書タイプ的発信者グループ別分類手段514が、評判位置記憶部8と文書記憶部7を参照し、評判情報を含む文書の文書タイプを判定し、更に、文書タイプ対応関係記憶部513に記憶された文書タイプと発信者グループとの対応関係を参照することにより、その評判情報を発信者グループ別に分類し、発信元グループ決定手段515が、発信者グループ別分類手段512と文書タイプ的発信者グループ別分類手段514の分類結果の優先順位を定め、評判情報について一つの発信者グループを決定し、その結果を分類結果記憶部6に出力する。
【選択図】 図1

Description

本発明は、情報分類装置に関し、特に評判情報を検索できる情報分類装置に関する。
現在、検索語を手掛かりにその属性情報を検索できるシステムとして、あらかじめ人手で収集した属性情報から利用者が欲しい情報を見ることができるシステムが存在する。例えば、Deja.com(非特許文献1:http://www.Deja.com)では、あらかじめ消費者から商品に関する属性情報として評判情報を収集し、利用者は商品の名前を選択するとその評判情報を得ることができる。
http://www.Deja.com
しかしながら、上記の評判情報検索システムのような人間の投稿に依存する方法は評価の量の面で限界があり、極端な著名な商品以外は商品購入の判断材料として利用するには十分ではないのが現状である。また、システムは商品を列挙して、その後消費者が投稿してくれるのを待つ方法を採用しているため、現存するすべての商品を網羅するまでには膨大な時間を要し、また人的コストも高い。そこで、例えばWebのような大規模なデータベースから評判情報を抜き出す方法を採用することにする。この場合、大量の、様々な人からの、様々な内容の評判情報を収集することが可能となるが、その情報をそのまま利用者に提示したのでは、利用者は結果を逐一確認する必要があり、どのような内容の評判が記載されているかを把握するまでに非常に時間がかかることになる。本発明はこのような問題点に鑑みてなされたもので、その目的は評判情報を多角的に分類する情報分類装置を提供すること、及び評判情報を自動的に検索して、検索した評判情報を多角的に分類する情報分類装置を提供することである。
本発明の第1の効果は、評判情報の多角的な分類を行うことができることである。その理由は、発信者グループ別分類と主題別分類と評価表現属性別分類という3つの異なる分類基準を有する分類手法を有しているためである。
本発明の第2の効果は、評判情報の判別および分類を一連の処理で行うことができることである。その理由は、評判情報の存在する位置を判別する手段と評判情報を多角的に分類する手段を両方備えるためである。
本発明の第3の効果は、評判情報の内容を利用者が容易に把握することができることである。その理由は、評判情報の判別結果及び分類結果を一括表示または分割表示する手段が存在するためである。
本発明の第1の情報分類装置は、評判情報の発信者を示す情報と発信者グループとの対応関係を記憶した発信者対応関係記憶部(図2の511)と、評判情報を含む文書から発信者を示す情報の位置を特定し発信者対応関係記憶部に記憶された対応関係により評判情報を発信者グループ別に分類する発信者グループ別分類手段(図2の512)と、文書タイプと発信者グループの対応関係を記憶した文書タイプ対応関係記憶部(図2の513)と、評判情報を含む文書の文書タイプを判定し文書タイプ対応関係記憶部に記憶された文書タイプと発信者グループの対応関係により評判情報を発信者グループ別に分類する文書タイプ的発信者グループ別分類手段(図2の514)と、発信者グループ別分類手段と文書タイプ的発信者グループ別分類手段の分類結果の優先順位を定め一つの発信者グループを決定する発信元グループ決定手段(図2の515)を有する。このような構成を採用し、発信者を示す情報又は文書タイプの情報を用いることにより評判情報を発信者グループ別に分類することが可能となる。
本発明の第2の情報分類装置は、評判情報の主題表現を記憶する主題表現記憶部(図7の521)と、文書内の評判情報が出現する位置の周囲に主題表現記憶部に記憶された主題表現が存在する場合、評判情報をその主題表現に分類する主題別分類手段(図7の522)を有する。このような構成を採用し、評判情報が出現する位置の周囲に存在する主題表現により評判情報を主題別に分類することが可能となる。
本発明の第3の情報分類装置は、評価表現の肯定的又は否定的な属性を記憶する評価表現属性記憶部(図8の531)と、否定表現を記憶する否定表現記憶部(図8の532)と、評価表現属性記憶部に記憶された評価表現の肯定的又は否定的な属性と、文書内の評価表現の近接に存在する否定表現記憶部に記憶された否定表現との組み合わせにより、評判情報を肯定又は否定な属性に分類する評価表現属性別分類手段(図8の533)とを有する。このような構成を採用し、評価表現の属性と否定表現を組み合わせることにより評判情報を肯定的又は否定的の評価表現属性別に分類することが可能となる。
本発明の第4の情報分類装置は、評判情報を発信者グループ別に分類する発信者グループ別分類手段(図9の51)と、評判情報を主題別に分類する主題別分類手段(図9の52)と、評判情報を評価表現属性別に分類する評価表現別分類手段(図9の53)を有する。このような構成を採用し、3つの異なる分類基準を有する分類手法を用いることにより、評判情報の多角的な分類が可能となる。
本発明の第5の情報分類装置は、文書集合に含まれる検索語に関する評判情報の位置を判別する評判情報判別手段(図10の3)と、評判情報が含まれる文書を用いて評判情報を特定の基準により分類する評判情報分類手段(図10の5)を有する。このような構成を採用し、評判情報判別手段と評判情報分類手段を両方備えることにより評判情報の判別および分類を一連の検索処理で行うことが可能となる。
本発明の第6の情報分類装置は、本発明の第5の情報分類装置において、評判情報判別手段が、入力された文書集合における入力された検索語の位置を特定する検索語位置特定手段(図13の302)と、事物に対する価値を定める評価表現を記憶する評価表現記憶部(図13の301)と、入力された文書集合における前記評価表現記憶部に記憶されたいずれかの前記評価表現が出現する位置を特定する評価表現位置特定手段(図13の303)と、前記検索語位置特定手段により出力された前記検索語の位置と前記評価表現位置特定手段により出力された前記評価表現の位置の距離が一定の範囲内ならば当該評価表現を前記検索語の評判情報と判別する表現間距離判定手段(図13の304)とを備える。このような構成を採用し、検索語と評価表現の表現間距離を判定することにより検索語に関する評判情報が出現する位置を自動的に特定して、その結果を評判位置記憶部に記憶することが可能となる。
本発明の第7の情報分類装置は、本発明の第5の情報分類装置において、評判情報判別手段が、前記評判情報判別手段が、入力された文書集合における入力された検索語の位置を特定する検索語位置特定手段(図15の302)と、前記検索語の分野を特定する検索語分野特定手段(図15の309)と、事物に対する価値を定める評価表現と、前記評価表現に関する分野情報を記憶する評価表現記憶部(図15の301)と、前記検索語分野特定手段により特定された前記検索語の分野と、前記評価表現記憶部の前記評価表現に関する分野情報とを参照し、前記評価表現記憶部に記憶された前記特定された検索語の分野に属するいずれかの前記評価表現が出現する位置を特定する評価表現位置特定手段(図15の303)と、前記検索語位置特定手段により出力された前記検索語の位置と前記評価表現位置特定手段により出力された前記評価表現の位置の距離が一定の範囲内ならば当該評価表現を前記検索語の評判情報と判別する表現間距離判定手段(図15の304)とを備える。このような構成を採用し、評判情報の判別精度の向上および判別速度の高速化が可能となり、精度を高くして、高速に評判位置記憶部8に評判情報の位置情報を記憶することができる。
本発明の第8の情報分類装置は、本発明の第5の情報分類装置において、評判情報判別手段が、入力された文書集合における入力された検索語の位置を特定する検索語位置特定手段(図17の302)と、数値表現の内、事物に対する価値を定める数値評価表現を記憶する数値評価表現記憶部(図17の305)と、入力された文書集合における前記数値評価表現記憶部に記憶されたいずれかの数値評価表現が出現する位置を特定する数値評価表現位置特定手段(図17の306)と、前記検索語位置特定手段により出力された前記検索語の位置と前記数値評価表現位置特定手段により出力された前記数値評価表現の位置の距離が一定の範囲内ならば当該数値評価表現を前記検索語の評判情報と判別する表現間距離判定手段(図17の304)とを備える。このような構成を採用し、検索語と数値評価表現の表現間距離を判定することにより数値評価表現で記述される検索語に関する評判情報が出現する位置を自動的に特定して、その結果を評判位置記憶部8に記憶することが可能となる。
本発明の第9の情報分類装置は、本発明の第5の情報分類装置において、評判情報判別手段が、入力された文書集合における入力された検索語の位置を特定する検索語位置特定手段(図22の302)と、記号表現の内、事物に対する価値を定める記号評価表現を記憶する記号評価表現記憶部(図22の307)と、入力された文書集合における前記記号評価表現記憶部に記憶されたいずれかの記号評価表現が出現する位置を特定する記号評価表現位置特定手段(図22の308)と、前記検索語位置特定手段により出力された前記検索語の位置と前記記号評価表現位置特定手段により出力された前記記号評価表現の位置の距離が一定の範囲内ならば当該記号評価表現を前記検索語の評判情報と判別する表現間距離判定手段(図22の304)とを備える。このような構成を採用し、検索語と記号評価表現の表現間距離を判定することにより記号評価表現で記述される検索語に関する評判情報が出現する位置を自動的に特定して、その結果を評判位置記憶部8に記憶することが可能となる。
本発明の第10の情報分類装置は、評判情報の内容及び分類結果を表示する検索結果表示手段(図10の9)を有する。このような構成を採用し、評判情報の判別結果及び分類結果を一括表示または分割表示することにより、評判情報の内容を利用者が容易に把握することが可能となる。
次に、本発明の実施の形態について図面を参照して詳細に説明する。
[実施の形態1]
図1を参照すると、本発明の第1の実施の形態は、文書記憶部7と、評判位置記憶部8と、評判情報分類手段5と、分類結果記憶部6とを備えている。
文書集合記憶部7は、文書の集合である文書集合を記憶するものである。文書集合に含まれる各文書には文書を識別するための情報が付与されている。なお、文書集合記憶部7に記憶される文書集合は、評判情報が含まれる文書のみを記憶することも可能である。
評判位置記憶部8は、評判情報の位置情報を記憶したものである。評判位置記憶部8の記憶形式は少なくとも評判情報が出現する文書を識別する情報を記憶する。評判情報とは、ある事物に対する評判に関する情報のことをいう。具体的には、評判情報は、文書に記載された評価対象に対する評価表現、数値評価表現、または記号評価表現を基にして得ることができる。ここで評価表現とは、事物に対する価値を定めることのできる表現である。したがって、「遊ぶ」「動く」「研究する」といった事物に対する価値を示さない表現は評価表現でない。評価表現は、「良い」「好き」「最高だ」「面白い」といった用言の他に、「人気」「絶品」「駄作」といった名詞も存在する。また、数値評価表現とは、数値表現の内事物に対する価値を定めることのできる表現である。数値表現は数値及びその付属単位とを少なくとも含むものである。したがって、数値評価表現とは、数値表現の内事物に対する価値を定めることのできる付属単位及び数値の範囲をもつ表現である。また、記号評価表現とは、記号表現の内事物に対する価値を定めることのできる表現である。具体例として、「★」「★★★」「◎」「×」「△」が該当する。
分類結果記憶部6は、評判情報分類手段5の分類結果を記憶するものである。分類結果記憶部6は、少なくとも評判情報の位置情報と評判情報の分類結果を記憶する。
評判情報分類手段5は、評判情報が含まれる文書記憶部7に記憶された文書を用いて評判位置記憶部8に記憶された評判情報を特定の基準により分類するものである。
図2を参照すると、評判情報分類手段5は、発信者対応関係記憶部511と、発信者グループ別分類手段512と、文書タイプ対応関係記憶部513と、文書タイプ的発信者グループ別分類手段514と、発信元グループ決定手段515とを有する。
発信者対応関係記憶部511は、評判情報の発信者を示す情報と発信者グループとの対応関係を記憶するものである。評判情報の発信者を示す情報とは、評判情報をいかなる者が発信したかを識別する情報のことをいう。例えば、個人名、企業名等、また、インターネット上の文書であればURLがこれに該当する。発信者グループとは、同一の概念を有する発信者のまとまりでありのことをいう。例えば、「一般消費者」「評価専門家」「販売業者」等がこれに該当する。発信者対応関係記憶部511の記憶形式は、評判情報の発信者を示す情報と発信者グループとを組みにして記憶する。
文書タイプ対応関係記憶部513は、文書タイプと発信者グループとの対応関係を記憶するものである。文書タイプ対応関係記憶部513の記憶形式は、文書タイプと発信者グループとを組みにして記憶する。ここで文書タイプとは、情報の記述構造の類似性の観点から分類された文書の型をいう。具体例として「掲示板」「日記」「商品カタログ」「求人情報」等がこれに該当する。
発信者グループ別分類手段512は、文書記憶部7と評判位置記憶部8を参照して、文書記憶部7に記憶された文書から評判情報を含む文書を抽出して、その各文書における発信者を示す情報が出現する位置を特定し、更に、発信者対応関係記憶部511に記憶された対応関係を参照して、評判位置記憶部8に記憶された評判情報を発信者グループ別に分類するものである。発信者グループ別分類手段512における文書から発信者を示す情報の抽出方法は、文書に発信者を示す情報が添付されている場合はその情報を抽出し、添付されていない場合は評判情報の位置から一定の距離に発信者対応関係記憶部511に記憶された発信者を示す情報と同一の文字列が存在する場合は、その文字列を抽出する。こうして抽出された発信者を示す情報を発信者対応関係記憶部511に記憶された対応関係を参照して、発信者グループに分類する。
文書タイプ的発信者グループ別分類手段514は、評判位置記憶部8を参照し、文書記憶部7に記憶された文書集合から、評判情報を含む文書を抽出し、抽出した文書の文書タイプを判定し、文書タイプ対応関係記憶部513に記憶された文書タイプと発信者グループとの対応関係を参照することにより、評判位置記憶部8に記憶された評判情報を発信者グループ別に分類するものである。文書タイプ的発信者グループ別分類手段514における文書タイプの判定方法は、HTML等のタグ付き文書を対象とすることを前提として、文書のURLに含まれる文字列や、特定のタグの出現の有無や、特定のタグに含まれる文字列の有無等の条件を利用して判定するものとする。具体的には、「2000年3月、情報処理学会研究報告、Vol.99、No.22、99−FI−53、pp9−16」に記載されている方法を用いる。
発信元グループ決定手段515は、発信者グループ別分類手段512と文書タイプ的発信者グループ別分類手段514の分類結果の優先順位を定め、評判情報について一つの発信者グループを決定し、その結果を分類結果記憶部6に出力するものである。優先順位は、発信者を示す情報又は文書タイプの種類により変更させることも可能である。
次に本発明の第1の実施の形態の動作について図2から図6を参照して説明する。
まず、発信者グループ別分類手段512は、評判位置記憶部8を参照して、文書記憶部7に記憶された文書集合から、評判情報を含む文書を抽出して、抽出した各文書の発信者を示す情報を抽出し、発信者対応関係記憶部511に記憶された対応関係を参照して、評判位置記憶部8に記憶された評判情報を発信者グループ別に分類する。今、文書記憶部7に、文書集合として図3に示す文書番号1のHTML文書と図4に示す文書番号2の文書が記憶されているとする。また、評判位置記憶部8に、評判情報の位置情報として(文書番号1、文書番号2)が記憶されているとする。発信者対応関係記憶部511に、図5に示す評判情報の発信者を示す情報と発信者グループとの対応関係が記憶されているものとする。具体的には、情報の発信者を示す情報として、HTML文書のURLを採用し、発信者グループとして、「一般消費者」と「評価専門家」とが記憶されているとする。この場合、発信者グループ別分類手段512は、評判位置記憶部8を参照して、文書記憶部7から、図16に示す文書番号1の文書及び図17に示す文書番号2の文書を抽出し、各文書に添付されたURL「http://aaa.co.jp/」と「http://ccc.ne.jp/bbs/」を抽出する。そして、発信者グループ別分類手段512は、発信者対応関係記憶部511の対応関係を参照して、文書番号1の文書と文書番号2の文書の評判情報をそれぞれ発信者グループ「評価専門家」に分類する。
また、文書タイプ的発信者グループ別分類手段514は、評判位置記憶部8を参照して、文書記憶部7に記憶された文書集合のうち、評判情報を含む文書を抽出し、抽出した文書の文書タイプを判定し、文書タイプ対応関係記憶部513に記憶された文書タイプと発信者グループの対応関係を参照することにより、評判位置記憶部8に記憶された評判情報を発信者グループ別に分類する。今、文書タイプ対応関係記憶部513に、図6に示す文書タイプと発信者グループとの対応関係が記憶されているとする。具体的には、文書タイプとして、「日記」と「掲示板」が記憶され、発信者グループとして「一般消費者」と「評価専門家」とが記憶されている場合である。この場合、文書タイプ的発信者グループ別分類手段514は、評判位置記憶部8を参照して、文書記憶部7から図3に示す文書番号1の文書と図4に示す文書番号2の文書とを抽出し、各文書の文書タイプを判定し、その結果、文書番号2の文書の文書タイプを「掲示板」タイプと判定する。尚、この場合、図3に示す文書番号1の文書については、文書タイプの判別を行うことができない。そして、文書タイプ的発信者グループ別分類手段514は、文書タイプ対応関係記憶部513に記憶された対応関係を参照することにより、文書番号2の文書の評判情報を「一般消費者」と分類する。
次に、発信者グループ決定手段515は、発信者グループ別分類手段512と文書タイプ的発信者グループ別分類手段514の分類結果の優先順位を定め、評判情報について一つの発信者グループを決定し、その結果を分類結果記憶部6に出力する。今、優先順位を文書タイプ的発信者グループ別分類手段514の分類結果の方を優先的に扱うと定めていたとする場合について説明する。この場合、発信者グループ決定手段515は、文書番号1の文書の評判情報の分類については、発信者グループ別分類手段512の分類結果である発信者グループ「評価専門家」と決定し、分類結果が競合していた文書番号2の評判情報の分類については、優先順位から文書タイプ的発信者グループ別分類手段514の分類結果を採用し、「一般消費者」と分類する。そして、発信者グループ決定手段515は、分類結果((文書番号1,評価専門家),(文書番号2,一般消費者))を分類結果記憶部6に記憶する。
なお、上記の構成では、発信者グループ別分類手段512と文書タイプ別分類手段514の2つの分類手段を用いて説明したが、発信者グループ別分類手段512または文書タイプ的発信者グループ別分類手段514のいずれか一方の手段のみでも評判情報の発信者グループ別の分類は可能である。
以上のように、本発明の第1の実施の形態に置いては、発信者を示す情報又は文書タイプの情報を用いることにより評判情報を発信者グループ別に分類することが可能となる。
[実施の形態2]
図7を参照すると、本発明の第2の実施の形態は、文書記憶部7と、評判位置記憶部8と、評判情報分類手段5と、分類結果記憶部6とを備えている。
分類結果記憶部6と文書記憶部7と評判位置記憶部8とは第1の実施の形態と同様であるため、ここでは説明を省略する。
図7を参照すると、評判情報分類手段5は、主題表現記憶部521と、主題別分類手段522とを有する。
主題表現記憶部521は、評判情報の主題表現を記憶するものである。ここで、主題表現とは、評判情報の中心的な問題を示す表現のことをいう。例えば、コンピュータの分野としては、「マニュアル」「価格」「サポート」「納期」等がこれに該当する。
主題別分類手段522は、文書記憶部7と評判位置記憶部8とを参照して、文書記憶部7に記憶された文書から評判情報を含む文書を抽出して、その各文書における評判情報が出現する位置の周囲の範囲に主題表現記憶部521に記憶された主題表現が存在する場合、主題表現記憶部521を参照して、評判情報を主題表現に分類する。評判情報が出現する位置の周囲の範囲はByte数、文字数、文章数、行数といった数値的な距離で設定する。また、評判情報が出現する位置の周囲の範囲を数値的な距離で設定するのに加え、評判情報と構文解析的依存関係がある単語や特定の表層格をとる単語を優先的に扱い、評判情報を主題表現に分類しても良い。例えば、評判情報が出現する位置の周囲の範囲内に、主題表現である「マニュアル」と「価格」の両方が出現する場合、評判情報と主題表現「マニュアル」には構文解析的依存関係があり、評判情報と主題表現「価格」には構文解析的依存関係がない場合、主題表現「マニュアル」を優先的に扱い、評判情報を主題表現「マニュアル」に分類するとしても良い。別の例として、同じ場合に主題表現「マニュアル」は表層格として助詞「は」又は「が」又は「を」をとるが、主題表現「価格」はこれらの助詞をとらない場合、主題表現「マニュアル」を優先的に扱い、評判情報を主題表現「マニュアル」に分類するとしても良い。また、文書記憶部7に記憶された文書に主題表現記憶部521に記憶された主題表現が存在する場合以外でも、あらかじめ主題表現をシソーラス等で同義語展開して、展開された語が文書記憶部7に記憶された文書に存在する場合でもよい。
次に、本発明の第2の実施の形態の動作について図7を参照して説明する。
まず、主題別分類手段522は、評判位置記憶部8を参照して、文書記憶部7に記憶された文書集合から、評判情報を含む文書を抽出して、主題表現記憶部521を参照して、各文書における評判情報が出現する位置の周囲の範囲に主題表現記憶部521に記憶された主題表現が存在する場合、評判情報を主題表現に分類する。今、文書記憶部7に、文書番号1の文書「商品Aのサポートが悪い。商品Bのマニュアルは良い。」が記憶され、評判位置記憶部8に、評判情報の位置情報((文書番号1,商品A,0Byte,悪い,18Byte),(文書番号1,商品B,24Byte,良い,44Byte))が記憶され、主題表現記憶部521に、主題表現(価格,サポート,マニュアル)が記憶されており、主題別分類手段522に設定される評判情報が出現する位置の周囲の範囲として、「評判情報と同一文章内」と設定されている場合について説明する。この場合、主題別分類手段522は、評判位置記憶部8と文書記憶部7を参照して、評判情報「悪い」と同一文章内に、主題表現記憶部521に記憶された主題表現「サポート」が存在し、評判情報「良い」と同一文章内に、主題表現記憶部521に記憶された主題表現「マニュアル」が存在することから、評判情報「悪い」と「良い」をそれぞれ主題表現「サポート」「マニュアル」に分類する。そして、主題別分類手段522は、分類結果記憶部6に対し、((文書番号1,商品A,0Byte,悪い,18Byte,サポート),(文書番号1,商品B,24Byte,良い,44Byte,マニュアル))を出力する。
以上のように、本発明の第2の実施の形態に置いては、評判情報が出現する位置の周囲に存在する主題表現により評判情報を主題別に分類することが可能となる。
[実施の形態3]
図8を参照すると、本発明の第3の実施の形態は、文書記憶部7と、評判位置記憶部8と、評判情報分類手段5と、分類結果記憶部6とを備えている。
分類結果記憶部6と文書記憶部7と評判位置記憶部8とは第1の実施の形態と同様であるため、ここでは説明を省略する。
図8を参照すると、評判情報分類手段5は、評価表現属性記憶部531と、否定表現記憶部532と、評価表現属性別分類手段533を有する。
評価表現属性記憶部531は、評価表現の肯定的又は否定的な属性を記憶するものである。ここで、評価表現属性記憶部531の記憶形式は、評価表現とその属性を示す情報とを組にして記憶する。
否定表現記憶部532は、否定表現を記憶するものである。否定表現記憶部532に記憶される否定表現には、「ない」「なく」「なかった」等のように後方に存在するものと、「非」「未」「不」等のように評価表現の接頭語として存在するものが含まれる。
評価表現属性別分類手段533は、評判位置記憶部8に記憶された評判情報を含む文書を抽出して、評価表現属性記憶部531に記憶された評価表現の肯定的又は否定的な属性と、文書記憶部7に記憶された否定表現を参照し、抽出した各文書における評判情報と、その近接に存在する否定表現との組み合わせにより、評価位置記憶部8に記憶された評判情報を肯定又は否定な属性に分類するものである。評価表現の近接の範囲は、Byte数、文字数、文章数、行数といった数値的な距離で設定する。また、評価表現の近接の範囲を数値的な距離で設定するのに加え、評価表現と構文解析的依存関係がある単語や特定の表層格や品詞をとる単語に絞って、評判情報を肯定又は否定な属性に分類してもよい。評価表現属性別分類手段533は、評価表現属性記憶部531に記憶された評価表現の属性に対して、否定表現記憶部532に記憶された否定表現が何回出現するかにより、評判情報の分類する属性を決定する。具体的には、評価表現の属性に対して否定表現が偶数回出現する場合には評価表現の属性をそのまま分類する属性とし、奇数回出現する場合には評価表現の属性とは逆の属性を分類する属性とする場合が考えられる。
次に本発明の第3の実施の形態の動作について図8を参照して説明する。
まず、評価表現属性別分類手段533は、評判位置記憶部8と文書記憶部7とを参照して、評判情報を含む文書を抽出し、評価表現属性記憶部531に記憶された評価表現の肯定的又は否定的な属性を参照し、抽出した各文書における評価表現と、その近接の範囲に存在する否定表現記憶部532に記憶された否定表現との組み合わせにより、評判情報を肯定又は否定な属性に分類する。今、文書記憶部7に文書番号1の文書「商品Aは良くない。商品Bは悪いとは言えなくもない。」が記憶され、評判位置記憶部8に、評判情報の位置情報((文書番号1,商品A,0Byte,良く,8Byte),(文書番号1,商品B,18Byte,悪い,26Byte))が記憶され、評価表現属性記憶部531に、評価表現の属性((良い,肯定),(良く,肯定),(悪い,否定),(悪く,否定))が記憶され、否定表現記憶部532に、否定表現(ない、なく、なかった)が記憶され、更に、評価表現属性別分類手段533の近接の範囲として、「後方20Byte以内」が設定されている場合について説明する。
評価表現属性別分類手段533は、評判位置記憶部8と文書記憶部7とを参照して、評判情報「良く」を含む文書番号1の文書を抽出する。そして、評価表現属性別分類手段533は、評価表現記憶部531と否定表現記憶部532とを参照し、評価表現「良く」の属性が肯定的な属性であり、更に、評価表現「良く」の後方20Byte以内に否定表現「ない」が1回出現することから、評判情報を評価表現「良く」の属性と逆の属性である「否定」の属性に分類する。同じように、評価表現属性別分類手段533は、評価表現属性記憶部531と否定表現記憶部532とを参照し、評価表現「悪い」の属性が否定的な属性であり、更に評価表現「悪い」の後方20Byte以内に否定表現「なく」「ない」がそれぞれ1回ずつ出現し、合わせて否定表現が偶数回出現することから、評判情報を評価表現「悪い」の属性と同じ属性である「否定」の属性に分類する。そして、評価表現属性別分類手段533は、この分類結果((文書番号1,商品A,0Byte,良く,8Byte,否定),(文書番号1,商品B,18Byte,悪い,26Byte,否定))を分類結果記憶部6に対し出力する。
なお、上記の構成では評価表現属性記憶部531と否定表現記憶部532の両方が存在する構成で説明したが、評価表現属性記憶部531に否定表現も含めた表現で評価表現の属性が記憶されている場合も考えられる。この場合、評判情報分類手段5に否定表現記憶部532は必要なく、評価表現属性記憶部533は評価表現属性記憶部531に記憶された属性のみで評判情報の分類を行う。
以上のように、本発明の第3の実施の形態に置いては、評価表現の属性と否定表現とを組み合わせることにより、評判情報を肯定的又は否定的の評価表現属性別に分類することが可能となる。
[実施の形態4]
図9を参照すると、本発明の第4の実施の形態は、文書集合記憶部7と、評判位置記憶部8と、評判情報分類手段5と、分類結果記憶部6とを備えている。
分類結果記憶部6と文書記憶部7と評判位置記憶部8とは第1の実施の形態と同様であるため、ここでは説明を省略する。
図9を参照すると、評判情報分類手段5は、評判位置記憶部8に記憶された評判情報を発信者グループ別に分類する発信者グループ別分類手段51と、評判位置記憶部8に記憶された評判情報を主題別に分類する主題別分類手段52と、評判位置記憶部8に記憶された評判情報を評価表現属性別に分類する評価表現別分類手段53とを有する。
発信者グループ別分類手段51は、図2に示す第1の実施の形態における評判情報分類手段5と同一の構成を有する。
主題別分類手段52は、図7に示す第2の実施の形態における評判情報分類手段5と同一の構成を有する。
評価表現属性別分類手段53は、図8に示す第3の実施の形態における評判情報分類手段5と同一の構成を有する。
以上のように、本発明の第4の実施の形態に置いては、発信者グループ別分類手段51と、主題別分類手段52と、評価表現別分類手段53という3つの異なる分類基準を有する分類手法を用いることにより、評判情報の多角的な分類が可能となる。
[実施の形態5]
図10を参照すると、本発明の第5の実施の形態は、文書入力手段1と、検索語入力手段2と、評判情報判別手段3と、評判位置記憶部8と、評判情報分類手段5と、分類結果記憶部6と、検索結果表示手段9とを備えている。
文書入力手段1は、評判情報検索の対象の文書の集合である文書集合を入力するものである。
検索語入力手段2は、評判情報検索の検索語となる文字列を入力するものである。
評判情報判別手段3は、文書入力手段1から文書集合を受け取り、検索語入力手段2から検索語を受け取り、文書集合に含まれる検索語に関する評判情報の位置を判別し、その評判情報の位置情報を判別結果記憶部に出力するものである。
文書入力手段1は、評判情報検索の対象となる文書の集合である文書集合を入力するものである。
検索語入力手段2は、評判情報検索の検索語となる文字列を入力するものである。
評判情報判別手段3は、文書入力手段1から文書集合を受け取り、検索語入力手段2から検索語を受け取り、文書集合に含まれる検索語に関する評判情報の位置を判別し、その評判情報の位置情報を評判位置記憶部8に出力するものである。
評判位置記憶部8は、評判情報判別手段3により判別された検索語に関する評判情報の位置情報を記憶するものである。
評判情報分類手段5は、文書入力手段1から文書集合を受け取り、評判位置記憶部8を参照して、評判情報を含む文書の評判情報を特定の基準により分類するものである。
分類結果記憶部6と文書記憶部7とは第1の実施の形態と同様であるため、ここでは説明を省略する。
検索結果表示手段9は、文書入力手段1から文書集合を受け取り、その文章を用いて、分類結果記憶部6に記憶された評判情報の内容及び分類結果を表示するものである。出力の方法としては、ディスプレイでの表示、プリンタでの印刷、音声による読み上げ、ファイル装置へ書き込むなどがある。
次に本発明の第5の実施の形態の動作について図10から図12を参照して説明する。
まず、文書入力手段1から文書集合を入力する。各文書には文書を識別するための文書番号が付与されている。また、検索語入力手段2から、評判情報の検索語となる文字列を入力する。
評判情報判別手段3が、文書入力手段1により入力された文書内の検索語入力手段1で入力された検索語に関する評判情報が出現する位置を判定し、評判位置記憶部8に出力する。
次に、評判情報分類手段5が、評判情報が含まれる文書入力手段1から入力された文書を用いて、評判位置記憶部8に記憶された評判情報を特定の基準により分類し、その結果を分類結果記憶部6に記憶させる。尚、ここでの評判情報を特定の基準により分類する方法については、第1の実施の形態から第4の実施の形態における評判情報分類手段5が行う評判情報の分類と同じ方法を採用する。
最後に、検索結果表示手段9が、分類結果記憶部6に記憶された評判情報の内容及び分類結果を表示する。表示方法としては、すべての結果を一括して表示する一括表示と、まず評判情報の総数や平均を一覧として表示してから各評判情報の具体的な内容を表示する分割表示とがある。
(1)一括表示
まず、一括表示では、評判情報毎に評判情報の内容及び分類結果を表示する。評判情報の内容では、その評判情報を含む文書の一部を表示する。ここで文書の一部の表示は、利用者が表示結果から評判の内容を把握できる程度の情報を表示し、例えば文書のタイトルや文書の存在位置(URL等)、文書の先頭部分、文書内の評判情報の周囲の文字列(検索語や評価表現の個所はアンダーライン等して目立たせることも可能)を表示する。特に、数値評価表現や、記号評価表現を含む評判情報については、文書のタイトルと数値評価表現または記号評価表現とを組にして表形式で表示することも可能である。分類結果の表示については、各分類項目のアイコンを用意し、文書が分類項目の評判情報を含む場合はそのアイコンを表示する。
図11に一括表示の例を示す。図11には、検索語入力手段2で入力された検索語「商品A」の検索結果が表示されている。図11の(a)には数値評価表現及び記号評価表現を含む評判情報を表形式で表示している。また、図11の(b)には評判情報を含む文書の一部として文書のタイトル、URL、評判情報の周囲の文字列を表示している。さらに、図11の(c)には分類結果として評価表現属性が肯定的か否定的かを示すアイコンと、発信者グループが評価専門家か一般消費者かを示すアイコンが表示されている。
(2)分割表示
次に、分割表示では全体表示、詳細表示の順に表示する。全体表示では、評判情報全体の内容を把握できることを目的として各分類基準の分類項目の総数を表示する。詳細表示では、評判情報の具体的な内容を把握することを目的とし、利用者の指定により全体表示と連携して特定の分類項目に所属する評判情報を評判情報の内容及び分類結果を表示する。この表示形式については一括表示と同様である。
図12に分割表示の例を示す。図12に示す分割表示の「全体表示」では、評価表現属性別の分類、発信者別分類、主題別分類についてそれぞれ各分類項目の評判の件数を表示している。利用者は「消費者」の項目を指定すると、図12に示す分割表示の「詳細表示」により「消費者」についての評判情報の具体的な内容を把握できる。
なお、上記の構成において文書入力手段1は、インターネット上に存在する文書を入力とすることも可能である。
また、検索結果表示手段9は分類結果記憶部6を参照しているが、評判位置記憶部8を参照することによっても動作する。この場合、表示方法は一括表示のみで分類結果の表示は行わない。
以上のように、本発明の第5の実施の形態に置いては、評判情報の存在する位置を判別する評判情報判別手段3と評判情報を特定の基準により分類する評判情報分類手段6との両方を備えることにより、評判情報の判別および分類を一連の検索処理で行うことが可能となる。また、評判情報の判別結果及び分類結果を一括表示または分割表示することにより、評判情報の内容を利用者が容易に把握することが可能となる。
ここで、評判情報判別手段の実施例について、以下に図面を用いて説明する。
まず、図13に示すように、評判情報判別手段3が、評価表現記憶部301と検索語位置特定手段302と評価表現位置特定手段303と表現間距離判定手段304とを有する場合(以下「実施例1」という。)について説明する。
評価表現記憶部301は、評価表現を記憶するものである。評価表現については、以前に述べた通りである。また、評価表現記憶部301における評価表現の記憶形式は、各評価表現の活用による表記の違いを吸収する単位で記憶する方式が記憶容量節約の面で効果的であるが、この方式に限定されるものではない。
検索語位置特定手段302は、文書入力手段1から文書集合を受け取り、検索語入力手段2から検索語を受け取り、文書集合における検索語の位置を特定し、その検索語の位置情報を表現間距離判定手段304に出力するものである。
評価表現位置特定手段303は、文書入力手段1から文書集合を受け取り、評価表現記憶部301から評価表現を取り出し、文書集合における評価表現記憶部301に記憶されたいずれかの評価表現が出現する位置を特定し、その評価表現の位置情報を表現間距離判定手段304に出力するものである。
表現間距離判定手段304は、検索語位置特定手段302で出力された検索語の位置情報と評価表現位置特定手段303で出力された評価表現の位置情報の距離を計算し、その両者の距離が一定の範囲内の場合、その評価表現をその検索語の評判情報と判別し、評価表現位置特定手段303で出力された評価表現の位置情報を評判情報の位置情報として評判位置記憶部8に出力するものである。
次に、この実施例1における評判情報判別手段3の動作について、図面を用いて説明する。
まず、文書入力手段1から文書集合を入力する(図14のステップS1)。各文書には文書を識別するための文書番号が付与されている。また、検索語入力手段2から、評判情報の検索語となる文字列を入力する(図14のステップS2)。尚、文書入力手段1による文書集合の入力と、検索語入力手段2による評判情報の検索語となる文字列の入力については、どちらを先に行ってもよく、また、同時でも構わないものとする。
いま、文書集合に含まれる文書として文書番号1のテキスト文書「商品Aは非常に面白い。また、商品Bは価格が安いのでお勧め。」が文書入力手段1から入力され、検索語として「商品A」が検索語入力装置2から入力された場合について以下説明する。
次に、検索語位置特定手段302は、文書入力手段1から入力された文書集合における検索語入力手段2から入力された検索語が出現する位置を特定し、その検索語の位置情報を表現間距離判定手段304に出力する(図14のステップS3)。位置情報の算出は、文書の先頭や最後尾等といった基準位置からの距離を算出する方法を用いて算出することができる。また、基準位置からの距離を算出する方法は、基準位置からの距離を算出することができれば、いかなる方法でも良い。具体的には、文書の先頭からの文字数により距離を算出する方法、文書の先頭からのByte数により距離を算出する方法、文書の先頭からの行数により距離を算出する方法が含まれる。また、出力する検索語の位置情報は、少なくとも検索語が出現する文書を特定する情報と、その文書内で検索語が出現する位置を特定する情報を含む。
文書入力手段1から上記した文書番号1のテキスト文書が入力され、検索語入力手段2から検索語「商品A」が入力され、検索語の位置の特定方法として文書の先頭からのByte数を採用する場合、検索語位置特定手段302は、文書番号1のテキスト文書から、「商品A」の位置を0Byteと特定して、「商品A」の位置情報(文書番号1,0Byte,商品A)を表現間距離判定手段304に出力する。
次に、評価表現位置特定手段303は、文書入力手段1から文書集合を受け取り、受け取った文書集合における評価表現記憶部301に記憶されたいずれかの評価表現集合のいずれかの評価表現が出現する位置を特定し、その評価表現の位置情報を表現間距離判定手段304に出力する(図14のステップS4)。具体的には、評価表現位置特定手段303は、評価表現記憶部301に記憶された評価表現ごとに、文書集合に含まれているかを調べ、文書集合に評価表現が含まれている場合、その評価表現の位置を特定する。評価表現位置特定手段303における位置の特定方法は検索語位置特定手段302と同一の方法で行う。また、出力する位置情報は、少なくとも検索語が出現する文書を特定する情報と、その文書内で評価表現が出現する位置を特定する情報とを含んでいる。
文書入力手段1から上記した文書番号1のテキスト文書が入力され、検索語入力手段2から検索語「商品A」が入力され、評価表現記憶手段301に、評価表現の集合として(面白い、お勧め、好き、いい)が記憶され、評価表現の位置の特定方法として文書の先頭からのByte数を採用する場合、評価表現位置特定手段303は、評価表現記憶部301に記憶されている評価表現のうち、「面白い」と「お勧め」が文書番号1のテキスト文書に含まれていることを判別し、そして、それぞれの評価表現の位置を特定し、評価表現の位置情報((文書番号1,面白い,14Byte),(文書番号1,お勧め,48Byte))を表現間距離判定手段304に対し出力する。
次に、表現間距離判定手段304は、検索語位置特定手段302で出力された検索語の位置情報と評価表現位置特定手段303で出力された評価表現の位置情報の距離が一定の範囲内ならば、その評価表現をその検索語の評判情報と判別し、その評判情報の位置情報を評判位置記憶部8に出力する(図14のステップS5)。ここで、距離が一定の範囲内とは、例えば検索語と評価表現との間の数値的差分の大きさが閾値以下である場合や、検索語と評価表現との間に構文解析的依存関係がある場合が該当する。また、評判情報の位置情報は、少なくとも評判情報が出現する文書番号を含むものとする。
評判位置記憶部8には、評判情報の位置情報が格納される(図14のステップS6)。
文書入力手段1から上記した文書番号1のテキスト文書が入力され、検索語入力手段2から検索語「商品A」が入力され、数値的差分の大きさの閾値を30Byteに設定した場合、表現間距離判定手段304は、検索語位置特定手段302から出力された検索語の位置情報(文書番号1,商品A,0Byte)と評価表現位置特定手段303から出力された評価表現の位置情報((文書番号1,面白い,14Byte),(文書番号1,お勧め,48Byte))の距離を測定し、評価表現が評判情報であるか否かを判断する。そして、この場合、表現間距離判定手段304は、「商品A」と「面白い」の距離が14−0=14Byteであり、閾値30Byte以下であるため、評価表現「面白い」を「商品A」の評判情報と判定し、「商品A」と「お勧め」の距離が48−0=48Byteであり、閾値30Byte以下でないため、評価表現「お勧め」を「商品A」の評判情報と判定しない。その結果、表現間距離判定手段304は、評判位置記憶部8に対し、検索語「商品A」に対する評判情報「面白い」の位置情報として(文書番号1,商品A,0Byte,面白い,14Byte)を出力する。
なお、前記検索語位置特定手段302と前記評価表現位置特定手段303の処理順序はどちらを先に処理することも可能である。
また上記の動作では、表現間距離判定手段304は検索位置特定手段302と評価表現位置特定手段303の両方から出力された後に動作を開始する方法を説明したが、それ以外にも検索語位置特定手段302で特定された検索語の位置と評価表現位置特定手段303で特定された評価表現の位置のいずれかを基準として動作を行うことも可能である。今、検索語位置特定手段302により特定された検索語の位置情報を基準とする場合について説明すると、まず基準とした手段である検索語位置特定手段302が検索語の位置情報を表現間距離判定手段304に出力し、次に表現間距離判定手段304は基準としなかった手段である評価表現位置特定手段303に対し、基準とした手段である検索語位置特定手段302の出力した検索語の位置情報と距離の範囲を出力する。そして、基準としなかった手段である評価表現位置特定手段303は、受け取った検索語の位置情報と距離の範囲から、検索語の位置から設定された距離の範囲だけ前方又は後方の範囲内に評価表現があるか否かを調べ、評価表現が存在する場合、その評価表現の位置を特定し、その評価表現の位置情報を表現間距離判定手段304に出力する。そして、最後に表現間距離判定手段304は、基準としなかった手段である評価表現位置特定手段303から出力された評価表現の位置情報を受け取り、検索語の位置情報と評判表現の位置情報から、検索語と評判表現の距離が一定の範囲内である場合、評判表現を検索語の評判情報として判別し、その結果を評判位置記憶部8に記憶するという方法でもよい。
以上のように、この実施例1における評判情報判別手段3を用いると、検索語と評価表現の表現間距離を判定することにより検索語に関する評判情報が出現する位置を自動的に特定して、その結果を評判位置記憶部8に記憶することが可能となる。
次に、図15に示すように、評判情報判別手段3が、評価表現記憶部301と検索語位置特定手段302と評価表現位置特定手段303と表現間距離判定手段304と、検索語分野特定手段309を有する場合(以下、「実施例2」という。)について説明する。この実施例2における評判情報判別手段3は、実施例1における評判情報判別手段3に比べ、検索語分野特定手段309を有する点で異なる。
実施例2における評価表現記憶部301は、評価表現に加え、その評価表現が使用される分野を示す情報又はその評価表現が使用されない分野を示す情報を、評価表現との組にして記憶している。
検索語分野特定手段309は、検索語入力手段2で入力された検索語の分野を特定し、その結果を評価表現位置特定手段303に出力するものである。
ここで、検索語の分野を特定する方法は、検索語入力手段2の入力が検索語とその検索語の分野とを組にして入力する場合については、その入力された分野を検索語の分野として特定し、それ以外の場合については、図示しないが、検索語と検索語の分野の対応関係を記憶したデータベースを備え、そのデータベースを参照することにより検索語の分野を特定する。
また、評価表現位置特定手段303は、評価表現記憶部301に記憶された評価表現の内、検索語分野特定手段309で特定された分野で使用される評価表現のみを選択し、そのいずれかの評価表現が文書入力手段1で入力された文書に存在する位置を特定する。
次に、この実施例2における評判情報判別手段3の動作について、図面を用いて説明する。
図16のステップS1、ステップS3、及びステップS7からステップS8の動作は、実施例1における動作と同一であるため説明を省略する。
検索語入力手段2から、検索語と検索語の分野を入力する(図16のステップS2)。尚、文書入力手段1による文書集合の入力と、検索語入力手段2による検索語と検索語の文野との入力については、どちらを先に行ってもよく、また、同時でも構わないものとする。
次に、検索語分野特定手段309が、検索語の分野を特定し、その検索語の分野情報を評価表現位置特定手段303に出力する(図16のステップS4)。なお、検索語の分野については、入力されるかどうかは任意である。検索語が入力されない場合は、検索語と検索語の分野の対応関係を記憶したデータベースを備え、検索語分野特定手段309がそのデータベースを参照することにより検索語の分野を特定する。
評価表現位置特定手段303は、検索語分野特定手段309により出力された検索語の分野を用いて、評価表現記憶部301からその検索語の分野で使用される評価表現を選択する(図16のステップS5)。そして、評価表現位置特定手段303は、各文書における選択した評価表現が出現する位置を特定し、その評価表現の位置情報を表現間距離判定手段304に出力する(図16のステップS6)。
以上のように、この実施例2における評判情報判別手段3を用いると、例えば、検索語の分野が「書籍」の場合、評価表現位置特定手段303が評価表現の位置を特定する際に、評価表現記憶部301に記憶されている評価表現の中から、評価表現「おいしい」のような「書籍」に関する評判では使用されない評価表現を除外して、評価表現の位置を特定して、その結果を評判位置記憶部8に記憶することが可能となる。このため、評判情報の判別精度の向上および判別速度の高速化が可能となり、精度を高くして、高速に評判位置記憶部8に評判情報の位置情報を記憶することができる。
次に、図17に示すように、評判情報判別手段3が、数値評価表現記憶部305と検索語位置特定手段302と数値評価表現位置特定手段306と表現間距離判定手段304とを有する場合(以下、「実施例3」という。)について説明する。この実施例3における評判情報判別手段3は、実施例1における評判情報判別手段3に比べ、評価表現記憶部301の代わりに数値評価表現記憶部305を、評価表現位置特定手段303の代わりに数値表現位置特定手段306を備えている点で異なる。
数値評価表現記憶部305は、数値表現の内事物に対する価値を定めることのできる表現を記憶する。ここで、数値評価表現は、以前に述べた通りである。
数値評価表現記憶部305の記憶形式は、各数値評価表現につき付属単位と許される数値の範囲を組にして記憶する。特に、付属単位の記録形式はそれが接頭語であるか接尾語であるかがわかるよう記憶することを要する。
数値評価表現位置特定手段306は、文書入力手段1から入力された文書集合の各文書において、数値評価表現記憶部301に記憶されたいずれかの数値評価表現集合のいずれかの数値評価表現が出現する位置を特定しその数値評価表現の位置情報を表現間距離判定手段304に出力するものである。
次に、この実施例3における評判情報判別手段3の動作について、図面を用いて説明する。図18のステップS1からステップS2の動作は、実施例1の動作と同一のため説明を省略する。
今、文書入力手段1から図19に示す文書番号1の文書と図20に示す文書番号2の文書を入力し、検索語入力手段2から検索語「商品B」を入力した場合を例として説明する。
検索語位置特定手段302は、入力された文書集合の各文書における検索語が出現する位置を特定し、その検索語の位置情報を表現間距離判定手段304に出力する(図18のステップS3)。検索語の位置の算出方法については実施例1と同様である。今、検索語位置特定手段302による位置の算出方法として、文書の先頭から行数を採用する場合について説明する。この場合、検索語位置特定手段302は、図19に示す文書番号1の文書については、「商品B」の位置をx行目と特定し、図20に示す文書番号2の文書については「商品B」の位置の位置をy行目と特定し、表現間距離判定手段304に対し、検索語「商品B」の位置情報((文書番号1,商品B,x行目),(文書番号2,商品B,y行目))を出力する。
数値評価表現位置特定手段306は、文書入力手段1から入力された文書集合の各文書における数値評価表現記憶部301に記憶されたいずれかの数値評価表現が出現する位置を特定し、その数値評価表現の位置情報を表現間距離判定手段304に出力する(図18のステップS4)。数値評価表現位置特定手段306における数値評価表現の位置の特定方法は、次の2通りがある。
(1)文書内に数値評価表現記憶部301に記憶されたいずれかの付属単位が、設定された許される範囲を満たす数値の接頭語または接尾語として出現する場合、その数値と付属単位が出現する位置を数値評価表現の位置と特定する。
(2)文書内に数値で記述される列又は行を有する表が存在し、かつその見出し語が数値評価表現記憶部301に記憶されたいずれか付属単位と同一である場合、その列又は行に存在する数値のうち、設定された許される範囲を満たすものが出現する位置を数値評価表現の位置と特定する。
位置の算出方法については、検索語位置特定手段302と同一方法で行う。また、出力する数値評価表現の位置情報は、少なくとも数値評価表現が出現する文書を特定する情報と、その文書内で数値評価表現が出現する位置を特定する情報を含むものとする。
今、数値評価表現記憶手段305に、図21に示す数値評価表現の集合が記憶されており、数値評価表現の位置の算出方法として文書の先頭からの行数を選択した場合について説明する。この場合、数値評価表現位置特定手段306は、上記した数値評価表現の位置の特定方法(1)により文書番号1の文書において、数値評価表現「1位」がx−1行目と、「2位」がx行目と、「3位」がx+1行目と特定し、上記した数値評価表現の位置の特定方法(2)により文書番号2の文書において、数値評価表現「順位1」がy−1行目と、「順位2」がy行目と、「順位3」がy+1行目と特定し、数値評価表現の位置情報として((文書番号1,1位,x−1行目),(文書番号1,2位,x行目),(文書番号1,3位,x+1行目)(文書番号2,順位1,y−1行目),(文書番号2,順位2,y行目),(文書番号2,順位3,y+1行目))を出力する。
次に、表現間距離判定手段304は、検索語位置特定手段302で出力された検索語の位置情報と数値評価表現位置特定手段306で出力された数値評価表現の位置情報を受け取り、検索語の位置情報と数値評価表現の位置情報の距離が一定範囲内ならば、その数値評価表現をその検索語の評価表現と判別し、その評価表現の位置情報を評判位置記憶部8に対し出力する(図18のステップS5)。距離が一定範囲内か否かの判断の方法は、実施例1の表現間距離判定手段4における方法と同一であるため、ここでは説明を省略する。
今、検索語と数値評価表現との間の数値的差分の大きさの閾値を0行と設定した場合ついて説明する。この場合、表現間距離判定手段304は、検索語の位置情報((文書番号1,商品B,x行目),(文書番号2,商品B,y行目))と数値評価表現の位置情報((文書番号1,1位,x−1行目),(文書番号1,2位,x行目),(文書番号1,3位,x+1行目)(文書番号2,順位1,y−1行目),(文書番号2,順位2,y行目),(文書番号2,順位3,y+1行目))の距離を測定し、文書番号1の文書における「商品B」と「2位」および文書番号2の文書における「商品B」と「順位2」の距離が閾値以下であるため、「2位」および「順位2」を検索語「商品B」の評判情報と判断し、判別結果記憶手段4に対し、評判情報の位置情報((文書番号1,商品B,x行目,2位、x行目),(文書番号2,商品B,y行目,2位,y行目)を出力する。
なお、検索語位置特定手段302と数値評価表現位置特定手段306の処理順序はどちらを先に処理することも可能である。
また上記の動作では、表現間距離判定手段304は検索位置特定手段302と数値評価表現位置特定手段306の両方から出力された後に動作を開始する方法を説明したが、それ以外にも検索語位置特定手段302で特定された検索語の位置と数値評価表現位置特定手段306で特定された数値評価表現の位置のいずれかを基準として動作を行うことも可能である。今、検索語位置特定手段302により特定された検索語の位置情報を基準とする場合について説明すると、まず基準とした手段である検索語位置特定手段が検索語の位置情報を表現間距離判定手段304に対し出力し、次に表現間距離判定手段304は基準としなかった手段である数値評価表現位置特定手段306に対し、基準とした手段である検索語位置特定手段302の出力した検索語の位置情報と距離の範囲を出力する。そして、基準としなかった手段である数値評価表現位置特定手段306は受け取った検索語の位置情報の前方距離の範囲又は後方距離の範囲に存在する数値評価表現の位置を特定し、その数値評価表現の位置情報を表現間距離判定手段304に出力する。そして、最後に表現間距離判定手段304は、基準としなかった手段である数値評価表現位置特定手段306から出力された数値評価表現の位置情報を受け取り、検索語の位置情報と数値評価表現の位置情報から、検索語と数値評価表現の距離が一定の範囲内である場合、数値評価表現を検索語の評判情報として判別し、評判位置記憶部8に記憶するという方法でもよい。
以上のように、この実施例3における評判情報判別手段3を用いると、検索語と数値評価表現の表現間距離を判定することにより数値評価表現で記述される検索語に関する評判情報が出現する位置を自動的に特定して、その結果を評判位置記憶部8に記憶することが可能となる。
次に、図22に示すように、評判情報判別手段3が、記号評価表現記憶部307と検索語位置特定手段302と記号評価表現位置特定手段308と表現間距離判定手段304とを有する場合(以下、「実施例4」という。)について説明する。
この実施例4における評判情報判別手段3は、実施例1における評判情報判別手段3に比べ、評価表現記憶部301の代わりに記号評価表現記憶部307を、評価表現位置特定手段303の代わりに記号評価表現位置特定手段308を備えている点で異なる。
記号評価表現記憶部307は、記号表現の内事物に対する価値を定めることのできる表現を記憶する。ここで、記号評価表現は、以前に述べた通りである。
記号評価表現位置特定手段308は、文書入力手段1から入力された文書集合の各文書における記号評価表現記憶部307に記憶されたいずれかの記号評価表現集合のいずれかの記号評価表現が出現する位置を特定しその位置情報を表現間距離判定手段304に出力するものである。
次に、この実施例4における評判情報判別手段3の動作について、図面を用いて説明する。
図23のステップS1からステップS2までの動作は、実施例1の動作と同一のため説明を省略する。
今、文書入力手段1から図24に示す文書番号1の文書を入力し、検索語入力手段2から検索語「商品B」を入力した場合を例として説明する。
検索語位置特定手段302は、入力された文書集合の各文書における検索語が出現する位置を特定し、その検索語の位置情報を表現間距離判定手段304に出力する(図23のステップS3)。検索語の位置の算出方法については実施例1と同様である。今、検索語位置特定手段302による位置の算出方法として、文書の先頭から行数を採用する場合について説明する。この場合、検索語位置特定手段302は、図24に示す文書番号1の文書については、「商品B」の位置をy行目と特定し、表現間距離判定手段304に対し、検索語「商品B」の位置情報(文書番号1,商品B,y行目)を出力する。
記号評価表現位置特定手段308は、文書入力手段1から入力された文書集合の各文書における記号評価表現記憶部307に記憶されたいずれかの記号評価表現が出現する位置を特定し、その記号評価表現の位置情報を表現間距離判定手段304に出力する(図23のステップS4)。記号評価表現位置特定手段308における記号評価表現の位置の特定方法は、(1)文書内に記号評価表現記憶部307に記憶されたいずれかの記号評価表現が出現し、かつ(2)その文書内で同一グループの異なる記号評価表現が一定回数以上出現する場合に、その位置を記号評価表現の位置と特定する。(2)の条件を採用する理由は、(1)の条件のみを採用すると、表題の装飾に使われる記号表現(例えば、「★★ タイトル★★」)や箇条書きの行頭文字に使われる記号表現(例えば、「○箇条書きの使い方」)のように、検索語に対する記号評価表現でない記号表現の位置を誤って特定するためであり、(2)の条件を採用すれば、記号評価表現でない記号表現「★★」や「○」等のみが複数出現する文書を除外することができる。また、位置の算出方法については検索語位置特定手段302と同一方法で行う。また、出力する位置情報は少なくとも記号評価表現が出現する文書を特定する情報と、その文書内で記号評価表現が出現する位置を特定する情報を組みにして出力する。今、記号評価表現記憶手段307に、図25に示す記号評価表現の集合が記憶されており、数値評価表現の位置の特定方法として、文書内で同一グループの異なる記号評価表現が3回以上出現することを条件とし、数値評価表現の位置の算出方法として文書の先頭からの行数を選択した場合について説明する。この場合、図24に示す文書番号1の文書内でグループ番号1の異なる記号評価表現「★★★」「★★」「★★★★」が3回出現するため、記号評価表現位置特定手段308は、記号評価表現の位置について、「★★★」をy−l行目と、「★★」をy行目と、「★★★★」をy+l行目とそれぞれ特定して、表現間距離判定手段304に対し、記号評価表現の位置情報((文書番号1,★★★,y−l行目),(文書番号1,★★,y行目),(文書番号1,★★★★,y+l行目))を出力する。
次に、表現間距離判定手段304は、検索語位置特定手段302で出力された検索語の位置情報と数値評価表現位置特定手段306で出力された数値評価表現の位置情報を受け取り、検索語の位置情報と数値評価表現の位置情報の距離が一定範囲内ならば、その数値評価表現をその検索語の評価表現と判別し、その評価表現の位置情報を評判位置記憶部8に対し出力する(図23のステップS6)。距離が一定範囲内か否かの判断の方法は、実施例1の表現間距離判定手段4における方法と同一であるため、ここでは説明を省略する。
今、検索語と記号評価表現との間の数値的差分の大きさの閾値を0行と設定した場合について説明する。この場合、表現間距離判定手段304は、検索語の位置情報(文書番号1,商品B,y行目)と記号評価表現の位置情報((文書番号1,★★★,y−l行目),(文書番号1,★★,y行目),(文書番号1,★★★★,y+l行目))の距離を測定し、文書番号1の文書における「商品B」と「★★」の距離が閾値以下であるため、記号評価表現「★★」を検索語「商品B」の評判情報と判別し、評判位置記憶部8に対し、評判情報の位置情報(文書番号1,商品B,y行目,★★、y行目)を出力する。
なお、検索語位置特定手段302と記号評価表現位置特定手段308の処理順序はどちらを先に処理することも可能である。
また上記の動作では、表現間距離判定手段304は検索位置特定手段302と記号評価表現位置特定手段308の両方から出力された後に動作を開始する方法を説明したが、それ以外にも検索語位置特定手段302で特定された検索語の位置と記号評価表現位置特定手段308で特定された数値評価表現の位置のいずれかを基準として動作を行うことも可能である。今、検索語位置特定手段302により特定された検索語の位置情報を基準とする場合について説明すると、まず基準とした手段である検索語位置特定手段302が検索語の位置情報を表現間距離判定手段304に対し出力し、次に表現間距離判定手段304は基準としなかった手段である記号評価表現位置特定手段308に対し、基準とした手段である検索語位置特定手段302の出力した検索語の位置情報と距離の範囲を出力する。そして、基準としなかった手段である記号評価表現位置特定手段308は、受け取った検索語の位置情報の前方距離の範囲又は後方距離の範囲に存在する記号評価表現の位置を特定し、その記号評価表現の位置情報を表現間距離判定手段304に出力する。そして、最後に表現間距離判定手段304は、基準としなかった手段である記号評価表現位置特定手段308から出力された記号評価表現の位置情報を受け取り、検索語の位置情報と記号評価表現の位置情報から、検索語と数値評価表現の距離が一定の範囲内である場合、記号評価表現を検索語の評判情報として評判位置記憶部8に記憶するという方法でもよい。
以上のように、実施例4における評判情報判別手段3を用いると、検索語と記号評価表現の表現間距離を判定することにより記号表現で記述される検索語に関する評判情報が出現する位置を自動的に判定して、その結果を評判位置記憶部8に記憶することが可能となる。
次に、図26に示すように、評判情報判別手段3が、評価表現記憶部301と、検索語位置特定手段302と、評価表現位置特定手段303と、表現間距離判定手段304と、数値評価表現記憶部305と、数値評価表現位置特定手段306と、記号評価表現記憶部307と、記号評価表現位置特定手段308とを有する場合(以下、「実施例5」という。)について説明する。
検索語位置特定手段302は、実施例1と同一であるため、ここでは説明を省略する。
評価表現記憶部301と評価表現位置特定手段303は、実施例1と同一であるため、ここでは説明を省略する。
また、数値評価表現記憶部305と数値評価表現位置特定手段306は、実施例3と同一であるため、ここでは説明を省略する。
記号評価表現記憶部307と記号評価表現位置特定手段308は、実施例4と同一であるため、ここでは説明を省略する。
次に、この実施例5における評判情報判別手段3の動作について、図面を用いて説明する。
図27のステップS1からステップS4までの動作は、実施例1における動作と同一のため説明を省略する。
図27のステップS5における動作は、実施例3における動作と同一である。
図27のステップS6における動作は、実施例4における動作と同一である。
図27のステップS7における表現間距離判定手段304の動作は、実施例1、実施例3及び実施例4における表現間距離判定手段304の動作と同一の動作を行う。
図27のステップS8における動作は、実施例1、実施例3及び実施例4における動作と同一の動作を行う。
以上のように、実施例5における評判情報判別手段3を用いると、検索語と評価表現及び検索語と数値評価表現及び検索語と記号評価表現の表現間距離を判定することにより、さまざまな表現で記述される検索語に関する評判情報を出現する位置を自動的に判別して、その結果を評判位置記憶部8に記憶することが可能となる。
[実施の形態6]
次に、本発明の第6の実施の形態について図面を参照して詳細に説明する。
図28を参照すると、本発明の第6の実施の形態は、本発明の第1の実施の形態と同様に、入力装置10、データ処理装置12、記憶装置11、出力装置13を備え、更に、情報分類装置を実現するためのプログラムを記録した記録媒体14を備える。この記録媒体14は磁気ディスク、半導体メモリ、CD−ROMその他の記録媒体であってよい。
情報分類装置を実現するためのプログラムは記録媒体14からデータ処理装置12に読み込まれ、データ処理装置12の動作を制御し、記憶装置11に文書記憶部7と、評判位置記憶部8と、発信者対応関係記憶部511と、文書タイプ対応関係記憶部513と、分類結果記憶部6との領域を確保する。データ処理装置12は情報分類装置を実現するためのプログラムの制御により第1の実施の形態における発信者グループ別分類手段512、文書タイプ的発信者グループ別分類手段514及び発信者グループ決定手段515による処理と同一の処理を実行する。
[実施の形態7]
次に、本発明の第7の実施の形態について図面を参照して詳細に説明する。
図28を参照すると、本発明の第7の実施の形態は、本発明の第2の実施の形態と同様に、入力装置10、データ処理装置12、記憶装置11、出力装置13を備え、更に、情報分類装置を実現するためのプログラムを記録した記録媒体14を備える。この記録媒体14は磁気ディスク、半導体メモリ、CD−ROMその他の記録媒体であってよい。
情報分類装置を実現するためのプログラムは記録媒体14からデータ処理装置12に読み込まれ、データ処理装置12の動作を制御し、記憶装置11に文書記憶部7と、評判位置記憶部8と、主題表現記憶部521と、分類結果記憶部6との領域を確保する。データ処理装置12は情報分類装置を実現するためのプログラムの制御により第2の実施の形態における主題別分類手段522による処理と同一の処理を実行する。
[実施の形態8]
次に、本発明の第8の実施の形態について図面を参照して詳細に説明する。
図28を参照すると、本発明の第7の実施の形態は、本発明の第3の実施の形態と同様に、入力装置10、データ処理装置12、記憶装置11、出力装置13を備え、更に、情報分類装置を実現するためのプログラムを記録した記録媒体14を備える。この記録媒体14は磁気ディスク、半導体メモリ、CD−ROMその他の記録媒体であってよい。
情報分類装置を実現するためのプログラムは記録媒体14からデータ処理装置12に読み込まれ、データ処理装置12の動作を制御し、記憶装置11に文書記憶部7と、評判位置記憶部8と、評価表現属性記憶部531と、否定表現記憶部532と、分類結果記憶部6との領域を確保する。データ処理装置12は情報分類装置を実現するためのプログラムの制御により第3の実施の形態における評価表現属性別分類手段533による処理と同一の処理を実行する。
[実施の形態9]
次に、本発明の第9の実施の形態について図面を参照して詳細に説明する。
図28を参照すると、本発明の第7の実施の形態は、本発明の第4の実施の形態と同様に、入力装置10、データ処理装置12、記憶装置11、出力装置13を備え、更に、情報分類装置を実現するためのプログラムを記録した記録媒体14を備える。この記録媒体14は磁気ディスク、半導体メモリ、CD−ROMその他の記録媒体であってよい。
情報分類装置を実現するためのプログラムは記録媒体14からデータ処理装置12に読み込まれ、データ処理装置12の動作を制御し、記憶装置11に文書記憶部7と、評判位置記憶部8と、発信者対応関係記憶部511と、文書タイプ対応関係記憶部513と、主題表現記憶部521と、評価表現属性記憶部531と、否定表現記憶部532と、分類結果記憶部6との領域を確保する。データ処理装置12は情報分類装置を実現するためのプログラムの制御により第1の実施の形態における発信者グループ別分類手段512、文書タイプ的発信者グループ別分類手段514及び発信者グループ決定手段515、第2の実施の形態における主題別分類手段522、更に第3の実施の形態における評価表現属性別分類手段533による処理と同一の処理を実行する。
[実施の形態10]
次に、本発明の第10の実施の形態について図面を参照して詳細に説明する。
図28を参照すると、本発明の第7の実施の形態は、本発明の第5の実施の形態と同様に、入力装置10、データ処理装置12、記憶装置11、出力装置13を備え、更に、情報分類装置を実現するためのプログラムを記録した記録媒体14を備える。この記録媒体14は磁気ディスク、半導体メモリ、CD−ROMその他の記録媒体であってよい。
情報分類装置を実現するためのプログラムは記録媒体14からデータ処理装置12に読み込まれ、データ処理装置12の動作を制御し、記憶装置11に評判位置記憶部8と分類結果記憶部6との領域を確保する。データ処理装置12は情報分類装置を実現するためのプログラムの制御により第5の実施の形態における文書入力手段1、検索語入力手段2、評判情報判別手段3、及び検索結果表示手段9、更に、第1から第4の実施の形態における評判情報分類手段5による処理と同一の処理を実行する。
本発明の第1、第2、第3及び第4の実施の形態の構成を示すブロック図。 本発明の第1の実施の形態の評判情報分類手段5の構成を示すブロック図。 本発明の第1の実施の形態の文書記憶部7の登録例1を示す図。 本発明の第1の実施の形態の文書記憶部7の登録例2を示す図。 本発明の第1の実施の形態の発信者対応関係記憶部511の登録例を示す図。 本発明の第1の実施の形態の文書タイプ対応関係記憶部513の登録例を示す図。 本発明の第2の実施の形態の評判情報分類手段5の構成を示すブロック図。 本発明の第3の実施の形態の評判情報分類手段5の構成を示すブロック図。 本発明の第4の実施の形態の評判情報分類手段5の構成を示すブロック図。 本発明の第5の実施の形態の構成を示すブロック図。 本発明の第5の実施の形態の検索結果表示手段9の表示例1を示す図。 本発明の第5の実施の形態の検索結果表示手段9の表示例2を示す図。 本発明の第5の実施の形態における評判情報判別手段3の実施例1の構成を示すブロック図。 本発明の第5の実施の形態における評判情報判別手段3の実施例1の動作を示す流れ図。 本発明の第5の実施の形態における評判情報判別手段3の実施例2の構成を示すブロック図。 本発明の第5の実施の形態における評判情報判別手段3の実施例2の動作を示す流れ図。 本発明の第5の実施の形態における評判情報判別手段3の実施例3の構成を示すブロック図。 本発明の第5の実施の形態における評判情報判別手段3の実施例3の動作を示す流れ図。 本発明の第5の実施の形態における評判情報判別手段3の実施例3の文書入力手段1の入力例1を示す図。 本発明の第5の実施の形態における評判情報判別手段3の実施例3の文書入力手段1の入力例2を示す図。 本発明の第5の実施の形態における評判情報判別手段3の実施例3の数値評価表現記憶部305の登録例を示す図。 本発明の第5の実施の形態における評判情報判別手段3の実施例4の構成を示すブロック図。 本発明の第5の実施の形態における評判情報判別手段3の実施例4の動作を示す流れ図。 本発明の第5の実施の形態における評判情報判別手段3の実施例4の文書入力手段1の入力例を示す図。 本発明の第5の実施の形態における評判情報判別手段3の実施例4の記号評価表現記憶部307の登録例を示す図。 本発明の第5の実施の形態における評判情報判別手段3の実施例5の構成を示すブロック図。 本発明の第5の実施の形態における評判情報判別手段3の実施例5の動作を示す流れ図。 本発明の第6の実施の形態の構成を示すブロック図。
符号の説明
1 文書入力手段
2 検索語入力手段
3 評判情報判別手段
5 評判情報分類手段
6 分類結果記憶部
7 文書記憶部
8 評判位置記憶部
9 検索結果表示手段
10 入力装置
11 記憶装置
12 データ処理装置
13 出力装置
14 記録媒体
51 発信者グループ別分類手段
52 主題別分類手段
53 評価表現属性別分類手段
301 評価表現記憶部
302 検索語位置特定手段
303 評価表現位置特定手段
304 表現間距離判定手段
305 数値評価表現記憶部
306 数値評価表現位置特定手段
307 数値評価表現記憶部
308 記号評価表現位置特定手段
309 検索語分野特定手段
511 発信者対応関係記憶部
512 発信者グループ別分類手段
513 文書タイプ対応関係記憶部
514 文書タイプ的発信者グループ別分類手段
515 発信者グループ決定手段
521 主題表現記憶部
522 主題別分類手段
531 評価表現属性記憶部
532 否定表現記憶部
533 評価表現属性別分類手段
1001 評判候補抽出手段





































Claims (4)

  1. 評判情報の主題表現を記憶する主題表現記憶部と、評判情報を含む文書から評判情報の位置を特定し、当該評判情報の周囲に前記主題表現記憶部に記憶された前記主題表現が存在する場合、当該評判情報を当該主題表現に分類する主題別分類手段とを備えたことを特徴とする情報分類装置。
  2. 評判情報の発信者を示す情報と発信者グループとの対応関係を記憶した発信者対応関係記憶部と、評判情報を含む文書から前記発信者を示す情報の位置を特定し、当該発信者を示す情報と、前記発信者対応関係記憶部に記憶された前記評判情報の発信者を示す情報と発信者グループとの対応関係とを用いて、前記評判情報を発信者グループ別に分類する発信者グループ別分類手段とを含む発信者グループ別分類手段と、評判情報の主題表現を記憶する主題表現記憶部と、評判情報を含む文書から評判情報の位置を特定し、当該評判情報の周囲に前記主題表現記憶部に記憶された前記主題表現が存在する場合、当該評判情報を当該主題表現に分類する主題別分類手段とを含む主題別分類手段と、評価表現の肯定的又は否定的な属性を記憶する評価表現属性記憶部と、評判情報を含む文書から前記評判情報の前記評価表現の位置を特定し、前記評価表現属性記憶部に記憶された前記評価表現の肯定的又は否定的な属性を参照して、前記評判情報を肯定又は否定な属性に分類する評価表現属性別分類手段とを含む評価表現属性別分類手段とを備えたことを特徴とする情報分類装置。
  3. 文書における検索語に関する評判情報の位置情報を記憶する評判位置記憶部と、文書に含まれる検索語に関する評判情報の位置を判別し、当該評判情報の位置情報を前記評判位置記憶部に出力する評判情報判別手段と、評判情報の主題表現を記憶する主題表現記憶部と、前記評判位置記憶部を参照して、評判情報を含む文書から評判情報の位置を特定し、当該評判情報の周囲に前記主題表現記憶部に記憶された前記主題表現が存在する場合、当該評判情報を当該主題表現に分類する主題別分類手段とを含む評判情報分類手段とを備えることを特徴とする情報分類装置。
  4. 評判情報の主題表現を記憶させる主題表現記憶処理と、評判情報を含む文書から前記評判情報の位置を特定し、当該評判情報の周囲に前記主題表現記憶処理により記憶された前記主題表現が存在する場合、当該評判情報を当該主題表現に分類する主題別分類処理とをコンピュータに実行させるためのプログラムを記録したことを特徴とする記録媒体。


JP2006122296A 2006-04-26 2006-04-26 情報分類装置 Pending JP2006236379A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006122296A JP2006236379A (ja) 2006-04-26 2006-04-26 情報分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006122296A JP2006236379A (ja) 2006-04-26 2006-04-26 情報分類装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2000278431A Division JP3864687B2 (ja) 2000-09-13 2000-09-13 情報分類装置

Publications (1)

Publication Number Publication Date
JP2006236379A true JP2006236379A (ja) 2006-09-07

Family

ID=37043872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006122296A Pending JP2006236379A (ja) 2006-04-26 2006-04-26 情報分類装置

Country Status (1)

Country Link
JP (1) JP2006236379A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012137782A1 (ja) * 2011-04-08 2012-10-11 株式会社ユニバーサルエンターテインメント 嗜好可視化システム及び検閲システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012137782A1 (ja) * 2011-04-08 2012-10-11 株式会社ユニバーサルエンターテインメント 嗜好可視化システム及び検閲システム
JP2012221222A (ja) * 2011-04-08 2012-11-12 Universal Entertainment Corp 情報処理システム、嗜好可視化システム及び検閲システム並びに嗜好可視化方法
CN103635898A (zh) * 2011-04-08 2014-03-12 环球娱乐株式会社 喜好可视化系统和审查系统
CN103635898B (zh) * 2011-04-08 2016-08-10 环球娱乐株式会社 喜好可视化系统和审查系统
US10055487B2 (en) 2011-04-08 2018-08-21 Universal Entertainment Corporation Preference visualization system and censorship system

Similar Documents

Publication Publication Date Title
US8010539B2 (en) Phrase based snippet generation
JP5238418B2 (ja) 情報推薦装置および情報推薦方法
US20110093258A1 (en) System and method for text cleaning
Al-Khatib et al. Emotional tone detection in arabic tweets
JP5229226B2 (ja) 情報共有システム、情報共有方法、および情報共有プログラム
JP5273735B2 (ja) テキスト要約方法、その装置およびプログラム
JP2010211594A (ja) テキスト分析装置および方法、並びにプログラム
Wicaksono et al. Automatic extraction of advice-revealing sentences foradvice mining from online forums
JP3820878B2 (ja) 情報検索装置,スコア決定装置,情報検索方法,スコア決定方法及びプログラム記録媒体
JP3864687B2 (ja) 情報分類装置
Bhuiyan et al. State-of-the-art review on opinion mining from online customers' feedback
JP2006244305A (ja) クチコミ情報判定方法及び装置及びプログラム
JP4931114B2 (ja) データ表示装置、データ表示方法及びデータ表示プログラム
JP2009211280A (ja) オンラインページ分析方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP5224532B2 (ja) 評判情報分類装置及びプログラム
Lin et al. Tourism-related opinion detection and tourist-attraction target identification
WO2016121127A1 (ja) データ評価システム、データ評価方法、およびデータ評価プログラム
JP2000112949A (ja) 情報判別支援装置及び類似情報判別支援プログラムを記録した記録媒体
JP4463242B2 (ja) 情報分類装置
JP2006065366A (ja) キーワード分類装置およびその方法、端末装置ならびにプログラム
Alam et al. Comparing named entity recognition on transcriptions and written texts
US8195458B2 (en) Open class noun classification
JP2006236379A (ja) 情報分類装置
JP2006236378A (ja) 情報分類装置
JP2006293616A (ja) 文書集約方法及び装置及びプログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070515

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070918