JP2006286026A - Opinion collection/analysis device, opinion collection/analysis method used therefor and its program - Google Patents

Opinion collection/analysis device, opinion collection/analysis method used therefor and its program Download PDF

Info

Publication number
JP2006286026A
JP2006286026A JP2006206235A JP2006206235A JP2006286026A JP 2006286026 A JP2006286026 A JP 2006286026A JP 2006206235 A JP2006206235 A JP 2006206235A JP 2006206235 A JP2006206235 A JP 2006206235A JP 2006286026 A JP2006286026 A JP 2006286026A
Authority
JP
Japan
Prior art keywords
opinion
object name
input
name
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006206235A
Other languages
Japanese (ja)
Other versions
JP4539616B2 (en
Inventor
Kenji Tateishi
健二 立石
Kenji Yamanishi
健司 山西
Satoshi Morinaga
聡 森永
Shunichi Fukushima
俊一 福島
Yoshihide Ishiguro
義英 石黒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006206235A priority Critical patent/JP4539616B2/en
Publication of JP2006286026A publication Critical patent/JP2006286026A/en
Application granted granted Critical
Publication of JP4539616B2 publication Critical patent/JP4539616B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To automatically extract opinions of persons from a set of documents present in the Internet or the like and to compare and analyze the opinions from various viewpoints. <P>SOLUTION: An object name set input means 11 of an input/output device 1 is used for inputting a plurality of object names by a user. An object name selection means 12 selects an object name of an analysis object out of a set of the object names inputted by the user by using the object name input means 11. A document set storage part 21 of a data processor 2 stores the document set, and an opinion extraction means 22 extracts opinions included in the document set stored in the document set storage part 21 and related to the object name inputted from the object name input means 11. An object comparison/analysis means 23 analyzes features of the opinions (partial opinions) related to the object name selected by the object name selection means 12 within the opinions (the whole opinions) extracted by the opinion extraction means 22 and related to the object names inputted by the object name set input means 11. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は及びそれに用いる意見収集分析装置方法並びにそのプログラムに関し、特に文書集合から抽出した意見をさまざまな観点で比較分析する意見収集分析装置に関する。 The present invention relates to an opinion collection / analysis apparatus method and program for use therein, and more particularly to an opinion collection / analysis apparatus that compares and analyzes opinions extracted from a document set from various viewpoints.

市場調査や顧客満足度調査のためには消費者からの意見を収集・分析することが重要である。従来、この意見を収集・分析するための方法としては、アンケートを用いて消費者から意見を収集し、その回答文から全体的な特徴や傾向を分析するという方法が使われている。 It is important to collect and analyze consumer opinions for market research and customer satisfaction surveys. Conventionally, as a method for collecting and analyzing this opinion, a method has been used in which opinions are collected from consumers using a questionnaire, and the overall characteristics and trends are analyzed from the answer sentences.

例えば、特開2001−266060号公報に開示されたアンケート回答分析システムでは、消費者からの自由回答文から、テキスト分類エンジンによってルール形式の知識を自動的に抽出し、その抽出結果を利用者に分析結果として提示している。 For example, in the questionnaire response analysis system disclosed in Japanese Patent Laid-Open No. 2001-266060, knowledge of the rule format is automatically extracted from a free answer sentence from a consumer by a text classification engine, and the extraction result is transmitted to the user. Presented as an analysis result.

一方、意見を収集するという点に注目すると、インタネットのWebページに記述されている情報から意見を抽出する方法がある。例えば、立石健二、石黒義英、福島俊一による“インターネットからの評判情報検索”[情報処理学会第62回全国大会予稿集(3),p123−124,2001]には、Webページに記述されたさまざまな情報の中からユーザが入力した商品に関する意見を自動的に抽出してユーザに検索結果として提示している。 On the other hand, focusing on the point of collecting opinions, there is a method of extracting opinions from information described on an Internet Web page. For example, “Reputation information retrieval from the Internet” by Kenji Tateishi, Yoshihide Ishiguro, Shunichi Fukushima [Proceedings of the 62nd National Convention of Information Processing Society (3), p123-124, 2001] Opinions related to products input by the user are automatically extracted from various information and presented as search results to the user.

しかしながら、上述したアンケート回答分析システムでは、人の意見をアンケート調査票を用いて収集しているが、アンケート実施者がアンケート調査票作成にかかるコストや、良質の回答モニタを選別してアンケートを依頼するコストが多く必要であり、またそのように労力をかけて調査を行っても十分な数の自由回答文の意見が得られないケースが多く存在するという問題がある。 However, in the above-mentioned questionnaire response analysis system, people's opinions are collected using questionnaire questionnaires, but the questionnaire implementer selects the questionnaire survey cost and high quality response monitors and requests the questionnaire. There is a problem that there are many cases where opinions of a sufficient number of free answer sentences cannot be obtained even if the investigation is conducted with such efforts.

また、上記の評判情報検索システムでは、意見の収集自体を自動的に行うことが可能であるが、収集した意見を単純に検索結果に列挙しただけでは、ユーザがその商品のどのような点が良くどのような点が悪いのか、または他の商品と比較してどのぐらい良いのかといった全体的な特徴や傾向を知ることができないという問題がある。 In addition, the above-described reputation information search system can automatically collect opinions, but simply listing the collected opinions in the search results will allow the user to determine what the product is about. There is a problem that it is impossible to know the overall characteristics and trends such as what is good or bad or how good it is compared to other products.

さらに、上記のアンケート回答分析システムと評判情報検索システムとを組合わせた場合、単純に評判情報検索システムの出力をアンケート回答分析システムに入力したのでは、抽出した意見を比較分析することができないという問題がある。 Furthermore, when the above questionnaire response analysis system and reputation information search system are combined, it is not possible to compare and analyze the extracted opinions simply by inputting the reputation information search system output into the questionnaire response analysis system. There's a problem.

さらにまた、上記のアンケート回答分析システムと評判情報検索システムとを組合わせた場合、評判情報検索システムの意見抽出精度が十分でないため、単純に評判情報検索システムの出力をアンケート回答分析システムに入力したのでは、精度の高い分析結果が得られないこともあるという問題がある。 Furthermore, when the above questionnaire response analysis system and reputation information search system are combined, the reputation information search system does not have sufficient opinion extraction accuracy, so the output of the reputation information search system is simply input to the questionnaire response analysis system. Therefore, there is a problem that a highly accurate analysis result may not be obtained.

そこで、本発明の目的は上記の問題点を解消し、抽出した意見全体の中で利用者が選択した対象物に関する意見の特徴を分析した結果を依頼者に提示することができる意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラムを提供することにある。 Accordingly, an object of the present invention is to provide an opinion collection / analysis apparatus that can solve the above-described problems and present a result of analyzing the characteristics of an opinion related to an object selected by a user among all extracted opinions to a client It is another object of the present invention to provide a method for collecting and analyzing opinions and a program therefor.

本発明の他の目的は、正確な意見抽出を実現することができ、その抽出した意見の高精度の分析結果を依頼者に提示することができる意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラムを提供することにある。 Another object of the present invention is to provide an opinion collection and analysis apparatus capable of realizing accurate opinion extraction and presenting a highly accurate analysis result of the extracted opinion to a client, an opinion collection and analysis method used therefor, and To provide that program.

本発明の別の目的は、抽出した意見全体の中で利用者が選択したカテゴリに関する意見の特徴を分析した結果を依頼者に提示することができる意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラムを提供することにある。 Another object of the present invention is to provide an opinion collection / analysis apparatus and an opinion collection / analysis method used therefor that can present a client with the result of analyzing the characteristics of the opinion related to the category selected by the user among the extracted opinions. To provide that program.

本発明による意見収集分析装置は、複数の対象物名を入力するための対象物名集合入力手段と、前記対象物名集合入力手段から入力された対象物名集合のうちの分析対象の対象物名を選択する対象物名選択手段と、文書集合を記憶する文書集合記憶手段と、前記文書集合記憶手段に記憶された文書集合に含まれかつ前記対象物名集合入力手段から入力された対象物名に関連する意見を抽出する意見抽出手段と、前記意見抽出手段で抽出した意見の中で前記対象物名選択手段で選択された対象物名に関する意見の特徴を分析する対象物比較分析手段とを備えている。 An opinion collection / analysis apparatus according to the present invention includes an object name set input unit for inputting a plurality of object names, and an object to be analyzed from the object name set input from the object name set input unit. Object name selection means for selecting a name, document set storage means for storing a document set, and an object included in the document set stored in the document set storage means and input from the object name set input means An opinion extracting means for extracting an opinion related to the name, and an object comparison analyzing means for analyzing the characteristics of the opinion related to the object name selected by the object name selecting means among the opinions extracted by the opinion extracting means; It has.

本発明による他の意見収集分析装置は、一つ以上の対象物名を入力するための対象物名入力手段と、前記対象物名入力手段から入力された対象物名集合のうちの分析対象の対象物名を選択する対象物名選択手段と、前記対象物名入力手段から入力された対象物名を基にそれに関連する対象物名を展開する対象物名拡張手段と、文書集合を記憶する文書集合記憶手段と、前記文書集合記憶手段に記憶された文書集合に含まれかつ前記対象物名集合入力手段から入力された対象物名及び前記対象物名拡張手段で拡張された対象物名に関連する意見を抽出する意見抽出手段と、前記意見抽出手段で抽出された意見の中で前記対象物名選択手段で選択した対象物名に関する意見の特徴を分析する対象物比較分析手段とを備えている。 Another opinion collecting / analyzing apparatus according to the present invention includes an object name input means for inputting one or more object names, and an object to be analyzed in the object name set input from the object name input means. Object name selection means for selecting an object name, object name expansion means for expanding an object name related to the object name input from the object name input means, and a document set are stored. A document set storage means, an object name included in the document set stored in the document set storage means and input from the object name set input means, and an object name extended by the object name extension means Opinion extraction means for extracting related opinions, and object comparison analysis means for analyzing the characteristics of the opinion related to the object name selected by the object name selection means among the opinions extracted by the opinion extraction means ing.

本発明による別の意見収集分析装置は、一つ以上の対象物名を入力するための対象物名入力手段と、分析条件を入力する分析条件入力手段と、文書集合を記憶する文書集合記憶手段と、前記文書集合記憶手段に記憶された文書集合に含まれかつ前記対象物名入力手段から入力された対象物名に関連する意見を抽出する意見抽出手段と、前記意見抽出手段で抽出された意見に様々なカテゴリを設定するカテゴリ設定手段と、前記意見抽出手段で抽出された意見の中で前記分析条件入力手段から指定された条件を満たす意見の特徴を分析する比較分析手段とを備えている。 Another opinion collection / analysis apparatus according to the present invention includes an object name input means for inputting one or more object names, an analysis condition input means for inputting an analysis condition, and a document set storage means for storing a document set. An opinion extraction unit that extracts an opinion that is included in the document set stored in the document set storage unit and that is related to the object name input from the object name input unit, and that is extracted by the opinion extraction unit Category setting means for setting various categories for opinions, and comparative analysis means for analyzing the characteristics of opinions that satisfy the conditions specified by the analysis condition input means among the opinions extracted by the opinion extraction means Yes.

本発明による意見収集分析方法は、複数の対象物名を入力するステップと、その入力された対象物名集合のうちの分析対象の対象物名を選択するステップと、文書集合を記憶する文書集合記憶手段に記憶された文書集合に含まれかつ前記入力された対象物名に関連する意見を抽出するステップと、この抽出した意見の中で前記選択された対象物名に関する意見の特徴を分析するステップとを備えている。 An opinion collection and analysis method according to the present invention includes a step of inputting a plurality of object names, a step of selecting an object name to be analyzed from the input object name set, and a document set storing a document set Extracting opinions related to the input object name included in the document set stored in the storage means, and analyzing the characteristics of the opinion regarding the selected object name in the extracted opinions And steps.

本発明による他の意見収集分析方法は、一つ以上の対象物名を入力するステップと、その入力された対象物名集合のうちの分析対象の対象物名を選択するステップと、前記入力された対象物名を基にそれに関連する対象物名を展開するステップと、文書集合を記憶する文書集合記憶手段に記憶された文書集合に含まれかつ前記入力された対象物名及び前記拡張された対象物名に関連する意見を抽出するステップと、この抽出された意見の中で前記選択した対象物名に関する意見の特徴を分析するステップとを備えている。 Another opinion collection and analysis method according to the present invention includes a step of inputting one or more object names, a step of selecting an object name to be analyzed from the input object name set, and the input A step of expanding a target name related to the target name based on the target name and a document set stored in a document set storage means for storing the document set and the input target name and the expanded The method includes a step of extracting an opinion related to the object name, and a step of analyzing a feature of the opinion related to the selected object name among the extracted opinions.

本発明による別の意見収集分析方法は、一つ以上の対象物名を入力するステップと、分析条件を入力するステップと、文書集合を記憶する文書集合記憶手段に記憶された文書集合に含まれかつ前記入力された対象物名に関連する意見を抽出するステップと、この抽出された意見に様々なカテゴリを設定するステップと、前記抽出された意見の中で前記分析条件を満たす意見の特徴を分析するステップとを備えている。 Another opinion collection and analysis method according to the present invention is included in the document set stored in the document set storage means for storing the document set, the step of inputting one or more object names, the step of inputting the analysis conditions, and the document set. A step of extracting an opinion related to the input object name, a step of setting various categories for the extracted opinion, and a feature of the opinion satisfying the analysis condition in the extracted opinion. Analyzing.

本発明による意見収集分析方法のプログラムは、コンピュータに、複数の対象物名を入力する処理と、その入力された対象物名集合のうちの分析対象の対象物名を選択する処理と、文書集合を記憶する文書集合記憶手段に記憶された文書集合に含まれかつ前記入力された対象物名に関連する意見を抽出する処理と、この抽出した意見の中で前記選択された対象物名に関する意見の特徴を分析する処理とを実行させている。 A program for an opinion collection and analysis method according to the present invention includes a process for inputting a plurality of object names to a computer, a process for selecting an object name to be analyzed from the input object name set, and a document set. Processing for extracting an opinion related to the input object name and included in the document set stored in the document set storage means for storing the comment, and an opinion related to the selected object name in the extracted opinion And processing for analyzing the characteristics of the.

本発明による他の意見収集分析方法のプログラムは、コンピュータに、一つ以上の対象物名を入力する処理と、その入力された対象物名集合のうちの分析対象の対象物名を選択する処理と、前記入力された対象物名を基にそれに関連する対象物名を展開する処理と、文書集合を記憶する文書集合記憶手段に記憶された文書集合に含まれかつ前記入力された対象物名及び前記拡張された対象物名に関連する意見を抽出する処理と、この抽出された意見の中で前記選択した対象物名に関する意見の特徴を分析する処理とを実行させている。 Another opinion collection and analysis method program according to the present invention includes a process for inputting one or more object names to a computer and a process for selecting an object name to be analyzed from the set of input object names. A process of expanding the object name related to the input object name based on the input object name, and the input object name included in the document set stored in the document set storage means for storing the document set And processing for extracting an opinion related to the expanded object name, and processing for analyzing the characteristics of the opinion regarding the selected object name in the extracted opinion.

本発明による別の意見収集分析方法のプログラムは、コンピュータに、一つ以上の対象物名を入力する処理と、分析条件を入力する処理と、文書集合を記憶する文書集合記憶手段に記憶された文書集合に含まれかつ前記入力された対象物名に関連する意見を抽出する処理と、この抽出された意見に様々なカテゴリを設定する処理と、前記抽出された意見の中で前記分析条件を満たす意見の特徴を分析する処理とを実行させている。 Another opinion collection and analysis method program according to the present invention is stored in a document set storage means for storing one or more object names, a process for inputting analysis conditions, and a document set in a computer. A process of extracting opinions related to the input object name included in the document set, a process of setting various categories for the extracted opinions, and the analysis condition in the extracted opinions. And a process of analyzing the characteristics of the opinions to be satisfied.

すなわち、本発明の意見収集分析装置は、利用者が複数の対象物名を入力する対象物名集合入力手段と、利用者が当該対象物名集合入力手段で入力した対象物名集合のうち分析対象の対象物名を選択する対象物名選択手段と、文書集合を記憶する文書集合記憶部と、当該文書集合記憶部に記憶された文書集合に含まれる当該対象物名集合入力手段から入力された対象物名に関連する意見を抽出する意見抽出手段と、当該意見抽出手段で抽出した当該対象物名集合入力手段で入力された対象物名に関する意見(全体の意見)に対して、その中で当該対象物名選択手段で選択した対象物名に関する意見(部分の意見)の特徴を分析する対象物比較分析手段とから構成されている。 That is, the opinion collection / analysis apparatus of the present invention analyzes an object name set input means for a user to input a plurality of object names, and an object name set input by a user using the object name set input means. The object name selection means for selecting the target object name, the document set storage section for storing the document set, and the object name set input means included in the document set stored in the document set storage section. An opinion extracting means for extracting opinions related to the object name, and an opinion (overall opinion) on the object name input by the object name set input means extracted by the opinion extracting means. And object comparison analysis means for analyzing the characteristics of opinions (partial opinions) related to the object name selected by the object name selection means.

このような構成を採用することによって、本発明の意見収集分析装置では、文書集合から複数の対象物名の意見を抽出することによって、抽出した意見全体の中で利用者が選択した対象物に関する意見の特徴を分析した結果が依頼者に提示可能となる。 By adopting such a configuration, the opinion collection / analysis apparatus of the present invention extracts the opinions of a plurality of object names from the document set, and thereby relates to the object selected by the user among the extracted opinions as a whole. The result of analyzing the characteristics of the opinion can be presented to the client.

また、本発明の意見収集分析装置は、物事に対する評価を示す表現である評価表現の集合が登録された評価表現記憶部と、入力された対象物と評価表現記憶部に記憶された評価表現が一定の関係にある場合に対象物と評価表現とを含む文字列又は文章を意見候補として抽出する意見候補抽出手段と、意見候補抽出手段で抽出された意見候補の意見らしさを判定する意見判定手段とを有している。 In addition, the opinion collection and analysis apparatus of the present invention includes an evaluation expression storage unit in which a set of evaluation expressions, which are expressions indicating evaluation of things, and an evaluation expression stored in the input object and the evaluation expression storage unit. Opinion candidate extraction means for extracting a character string or sentence including an object and an evaluation expression as an opinion candidate when there is a certain relationship, and an opinion determination means for determining the likelihood of the opinion candidate extracted by the opinion candidate extraction means And have.

このような構成を採用することによって、本発明の意見収集分析装置では、インタネットから抽出した意見候補の意見らしさを構文的適性もしくは客観的適性といった方法によって判定することによって、正確な意見抽出を実現し、それによって抽出した意見の高精度の分析結果が依頼者に提示可能となる。 By adopting such a configuration, the opinion collection and analysis apparatus of the present invention realizes accurate opinion extraction by determining the likelihood of opinion extracted from the Internet by a method such as syntactic suitability or objective suitability. As a result, a highly accurate analysis result of the extracted opinion can be presented to the client.

さらに、本発明の意見収集分析装置は、利用者が一つ以上の対象物名を入力する対象物名入力手段と、利用者が分析条件を入力する分析条件入力手段と、文書集合を記憶する文書集合記憶部と、当該文書集合記憶部に記憶された文書集合に含まれる当該対象物名入力手段から入力された対象物名に関連する意見を抽出する意見抽出手段と、当該意見抽出手段で抽出された意見に様々なカテゴリを設定するカテゴリ設定手段と、当該意見抽出手段で抽出された当該対象物名入力手段で入力された対象物名に関する意見(全体の意見)に対して、その中で当該分析条件指定選択手段で指定された条件を満たす意見(部分の意見)の特徴を分析する比較分析手段とから構成されている。 Furthermore, the opinion collection and analysis apparatus of the present invention stores an object name input means for a user to input one or more object names, an analysis condition input means for a user to input analysis conditions, and a document set. A document set storage unit, an opinion extraction unit that extracts an opinion related to the object name input from the object name input unit included in the document set stored in the document set storage unit, and the opinion extraction unit Among the category setting means for setting various categories for the extracted opinions, and opinions regarding the object name input by the object name input means extracted by the opinion extraction means (overall opinions), And comparative analysis means for analyzing the characteristics of opinions (partial opinions) that satisfy the conditions specified by the analysis condition specification selection means.

このような構成を採用することによって、本発明の意見収集分析装置では、文書集合から抽出した意見に様々なカテゴリを自動的に設定することによって、抽出した意見全体の中で利用者が選択したカテゴリに関する意見の特徴を分析した結果が依頼者に提示可能となる。 By adopting such a configuration, the opinion collection / analysis apparatus of the present invention automatically sets various categories to the opinions extracted from the document set, and the user selects among the extracted opinions as a whole. The result of analyzing the characteristics of opinions regarding the category can be presented to the client.

以上説明したように本発明の意見収集分析装置は、複数の対象物名を入力し、その入力された対象物名集合のうちの分析対象の対象物名を選択し、文書集合を記憶する文書集合記憶手段に記憶された文書集合に含まれかつ入力された対象物名に関連する意見を抽出し、この抽出した意見の中で選択された対象物名に関する意見の特徴を分析することによって、抽出した意見全体の中で利用者が選択した対象物に関する意見の特徴を分析した結果を依頼者に提示することができるという効果が得られる。 As described above, the opinion collection / analysis apparatus of the present invention inputs a plurality of object names, selects an object name to be analyzed from the input object name set, and stores a document set By extracting an opinion related to the input object name included in the document set stored in the set storage means, and analyzing characteristics of the opinion related to the object name selected in the extracted opinion, As a result, it is possible to present the client with the result of analyzing the characteristics of the opinion regarding the object selected by the user in the extracted opinions as a whole.

本発明の他の意見収集分析装置は、一つ以上の対象物名を入力し、その入力された対象物名集合のうちの分析対象の対象物名を選択し、入力された対象物名を基にそれに関連する対象物名を展開し、文書集合を記憶する文書集合記憶手段に記憶された文書集合に含まれかつ入力された対象物名及び拡張された対象物名に関連する意見を抽出し、この抽出された意見の中で選択した対象物名に関する意見の特徴を分析することによって、正確な意見抽出を実現することができ、その抽出した意見の高精度の分析結果を依頼者に提示することができるという効果が得られる。 Another opinion collection / analysis apparatus of the present invention inputs one or more object names, selects an object name to be analyzed from the input object name set, and inputs the input object name. Based on the object name related to the expanded object name, the document name stored in the document set storage means for storing the document set is extracted and opinions related to the input object name and the extended object name are extracted. By analyzing the characteristics of the opinions related to the selected object name in the extracted opinions, it is possible to realize accurate opinion extraction, and to provide the client with the highly accurate analysis results of the extracted opinions. The effect that it can be presented is obtained.

本発明の別の意見収集分析装置は、一つ以上の対象物名を入力し、分析条件を入力し、文書集合を記憶する文書集合記憶手段に記憶された文書集合に含まれかつ入力された対象物名に関連する意見を抽出し、この抽出された意見に様々なカテゴリを設定し、抽出された意見の中で分析条件を満たす意見の特徴を分析することによって、抽出した意見全体の中で利用者が選択したカテゴリに関する意見の特徴を分析した結果を依頼者に提示することができるという効果が得られる。
Another opinion collection / analysis apparatus according to the present invention includes one or more object names, an analysis condition, and a document set stored in a document set storage means for storing the document set. By extracting opinions related to the object name, setting various categories for the extracted opinions, and analyzing the characteristics of the opinions that satisfy the analysis conditions in the extracted opinions, the entire opinion is extracted. Thus, an effect that the result of analyzing the feature of the opinion regarding the category selected by the user can be presented to the client is obtained.

次に、本発明の実施例について図面を参照して説明する。図1は本発明の第1の実施例による意見収集分析装置の構成を示すブロック図である。図1において、本発明の第1の実施例による意見収集分析装置は入出力装置1と、データ処理装置2とから構成されている。 Next, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration of an opinion collection / analysis apparatus according to a first embodiment of the present invention. In FIG. 1, the opinion collection / analysis apparatus according to the first embodiment of the present invention comprises an input / output device 1 and a data processing device 2.

入出力装置1は利用者が複数の対象物名を入力する対象物名集合入力手段11と、利用者が対象物名集合入力手段11で入力した対象物名集合のうち分析対象の対象物名を選択する対象物名選択手段12と、対象物比較分析手段23の分析結果を出力する出力手段13とから構成されている。 The input / output device 1 includes an object name set input unit 11 for a user to input a plurality of object names, and an object name to be analyzed among the object name sets input by the user using the object name set input unit 11. The object name selecting means 12 for selecting and an output means 13 for outputting the analysis result of the object comparison / analysis means 23.

また、データ処理装置2は主にコンピュータから構成され、文書集合を記憶する文書集合記憶部21と、文書集合記憶部21に記憶された文書集合に含まれる対象物名集合入力手段11から入力された対象物名に関連する意見を抽出する意見抽出手段22と、意見抽出手段22で抽出した対象物名集合入力手段11で入力された対象物名に関する意見(全体の意見)に対する、その中で対象物名選択手段12で選択した対象物名に関する意見(部分の意見)の特徴を分析する対象物比較分析手段23と、データ処理装置2の各手段を実現するためのプログラムを格納する記録媒体24とを備えている。尚、データ処理装置2の各手段はハードウェアで構成可能である。 The data processing apparatus 2 is mainly composed of a computer, and is input from a document set storage unit 21 for storing a document set and an object name set input unit 11 included in the document set stored in the document set storage unit 21. The opinion extraction means 22 for extracting an opinion related to the object name and the opinion on the object name (the overall opinion) input by the object name set input means 11 extracted by the opinion extraction means 22 Object comparison / analysis means 23 for analyzing the characteristics of opinions (partial opinions) related to the object name selected by the object name selection means 12 and a recording medium for storing a program for realizing each means of the data processing device 2 24. Each means of the data processing device 2 can be configured by hardware.

対象物集合入力手段11における対象物名は、例えば『商品「M」』、『商品「K」』、『商品「S」』、『商品「R」』というように同分野[例えば、コンピュータやPDA(PersonalDigitalAssistans)等の分野]の複数の対象物名を入力することが効果的である。また、対象物名は商品名に限ることなく、例えば「N社」のような企業・組織名、「山田太郎」のような人名であってもよい。 The object names in the object set input means 11 are the same field such as “product“ M ””, “product“ K ””, “product“ S ””, “product“ R ”” [for example, computer or It is effective to input a plurality of object names in a field such as PDA (Personal Digital Assistance). The object name is not limited to a product name, and may be a company / organization name such as “N Company” or a personal name such as “Taro Yamada”.

文書記憶部21における文書集合とは、ディジタル化された文書集合であればどのような形態でもよいが、様々な人が自由に情報を発信しているインタネット上の文書が意見収集分析には効果的である。 The document set in the document storage unit 21 may be in any form as long as it is a digitized document set. However, documents on the Internet from which various people freely transmit information are effective for opinion collection analysis. Is.

対象物比較分析手段23における特徴は、対象物と意見とのペアの複数個を入力として、分析結果出力を、例えば「1)if−then−else型のルールで意見を対象物に分類する分類ルールとしての表現」、「2)if−then−or型のルールで意見を対象物に対応させる相関ルールとしての表現」、「3)対象物とその特徴語をポジショニングマップでの表現」、「4)意見を対象物に関して典型的な順に並べたリストでの表現」のいずれかを行うことである。 A feature of the object comparison / analysis means 23 is that a plurality of pairs of an object and an opinion are input, and an analysis result output is classified into, for example, “1) if-then-else type rule to classify an opinion as an object. "Expression as a rule", "2) Expression as a correlation rule that associates an opinion with an object by an if-then-or type rule", "3) Expression of an object and its characteristic word in a positioning map", " 4) “Expression in a list in which opinions are arranged in a typical order with respect to the object”.

特に、1)のif−then−else型のルールは特開2001−266060号公報の「アンケート回答分析システム」に開示された方法によって得ることができる。 In particular, the 1) if-then-else rule can be obtained by the method disclosed in “Questionnaire Answer Analysis System” of Japanese Patent Laid-Open No. 2001-266060.

図2は図1の意見抽出手段22の構成例を示すブロック図である。図2において、意見抽出手段22は物事に対する評価を示す表現である評価表現の集合が登録された評価表現記憶部221と、入力された対象物名と評価表現記憶部221に記憶された評価表現とが一定の関係にある場合に対象物名と評価表現とを含む文字列または文章を意見候補としてWeb文書記憶部25(文書集合記憶部21)から抽出する意見候補抽出手段222と、意見候補抽出手段222で抽出された意見候補が意見と認められるかを判定する意見判定手段223とから構成されている。 FIG. 2 is a block diagram illustrating a configuration example of the opinion extraction unit 22 of FIG. In FIG. 2, the opinion extraction unit 22 includes an evaluation expression storage unit 221 in which a set of evaluation expressions, which are expressions indicating evaluation of things, and an evaluation expression stored in the input object name and evaluation expression storage unit 221. Opinion candidate extraction means 222 that extracts a character string or a sentence including the object name and the evaluation expression as an opinion candidate from the Web document storage unit 25 (document set storage unit 21), and an opinion candidate An opinion determination unit 223 that determines whether the opinion candidate extracted by the extraction unit 222 is recognized as an opinion is included.

評価表現記憶部221に記憶される評価表現は、物事に対する評価を示す表現である。商品に関する評価表現の例を図3に示す。図3において、商品分野「共通」に対応する評価表現には「いい」、「好き」、「最高」、「勧め」、「満足だ」があり、商品分野「書籍」に対応する評価表現には「面白い」、「名作」、「読みにくい」、「分かりやすい」があり、商品分野「コンピュータ」に対応する評価表現には「速い」、「重い」、「壊れやすい」、「うるさい」、「不安定」があり、商品分野「食品」に対応する評価表現には「美味い」、「不味い」、「しつこい」がある。 The evaluation expression stored in the evaluation expression storage unit 221 is an expression indicating an evaluation of things. An example of the evaluation expression relating to the product is shown in FIG. In FIG. 3, the evaluation expressions corresponding to the product field “common” include “good”, “like”, “best”, “recommended”, and “satisfied”, and the evaluation expression corresponding to the product field “book” Has "interesting", "masterpiece", "difficult to read", "easy to understand", and evaluation expressions corresponding to the product field "computer" are "fast", "heavy", "fragile", "noisy" There are “unstable”, and the evaluation expressions corresponding to the product field “food” include “delicious”, “taste”, and “persistent”.

一方、「遊ぶ」、「動く」、「研究する」といった物事に対する評価を示さない表現は、評価表現ではない。また、評価表現の種類としては、「良い」、「好き」、「美味い」といった人の感情や感情を示す表現と、「速い」、「重い」といった人の物における性質や特徴を示す表現とがある。評価表現の記憶形式は、各評価表現の活用による表記の違いを吸収する単位で記憶する方式が記憶容量節約の面で効果的であるが、この方式に限定されるものではない。 On the other hand, expressions that do not indicate evaluation for things such as “play”, “move”, and “research” are not evaluation expressions. In addition, the types of evaluation expressions include expressions indicating human feelings and feelings such as “good”, “like” and “delicious”, and expressions indicating characteristics and characteristics of human objects such as “fast” and “heavy”. There is. As a storage format of evaluation expressions, a method of storing in a unit that absorbs a difference in notation due to utilization of each evaluation expression is effective in terms of saving storage capacity, but is not limited to this method.

意見候補抽出手段222において対象物と評価表現とが一定の関係にある場合とは、例えば対象物と評価表現とが一定の文字数またはバイト数にある場合や、対象物と評価表現に構文的依存関係がある場合である。 The case where the object and the evaluation expression are in a certain relationship in the opinion candidate extraction means 222 is, for example, a case where the object and the evaluation expression are in a certain number of characters or bytes, or syntactic dependence on the object and the evaluation expression. This is the case.

意見判定手段223において意見と認められるかを判定する方法には、構文的適性判定手段223aによる意見候補の構文的な意見らしさの判定する方法と、客観的適性判定手段223bによる意見候補が客観的であるかを判定する方法とがある。 There are two methods for determining whether an opinion is recognized as an opinion in the opinion determination unit 223: a method for determining the syntactic opinion likelihood of an opinion candidate by the syntactic aptitude determination unit 223a, and an opinion candidate by the objective aptitude determination unit 223b are objective. There is a method for determining whether or not.

構文的適性判定手段223aにおける意見候補の構文的意見らしさは、図4に示すような意見が持つ構文的特性を用いて判定する。図4において、意見の構文的特性には、「(1)対象物名と評価表現とが同一文内に存在する」、「(2)対象物名が評価表現の主部に存在する」、「(3)評価表現が文の述部に存在する」、「(4)文の述部に不必要な文末表現が存在しない」がある。 The syntactic opinion likelihood of the opinion candidate in the syntactic aptitude determination means 223a is determined using the syntactic characteristics of the opinion as shown in FIG. In FIG. 4, the syntactic characteristics of the opinion include “(1) the object name and the evaluation expression exist in the same sentence”, “(2) the object name exists in the main part of the evaluation expression”, There are “(3) an evaluation expression exists in a statement predicate” and “(4) an unnecessary sentence ending expression does not exist in the statement predicate”.

尚、(4)の不必要な文末表現とは、例えば、『商品「M」は良いの?』のような疑問表現、『商品「M」はもう少し軽いとよいのに』のような仮定表現が考えられる。 The unnecessary sentence ending expression (4) is, for example, “Is the product“ M ”good? Or a hypothetical expression such as “I wish the product“ M ”should be a little lighter”.

構文的適正判定手段223aは上記のような意見の構文的特性を、意見候補がどの程度満たすかを数値にし、その数値が予め定めた閾値を超える場合には、構文的に意見らしいと判定する。数値にする方法としては、例えば、意見候補が全構文的特性数に対して満たす構文的特性の数の割合とする方法が考えられる。また、各構文的特性に重みを付与して、意見候補が満たす構文的特性の重みの総和とする方法も考えられる。 The syntactic appropriateness determining means 223a takes the syntactical characteristics of the opinion as described above as a numerical value indicating how much the opinion candidate satisfies, and if the numerical value exceeds a predetermined threshold value, the syntactic appropriateness determining means 223a determines that the opinion is syntactically likely . As a method of making a numerical value, for example, a method of considering the ratio of the number of syntactic characteristics that the opinion candidate satisfies to the total number of syntactic characteristics is conceivable. A method is also conceivable in which a weight is assigned to each syntactic characteristic and the sum of the syntactic characteristic weights satisfied by the opinion candidates is obtained.

客観的適性判定手段223bにおいて意見候補が客観的であるとは、意見が第3者によって記述されていることをいう。例えば、『商品「M」はお勧めです』が意見候補である場合を考えると、この意見候補は構文的適正判定手段223aにおける4つの構文的特性を全て満たすので、構文的に意見らしいと判定される。しかしながら、この意見候補が『商品「M」』の開発者または『商品「M」』の販売者によって記述されている場合には、意見として信頼することができない。 In the objective aptitude determination means 223b, the opinion candidate is objective means that the opinion is described by a third party. For example, considering that “product“ M ”is recommended” is an opinion candidate, this opinion candidate satisfies all of the four syntactic characteristics in the syntactic appropriateness determination means 223a, so that it is determined to be syntactically an opinion. The However, if this opinion candidate is described by the developer of “product“ M ”” or the seller of “product“ M ””, it cannot be trusted as an opinion.

客観的適正判定手段223bはこのような第3者とは認められない記述者のリストを用意し、意見候補の記述者がこのリストに一致もしくは部分一致を含む場合には意見候補が客観的でないと判定し、そうでない場合には意見候補が客観的であると判定する。このリストは文書がインタネット上の文書であればURL(UniformResourceLocator)で表すことができ、コンピュータの分野のURLリストの例を図5に示す。 The objective suitability determination means 223b prepares a list of writers who are not recognized as such third parties, and the opinion candidates are not objective when the writers of opinion candidates include matches or partial matches in this list Otherwise, it is determined that the opinion candidate is objective. If the document is a document on the Internet, this list can be represented by a URL (Uniform Resource Locator), and FIG. 5 shows an example of a URL list in the field of computers.

図5において、上記のリストには「So社」のURLとして「soo.co.jp」、「Ib社」のURLとして「ibb.co.jp」、「T社」のURLとして「ttt.co.jp」、「N社」のURLとして「nnn.co.jp」、「A社」のURLとして「aaa.co.jp」、「Sh社」のURLとして「shh.co.jp」、「C社」のURLとして「ccc.co.jp」、「F社」のURLとして「fff.co.jp」、「Io社」のURLとして「ioo.co.jp」、「J社」のURLとして「jjj.co.jp」」がそれぞれ掲載されている。 5, the above list includes “so.co.jp” as the URL of “So Company”, “ibb.co.jp” as the URL of “Ib Company”, and “tt.co” as the URL of “T Company”. .Jp "," Nnn.co.jp "as the URL of" N Company "," aaa.co.jp "as the URL of" Company A "," sh.co.jp "," URL of "Sh Company" “Ccc.co.jp” as the URL of “Company C”, “fff.co.jp” as the URL of “Company F”, “io.co.jp” as the URL of “Io Company”, URL of “J Company” As “jjj.co.jp”.

図6は本発明の第1の実施例による意見収集分析装置の処理動作を示すフローチャートであり、図7は図6の意見抽出の処理動作を示すフローチャートである。これら図1〜図7を参照して本発明の第1の実施例による意見収集分析装置の処理動作について説明する。尚、図6及び図7に示す処理はデータ処理装置2が記録媒体24に格納されたプログラムを実行することで実現される。 6 is a flowchart showing the processing operation of the opinion collection / analysis apparatus according to the first embodiment of the present invention, and FIG. 7 is a flowchart showing the processing operation of opinion extraction in FIG. The processing operation of the opinion collection / analysis apparatus according to the first embodiment of the present invention will be described with reference to FIGS. 6 and 7 is realized by the data processing apparatus 2 executing a program stored in the recording medium 24.

まず、利用者は意見収集分析装置に対して、対象物名集合入力手段11から対象物名の集合を、対象物名選択手段12から分析対象の対象物名を選択する(図6ステップS1)。ここでは、対象物名集合入力手段11で『商品「M」』、『商品「K」』、『商品「S」』、『商品「R」』を入力し、対象物名選択手段12で『商品「M」』を選択した場合について説明する。 First, the user selects a set of object names from the object name set input means 11 and an object name to be analyzed from the object name selection means 12 to the opinion collection / analysis apparatus (step S1 in FIG. 6). . Here, “product“ M ””, “product“ K ””, “product“ S ”” and “product“ R ”” are input by the object name set input unit 11, and “object“ R ”is input by the object name selection unit 12. A case where the product “M” is selected will be described.

次に、意見抽出手段22によって文書集合記憶部21に記憶された文書集合に含まれる対象物名集合入力手段11で入力された対象物名に関連する意見を抽出する(図6ステップS2)。 Next, an opinion related to the object name input by the object name set input unit 11 included in the document set stored in the document set storage unit 21 is extracted by the opinion extraction unit 22 (step S2 in FIG. 6).

この意見抽出処理は意見候補抽出手段222によって物事に対する評価を示す表現である評価表現の集合が登録された評価表現記憶部221と、入力された対象物と評価表現記憶部221に記憶された評価表現とが一定の関係にある場合には、対象物と評価表現とを含む文字列または文章を意見候補として抽出する処理(図7ステップS11)と、意見判定手段223によって意見候補抽出手段222で抽出された意見候補の意見らしさを判定する処理(図7ステップS12)とからなる。 This opinion extraction process is performed by the opinion candidate extraction unit 222 in which an evaluation expression storage unit 221 in which a set of evaluation expressions that are expressions indicating evaluation of things is registered, and the input object and the evaluation expression stored in the evaluation expression storage unit 221. When the expression has a certain relationship, a process of extracting a character string or a sentence including the object and the evaluation expression as an opinion candidate (step S11 in FIG. 7), and the opinion determination means 223 causes the opinion candidate extraction means 222 to And processing for determining the likelihood of opinion of the extracted opinion candidate (step S12 in FIG. 7).

上記の意見抽出処理によって抽出した意見の例を図8に示す。この例では、まず意見候補抽出手段222における対象物名と評価表現との一定の関係を、両者が80Byte以内という条件として意見候補を抽出し、その後、意見判定手段223によって意見の構文的適性、客観的適正を判定した結果である。 An example of the opinion extracted by the above opinion extraction process is shown in FIG. In this example, an opinion candidate is first extracted based on a certain relationship between the object name and the evaluation expression in the opinion candidate extraction unit 222 as a condition that both are within 80 bytes, and then the syntactic aptitude of the opinion by the opinion determination unit 223, It is the result of determining objective suitability.

構文的特性については、上記の4つの特性のうち3つ以上満たすことを条件としている。例えば、図8の1行目は、対象物名商品「M」、評価表現名「いい」で抽出された意見であり、4つの意見の構文的特性も全て満たしている。 The syntactic characteristics are conditional on satisfying at least three of the above four characteristics. For example, the first line of FIG. 8 is an opinion extracted with the object name product “M” and the evaluation expression name “good”, and all the syntactic characteristics of the four opinions are also satisfied.

次に、意見収集分析装置は対象物比較分析手段23によって意見抽出手段22で抽出した対象物名集合入力手段11で入力された対象物名に関する意見(全体の意見)に対する、その中で対象物名選択手段12で選択した対象物名に関する意見(部分の意見)の特徴を分析し、その結果を出力手段13を介して出力する(図6ステップS3)。 Next, the opinion collecting / analyzing apparatus applies the object regarding the opinion (the entire opinion) about the object name input by the object name set input means 11 extracted by the opinion extracting means 22 by the object comparison analyzing means 23. The feature of the opinion (partial opinion) regarding the object name selected by the name selection means 12 is analyzed, and the result is output via the output means 13 (step S3 in FIG. 6).

すなわち、対象物とこれに関する意見とのペアの複数個を入力として、例えば、1)分類ルール、2)相関ルール、3)ポジショニングマップ、4)典型文リストの4つの比較分析結果のうちの1つを出力する。 That is, by inputting a plurality of pairs of an object and an opinion related thereto, for example, 1) a classification rule, 2) a correlation rule, 3) a positioning map, 4) one of four comparative analysis results of a typical sentence list Output one.

1)の分類ルールとは、if−then−else形式で意見と対象物の関係を表したものである。例えば、図9に示すように、OS「D」→商品「M」(70%)、モノクロ→商品「M」(70%)、電子メール→商品「M」(100%)、ワープロ→商品「M」(100%)、送信→商品「M」(90%)、それ以外→商品「M」でない(78.9%)は『もしOS「D」という単語が意見中に現れれば、その意見は商品「M」に関するものであり、そうでなければ、もしモノクロという単語が意見中に現れれば、その意見は商品「M」に関するものであり』と読む。 The classification rule 1) expresses the relationship between opinions and objects in an if-then-else format. For example, as shown in FIG. 9, OS “D” → product “M” (70%), monochrome → product “M” (70%), e-mail → product “M” (100%), word processor → product “ “M” (100%), transmission → product “M” (90%), otherwise → product “M” (78.9%) is “if the word“ OS ”D” appears in the opinion Is related to the product “M”, otherwise, if the word “monochrome” appears in the opinion, the opinion is related to the product “M” ”.

ここで、上記の場合には『OS「D」』、「モノクロ」等が商品「M」という対象物に関する特徴語である。これらの特徴語は、その上位の言葉が現れた意見を全て全体から取り除いた意見の集合に出現した単語の中から情報量尺度の高い順に選ばれる。 Here, in the above case, “OS“ D ””, “monochrome”, and the like are characteristic words related to the object “M”. These feature words are selected in descending order of the information amount scale from words appearing in a set of opinions obtained by removing all opinions in which the upper words appear from the whole.

また、情報量尺度とは次のように計算する。例えば、意見の数がN個あって、対象物がAのものとA以外のものとがそれぞれN1個とN0個であったとし、単語または単語の組合わせである「w」が現れる意見の数がT、その中で対象物がAのものとA以外のものとがそれぞれT1個とT0個であったとし、単語「w」が現れない意見の数がS、その中で対象物がAのものとA以外のものとがそれぞれS1個とS0個であったとすると、T+S=N,T1+S1=N1,T0+S0=N0の関係があり、「w」のもつ情報量尺度は、例えば、「w」の出現を通じて分類する前に意見の集合がもっていた情報量Iから「w」の出現を通じて分類した後の意見の集合がもっていた情報量I(w)を引いた値として、つまり、ΔI(w)=I−I(w)……(1)という式で計算される。 The information amount scale is calculated as follows. For example, if there are N opinions, and there are N1 and N0 objects for the object A and those other than A, respectively, the word or word combination “w” appears. Suppose that the number is T, among which there are T1 and T0 objects A and other than A, respectively, and the number of opinions in which the word “w” does not appear is S, among which the object is If there are S1 and S0 for A and other than A, there is a relationship of T + S = N, T1 + S1 = N1, T0 + S0 = N0, and the information scale of “w” is, for example, “ As the value obtained by subtracting the amount of information I (w) held in the opinion set after classification through the appearance of “w” from the information amount I in the opinion set before classification through the appearance of “w”, that is, ΔI (W) = I−I (w)... (1)

ここで、Iは例えば、文献「J.Rissanen:FisherInformationandStochasticComplexity.IEEETrans.onInformationTheory,42(1),pp:40−47,1996」で提案されている確率的コンプレキシテイ(stochasticcomplexity)という量を用いて、I=N・H(N1/N)+(1/2)log[N(π/2)]……(2)という式で計算することができる。また、H(x)=[(−x)log(x)]−[(1−x)log(1−x)]であり、πは円周率、対数の底は2である。 Here, I uses, for example, a stochastic complexity amount proposed by the document “J. Rissanen: FisherInformation and StochasticComplexity. IEEE Etrans. OnInformationTheory, 42 (1), pp: 40-47, 1996”. , I = N · H (N1 / N) + (1/2) log [N (π / 2)] (2). Further, H (x) = [(− x) log (x)] − [(1−x) log (1−x)], π is the circumference, and the base of the logarithm is 2.

同様に、I(w)は、I(w)=T・H(T1/T)+(1/2)log[T(π/2)]+S・H(S1/S)+(1/2)log[S(π/2)]……(3)という式で計算される。ΔI(w)が最も大きい値をもつような「w」が選ばれる。 Similarly, I (w) is I (w) = T · H (T1 / T) + (1/2) log [T (π / 2)] + S · H (S1 / S) + (1/2 ) Log [S (π / 2)] (3). “W” is selected such that ΔI (w) has the largest value.

また、確率的コンプレキシティの代わりに、例えば、文献「K.Yamanishi:ADecision−theoreticExtensionofStochasticComplexityandItsApplicationstoLearning,IEEETrans.onInformationTheory,44(4),pp:1424−1439,1998」で提案されている拡張型確率的コンプレキシティを用いて、I=min{N1,N−N1}+B√NlogN……(4)I(w)=min{T1,T−T1}+B√TlogT+min{S1,S−S1}+B√SlogS……(5)という式で計算してから、情報量尺度を、ΔI(w)=I−I(w)……(6)という式で計算することもできる。 Also, instead of stochastic complexity, for example, the document “K. I = min {N1, N−N1} + B√NlogN (4) I (w) = min {T1, T−T1} + B√TlogT + min {S1, S−S1} + B√SlogS .. (5), and then the information scale can be calculated by the equation: ΔI (w) = I−I (w) (6).

このような分類ルールを出力する対象物比較分析手段23としては、図10に示すように、形態素解析手段231と属性抽出手段232と情報量尺度計算手段233とからなる。 As shown in FIG. 10, the object comparison / analysis unit 23 that outputs such a classification rule includes a morpheme analysis unit 231, an attribute extraction unit 232, and an information amount scale calculation unit 233.

形態素解析手段231は意見の文章を単語に分解する。例えば、「形態素解析手段は意見の文章を単語に分解する」は「形態素/解析/手段/は/意見/の/文章/を/単語/に/分解する」と分解される。 The morpheme analyzing means 231 breaks down the opinion sentence into words. For example, “the morpheme analyzing means decomposes the sentence of opinion into words” is decomposed into “morpheme / analysis / means / has / opinion / of / sentence / decomposed into / word / decomposed”.

属性抽出手段232は形態素解析によって得られた各単語wについて(1)式の値を計算して、その値が与えられたある閾値以上のものだけを選択する。情報量尺度計算手段233は単語または単語の複数の組合わせに対して、全体の意見集合を対象にして(1)式の値を計算し、最大のものを選ぶ。 The attribute extraction means 232 calculates the value of the expression (1) for each word w obtained by morphological analysis, and selects only those whose values are greater than a given threshold. The information amount scale calculation means 233 calculates the value of equation (1) for the entire opinion set for a word or a plurality of combinations of words, and selects the largest one.

選ばれた単語を含む意見を全体から取り除いて、残りの意見を対象として、単語または単語の複数の組合わせに対して、(1)式の値を計算し、その値から最大のものを選ぶ。以下、これを繰り返す。 The opinion including the selected word is removed from the whole, and the value of the formula (1) is calculated for the word or a plurality of combinations of words for the remaining opinions, and the maximum value is selected from the values. . This is repeated below.

2)の相関ルールは、if−then−or形式で意見と対象物の関係を表したものである。例えば、上記の分類ルールと同じ図は相関ルールとして読むこともできる。その場合、『もしOS「D」という単語が意見中に現れれば、その意見は商品「M」に関するものであり、または、もしモノクロという単語が意見中に現れれば、その意見は商品「M」に関するものであり』と読む。 The association rule 2) represents the relationship between an opinion and an object in an if-then-or format. For example, the same figure as the above classification rule can be read as a correlation rule. In that case, “If the word OS“ D ”appears in the opinion, the opinion relates to the product“ M ”, or if the word“ monochrome ”appears in the opinion, the opinion is the product“ M ”. And read.

ここで、上記の場合には『OS「D」』、「モノクロ」等が商品「M」という対象物に関する特徴語である。これら特徴語は全体の意見の集合に出現した単語の中から(1)式の情報量尺度Δ(w)の大きい順に選ばれる。 Here, in the above case, “OS“ D ””, “monochrome”, and the like are characteristic words related to the object “M”. These feature words are selected from the words appearing in the entire opinion set in descending order of the information amount scale Δ (w) in the equation (1).

このような相関ルールを出力する対象物比較分析手段23としては、図11に示すように、形態素解析手段234と属性抽出手段235と情報量尺度計算手段236とからなる。 As shown in FIG. 11, the object comparison / analysis means 23 that outputs such an association rule includes a morpheme analysis means 234, an attribute extraction means 235, and an information amount scale calculation means 236.

形態素解析手段234は意見の文章を単語に分解する。属性抽出手段235は形態素解析によって得られた各単語「w」について(1)式の値を計算し、その値が与えられたある閾値以上のものだけを選択する。 The morpheme analyzing means 234 breaks the sentence of opinion into words. The attribute extraction means 235 calculates the value of the expression (1) for each word “w” obtained by morphological analysis, and selects only those values that are greater than a given threshold value.

情報量尺度計算手段236は単語または単語の複数の組合わせに対して、全体の意見集合を対象にして(1)式の値を計算し、その値を最大のものから順に並べていく。 The information amount scale calculation means 236 calculates the value of the expression (1) for the entire opinion set for a word or a plurality of combinations of words, and arranges the values in order from the largest.

3)のポジショニングマップは、複数の対象物と、それらに関する特徴語とを2次元のマップ図に配置したものである。例えば、図12は商品「M」、商品「K」、商品「S」、商品「R」といった複数の対象物と、2)の相関ルール等で計算された、それらの特徴語とからなるポジショニングマップを表している。具体的には、図12に示す×印はそれぞれ、商品「M」、商品「K」、商品「S」、商品「R」の軸上での位置を示し、商品「M」に対する特徴語として「パス」・「突き止める」・「送信」が、商品「K」に対する特徴語として「デビュー」・「FIVA」・「MD」・「意外」・「残念」が、商品「S」に対する特徴語として『商品「J」』・『商品「C」』・「メモリカード」が、商品「R」に対する特徴語として「フロッピー(R)」・「熱」・『CPU「P」』が軸上のそれぞれの位置関係で存在することを示している。 The positioning map 3) is obtained by arranging a plurality of objects and feature words related to them in a two-dimensional map diagram. For example, FIG. 12 shows a positioning made up of a plurality of objects such as a product “M”, a product “K”, a product “S”, and a product “R”, and feature words calculated by the correlation rule of 2). Represents a map. Specifically, the crosses shown in FIG. 12 indicate the positions on the axes of the product “M”, the product “K”, the product “S”, and the product “R”, and are used as feature words for the product “M”. “Pass”, “Find”, and “Send” are the characteristic words for the product “K”. “Debut”, “FIVA”, “MD”, “Unexpected”, and “Sorry” are the characteristic words for the product “S”. "Product" J "", "Product" C "", "Memory card" are the characteristic words for the product "R", "Floppy (R)", "Heat", "CPU" P "" It shows that it exists in the positional relationship.

このようなポジショニングマップは、ひとたび対象物とそれらの特徴語が得られたら、文献「J.P.Benzecri:CorrespondenceAnalysisHandbook,MercelDekker,1992」にも記載されているような標準的なコレスポンデンス分析の方法にしたがって作成される。 Once such objects and their characteristic words have been obtained, such a positioning map is applied to a standard correspondence analysis method as described in the document “JP Benzecri: Correspondence Analysis Handbook, MercelDecker, 1992”. Therefore created.

すなわち、分析対象となる対象物全体にわたって特徴語の頻度を並べたマトリックスに適当な対称化をほどこして得られたマトリックスから、最大固有値に対応する固有ベクトルと、二番目に大きい固有値に対応する固有ベクトルとを算出し、これらの第一成分、第二成分を縦軸、横軸としてプロットして得られる。 That is, an eigenvector corresponding to the largest eigenvalue and an eigenvector corresponding to the second largest eigenvalue are obtained from a matrix obtained by appropriately symmetrizing a matrix in which the frequency of feature words is arranged over the entire object to be analyzed. And plotting the first component and the second component on the vertical axis and the horizontal axis.

このようなポジショニングマップを出力する対象物比較分析手段23としては、図13に示すように、形態素解析手段237と属性抽出手段238と情報量尺度計算手段239と対応分析手段240とからなる。 As shown in FIG. 13, the object comparison analysis unit 23 that outputs such a positioning map includes a morpheme analysis unit 237, an attribute extraction unit 238, an information amount scale calculation unit 239, and a correspondence analysis unit 240.

形態素解析手段237は意見の文章を単語に分解する。属性抽出手段238は形態素解析によって得られた各単語「w」について(1)式の値を計算し、その値が与えられたある閾値以上のものだけを選択する。 The morpheme analyzing means 237 breaks down the opinion sentence into words. The attribute extraction means 238 calculates the value of the expression (1) for each word “w” obtained by morphological analysis, and selects only those values that are greater than a given threshold value.

情報量尺度計算手段239は単語または単語の複数の組合わせに対して、全体の意見集合を対象にして(1)式の値を計算し、その値を最大のものから順に与えられた数だけ、あるいは与えられた閾値以上の情報量尺度をもつ単語を抽出する。 The information amount scale calculation means 239 calculates the value of the expression (1) for the entire opinion set for a word or a plurality of combinations of words, and the value is the number given in order from the largest. Or, a word having an information amount scale equal to or greater than a given threshold is extracted.

対応分析手段240は抽出された単語と分析対象との対応マトリックスを作り、その要素は各単語の出現頻度であるとし、この行列の第一固有ベクトル及び第二固有ベクトルの第一成分及び第二成分を求めてプロットすることによってポジショニングマップを作成する。 The correspondence analysis unit 240 creates a correspondence matrix between the extracted words and the analysis target, and the element is the appearance frequency of each word, and the first component and the second component of the first eigenvector and the second eigenvector of this matrix are used. Create a positioning map by finding and plotting.

4)の典型文リストは各対象物に対して、各意見の代表度(対象物の意見として典型的である度合い)を計算し、その値を代表度の大きい降順にソートしたものである。 The typical sentence list of 4) calculates the representative level of each opinion (degree that is typical as the opinion of the target object) for each object, and sorts the values in descending order of the representative level.

商品「M」を対象物とする場合については、例えば、1.商品「M」は使いにくい、遅い2.商品「M」は大きくなってしまった、小さいほうがよい3.この商品「M」、気に入った、マーベラスである4.この商品「M」の弱点は暗いことだの順に並ぶ。 In the case where the product “M” is an object, for example: Product "M" is difficult to use and slow 2. 2. Product “M” has become larger, smaller is better This product "M" is my favorite Marvelous. The weak points of this product “M” are arranged in order of darkness.

文章Bの対象物cにおける代表度合いは、例えば、文章B=w1,....,wMのように、単語の列として見なすと、ベイズの事後確率は、p(c|B)=p(c)(Πjp(wj|c))/(Σcp(c)(Πjp(wj|c)))……(7)という式で与えられる。 The representative degree of the sentence B in the object c is, for example, the sentence B = w1,. . . . , WM, Bayes' posterior probability is p (c | B) = p (c) (Πjp (wj | c)) / (Σcp (c) (Πjp (wj | c) ))) ...... It is given by the equation (7).

ここで、p(c)は対象物cの出現確率であり、データから、p(c)=(Nc+1/2)/(N+J/2)……(8)という式で計算される。ここで、Jは対象物の総数、Nは意見の総数、Ncはその中で対象物cの出現数である。 Here, p (c) is the appearance probability of the object c, and is calculated from the data by the following equation: p (c) = (Nc + 1/2) / (N + J / 2) (8). Here, J is the total number of objects, N is the total number of opinions, and Nc is the number of appearances of the object c therein.

また、p(wj|c)は単語wjが出現する確率であり、これはラプラス型の推定量、p(wj|c)=(Kj+1/2)/(K+J/2)……(9)という式で計算される。ここで、Jは単語総数、Kは意見データに現れた全ての単語の総数であり、重複を含めて計算している。Kjはその中の単語wjの出現数である。 Further, p (wj | c) is a probability that the word wj appears, and this is a Laplace-type estimation amount, p (wj | c) = (Kj + 1/2) / (K + J / 2) (9) Calculated by the formula. Here, J is the total number of words, K is the total number of all words appearing in the opinion data, and is calculated including duplication. Kj is the number of occurrences of the word wj in it.

このような典型文リストを出力する対象物比較分析手段23としては、図14に示すように、形態素解析手段241と属性抽出手段242と代表度計算手段243とソート手段244とからなる。 As shown in FIG. 14, the object comparison analysis unit 23 that outputs such a typical sentence list includes a morpheme analysis unit 241, an attribute extraction unit 242, a representative degree calculation unit 243, and a sort unit 244.

形態素解析手段241は意見の文章を単語に分解する。属性抽出手段242は形態素解析によって得られた各単語wについて(1)式の値を計算し、その値が与えられたある閾値以上のものだけを選択する。 The morpheme analyzing means 241 breaks down the opinion sentence into words. The attribute extraction unit 242 calculates the value of the expression (1) for each word w obtained by morphological analysis, and selects only those values that are greater than a given threshold value.

代表度計算手段243は上記の形態素解析手段241で選ばれた単語全体に対して、各意見文章Bについて(7)式の値を計算する。ソート手段244はそれらの意見文章を(7)式の値にしたがって降順あるいは昇順にソートした結果を出力する。 The representative degree calculating unit 243 calculates the value of the expression (7) for each opinion sentence B with respect to the whole word selected by the morpheme analyzing unit 241. The sorting means 244 outputs the result of sorting the opinion sentences in descending order or ascending order according to the value of equation (7).

図15は本発明の第2の実施例による意見収集分析装置の構成を示すブロック図である。図15において、本発明の第2の実施例による意見収集分析装置は、入出力装置3に対象物名集合入力手段11の代わりとして利用者が一つ以上の対象物名を入力する対象物名入力手段31を設け、データ処理装置4に対象物名入力手段31で入力された対象物名を基にそれに関連する対象物名を展開する対象物名拡張手段41を設けた以外は本発明の第1の実施例による意見収集分析装置と同様の構成となっており、同一構成要素には同一符号を付してある。また、同一構成要素の動作は本発明の第1の実施例と同様である。 FIG. 15 is a block diagram showing the configuration of the opinion collection / analysis apparatus according to the second embodiment of the present invention. In FIG. 15, the opinion collection / analysis apparatus according to the second embodiment of the present invention is an object name in which a user inputs one or more object names to the input / output device 3 instead of the object name set input means 11. Except for providing the input means 31 and providing the data processing device 4 with the object name expansion means 41 for expanding the object name related to the object name input by the object name input means 31. The configuration is the same as that of the opinion collection and analysis apparatus according to the first embodiment, and the same components are denoted by the same reference numerals. The operation of the same component is the same as that of the first embodiment of the present invention.

対象物名拡張手段41は予め類似する対象物名同士をグループとして登録した辞書を用いて対象物名入力手段12で入力された対象物名を自動的に拡張する。例えば、『商品「M」』、『商品「K」』、『商品「S」』、『商品「R」』をグループとして登録し、対象物名入力手段12で『商品「M」』と入力された時に、『商品「K」』、『商品「S」』、『商品「R」』を拡張する。 The object name expanding unit 41 automatically expands the object name input by the object name input unit 12 using a dictionary in which similar object names are registered in advance as a group. For example, “product“ M ””, “product“ K ””, “product“ S ””, “product“ R ”” are registered as a group, and “product“ M ”” is input by the object name input means 12. “Product“ K ””, “Product“ S ””, and “Product“ R ”” are expanded.

尚、本発明の第2の実施例でも、データ処理装置4は主にコンピュータから構成され、記録媒体42に格納されたプログラムをデータ処理装置4が実行することで装置内の各手段が実現される。また、データ処理装置4の各手段はハードウェアで構成可能である。 In the second embodiment of the present invention, the data processing device 4 is mainly composed of a computer, and each means in the device is realized by the data processing device 4 executing the program stored in the recording medium 42. The Each means of the data processing device 4 can be configured by hardware.

図16は本発明の第3の実施例による意見収集分析装置の構成を示すブロック図である。図16において、本発明の第3の実施例による意見収集分析装置は入出力装置5と、データ処理装置6とから構成されている。 FIG. 16 is a block diagram showing the configuration of the opinion collection / analysis apparatus according to the third embodiment of the present invention. In FIG. 16, the opinion collection / analysis apparatus according to the third embodiment of the present invention comprises an input / output device 5 and a data processing device 6.

入出力装置5は利用者が一つ以上の対象物名を入力する対象物名入力手段31と、利用者が分析条件を入力する分析条件入力手段51と、比較分析手段62の分析結果を出力する出力手段13とから構成されている。 The input / output device 5 outputs the analysis result of the object name input means 31 for the user to input one or more object names, the analysis condition input means 51 for the user to input the analysis conditions, and the comparison analysis means 62. And output means 13 for performing the above operation.

また、データ処理装置6は主にコンピュータから構成され、文書集合を記憶する文書集合記憶部21と、文書集合記憶部21に記憶された文書集合に含まれかつ対象物名入力手段31から入力された対象物名に関連する意見を抽出する意見抽出手段22と、意見抽出手段22で抽出された意見に様々なカテゴリを設定するカテゴリ設定手段61と、意見抽出手段22で抽出されかつ対象物名入力手段31で入力された対象物名に関する意見(全体の意見)に対する、その中で分析条件入力手段51で指定された条件を満たす意見(部分の意見)の特徴を分析する比較分析手段62と、データ処理装置6の各手段を実現するためのプログラムを格納する記録媒体63とを備えている。尚、データ処理装置6の各手段はハードウェアで構成可能である。 The data processing device 6 is mainly composed of a computer, and is included in a document set storage unit 21 for storing the document set, and included in the document set stored in the document set storage unit 21 and input from the object name input unit 31. Opinion extraction means 22 for extracting opinions related to the object name, category setting means 61 for setting various categories for the opinions extracted by the opinion extraction means 22, and object names extracted by the opinion extraction means 22 Comparative analysis means 62 for analyzing the characteristics of opinions (partial opinions) that satisfy the conditions specified by the analysis condition input means 51 with respect to opinions (overall opinions) regarding the object name input by the input means 31; And a recording medium 63 for storing a program for realizing each means of the data processing device 6. Each means of the data processing device 6 can be configured by hardware.

カテゴリ設定手段61におけるカテゴリには、(a)対象物の機能のカテゴリ、(b)対象物の機種のカテゴリ、(c)意見の評価のカテゴリ、(d)意見の評価表現のカテゴリ、(e)意見の記述時刻のカテゴリ、(f)意見の記載場所のカテゴリがある。カテゴリを設定するとは、それぞれのカテゴリにラベルを付与することを意味する。 The categories in the category setting means 61 include (a) the function category of the object, (b) the model of the object model, (c) the opinion evaluation category, (d) the opinion evaluation expression category, (e There is a category of opinion description time, and (f) a category of opinion description location. Setting a category means giving a label to each category.

分析条件入力手段51における分析条件は、カテゴリとその意見のラベルとを指定することによって記述する。カテゴリとしては、カテゴリ設定手段61で設定される(a)〜(f)のカテゴリに加え、対象物名入力手段31で入力された対象物名も(g)対象物名のカテゴリとして扱う。例えば、分析条件として『対象物名=商品「M」&意見の評価=肯定』というように指定する。これは「対象物名のカテゴリ」のラベルが『商品「M」』でかつ「意見の評価のカテゴリ」のラベルが「肯定」である意見を分析対象とすることを意味する。 Analysis conditions in the analysis condition input means 51 are described by designating a category and a label of the opinion. As the category, in addition to the categories (a) to (f) set by the category setting means 61, the object name input by the object name input means 31 is also handled as the category of the object name (g). For example, the analysis condition is specified as “object name = product“ M ”& opinion evaluation = affirmation”. This means that an opinion in which the “object name category” label is “product“ M ”” and the “opinion evaluation category” label is “affirmed” is to be analyzed.

比較分析手段62における特徴は、ルール形式の知識として表現する。例えば、特開2001−266060号公報に記載された「アンケート回答分析システム」におけるテキスト分類エンジンを用いると、全体の意見に対する部分の意見の特徴をif−then−else型のルールによって学習することができる。 Features in the comparative analysis means 62 are expressed as knowledge of the rule format. For example, when the text classification engine in the “questionnaire answer analysis system” described in Japanese Patent Application Laid-Open No. 2001-266060 is used, it is possible to learn the characteristics of a part of the opinion with respect to the entire opinion by an if-then-else type rule. it can.

図17は本発明の第3の実施例による意見収集分析装置の処理動作を示すフローチャートであり、図18は図17のカテゴリ生成の処理動作を示すフローチャートである。これら図16〜図18を参照して本発明の第3の実施例による意見収集分析装置の処理動作について説明する。尚、図17及び図18に示す処理はデータ処理装置6が記録媒体63に格納されたプログラムを実行することで実現される。 FIG. 17 is a flowchart showing the processing operation of the opinion collection / analysis apparatus according to the third embodiment of the present invention, and FIG. 18 is a flowchart showing the processing operation of category generation in FIG. The processing operation of the opinion collection / analysis apparatus according to the third embodiment of the present invention will be described with reference to FIGS. Note that the processing shown in FIGS. 17 and 18 is realized by the data processing device 6 executing a program stored in the recording medium 63.

まず、利用者が対象物名入力手段31によって一つ以上の対象物名を入力すると(図17ステップS21)、意見抽出手段22は文書集合記憶部21に記憶された文書集合に含まれかつ対象物名入力手段31で入力された対象物名に関連する意見を抽出する(図17ステップS22)。 First, when the user inputs one or more object names using the object name input unit 31 (step S21 in FIG. 17), the opinion extraction unit 22 is included in the document set stored in the document set storage unit 21 and is the target. Opinions related to the object name input by the object name input means 31 are extracted (step S22 in FIG. 17).

次に、カテゴリ設定手段61は意見抽出手段22で抽出された意見に様々なカテゴリを設定する(図17ステップS23)。さらに、利用者は分析条件指定手段51によって分析条件を入力すると(図17ステップS24)、比較分析手段61は意見抽出手段22で抽出されかつ対象物名入力手段31で入力された対象物名に関する意見(全体の意見)に対する、その中で分析条件指定手段51で指定された条件を満たす意見(部分の意見)の特徴を分析する(図17ステップS25)。 Next, the category setting means 61 sets various categories for the opinions extracted by the opinion extraction means 22 (step S23 in FIG. 17). Further, when the user inputs the analysis condition by the analysis condition specifying means 51 (step S24 in FIG. 17), the comparative analysis means 61 relates to the object name extracted by the opinion extraction means 22 and input by the object name input means 31. The characteristics of opinions (partial opinions) that satisfy the conditions specified by the analysis condition specifying means 51 are analyzed for the opinions (total opinions) (step S25 in FIG. 17).

尚、上記のカテゴリ設定処理の具体的な動作としては、本発明の第1の実施例による意見収集分析装置のステップS3の動作において、「対象物」を「カテゴリ」と読み替えた場合の動作と同様である。 The specific operation of the above category setting process is an operation when “object” is replaced with “category” in the operation of step S3 of the opinion collection and analysis apparatus according to the first embodiment of the present invention. It is the same.

カテゴリ設定手段61の動作は、まず用意された一つ以上のカテゴリの内の1つを選択する(図18ステップS31)。用意されたカテゴリとしては、(a)対象物の機能のカテゴリ、(b)対象物の機種のカテゴリ、(c)意見の評価のカテゴリ、(d)意見の評価表現のカテゴリ、(e)意見の記述時刻のカテゴリ、(f)意見の記載場所のカテゴリがある。 The operation of the category setting means 61 first selects one of one or more prepared categories (step S31 in FIG. 18). The prepared categories include (a) the function category of the object, (b) the category of the object model, (c) the opinion evaluation category, (d) the opinion evaluation expression category, and (e) the opinion. (F) The category of the place where the opinion is written.

(a)対象物の機能のカテゴリは、意見を対象物の機能という視点から分類する。対象物の機能とは、例えば対象物が携帯電話であれば「電話機能」、「充電機能」、「メール機能」、「カレンダ機能」、「電話帳機能」、「スケジュール管理機能」等が考えられる。 (A) The category of the function of the object classifies opinions from the viewpoint of the function of the object. For example, if the object is a mobile phone, the functions of the object may be “phone function”, “charging function”, “mail function”, “calendar function”, “phone book function”, “schedule management function”, etc. It is done.

(b)対象物の機種のカテゴリは、意見を対象物の機種という視点から分類する。対象物の機種とは、例えば商品名『商品「M」』が『商品「MII−550」』『商品「M−K1」』、企業名「N」が「Nソフトウェア」、「Nシステム建設」というように、入力された対象物名を含む下位の対象物名のことである。 (B) The category of the model of the object classifies opinions from the viewpoint of the model of the object. For example, the product name “product“ M ”” is “product“ MII-550 ”” “product“ M-K1 ””, the company name “N” is “N software”, and “N system construction”. Thus, it is a lower-order object name including the input object name.

(c)意見の評価のカテゴリは、意見をその評価という視点から分類する。意見の評価は意見の記述者がその対象物を肯定的に捉えているか、否定的に捉えているかを示すものである。したがって、「肯定」または「否定」という2つの値、あるいはそれらの度合いといった形式で表すことができる。 (C) The opinion evaluation category classifies opinions from the viewpoint of evaluation. Opinion evaluation indicates whether an opinion writer views the object positively or negatively. Therefore, it can be expressed in the form of two values “positive” or “negative” or their degree.

(d)意見の評価表現のカテゴリは、意見をその評価表現という視点から分類する。意見の評価表現とは、意見抽出手段22で用いた評価表現記憶部221に記憶される評価表現である。 (D) The category of opinion evaluation expression classifies opinions from the viewpoint of the evaluation expression. The evaluation expression of the opinion is an evaluation expression stored in the evaluation expression storage unit 221 used by the opinion extraction unit 22.

(e)意見の記述時刻のカテゴリは、意見をその記述時刻という視点から分類する。意見の記述時間とは、意見の記述者がその意見をいつ記述したかを示すものである。 (E) The opinion description time category classifies opinions from the viewpoint of the description time. Opinion writing time indicates when an opinion writer described the opinion.

(f)意見の記載場所のカテゴリは、意見をその記載場所という視点から分類する。意見の記載場所とは、意見の記述者がその意見をどのような場所で記述したかを示すものである。 (F) The category of the description location of the opinion is classified from the viewpoint of the description location. An opinion description location indicates where the opinion writer described the opinion.

次に、カテゴリ設定手段61は選択したカテゴリに対する意見のラベルを付与する(図18ステップS32)。意見のラベルを付与する方法は、選択したカテゴリによって異なる。 Next, the category setting means 61 gives an opinion label for the selected category (step S32 in FIG. 18). The method of assigning the opinion label depends on the selected category.

(a)対象物の機能のカテゴリの場合、意見のラベルを付与する方法としては、例えば機能を示す表現のリストを用意し、意見抽出部22で抽出した意見の中にその表現が含まれる場合には、その表現を意見のラベルとして付与する方法がありうる。機能を示す表現としては、例えば対象物が携帯電話ならば「電話」、「充電」、「メール」、「カレンダ」、「電話帳」、「スケジュール管理」等が考えられる。 (A) In the case of the function category of an object, as a method of assigning an opinion label, for example, a list of expressions indicating functions is prepared, and the expression is included in the opinions extracted by the opinion extraction unit 22 May have a method of giving the expression as a label of opinion. For example, if the object is a mobile phone, “phone”, “charge”, “mail”, “calendar”, “phone book”, “schedule management”, and the like can be considered as expressions indicating functions.

また、意見のラベルを付与する方法として、例えば上記の機能を示す表現を共起語を用いて自動的に収集する方法もありうる。共起語とは、例えば「機能」である。つまり、機能を示す表現は「○○機能」のように、共起語の前方に隣接する名詞やサ変名詞の連続として規則的に表現されることを利用して自動収集する。 In addition, as a method of assigning opinion labels, for example, there may be a method of automatically collecting expressions indicating the above functions using co-occurrence words. The co-occurrence word is, for example, “function”. In other words, the expression indicating the function is automatically collected by using a regular expression as a series of nouns and sagittal nouns adjacent to the front of the co-occurrence word, such as “XX function”.

(b)対象物の機種のカテゴリの場合、意見のラベルを付与する方法としては、例えば対象物名と機種名とを対応させたテーブルを用意する方法がある。この場合、対象物名入力手段31で入力された対象物名をキーとしてこのテーブルから機種名を展開し、次に、意見抽出部21で抽出された意見にこの機種名が含まれる場合には、その機種名を分類ラベルとして付与する。 (B) In the case of the category of the model of the object, as a method of assigning the opinion label, there is a method of preparing a table in which the object name and the model name are associated, for example. In this case, when the model name is expanded from this table using the target name input by the target name input means 31 as a key, and then the model name is included in the opinion extracted by the opinion extraction unit 21 The model name is assigned as a classification label.

対象物名と機種名との対応としては、例えば、「N社」→「Nソフト」・「Nシステム建設」、『商品「M」』→『商品「MII−R550」』・『商品「M−K1」』が該当する。 For example, “N company” → “N software”, “N system construction”, “product“ M ”” → “product“ MII-R550 ””, “product“ M ” −K1 ””.

(c)意見の評価のカテゴリの場合、意見のラベルを付与する方法としては、例えば評価表現とその基本評価とを対応させたテーブル(基本評価テーブル)と、否定表現のリスト(否定表現リスト)とを用いる方法がある。 (C) In the case of an opinion evaluation category, as a method of assigning an opinion label, for example, a table (basic evaluation table) in which an evaluation expression and its basic evaluation are associated with each other, and a negative expression list (negative expression list) There is a method of using.

この場合、まず、意見抽出部22で抽出された意見に含まれる評価表現から基本評価テーブルを用いて意見の基本評価を求める。次に、意見に含まれる評価表現の近傍に否定表現テーブルに含まれる否定表現が含まれる場合には、その基本評価を反転させた評価を意見のラベルとして付与する。逆に、否定表現が含まれない場合には、その基本評価を意見のラベルとして付与する。 In this case, first, the basic evaluation of the opinion is obtained from the evaluation expression included in the opinion extracted by the opinion extraction unit 22 using the basic evaluation table. Next, when a negative expression included in the negative expression table is included in the vicinity of the evaluation expression included in the opinion, an evaluation obtained by inverting the basic evaluation is given as an opinion label. Conversely, if a negative expression is not included, the basic evaluation is given as an opinion label.

ここで、基本評価テーブルにおける評価表現とその基本評価との対応として「良い」→「肯定」、「悪い」→「否定」、「速い」→「肯定」、「重い」→「否定」が該当する。また、否定表現としては、「ない」、「なかった」、「ません」のように文法によって述語を否定する文法的否定表現と、「不」、「疑問である」、「言いかねる」のように語彙によって述語を否定する語彙的否定表現とがあり、それらを登録する。 Here, “good” → “affirmation”, “bad” → “denial”, “fast” → “affirmation”, “heavy” → “denial” correspond to the evaluation expression in the basic evaluation table and the basic evaluation. To do. Also, as negative expressions, grammatical negative expressions that deny predicates by grammar, such as “not”, “not”, “not”, and “not”, “question”, “can't say” There are lexical negative expressions that negate predicates by vocabulary, and register them.

(d)意見の評価表現のカテゴリの場合、意見のラベルを付与する方法としては、例えば意見抽出手段22で抽出した意見に含まれる評価表現を分類ラベルとして付与する方法がある。 (D) In the case of opinion evaluation expression category, as a method of assigning an opinion label, for example, there is a method of assigning an evaluation expression included in an opinion extracted by the opinion extracting means 22 as a classification label.

(e)意見の記述時間に基づくカテゴリの場合、意見のラベルを付与する方法としては、例えば文書がインタネット上の文書であれば、意見抽出手段22で抽出した意見を含む文書の更新時刻を意見のラベルとして付与する方法がある。 (E) In the case of a category based on opinion description time, as a method of assigning an opinion label, for example, if the document is a document on the Internet, the update time of the document including the opinion extracted by the opinion extracting means 22 There is a method of giving as a label.

(f)意見の記載場所に基づくカテゴリの場合、意見のラベルを付与する方法としては、例えば文書がインタネット上の文書であれば、意見抽出手段22で抽出した意見を含む文書のURLを意見のラベルとして付与する方法がある。 (F) In the case of a category based on an opinion description location, as a method of assigning an opinion label, for example, if the document is a document on the Internet, the URL of the document containing the opinion extracted by the opinion extracting means 22 There is a method of giving as a label.

また、意見のラベルを付与する方法としては、例えば文書がインタネット上の文書であれば、意見抽出手段22で抽出した意見を含む文書のURLのドメインを意見のラベルとして付与する方法がある。 In addition, as a method of assigning an opinion label, for example, if the document is a document on the Internet, there is a method of assigning the URL domain of the document including the opinion extracted by the opinion extracting means 22 as an opinion label.

最後に、もし、まだ選択していないカテゴリがある場合には、ステップS31に戻り、すべてのカテゴリを選択している場合には処理を終了する(図18ステップS33)。 Finally, if there is a category that has not yet been selected, the process returns to step S31, and if all categories have been selected, the process ends (step S33 in FIG. 18).

このように、文書集合から複数の対象物名の意見を抽出することによって、抽出した意見全体に対する、その中で利用者が選択した対象物に関する意見の特徴を分析し、その結果を依頼者に提示することができる。 In this way, by extracting opinions of multiple object names from the document set, the characteristics of opinions regarding the object selected by the user in the extracted opinions are analyzed, and the results are sent to the client. Can be presented.

また、文書集合から抽出した意見候補の意見らしさを構文的適性もしくは客観的適性といった方法によって判定することによって、正確な意見抽出を実現し、それによって抽出した意見の高精度の分析結果を依頼者に提示することができる。 In addition, it is possible to extract accurate opinions by judging the likelihood of opinions extracted from a set of documents by a method such as syntactic aptitude or objective aptitude, and the requester can obtain a highly accurate analysis result of the extracted opinions. Can be presented.

さらに、文書集合から抽出した意見に様々なカテゴリを自動的に設定することによって、抽出した意見全体に対する、その中で利用者が選択したカテゴリに関する意見の特徴を分析し、その結果を依頼者に提示することができる。 Furthermore, by automatically setting various categories for the opinions extracted from the document set, the characteristics of the opinions related to the category selected by the user in the extracted opinions are analyzed, and the results are sent to the client. Can be presented.

本発明の第1の実施例による意見収集分析装置の構成を示すブロック図である。It is a block diagram which shows the structure of the opinion collection analyzer by 1st Example of this invention. 図1の意見抽出手段の構成例を示すブロック図である。It is a block diagram which shows the structural example of the opinion extraction means of FIG. 図2の評価表現辞書記憶部の内容例を示す図である。It is a figure which shows the example of the content of the evaluation expression dictionary memory | storage part of FIG. 図2の構文的適性判定手段における構文的特性の例を示す図である。It is a figure which shows the example of the syntactic characteristic in the syntactic aptitude determination means of FIG. 図2の客観的適性判定手段におけるURLリストの例を示す図である。It is a figure which shows the example of the URL list | wrist in the objective aptitude determination means of FIG. 本発明の第1の実施例による意見収集分析装置の処理動作を示すフローチャートである。It is a flowchart which shows the processing operation of the opinion collection analyzer by 1st Example of this invention. 図6の意見抽出の処理動作を示すフローチャートである。It is a flowchart which shows the processing operation of opinion extraction of FIG. 図1の意見抽出手段の出力例を示す図である。It is a figure which shows the example of an output of the opinion extraction means of FIG. 図1の対象物比較分析手段の分類ルールによる出力例を示す図である。It is a figure which shows the example output by the classification rule of the target object comparison analysis means of FIG. 図1の対象物比較分析手段の分類ルールによる構成例を示すブロック図である。It is a block diagram which shows the structural example by the classification rule of the target object comparison analysis means of FIG. 図1の対象物比較分析手段の相関ルールによる構成例を示すブロック図である。It is a block diagram which shows the structural example by the correlation rule of the target object comparison analysis means of FIG. 図1の対象物比較分析手段のポジショニングマップによる出力例を示す図である。It is a figure which shows the example of an output by the positioning map of the target object comparison analysis means of FIG. 図1の対象物比較分析手段のポジショニングマップによる構成例を示すブロック図である。It is a block diagram which shows the structural example by the positioning map of the target object comparison analysis means of FIG. 図1の対象物比較分析手段の典型文リストによる構成例を示すブロック図である。It is a block diagram which shows the structural example by the typical sentence list of the target object comparison analysis means of FIG. 本発明の第2の実施例による意見収集分析装置の構成を示すブロック図である。It is a block diagram which shows the structure of the opinion collection analyzer by 2nd Example of this invention. 本発明の第3の実施例による意見収集分析装置の構成を示すブロック図である。It is a block diagram which shows the structure of the opinion collection analyzer by the 3rd Example of this invention. 本発明の第3の実施例による意見収集分析装置の処理動作を示すフローチャートである。It is a flowchart which shows the processing operation of the opinion collection analyzer by 3rd Example of this invention. 図17のカテゴリ生成の処理動作を示すフローチャートである。It is a flowchart which shows the processing operation | movement of the category production | generation of FIG.

符号の説明Explanation of symbols

1,3,5入出力装置
2,4,6データ処理装置
11対象物名集合入力手段
12対象物名選択手段
13出力手段
21文書集合記憶部
22意見抽出手段
23対象物比較分析手段
24,42,63記録媒体
31対象物名入力手段
41対象物名拡張手段
51分析条件入力手段
61カテゴリ設定手段
62比較分析手段
221評価表現記憶部
222意見候補抽出手段
223意見判定手段
223a構文的適性判定手段
223b客観的適性判定手段
231,234,237,241形態素解析手段
232,235,238,242属性選択手段
233,236,239情報量尺度計算手段
240対応分析手段
243代表度分析手段
244ソート手段

1, 3, 5 I / O devices 2, 4, 6 Data processing device 11 Object name set input means 12 Object name selection means 13 Output means 21 Document set storage unit 22 Opinion extraction means 23 Object comparison analysis means 24, 42 , 63 Recording medium 31 Object name input means 41 Object name extension means 51 Analysis condition input means 61 Category setting means 62 Comparison analysis means 221 Evaluation expression storage section 222 Opinion candidate extraction means 223 Opinion determination means 223a Syntactic aptitude determination means 223b Objective aptitude determination means 231, 234, 237, 241 Morphological analysis means 232, 235, 238, 242 Attribute selection means 233, 236, 239 Information amount scale calculation means 240 Corresponding analysis means 243 Representativeness analysis means 244 Sort means

Claims (15)

複数の対象物名を入力するための対象物名集合入力手段と、
前記対象物名集合入力手段から入力された対象物名集合のうちの分析対象の対象物名を選択する対象物名選択手段と、
文書集合を記憶する文書集合記憶手段と、
物事に対する評価を示す表現である評価表現の集合が登録された評価表現記憶手段と、
前記文書集合記憶手段に格納された文書集合から、前記対象物名集合入力手段から入力されたそれぞれの対象物名と前記評価表現記憶手段に格納されている評価表現とを含む文字列又は文章を、それぞれの対象物名に関する意見として抽出する意見抽出手段と、
前記意見抽出手段で抽出された意見である全体の意見における、前記分析対象の対象物名に関する意見である部分の意見が占める確率を示す指標を、意見から抽出した単語又は単語の組合わせ毎に求め、前記指標に基づいて単語又は単語の複数の組合わせを選択して出力する対象物比較分析手段とを有することを特徴とする意見収集分析装置。
Object name set input means for inputting a plurality of object names;
Object name selection means for selecting an object name to be analyzed from the object name set input from the object name set input means;
Document set storage means for storing the document set;
An evaluation expression storage means in which a set of evaluation expressions, which are expressions indicating evaluations of things, are registered;
From a document set stored in the document set storage means, a character string or a sentence including each object name input from the object name set input means and an evaluation expression stored in the evaluation expression storage means , Opinion extraction means for extracting as opinions about each object name,
For each word or combination of words extracted from the opinion, an index indicating the probability that the opinion of the portion that is the opinion on the object name to be analyzed occupies in the overall opinion that is the opinion extracted by the opinion extracting means And an object comparison / analysis unit that selects and outputs a word or a plurality of combinations of words based on the index.
一つ以上の対象物名を入力するための対象物名入力手段と、
前記対象物名入力手段から入力された対象物名集合のうちの分析対象の対象物名を選択する対象物名選択手段と、
前記対象物名入力手段から入力された対象物名を基にそれに関連する対象物名を展開する対象物名拡張手段と、
文書集合を記憶する文書集合記憶手段と、
物事に対する評価を示す表現である評価表現の集合が登録された評価表現記憶手段と、
前記文書集合記憶手段に格納された文書集合から、前記対象物名集合入力手段から入力されたそれぞれの対象物名及び前記対象物名拡張手段で拡張された対象物名と前記評価表現記憶手段に格納されている評価表現とを含む文字列又は文章を、それぞれの対象物名に関する意見として抽出する意見抽出手段と、
前記意見抽出手段で抽出された意見である全体の意見における、前記対象物名選択手段で選択された対象物名及び前記対象物名拡張手段で拡張された対象物名に関する意見である部分の意見が占める確率を示す指標を、意見から抽出した単語又は単語の組合わせ毎に求め、前記指標に基づいて単語又は単語の複数の組合わせを選択して出力する対象物比較分析手段とを有することを特徴とする意見収集分析装置。
An object name input means for inputting one or more object names;
An object name selection means for selecting an object name to be analyzed from the object name set input from the object name input means;
An object name expanding means for expanding an object name related to the object name based on the object name input from the object name input means;
Document set storage means for storing the document set;
An evaluation expression storage means in which a set of evaluation expressions, which are expressions indicating evaluations of things, are registered;
From the document set stored in the document set storage means, each object name input from the object name set input means, the object name extended by the object name extension means, and the evaluation expression storage means An opinion extraction means for extracting a character string or a sentence including a stored evaluation expression as an opinion on each object name;
Opinions of portions that are opinions about the object name selected by the object name selecting means and the object name expanded by the object name expanding means in the entire opinion that is the opinion extracted by the opinion extracting means An object comparison analysis unit that obtains an index indicating the probability occupied by each word or combination of words extracted from the opinion, and selects and outputs a plurality of words or combinations of words based on the index An opinion collection and analysis device characterized by
一つ以上の対象物名を入力するための対象物名入力手段と、
分析条件を入力する分析条件入力手段と、
文書集合を記憶する文書集合記憶手段と、
物事に対する評価を示す表現である評価表現の集合が登録された評価表現記憶手段と、
前記文書集合記憶手段に格納された文書集合から、前記対象物名集合入力手段から入力されたそれぞれの対象物名と前記評価表現記憶手段に格納されている評価表現とを含む文字列又は文章を、それぞれの対象物名に関する意見として抽出する意見抽出手段と、
前記意見抽出手段で抽出された意見に、予め定められたカテゴリ毎に、前記意見の内容、記述時刻及び/又は記載場所に基づくラベルを設定するカテゴリ設定手段と、
前記意見抽出手段で抽出された意見である全体の意見における、前記分析条件入力手段から指定された条件を満たす意見である部分の意見が占める確率を占める指標を、意見から抽出した単語又は単語の組合わせ毎に求め、前記指標に基づいて単語又は単語の複数の組合わせを選択して出力する対象物比較分析手段とを有することを特徴とする意見収集分析装置。
An object name input means for inputting one or more object names;
An analysis condition input means for inputting an analysis condition;
Document set storage means for storing the document set;
An evaluation expression storage means in which a set of evaluation expressions, which are expressions indicating evaluations of things, are registered;
From a document set stored in the document set storage means, a character string or a sentence including each object name input from the object name set input means and an evaluation expression stored in the evaluation expression storage means , Opinion extraction means for extracting as opinions about each object name,
Category setting means for setting a label based on the content of the opinion, a description time and / or a description location for each predetermined category in the opinion extracted by the opinion extraction means;
An index that accounts for the probability that the opinion of the portion that is the opinion that satisfies the condition specified by the analysis condition input means in the entire opinion that is the opinion extracted by the opinion extraction means is the word or word extracted from the opinion And an object comparison / analysis unit which obtains each combination and selects and outputs a word or a plurality of combinations of words based on the index.
前記対象物比較分析手段は、確率的コンプレキシティを用いて前記指標を求める
ことを特徴とする請求項1から3いずれか1項に記載の意見収集分析装置。
4. The opinion collection and analysis apparatus according to claim 1, wherein the object comparison and analysis unit obtains the index using probabilistic complexity. 5.
前記対象物比較分析手段は、拡張型確率的コンプレキシティを用いて前記指標を求める
ことを特徴とする請求項1から3いずれか1項に記載の意見収集分析装置。
4. The opinion collection and analysis apparatus according to claim 1, wherein the object comparison and analysis unit obtains the index using extended probabilistic complexity. 5.
前記対象物比較分析手段は、ベイズの事後確率及びラプラス型の推定量を用いて前記指標を求める
ことを特徴とする請求項1から3いずれか1項に記載の意見収集分析装置。
4. The opinion collection and analysis apparatus according to claim 1, wherein the object comparison and analysis unit obtains the index using a Bayesian posterior probability and a Laplace-type estimation amount. 5.
複数の対象物名を入力するステップと、
その入力された対象物名集合のうちの分析対象の対象物名を選択するステップと、
文書集合を記憶する文書集合記憶手段に格納された文書集合から、前記対象物名を入力するステップで入力されたそれぞれの対象物名と物事に対する評価を示す表現である評価表現の集合が登録された評価表現記憶手段に格納されている評価表現とを含む文字列又は文章を、それぞれの対象物名に関する意見として抽出するステップと、
この抽出された意見である全体の意見における、前記分析対象の対象物名に関する意見である部分の意見が占める確率を示す指標を、意見から抽出した単語又は単語の組合わせ毎に求め、前記指標に基づいて単語又は単語の複数の組合わせを選択して出力するステップと、
を有することを特徴とする意見収集分析方法。
Entering multiple feature names;
Selecting an analysis target name from the input feature name set;
A set of evaluation expressions, which are expressions indicating evaluations for each object name and things input in the step of inputting the object name, are registered from the document set stored in the document set storage means for storing the document set. Extracting a character string or a sentence including an evaluation expression stored in the evaluation expression storage means as an opinion on each object name;
An index indicating the probability that the opinion of the portion that is the opinion on the object name to be analyzed in the entire opinion that is the extracted opinion is occupied is obtained for each word or combination of words extracted from the opinion, and the index Selecting and outputting a word or multiple combinations of words based on:
An opinion collection and analysis method characterized by comprising:
一つ以上の対象物名を入力するステップと、
その入力された対象物名集合のうちの分析対象の対象物名を選択するステップと、
前記入力された対象物名を基にそれに関連する対象物名を拡張するステップと、
文書集合を記憶する文書集合記憶手段に格納された文書集合から、前記対象物名を入力するステップで入力されたそれぞれの対象物名及び前記対象物名を展開するステップで拡張された対象物名と物事に対する評価を示す表現である評価表現の集合が登録された評価表現記憶手段に格納されている評価表現とを含む文字列又は文章を、それぞれの対象物名に関する意見として抽出するステップと、
この抽出された意見である全体の意見における、前記分析対象の対象物名及び前記拡張された対象物名に関する意見である部分の意見が占める確率を示す指標を、意見から抽出した単語又は単語の組合わせ毎に求め、前記指標に基づいて単語又は単語の複数の組合わせを選択して出力するステップと、
を有することを特徴とする意見収集分析方法。
Entering one or more feature names;
Selecting an analysis target name from the input feature name set;
Extending a related object name based on the input object name;
Each object name input in the step of inputting the object name and the object name expanded in the step of expanding the object name from the document set stored in the document set storage means for storing the document set Extracting a character string or a sentence including an evaluation expression stored in an evaluation expression storage means in which a set of evaluation expressions, which is an expression indicating an evaluation of things, is registered as an opinion on each object name;
In the overall opinion that is the extracted opinion, an index that indicates the probability that the opinion of the portion that is the opinion related to the target name of the analysis target and the extended target name occupies the word or word extracted from the opinion Obtaining for each combination, selecting and outputting a word or a plurality of combinations of words based on the index;
An opinion collection and analysis method characterized by comprising:
一つ以上の対象物名を入力するステップと、
分析条件を入力するステップと、
文書集合を記憶する文書集合記憶手段に格納された文書集合から、前記対象物名を入力するステップで入力されたそれぞれの対象物名と物事に対する評価を示す表現である評価表現の集合が登録された評価表現記憶手段に格納されている評価表現とを含む文字列又は文章を、それぞれの対象物名に関する意見として抽出するステップと、
この抽出された意見に、予め定められたカテゴリ毎に、前記意見の内容、記述時刻及び/又は記載場所に基づくラベルを設定するステップと、
前記抽出された意見である全体の意見における、前記分析条件を満たす意見である部分の意見が占める確率を示す指標を、意見から抽出した単語又は単語の組合わせ毎に求め、前記指標に基づいて単語又は単語の複数の組合わせを選択して出力するステップと、
を有することを特徴とする意見収集分析方法。
Entering one or more feature names;
Entering analysis conditions;
A set of evaluation expressions, which are expressions indicating evaluations for each object name and things input in the step of inputting the object name, are registered from the document set stored in the document set storage means for storing the document set. Extracting a character string or a sentence including an evaluation expression stored in the evaluation expression storage means as an opinion on each object name;
Setting a label based on the content of the opinion, a description time and / or a description location for each of the extracted opinions for each predetermined category;
An index indicating the probability that the opinion of the portion that is the opinion that satisfies the analysis condition in the entire opinion that is the extracted opinion is obtained for each word or combination of words extracted from the opinion, and based on the index Selecting and outputting a word or multiple combinations of words;
An opinion collection and analysis method characterized by comprising:
前記確率を示す指標は、確率的コンプレキシティを用いて求める
ことを特徴とする請求項7から9いずれか1項に記載の意見収集分析方法。
The opinion collection and analysis method according to any one of claims 7 to 9, wherein the index indicating the probability is obtained using stochastic complexity.
前記確率を示す指標は、拡張型確率的コンプレキシティを用いて求める
ことを特徴とする請求項7から9いずれか1項に記載の意見収集分析方法。
The opinion collection / analysis method according to claim 7, wherein the index indicating the probability is obtained by using an extended probabilistic complexity.
前記確率を示す指標は、ベイズの事後確率及びラプラス型の推定量を用いて求める
ことを特徴とする請求項7から9いずれか1項に記載の意見収集分析方法。
10. The opinion collection and analysis method according to claim 7, wherein the index indicating the probability is obtained using a Bayesian posterior probability and a Laplace-type estimator. 11.
複数の対象物名を入力する処理、
その入力された対象物名集合のうちの分析対象の対象物名を選択する処理、
文書集合を記憶する文書集合記憶手段に格納された文書集合から、前記入力されたそれぞれの対象物名と物事に対する評価を示す表現である評価表現の集合が登録された評価表現記憶手段に格納されている評価表現とを含む文字列又は文章を、それぞれの対象物名に関する意見として抽出する処理、
この抽出された意見である全体の意見における、前記分析対象の対象物名に関する意見である部分の意見が占める確率を示す指標を、意見から抽出した単語又は単語の組合わせ毎に求め、前記指標に基づいて単語又は単語の複数の組合わせを選択して出力する処理、
をコンピュータに実行させるためのプログラム。
The process of entering multiple feature names,
A process of selecting a target name of an analysis target from the input target name set;
From the document set stored in the document set storage means for storing the document set, the set of evaluation expressions, which are expressions indicating the evaluation of the respective object names and things inputted, are stored in the registered evaluation expression storage means. A process of extracting a character string or sentence including an evaluation expression as an opinion on each object name,
An index indicating the probability that the opinion of the portion that is the opinion on the object name to be analyzed in the entire opinion that is the extracted opinion is occupied is obtained for each word or combination of words extracted from the opinion, and the index Processing to select and output a word or multiple combinations of words based on
A program that causes a computer to execute.
一つ以上の対象物名を入力する処理、
その入力された対象物名集合のうちの分析対象の対象物名を選択する処理、
前記入力された対象物名を基にそれを関連する対象物名に拡張する処理、
文書集合を記憶する文書集合記憶手段に格納された文書集合から、前記対象物名集合入力手段から入力されたそれぞれの対象物名及び前記対象物名拡張手段で拡張された対象物名と物事に対する評価を示す表現である評価表現の集合が登録された評価表現記憶手段に格納されている評価表現とを含む文字列又は文章を、それぞれの対象物名に関する意見として抽出する処理、
この抽出された意見である全体の意見における、前記分析対象の対象物名及び前記拡張された対象物名に関する意見である部分の意見が占める確率を示す指標を、意見から抽出した単語又は単語の組合わせ毎に求め、前記指標に基づいて前記単語又は単語の複数の組合わせを選択して出力する処理、
をコンピュータに実行させるためのプログラム。
The process of entering one or more feature names,
A process of selecting a target name of an analysis target from the input target name set;
A process of extending the input object name to a related object name based on the input object name;
From the document set stored in the document set storage means for storing the document set, the respective object names input from the object name set input means and the object names and things expanded by the object name extension means A process of extracting a character string or a sentence including an evaluation expression stored in an evaluation expression storage means in which a set of evaluation expressions, which is an expression indicating an evaluation, is extracted as an opinion regarding each object name;
In the overall opinion that is the extracted opinion, an index that indicates the probability that the opinion of the portion that is the opinion related to the target name of the analysis target and the extended target name occupies the word or word extracted from the opinion A process for obtaining each combination and selecting and outputting the word or a plurality of combinations of words based on the index;
A program that causes a computer to execute.
一つ以上の対象物名を入力する処理
分析条件を入力する処理、
文書集合を記憶する文書集合記憶手段に格納された文書集合から、前記対象物名集合入力手段から入力されたそれぞれの対象物名と物事に対する評価を示す表現である評価表現の集合が登録された評価表現記憶手段に格納されている評価表現とを含む文字列又は文章を、それぞれの対象物名に関する意見として抽出する処理
この抽出された意見に、予め定められたカテゴリ毎に、その内容、記述時刻及び/又は記載場所に基づくラベルを設定する処理、
前記抽出された意見(全体の意見)と、その中で前記分析条件を満たす意見(部分の意見)とを、意見から抽出した単語又は単語の組合わせ毎にその出現の有無によって各意見を分類して分類の前後における部分の意見が全体の意見で占める確率を表す指標の差を情報量尺度として計算することにより比較分析し、前記単語又は単語の複数の組合わせをその情報量尺度に基づいて選択したものを部分の意見が持つ特徴として出力する処理、
をコンピュータに実行させるためのプログラム。





Processing to input one or more target names Processing to input analysis conditions,
From the document set stored in the document set storage means for storing the document set, a set of evaluation expressions, which are expressions indicating the evaluation of the respective object names and things inputted from the object name set input means, are registered. Processing to extract character strings or sentences including evaluation expressions stored in the evaluation expression storage means as opinions relating to respective object names The contents and descriptions of the extracted opinions for each predetermined category Processing to set labels based on time and / or location,
The extracted opinions (total opinions) and the opinions satisfying the analysis conditions (partial opinions) are classified according to the presence / absence of each word or word combination extracted from the opinions. And comparing and analyzing the difference in the index representing the probability that the opinion of the part before and after the classification occupies the whole opinion as an information measure, and based on the information measure of the word or a plurality of combinations of words The process of outputting the selection as a feature of the opinion of the part,
A program that causes a computer to execute.





JP2006206235A 2006-07-28 2006-07-28 Opinion collection and analysis apparatus, opinion collection and analysis method used therefor, and program thereof Expired - Lifetime JP4539616B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006206235A JP4539616B2 (en) 2006-07-28 2006-07-28 Opinion collection and analysis apparatus, opinion collection and analysis method used therefor, and program thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006206235A JP4539616B2 (en) 2006-07-28 2006-07-28 Opinion collection and analysis apparatus, opinion collection and analysis method used therefor, and program thereof

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2002001873A Division JP4410970B2 (en) 2002-01-09 2002-01-09 Opinion collection and analysis apparatus, opinion collection and analysis method used therefor, and program thereof

Publications (2)

Publication Number Publication Date
JP2006286026A true JP2006286026A (en) 2006-10-19
JP4539616B2 JP4539616B2 (en) 2010-09-08

Family

ID=37407800

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006206235A Expired - Lifetime JP4539616B2 (en) 2006-07-28 2006-07-28 Opinion collection and analysis apparatus, opinion collection and analysis method used therefor, and program thereof

Country Status (1)

Country Link
JP (1) JP4539616B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009142049A1 (en) * 2008-05-20 2009-11-26 日本電気株式会社 Evaluation information processing system, evaluation information processing method, and recording medium for storing program for processing evaluation information
US8452782B2 (en) 2008-03-12 2013-05-28 Nec Corporation Text mining device, text mining method, text mining program, and recording medium
JP2019083076A (en) * 2016-12-02 2019-05-30 本田技研工業株式会社 Evaluation device, evaluation method and evaluation program
US11373198B2 (en) 2016-12-02 2022-06-28 Honda Motor Co., Ltd. Evaluation device, evaluation method, and evaluation program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11167581A (en) * 1997-12-04 1999-06-22 Ntt Data Corp Information sorting method, device and system
JPH11345241A (en) * 1998-06-03 1999-12-14 Fujitsu Ltd Analyzer for text information and recording medium
JP2001266060A (en) * 2000-03-15 2001-09-28 Nec Corp Analysis system questionnaire answer

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11167581A (en) * 1997-12-04 1999-06-22 Ntt Data Corp Information sorting method, device and system
JPH11345241A (en) * 1998-06-03 1999-12-14 Fujitsu Ltd Analyzer for text information and recording medium
JP2001266060A (en) * 2000-03-15 2001-09-28 Nec Corp Analysis system questionnaire answer

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8452782B2 (en) 2008-03-12 2013-05-28 Nec Corporation Text mining device, text mining method, text mining program, and recording medium
WO2009142049A1 (en) * 2008-05-20 2009-11-26 日本電気株式会社 Evaluation information processing system, evaluation information processing method, and recording medium for storing program for processing evaluation information
JP2019083076A (en) * 2016-12-02 2019-05-30 本田技研工業株式会社 Evaluation device, evaluation method and evaluation program
US11373198B2 (en) 2016-12-02 2022-06-28 Honda Motor Co., Ltd. Evaluation device, evaluation method, and evaluation program

Also Published As

Publication number Publication date
JP4539616B2 (en) 2010-09-08

Similar Documents

Publication Publication Date Title
JP5391633B2 (en) Term recommendation to define the ontology space
US20110106743A1 (en) Method and system to predict a data value
Thorleuchter et al. Web mining based extraction of problem solution ideas
WO2009096523A1 (en) Information analysis device, search system, information analysis method, and information analysis program
Wang et al. Customer-driven product design selection using web based user-generated content
KR20130056207A (en) Relational information expansion device, relational information expansion method and program
Bellot et al. INEX Tweet Contextualization task: Evaluation, results and lesson learned
WO2012096388A1 (en) Unexpectedness determination system, unexpectedness determination method, and program
Al Qundus et al. Exploring the impact of short-text complexity and structure on its quality in social media
WO2023108980A1 (en) Information push method and device based on text adversarial sample
JP6535858B2 (en) Document analyzer, program
JP4293145B2 (en) Word-of-mouth information determination method, apparatus, and program
Liu et al. Age inference using a hierarchical attention neural network
JP4539616B2 (en) Opinion collection and analysis apparatus, opinion collection and analysis method used therefor, and program thereof
JP2008146293A (en) Evaluation system, method and program for browsing target information
JP5138621B2 (en) Information processing apparatus, dissatisfied product discovery method and program
Govindarajan Approaches and applications for sentiment analysis: a literature review
Dai et al. Research on image of enterprise after-sales service based on text sentiment analysis
JP5197491B2 (en) Action recommendation device, method and program
JP4410970B2 (en) Opinion collection and analysis apparatus, opinion collection and analysis method used therefor, and program thereof
KR20090126862A (en) System and method for analyzing emotional information from natural language sentence, and medium for storaging program for the same
Kurashima et al. Ranking entities using comparative relations
JP5614687B2 (en) Information analysis device for analyzing time-series text data including time-series information and text information
Wambsganss et al. Using Deep Learning for Extracting User-Generated Knowledge from Web Communities.
JP2000105769A (en) Document display method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060728

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070118

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080611

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20090508

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100512

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100601

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100614

R150 Certificate of patent or registration of utility model

Ref document number: 4539616

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130702

Year of fee payment: 3

EXPY Cancellation because of completion of term