JP2005322239A - Natural sentence processor, natural sentence processing method and natural sentence processing program - Google Patents

Natural sentence processor, natural sentence processing method and natural sentence processing program Download PDF

Info

Publication number
JP2005322239A
JP2005322239A JP2005133969A JP2005133969A JP2005322239A JP 2005322239 A JP2005322239 A JP 2005322239A JP 2005133969 A JP2005133969 A JP 2005133969A JP 2005133969 A JP2005133969 A JP 2005133969A JP 2005322239 A JP2005322239 A JP 2005322239A
Authority
JP
Japan
Prior art keywords
opinion
information
questionnaire
determination
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005133969A
Other languages
Japanese (ja)
Other versions
JP3917629B2 (en
Inventor
Takahiro Saito
孝広 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005133969A priority Critical patent/JP3917629B2/en
Publication of JP2005322239A publication Critical patent/JP2005322239A/en
Application granted granted Critical
Publication of JP3917629B2 publication Critical patent/JP3917629B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To accurately determine whether opinions are affirmative or negative from free description type questionnaire answer sentences or the like. <P>SOLUTION: A natural sentence processor having a determination knowledge data base which stores information about a pair of words in association with whether the information about the pair of words is an affirmative expression or a negative expression, a syntax analysis means for extracting a pair of words in electronic text data from coming electronic text data and an opinion determination part which determines whether words in questionnaire information are affirmative opinions or negative opinions by referring to the determination knowledge data base based on the information about the pair of words extracted by the syntax analysis means is provided. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は自由記述式で書かれた自然文処理装置、自然言語処理方法及び自然文処理用プログラムに係り、例えば市場調査等の際に行われるアンケートの回答が自然文で行われたとき、これをアンケートの結果として分析する文書処理装置、自然言語処理方法及び文書処理用プログラムに関する。   The present invention relates to a natural sentence processing device, a natural language processing method, and a natural sentence processing program written in a free-description format. For example, when a questionnaire is conducted in a natural language when a questionnaire is conducted during a market research or the like. The present invention relates to a document processing apparatus, a natural language processing method, and a document processing program.

各種の調査を行うための手段の1つとしてアンケートが行われている。アンケートには、回答の一部あるいは全部が自由記述式文書である自由記述式のアンケート方式と、アンケート調査票に設問に関して予め幾つかの選択肢を用意しておき、アンケート回答者にその中から選ばせる選択方式がある。   A questionnaire is conducted as one of means for conducting various surveys. In the questionnaire, there are a free description type questionnaire method in which some or all of the responses are free description type documents, and several options regarding the question are prepared in the questionnaire survey form in advance, and the questionnaire respondent is selected from among them There is a selection method.

自由記述式のアンケート方式は、回答結果が自然文であり、多数の回答者から有用な情報を得るためには人手による集計及び分析が必要であり、非常にコストがかかるといった問題がある。   The free description type questionnaire method has a problem that the answer result is a natural sentence, and manual counting and analysis are required to obtain useful information from a large number of respondents, which is very expensive.

この問題を解決する手段として前記選択方式がある。しかしこの方式の場合は、予め作成された選択肢以外に関する情報は得ることができず、アンケート実施者の予期していなかったニーズ等の重要な知識を得ることができないという問題がある。   As a means for solving this problem, there is the selection method. However, in the case of this method, there is a problem that information relating to options other than those created in advance cannot be obtained, and important knowledge such as needs that the questionnaire implementer did not expect cannot be obtained.

この自由記述式アンケートの集計時のコストの軽減を目的として、集計時にコンピュータによる自動集計を行う、アンケート集計システムが提案(例えば特許文献1参照)されている。   For the purpose of reducing the cost at the time of aggregation of this free description questionnaire, a questionnaire aggregation system that performs automatic aggregation by a computer at the time of aggregation has been proposed (for example, see Patent Document 1).

このアンケート集計システムでは、装置内にシソーラス辞書を具備し、自由記述文内の単語単位でシソーラス辞書を検索し、その上位語で結果を統合する装置である。例えば「硬式野球」と「軟式野球」を、上位語の「野球」として集計するといった処理を行う装置である。
特開平09−190454号公報
In this questionnaire totalization system, a thesaurus dictionary is provided in the device, the thesaurus dictionary is searched in units of words in the free description sentence, and the results are integrated with the broader terms. For example, it is a device that performs processing such as counting “hard baseball” and “soft baseball” as the broader term “baseball”.
JP 09-190454 A

しかし、この統合はあくまでも単語単位で行われるので、例えばこの装置の説明で挙げられているアンケートの質問項目「生涯学習の内容は」に対する回答として、「硬式野球。」と「軟式野球。」を単語のみで記述されている文を正しく「野球」として集計することは可能であるが、しかし、「若い頃は野球だと思っていましたが、今ではやはりゴルフの方が良いと思います」等の否定的な対象として記述されている場合には正確な集計が行えないという問題がある。   However, since this integration is performed in units of words, for example, “hard baseball.” And “soft baseball.” Are answers to the question item “What is lifelong learning?” In the questionnaire given in the description of this device. It is possible to correctly count sentences written only in words as "baseball", but "I thought it was baseball when I was young, but now I think golf is better" There is a problem that accurate tabulation cannot be performed when it is described as a negative object such as.

またこの方法では正確な集計が殆ど不可能となる様な質問もある。例えば、「本製品についてご意見をお聞かせ下さい」といった質問に関しては、アンケート記述者は単語のみで回答を行うことはなく、さらにその記述が否定的内容なのか、肯定的内容なのかをアンケートの趣旨からいえば集計時に区別する必要があるが、それもこの装置では行えない。   There are also questions that make accurate tabulation almost impossible with this method. For example, for questions such as “Please give us your opinion about this product”, the questionnaire writer does not answer only with words, and whether the description is negative or positive From the point of view, it is necessary to distinguish at the time of aggregation, but this cannot be done with this apparatus.

つまり、この装置においては、本来の意味での自由記述式アンケートを、すなわちアンケート実施者側としてはどんな質問文でも許容し、アンケート記述側としてはどのような記述も許容するような場合を、正確に集計することはできない。   In other words, in this device, a free description questionnaire in its original meaning, that is, any question sentence is allowed on the questionnaire implementer side, and any description is allowed on the questionnaire description side, is accurate. Cannot be counted.

またアンケート以外にも多数の人間が各々の意見を述べている例としては、パソコン通信やウェブページにおける掲示板における記事や、ヘルプデスクに寄せられる顧客の問い合わせなどが挙げられるが、そこでも各個人の意見は自然文で記述されており、それらから有用な情報を得るためには自由記述式アンケートの分析作業と同様のコストがかかるという問題があった。   In addition to questionnaires, examples of how many people express their opinions include personal computer communications, articles on bulletin boards on web pages, and customer inquiries sent to help desks. Opinions are described in natural sentences, and there is a problem that it takes the same cost as analysis of free description questionnaires to obtain useful information from them.

したがって本発明の目的は、前記の如き自由記述式アンケート等における問題点を解決し、有用な情報を低コストでかつ正確に獲得するようにしたものである。   Therefore, an object of the present invention is to solve the problems in the free description questionnaire as described above, and to obtain useful information accurately at low cost.

また本発明では自由記述式アンケートに限らず、各個人の意見が自然文の形で記述されている情報源より有用の情報を低コストでかつ正確に獲得するようにしたものである。   In the present invention, not only a free description questionnaire, but useful information is obtained at low cost and accurately from an information source in which each person's opinion is described in the form of a natural sentence.

前記本発明の目的を達成するための原理構成を図1に示す。図1において、1は入力部、2は回答抽出部、3は意見抽出部、4は意見集計部、5は結果提示部、6は意見判定部、7は判定知識獲得部、8は集計知識データベース、9は判定知識データベース、10は集計結果格納データベースである。   FIG. 1 shows the principle configuration for achieving the object of the present invention. In FIG. 1, 1 is an input unit, 2 is an answer extraction unit, 3 is an opinion extraction unit, 4 is an opinion aggregation unit, 5 is a result presentation unit, 6 is an opinion determination unit, 7 is a determination knowledge acquisition unit, and 8 is total knowledge. A database, 9 is a judgment knowledge database, and 10 is a tabulation result storage database.

本発明の前記課題は下記(1)〜(5)の構成により達成することができる。   The said subject of this invention can be achieved by the structure of following (1)-(5).

(1)単語対情報とその単語対情報が肯定的表現か否定的表現かを対応付けて格納する判定知識データベースと、
到来する電子テキストデータより電子テキストデータ内の単語対を抽出する構文解析手段と、
前記構文解析手段により抽出された単語対情報を元に、前記判定知識データベースを参照してアンケート情報内の単語に対して肯定的意見か否定的意見かを判定する意見判定部と、
を有することを特徴とする自然文処理装置。
(1) a judgment knowledge database that stores word pair information in association with whether the word pair information is a positive expression or a negative expression;
A syntax analysis means for extracting word pairs in the electronic text data from the incoming electronic text data;
Based on the word pair information extracted by the syntax analysis means, an opinion determination unit that determines whether the opinion is a positive opinion or a negative opinion with respect to the words in the questionnaire information with reference to the determination knowledge database;
The natural sentence processing apparatus characterized by having.

(2)集計結果を蓄積する蓄積手段を有し、
前記構文解析手段は、複数のアンケート情報の自由記載部分を電子テキストデータとして抽出し、
前記構文解析手段は、前記抽出部が電子テキストデータとして抽出した各々のアンケート情報の構文解析を行い、単語対を抽出するとともに、
更に、前記意見判定部が判定した複数のアンケート情報の判定結果の集計を行い、該集計結果を前記蓄積手段に蓄積する意見集計部と、
を有することを特徴とする前記(1)に記載の自然文処理装置。
(2) having a storage means for storing the counting results;
The syntax analysis means extracts free description parts of a plurality of questionnaire information as electronic text data,
The syntax analysis means performs syntax analysis of each questionnaire information extracted as electronic text data by the extraction unit, extracts word pairs,
Furthermore, the opinion totaling unit that aggregates the determination results of the plurality of questionnaire information determined by the opinion determination unit and accumulates the totalization results in the storage unit;
The natural sentence processing apparatus according to (1), characterized in that:

(3)前記構文解析手段は電子テキストデータを構文木に変換した情報を基に単語対を抽出する事を特徴とする前記(1)または前記(2)に記載の自然文処理装置。   (3) The natural sentence processing apparatus according to (1) or (2), wherein the syntax analysis unit extracts word pairs based on information obtained by converting electronic text data into a syntax tree.

(4)単語対情報とその単語対情報が肯定的表現か否定的表現かを対応付けて格納する判定知識データベースにアクセス可能なコンピュータを、
到来する電子テキストデータより電子テキストデータ内の単語対を抽出する構文解析手段と、
前記構文解析手段により抽出された単語対情報を元に、前記判定知識データベースを参照してアンケート情報内の単語に対して肯定的意見か否定的意見かを判定する意見判定部と、
して機能させる自然言語処理プログラム。
(4) A computer that can access a judgment knowledge database that stores word pair information in association with whether the word pair information is a positive expression or a negative expression,
A syntax analysis means for extracting word pairs in the electronic text data from the incoming electronic text data;
Based on the word pair information extracted by the syntax analysis means, an opinion determination unit that determines whether the opinion is a positive opinion or a negative opinion with respect to the words in the questionnaire information with reference to the determination knowledge database;
Natural language processing program that makes it work.

(5)単語対情報とその単語対情報が肯定的表現か否定的表現かを対応付けて格納する判定知識データベースにアクセス可能なコンピュータが、
到来する電子テキストデータより電子テキストデータ内の単語対を抽出する構文解析ステップと、
前記構文解析ステップにより抽出された単語対情報を元に、前記判定知識データベースを参照してアンケート情報内の単語に対して肯定的意見か否定的意見かを判定する意見判定ステップと、
を実行する事を特徴とする自然言語処理方法。
(5) A computer that can access a judgment knowledge database that stores word pair information in association with whether the word pair information is a positive expression or a negative expression.
A parsing step for extracting word pairs in the electronic text data from the incoming electronic text data;
Based on the word pair information extracted by the syntax analysis step, an opinion determination step for determining whether the opinion in the questionnaire information is a positive opinion or a negative opinion with reference to the determination knowledge database;
Natural language processing method characterized by executing

これにより下記の作用効果を奏することができる。   Thereby, the following effects can be obtained.

(1)複数の意見提供者から提出された自由記述部分の回答文より、意見提供者の主張・見解・感想など単語対を意見として自動的に抽出することができるので、多数の自由記述部分の回答文より正確に短時間で意見を抽出することができる。   (1) Since word pairs such as the opinion provider's assertions, opinions, and impressions can be automatically extracted from the response text of the free description parts submitted by multiple opinion providers, many free description parts It is possible to extract opinions accurately and in a short time from the answer sentence.

(2)抽出した意見が対象物に関する肯定的評価を与えているものか、それとも否定的評価を与えているものかを、これらを判定するための知識を格納する判定知識データベースを検索することにより、正確に、自動判定することができる。   (2) By searching a judgment knowledge database that stores knowledge for judging whether the extracted opinion gives a positive evaluation or negative evaluation regarding the object , Accurate and automatic determination.

(3)一つの回答文から肯定意見と否定意見の両方が得られたときに、その評価の強さを比較してその回答文における総合的なきめ細かな判定結果を自動的に得ることができる。   (3) When both a positive opinion and a negative opinion are obtained from a single answer sentence, the strength of the evaluation can be compared to automatically obtain a comprehensive and detailed judgment result in the answer sentence. .

(4)提示情報を、全体集合を変化させた複数のグラフで順次表示することができるので、分析結果をわかり易く提示することができる。   (4) Since the presentation information can be sequentially displayed in a plurality of graphs in which the entire set is changed, the analysis result can be presented in an easy-to-understand manner.

(5)抽出した意見を判定する際の知識を、特定形式の意見調査票における回答結果より自動的に獲得するので、事前に判定する際の知識を用意することなく、意見判定を行うことができる。しかも学習する程正確な結果を得ることができる。   (5) Since the knowledge for judging the extracted opinion is automatically acquired from the answer result in the opinion questionnaire of a specific format, it is possible to make an opinion judgment without preparing the knowledge for judgment in advance. it can. Moreover, accurate results can be obtained as learning is performed.

(6)抽出した意見を判定する際の知識を、特定形式の意見調査票を使用することなく、自動的に獲得することができるので、これまた事前に判定する際の知識を用意することなく、意見判定を行うことができる。しかも学習する程正確な結果を得ることができる。   (6) Since knowledge for judging the extracted opinion can be automatically acquired without using a specific form opinion survey form, it is also possible to prepare knowledge for judgment in advance. , Opinion judgment can be performed. Moreover, accurate results can be obtained as learning is performed.

(7)コンピュータに、提供された意見から意見提供者の自由記述部分の電子化データを意見提供の回答文として抽出する回答抽出手段、抽出した回答文より、単語対を抽出する意見抽出手段、抽出した意見内容毎の集計を行う意見集計手段、この意見内容毎の集計結果を提供する結果提供手段として機能するプログラムをインストールすることにより、通常のコンピュータを、複数の意見提供者から提供された意見を解析する自然文処理機能を遂行させることができる。   (7) An answer extracting means for extracting the electronic data of the free description part of the opinion provider from the provided opinions as an answer sentence for providing the opinion to the computer, an opinion extracting means for extracting a word pair from the extracted answer sentence, By installing a program that functions as an opinion aggregation means that aggregates the extracted opinion contents and a result providing means that provides the aggregation results for each opinion contents, a normal computer was provided by multiple opinion providers. A natural sentence processing function for analyzing opinions can be performed.

本発明の一実施の形態を図1〜図6にもとづきアンケート回答の分析を例として説明する。図1は本発明の実施の形態、図2は意見抽出説明図、図3は本発明における意見集計結果の一例を示す意見集計結果説明図、図4は本発明における集計結果の一例を示す集計結果説明図、図5は本発明のグラフ状態説明図、図6は本発明の回答文解析例である。   An embodiment of the present invention will be described with reference to an analysis of questionnaire responses based on FIGS. 1 is an embodiment of the present invention, FIG. 2 is an explanatory view of opinion extraction, FIG. 3 is an explanatory view of an opinion summary result showing an example of an opinion summary result in the present invention, and FIG. 4 is an aggregate showing an example of an aggregate result in the present invention. FIG. 5 is an explanatory diagram of results, FIG. 5 is a graph state explanatory diagram of the present invention, and FIG. 6 is an example of an answer sentence analysis of the present invention.

図中、1は入力部、2は回答抽出部、3は意見抽出部、4は意見集計部、5は結果提示部、6は意見判定部、7は判定知識獲得部であって第1判定知識獲得部7−1及び第2判定知識獲得部7−2を具備するもの、8は集計知識データベース、9は判定知識データベース、10は集計結果格納データベース、20はプロセッサ、21は表示部、Aはアンケート回答者、Bはアンケート分析者である。   In the figure, 1 is an input unit, 2 is an answer extraction unit, 3 is an opinion extraction unit, 4 is an opinion aggregation unit, 5 is a result presentation unit, 6 is an opinion determination unit, 7 is a determination knowledge acquisition unit, and is a first determination. Comprising knowledge acquisition unit 7-1 and second determination knowledge acquisition unit 7-2, 8 is a total knowledge database, 9 is a determination knowledge database, 10 is a total result storage database, 20 is a processor, 21 is a display unit, A Is a questionnaire respondent and B is a questionnaire analyst.

入力部1は、アンケート回答者Aがアンケート用紙に各々の回答を入力し、この回答を装置に回収する処理を行うものである。この回答を回収する処理としては、例えば紙媒体のアンケート調査票をアンケート対象者に直接配布したり、あるいはファックスなどで配布し、そこに回答を記入させて結果を回収する手法や、電子メールやウェブ掲示板を用いて調査票の配布と回答記入及び回収を行うこと等で実現可能である。   The input unit 1 performs a process in which the questionnaire respondent A inputs each answer on a questionnaire sheet and collects this answer in the apparatus. The process of collecting this response includes, for example, distributing a questionnaire on paper media directly to the survey target person, or distributing it by fax etc. This can be achieved by distributing survey forms, filling in responses and collecting them using a web bulletin board.

アンケート調査票の回答回収やファックスによる回答回収の場合は、回答記入欄が固定されているので、用紙の座標位置により検出できる。このような回答を回収する処理には、従来のアンケート結果回収のための手段をそのまま流用可能である。   In the case of collecting responses to questionnaires or collecting responses by fax, the response entry field is fixed so that it can be detected by the coordinate position of the paper. In the process of collecting such answers, conventional means for collecting questionnaire results can be used as they are.

なお入力部1としては以上のような文字情報によるものを扱うもののみに限定されるものでてはなく、電話応答などによって対象者の回答を音声データの形で回収することも可能であり、インターネットを使用したウェブ上のデータでもよく、回答のメディアとしてあらゆる情報伝達手段が利用可能である。もし翻訳手段が具備されていれば外国語で入力することもできる。   Note that the input unit 1 is not limited to the one that handles character information as described above, and it is also possible to collect the subject's answers in the form of voice data by telephone response, etc. Data on the web using the Internet may be used, and any information transmission means can be used as a response medium. If a translation means is provided, it can be entered in a foreign language.

回答抽出部2は、回収された個々のアンケート回答結果の中の自由記述部分を電子テキスト化し、回答文として抽出する処理を行うものである。この処理は、例えば回収した紙媒体によるアンケート回答をアンケート実施者側のオペレータがキーボードなどの電子化データ入力手段で電子化テキストを作成する方法や、回答メディアに応じて適当な自動電子化手段、例えば文字認識装置や音声認識装置を用いて入手をかけることなく電子化テキストを作成する方法などで実現される。   The answer extraction unit 2 converts the free description part of each collected questionnaire answer result into an electronic text and extracts it as an answer sentence. This process includes, for example, a method in which an operator on the questionnaire operator side creates a digitized text by means of digitized data input means such as a keyboard, and an automatic digitizing means suitable for the answer medium, For example, it is realized by a method of creating digitized text without using a character recognition device or a speech recognition device.

またアンケートの入力部1に採用した手段によっては、回収した回答が既に電子化されている場合があるが、このような場合はその電子化されている自由記述部分をそのまま意見抽出部3に送出することができる。   Depending on the means adopted for the questionnaire input unit 1, the collected responses may already be digitized. In such a case, the digitized free description portion is sent to the opinion extraction unit 3 as it is. can do.

意見抽出部3は、回答抽出部2が作成した電子化された回答文を解析し、回答文のいわんとする情報を意見として抽出する処理を行うものである。   The opinion extraction unit 3 analyzes the digitized response sentence created by the answer extraction unit 2, and performs processing to extract information that is so-called in the answer sentence as an opinion.

ここで抽出される意見とは、例えばノートパソコンにおける製品アンケートについて、「本体は小さいのに画面が大きい。」という回答文の中に含まれている、「本体は小さい」、「画面は大きい」といったアンケート集計の際にアンケート実施者が知りたい情報である。   The opinions extracted here include, for example, a product questionnaire on a notebook computer, which is included in an answer sentence “the body is small but the screen is large”, “the body is small”, “the screen is large” This is the information that the surveyor wants to know when collecting the questionnaires.

この意見抽出処理は、図2に示す如く、回答文を構文解析手段3−2を用いて構文木に変換してその主語と述語を抽出し、その二項関係「本体−小さい」、「画面−大きい」を集計処理単位とすることで実現される。   In this opinion extraction process, as shown in FIG. 2, the answer sentence is converted into a syntax tree using the syntax analysis means 3-2 to extract the subject and the predicate, and the binary relations “body-small”, “screen” This is achieved by setting “large” as the total processing unit.

なお、意見として抽出する情報としては、上記の「主語−述語」の組に限らず、「被修飾語−修飾語」の関係から例えば「見やすい画面」から「画面−見やすい」を抽出するなど、種々のものが考えられる。   Note that the information extracted as an opinion is not limited to the above-mentioned “subject-predicate” pair, but for example, “screen-easy to see” is extracted from “easy-to-view screen” from the “modified subject-modifier” relationship, etc. Various things are possible.

また以上のような二項関係に限らず、構文木の中の三項以上の関係、例えば「主語−目的語−述語」を意見とすることもできるし、抽出した表記による関係をさらに意味解釈手段3−1によって意味構造に変換してそれを意見とすることも可能である。   In addition to the binary relations as described above, it is also possible to use the relation of three or more terms in the syntax tree, for example, "subject-object-predicate" as an opinion, and further interpret the relation by the extracted notation. It is also possible to convert it into a semantic structure by means 3-1 and make it an opinion.

例えば「♯画面→♯美しい」と表す。ここで♯はその後方の単語の意味を表す演算子であって、テキスト中に出てきた画面のみではなく、例えばその分野の画面の同義語全体を表すものであり、モニタ、スクリーン、画面、液晶等全体を示す。また→は推論結果を表す演算子であり、この例では「画面であれば美しいもの」ということを示す。なお、これらの処理は全てコンピュータを用いて行い、人手をかけることなく実現可能である。   For example, “# screen → # beautiful”. Here, # is an operator representing the meaning of the word behind it, not only the screen that appears in the text, but for example, the whole synonym of the screen in the field, monitor, screen, screen, The entire liquid crystal is shown. In addition, “→” is an operator representing an inference result, and in this example, indicates that “the screen is beautiful”. These processes are all performed using a computer and can be realized without manpower.

意見集計部4は、意見抽出部3が抽出した意見、例えば「本体−小さい」や「画面−大きい」といった二項関係毎にその出現頻度を集計する処理を行うものである。これにより、例えば図3に示す如く、二項関係毎の出現頻度を集計することができる。   The opinion totaling unit 4 performs processing for totalizing the appearance frequency for each opinion extracted by the opinion extracting unit 3, for example, binary relations such as “main body-small” and “screen-large”. Thereby, for example, as shown in FIG. 3, the appearance frequency for each binary relation can be totaled.

集計方法としては、例えば意見を上記の如き二項関係とした場合、各意見毎にその数を集計することに加えて、第一項(「本体−小さい」なら「本体」)のみによる集計や、第二項(前記の例における「小さい」)のみによる集計を行い、それらの集計結果を結果提示部5に送出することで、分析者Bの分析目的に合致した情報提示を行うことができる。   As an aggregation method, for example, when the opinions are expressed in the binary relation as described above, in addition to counting the number for each opinion, the aggregation is based only on the first item (or “body” if “body-small”). By performing the aggregation only by the second term ("small" in the above example) and sending the aggregation results to the result presentation unit 5, it is possible to present information that matches the analysis purpose of the analyst B. .

また意見の表現の揺れを吸収した結果を集計する機能を付与した集計方式もできる。これは、例えば否定文から抽出された意見、「本体−大きくない」に関して、「本体−大きくない」という意見を「本体−小さい」と同意見として集計を行うといった機能である。   In addition, a tabulation method with a function of tabulating the result of absorbing the fluctuation of the expression of the opinion can be used. For example, regarding the opinion extracted from a negative sentence, “main body—not big”, the opinion “main body—not big” is counted as “main body—small” as the same opinion.

これは例えば、意見集計部4に反意語の肯定表現を示す反意語データベースを含む集計知識データベース8を接続し、意見の第二項が否定を含む場合、例えば「大きくない」の肯定表現「大きい」でこの反意語データベースを検索し、その反意語「小さい」を獲得して第一項と組み合わせて「本体−小さい」として集計に用いることで実現できる。   For example, when the aggregate knowledge database 8 including an antonym database indicating an antonym expression of an antonym is connected to the opinion tabulation unit 4 and the second term of the opinion includes a denial, for example, an affirmative expression “not large” is “large”. This antonym database is searched, and the antonym “small” is acquired and combined with the first term to be used for aggregation as “main body-small”.

同様の方式で、集計知識データベース8に同義語データベースを備え、同義語の統一を行うことも可能である。この処理は、例えば「画面−綺麗」、「スクリーン−美しい」といった意見を「画面−美しい」として集計することができる。   In the same manner, the total knowledge database 8 can be provided with a synonym database, and synonyms can be unified. In this process, for example, opinions such as “screen-beautiful” and “screen-beautiful” can be tabulated as “screen-beautiful”.

その他シソーラス、実世界知識等を集計知識データベース8に備えることもできる。実世界知識とは、例えば「前のものが良かった」という意見を「今のものは悪い」と判断し、「操作性は前のものが良かった」という回答文から抽出すべき知識として「操作性は悪い」と分析するものである。   Other thesauruses, real world knowledge, and the like can also be provided in the aggregate knowledge database 8. Real world knowledge is, for example, the opinion that “the previous one was good” is judged as “the current one is bad”, and the knowledge that should be extracted from the reply sentence that “the operability was good before” The operability is bad ".

以上の処理を行った結果は、例えば図3に示す表の様に表される。図3はノートパソコンに関するものであり、意見としては「本体−小さい」、「画面−大きい」、「画面−小さい」・・・が抽出され、その集計数は200、50、150・・・であり、「本体−小さい」、「画面−大きい」は好判定結果を示し、「画面−小さい」は否判定結果を示している。   The result of performing the above processing is expressed as a table shown in FIG. 3, for example. FIG. 3 relates to a notebook personal computer. As opinions, “main body-small”, “screen-large”, “screen-small”... Are extracted, and the total number is 200, 50, 150. Yes, “main body-small” and “screen-large” indicate a favorable determination result, and “screen-small” indicates a negative determination result.

そして「本体−小さい」の同義意見としては「本体−コンパクト」、「ボディ−小さい」・・・が、「画面−大きい」の同義意見としては「画面−広い」・・・が、「画面−小さい」の同義意見としては「画面−狭い」、「画面−大きくない」・・・が存在したことを示している。   As synonymous opinions of “main body-small”, “main body-compact”, “body-small”..., And as synonymous opinion of “screen-large”, “screen-wide”. As a synonymous opinion of “small”, “screen-narrow”, “screen-not big”,... Exist.

結果提示部5に送出するデータ形式は、種々の表形式ソフトの扱う形式に変換して図3のような表の形で送ってもよいし、他の形式で送ることもできる。なおこれらの意見集計部に関する処理は全てコンピュータで実現可能である。   The data format sent to the result presentation unit 5 may be converted into a format handled by various tabular software and sent in the form of a table as shown in FIG. 3, or may be sent in another format. Note that all the processes related to the opinion totaling unit can be realized by a computer.

結果提示部5は、意見集計部4が作成した集計結果をアンケート分析者Bに提示する処理を行うものである。集計結果の提示方法としては、図4に示す如き表の形でアンケート分析者Bに提示してもよいし、その他、種々の表計算ソフトの機能を利用して、アンケート分析者Bの分析目的に合致した表やグラフを作成して提示してもよい。   The result presentation unit 5 performs processing for presenting the total result created by the opinion totaling unit 4 to the questionnaire analyst B. As a method of presenting the aggregated results, it may be presented to the questionnaire analyst B in the form of a table as shown in FIG. 4 or, in addition, the analysis purpose of the questionnaire analyst B using various spreadsheet software functions You may create and present a table or graph that matches

図4によれば、回答者は対象商品について、本体が綺麗とか汚いということよりも、大きいとか小さいということに関心のあることもわかる。   According to FIG. 4, it can also be seen that the respondent is interested in the target product being larger or smaller than the clean or dirty main body.

提示手段としては、例えば図1に示す表示部21にモニタ用の図表をアンケート分析者に提示できるものである必要があるが、本発明では必ずしも図表情報を提示手段に限定する必要はなく、例えば結果読み挙げ手段としスピ−カ等を用いて音声情報に変換してアンケート分析者に提示してもよい。   As the presenting means, for example, it is necessary to be able to present a chart for monitoring to the questionnaire analyst on the display unit 21 shown in FIG. 1, but in the present invention, it is not always necessary to limit the chart information to the presenting means. As a result reading means, it may be converted into voice information using a speaker or the like and presented to a questionnaire analyst.

グラフとして提示する場合は、図5に示す如く、最初の図表として、長さを第一項で集計した意見の総数とした棒グラフで表現する。例えば本体については、図4に示す如く、好意的意見数が500、否定的意見数が20あるので、520の総数を示す棒グラフを作成し、それに対する肯定評価意見(500)と否定評価意見(20)の割合を各々色分けして提示し、例えばアンケート分析者がその肯定評価部分をマウスの如きポインテングデバイスで指定すると、肯定意見における第二項目の各割合を円グラフで提示し、さらに円グラフ内にある項目にポインテングデバイスで指示するとその意見が抽出された回答文を表示するというような方法である。   When presenting as a graph, as shown in FIG. 5, the first chart is represented by a bar graph in which the length is the total number of opinions totaled in the first term. For example, as shown in FIG. 4, since the number of favorable opinions is 500 and the number of negative opinions is 20, as shown in FIG. 4, a bar graph indicating the total number of 520 is created, and positive evaluation opinion (500) and negative evaluation opinion ( 20) each of the ratios is presented in different colors. For example, if the questionnaire analyst designates the positive evaluation part with a pointing device such as a mouse, each ratio of the second item in the positive opinion is presented in a pie chart, and When an item in the graph is instructed by a pointing device, an answer sentence in which the opinion is extracted is displayed.

図5において、本体に関する棒グラフの肯定評価部分をポインテングデバイスでポインテングすると、3つに区分された円グラフが表示され、領域(a)をポインテングすると、回答文「小さい」が表示される。また領域(b)をポインテングすると「便利」が表示され、領域(c)をポインテングすると「軽い」が表示される。   In FIG. 5, when a positive evaluation portion of the bar graph relating to the main body is pointed with the pointing device, a pie chart divided into three is displayed, and when the area (a) is pointed, an answer sentence “small” is displayed. Further, when the area (b) is pointed, “Convenient” is displayed, and when the area (c) is pointed, “Light” is displayed.

さらに1つの回答文から肯定意見と否定意見の両方が得られたときに、その評価の強さを比較してその回答文における総合的な判定結果を推定する。このためこの2つの意見が出たとき、それぞれにあらかじめ点数をつけ、重み付けする。   Furthermore, when both a positive opinion and a negative opinion are obtained from one answer sentence, the strengths of the evaluations are compared, and a comprehensive determination result in the answer sentence is estimated. For this reason, when these two opinions are given, each is given a score in advance and weighted.

このようにして、意見単位の集計結果だけでなく、回答文単位の評価の集計も行えるので、それをグラフの割合で色分けして最初にアンケート分析者に提示し、例えばその肯定意見の割合の部分をポインテングデバイスで指定すると、総合的に肯定評価を与えている回答文における意見の割合などもグラフィカルに提示することができる。   In this way, not only the result of the opinion unit, but also the evaluation of the response sentence unit can be aggregated, so it is color-coded by the proportion of the graph and presented to the questionnaire analyst first, for example the proportion of the positive opinion If a part is designated by a pointing device, the ratio of the opinions in the answer sentences giving a comprehensive evaluation can also be presented graphically.

意見判定部6は、意見抽出部3が抽出した各意見情報について、判定知識データベース9に格納された意見判定知識を用いて、その意見が肯定的意見か否定的意見かを判定する処理を行うものである。   The opinion determination unit 6 performs a process of determining whether the opinion is a positive opinion or a negative opinion using the opinion determination knowledge stored in the determination knowledge database 9 for each opinion information extracted by the opinion extraction unit 3. Is.

判定知識データベース9に格納される意見判定知識とは、例えば意見が例としてあげた二項関係で表現可能なものである場合は「本体−小さい−肯定的評価」といった三項関係で記述可能な情報である。またこの判定知識データベース9における対象物依存性をなくし、他の対象物に関するアンケートも同じデータベースを使うことを考えて、さらに対象物に関する情報を加えた「本体−小さい−肯定的評価、対象物:情報機器」等の4項関係で記述してもよい。   The opinion judgment knowledge stored in the judgment knowledge database 9 can be described by a ternary relationship such as “body-small-positive evaluation” when the opinion can be expressed by the binary relationship given as an example. Information. Further, considering that the object dependency in the judgment knowledge database 9 is eliminated, and the questionnaire regarding other objects is also used in the same database, information on the object is further added to “main body-small-positive evaluation, object: It may be described in terms of four terms such as “information equipment”.

このような判定知識を格納した判定知識データベースを具備し、抽出した各意見、例えば「本体−小さい」に対してこの判定知識データベースを検索し、例えば「本体−小さい−肯定的評価」を得ることで、この処理が実現できる。   A judgment knowledge database storing such judgment knowledge is provided, and the judgment knowledge database is searched for each extracted opinion, for example, “main body-small”, and, for example, “main body-small-positive evaluation” is obtained. This process can be realized.

また、例えば肯定的意見に+1、否定的意見に−1という得点(重み)を与えて一つの回答文において得られた複数の意見の得点の和をある一つの回答文について総合的な評価とみなすことで回答文単位の対象物の評価を求めることができる。   Also, for example, by giving a score (weight) of +1 to a positive opinion and -1 to a negative opinion, the sum of the scores of a plurality of opinions obtained in one answer sentence can be comprehensively evaluated for one answer sentence. By considering it, it is possible to request the evaluation of the object in response sentence units.

さらに、判定結果を肯定的評価/否定的評価といった2値ではなく、多値をとるものとして、例えば評価にさらに「強い肯定」、「強い否定」を加えて4値として、評価の強さに応じた得点を与えることで、より精度の良い判定を図ることもできる。また各評価値を評価関数で表現し、束値論理に基づく合成、いわゆる「ファジー推論」を行って総合評価を算出することも可能である。   Furthermore, the determination result is not a binary value such as a positive evaluation / negative evaluation, but takes a multi-value, for example, by adding “strong positive” and “strong negative” to the evaluation to give a four-value to the strength of the evaluation. A more accurate determination can also be achieved by giving a corresponding score. It is also possible to express each evaluation value by an evaluation function and calculate a comprehensive evaluation by performing synthesis based on bundle value logic, so-called “fuzzy inference”.

判定知識獲得部7は、判定知識を、人手を用いることなく、自動的に獲得するものである。意見判定部6で使用される判定知識は対象物依存の知識であり、その整備にはコストがかかる。この問題を解決するためには、アンケート回答文より自動的に判定知識を獲得すればよい。   The determination knowledge acquisition unit 7 automatically acquires the determination knowledge without using human hands. The judgment knowledge used by the opinion judgment unit 6 is object-dependent knowledge, and its maintenance is costly. In order to solve this problem, it is only necessary to automatically obtain judgment knowledge from a questionnaire response sentence.

第1の手法として、特に抽出した意見を判定する際の知識を判定形式のアンケート調査票におけるアンケート回答結果より自動的に獲得して蓄積するものである。   As a first method, the knowledge for judging the extracted opinion is automatically acquired and accumulated from the questionnaire response result in the questionnaire questionnaire in the judgment format.

運用初期においては、判定知識データベース9内に十分な判定知識が格納されていないので、アンケートの各質問については、例えば「本製品について、良いと思われた点をご記入下さい」といった、質問に対する回答結果の評価が明らかになるような設問とし、そこに記載された回答文より意見を抽出して、回答に予想される評価を合わせて判定知識として判定知識データベースに格納するものである。   In the initial stage of operation, sufficient judgment knowledge is not stored in the judgment knowledge database 9, so for each question in the questionnaire, for example, “Please fill in the points that you think are good about this product” The question is such that the evaluation of the answer result is clarified, the opinion is extracted from the answer sentence described therein, and the expected evaluation of the answer is combined and stored in the judgment knowledge database as judgment knowledge.

また対象物に対してその評価すべき属性が予め判明している場合には、設問として「本製品の以下の事項について、感じたことを以下より選択し、そう感じた理由をご記入下さい」などとし、次に「画面」、「キーボード」・・・といった評価すべき属性を並べて、回答箇所には「大変良い−良い−普通−悪い−大変悪い」といった選択肢記入項目とその理由を記入する自由記述項目の2つを設け、アンケート結果を電子化した結果より、事項例えば「画面」と自由記述部分からの術語、例えば「大きくて見やすいから」という記述から、「大きい」、「見やすい」を抽出し、その組をもって意見を作成し、それに選択部分の評価値、例えば良い、を合わせて判定知識を作成する。例えば「画面−大きい−肯定的評価」及び「画面−見やすい−肯定的評価」を作成する。このような処理で獲得された知識を判定知識データベース9に格納することで、以後の処理で利用することが可能となる。前記各処理は、図1に示す第1判定知識獲得部7−1が行う。   In addition, when the attribute to be evaluated for the object is known in advance, the question is “Please select what you feel about the following items of this product from the following, and enter the reason why you feel it” Next, arrange the attributes to be evaluated such as “screen”, “keyboard”, etc., and enter the option entry item “very good-good-normal-bad-very bad” and the reason in the answer part. Two free description items are provided, and the results of digitizing the questionnaire results indicate that items such as “screen” and the terminology from the free description part, for example, “large and easy to see”, “large” and “easy to see” Extraction is made, an opinion is created based on the set, and judgment knowledge is created by combining the evaluation value of the selected portion, for example, good. For example, “screen-large-positive evaluation” and “screen-easy to read-positive evaluation” are created. By storing the knowledge acquired by such processing in the judgment knowledge database 9, it can be used in the subsequent processing. Each process is performed by the first determination knowledge acquisition unit 7-1 shown in FIG.

第2の手法としては、前記のように、運用初期に特別の設問を設定しなくとも判定知識を獲得するようにしたものであり、図1に示す第2判定知識獲得部7−2が処理を行うものである。   As described above, as described above, the determination knowledge is acquired without setting a special question at the initial stage of operation as described above, and the second determination knowledge acquisition unit 7-2 shown in FIG. Is to do.

これは、例えば「画面が見やすくて良い」という回答文からは「画面−見やすい」、「画面−良い」という2つの意見が抽出できるが、その一つの第二項が予め与えてある評価を表している語である場合、この例では「良い」が予め与えられている評価を表しているので、この知識を「良い−肯定的評価」という二項関係で表現する。そしてこの2つをマージして「画面−見やすい−肯定的評価」という判定知識情報を獲得することができる。   This is because, for example, two opinions “screen-easy to see” and “screen-good” can be extracted from an answer sentence “screen is easy to see”, and one of the second terms represents an evaluation given in advance. In this example, since “good” represents an evaluation given in advance, this knowledge is expressed by a binary relation of “good-positive evaluation”. Then, by combining these two, it is possible to acquire the determination knowledge information “screen−easy to see−positive evaluation”.

この手法は、判定知識の抽出だけでなく、運用の初期状態で装置に与えていない評価を表している語を獲得することも可能である。これは、例えば「良い−肯定的評価」という知識を予め装置に与えて、前記の例文より「画面−見やすい−肯定的評価」という判定知識を獲得したとする。   This method can not only extract judgment knowledge but also obtain words representing evaluations that are not given to the apparatus in the initial state of operation. For example, it is assumed that knowledge of “good—positive evaluation” is given to the apparatus in advance, and determination knowledge “screen—easy to see—positive evaluation” is acquired from the above example sentence.

次に「画面が見やすくて素晴らしい」という回答文より「画面−見やすい」、「画面−素晴らしい」といった二つの意見が抽出されるが、前記獲得した判定知識より「画面−見やすい」は肯定的評価であることが分かるので、「素晴らしい−肯定的評価」といった新たな知識を得ることができる。このように「見やすい」「素晴らしい」は肯定的評価であることを判定知識データベース9に格納し、以後の処理に利用することで、知識の学習機能を実現することができる。   Next, two opinions such as “screen—easy to see” and “screen—great” are extracted from the answer sentence “screen is easy to see and great”. Knowing that there is new knowledge such as “Excellent-Positive Evaluation”. The knowledge learning function can be realized by storing in the judgment knowledge database 9 that “easy to see” and “great” are positive evaluations in this way and using them in subsequent processing.

以上で述べた処理はすべてコンピュータで人手を要せずに処理可能である。なお前記第1の手法、第2の手法の判定知識獲得方式は排反ではなく、この両方を組み合わせたものも構成できる。   All of the processes described above can be processed by a computer without requiring manual operation. Note that the determination knowledge acquisition methods of the first method and the second method are not rejected, and a combination of both can be configured.

集計知識データベース8には、回答文を集計するために必要なデータが格納されるものであり、例えば、反意語データベース、同義語データベース、シソーラス、実世界知識等が格納されている。   The tabulated knowledge database 8 stores data necessary for tabulating answer sentences. For example, an antonym database, a synonym database, a thesaurus, real world knowledge, and the like are stored.

判定知識データベース9には回答文が肯定的(好意的)意見なのか否定的意見なのかを判定するために必要なデータが格納されるものであり、例えば品詞、意見判定知識、「第1項+第2項+評価」、「第1項+第2項+評価+対象分野」、肯定的意見と否定的意見が混在するときの各意見に対する点数(重みづけ)等が格納されている。   The judgment knowledge database 9 stores data necessary for judging whether the answer sentence is a positive (favorable) opinion or a negative opinion. For example, part of speech, opinion judgment knowledge, “first item” “+ 2nd term + evaluation”, “1st term + second term + evaluation + target field”, points (weighting) for each opinion when a positive opinion and a negative opinion are mixed are stored.

集計結果格納データベース10は、本発明により得られた集計結果を一時格納するものであり、図3、図4に示す集計データや、図5に示す表示データ等が格納されるものである。   The totaling result storage database 10 temporarily stores the totaling results obtained by the present invention, and stores the totaling data shown in FIGS. 3 and 4, the display data shown in FIG.

プロセッサ20は、本発明の自然処理装置を構成するものであり、例えば回答抽出部2、意見抽出部3、意見集計部4、結果提示部5、意見判定部6、判定知識獲得部7等を具備している。   The processor 20 constitutes the natural processing apparatus of the present invention, and includes, for example, an answer extraction unit 2, an opinion extraction unit 3, an opinion totaling unit 4, a result presentation unit 5, an opinion determination unit 6, a determination knowledge acquisition unit 7, and the like. It has.

表示部21は、本発明の処理結果をアンケート分析者Bが表示して、その処理結果を見るためのものであり、ディスプレイやプリンタ等で構成される。   The display unit 21 is for the questionnaire analyst B to display the processing result of the present invention and view the processing result, and is configured by a display, a printer, or the like.

図1に示す本発明の実施の形態の動作を図7に示すフローチャートに従って説明する。   The operation of the embodiment of the present invention shown in FIG. 1 will be described according to the flowchart shown in FIG.

S1.アンケート回答者Aからアンケートに対する回答が、例えばファクシミリや電子情報で入力部1に入力される。入力部1では、この回答結果を回答抽出部2に送出する。   S1. An answer to the questionnaire from the questionnaire respondent A is input to the input unit 1 by facsimile or electronic information, for example. The input unit 1 sends this answer result to the answer extraction unit 2.

S2.回答抽出部2は、この回答結果、特に自由記述部分を電子テキスト化し、回答文として抽出する処理を行う。そしてこの電子化された回答文を意見抽出部3に送出する。   S2. The answer extracting unit 2 converts the answer result, particularly a free description part, into an electronic text and extracts it as an answer sentence. Then, this electronic response sentence is sent to the opinion extraction unit 3.

S3.意見抽出部3は、この電子化された回答文を形態素解析し、構文解析手段3−2を用いて構文木に変換し、二項関係あるいは三項関係等を作成し、回答文より意見の抽出を行う。そしてこれを意見集計部4に送出する。   S3. The opinion extraction unit 3 performs a morphological analysis on the digitized answer sentence, converts it into a syntax tree using the syntax analysis unit 3-2, creates a binary relation or a ternary relation, and the like. Perform extraction. Then, this is sent to the opinion totaling unit 4.

S4.意見集計部4は、前記意見抽出部3が抽出した意見を、例えば二項関係毎にその出現頻度を集計する。このとき意見抽出部3が抽出した意見が肯定的意見か、否定的意見かを意見判定部6が判定知識データベースに格納された意見判定知識を用いて判定する。   S4. The opinion totaling unit 4 totals the appearance frequencies of the opinions extracted by the opinion extracting unit 3 for each binary relationship, for example. At this time, the opinion determination unit 6 determines whether the opinion extracted by the opinion extraction unit 3 is a positive opinion or a negative opinion using the opinion determination knowledge stored in the determination knowledge database.

S5.意見集計部4は、このように意見抽出部3が抽出した意見の出現頻度を集計し、意見判定部6を介して意見抽出部3が抽出した意見が肯定的か否定的かを判定し、また集計知識データベース8の同義語データベースをアクセスして同義意見を認識する。そして図3に示す如き、意見集計表を作成する。   S5. The opinion totaling unit 4 totals the appearance frequency of the opinions extracted by the opinion extracting unit 3 in this way, determines whether the opinion extracted by the opinion extracting unit 3 via the opinion determining unit 6 is positive or negative, Further, the synonym database of the total knowledge database 8 is accessed to recognize synonymous opinions. Then, an opinion summary table is created as shown in FIG.

S6.このようにして作成された意見集計が結果提示部5に送出されると、結果提示部5では、これを加工してアンケート分析者Bがアンケート結果を分析し易い形で提示する処理を行う。例えば、図4に示す如く、表形式にして提示してもよく、またアンケート分析者の解析目的に合致した表やグラフを作成して提示してもよい。また図5に示す如く、ポインテングデバイスで指定されたときその部分を更に詳述表示するように提示してもよい。   S6. When the opinion total created in this way is sent to the result presenting unit 5, the result presenting unit 5 processes the processed result and presents the questionnaire result in an easy-to-analyze manner for the questionnaire analyst B. For example, as shown in FIG. 4, it may be presented in a table format, or a table or graph that matches the analysis purpose of a questionnaire analyst may be created and presented. Further, as shown in FIG. 5, when a pointing device is designated, the portion may be presented to be displayed in more detail.

ところで、図6に示す回答文が入力されたとき、本発明では意見抽出部3が意見判定部6とともに、この回答文を形態素解析して、前半の文の主語−述語が「野球−思って」であり、「が」が否定接続詞であることを認識して、「野球−思って−否定」を認識する。   By the way, when the answer sentence shown in FIG. 6 is input, in the present invention, the opinion extraction unit 3 and the opinion determination unit 6 perform morphological analysis on the answer sentence, and the subject-predicate of the first half sentence is “baseball-I think. "," Recognizing that "ga" is a negative conjunction and recognizing "baseball-thinking-negative".

そして後半の文の主語−述語が「ゴルフ−良い」であり良いの評価が肯定であることより「ゴクフ−良い−肯定」を認識する。このようにして図6の回答文は「野球ではなく−ゴルフ」ということを得る。   Then, since the subject-predicate of the latter half sentence is “golf-good” and the evaluation of good is affirmative, “gokufu-good-affirmation” is recognized. In this way, the reply sentence in FIG. 6 obtains “not golf but baseball—golf”.

なお、前記説明では、本発明をアンケート回答文の処理の例について説明したが、本発明は勿論これに限定されるものではない。   In the above description, the present invention has been described with respect to an example of a questionnaire response sentence processing. However, the present invention is not limited to this.

なお前記回答抽出部2、意見抽出部3、意見集計部4、結果提示部5、意見判定部6、判定知識獲得部7等は、例えばプログラムで構成処理することが出来る。   The answer extraction unit 2, the opinion extraction unit 3, the opinion totaling unit 4, the result presentation unit 5, the opinion determination unit 6, the determination knowledge acquisition unit 7, and the like can be configured and processed by a program, for example.

本発明の形態を付記に記載する。   The form of this invention is described in an appendix.

(付記1)複数の意見提供者から提供された意見を解析する自然文処理装置において、提供された意見から意見提供者の自由記述部分の電子化データを意見提供の回答文として抽出する回答抽出手段と、抽出した回答文より、単語対を抽出する意見抽出手段と、抽出した意見内容毎の集計を行う意見集計手段と、この意見内容毎の集計結果を提供する結果提供手段を具備したことを特徴とする自然文処理装置。   (Supplementary note 1) In a natural sentence processing device that analyzes opinions provided by a plurality of opinion providers, the answer extraction is to extract the electronic data of the free description portion of the opinion provider from the provided opinions as a reply sentence for providing the opinions. Means, opinion extraction means for extracting word pairs from the extracted answer sentences, opinion totaling means for totaling each extracted opinion content, and result providing means for providing a total result for each opinion content Natural sentence processing device characterized by.

(付記2)前記付記1に記載の自然文処理装置において、抽出した意見が肯定的評価を与えているのか否定的評価を与えているのかを判定する意見判定手段と、意見を判定するための知識を格納する判定知識データベースを具備したことを特徴とする自然文処理装置。   (Additional remark 2) In the natural sentence processing apparatus of the said additional remark 1, the opinion determination means which determines whether the extracted opinion has given positive evaluation or negative evaluation, and for determining an opinion A natural sentence processing apparatus comprising a judgment knowledge database for storing knowledge.

(付記3)前記付記2に記載の自然文処理装置において、一つの回答文において、肯定意見と否定意見の2つが得られた場合、その強さを判定し、回答文の総合的な肯定・否定を判定する意見判定手段を具備したことを特徴とする自然文処理装置。   (Supplementary note 3) In the natural sentence processing device described in the supplementary note 2, when two affirmative opinions and negative opinions are obtained in one reply sentence, the strength is determined, and a comprehensive confirmation of the reply sentence is made. A natural sentence processing apparatus comprising an opinion determining means for determining negative.

(付記4)前記付記1、付記2記載の自然文処理装置において、提示情報を全体集合を変化させた複数のグラフで表示する提示手段を具備したことを特徴とする自然文処理装置。   (Additional remark 4) The natural sentence processing apparatus of Additional remark 1 and Additional remark 2 WHEREIN: The presentation means which displays presentation information by the some graph which changed the whole set was provided, The natural sentence processing apparatus characterized by the above-mentioned.

(付記5)前記付記2、付記3記載の自然文処理装置において、特に抽出した意見を判定する際の知識を、特定形式の意見調査票における回答結果より自動的に獲得して蓄積する判定知識獲得手段を具備したことを特徴とする自然文処理装置。   (Additional remark 5) In the natural sentence processing apparatus according to the above additional remarks 2 and 3, determination knowledge for automatically acquiring and accumulating knowledge for determining an opinion extracted in particular from an answer result in a specific form opinion survey form A natural sentence processing apparatus comprising an acquisition means.

(付記6)前記付記2、付記3記載の自然文処理装置において、特に抽出した意見を判定する際の知識を、回答文内の特定の表現パターンより自動的に獲得して蓄積する判定知識獲得手段を具備したことを特徴とする自然文処理装置。   (Supplementary note 6) In the natural sentence processing apparatus according to supplementary notes 2 and 3, particularly, knowledge for judging the extracted opinion is acquired automatically from a specific expression pattern in the answer sentence and acquired. A natural sentence processing apparatus characterized by comprising means.

(付記7)コンピュータを、複数の意見提供者から提供された意見を解析する自然文処理手段として動作させるために、提供された意見から意見提供者の自由記述部分の電子化データを意見提供の回答文として抽出する回答抽出手段、抽出した回答文より、単語対を抽出する意見抽出手段、抽出した意見内容毎の集計を行う意見集計手段、この意見内容毎の集計結果を提供する結果提供手段として機能させるための自然文処理用プログラム。   (Supplementary note 7) In order to operate the computer as a natural sentence processing means for analyzing opinions provided by a plurality of opinion providers, the electronic data of the free description part of the opinion provider is provided from the provided opinions. Answer extracting means for extracting as answer sentences, opinion extracting means for extracting word pairs from the extracted answer sentences, opinion counting means for counting for each extracted opinion content, and result providing means for providing a total result for each opinion content Natural sentence processing program to function as

本発明の実施の形態である。It is an embodiment of the present invention. 本発明における意見抽出説明図である。It is opinion extraction explanatory drawing in this invention. 本発明における意見集計結果説明図である。It is an opinion total result explanatory drawing in the present invention. 本発明における集計結果説明図である。It is an aggregation result explanatory view in the present invention. 本発明におけるグラフ状態説明図である。It is a graph state explanatory view in the present invention. 本発明における回答文解析例である。It is an example of an answer sentence analysis in the present invention. 本発明の動作状態説明図である。It is an operation state explanatory view of the present invention.

符号の説明Explanation of symbols

1 入力部
2 回答抽出部
3 意見抽出部
4 意見集計部
5 結果提示部
6 意見判定部
7 判定知識獲得部
8 集計知識データベース
9 判定知識データベース
10 集計結果格納データベース
20 プロセッサ
21 表示部
DESCRIPTION OF SYMBOLS 1 Input part 2 Answer extraction part 3 Opinion extraction part 4 Opinion extraction part 5 Result presentation part 6 Opinion judgment part 7 Determination knowledge acquisition part 8 Total knowledge database 9 Determination knowledge database 10 Total result storage database 20 Processor 21 Display part

Claims (5)

単語対情報とその単語対情報が肯定的表現か否定的表現かを対応付けて格納する判定知識データベースと、
到来する電子テキストデータより電子テキストデータ内の単語対を抽出する構文解析手段と、
前記構文解析手段により抽出された単語対情報を元に、前記判定知識データベースを参照してアンケート情報内の単語に対して肯定的意見か否定的意見かを判定する意見判定部と、
を有することを特徴とする自然文処理装置。
A judgment knowledge database that stores word pair information in association with whether the word pair information is a positive expression or a negative expression;
A syntax analysis means for extracting word pairs in the electronic text data from the incoming electronic text data;
Based on the word pair information extracted by the syntax analysis means, an opinion determination unit that determines whether the opinion is a positive opinion or a negative opinion with respect to the words in the questionnaire information with reference to the determination knowledge database;
The natural sentence processing apparatus characterized by having.
集計結果を蓄積する蓄積手段を有し、
前記構文解析手段は、複数のアンケート情報の自由記載部分を電子テキストデータとして抽出し、
前記構文解析手段は、前記抽出部が電子テキストデータとして抽出した各々のアンケート情報の構文解析を行い、単語対を抽出するとともに、
更に、前記意見判定部が判定した複数のアンケート情報の判定結果の集計を行い、該集計結果を前記蓄積手段に蓄積する意見集計部と、
を有することを特徴とする請求項1に記載の自然文処理装置。
It has a storage means to store the total results,
The syntax analysis means extracts free description parts of a plurality of questionnaire information as electronic text data,
The syntax analysis means performs syntax analysis of each questionnaire information extracted as electronic text data by the extraction unit, extracts word pairs,
Furthermore, the opinion totaling unit that aggregates the determination results of the plurality of questionnaire information determined by the opinion determination unit and accumulates the totalization results in the storage unit;
The natural sentence processing apparatus according to claim 1, comprising:
前記構文解析手段は電子テキストデータを構文木に変換した情報を基に単語対を抽出する事を特徴とする請求項1または請求項2に記載の自然文処理装置。   The natural sentence processing apparatus according to claim 1, wherein the syntax analysis unit extracts a word pair based on information obtained by converting electronic text data into a syntax tree. 単語対情報とその単語対情報が肯定的表現か否定的表現かを対応付けて格納する判定知識データベースにアクセス可能なコンピュータを、
到来する電子テキストデータより電子テキストデータ内の単語対を抽出する構文解析手段と、
前記構文解析手段により抽出された単語対情報を元に、前記判定知識データベースを参照してアンケート情報内の単語に対して肯定的意見か否定的意見かを判定する意見判定部と、
して機能させる自然言語処理用プログラム。
A computer capable of accessing a judgment knowledge database that stores word pair information in association with whether the word pair information is a positive expression or a negative expression,
A syntax analysis means for extracting word pairs in the electronic text data from the incoming electronic text data;
Based on the word pair information extracted by the syntax analysis means, an opinion determination unit that determines whether the opinion is a positive opinion or a negative opinion with respect to the words in the questionnaire information with reference to the determination knowledge database;
Natural language processing program that makes it work.
単語対情報とその単語対情報が肯定的表現か否定的表現かを対応付けて格納する判定知識データベースにアクセス可能なコンピュータが、
到来する電子テキストデータより電子テキストデータ内の単語対を抽出する構文解析ステップと、
前記構文解析ステップにより抽出された単語対情報を元に、前記判定知識データベースを参照してアンケート情報内の単語に対して肯定的意見か否定的意見かを判定する意見判定ステップと、
を実行する事を特徴とする自然言語処理方法。
A computer that can access a judgment knowledge database that stores word pair information in association with whether the word pair information is a positive expression or a negative expression,
A parsing step for extracting word pairs in the electronic text data from the incoming electronic text data;
Based on the word pair information extracted by the parsing step, an opinion determination step for determining whether the opinion in the questionnaire information is a positive opinion or a negative opinion with reference to the determination knowledge database;
Natural language processing method characterized by executing
JP2005133969A 2000-08-21 2005-05-02 Natural sentence processing apparatus and natural sentence processing program Expired - Lifetime JP3917629B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005133969A JP3917629B2 (en) 2000-08-21 2005-05-02 Natural sentence processing apparatus and natural sentence processing program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2000249313 2000-08-21
JP2005133969A JP3917629B2 (en) 2000-08-21 2005-05-02 Natural sentence processing apparatus and natural sentence processing program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001245870A Division JP2002140465A (en) 2000-08-21 2001-08-14 Natural sentence processor and natural sentence processing program

Publications (2)

Publication Number Publication Date
JP2005322239A true JP2005322239A (en) 2005-11-17
JP3917629B2 JP3917629B2 (en) 2007-05-23

Family

ID=35469437

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005133969A Expired - Lifetime JP3917629B2 (en) 2000-08-21 2005-05-02 Natural sentence processing apparatus and natural sentence processing program

Country Status (1)

Country Link
JP (1) JP3917629B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007219880A (en) * 2006-02-17 2007-08-30 Fujitsu Ltd Reputation information processing program, method, and apparatus
JP2007226460A (en) * 2006-02-22 2007-09-06 Just Syst Corp Data processor and data processing method
JP2010079826A (en) * 2008-09-29 2010-04-08 Nec Biglobe Ltd Information processor, and contrast information output method and program
WO2010120679A3 (en) * 2009-04-12 2011-03-03 The Brookeside Group, Inc. Emotivity and vocality measurement
JP2013105226A (en) * 2011-11-11 2013-05-30 Fujitsu Ltd Received mail sorting device, received mail sorting program, and received mail sorting method
WO2017203681A1 (en) * 2016-05-27 2017-11-30 楽天株式会社 Information processing device, information processing method, program, and storage medium

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101007284B1 (en) 2008-09-23 2011-01-13 주식회사 버즈니 System and method for searching opinion using internet
US20110179009A1 (en) * 2008-09-23 2011-07-21 Sang Hyob Nam Internet-based opinion search system and method, and internet-based opinion search and advertising service system and method
KR101158860B1 (en) * 2009-12-31 2012-06-25 에이든 정일 조 Method for searching subjective analysis according to mental status and system therefor

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007219880A (en) * 2006-02-17 2007-08-30 Fujitsu Ltd Reputation information processing program, method, and apparatus
JP2007226460A (en) * 2006-02-22 2007-09-06 Just Syst Corp Data processor and data processing method
JP2010079826A (en) * 2008-09-29 2010-04-08 Nec Biglobe Ltd Information processor, and contrast information output method and program
WO2010120679A3 (en) * 2009-04-12 2011-03-03 The Brookeside Group, Inc. Emotivity and vocality measurement
US8438037B2 (en) 2009-04-12 2013-05-07 Thomas M. Cates Emotivity and vocality measurement
JP2013105226A (en) * 2011-11-11 2013-05-30 Fujitsu Ltd Received mail sorting device, received mail sorting program, and received mail sorting method
WO2017203681A1 (en) * 2016-05-27 2017-11-30 楽天株式会社 Information processing device, information processing method, program, and storage medium

Also Published As

Publication number Publication date
JP3917629B2 (en) 2007-05-23

Similar Documents

Publication Publication Date Title
JP3917629B2 (en) Natural sentence processing apparatus and natural sentence processing program
JP4870448B2 (en) Information processing apparatus, customer needs analysis method, and program
CN100461183C (en) Metadata automatic extraction method based on multiple rule in network search
CN103136329B (en) Multiple queries revision models integrated
US20130198195A1 (en) System and method for identifying one or more resumes based on a search query using weighted formal concept analysis
WO2019203156A1 (en) Chatbot search system, chatbot search method, and program
US20040029085A1 (en) Summarisation representation apparatus
JP4547500B2 (en) Search device and program
US20060078862A1 (en) Answer support system, answer support apparatus, and answer support program
CN103810251B (en) Method and device for extracting text
CN102054024A (en) Information processing apparatus, information extracting method, program, and information processing system
Demir et al. Interactive sight into information graphics
JP2002140465A (en) Natural sentence processor and natural sentence processing program
JP5213098B2 (en) Question answering method and system
US20220327445A1 (en) Workshop assistance system and workshop assistance method
JP3583631B2 (en) Information mining method, information mining device, and computer-readable recording medium recording information mining program
CN111460119A (en) Intelligent question and answer method and system for economic knowledge and intelligent equipment
JP5265597B2 (en) Document quality evaluation system and document quality evaluation program
JP2010198142A (en) Device, method and program for preparing database in which phrase included in document classified by category
JP2012093870A (en) Request acquisition support system for system development, request acquisition support method, and program
JP5332128B2 (en) Information retrieval apparatus, information retrieval method and program thereof
JP6375367B2 (en) Objection generation method, objection generation system
Kamiński Corpus-based extraction of collocations for near-synonym discrimination
Thanadechteemapat et al. Thai word segmentation for visualization of thai web sites
JP4669642B2 (en) Document classification apparatus, document classification method, and computer-readable recording medium storing a program for causing a computer to execute the document classification method

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060425

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060718

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060914

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061003

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061030

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070208

R150 Certificate of patent or registration of utility model

Ref document number: 3917629

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120216

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130216

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140216

Year of fee payment: 7

EXPY Cancellation because of completion of term