JP2002140465A - Natural sentence processor and natural sentence processing program - Google Patents

Natural sentence processor and natural sentence processing program

Info

Publication number
JP2002140465A
JP2002140465A JP2001245870A JP2001245870A JP2002140465A JP 2002140465 A JP2002140465 A JP 2002140465A JP 2001245870 A JP2001245870 A JP 2001245870A JP 2001245870 A JP2001245870 A JP 2001245870A JP 2002140465 A JP2002140465 A JP 2002140465A
Authority
JP
Japan
Prior art keywords
opinion
answer
opinions
extracted
natural sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001245870A
Other languages
Japanese (ja)
Inventor
Takahiro Saito
孝広 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001245870A priority Critical patent/JP2002140465A/en
Publication of JP2002140465A publication Critical patent/JP2002140465A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To accurately acquire opinions from free description type questionnaire answer sentences or the like without any human labor. SOLUTION: This natural sentence processor for analyzing opinions provided by a plurality of opinion providers A is provided with an answer extracting means 2 for extracting the electronic data of the free description parts of the opinion providers from the provided opinions as the answer sentences of opinion provision, an opinion extracting means 3 for extracting pairs of words from the extracted answer sentences, an opinion totaling means 4 for totaling the respective extracted opinion contents, and a result providing means 5 for providing the totaled result of the respective opinion contents.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は自由記述式で書かれ
た自然文処理装置及び自然文処理用プログラムに係り、
例えば市場調査等の際に行われるアンケートの回答が自
然文で行われたとき、これをアンケートの結果として分
析する文書処理装置及び文書処理用プログラムに関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a natural sentence processing device and a natural sentence processing program written in free description format.
For example, the present invention relates to a document processing apparatus and a document processing program for analyzing, as a result of a questionnaire, a response to a questionnaire performed in a market research or the like when the answer is a natural sentence.

【0002】[0002]

【従来の技術】各種の調査を行うための手段の1つとし
てアンケートが行われている。アンケートには、回答の
一部あるいは全部が自由記述式文書である自由記述式の
アンケート方式と、アンケート調査票に設問に関して予
め幾つかの選択肢を用意しておき、アンケート回答者に
その中から選ばせる選択方式がある。
2. Description of the Related Art A questionnaire is used as one of means for conducting various surveys. For the questionnaire, a free-form questionnaire system in which some or all of the answers are free-form documents, and a questionnaire questionnaire with several options prepared in advance, and the questionnaire respondents can select from among them There is a selection method to make it.

【0003】自由記述式のアンケート方式は、回答結果
が自然文であり、多数の回答者から有用な情報を得るた
めには人手による集計及び分析が必要であり、非常にコ
ストがかかるといった問題がある。
[0003] The open-ended questionnaire method has a problem that the answer result is a natural sentence, and manual counting and analysis are required to obtain useful information from many respondents, which is very costly. is there.

【0004】この問題を解決する手段として前記選択方
式がある。しかしこの方式の場合は、予め作成された選
択肢以外に関する情報は得ることができず、アンケート
実施者の予期していなかったニーズ等の重要な知識を得
ることができないという問題がある。
[0004] As a means for solving this problem, there is the above-mentioned selection method. However, in the case of this method, there is a problem in that information regarding options other than those created in advance cannot be obtained, and important knowledge such as needs that the questionnaire implementer did not expect cannot be obtained.

【0005】この自由記述式アンケートの集計時のコス
トの軽減を目的として、集計時にコンピュータによる自
動集計を行う、アンケート集計システムが提案(特開平
09−190454号公報)されている。
[0005] A questionnaire totalizing system has been proposed (JP-A-09-190454) for automatically totaling by a computer at the time of totaling in order to reduce the cost of totalizing the free-form questionnaire.

【0006】このアンケート集計システムでは、装置内
にシソーラス辞書を具備し、自由記述文内の単語単位で
シソーラス辞書を検索し、その上位語で結果を統合する
装置である。例えば「硬式野球」と「軟式野球」を、上
位語の「野球」として集計するといった処理を行う装置
である。
[0006] This questionnaire totaling system is a device that has a thesaurus dictionary in the device, searches the thesaurus dictionary for each word in a free description sentence, and integrates the results by its higher terms. For example, it is a device that performs processing such as summing up “hardball baseball” and “softball baseball” as an upper word “baseball”.

【0007】しかし、この統合はあくまでも単語単位で
行われるので、例えばこの装置の説明で挙げられている
アンケートの質問項目「生涯学習の内容は」に対する回
答として、「硬式野球。」と「軟式野球。」を単語のみ
で記述されている文を正しく「野球」として集計するこ
とは可能であるが、しかし、「若い頃は野球だと思って
いましたが、今ではやはりゴルフの方が良いと思いま
す」等の否定的な対象として記述されている場合には正
確な集計が行えないという問題がある。
[0007] However, since this integration is performed on a word-by-word basis, as a response to the question item "contents of lifelong learning" of the questionnaire mentioned in the description of this device, for example, "hardball baseball" and "softball baseball.""." Can be correctly counted as a "baseball" sentence that is described only in words, but "I thought that when I was young, I thought baseball, but now golf is still better. If it is described as a negative object such as "I think", there is a problem that accurate counting cannot be performed.

【0008】またこの方法では正確な集計が殆ど不可能
となる様な質問もある。例えば、「本製品についてご意
見をお聞かせ下さい」といった質問に関しては、アンケ
ート記述者は単語のみで回答を行うことはなく、さらに
その記述が否定的内容なのか、肯定的内容なのかをアン
ケートの趣旨からいえば集計時に区別する必要がある
が、それもこの装置では行えない。
There are also questions that this method makes accurate summarization almost impossible. For example, regarding a question such as "Please give us your opinion about this product", the questionnaire writer does not answer with only words, and also asks whether the description is negative or positive. For the purpose, it is necessary to make a distinction at the time of counting, but this cannot be done with this device.

【0009】つまり、この装置においては、本来の意味
での自由記述式アンケートを、すなわちアンケート実施
者側としてはどんな質問文でも許容し、アンケート記述
側としてはどのような記述も許容するような場合を、正
確に集計することはできない。
In other words, in this device, a free-form questionnaire in the original sense is permitted, that is, any question sentence is permitted as a questionnaire performer, and any description is permitted as a questionnaire description side. Cannot be calculated accurately.

【0010】またアンケート以外にも多数の人間が各々
の意見を述べている例としては、パソコン通信やウェブ
ページにおける掲示板における記事や、ヘルプデスクに
寄せられる顧客の問い合わせなどが挙げられるが、そこ
でも各個人の意見は自然文で記述されており、それらか
ら有用な情報を得るためには自由記述式アンケートの分
析作業と同様のコストがかかるという問題があった。
In addition to the questionnaire, examples in which a large number of people express their opinions include articles in bulletin boards on personal computer communications and web pages, and customer inquiries sent to help desks. The opinion of each individual is described in a natural sentence, and there is a problem that it takes the same cost as the analysis work of the open-ended questionnaire to obtain useful information from them.

【0011】[0011]

【発明が解決しようとする課題】したがって本発明の目
的は、前記の如き自由記述式アンケート等における問題
点を解決し、有用な情報を低コストでかつ正確に獲得す
るようにしたものである。
SUMMARY OF THE INVENTION Accordingly, an object of the present invention is to solve the above-described problems in the free-form questionnaire and the like, and to obtain useful information accurately at low cost.

【0012】また本発明では自由記述式アンケートに限
らず、各個人の意見が自然文の形で記述されている情報
源より有用の情報を低コストでかつ正確に獲得するよう
にしたものである。
Further, the present invention is not limited to a free description type questionnaire, but is intended to obtain useful information accurately and at low cost from an information source in which each individual's opinion is described in the form of a natural sentence. .

【0013】[0013]

【課題を解決するための手段】前記本発明の目的を達成
するための原理構成を図1に示す。図1において、1は
入力部、2は回答抽出部、3は意見抽出部、4は意見集
計部、5は結果提示部、6は意見判定部、7は判定知識
獲得部、8は集計知識データベース、9は判定知識デー
タベース、10は集計結果格納データベースである。
FIG. 1 shows a principle configuration for achieving the object of the present invention. In FIG. 1, 1 is an input unit, 2 is an answer extracting unit, 3 is an opinion extracting unit, 4 is an opinion totaling unit, 5 is a result presenting unit, 6 is an opinion determining unit, 7 is a judgment knowledge acquiring unit, and 8 is totaling knowledge. Reference numeral 9 denotes a judgment knowledge database, and reference numeral 10 denotes a tally result storage database.

【0014】本発明の前記課題は下記(1)〜(7)の
構成により達成することができる。
The above object of the present invention can be achieved by the following constitutions (1) to (7).

【0015】(1)複数の意見提供者から提供された意
見を解析する自然文処理装置において、提供された意見
から意見提供者の自由記述部分の電子化データを意見提
供の回答文として抽出する回答抽出手段2と、抽出した
回答文より、単語対を抽出する意見抽出手段3と、抽出
した意見内容毎の集計を行う意見集計手段4と、この意
見内容毎の集計結果を提供する結果提供手段5を具備し
たことを特徴とする。
(1) In a natural sentence processing apparatus that analyzes opinions provided by a plurality of opinion providers, digitized data of a free description portion of the opinion provider is extracted from the provided opinions as a reply sentence for providing an opinion. Answer extracting means 2, Opinion extracting means 3 for extracting word pairs from the extracted answer sentences, Opinion totaling means 4 for totalizing each extracted opinion content, and providing results for providing the totaling result for each opinion content It is characterized by comprising means 5.

【0016】(2)前記(1)に記載の自然文処理装置
において、抽出した意見が肯定的評価を与えているのか
否定的評価を与えているのかを判定する意見判定手段6
と、意見を判定するための知識を格納する判定知識デー
タベース9を具備したことを特徴とする。
(2) In the natural sentence processing apparatus according to (1), opinion judging means 6 for judging whether the extracted opinion gives a positive evaluation or a negative evaluation.
And a judgment knowledge database 9 for storing knowledge for judging opinions.

【0017】(3)前記(2)に記載の自然文処理装置
において、一つの回答文において、肯定意見と否定意見
の2つが得られた場合、その強さを判定し、回答文の総
合的な肯定・否定を判定する意見判定手段6を具備した
ことを特徴とする。
(3) In the natural sentence processing apparatus according to the above (2), when two positive opinions and negative opinions are obtained in one answer sentence, the strength is determined and the overall answer sentence is determined. It is characterized by having opinion judgment means 6 for judging positive or negative.

【0018】(4)前記(1)、(2)記載の自然文処
理装置において、提示情報を全体集合を変化させた複数
のグラフで表示する結果提示手段5を具備したことを特
徴とする。
(4) The natural sentence processing apparatus according to (1) or (2), further comprising a result presenting means 5 for displaying the presented information as a plurality of graphs in which the whole set is changed.

【0019】(5)前記(2)、(3)記載の自然文処
理装置において、特に抽出した意見を判定する際の知識
を、特定形式の意見調査票における回答結果より自動的
に獲得して蓄積する判定知識獲得手段7−1を具備した
ことを特徴とする。
(5) In the natural sentence processing apparatus according to the above (2) or (3), knowledge for judging an extracted opinion is automatically acquired from an answer result in an opinion survey form of a specific format. It is characterized by comprising judgment knowledge acquiring means 7-1 for accumulating.

【0020】(6)前記(2)、(3)記載の自然文処
理装置において、特に抽出した意見を判定する際の知識
を、回答文内の特定の表現パターンより自動的に獲得し
て蓄積する判定知識獲得手段7−2を具備したことを特
徴とする。
(6) In the natural sentence processing apparatus described in the above (2) or (3), knowledge for judging an extracted opinion is automatically acquired and accumulated from a specific expression pattern in the answer sentence. A determination knowledge acquisition means 7-2 for performing the determination.

【0021】(7)コンピュータを、複数の意見提供者
から提供された意見を解析する自然文処理手段として動
作させるために、提供された意見から意見提供者の自由
記述部分の電子化データを意見提供の回答文として抽出
する回答抽出手段2、抽出した回答文より、単語対を抽
出する意見抽出手段3、抽出した意見内容毎の集計を行
う意見集計手段4、この意見内容毎の集計結果を提供す
る結果提供手段5として機能させるための自然文処理用
プログラムを提供する。
(7) In order to operate the computer as a natural sentence processing means for analyzing opinions provided by a plurality of opinion providers, the computerized data of the free description part of the opinion provider is provided from the provided opinions. Answer extraction means 2 for extracting the provided answer sentence, opinion extracting means 3 for extracting a word pair from the extracted answer sentence, opinion summing means 4 for summing up each extracted opinion content, and summarizing the result of each opinion content. A natural sentence processing program for functioning as the provided result providing means 5 is provided.

【0022】これにより下記の作用効果を奏することが
できる。
As a result, the following functions and effects can be obtained.

【0023】(1)複数の意見提供者から提出された自
由記述部分の回答文より、意見提供者の主張・見解・感
想など単語対を意見として自動的に抽出することができ
るので、多数の自由記述部分の回答文より正確に短時間
で意見を抽出することができる。
(1) Word pairs such as opinions, opinions, and impressions of the opinion provider can be automatically extracted as opinions from the answer sentence of the free description part submitted by a plurality of opinion providers. Opinions can be extracted accurately and in a short time from the answer sentence in the free description part.

【0024】(2)抽出した意見が対象物に関する肯定
的評価を与えているものか、それとも否定的評価を与え
ているものかを、これらを判定するための知識を格納す
る判定知識データベースを検索することにより、正確
に、自動判定することができる。
(2) Searching a judgment knowledge database storing knowledge for judging whether the extracted opinion has given a positive evaluation or a negative evaluation regarding the object. By doing so, it is possible to accurately and automatically determine.

【0025】(3)一つの回答文から肯定意見と否定意
見の両方が得られたときに、その評価の強さを比較して
その回答文における総合的なきめ細かな判定結果を自動
的に得ることができる。
(3) When both positive and negative opinions are obtained from one answer sentence, the strength of the evaluation is compared and a comprehensive and detailed judgment result in the answer sentence is automatically obtained. be able to.

【0026】(4)提示情報を、全体集合を変化させた
複数のグラフで順次表示することができるので、分析結
果をわかり易く提示することができる。
(4) Since the presentation information can be sequentially displayed in a plurality of graphs in which the whole set is changed, the analysis result can be presented in an easily understandable manner.

【0027】(5)抽出した意見を判定する際の知識
を、特定形式の意見調査票における回答結果より自動的
に獲得するので、事前に判定する際の知識を用意するこ
となく、意見判定を行うことができる。しかも学習する
程正確な結果を得ることができる。
(5) Since the knowledge for judging the extracted opinion is automatically acquired from the answer result in the opinion questionnaire of a specific format, the opinion judgment can be made without preparing the knowledge for the judgment in advance. It can be carried out. Moreover, the more accurate the result, the more accurate the result can be obtained.

【0028】(6)抽出した意見を判定する際の知識
を、特定形式の意見調査票を使用することなく、自動的
に獲得することができるので、これまた事前に判定する
際の知識を用意することなく、意見判定を行うことがで
きる。しかも学習する程正確な結果を得ることができ
る。
(6) Since the knowledge for determining the extracted opinion can be automatically acquired without using an opinion survey form of a specific format, the knowledge for determination in advance is prepared. Opinion judgment can be performed without doing. Moreover, the more accurate the result, the more accurate the result can be obtained.

【0029】(7)コンピュータに、提供された意見か
ら意見提供者の自由記述部分の電子化データを意見提供
の回答文として抽出する回答抽出手段、抽出した回答文
より、単語対を抽出する意見抽出手段、抽出した意見内
容毎の集計を行う意見集計手段、この意見内容毎の集計
結果を提供する結果提供手段として機能するプログラム
をインストールすることにより、通常のコンピュータ
を、複数の意見提供者から提供された意見を解析する自
然文処理機能を遂行させることができる。
(7) An answer extracting means for extracting, as a response sentence for providing an opinion, digitized data of a free description portion of the opinion provider from the provided opinion to the computer, and an opinion for extracting a word pair from the extracted answer sentence By installing a program that functions as an extracting unit, an opinion totalizing unit that totals each extracted opinion content, and a result providing unit that provides a totaling result for each opinion content, a normal computer can be installed from multiple opinion providers. A natural sentence processing function for analyzing the provided opinion can be performed.

【0030】[0030]

【発明の実施の形態】本発明の一実施の形態を図1〜図
6にもとづきアンケート回答の分析を例として説明す
る。図1は本発明の実施の形態、図2は意見抽出説明
図、図3は本発明における意見集計結果の一例を示す意
見集計結果説明図、図4は本発明における集計結果の一
例を示す集計結果説明図、図5は本発明のグラフ状態説
明図、図6は本発明の回答文解析例である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described with reference to FIGS. 1 is an embodiment of the present invention, FIG. 2 is an explanatory diagram of opinion extraction, FIG. 3 is an explanatory diagram of an opinion total result showing an example of an opinion total result in the present invention, and FIG. 4 is a total showing an example of a total result in the present invention. FIG. 5 is an explanatory diagram of a result, FIG. 5 is an explanatory diagram of a graph state of the present invention, and FIG. 6 is an analysis example of an answer sentence of the present invention.

【0031】図中、1は入力部、2は回答抽出部、3は
意見抽出部、4は意見集計部、5は結果提示部、6は意
見判定部、7は判定知識獲得部であって第1判定知識獲
得部7−1及び第2判定知識獲得部7−2を具備するも
の、8は集計知識データベース、9は判定知識データベ
ース、10は集計結果格納データベース、20はプロセ
ッサ、21は表示部、Aはアンケート回答者、Bはアン
ケート分析者である。
In the figure, 1 is an input section, 2 is an answer extracting section, 3 is an opinion extracting section, 4 is an opinion totaling section, 5 is a result presenting section, 6 is an opinion judging section, and 7 is a judgment knowledge acquiring section. A first knowledge acquiring unit 7-1 and a second knowledge acquiring unit 7-2, 8 is a total knowledge database, 9 is a judgment knowledge database, 10 is a total result storage database, 20 is a processor, and 21 is a display. A is a questionnaire respondent and B is a questionnaire analyst.

【0032】入力部1は、アンケート回答者Aがアンケ
ート用紙に各々の回答を入力し、この回答を装置に回収
する処理を行うものである。この回答を回収する処理と
しては、例えば紙媒体のアンケート調査票をアンケート
対象者に直接配布したり、あるいはファックスなどで配
布し、そこに回答を記入させて結果を回収する手法や、
電子メールやウェブ掲示板を用いて調査票の配布と回答
記入及び回収を行うこと等で実現可能である。
The input section 1 is for the questionnaire respondent A to input each answer to a questionnaire sheet and to collect the answers in the apparatus. As a process for collecting this answer, for example, a paper questionnaire questionnaire can be directly distributed to the questionnaire target, or distributed by fax, etc.
This can be realized by distributing a survey form, entering a response, and collecting it using an electronic mail or a web bulletin board.

【0033】アンケート調査票の回答回収やファックス
による回答回収の場合は、回答記入欄が固定されている
ので、用紙の座標位置により検出できる。このような回
答を回収する処理には、従来のアンケート結果回収のた
めの手段をそのまま流用可能である。
In the case of collecting a response to a questionnaire or collecting a response by facsimile, since the answer entry column is fixed, it can be detected by the coordinate position of the sheet. In the process of collecting such answers, the conventional means for collecting questionnaire results can be used as it is.

【0034】なお入力部1としては以上のような文字情
報によるものを扱うもののみに限定されるものでてはな
く、電話応答などによって対象者の回答を音声データの
形で回収することも可能であり、インターネットを使用
したウェブ上のデータでもよく、回答のメディアとして
あらゆる情報伝達手段が利用可能である。もし翻訳手段
が具備されていれば外国語で入力することもできる。
Note that the input unit 1 is not limited to the one that handles character information as described above, and it is also possible to collect the answer of the subject in the form of voice data by telephone response or the like. However, data on the Web using the Internet may be used, and any information transmission means can be used as a medium for answering. If translation means is provided, it can be input in a foreign language.

【0035】回答抽出部2は、回収された個々のアンケ
ート回答結果の中の自由記述部分を電子テキスト化し、
回答文として抽出する処理を行うものである。この処理
は、例えば回収した紙媒体によるアンケート回答をアン
ケート実施者側のオペレータがキーボードなどの電子化
データ入力手段で電子化テキストを作成する方法や、回
答メディアに応じて適当な自動電子化手段、例えば文字
認識装置や音声認識装置を用いて入手をかけることなく
電子化テキストを作成する方法などで実現される。
The answer extraction unit 2 converts the free description part in the collected individual questionnaire answer results into electronic text,
This is a process for extracting a response sentence. This processing is, for example, a method in which a questionnaire response on a collected paper medium is used by an operator on the side of the questionnaire to create digitized text using digitized data input means such as a keyboard, or an appropriate automatic digitizing means depending on the answer medium, For example, it is realized by a method of creating digitized text without using a character recognition device or a voice recognition device.

【0036】またアンケートの入力部1に採用した手段
によっては、回収した回答が既に電子化されている場合
があるが、このような場合はその電子化されている自由
記述部分をそのまま意見抽出部3に送出することができ
る。
Depending on the means used in the questionnaire input unit 1, the collected answers may already be digitized. In such a case, the digitized free description part is directly used as the opinion extraction unit. 3 can be sent.

【0037】意見抽出部3は、回答抽出部2が作成した
電子化された回答文を解析し、回答文のいわんとする情
報を意見として抽出する処理を行うものである。
The opinion extracting unit 3 analyzes the digitized answer sentence created by the answer extracting unit 2 and extracts information on the answer sentence as an opinion.

【0038】ここで抽出される意見とは、例えばノート
パソコンにおける製品アンケートについて、「本体は小
さいのに画面が大きい。」という回答文の中に含まれて
いる、「本体は小さい」、「画面は大きい」といったア
ンケート集計の際にアンケート実施者が知りたい情報で
ある。
The opinions extracted here include, for example, a product questionnaire on a notebook computer, which is included in the answer sentence "The body is small but the screen is large." Is large "is information that the questionnaire implementer wants to know at the time of questionnaire aggregation.

【0039】この意見抽出処理は、図2に示す如く、回
答文を構文解析手段3−2を用いて構文木に変換してそ
の主語と述語を抽出し、その二項関係「本体−小さ
い」、「画面−大きい」を集計処理単位とすることで実
現される。
In this opinion extraction process, as shown in FIG. 2, the answer sentence is converted into a syntax tree by using the syntax analysis means 3-2 to extract its subject and predicate, and its binary relation "body-small". , "Screen-large" is set as the total processing unit.

【0040】なお、意見として抽出する情報としては、
上記の「主語−述語」の組に限らず、「被修飾語−修飾
語」の関係から例えば「見やすい画面」から「画面−見
やすい」を抽出するなど、種々のものが考えられる。
The information to be extracted as opinions is
Not limited to the above-described "subject-predicate" pair, various things can be considered, such as extracting "screen-easy" from "easy-to-view screen" from the "modified-modifier" relationship.

【0041】また以上のような二項関係に限らず、構文
木の中の三項以上の関係、例えば「主語−目的語−述
語」を意見とすることもできるし、抽出した表記による
関係をさらに意味解釈手段3−1によって意味構造に変
換してそれを意見とすることも可能である。
The opinion is not limited to the above-described binary relation, but may be an opinion based on three or more relations in the syntax tree, for example, "subject-object-predicate". Furthermore, it is also possible to convert it into a semantic structure by the semantic interpreting means 3-1 and use it as an opinion.

【0042】例えば「♯画面→♯美しい」と表す。ここ
で♯はその後方の単語の意味を表す演算子であって、テ
キスト中に出てきた画面のみではなく、例えばその分野
の画面の同義語全体を表すものであり、モニタ、スクリ
ーン、画面、液晶等全体を示す。また→は推論結果を表
す演算子であり、この例では「画面であれば美しいも
の」ということを示す。なお、これらの処理は全てコン
ピュータを用いて行い、人手をかけることなく実現可能
である。
For example, “♯screen → ♯beautiful” is represented. Here, ♯ is an operator representing the meaning of the word behind it, and represents not only the screen appearing in the text but also, for example, the entire synonym of the screen in the field, such as monitor, screen, screen, Shows the entire liquid crystal and the like. In addition, → is an operator representing an inference result, and in this example, indicates that “the screen is beautiful”. Note that all of these processes are performed using a computer, and can be realized without human intervention.

【0043】意見集計部4は、意見抽出部3が抽出した
意見、例えば「本体−小さい」や「画面−大きい」とい
った二項関係毎にその出現頻度を集計する処理を行うも
のである。これにより、例えば図3に示す如く、二項関
係毎の出現頻度を集計することができる。
The opinion totalizing unit 4 performs a process of totalizing the frequency of appearance of each of the opinions extracted by the opinion extracting unit 3, for example, for each binary relation such as "body-small" or "screen-large". As a result, for example, as shown in FIG. 3, the frequency of appearance for each binary relation can be totaled.

【0044】集計方法としては、例えば意見を上記の如
き二項関係とした場合、各意見毎にその数を集計するこ
とに加えて、第一項(「本体−小さい」なら「本体」)
のみによる集計や、第二項(前記の例における「小さ
い」)のみによる集計を行い、それらの集計結果を結果
提示部5に送出することで、分析者Bの分析目的に合致
した情報提示を行うことができる。
As an aggregation method, for example, when opinions are expressed as the above-described binary relation, in addition to totalizing the number for each opinion, the first item (“body” if “body-small”) is used.
By performing tallying with only the second term or tallying with only the second term (“small” in the above example) and sending the tallying result to the result presenting unit 5, information presentation that matches the analysis purpose of the analyst B can be performed. It can be carried out.

【0045】また意見の表現の揺れを吸収した結果を集
計する機能を付与した集計方式もできる。これは、例え
ば否定文から抽出された意見、「本体−大きくない」に
関して、「本体−大きくない」という意見を「本体−小
さい」と同意見として集計を行うといった機能である。
Further, a tallying method having a function of tallying the results of absorbing the fluctuation of the expression of opinions can be used. This is a function of, for example, regarding the opinion extracted from the negative sentence, “body-not large”, summing up the opinion “body-not large” as the same opinion as “body-small”.

【0046】これは例えば、意見集計部4に反意語の肯
定表現を示す反意語データベースを含む集計知識データ
ベース8を接続し、意見の第二項が否定を含む場合、例
えば「大きくない」の肯定表現「大きい」でこの反意語
データベースを検索し、その反意語「小さい」を獲得し
て第一項と組み合わせて「本体−小さい」として集計に
用いることで実現できる。
For example, a total knowledge database 8 including an antonym database showing an atonym of an antonym is connected to the opinion tallying unit 4, and if the second term of the opinion includes a negation, for example, an affirmative expression of "not large" This can be realized by searching this antonym database with "large", acquiring the antonym "small", combining it with the first term, and using it as "body-small" for counting.

【0047】同様の方式で、集計知識データベース8に
同義語データベースを備え、同義語の統一を行うことも
可能である。この処理は、例えば「画面−綺麗」、「ス
クリーン−美しい」といった意見を「画面−美しい」と
して集計することができる。
In a similar manner, it is also possible to equip the total knowledge database 8 with a synonym database and to unify synonyms. In this process, for example, opinions such as “screen-beautiful” and “screen-beautiful” can be totaled as “screen-beautiful”.

【0048】その他シソーラス、実世界知識等を集計知
識データベース8に備えることもできる。実世界知識と
は、例えば「前のものが良かった」という意見を「今の
ものは悪い」と判断し、「操作性は前のものが良かっ
た」という回答文から抽出すべき知識として「操作性は
悪い」と分析するものである。
In addition, a thesaurus, real world knowledge, and the like can be provided in the tallying knowledge database 8. Real-world knowledge means, for example, that the opinion "the previous one was good" is judged to be "the current one is bad", and the knowledge to be extracted from the answer sentence "the previous one was good for operability" The operability is bad. "

【0049】以上の処理を行った結果は、例えば図3に
示す表の様に表される。図3はノートパソコンに関する
ものであり、意見としては「本体−小さい」、「画面−
大きい」、「画面−小さい」・・・が抽出され、その集
計数は200、50、150・・・であり、「本体−小
さい」、「画面−大きい」は好判定結果を示し、「画面
−小さい」は否判定結果を示している。
The result of performing the above processing is shown, for example, in a table shown in FIG. FIG. 3 relates to a notebook personal computer.
.. Are extracted, and the total number is 200, 50, 150..., “Body-small” and “screen-large” indicate favorable determination results, and “screen-large” “Small” indicates a negative determination result.

【0050】そして「本体−小さい」の同義意見として
は「本体−コンパクト」、「ボディ−小さい」・・・
が、「画面−大きい」の同義意見としては「画面−広
い」・・・が、「画面−小さい」の同義意見としては
「画面−狭い」、「画面−大きくない」・・・が存在し
たことを示している。
As the synonymous opinion of "body-small", "body-compact", "body-small" ...
However, as the synonymous opinion of "screen-large", "screen-wide" ..., but as the synonymous opinion of "screen-small", "screen-narrow", "screen-not large" ... It is shown that.

【0051】結果提示部5に送出するデータ形式は、種
々の表形式ソフトの扱う形式に変換して図3のような表
の形で送ってもよいし、他の形式で送ることもできる。
なおこれらの意見集計部に関する処理は全てコンピュー
タで実現可能である。
The data format sent to the result presentation unit 5 may be converted into a format handled by various table format software and sent in the form of a table as shown in FIG. 3, or may be sent in another format.
Note that all of the processing relating to these opinion counting units can be realized by a computer.

【0052】結果提示部5は、意見集計部4が作成した
集計結果をアンケート分析者Bに提示する処理を行うも
のである。集計結果の提示方法としては、図4に示す如
き表の形でアンケート分析者Bに提示してもよいし、そ
の他、種々の表計算ソフトの機能を利用して、アンケー
ト分析者Bの分析目的に合致した表やグラフを作成して
提示してもよい。
The result presenting unit 5 performs a process of presenting the totaling result created by the opinion totalizing unit 4 to the questionnaire analyst B. As a method of presenting the totaling result, the questionnaire analyst B may be presented to the questionnaire analyst B in the form of a table as shown in FIG. May be created and presented.

【0053】図4によれば、回答者は対象商品につい
て、本体が綺麗とか汚いということよりも、大きいとか
小さいということに関心のあることもわかる。
According to FIG. 4, it can be understood that the respondent is more interested in the target product that is larger or smaller than the case where the main body is clean or dirty.

【0054】提示手段としては、例えば図1に示す表示
部21にモニタ用の図表をアンケート分析者に提示でき
るものである必要があるが、本発明では必ずしも図表情
報を提示手段に限定する必要はなく、例えば結果読み挙
げ手段としスピ−カ等を用いて音声情報に変換してアン
ケート分析者に提示してもよい。
As the presenting means, for example, it is necessary to be able to present a monitor chart to the questionnaire analyst on the display unit 21 shown in FIG. 1, but in the present invention, it is not always necessary to limit the chart information to the presenting means. Alternatively, the information may be converted into voice information using a speaker or the like as a result reading means and presented to the questionnaire analyst.

【0055】グラフとして提示する場合は、図5に示す
如く、最初の図表として、長さを第一項で集計した意見
の総数とした棒グラフで表現する。例えば本体について
は、図4に示す如く、好意的意見数が500、否定的意
見数が20あるので、520の総数を示す棒グラフを作
成し、それに対する肯定評価意見(500)と否定評価
意見(20)の割合を各々色分けして提示し、例えばア
ンケート分析者がその肯定評価部分をマウスの如きポイ
ンテングデバイスで指定すると、肯定意見における第二
項目の各割合を円グラフで提示し、さらに円グラフ内に
ある項目にポインテングデバイスで指示するとその意見
が抽出された回答文を表示するというような方法であ
る。
When presented as a graph, as shown in FIG. 5, the first chart is represented by a bar graph in which the length is the total number of opinions counted in the first term. For example, as shown in FIG. 4, the number of favorable opinions is 500 and the number of negative opinions is 20, as shown in FIG. 4, so a bar graph showing the total number of 520 is created, and a positive evaluation opinion (500) and a negative evaluation opinion (500) are prepared. 20) are presented in different colors, for example, when the questionnaire analyst designates the positive evaluation part with a pointing device such as a mouse, the percentages of the second items in the positive opinion are presented in a pie chart, and the circle When a pointing device is used to indicate an item in the graph, an answer sentence from which the opinion is extracted is displayed.

【0056】図5において、本体に関する棒グラフの肯
定評価部分をポインテングデバイスでポインテングする
と、3つに区分された円グラフが表示され、領域(a)
をポインテングすると、回答文「小さい」が表示され
る。また領域(b)をポインテングすると「便利」が表
示され、領域(c)をポインテングすると「軽い」が表
示される。
In FIG. 5, when the positive evaluation portion of the bar graph relating to the main body is pointed by the pointing device, a pie chart divided into three is displayed, and the area (a) is displayed.
, The answer sentence "small" is displayed. When the area (b) is pointed, "convenience" is displayed, and when the area (c) is pointed, "light" is displayed.

【0057】さらに1つの回答文から肯定意見と否定意
見の両方が得られたときに、その評価の強さを比較して
その回答文における総合的な判定結果を推定する。この
ためこの2つの意見が出たとき、それぞれにあらかじめ
点数をつけ、重み付けする。
Further, when both a positive opinion and a negative opinion are obtained from one answer sentence, the strength of the evaluation is compared to estimate a comprehensive judgment result in the answer sentence. For this reason, when these two opinions come out, each is given a score in advance and weighted.

【0058】このようにして、意見単位の集計結果だけ
でなく、回答文単位の評価の集計も行えるので、それを
グラフの割合で色分けして最初にアンケート分析者に提
示し、例えばその肯定意見の割合の部分をポインテング
デバイスで指定すると、総合的に肯定評価を与えている
回答文における意見の割合などもグラフィカルに提示す
ることができる。
In this way, not only the total result of the opinion unit but also the total of the evaluation of the answer sentence can be totaled. Therefore, it is color-coded according to the ratio of the graph and first presented to the questionnaire analyst. By designating the portion of the ratio with a pointing device, it is possible to graphically present the ratio of opinions in an answer sentence that gives a comprehensive positive evaluation.

【0059】意見判定部6は、意見抽出部3が抽出した
各意見情報について、判定知識データベース9に格納さ
れた意見判定知識を用いて、その意見が肯定的意見か否
定的意見かを判定する処理を行うものである。
The opinion judging unit 6 judges whether each opinion information extracted by the opinion extracting unit 3 is a positive opinion or a negative opinion by using the opinion judgment knowledge stored in the judgment knowledge database 9. The processing is performed.

【0060】判定知識データベース9に格納される意見
判定知識とは、例えば意見が例としてあげた二項関係で
表現可能なものである場合は「本体−小さい−肯定的評
価」といった三項関係で記述可能な情報である。またこ
の判定知識データベース9における対象物依存性をなく
し、他の対象物に関するアンケートも同じデータベース
を使うことを考えて、さらに対象物に関する情報を加え
た「本体−小さい−肯定的評価、対象物:情報機器」等
の4項関係で記述してもよい。
The opinion judgment knowledge stored in the judgment knowledge database 9 is, for example, a ternary relation such as “body-small-positive evaluation” when an opinion can be expressed by a binary relation as an example. This is information that can be described. In addition, in order to eliminate the object dependency in the judgment knowledge database 9 and to use the same database for questionnaires on other objects, information on the object is further added to the “body-small-positive evaluation, object: It may be described in terms of four terms such as "information equipment".

【0061】このような判定知識を格納した判定知識デ
ータベースを具備し、抽出した各意見、例えば「本体−
小さい」に対してこの判定知識データベースを検索し、
例えば「本体−小さい−肯定的評価」を得ることで、こ
の処理が実現できる。
A judgment knowledge database storing such judgment knowledge is provided, and each extracted opinion, for example, “body-
Search this judgment knowledge database for "small"
For example, this processing can be realized by obtaining “body-small-positive evaluation”.

【0062】また、例えば肯定的意見に+1、否定的意
見に−1という得点(重み)を与えて一つの回答文にお
いて得られた複数の意見の得点の和をある一つの回答文
について総合的な評価とみなすことで回答文単位の対象
物の評価を求めることができる。
Further, for example, a score (weight) of +1 is given to a positive opinion and −1 is given to a negative opinion, and the sum of scores of a plurality of opinions obtained in one answer sentence is comprehensively calculated for one answer sentence. The evaluation of the object can be obtained for each answer sentence by regarding the evaluation as a proper evaluation.

【0063】さらに、判定結果を肯定的評価/否定的評
価といった2値ではなく、多値をとるものとして、例え
ば評価にさらに「強い肯定」、「強い否定」を加えて4
値として、評価の強さに応じた得点を与えることで、よ
り精度の良い判定を図ることもできる。また各評価値を
評価関数で表現し、束値論理に基づく合成、いわゆる
「ファジー推論」を行って総合評価を算出することも可
能である。
Further, the judgment result is not binary, such as positive evaluation / negative evaluation, but multi-valued. For example, “strong affirmation” and “strong negation” are further added to the evaluation to obtain 4 values.
By giving a score according to the strength of the evaluation as a value, a more accurate determination can be achieved. It is also possible to express each evaluation value by an evaluation function and calculate a comprehensive evaluation by performing synthesis based on bundle value logic, so-called “fuzzy inference”.

【0064】判定知識獲得部7は、判定知識を、人手を
用いることなく、自動的に獲得するものである。意見判
定部6で使用される判定知識は対象物依存の知識であ
り、その整備にはコストがかかる。この問題を解決する
ためには、アンケート回答文より自動的に判定知識を獲
得すればよい。
The judgment knowledge acquiring section 7 automatically acquires judgment knowledge without using any manual operation. The judgment knowledge used in the opinion judgment unit 6 is object-dependent knowledge, and maintenance of the judgment knowledge is costly. In order to solve this problem, it is only necessary to automatically acquire the judgment knowledge from the questionnaire answer sentence.

【0065】第1の手法として、特に抽出した意見を判
定する際の知識を判定形式のアンケート調査票における
アンケート回答結果より自動的に獲得して蓄積するもの
である。
The first method is to automatically acquire and accumulate knowledge for judging an extracted opinion automatically from a questionnaire response result in a questionnaire questionnaire in a judgment format.

【0066】運用初期においては、判定知識データベー
ス9内に十分な判定知識が格納されていないので、アン
ケートの各質問については、例えば「本製品について、
良いと思われた点をご記入下さい」といった、質問に対
する回答結果の評価が明らかになるような設問とし、そ
こに記載された回答文より意見を抽出して、回答に予想
される評価を合わせて判定知識として判定知識データベ
ースに格納するものである。
In the initial stage of operation, since sufficient judgment knowledge is not stored in the judgment knowledge database 9, each question of the questionnaire is, for example, “for this product,
Please fill in the points that you think are good. ", And extract the opinions from the answer sentence and combine the expected evaluation with the answer. Is stored in the judgment knowledge database as judgment knowledge.

【0067】また対象物に対してその評価すべき属性が
予め判明している場合には、設問として「本製品の以下
の事項について、感じたことを以下より選択し、そう感
じた理由をご記入下さい」などとし、次に「画面」、
「キーボード」・・・といった評価すべき属性を並べ
て、回答箇所には「大変良い−良い−普通−悪い−大変
悪い」といった選択肢記入項目とその理由を記入する自
由記述項目の2つを設け、アンケート結果を電子化した
結果より、事項例えば「画面」と自由記述部分からの術
語、例えば「大きくて見やすいから」という記述から、
「大きい」、「見やすい」を抽出し、その組をもって意
見を作成し、それに選択部分の評価値、例えば良い、を
合わせて判定知識を作成する。例えば「画面−大きい−
肯定的評価」及び「画面−見やすい−肯定的評価」を作
成する。このような処理で獲得された知識を判定知識デ
ータベース9に格納することで、以後の処理で利用する
ことが可能となる。前記各処理は、図1に示す第1判定
知識獲得部7−1が行う。
If the attributes to be evaluated for the object are known in advance, the question is “Select the following items of this product that you felt from the following, and explain the reason why you felt so. Please fill in. "
Attributes to be evaluated such as "keyboard" are arranged, and the answer part is provided with two items: an option entry item "very good-good-normal-bad-very bad" and a free description item to enter the reason. From the results of the electronic questionnaire results, from the items such as "screen" and terms from the free description part, for example, the description "because it is large and easy to see"
“Large” and “easy to see” are extracted, an opinion is created based on the combination, and the evaluation value of the selected portion, for example, “good” is combined to create judgment knowledge. For example, "screen-large-
"Positive evaluation" and "screen-easy-to-view-positive evaluation". By storing the knowledge acquired by such processing in the judgment knowledge database 9, it becomes possible to use it in the subsequent processing. The above processes are performed by the first determination knowledge acquisition unit 7-1 shown in FIG.

【0068】第2の手法としては、前記のように、運用
初期に特別の設問を設定しなくとも判定知識を獲得する
ようにしたものであり、図1に示す第2判定知識獲得部
7−2が処理を行うものである。
As a second method, as described above, judgment knowledge is acquired without setting a special question at the beginning of operation, and the second judgment knowledge acquisition unit 7- shown in FIG. Reference numeral 2 denotes a processing unit.

【0069】これは、例えば「画面が見やすくて良い」
という回答文からは「画面−見やすい」、「画面−良
い」という2つの意見が抽出できるが、その一つの第二
項が予め与えてある評価を表している語である場合、こ
の例では「良い」が予め与えられている評価を表してい
るので、この知識を「良い−肯定的評価」という二項関
係で表現する。そしてこの2つをマージして「画面−見
やすい−肯定的評価」という判定知識情報を獲得するこ
とができる。
This is, for example, “the screen can be easily viewed”.
From the answer sentence, two opinions, "screen-easy to see" and "screen-good" can be extracted, but if one of the second terms is a word representing a previously given evaluation, in this example, " Since “good” indicates an evaluation given in advance, this knowledge is expressed by a binary relation of “good-positive evaluation”. Then, by merging the two, it is possible to obtain the determination knowledge information “screen-easy-to-view-positive evaluation”.

【0070】この手法は、判定知識の抽出だけでなく、
運用の初期状態で装置に与えていない評価を表している
語を獲得することも可能である。これは、例えば「良い
−肯定的評価」という知識を予め装置に与えて、前記の
例文より「画面−見やすい−肯定的評価」という判定知
識を獲得したとする。
This method not only extracts judgment knowledge, but also
It is also possible to acquire words representing evaluations that have not been given to the device in the initial state of operation. It is assumed that, for example, the knowledge “good-positive evaluation” is given to the apparatus in advance, and the determination knowledge “screen-easy-to-view-positive evaluation” is acquired from the above example sentence.

【0071】次に「画面が見やすくて素晴らしい」とい
う回答文より「画面−見やすい」、「画面−素晴らし
い」といった二つの意見が抽出されるが、前記獲得した
判定知識より「画面−見やすい」は肯定的評価であるこ
とが分かるので、「素晴らしい−肯定的評価」といった
新たな知識を得ることができる。このように「見やす
い」「素晴らしい」は肯定的評価であることを判定知識
データベース9に格納し、以後の処理に利用すること
で、知識の学習機能を実現することができる。
Next, two opinions such as “screen-easy to see” and “screen-great” are extracted from the answer sentence “screen is easy to see and wonderful”, but “screen-easy to understand” is affirmed from the acquired judgment knowledge. Since the evaluation is a positive evaluation, it is possible to obtain new knowledge such as "excellent-positive evaluation". As described above, the fact that “easy to see” and “great” is a positive evaluation is stored in the determination knowledge database 9 and is used for subsequent processing, thereby realizing a knowledge learning function.

【0072】以上で述べた処理はすべてコンピュータで
人手を要せずに処理可能である。なお前記第1の手法、
第2の手法の判定知識獲得方式は排反ではなく、この両
方を組み合わせたものも構成できる。
All of the above-described processing can be performed by a computer without human intervention. Note that the first method,
The determination knowledge acquisition method of the second method is not exhaustive, but may be a combination of both.

【0073】集計知識データベース8には、回答文を集
計するために必要なデータが格納されるものであり、例
えば、反意語データベース、同義語データベース、シソ
ーラス、実世界知識等が格納されている。
The tallying knowledge database 8 stores data necessary for tallying answer sentences. For example, an antonym database, a synonym database, a thesaurus, real world knowledge, and the like are stored.

【0074】判定知識データベース9には回答文が肯定
的(好意的)意見なのか否定的意見なのかを判定するた
めに必要なデータが格納されるものであり、例えば品
詞、意見判定知識、「第1項+第2項+評価」、「第1
項+第2項+評価+対象分野」、肯定的意見と否定的意
見が混在するときの各意見に対する点数(重みづけ)等
が格納されている。
The judgment knowledge database 9 stores data necessary for judging whether the answer sentence is a positive (favorable) opinion or a negative opinion. For example, the part-of-speech, opinion judgment knowledge, " 1st term + 2nd term + evaluation ”,“ 1st term
Item + second item + evaluation + target field ”, points (weight) for each opinion when a positive opinion and a negative opinion coexist are stored.

【0075】集計結果格納データベース10は、本発明
により得られた集計結果を一時格納するものであり、図
3、図4に示す集計データや、図5に示す表示データ等
が格納されるものである。
The counting result storage database 10 temporarily stores the counting results obtained by the present invention, and stores the counting data shown in FIGS. 3 and 4, the display data shown in FIG. 5, and the like. is there.

【0076】プロセッサ20は、本発明の自然処理装置
を構成するものであり、例えば回答抽出部2、意見抽出
部3、意見集計部4、結果提示部5、意見判定部6、判
定知識獲得部7等を具備している。
The processor 20 constitutes the natural processing apparatus of the present invention, and includes, for example, an answer extracting unit 2, an opinion extracting unit 3, an opinion totaling unit 4, a result presenting unit 5, an opinion judging unit 6, and a judgment knowledge acquiring unit. 7 and the like.

【0077】表示部21は、本発明の処理結果をアンケ
ート分析者Bが表示して、その処理結果を見るためのも
のであり、ディスプレイやプリンタ等で構成される。
The display section 21 is for the questionnaire analyst B to display the processing result of the present invention and to see the processing result, and is composed of a display, a printer, and the like.

【0078】図1に示す本発明の実施の形態の動作を図
7に示すフローチャートに従って説明する。
The operation of the embodiment of the present invention shown in FIG. 1 will be described with reference to the flowchart shown in FIG.

【0079】S1.アンケート回答者Aからアンケート
に対する回答が、例えばファクシミリや電子情報で入力
部1に入力される。入力部1では、この回答結果を回答
抽出部2に送出する。
S1. The answer to the questionnaire from the questionnaire respondent A is input to the input unit 1 by facsimile or electronic information, for example. The input unit 1 sends the answer result to the answer extracting unit 2.

【0080】S2.回答抽出部2は、この回答結果、特
に自由記述部分を電子テキスト化し、回答文として抽出
する処理を行う。そしてこの電子化された回答文を意見
抽出部3に送出する。
S2. The answer extraction unit 2 performs a process of converting the answer result, particularly the free description part, into an electronic text and extracting it as an answer sentence. Then, the computerized answer sentence is sent to the opinion extracting unit 3.

【0081】S3.意見抽出部3は、この電子化された
回答文を形態素解析し、構文解析手段3−2を用いて構
文木に変換し、二項関係あるいは三項関係等を作成し、
回答文より意見の抽出を行う。そしてこれを意見集計部
4に送出する。
S3. The opinion extracting unit 3 morphologically analyzes the digitized answer sentence, converts it into a parse tree using the parsing means 3-2, and creates a binary or ternary relation,
Extract opinions from the answer sentence. Then, this is sent to the opinion counting unit 4.

【0082】S4.意見集計部4は、前記意見抽出部3
が抽出した意見を、例えば二項関係毎にその出現頻度を
集計する。このとき意見抽出部3が抽出した意見が肯定
的意見か、否定的意見かを意見判定部6が判定知識デー
タベースに格納された意見判定知識を用いて判定する。
S4. The opinion tallying unit 4 is provided with the opinion extracting unit
Are collected, for example, for each binary relation, the appearance frequency of the extracted opinions. At this time, the opinion judgment unit 6 judges whether the opinion extracted by the opinion extraction unit 3 is a positive opinion or a negative opinion, using the opinion judgment knowledge stored in the judgment knowledge database.

【0083】S5.意見集計部4は、このように意見抽
出部3が抽出した意見の出現頻度を集計し、意見判定部
6を介して意見抽出部3が抽出した意見が肯定的か否定
的かを判定し、また集計知識データベース8の同義語デ
ータベースをアクセスして同義意見を認識する。そして
図3に示す如き、意見集計表を作成する。
S5. The opinion counting unit 4 counts the appearance frequencies of the opinions extracted by the opinion extraction unit 3 in this manner, and determines whether the opinion extracted by the opinion extraction unit 3 via the opinion determination unit 6 is positive or negative. Further, the synonym database is accessed and the synonymous opinion is recognized. Then, as shown in FIG. 3, an opinion totaling table is created.

【0084】S6.このようにして作成された意見集計
が結果提示部5に送出されると、結果提示部5では、こ
れを加工してアンケート分析者Bがアンケート結果を分
析し易い形で提示する処理を行う。例えば、図4に示す
如く、表形式にして提示してもよく、またアンケート分
析者の解析目的に合致した表やグラフを作成して提示し
てもよい。また図5に示す如く、ポインテングデバイス
で指定されたときその部分を更に詳述表示するように提
示してもよい。
S6. When the opinion tally created in this way is sent to the result presenting unit 5, the result presenting unit 5 processes this and presents the questionnaire analyst B in an easy-to-analyze form. For example, as shown in FIG. 4, the data may be presented in the form of a table, or a table or a graph matching the analysis purpose of the questionnaire analyst may be created and presented. Alternatively, as shown in FIG. 5, when specified by a pointing device, the portion may be presented so as to be displayed in more detail.

【0085】ところで、図6に示す回答文が入力された
とき、本発明では意見抽出部3が意見判定部6ととも
に、この回答文を形態素解析して、前半の文の主語−述
語が「野球−思って」であり、「が」が否定接続詞であ
ることを認識して、「野球−思って−否定」を認識す
る。
When the answer sentence shown in FIG. 6 is input, in the present invention, the opinion extractor 3 and the opinion determiner 6 morphologically analyze the answer sentence, and the subject-predicate of the first half sentence is "baseball". It recognizes that "ga" is a negative conjunction and recognizes "baseball-thought-negation".

【0086】そして後半の文の主語−述語が「ゴルフ−
良い」であり良いの評価が肯定であることより「ゴクフ
−良い−肯定」を認識する。このようにして図6の回答
文は「野球ではなく−ゴルフ」ということを得る。
The subject-predicate of the latter sentence is "golf-
"Good" and a positive evaluation of "good" recognizes "gokufu-good-positive". In this way, the answer sentence of FIG. 6 obtains "not baseball-golf".

【0087】なお、前記説明では、本発明をアンケート
回答文の処理の例について説明したが、本発明は勿論こ
れに限定されるものではない。
In the above description, the present invention has been described with respect to an example of processing of a questionnaire response sentence, but the present invention is of course not limited to this.

【0088】なお前記回答抽出部2、意見抽出部3、意
見集計部4、結果提示部5、意見判定部6、判定知識獲
得部7等は、例えばプログラムで構成処理することが出
来る。
The answer extracting unit 2, the opinion extracting unit 3, the opinion totaling unit 4, the result presenting unit 5, the opinion judging unit 6, the judgment knowledge acquiring unit 7 and the like can be constituted by a program, for example.

【0089】本発明の形態を付記に記載する。The embodiments of the present invention are described in Appendix.

【0090】(付記1)複数の意見提供者から提供され
た意見を解析する自然文処理装置において、提供された
意見から意見提供者の自由記述部分の電子化データを意
見提供の回答文として抽出する回答抽出手段と、抽出し
た回答文より、単語対を抽出する意見抽出手段と、抽出
した意見内容毎の集計を行う意見集計手段と、この意見
内容毎の集計結果を提供する結果提供手段を具備したこ
とを特徴とする自然文処理装置。
(Supplementary Note 1) In a natural sentence processing apparatus that analyzes opinions provided by a plurality of opinion providers, digitized data of a free description portion of the opinion provider is extracted from the provided opinions as an answer providing answer. Answer extracting means, an opinion extracting means for extracting a word pair from the extracted answer sentence, an opinion totalizing means for totalizing each extracted opinion content, and a result providing means for providing a totaling result for each opinion content. A natural sentence processing device, comprising:

【0091】(付記2)前記付記1に記載の自然文処理
装置において、抽出した意見が肯定的評価を与えている
のか否定的評価を与えているのかを判定する意見判定手
段と、意見を判定するための知識を格納する判定知識デ
ータベースを具備したことを特徴とする自然文処理装
置。
(Supplementary Note 2) In the natural sentence processing apparatus according to Supplementary Note 1, an opinion judging means for judging whether the extracted opinion gives a positive evaluation or a negative evaluation, and an opinion judgment A natural sentence processing apparatus comprising a judgment knowledge database for storing knowledge for performing

【0092】(付記3)前記付記2に記載の自然文処理
装置において、一つの回答文において、肯定意見と否定
意見の2つが得られた場合、その強さを判定し、回答文
の総合的な肯定・否定を判定する意見判定手段を具備し
たことを特徴とする自然文処理装置。
(Supplementary Note 3) In the natural sentence processing apparatus according to Supplementary Note 2, when two positive opinions and negative opinions are obtained in one answer sentence, the strength is determined, and the overall answer sentence is determined. A natural sentence processing device comprising opinion judgment means for judging positive or negative.

【0093】(付記4)前記付記1、付記2記載の自然
文処理装置において、提示情報を全体集合を変化させた
複数のグラフで表示する提示手段を具備したことを特徴
とする自然文処理装置。
(Supplementary Note 4) The natural sentence processing apparatus according to Supplementary Note 1 or 2, further comprising presentation means for displaying presentation information as a plurality of graphs in which a whole set is changed. .

【0094】(付記5)前記付記2、付記3記載の自然
文処理装置において、特に抽出した意見を判定する際の
知識を、特定形式の意見調査票における回答結果より自
動的に獲得して蓄積する判定知識獲得手段を具備したこ
とを特徴とする自然文処理装置。
(Supplementary Note 5) In the natural sentence processing apparatus according to Supplementary Notes 2 and 3, the knowledge for judging the extracted opinion is automatically acquired and accumulated from the answer result in the opinion survey form of a specific format. A natural sentence processing apparatus characterized by comprising judgment knowledge acquiring means for performing judgment.

【0095】(付記6)前記付記2、付記3記載の自然
文処理装置において、特に抽出した意見を判定する際の
知識を、回答文内の特定の表現パターンより自動的に獲
得して蓄積する判定知識獲得手段を具備したことを特徴
とする自然文処理装置。
(Supplementary Note 6) In the natural sentence processing apparatus according to Supplementary Notes 2 and 3, especially, knowledge for judging an extracted opinion is automatically acquired from a specific expression pattern in an answer sentence and accumulated. A natural sentence processing device comprising a judgment knowledge acquiring means.

【0096】(付記7)コンピュータを、複数の意見提
供者から提供された意見を解析する自然文処理手段とし
て動作させるために、提供された意見から意見提供者の
自由記述部分の電子化データを意見提供の回答文として
抽出する回答抽出手段、抽出した回答文より、単語対を
抽出する意見抽出手段、抽出した意見内容毎の集計を行
う意見集計手段、この意見内容毎の集計結果を提供する
結果提供手段として機能させるための自然文処理用プロ
グラム。
(Supplementary Note 7) In order for the computer to operate as a natural sentence processing means for analyzing opinions provided by a plurality of opinion providers, digitized data of a free description portion of the opinion provider is provided from the provided opinions. Provide answer extraction means for extracting the answer sentence provided by the opinion, opinion extraction means for extracting a word pair from the extracted answer sentence, opinion counting means for counting each extracted opinion content, and provide a tally result for each opinion content A natural sentence processing program to function as a result providing means.

【0097】[0097]

【発明の効果】本発明により下記の効果を奏する。According to the present invention, the following effects can be obtained.

【0098】(1)複数の意見提供者から提出された自
由記述部分の回答文より意見提供者の主張・見解・感想
など単語対を意見として自動的に抽出することができる
ので、多数の自由記述部分の回答文より正確に短時間で
意見を抽出することができる。
(1) Word pairs such as opinions, views, and impressions of the opinion provider can be automatically extracted as opinions from the answer sentence of the free description part submitted by a plurality of opinion providers, so that a large number of freedoms can be obtained. Opinions can be extracted accurately and in a short time from the answer sentence in the description part.

【0099】(2)抽出した意見が対象物に関する肯定
的評価を与えているものか、それとも否定的評価を与え
ているものかを、これらを判定するための知識を格納す
る判定的データベースを検索することにより、正確に、
自動判定することができる。
(2) Searching a judging database storing knowledge for judging whether the extracted opinion gives a positive evaluation or a negative evaluation regarding the object or not. By doing so,
Automatic determination can be made.

【0100】(3)一つの回答文から肯定意見と否定意
見の両方が得られたときに、その評価の強さを比較して
その回答文における総合的なきめ細かな判定結果を自動
的に得ることができる。
(3) When both positive and negative opinions are obtained from one answer sentence, the evaluation strengths are compared to automatically obtain comprehensive and detailed judgment results in the answer sentence. be able to.

【0101】(4)コンピュータに、提供された意見か
ら意見提供者の自由記述部分の電子化データを意見提供
の回答文として抽出する回答抽出手段、抽出した回答文
より、単語対を抽出する意見抽出手段、抽出した意見内
容毎の集計を行う意見集計手段、この意見内容毎の集計
結果を提供する結果提供手段として機能するプログラム
をインストールすることにより、通常のコンピュータ
に、複数の意見提供者から提供された意見を解析する自
然文処理機能を遂行させることができる。
(4) Answer extraction means for extracting, from the provided opinion, digitized data of the free description portion of the opinion provider as an answer sentence provided by the opinion provider, and an opinion for extracting a word pair from the extracted answer sentence By installing a program that functions as an extracting unit, an opinion totalizing unit that totals each extracted opinion content, and a result providing unit that provides a totaling result for each opinion content, a plurality of opinion providers can be installed on a normal computer. A natural sentence processing function of analyzing the provided opinion can be performed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態である。FIG. 1 is an embodiment of the present invention.

【図2】本発明における意見抽出説明図である。FIG. 2 is an explanatory diagram of opinion extraction according to the present invention.

【図3】本発明における意見集計結果説明図である。FIG. 3 is an explanatory view of an opinion totaling result in the present invention.

【図4】本発明における集計結果説明図である。FIG. 4 is an explanatory diagram of a counting result in the present invention.

【図5】本発明におけるグラフ状態説明図である。FIG. 5 is an explanatory diagram of a graph state in the present invention.

【図6】本発明における回答文解析例である。FIG. 6 is an example of answer sentence analysis in the present invention.

【図7】本発明の動作状態説明図である。FIG. 7 is an explanatory diagram of an operation state of the present invention.

【符号の説明】[Explanation of symbols]

1 入力部 2 回答抽出部 3 意見抽出部 4 意見集計部 5 結果提示部 6 意見判定部 7 判定知識獲得部 8 集計知識データベース 9 判定知識データベース 10 集計結果格納データベース 20 プロセッサ 21 表示部 DESCRIPTION OF SYMBOLS 1 Input part 2 Answer extraction part 3 Opinion extraction part 4 Opinion totalization part 5 Result presentation part 6 Opinion judgment part 7 Judgment knowledge acquisition part 8 Total knowledge database 9 Judgment knowledge database 10 Total result storage database 20 Processor 21 Display part

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】複数の意見提供者から提供された意見を解
析する自然文処理装置において、 提供された意見から意見提供者の自由記述部分の電子化
データを意見提供の回答文として抽出する回答抽出手段
と、 抽出した回答文より、単語対を抽出する意見抽出手段
と、 抽出した意見内容毎の集計を行う意見集計手段と、 この意見内容毎の集計結果を提供する結果提供手段を具
備したことを特徴とする自然文処理装置。
Claims: 1. A natural sentence processing apparatus for analyzing opinions provided by a plurality of opinion providers, wherein a response extracting electronic data of a free description portion of the opinion provider from the provided opinions as an answer providing answer statement. Extraction means, opinion extraction means for extracting word pairs from the extracted answer sentences, opinion totalization means for totalizing each extracted opinion content, and result providing means for providing a totaling result for each opinion content A natural sentence processing device characterized by the above-mentioned.
【請求項2】前記請求項1に記載の自然文処理装置にお
いて、 抽出した意見が肯定的評価を与えているのか否定的評価
を与えているのかを判定する意見判定手段と、 意見を判定するための知識を格納する判定知識データベ
ースを具備したことを特徴とする自然文処理装置。
2. The natural sentence processing apparatus according to claim 1, wherein opinion judgment means for judging whether the extracted opinion gives a positive evaluation or a negative evaluation, and judges the opinion A natural sentence processing device comprising a judgment knowledge database for storing knowledge for the purpose.
【請求項3】前記請求項2に記載の自然文処理装置にお
いて、 一つの回答文において、肯定意見と否定意見の2つが得
られた場合、その強さを判定し、回答文の総合的な肯定
・否定を判定する意見判定手段を具備したことを特徴と
する自然文処理装置。
3. In the natural sentence processing apparatus according to claim 2, when two positive opinions and negative opinions are obtained in one answer sentence, the strength is determined, and the overall answer sentence is determined. A natural sentence processing device comprising an opinion judging means for judging affirmation / negation.
【請求項4】コンピュータを、複数の意見提供者から提
供された意見を解析する自然文処理手段として動作させ
るために、 提供された意見から意見提供者の自由記述部分の電子化
データを意見提供の回答文として抽出する回答抽出手
段、 抽出した回答文より、単語対を抽出する意見抽出手段、 抽出した意見内容毎の集計を行う意見集計手段、 この意見内容毎の集計結果を提供する結果提供手段とし
て機能させるための自然文処理用プログラム。
In order to operate a computer as a natural sentence processing means for analyzing opinions provided by a plurality of opinion providers, electronic opinion data of a free description portion of the opinion provider is provided from the provided opinions. Extraction means to extract word pairs from the extracted answer sentences, Opinion extraction means to extract word pairs from the extracted answer sentences, Opinion summarizing means to sum up each extracted opinion content, Provision of results that provide the totaling result for each opinion content Natural sentence processing program to function as a means.
JP2001245870A 2000-08-21 2001-08-14 Natural sentence processor and natural sentence processing program Withdrawn JP2002140465A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001245870A JP2002140465A (en) 2000-08-21 2001-08-14 Natural sentence processor and natural sentence processing program

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000249313 2000-08-21
JP2000-249313 2000-08-21
JP2001245870A JP2002140465A (en) 2000-08-21 2001-08-14 Natural sentence processor and natural sentence processing program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005133969A Division JP3917629B2 (en) 2000-08-21 2005-05-02 Natural sentence processing apparatus and natural sentence processing program

Publications (1)

Publication Number Publication Date
JP2002140465A true JP2002140465A (en) 2002-05-17

Family

ID=26598134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001245870A Withdrawn JP2002140465A (en) 2000-08-21 2001-08-14 Natural sentence processor and natural sentence processing program

Country Status (1)

Country Link
JP (1) JP2002140465A (en)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004178123A (en) * 2002-11-26 2004-06-24 Hitachi Ltd Information processor and program for executing information processor
JP2006113746A (en) * 2004-10-13 2006-04-27 Hewlett-Packard Development Co Lp Document classification apparatus, method and program
JP2006252090A (en) * 2005-03-10 2006-09-21 Nippon Telegr & Teleph Corp <Ntt> Device and method for acquiring reputation information, program, and storage medium
JP2008209978A (en) * 2007-02-23 2008-09-11 Nippon Telegr & Teleph Corp <Ntt> Comparative evaluation detection device, comparative evaluation detection method, comparative evaluation detection program mounted with the method, and storage medium recording the program
US7546310B2 (en) 2004-11-19 2009-06-09 International Business Machines Corporation Expression detecting system, an expression detecting method and a program
JP2015230594A (en) * 2014-06-05 2015-12-21 株式会社日立製作所 Opinion utilization support device and opinion utilization support method
US9740681B2 (en) 2012-04-25 2017-08-22 International Business Machines Corporation Method for classifying pieces of text on basis of evaluation polarity, computer program product, and computer
JP2017219992A (en) * 2016-06-07 2017-12-14 株式会社エヌ・ティ・ティ・アド Translation device and translation system
JP6342027B1 (en) * 2017-02-21 2018-06-13 ヤフー株式会社 Providing device, providing method, and providing program
JP2020113129A (en) * 2019-01-15 2020-07-27 株式会社日立製作所 Document evaluation device, document evaluation method, and program

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004178123A (en) * 2002-11-26 2004-06-24 Hitachi Ltd Information processor and program for executing information processor
JP4713870B2 (en) * 2004-10-13 2011-06-29 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. Document classification apparatus, method, and program
JP2006113746A (en) * 2004-10-13 2006-04-27 Hewlett-Packard Development Co Lp Document classification apparatus, method and program
US7546310B2 (en) 2004-11-19 2009-06-09 International Business Machines Corporation Expression detecting system, an expression detecting method and a program
JP2006252090A (en) * 2005-03-10 2006-09-21 Nippon Telegr & Teleph Corp <Ntt> Device and method for acquiring reputation information, program, and storage medium
JP4513098B2 (en) * 2005-03-10 2010-07-28 日本電信電話株式会社 Reputation information acquisition device, reputation information acquisition method, program, and storage medium
JP2008209978A (en) * 2007-02-23 2008-09-11 Nippon Telegr & Teleph Corp <Ntt> Comparative evaluation detection device, comparative evaluation detection method, comparative evaluation detection program mounted with the method, and storage medium recording the program
US9740681B2 (en) 2012-04-25 2017-08-22 International Business Machines Corporation Method for classifying pieces of text on basis of evaluation polarity, computer program product, and computer
JP2015230594A (en) * 2014-06-05 2015-12-21 株式会社日立製作所 Opinion utilization support device and opinion utilization support method
JP2017219992A (en) * 2016-06-07 2017-12-14 株式会社エヌ・ティ・ティ・アド Translation device and translation system
JP6342027B1 (en) * 2017-02-21 2018-06-13 ヤフー株式会社 Providing device, providing method, and providing program
JP2018136720A (en) * 2017-02-21 2018-08-30 ヤフー株式会社 Distribution system, distribution method and distribution program
US11282104B2 (en) 2017-02-21 2022-03-22 Yahoo Japan Corporation Provision device, provision method and non-transitory computer readable storage medium
JP2020113129A (en) * 2019-01-15 2020-07-27 株式会社日立製作所 Document evaluation device, document evaluation method, and program
JP7281905B2 (en) 2019-01-15 2023-05-26 株式会社日立ソリューションズ西日本 Document evaluation device, document evaluation method and program

Similar Documents

Publication Publication Date Title
JP4870448B2 (en) Information processing apparatus, customer needs analysis method, and program
JP3917629B2 (en) Natural sentence processing apparatus and natural sentence processing program
Agirre et al. Enriching very large ontologies using the WWW
US9053418B2 (en) System and method for identifying one or more resumes based on a search query using weighted formal concept analysis
US8340955B2 (en) System and method for finding the most likely answer to a natural language question
US20070022099A1 (en) Question answering system, data search method, and computer program
Green Automatically generating hypertext by computing semantic similarity.
JP2002140465A (en) Natural sentence processor and natural sentence processing program
KR20100069118A (en) Method for constructing query index database, method for recommending query by using the query index database
US20220327445A1 (en) Workshop assistance system and workshop assistance method
Zhang et al. Sentiment bias detection in support of news credibility judgment
JP2003157271A (en) Device and method for mining text
JP3955522B2 (en) Data analysis apparatus and method, and program
JP2002123544A (en) Retrieval preprocessing apparatus, document retrieving apparatus, and retrieval preprocessing method and document retrieving method
JP5439028B2 (en) Information search apparatus, information search method, and program
Higashinaka et al. An unsupervised method for learning generation dictionaries for spoken dialogue systems by mining user reviews
Pudner et al. An Intelligent Conversational Agent Approach to Extracting Queries from Natural Language.
JP2003241634A (en) Coaching information collecting device and coaching information providing device
JP5295818B2 (en) Database creation apparatus, database creation method, and database creation program in which words included in document are assigned by category
JP2002189845A (en) Evaluation system and evaluation method
JP2002163417A (en) Data analyzing device and storage medium stored with program for data analysis
JP5138622B2 (en) Information processing apparatus, complaint extraction method, and program
JP2011022874A (en) Data processing apparatus and data processing method
JP2004127086A (en) Document retrieval system, and information providing system using it
JP2008009623A (en) Method, device and program for calculating intensity of experience, and computer readable recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040901

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20040901

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20040928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041005

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041206

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050301

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050502

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050531

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050624

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070515