JP2005322239A - Natural sentence processor, natural sentence processing method and natural sentence processing program - Google Patents
Natural sentence processor, natural sentence processing method and natural sentence processing program Download PDFInfo
- Publication number
- JP2005322239A JP2005322239A JP2005133969A JP2005133969A JP2005322239A JP 2005322239 A JP2005322239 A JP 2005322239A JP 2005133969 A JP2005133969 A JP 2005133969A JP 2005133969 A JP2005133969 A JP 2005133969A JP 2005322239 A JP2005322239 A JP 2005322239A
- Authority
- JP
- Japan
- Prior art keywords
- opinion
- information
- questionnaire
- determination
- text data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は自由記述式で書かれた自然文処理装置、自然言語処理方法及び自然文処理用プログラムに係り、例えば市場調査等の際に行われるアンケートの回答が自然文で行われたとき、これをアンケートの結果として分析する文書処理装置、自然言語処理方法及び文書処理用プログラムに関する。 The present invention relates to a natural sentence processing device, a natural language processing method, and a natural sentence processing program written in a free-description format. For example, when a questionnaire is conducted in a natural language when a questionnaire is conducted during a market research or the like. The present invention relates to a document processing apparatus, a natural language processing method, and a document processing program.
各種の調査を行うための手段の1つとしてアンケートが行われている。アンケートには、回答の一部あるいは全部が自由記述式文書である自由記述式のアンケート方式と、アンケート調査票に設問に関して予め幾つかの選択肢を用意しておき、アンケート回答者にその中から選ばせる選択方式がある。 A questionnaire is conducted as one of means for conducting various surveys. In the questionnaire, there are a free description type questionnaire method in which some or all of the responses are free description type documents, and several options regarding the question are prepared in the questionnaire survey form in advance, and the questionnaire respondent is selected from among them There is a selection method.
自由記述式のアンケート方式は、回答結果が自然文であり、多数の回答者から有用な情報を得るためには人手による集計及び分析が必要であり、非常にコストがかかるといった問題がある。 The free description type questionnaire method has a problem that the answer result is a natural sentence, and manual counting and analysis are required to obtain useful information from a large number of respondents, which is very expensive.
この問題を解決する手段として前記選択方式がある。しかしこの方式の場合は、予め作成された選択肢以外に関する情報は得ることができず、アンケート実施者の予期していなかったニーズ等の重要な知識を得ることができないという問題がある。 As a means for solving this problem, there is the selection method. However, in the case of this method, there is a problem that information relating to options other than those created in advance cannot be obtained, and important knowledge such as needs that the questionnaire implementer did not expect cannot be obtained.
この自由記述式アンケートの集計時のコストの軽減を目的として、集計時にコンピュータによる自動集計を行う、アンケート集計システムが提案(例えば特許文献1参照)されている。 For the purpose of reducing the cost at the time of aggregation of this free description questionnaire, a questionnaire aggregation system that performs automatic aggregation by a computer at the time of aggregation has been proposed (for example, see Patent Document 1).
このアンケート集計システムでは、装置内にシソーラス辞書を具備し、自由記述文内の単語単位でシソーラス辞書を検索し、その上位語で結果を統合する装置である。例えば「硬式野球」と「軟式野球」を、上位語の「野球」として集計するといった処理を行う装置である。
しかし、この統合はあくまでも単語単位で行われるので、例えばこの装置の説明で挙げられているアンケートの質問項目「生涯学習の内容は」に対する回答として、「硬式野球。」と「軟式野球。」を単語のみで記述されている文を正しく「野球」として集計することは可能であるが、しかし、「若い頃は野球だと思っていましたが、今ではやはりゴルフの方が良いと思います」等の否定的な対象として記述されている場合には正確な集計が行えないという問題がある。 However, since this integration is performed in units of words, for example, “hard baseball.” And “soft baseball.” Are answers to the question item “What is lifelong learning?” In the questionnaire given in the description of this device. It is possible to correctly count sentences written only in words as "baseball", but "I thought it was baseball when I was young, but now I think golf is better" There is a problem that accurate tabulation cannot be performed when it is described as a negative object such as.
またこの方法では正確な集計が殆ど不可能となる様な質問もある。例えば、「本製品についてご意見をお聞かせ下さい」といった質問に関しては、アンケート記述者は単語のみで回答を行うことはなく、さらにその記述が否定的内容なのか、肯定的内容なのかをアンケートの趣旨からいえば集計時に区別する必要があるが、それもこの装置では行えない。 There are also questions that make accurate tabulation almost impossible with this method. For example, for questions such as “Please give us your opinion about this product”, the questionnaire writer does not answer only with words, and whether the description is negative or positive From the point of view, it is necessary to distinguish at the time of aggregation, but this cannot be done with this apparatus.
つまり、この装置においては、本来の意味での自由記述式アンケートを、すなわちアンケート実施者側としてはどんな質問文でも許容し、アンケート記述側としてはどのような記述も許容するような場合を、正確に集計することはできない。 In other words, in this device, a free description questionnaire in its original meaning, that is, any question sentence is allowed on the questionnaire implementer side, and any description is allowed on the questionnaire description side, is accurate. Cannot be counted.
またアンケート以外にも多数の人間が各々の意見を述べている例としては、パソコン通信やウェブページにおける掲示板における記事や、ヘルプデスクに寄せられる顧客の問い合わせなどが挙げられるが、そこでも各個人の意見は自然文で記述されており、それらから有用な情報を得るためには自由記述式アンケートの分析作業と同様のコストがかかるという問題があった。 In addition to questionnaires, examples of how many people express their opinions include personal computer communications, articles on bulletin boards on web pages, and customer inquiries sent to help desks. Opinions are described in natural sentences, and there is a problem that it takes the same cost as analysis of free description questionnaires to obtain useful information from them.
したがって本発明の目的は、前記の如き自由記述式アンケート等における問題点を解決し、有用な情報を低コストでかつ正確に獲得するようにしたものである。 Therefore, an object of the present invention is to solve the problems in the free description questionnaire as described above, and to obtain useful information accurately at low cost.
また本発明では自由記述式アンケートに限らず、各個人の意見が自然文の形で記述されている情報源より有用の情報を低コストでかつ正確に獲得するようにしたものである。 In the present invention, not only a free description questionnaire, but useful information is obtained at low cost and accurately from an information source in which each person's opinion is described in the form of a natural sentence.
前記本発明の目的を達成するための原理構成を図1に示す。図1において、1は入力部、2は回答抽出部、3は意見抽出部、4は意見集計部、5は結果提示部、6は意見判定部、7は判定知識獲得部、8は集計知識データベース、9は判定知識データベース、10は集計結果格納データベースである。 FIG. 1 shows the principle configuration for achieving the object of the present invention. In FIG. 1, 1 is an input unit, 2 is an answer extraction unit, 3 is an opinion extraction unit, 4 is an opinion aggregation unit, 5 is a result presentation unit, 6 is an opinion determination unit, 7 is a determination knowledge acquisition unit, and 8 is total knowledge. A database, 9 is a judgment knowledge database, and 10 is a tabulation result storage database.
本発明の前記課題は下記(1)〜(5)の構成により達成することができる。 The said subject of this invention can be achieved by the structure of following (1)-(5).
(1)単語対情報とその単語対情報が肯定的表現か否定的表現かを対応付けて格納する判定知識データベースと、
到来する電子テキストデータより電子テキストデータ内の単語対を抽出する構文解析手段と、
前記構文解析手段により抽出された単語対情報を元に、前記判定知識データベースを参照してアンケート情報内の単語に対して肯定的意見か否定的意見かを判定する意見判定部と、
を有することを特徴とする自然文処理装置。
(1) a judgment knowledge database that stores word pair information in association with whether the word pair information is a positive expression or a negative expression;
A syntax analysis means for extracting word pairs in the electronic text data from the incoming electronic text data;
Based on the word pair information extracted by the syntax analysis means, an opinion determination unit that determines whether the opinion is a positive opinion or a negative opinion with respect to the words in the questionnaire information with reference to the determination knowledge database;
The natural sentence processing apparatus characterized by having.
(2)集計結果を蓄積する蓄積手段を有し、
前記構文解析手段は、複数のアンケート情報の自由記載部分を電子テキストデータとして抽出し、
前記構文解析手段は、前記抽出部が電子テキストデータとして抽出した各々のアンケート情報の構文解析を行い、単語対を抽出するとともに、
更に、前記意見判定部が判定した複数のアンケート情報の判定結果の集計を行い、該集計結果を前記蓄積手段に蓄積する意見集計部と、
を有することを特徴とする前記(1)に記載の自然文処理装置。
(2) having a storage means for storing the counting results;
The syntax analysis means extracts free description parts of a plurality of questionnaire information as electronic text data,
The syntax analysis means performs syntax analysis of each questionnaire information extracted as electronic text data by the extraction unit, extracts word pairs,
Furthermore, the opinion totaling unit that aggregates the determination results of the plurality of questionnaire information determined by the opinion determination unit and accumulates the totalization results in the storage unit;
The natural sentence processing apparatus according to (1), characterized in that:
(3)前記構文解析手段は電子テキストデータを構文木に変換した情報を基に単語対を抽出する事を特徴とする前記(1)または前記(2)に記載の自然文処理装置。 (3) The natural sentence processing apparatus according to (1) or (2), wherein the syntax analysis unit extracts word pairs based on information obtained by converting electronic text data into a syntax tree.
(4)単語対情報とその単語対情報が肯定的表現か否定的表現かを対応付けて格納する判定知識データベースにアクセス可能なコンピュータを、
到来する電子テキストデータより電子テキストデータ内の単語対を抽出する構文解析手段と、
前記構文解析手段により抽出された単語対情報を元に、前記判定知識データベースを参照してアンケート情報内の単語に対して肯定的意見か否定的意見かを判定する意見判定部と、
して機能させる自然言語処理プログラム。
(4) A computer that can access a judgment knowledge database that stores word pair information in association with whether the word pair information is a positive expression or a negative expression,
A syntax analysis means for extracting word pairs in the electronic text data from the incoming electronic text data;
Based on the word pair information extracted by the syntax analysis means, an opinion determination unit that determines whether the opinion is a positive opinion or a negative opinion with respect to the words in the questionnaire information with reference to the determination knowledge database;
Natural language processing program that makes it work.
(5)単語対情報とその単語対情報が肯定的表現か否定的表現かを対応付けて格納する判定知識データベースにアクセス可能なコンピュータが、
到来する電子テキストデータより電子テキストデータ内の単語対を抽出する構文解析ステップと、
前記構文解析ステップにより抽出された単語対情報を元に、前記判定知識データベースを参照してアンケート情報内の単語に対して肯定的意見か否定的意見かを判定する意見判定ステップと、
を実行する事を特徴とする自然言語処理方法。
(5) A computer that can access a judgment knowledge database that stores word pair information in association with whether the word pair information is a positive expression or a negative expression.
A parsing step for extracting word pairs in the electronic text data from the incoming electronic text data;
Based on the word pair information extracted by the syntax analysis step, an opinion determination step for determining whether the opinion in the questionnaire information is a positive opinion or a negative opinion with reference to the determination knowledge database;
Natural language processing method characterized by executing
これにより下記の作用効果を奏することができる。 Thereby, the following effects can be obtained.
(1)複数の意見提供者から提出された自由記述部分の回答文より、意見提供者の主張・見解・感想など単語対を意見として自動的に抽出することができるので、多数の自由記述部分の回答文より正確に短時間で意見を抽出することができる。 (1) Since word pairs such as the opinion provider's assertions, opinions, and impressions can be automatically extracted from the response text of the free description parts submitted by multiple opinion providers, many free description parts It is possible to extract opinions accurately and in a short time from the answer sentence.
(2)抽出した意見が対象物に関する肯定的評価を与えているものか、それとも否定的評価を与えているものかを、これらを判定するための知識を格納する判定知識データベースを検索することにより、正確に、自動判定することができる。 (2) By searching a judgment knowledge database that stores knowledge for judging whether the extracted opinion gives a positive evaluation or negative evaluation regarding the object , Accurate and automatic determination.
(3)一つの回答文から肯定意見と否定意見の両方が得られたときに、その評価の強さを比較してその回答文における総合的なきめ細かな判定結果を自動的に得ることができる。 (3) When both a positive opinion and a negative opinion are obtained from a single answer sentence, the strength of the evaluation can be compared to automatically obtain a comprehensive and detailed judgment result in the answer sentence. .
(4)提示情報を、全体集合を変化させた複数のグラフで順次表示することができるので、分析結果をわかり易く提示することができる。 (4) Since the presentation information can be sequentially displayed in a plurality of graphs in which the entire set is changed, the analysis result can be presented in an easy-to-understand manner.
(5)抽出した意見を判定する際の知識を、特定形式の意見調査票における回答結果より自動的に獲得するので、事前に判定する際の知識を用意することなく、意見判定を行うことができる。しかも学習する程正確な結果を得ることができる。 (5) Since the knowledge for judging the extracted opinion is automatically acquired from the answer result in the opinion questionnaire of a specific format, it is possible to make an opinion judgment without preparing the knowledge for judgment in advance. it can. Moreover, accurate results can be obtained as learning is performed.
(6)抽出した意見を判定する際の知識を、特定形式の意見調査票を使用することなく、自動的に獲得することができるので、これまた事前に判定する際の知識を用意することなく、意見判定を行うことができる。しかも学習する程正確な結果を得ることができる。 (6) Since knowledge for judging the extracted opinion can be automatically acquired without using a specific form opinion survey form, it is also possible to prepare knowledge for judgment in advance. , Opinion judgment can be performed. Moreover, accurate results can be obtained as learning is performed.
(7)コンピュータに、提供された意見から意見提供者の自由記述部分の電子化データを意見提供の回答文として抽出する回答抽出手段、抽出した回答文より、単語対を抽出する意見抽出手段、抽出した意見内容毎の集計を行う意見集計手段、この意見内容毎の集計結果を提供する結果提供手段として機能するプログラムをインストールすることにより、通常のコンピュータを、複数の意見提供者から提供された意見を解析する自然文処理機能を遂行させることができる。 (7) An answer extracting means for extracting the electronic data of the free description part of the opinion provider from the provided opinions as an answer sentence for providing the opinion to the computer, an opinion extracting means for extracting a word pair from the extracted answer sentence, By installing a program that functions as an opinion aggregation means that aggregates the extracted opinion contents and a result providing means that provides the aggregation results for each opinion contents, a normal computer was provided by multiple opinion providers. A natural sentence processing function for analyzing opinions can be performed.
本発明の一実施の形態を図1〜図6にもとづきアンケート回答の分析を例として説明する。図1は本発明の実施の形態、図2は意見抽出説明図、図3は本発明における意見集計結果の一例を示す意見集計結果説明図、図4は本発明における集計結果の一例を示す集計結果説明図、図5は本発明のグラフ状態説明図、図6は本発明の回答文解析例である。 An embodiment of the present invention will be described with reference to an analysis of questionnaire responses based on FIGS. 1 is an embodiment of the present invention, FIG. 2 is an explanatory view of opinion extraction, FIG. 3 is an explanatory view of an opinion summary result showing an example of an opinion summary result in the present invention, and FIG. 4 is an aggregate showing an example of an aggregate result in the present invention. FIG. 5 is an explanatory diagram of results, FIG. 5 is a graph state explanatory diagram of the present invention, and FIG. 6 is an example of an answer sentence analysis of the present invention.
図中、1は入力部、2は回答抽出部、3は意見抽出部、4は意見集計部、5は結果提示部、6は意見判定部、7は判定知識獲得部であって第1判定知識獲得部7−1及び第2判定知識獲得部7−2を具備するもの、8は集計知識データベース、9は判定知識データベース、10は集計結果格納データベース、20はプロセッサ、21は表示部、Aはアンケート回答者、Bはアンケート分析者である。 In the figure, 1 is an input unit, 2 is an answer extraction unit, 3 is an opinion extraction unit, 4 is an opinion aggregation unit, 5 is a result presentation unit, 6 is an opinion determination unit, 7 is a determination knowledge acquisition unit, and is a first determination. Comprising knowledge acquisition unit 7-1 and second determination knowledge acquisition unit 7-2, 8 is a total knowledge database, 9 is a determination knowledge database, 10 is a total result storage database, 20 is a processor, 21 is a display unit, A Is a questionnaire respondent and B is a questionnaire analyst.
入力部1は、アンケート回答者Aがアンケート用紙に各々の回答を入力し、この回答を装置に回収する処理を行うものである。この回答を回収する処理としては、例えば紙媒体のアンケート調査票をアンケート対象者に直接配布したり、あるいはファックスなどで配布し、そこに回答を記入させて結果を回収する手法や、電子メールやウェブ掲示板を用いて調査票の配布と回答記入及び回収を行うこと等で実現可能である。 The input unit 1 performs a process in which the questionnaire respondent A inputs each answer on a questionnaire sheet and collects this answer in the apparatus. The process of collecting this response includes, for example, distributing a questionnaire on paper media directly to the survey target person, or distributing it by fax etc. This can be achieved by distributing survey forms, filling in responses and collecting them using a web bulletin board.
アンケート調査票の回答回収やファックスによる回答回収の場合は、回答記入欄が固定されているので、用紙の座標位置により検出できる。このような回答を回収する処理には、従来のアンケート結果回収のための手段をそのまま流用可能である。 In the case of collecting responses to questionnaires or collecting responses by fax, the response entry field is fixed so that it can be detected by the coordinate position of the paper. In the process of collecting such answers, conventional means for collecting questionnaire results can be used as they are.
なお入力部1としては以上のような文字情報によるものを扱うもののみに限定されるものでてはなく、電話応答などによって対象者の回答を音声データの形で回収することも可能であり、インターネットを使用したウェブ上のデータでもよく、回答のメディアとしてあらゆる情報伝達手段が利用可能である。もし翻訳手段が具備されていれば外国語で入力することもできる。 Note that the input unit 1 is not limited to the one that handles character information as described above, and it is also possible to collect the subject's answers in the form of voice data by telephone response, etc. Data on the web using the Internet may be used, and any information transmission means can be used as a response medium. If a translation means is provided, it can be entered in a foreign language.
回答抽出部2は、回収された個々のアンケート回答結果の中の自由記述部分を電子テキスト化し、回答文として抽出する処理を行うものである。この処理は、例えば回収した紙媒体によるアンケート回答をアンケート実施者側のオペレータがキーボードなどの電子化データ入力手段で電子化テキストを作成する方法や、回答メディアに応じて適当な自動電子化手段、例えば文字認識装置や音声認識装置を用いて入手をかけることなく電子化テキストを作成する方法などで実現される。 The answer extraction unit 2 converts the free description part of each collected questionnaire answer result into an electronic text and extracts it as an answer sentence. This process includes, for example, a method in which an operator on the questionnaire operator side creates a digitized text by means of digitized data input means such as a keyboard, and an automatic digitizing means suitable for the answer medium, For example, it is realized by a method of creating digitized text without using a character recognition device or a speech recognition device.
またアンケートの入力部1に採用した手段によっては、回収した回答が既に電子化されている場合があるが、このような場合はその電子化されている自由記述部分をそのまま意見抽出部3に送出することができる。
Depending on the means adopted for the questionnaire input unit 1, the collected responses may already be digitized. In such a case, the digitized free description portion is sent to the
意見抽出部3は、回答抽出部2が作成した電子化された回答文を解析し、回答文のいわんとする情報を意見として抽出する処理を行うものである。
The
ここで抽出される意見とは、例えばノートパソコンにおける製品アンケートについて、「本体は小さいのに画面が大きい。」という回答文の中に含まれている、「本体は小さい」、「画面は大きい」といったアンケート集計の際にアンケート実施者が知りたい情報である。 The opinions extracted here include, for example, a product questionnaire on a notebook computer, which is included in an answer sentence “the body is small but the screen is large”, “the body is small”, “the screen is large” This is the information that the surveyor wants to know when collecting the questionnaires.
この意見抽出処理は、図2に示す如く、回答文を構文解析手段3−2を用いて構文木に変換してその主語と述語を抽出し、その二項関係「本体−小さい」、「画面−大きい」を集計処理単位とすることで実現される。 In this opinion extraction process, as shown in FIG. 2, the answer sentence is converted into a syntax tree using the syntax analysis means 3-2 to extract the subject and the predicate, and the binary relations “body-small”, “screen” This is achieved by setting “large” as the total processing unit.
なお、意見として抽出する情報としては、上記の「主語−述語」の組に限らず、「被修飾語−修飾語」の関係から例えば「見やすい画面」から「画面−見やすい」を抽出するなど、種々のものが考えられる。 Note that the information extracted as an opinion is not limited to the above-mentioned “subject-predicate” pair, but for example, “screen-easy to see” is extracted from “easy-to-view screen” from the “modified subject-modifier” relationship, etc. Various things are possible.
また以上のような二項関係に限らず、構文木の中の三項以上の関係、例えば「主語−目的語−述語」を意見とすることもできるし、抽出した表記による関係をさらに意味解釈手段3−1によって意味構造に変換してそれを意見とすることも可能である。 In addition to the binary relations as described above, it is also possible to use the relation of three or more terms in the syntax tree, for example, "subject-object-predicate" as an opinion, and further interpret the relation by the extracted notation. It is also possible to convert it into a semantic structure by means 3-1 and make it an opinion.
例えば「♯画面→♯美しい」と表す。ここで♯はその後方の単語の意味を表す演算子であって、テキスト中に出てきた画面のみではなく、例えばその分野の画面の同義語全体を表すものであり、モニタ、スクリーン、画面、液晶等全体を示す。また→は推論結果を表す演算子であり、この例では「画面であれば美しいもの」ということを示す。なお、これらの処理は全てコンピュータを用いて行い、人手をかけることなく実現可能である。 For example, “# screen → # beautiful”. Here, # is an operator representing the meaning of the word behind it, not only the screen that appears in the text, but for example, the whole synonym of the screen in the field, monitor, screen, screen, The entire liquid crystal is shown. In addition, “→” is an operator representing an inference result, and in this example, indicates that “the screen is beautiful”. These processes are all performed using a computer and can be realized without manpower.
意見集計部4は、意見抽出部3が抽出した意見、例えば「本体−小さい」や「画面−大きい」といった二項関係毎にその出現頻度を集計する処理を行うものである。これにより、例えば図3に示す如く、二項関係毎の出現頻度を集計することができる。
The opinion totaling unit 4 performs processing for totalizing the appearance frequency for each opinion extracted by the
集計方法としては、例えば意見を上記の如き二項関係とした場合、各意見毎にその数を集計することに加えて、第一項(「本体−小さい」なら「本体」)のみによる集計や、第二項(前記の例における「小さい」)のみによる集計を行い、それらの集計結果を結果提示部5に送出することで、分析者Bの分析目的に合致した情報提示を行うことができる。 As an aggregation method, for example, when the opinions are expressed in the binary relation as described above, in addition to counting the number for each opinion, the aggregation is based only on the first item (or “body” if “body-small”). By performing the aggregation only by the second term ("small" in the above example) and sending the aggregation results to the result presentation unit 5, it is possible to present information that matches the analysis purpose of the analyst B. .
また意見の表現の揺れを吸収した結果を集計する機能を付与した集計方式もできる。これは、例えば否定文から抽出された意見、「本体−大きくない」に関して、「本体−大きくない」という意見を「本体−小さい」と同意見として集計を行うといった機能である。 In addition, a tabulation method with a function of tabulating the result of absorbing the fluctuation of the expression of the opinion can be used. For example, regarding the opinion extracted from a negative sentence, “main body—not big”, the opinion “main body—not big” is counted as “main body—small” as the same opinion.
これは例えば、意見集計部4に反意語の肯定表現を示す反意語データベースを含む集計知識データベース8を接続し、意見の第二項が否定を含む場合、例えば「大きくない」の肯定表現「大きい」でこの反意語データベースを検索し、その反意語「小さい」を獲得して第一項と組み合わせて「本体−小さい」として集計に用いることで実現できる。
For example, when the
同様の方式で、集計知識データベース8に同義語データベースを備え、同義語の統一を行うことも可能である。この処理は、例えば「画面−綺麗」、「スクリーン−美しい」といった意見を「画面−美しい」として集計することができる。
In the same manner, the
その他シソーラス、実世界知識等を集計知識データベース8に備えることもできる。実世界知識とは、例えば「前のものが良かった」という意見を「今のものは悪い」と判断し、「操作性は前のものが良かった」という回答文から抽出すべき知識として「操作性は悪い」と分析するものである。
Other thesauruses, real world knowledge, and the like can also be provided in the
以上の処理を行った結果は、例えば図3に示す表の様に表される。図3はノートパソコンに関するものであり、意見としては「本体−小さい」、「画面−大きい」、「画面−小さい」・・・が抽出され、その集計数は200、50、150・・・であり、「本体−小さい」、「画面−大きい」は好判定結果を示し、「画面−小さい」は否判定結果を示している。 The result of performing the above processing is expressed as a table shown in FIG. 3, for example. FIG. 3 relates to a notebook personal computer. As opinions, “main body-small”, “screen-large”, “screen-small”... Are extracted, and the total number is 200, 50, 150. Yes, “main body-small” and “screen-large” indicate a favorable determination result, and “screen-small” indicates a negative determination result.
そして「本体−小さい」の同義意見としては「本体−コンパクト」、「ボディ−小さい」・・・が、「画面−大きい」の同義意見としては「画面−広い」・・・が、「画面−小さい」の同義意見としては「画面−狭い」、「画面−大きくない」・・・が存在したことを示している。 As synonymous opinions of “main body-small”, “main body-compact”, “body-small”..., And as synonymous opinion of “screen-large”, “screen-wide”. As a synonymous opinion of “small”, “screen-narrow”, “screen-not big”,... Exist.
結果提示部5に送出するデータ形式は、種々の表形式ソフトの扱う形式に変換して図3のような表の形で送ってもよいし、他の形式で送ることもできる。なおこれらの意見集計部に関する処理は全てコンピュータで実現可能である。 The data format sent to the result presentation unit 5 may be converted into a format handled by various tabular software and sent in the form of a table as shown in FIG. 3, or may be sent in another format. Note that all the processes related to the opinion totaling unit can be realized by a computer.
結果提示部5は、意見集計部4が作成した集計結果をアンケート分析者Bに提示する処理を行うものである。集計結果の提示方法としては、図4に示す如き表の形でアンケート分析者Bに提示してもよいし、その他、種々の表計算ソフトの機能を利用して、アンケート分析者Bの分析目的に合致した表やグラフを作成して提示してもよい。 The result presentation unit 5 performs processing for presenting the total result created by the opinion totaling unit 4 to the questionnaire analyst B. As a method of presenting the aggregated results, it may be presented to the questionnaire analyst B in the form of a table as shown in FIG. 4 or, in addition, the analysis purpose of the questionnaire analyst B using various spreadsheet software functions You may create and present a table or graph that matches
図4によれば、回答者は対象商品について、本体が綺麗とか汚いということよりも、大きいとか小さいということに関心のあることもわかる。 According to FIG. 4, it can also be seen that the respondent is interested in the target product being larger or smaller than the clean or dirty main body.
提示手段としては、例えば図1に示す表示部21にモニタ用の図表をアンケート分析者に提示できるものである必要があるが、本発明では必ずしも図表情報を提示手段に限定する必要はなく、例えば結果読み挙げ手段としスピ−カ等を用いて音声情報に変換してアンケート分析者に提示してもよい。
As the presenting means, for example, it is necessary to be able to present a chart for monitoring to the questionnaire analyst on the
グラフとして提示する場合は、図5に示す如く、最初の図表として、長さを第一項で集計した意見の総数とした棒グラフで表現する。例えば本体については、図4に示す如く、好意的意見数が500、否定的意見数が20あるので、520の総数を示す棒グラフを作成し、それに対する肯定評価意見(500)と否定評価意見(20)の割合を各々色分けして提示し、例えばアンケート分析者がその肯定評価部分をマウスの如きポインテングデバイスで指定すると、肯定意見における第二項目の各割合を円グラフで提示し、さらに円グラフ内にある項目にポインテングデバイスで指示するとその意見が抽出された回答文を表示するというような方法である。 When presenting as a graph, as shown in FIG. 5, the first chart is represented by a bar graph in which the length is the total number of opinions totaled in the first term. For example, as shown in FIG. 4, since the number of favorable opinions is 500 and the number of negative opinions is 20, as shown in FIG. 4, a bar graph indicating the total number of 520 is created, and positive evaluation opinion (500) and negative evaluation opinion ( 20) each of the ratios is presented in different colors. For example, if the questionnaire analyst designates the positive evaluation part with a pointing device such as a mouse, each ratio of the second item in the positive opinion is presented in a pie chart, and When an item in the graph is instructed by a pointing device, an answer sentence in which the opinion is extracted is displayed.
図5において、本体に関する棒グラフの肯定評価部分をポインテングデバイスでポインテングすると、3つに区分された円グラフが表示され、領域(a)をポインテングすると、回答文「小さい」が表示される。また領域(b)をポインテングすると「便利」が表示され、領域(c)をポインテングすると「軽い」が表示される。 In FIG. 5, when a positive evaluation portion of the bar graph relating to the main body is pointed with the pointing device, a pie chart divided into three is displayed, and when the area (a) is pointed, an answer sentence “small” is displayed. Further, when the area (b) is pointed, “Convenient” is displayed, and when the area (c) is pointed, “Light” is displayed.
さらに1つの回答文から肯定意見と否定意見の両方が得られたときに、その評価の強さを比較してその回答文における総合的な判定結果を推定する。このためこの2つの意見が出たとき、それぞれにあらかじめ点数をつけ、重み付けする。 Furthermore, when both a positive opinion and a negative opinion are obtained from one answer sentence, the strengths of the evaluations are compared, and a comprehensive determination result in the answer sentence is estimated. For this reason, when these two opinions are given, each is given a score in advance and weighted.
このようにして、意見単位の集計結果だけでなく、回答文単位の評価の集計も行えるので、それをグラフの割合で色分けして最初にアンケート分析者に提示し、例えばその肯定意見の割合の部分をポインテングデバイスで指定すると、総合的に肯定評価を与えている回答文における意見の割合などもグラフィカルに提示することができる。 In this way, not only the result of the opinion unit, but also the evaluation of the response sentence unit can be aggregated, so it is color-coded by the proportion of the graph and presented to the questionnaire analyst first, for example the proportion of the positive opinion If a part is designated by a pointing device, the ratio of the opinions in the answer sentences giving a comprehensive evaluation can also be presented graphically.
意見判定部6は、意見抽出部3が抽出した各意見情報について、判定知識データベース9に格納された意見判定知識を用いて、その意見が肯定的意見か否定的意見かを判定する処理を行うものである。
The
判定知識データベース9に格納される意見判定知識とは、例えば意見が例としてあげた二項関係で表現可能なものである場合は「本体−小さい−肯定的評価」といった三項関係で記述可能な情報である。またこの判定知識データベース9における対象物依存性をなくし、他の対象物に関するアンケートも同じデータベースを使うことを考えて、さらに対象物に関する情報を加えた「本体−小さい−肯定的評価、対象物:情報機器」等の4項関係で記述してもよい。
The opinion judgment knowledge stored in the
このような判定知識を格納した判定知識データベースを具備し、抽出した各意見、例えば「本体−小さい」に対してこの判定知識データベースを検索し、例えば「本体−小さい−肯定的評価」を得ることで、この処理が実現できる。 A judgment knowledge database storing such judgment knowledge is provided, and the judgment knowledge database is searched for each extracted opinion, for example, “main body-small”, and, for example, “main body-small-positive evaluation” is obtained. This process can be realized.
また、例えば肯定的意見に+1、否定的意見に−1という得点(重み)を与えて一つの回答文において得られた複数の意見の得点の和をある一つの回答文について総合的な評価とみなすことで回答文単位の対象物の評価を求めることができる。 Also, for example, by giving a score (weight) of +1 to a positive opinion and -1 to a negative opinion, the sum of the scores of a plurality of opinions obtained in one answer sentence can be comprehensively evaluated for one answer sentence. By considering it, it is possible to request the evaluation of the object in response sentence units.
さらに、判定結果を肯定的評価/否定的評価といった2値ではなく、多値をとるものとして、例えば評価にさらに「強い肯定」、「強い否定」を加えて4値として、評価の強さに応じた得点を与えることで、より精度の良い判定を図ることもできる。また各評価値を評価関数で表現し、束値論理に基づく合成、いわゆる「ファジー推論」を行って総合評価を算出することも可能である。 Furthermore, the determination result is not a binary value such as a positive evaluation / negative evaluation, but takes a multi-value, for example, by adding “strong positive” and “strong negative” to the evaluation to give a four-value to the strength of the evaluation. A more accurate determination can also be achieved by giving a corresponding score. It is also possible to express each evaluation value by an evaluation function and calculate a comprehensive evaluation by performing synthesis based on bundle value logic, so-called “fuzzy inference”.
判定知識獲得部7は、判定知識を、人手を用いることなく、自動的に獲得するものである。意見判定部6で使用される判定知識は対象物依存の知識であり、その整備にはコストがかかる。この問題を解決するためには、アンケート回答文より自動的に判定知識を獲得すればよい。
The determination
第1の手法として、特に抽出した意見を判定する際の知識を判定形式のアンケート調査票におけるアンケート回答結果より自動的に獲得して蓄積するものである。 As a first method, the knowledge for judging the extracted opinion is automatically acquired and accumulated from the questionnaire response result in the questionnaire questionnaire in the judgment format.
運用初期においては、判定知識データベース9内に十分な判定知識が格納されていないので、アンケートの各質問については、例えば「本製品について、良いと思われた点をご記入下さい」といった、質問に対する回答結果の評価が明らかになるような設問とし、そこに記載された回答文より意見を抽出して、回答に予想される評価を合わせて判定知識として判定知識データベースに格納するものである。
In the initial stage of operation, sufficient judgment knowledge is not stored in the
また対象物に対してその評価すべき属性が予め判明している場合には、設問として「本製品の以下の事項について、感じたことを以下より選択し、そう感じた理由をご記入下さい」などとし、次に「画面」、「キーボード」・・・といった評価すべき属性を並べて、回答箇所には「大変良い−良い−普通−悪い−大変悪い」といった選択肢記入項目とその理由を記入する自由記述項目の2つを設け、アンケート結果を電子化した結果より、事項例えば「画面」と自由記述部分からの術語、例えば「大きくて見やすいから」という記述から、「大きい」、「見やすい」を抽出し、その組をもって意見を作成し、それに選択部分の評価値、例えば良い、を合わせて判定知識を作成する。例えば「画面−大きい−肯定的評価」及び「画面−見やすい−肯定的評価」を作成する。このような処理で獲得された知識を判定知識データベース9に格納することで、以後の処理で利用することが可能となる。前記各処理は、図1に示す第1判定知識獲得部7−1が行う。
In addition, when the attribute to be evaluated for the object is known in advance, the question is “Please select what you feel about the following items of this product from the following, and enter the reason why you feel it” Next, arrange the attributes to be evaluated such as “screen”, “keyboard”, etc., and enter the option entry item “very good-good-normal-bad-very bad” and the reason in the answer part. Two free description items are provided, and the results of digitizing the questionnaire results indicate that items such as “screen” and the terminology from the free description part, for example, “large and easy to see”, “large” and “easy to see” Extraction is made, an opinion is created based on the set, and judgment knowledge is created by combining the evaluation value of the selected portion, for example, good. For example, “screen-large-positive evaluation” and “screen-easy to read-positive evaluation” are created. By storing the knowledge acquired by such processing in the
第2の手法としては、前記のように、運用初期に特別の設問を設定しなくとも判定知識を獲得するようにしたものであり、図1に示す第2判定知識獲得部7−2が処理を行うものである。 As described above, as described above, the determination knowledge is acquired without setting a special question at the initial stage of operation as described above, and the second determination knowledge acquisition unit 7-2 shown in FIG. Is to do.
これは、例えば「画面が見やすくて良い」という回答文からは「画面−見やすい」、「画面−良い」という2つの意見が抽出できるが、その一つの第二項が予め与えてある評価を表している語である場合、この例では「良い」が予め与えられている評価を表しているので、この知識を「良い−肯定的評価」という二項関係で表現する。そしてこの2つをマージして「画面−見やすい−肯定的評価」という判定知識情報を獲得することができる。 This is because, for example, two opinions “screen-easy to see” and “screen-good” can be extracted from an answer sentence “screen is easy to see”, and one of the second terms represents an evaluation given in advance. In this example, since “good” represents an evaluation given in advance, this knowledge is expressed by a binary relation of “good-positive evaluation”. Then, by combining these two, it is possible to acquire the determination knowledge information “screen−easy to see−positive evaluation”.
この手法は、判定知識の抽出だけでなく、運用の初期状態で装置に与えていない評価を表している語を獲得することも可能である。これは、例えば「良い−肯定的評価」という知識を予め装置に与えて、前記の例文より「画面−見やすい−肯定的評価」という判定知識を獲得したとする。 This method can not only extract judgment knowledge but also obtain words representing evaluations that are not given to the apparatus in the initial state of operation. For example, it is assumed that knowledge of “good—positive evaluation” is given to the apparatus in advance, and determination knowledge “screen—easy to see—positive evaluation” is acquired from the above example sentence.
次に「画面が見やすくて素晴らしい」という回答文より「画面−見やすい」、「画面−素晴らしい」といった二つの意見が抽出されるが、前記獲得した判定知識より「画面−見やすい」は肯定的評価であることが分かるので、「素晴らしい−肯定的評価」といった新たな知識を得ることができる。このように「見やすい」「素晴らしい」は肯定的評価であることを判定知識データベース9に格納し、以後の処理に利用することで、知識の学習機能を実現することができる。
Next, two opinions such as “screen—easy to see” and “screen—great” are extracted from the answer sentence “screen is easy to see and great”. Knowing that there is new knowledge such as “Excellent-Positive Evaluation”. The knowledge learning function can be realized by storing in the
以上で述べた処理はすべてコンピュータで人手を要せずに処理可能である。なお前記第1の手法、第2の手法の判定知識獲得方式は排反ではなく、この両方を組み合わせたものも構成できる。 All of the processes described above can be processed by a computer without requiring manual operation. Note that the determination knowledge acquisition methods of the first method and the second method are not rejected, and a combination of both can be configured.
集計知識データベース8には、回答文を集計するために必要なデータが格納されるものであり、例えば、反意語データベース、同義語データベース、シソーラス、実世界知識等が格納されている。
The tabulated
判定知識データベース9には回答文が肯定的(好意的)意見なのか否定的意見なのかを判定するために必要なデータが格納されるものであり、例えば品詞、意見判定知識、「第1項+第2項+評価」、「第1項+第2項+評価+対象分野」、肯定的意見と否定的意見が混在するときの各意見に対する点数(重みづけ)等が格納されている。
The
集計結果格納データベース10は、本発明により得られた集計結果を一時格納するものであり、図3、図4に示す集計データや、図5に示す表示データ等が格納されるものである。
The totaling
プロセッサ20は、本発明の自然処理装置を構成するものであり、例えば回答抽出部2、意見抽出部3、意見集計部4、結果提示部5、意見判定部6、判定知識獲得部7等を具備している。
The
表示部21は、本発明の処理結果をアンケート分析者Bが表示して、その処理結果を見るためのものであり、ディスプレイやプリンタ等で構成される。
The
図1に示す本発明の実施の形態の動作を図7に示すフローチャートに従って説明する。 The operation of the embodiment of the present invention shown in FIG. 1 will be described according to the flowchart shown in FIG.
S1.アンケート回答者Aからアンケートに対する回答が、例えばファクシミリや電子情報で入力部1に入力される。入力部1では、この回答結果を回答抽出部2に送出する。 S1. An answer to the questionnaire from the questionnaire respondent A is input to the input unit 1 by facsimile or electronic information, for example. The input unit 1 sends this answer result to the answer extraction unit 2.
S2.回答抽出部2は、この回答結果、特に自由記述部分を電子テキスト化し、回答文として抽出する処理を行う。そしてこの電子化された回答文を意見抽出部3に送出する。
S2. The answer extracting unit 2 converts the answer result, particularly a free description part, into an electronic text and extracts it as an answer sentence. Then, this electronic response sentence is sent to the
S3.意見抽出部3は、この電子化された回答文を形態素解析し、構文解析手段3−2を用いて構文木に変換し、二項関係あるいは三項関係等を作成し、回答文より意見の抽出を行う。そしてこれを意見集計部4に送出する。
S3. The
S4.意見集計部4は、前記意見抽出部3が抽出した意見を、例えば二項関係毎にその出現頻度を集計する。このとき意見抽出部3が抽出した意見が肯定的意見か、否定的意見かを意見判定部6が判定知識データベースに格納された意見判定知識を用いて判定する。
S4. The opinion totaling unit 4 totals the appearance frequencies of the opinions extracted by the
S5.意見集計部4は、このように意見抽出部3が抽出した意見の出現頻度を集計し、意見判定部6を介して意見抽出部3が抽出した意見が肯定的か否定的かを判定し、また集計知識データベース8の同義語データベースをアクセスして同義意見を認識する。そして図3に示す如き、意見集計表を作成する。
S5. The opinion totaling unit 4 totals the appearance frequency of the opinions extracted by the
S6.このようにして作成された意見集計が結果提示部5に送出されると、結果提示部5では、これを加工してアンケート分析者Bがアンケート結果を分析し易い形で提示する処理を行う。例えば、図4に示す如く、表形式にして提示してもよく、またアンケート分析者の解析目的に合致した表やグラフを作成して提示してもよい。また図5に示す如く、ポインテングデバイスで指定されたときその部分を更に詳述表示するように提示してもよい。 S6. When the opinion total created in this way is sent to the result presenting unit 5, the result presenting unit 5 processes the processed result and presents the questionnaire result in an easy-to-analyze manner for the questionnaire analyst B. For example, as shown in FIG. 4, it may be presented in a table format, or a table or graph that matches the analysis purpose of a questionnaire analyst may be created and presented. Further, as shown in FIG. 5, when a pointing device is designated, the portion may be presented to be displayed in more detail.
ところで、図6に示す回答文が入力されたとき、本発明では意見抽出部3が意見判定部6とともに、この回答文を形態素解析して、前半の文の主語−述語が「野球−思って」であり、「が」が否定接続詞であることを認識して、「野球−思って−否定」を認識する。
By the way, when the answer sentence shown in FIG. 6 is input, in the present invention, the
そして後半の文の主語−述語が「ゴルフ−良い」であり良いの評価が肯定であることより「ゴクフ−良い−肯定」を認識する。このようにして図6の回答文は「野球ではなく−ゴルフ」ということを得る。 Then, since the subject-predicate of the latter half sentence is “golf-good” and the evaluation of good is affirmative, “gokufu-good-affirmation” is recognized. In this way, the reply sentence in FIG. 6 obtains “not golf but baseball—golf”.
なお、前記説明では、本発明をアンケート回答文の処理の例について説明したが、本発明は勿論これに限定されるものではない。 In the above description, the present invention has been described with respect to an example of a questionnaire response sentence processing. However, the present invention is not limited to this.
なお前記回答抽出部2、意見抽出部3、意見集計部4、結果提示部5、意見判定部6、判定知識獲得部7等は、例えばプログラムで構成処理することが出来る。
The answer extraction unit 2, the
本発明の形態を付記に記載する。 The form of this invention is described in an appendix.
(付記1)複数の意見提供者から提供された意見を解析する自然文処理装置において、提供された意見から意見提供者の自由記述部分の電子化データを意見提供の回答文として抽出する回答抽出手段と、抽出した回答文より、単語対を抽出する意見抽出手段と、抽出した意見内容毎の集計を行う意見集計手段と、この意見内容毎の集計結果を提供する結果提供手段を具備したことを特徴とする自然文処理装置。 (Supplementary note 1) In a natural sentence processing device that analyzes opinions provided by a plurality of opinion providers, the answer extraction is to extract the electronic data of the free description portion of the opinion provider from the provided opinions as a reply sentence for providing the opinions. Means, opinion extraction means for extracting word pairs from the extracted answer sentences, opinion totaling means for totaling each extracted opinion content, and result providing means for providing a total result for each opinion content Natural sentence processing device characterized by.
(付記2)前記付記1に記載の自然文処理装置において、抽出した意見が肯定的評価を与えているのか否定的評価を与えているのかを判定する意見判定手段と、意見を判定するための知識を格納する判定知識データベースを具備したことを特徴とする自然文処理装置。 (Additional remark 2) In the natural sentence processing apparatus of the said additional remark 1, the opinion determination means which determines whether the extracted opinion has given positive evaluation or negative evaluation, and for determining an opinion A natural sentence processing apparatus comprising a judgment knowledge database for storing knowledge.
(付記3)前記付記2に記載の自然文処理装置において、一つの回答文において、肯定意見と否定意見の2つが得られた場合、その強さを判定し、回答文の総合的な肯定・否定を判定する意見判定手段を具備したことを特徴とする自然文処理装置。 (Supplementary note 3) In the natural sentence processing device described in the supplementary note 2, when two affirmative opinions and negative opinions are obtained in one reply sentence, the strength is determined, and a comprehensive confirmation of the reply sentence is made. A natural sentence processing apparatus comprising an opinion determining means for determining negative.
(付記4)前記付記1、付記2記載の自然文処理装置において、提示情報を全体集合を変化させた複数のグラフで表示する提示手段を具備したことを特徴とする自然文処理装置。 (Additional remark 4) The natural sentence processing apparatus of Additional remark 1 and Additional remark 2 WHEREIN: The presentation means which displays presentation information by the some graph which changed the whole set was provided, The natural sentence processing apparatus characterized by the above-mentioned.
(付記5)前記付記2、付記3記載の自然文処理装置において、特に抽出した意見を判定する際の知識を、特定形式の意見調査票における回答結果より自動的に獲得して蓄積する判定知識獲得手段を具備したことを特徴とする自然文処理装置。
(Additional remark 5) In the natural sentence processing apparatus according to the above
(付記6)前記付記2、付記3記載の自然文処理装置において、特に抽出した意見を判定する際の知識を、回答文内の特定の表現パターンより自動的に獲得して蓄積する判定知識獲得手段を具備したことを特徴とする自然文処理装置。
(Supplementary note 6) In the natural sentence processing apparatus according to
(付記7)コンピュータを、複数の意見提供者から提供された意見を解析する自然文処理手段として動作させるために、提供された意見から意見提供者の自由記述部分の電子化データを意見提供の回答文として抽出する回答抽出手段、抽出した回答文より、単語対を抽出する意見抽出手段、抽出した意見内容毎の集計を行う意見集計手段、この意見内容毎の集計結果を提供する結果提供手段として機能させるための自然文処理用プログラム。 (Supplementary note 7) In order to operate the computer as a natural sentence processing means for analyzing opinions provided by a plurality of opinion providers, the electronic data of the free description part of the opinion provider is provided from the provided opinions. Answer extracting means for extracting as answer sentences, opinion extracting means for extracting word pairs from the extracted answer sentences, opinion counting means for counting for each extracted opinion content, and result providing means for providing a total result for each opinion content Natural sentence processing program to function as
1 入力部
2 回答抽出部
3 意見抽出部
4 意見集計部
5 結果提示部
6 意見判定部
7 判定知識獲得部
8 集計知識データベース
9 判定知識データベース
10 集計結果格納データベース
20 プロセッサ
21 表示部
DESCRIPTION OF SYMBOLS 1 Input part 2
Claims (5)
到来する電子テキストデータより電子テキストデータ内の単語対を抽出する構文解析手段と、
前記構文解析手段により抽出された単語対情報を元に、前記判定知識データベースを参照してアンケート情報内の単語に対して肯定的意見か否定的意見かを判定する意見判定部と、
を有することを特徴とする自然文処理装置。 A judgment knowledge database that stores word pair information in association with whether the word pair information is a positive expression or a negative expression;
A syntax analysis means for extracting word pairs in the electronic text data from the incoming electronic text data;
Based on the word pair information extracted by the syntax analysis means, an opinion determination unit that determines whether the opinion is a positive opinion or a negative opinion with respect to the words in the questionnaire information with reference to the determination knowledge database;
The natural sentence processing apparatus characterized by having.
前記構文解析手段は、複数のアンケート情報の自由記載部分を電子テキストデータとして抽出し、
前記構文解析手段は、前記抽出部が電子テキストデータとして抽出した各々のアンケート情報の構文解析を行い、単語対を抽出するとともに、
更に、前記意見判定部が判定した複数のアンケート情報の判定結果の集計を行い、該集計結果を前記蓄積手段に蓄積する意見集計部と、
を有することを特徴とする請求項1に記載の自然文処理装置。 It has a storage means to store the total results,
The syntax analysis means extracts free description parts of a plurality of questionnaire information as electronic text data,
The syntax analysis means performs syntax analysis of each questionnaire information extracted as electronic text data by the extraction unit, extracts word pairs,
Furthermore, the opinion totaling unit that aggregates the determination results of the plurality of questionnaire information determined by the opinion determination unit and accumulates the totalization results in the storage unit;
The natural sentence processing apparatus according to claim 1, comprising:
到来する電子テキストデータより電子テキストデータ内の単語対を抽出する構文解析手段と、
前記構文解析手段により抽出された単語対情報を元に、前記判定知識データベースを参照してアンケート情報内の単語に対して肯定的意見か否定的意見かを判定する意見判定部と、
して機能させる自然言語処理用プログラム。 A computer capable of accessing a judgment knowledge database that stores word pair information in association with whether the word pair information is a positive expression or a negative expression,
A syntax analysis means for extracting word pairs in the electronic text data from the incoming electronic text data;
Based on the word pair information extracted by the syntax analysis means, an opinion determination unit that determines whether the opinion is a positive opinion or a negative opinion with respect to the words in the questionnaire information with reference to the determination knowledge database;
Natural language processing program that makes it work.
到来する電子テキストデータより電子テキストデータ内の単語対を抽出する構文解析ステップと、
前記構文解析ステップにより抽出された単語対情報を元に、前記判定知識データベースを参照してアンケート情報内の単語に対して肯定的意見か否定的意見かを判定する意見判定ステップと、
を実行する事を特徴とする自然言語処理方法。
A computer that can access a judgment knowledge database that stores word pair information in association with whether the word pair information is a positive expression or a negative expression,
A parsing step for extracting word pairs in the electronic text data from the incoming electronic text data;
Based on the word pair information extracted by the parsing step, an opinion determination step for determining whether the opinion in the questionnaire information is a positive opinion or a negative opinion with reference to the determination knowledge database;
Natural language processing method characterized by executing
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005133969A JP3917629B2 (en) | 2000-08-21 | 2005-05-02 | Natural sentence processing apparatus and natural sentence processing program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000249313 | 2000-08-21 | ||
JP2005133969A JP3917629B2 (en) | 2000-08-21 | 2005-05-02 | Natural sentence processing apparatus and natural sentence processing program |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001245870A Division JP2002140465A (en) | 2000-08-21 | 2001-08-14 | Natural sentence processor and natural sentence processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005322239A true JP2005322239A (en) | 2005-11-17 |
JP3917629B2 JP3917629B2 (en) | 2007-05-23 |
Family
ID=35469437
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005133969A Expired - Lifetime JP3917629B2 (en) | 2000-08-21 | 2005-05-02 | Natural sentence processing apparatus and natural sentence processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3917629B2 (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219880A (en) * | 2006-02-17 | 2007-08-30 | Fujitsu Ltd | Reputation information processing program, method, and apparatus |
JP2007226460A (en) * | 2006-02-22 | 2007-09-06 | Just Syst Corp | Data processor and data processing method |
JP2010079826A (en) * | 2008-09-29 | 2010-04-08 | Nec Biglobe Ltd | Information processor, and contrast information output method and program |
WO2010120679A3 (en) * | 2009-04-12 | 2011-03-03 | The Brookeside Group, Inc. | Emotivity and vocality measurement |
JP2013105226A (en) * | 2011-11-11 | 2013-05-30 | Fujitsu Ltd | Received mail sorting device, received mail sorting program, and received mail sorting method |
WO2017203681A1 (en) * | 2016-05-27 | 2017-11-30 | 楽天株式会社 | Information processing device, information processing method, program, and storage medium |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101007284B1 (en) | 2008-09-23 | 2011-01-13 | 주식회사 버즈니 | System and method for searching opinion using internet |
US20110179009A1 (en) * | 2008-09-23 | 2011-07-21 | Sang Hyob Nam | Internet-based opinion search system and method, and internet-based opinion search and advertising service system and method |
KR101158860B1 (en) * | 2009-12-31 | 2012-06-25 | 에이든 정일 조 | Method for searching subjective analysis according to mental status and system therefor |
-
2005
- 2005-05-02 JP JP2005133969A patent/JP3917629B2/en not_active Expired - Lifetime
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219880A (en) * | 2006-02-17 | 2007-08-30 | Fujitsu Ltd | Reputation information processing program, method, and apparatus |
JP2007226460A (en) * | 2006-02-22 | 2007-09-06 | Just Syst Corp | Data processor and data processing method |
JP2010079826A (en) * | 2008-09-29 | 2010-04-08 | Nec Biglobe Ltd | Information processor, and contrast information output method and program |
WO2010120679A3 (en) * | 2009-04-12 | 2011-03-03 | The Brookeside Group, Inc. | Emotivity and vocality measurement |
US8438037B2 (en) | 2009-04-12 | 2013-05-07 | Thomas M. Cates | Emotivity and vocality measurement |
JP2013105226A (en) * | 2011-11-11 | 2013-05-30 | Fujitsu Ltd | Received mail sorting device, received mail sorting program, and received mail sorting method |
WO2017203681A1 (en) * | 2016-05-27 | 2017-11-30 | 楽天株式会社 | Information processing device, information processing method, program, and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP3917629B2 (en) | 2007-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3917629B2 (en) | Natural sentence processing apparatus and natural sentence processing program | |
JP4870448B2 (en) | Information processing apparatus, customer needs analysis method, and program | |
CN100461183C (en) | Metadata automatic extraction method based on multiple rule in network search | |
CN103136329B (en) | Multiple queries revision models integrated | |
US20130198195A1 (en) | System and method for identifying one or more resumes based on a search query using weighted formal concept analysis | |
WO2019203156A1 (en) | Chatbot search system, chatbot search method, and program | |
US20040029085A1 (en) | Summarisation representation apparatus | |
JP4547500B2 (en) | Search device and program | |
US20060078862A1 (en) | Answer support system, answer support apparatus, and answer support program | |
CN103810251B (en) | Method and device for extracting text | |
CN102054024A (en) | Information processing apparatus, information extracting method, program, and information processing system | |
Demir et al. | Interactive sight into information graphics | |
JP2002140465A (en) | Natural sentence processor and natural sentence processing program | |
JP5213098B2 (en) | Question answering method and system | |
US20220327445A1 (en) | Workshop assistance system and workshop assistance method | |
JP3583631B2 (en) | Information mining method, information mining device, and computer-readable recording medium recording information mining program | |
CN111460119A (en) | Intelligent question and answer method and system for economic knowledge and intelligent equipment | |
JP5265597B2 (en) | Document quality evaluation system and document quality evaluation program | |
JP2010198142A (en) | Device, method and program for preparing database in which phrase included in document classified by category | |
JP2012093870A (en) | Request acquisition support system for system development, request acquisition support method, and program | |
JP5332128B2 (en) | Information retrieval apparatus, information retrieval method and program thereof | |
JP6375367B2 (en) | Objection generation method, objection generation system | |
Kamiński | Corpus-based extraction of collocations for near-synonym discrimination | |
Thanadechteemapat et al. | Thai word segmentation for visualization of thai web sites | |
JP4669642B2 (en) | Document classification apparatus, document classification method, and computer-readable recording medium storing a program for causing a computer to execute the document classification method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060425 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060626 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060718 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060914 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061003 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061030 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3917629 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110216 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110216 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120216 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130216 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140216 Year of fee payment: 7 |
|
EXPY | Cancellation because of completion of term |