JP2007241765A - Method for acquiring attribute expression, and method, device and program for acquiring evaluation expression - Google Patents

Method for acquiring attribute expression, and method, device and program for acquiring evaluation expression Download PDF

Info

Publication number
JP2007241765A
JP2007241765A JP2006064804A JP2006064804A JP2007241765A JP 2007241765 A JP2007241765 A JP 2007241765A JP 2006064804 A JP2006064804 A JP 2006064804A JP 2006064804 A JP2006064804 A JP 2006064804A JP 2007241765 A JP2007241765 A JP 2007241765A
Authority
JP
Japan
Prior art keywords
expression
attribute
evaluation
document
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006064804A
Other languages
Japanese (ja)
Inventor
Setsuo Yamada
節夫 山田
Nobuaki Hiroshima
伸章 廣嶋
Kura Furuse
蔵 古瀬
Ryoji Kataoka
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006064804A priority Critical patent/JP2007241765A/en
Publication of JP2007241765A publication Critical patent/JP2007241765A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To acquire even an attribute expression set even when co-occurrence frequency of an attribute expression with an input evaluation expression is low, and to acquire even an evaluation expression set even when co-occurrence frequency of an evaluation expression with an input attribution expression is low. <P>SOLUTION: When the evaluation expression is input, attribution expression candidates are extracted based on information about the appearing position of a word from a document storage means, and the attribution expression candidates are narrowed down utilizing the appearing frequency of the attribution expression candidates. Then, for each narrowed-down attribution expression candidate, co-occurrence words are extracted from the document storage means based on the information about the appearing position of the word. The attribution expression candidates having the same co-occurrence word equal to or more than a predetermined number are collected and extracted as the attribute expression set. The evaluation expression set is extracted similarly. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、属性表現獲得方法及び評価表現獲得方法及び装置及びプログラムに係り、特に、属性表現を基にその属性表現の評価を表す評価表現を、または、評価表現を基にその評価表現が何についての評価であるかを表す属性表現を、文書から獲得するための属性表現獲得方法及び評価表現獲得方法及び装置及びプログラムに関する。   The present invention relates to an attribute expression acquisition method, an evaluation expression acquisition method, an apparatus, and a program, and in particular, an evaluation expression that represents an evaluation of the attribute expression based on the attribute expression, or what the evaluation expression is based on the evaluation expression. The present invention relates to an attribute expression acquisition method, an evaluation expression acquisition method, an apparatus, and a program for acquiring an attribute expression indicating whether the evaluation is for a document from a document.

属性表現を基にその属性表現の評価を表す評価表現を、または、評価表現を基にその評価表現が何についての評価であるかを表す属性表現を、文書から獲得する場合、同一文内で属性表現と評価表現が同時に出現する頻度などの統計情報を利用した方法が知られている。例えば、携帯電話などの対象事物に関する評価表現(「小さい」「美しい」など)から、その対象物の性質を示す属性表現(「画面」「デザイン」など)を獲得する方法が知られている(例えば、非特許文献1参照)。
「意見抽出のための評価表現の収集」、言語処理学会論文集、Vol.12、No.3, pp.203-222, 2005年
When acquiring from a document an evaluation expression that represents an evaluation of the attribute expression based on the attribute expression or an attribute expression that indicates what the evaluation expression is based on the evaluation expression, within the same sentence A method using statistical information such as the frequency at which attribute expressions and evaluation expressions appear simultaneously is known. For example, there is a known method for obtaining an attribute expression (such as “screen” or “design”) indicating the property of an object from an evaluation expression (such as “small” or “beautiful”) regarding the object such as a mobile phone ( For example, refer nonpatent literature 1).
"Collection of evaluation expressions for opinion extraction", Proc. Of Language Processing Society, Vol.12, No.3, pp.203-222, 2005

しかしながら、上記従来の評価表現を獲得する方法は、統計情報を利用しているので、頻度が少ない単語については自動で獲得することが困難である。例えば、評価表現から属性表現を獲得する場合、属性表現は非常に多種類の表現が存在するため、評価表現と属性表現の特定の組み合わせが同一文中に同時に出現する頻度が少ない属性表現も多く、このような頻度が少ない多くの属性表現を自動で獲得できない問題があった。   However, since the conventional method for obtaining an evaluation expression uses statistical information, it is difficult to automatically obtain a word with a low frequency. For example, when acquiring an attribute expression from an evaluation expression, since there are very many types of expression, there are many attribute expressions in which a specific combination of an evaluation expression and an attribute expression appears less frequently in the same sentence, There is a problem that many attribute expressions with such a low frequency cannot be automatically acquired.

本発明は、上記の点に鑑みなされたもので、頻度が少ない属性表現であっても、属性表現候補が、入力評価表現以外で同じ共起語を持つかどうかについて調べることによって、属性表現と認定でき、また、頻度が少ない評価表現であっても、評価表現候補が、入力属性表現以外で同じ共起語を持つかどうかについて調べることによって、評価表現と認定できることが可能な属性表現獲得方法及び評価表現獲得方法及び装置及びプログラムを提供することを目的とする。   The present invention has been made in view of the above points, and by examining whether an attribute expression candidate has the same co-occurrence word other than the input evaluation expression, even if the attribute expression is less frequent, Attribute expression acquisition method that can be recognized as an evaluation expression by examining whether the evaluation expression candidates have the same co-occurrence word other than the input attribute expression, even if the evaluation expression can be recognized and less frequently Another object of the present invention is to provide an evaluation expression acquisition method, apparatus, and program.

図1は、本発明の原理を説明するための図(その1)である。   FIG. 1 is a diagram (part 1) for explaining the principle of the present invention.

本発明(請求項1)は、評価表現入力手段、属性表現候補抽出手段、属性表現候補格納手段、属性表現候補絞り込み手段、共起語抽出手段、共起語格納手段、属性表現抽出手段及び複数の記憶手段を有する属性表現獲得装置における、対象事物に対して評価を表す表現である評価表現を基に、該対象事物の性質を表す属性表現を文書から獲得するための属性表現獲得方法であって、
評価表現入力手段が、1つの評価表現を入力する評価表現入力ステップ(ステップ1)と、
属性表現候補抽出手段が、評価表現入力ステップによって取得された1つの評価表現と同一文内で同時に出現する表現(属性表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段から、単語の出現位置に関する情報を基に抽出する属性表現候補抽出ステップ(ステップ2)と、
属性表現候補格納手段が、属性表現候補を文毎に属性表現候補記憶手段に格納する属性表現候補格納ステップ(ステップ3)と、
属性表現候補絞り込み手段が、属性表現候補記憶手段から属性表現候補の出現頻度を利用して、該属性表現候補を絞り込む属性表現候補絞り込みステップ(ステップ4)と、
共起語抽出手段が、属性表現候補絞り込みステップによって絞り込まれた属性表現候補毎に、該属性表現候補と同一文内で同時に出現する該評価表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、単語区切り付き文書格納した文書記憶手段から抽出する共起語抽出ステップ(ステップ5)と、
共起語格納手段が、属性表現候補毎に共起語の集合を共起語記憶手段に格納する共起語格納ステップ(ステップ6)と、
属性表現抽出手段が、共起語記憶手段に格納されている共起語の集合のうち、予め決められた数以上に同じ共起語を持つ属性表現候補をまとめて属性表現集合として抽出する属性表現抽出ステップ(ステップ7)と、を行う。
The present invention (Claim 1) includes evaluation expression input means, attribute expression candidate extraction means, attribute expression candidate storage means, attribute expression candidate narrowing means, co-occurrence word extraction means, co-occurrence word storage means, attribute expression extraction means, and a plurality of attribute expression extraction means An attribute expression acquisition method for acquiring, from a document, an attribute expression representing the property of a target object based on an evaluation expression that is an expression representing an evaluation of the target object in an attribute expression acquisition device having a storage means. And
An evaluation expression input step (step 1) in which the evaluation expression input means inputs one evaluation expression;
An attribute expression candidate extraction unit is a document storage unit that stores a word-delimited document prepared in advance as an expression (attribute expression candidate) that simultaneously appears in the same sentence as one evaluation expression acquired by the evaluation expression input step. An attribute expression candidate extraction step (step 2) for extracting based on information on the appearance position of the word;
An attribute expression candidate storage means for storing an attribute expression candidate in the attribute expression candidate storage means for each sentence in an attribute expression candidate storage step (step 3);
An attribute expression candidate narrowing-down means for narrowing down the attribute expression candidates by using the appearance frequency of the attribute expression candidates from the attribute expression candidate storage means (step 4);
For each attribute expression candidate narrowed down by the attribute expression candidate narrowing-down step, the co-occurrence word extracting means selects a word (co-occurrence word) other than the evaluation expression that simultaneously appears in the same sentence as the attribute expression candidate. A co-occurrence word extraction step (step 5) for extracting from the document storage means that stores the document with the word separator based on the information about the position;
A co-occurrence word storage means for storing a set of co-occurrence words for each attribute expression candidate in the co-occurrence word storage means (step 6);
Attribute expression extraction means extracts attribute expression candidates having the same co-occurrence word more than a predetermined number from the set of co-occurrence words stored in the co-occurrence word storage means and extracts them as an attribute expression set An expression extraction step (step 7) is performed.

また、本発明(請求項2)は、属性表現候補抽出ステップ(ステップ2)において、
属性表現候補抽出手段が、予め用意した文書の単語自身に関する言語情報を格納した言語情報付き文書を格納した文書記憶手段から、該言語情報を利用して属性表現候補を抽出するステップを行い、
共起語抽出ステップ(ステップ5)において、
共起語抽出手段が、言語情報付き文書格納した文書記憶手段から、言語情報を利用して共起語を抽出するステップを行う。
Further, the present invention (Claim 2), in the attribute expression candidate extraction step (Step 2),
The attribute expression candidate extraction means performs a step of extracting attribute expression candidates using the language information from the document storage means storing the document with language information storing the language information about the word itself of the document prepared in advance,
In the co-occurrence word extraction step (step 5),
The co-occurrence word extraction unit performs a step of extracting the co-occurrence word from the document storage unit storing the document with language information using the language information.

また、本発明(請求項3)は、属性表現候補抽出ステップ(ステップ2)において、
属性表現候補抽出手段が、予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段から、該構文情報を利用して属性表現候補を抽出するステップを行い、
共起語抽出ステップ(ステップ5)において、
共起語抽出手段が、構文情報付き文書を格納した文書記憶手段から構文情報を利用して共起語を抽出するステップを行う。
Further, the present invention (Claim 3), in the attribute expression candidate extraction step (Step 2),
The attribute expression candidate extraction means performs a step of extracting attribute expression candidates from the document storage means storing a document with syntax information related to words of a document prepared in advance using the syntax information;
In the co-occurrence word extraction step (step 5),
The co-occurrence word extraction unit performs a step of extracting the co-occurrence word using the syntax information from the document storage unit storing the document with syntax information.

図2は、本発明の原理構成図(その1)である。   FIG. 2 is a diagram illustrating the principle of the present invention (part 1).

本発明(請求項4)は、対象事物に対して評価を表す表現である評価表現を基に、該対象事物の性質を表す属性表現を文書から獲得するための属性表現獲得装置であって、
1つの評価表現を入力する評価表現入力手段110と、
評価表現入力手段110によって取得された1つの評価表現と同一文内で同時に出現する表現(属性表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段10から、単語の出現位置に関する情報を基に抽出する属性表現候補抽出手段120と、
属性表現候補を文毎に属性表現候補記憶手段20に格納する属性表現候補格納手段130と、
属性表現候補記憶手段20から属性表現候補の出現頻度を利用して、該属性表現候補を絞り込む属性表現候補絞り込み手段140と、
属性表現候補絞り込み手段140によって絞り込まれた属性表現候補毎に、該属性表現候補と同一文内で同時に出現する該評価表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、単語区切り付き文書を格納した文書記憶手段10から抽出する共起語抽出手段150と、
属性表現候補毎に共起語の集合を共起語記憶手段30に格納する共起語格納手段160と、
共起語記憶手段30に格納されている共起語の集合のうち、予め決められた数以上に同じ共起語を持つ属性表現候補をまとめて属性表現集合として抽出する属性表現抽出手段170と、を有する。
The present invention (Claim 4) is an attribute expression acquisition device for acquiring, from a document, an attribute expression that represents the property of a target object, based on an evaluation expression that is an expression that represents the evaluation of the target object.
Evaluation expression input means 110 for inputting one evaluation expression;
Expressions (attribute expression candidates) that simultaneously appear in the same sentence as one evaluation expression acquired by the evaluation expression input unit 110 are related to the appearance position of the word from the document storage unit 10 that stores a word-delimited document prepared in advance. Attribute expression candidate extraction means 120 for extracting based on information;
Attribute expression candidate storage means 130 for storing attribute expression candidates in the attribute expression candidate storage means 20 for each sentence;
Attribute expression candidate narrowing means 140 for narrowing down the attribute expression candidates using the appearance frequency of the attribute expression candidates from the attribute expression candidate storage means 20;
For each attribute expression candidate narrowed down by the attribute expression candidate narrowing means 140, a word (co-occurrence word) other than the evaluation expression that simultaneously appears in the same sentence as the attribute expression candidate is determined based on information on the appearance position of the word. A co-occurrence word extracting means 150 for extracting the document with word delimiter from the document storage means 10;
Co-occurrence word storage means 160 for storing a set of co-occurrence words for each attribute expression candidate in the co-occurrence word storage means 30;
An attribute expression extraction unit 170 that collectively extracts attribute expression candidates having the same co-occurrence word from a set of co-occurrence words stored in the co-occurrence word storage unit 30 as an attribute expression set. Have.

また、本発明(請求項5)は、属性表現候補抽出手段120において、
予め用意した文書の単語自身に関する言語情報付き文書を格納した文書記憶手段10から、該言語情報を利用して属性表現候補を抽出する手段を含み、
共起語抽出手段150は、
言語情報付き文書を格納した文書記憶手段10から、言語情報を利用して共起語を抽出する手段を含む。
Further, according to the present invention (Claim 5), in the attribute expression candidate extraction unit 120,
Including means for extracting attribute expression candidates from the document storage means 10 storing a document with language information relating to the word itself of the document prepared in advance using the language information;
The co-occurrence word extraction means 150
Means for extracting a co-occurrence word using the language information from the document storage means 10 storing the document with language information;

また、本発明(請求項6)は、属性表現候補抽出手段120において、
予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段10から、該構文情報を利用して属性表現候補を抽出する手段を含み、
共起語抽出手段150は、
構文情報付き文書を格納した文書記憶手段10から構文情報を利用して共起語を抽出する手段を含む。
Further, according to the present invention (claim 6), the attribute expression candidate extraction unit 120
Means for extracting attribute expression candidates from the document storage means 10 storing a document with syntax information related to words of a document prepared in advance, using the syntax information;
The co-occurrence word extraction means 150
Means for extracting a co-occurrence word from the document storage means 10 storing the document with syntax information using the syntax information;

本発明(請求項7)は、コンピュータを、請求項4乃至6記載の属性表現獲得装置として機能させる属性表現獲得プログラムである。   The present invention (Claim 7) is an attribute expression acquisition program for causing a computer to function as the attribute expression acquisition apparatus according to claims 4 to 6.

図3は、本発明の原理を説明するための図(その2)である。   FIG. 3 is a diagram (part 2) for explaining the principle of the present invention.

本発明(請求項8)は、属性表現入力手段、評価表現候補抽出手段、評価表現候補格納手段、評価表現候補絞り込み手段、共起語抽出手段、共起語格納手段、評価表現抽出手段及び複数の記憶手段とを有する評価表現獲得装置における、対象事物の性質を表す属性表現を基に、該対象事物に対して評価を表す表現である評価表現を文書から獲得する評価表現獲得方法であって、
属性表現入力手段が、1つの属性表現を入力する属性表現入力ステップ(ステップ11)と、
評価表現候補抽出手段が、属性表現入力ステップによって取得された1つの属性表現と同一文内で同時に出現する表現(評価表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段から単語の出現位置に関する情報を基に抽出する評価表現候補抽出ステップ(ステップ12)と、
評価表現候補格納手段が、評価表現候補を文毎に評価表現候補記憶手段に格納する評価表現候補格納ステップ(ステップ13)と、
評価表現候補絞り込み手段が、評価表現候補記憶手段から、評価表現候補の出現頻度を利用して、評価表現候補を絞り込む評価表現候補絞り込みステップ(ステップ14)と、
共起語抽出手段が、評価表現候補絞り込みステップ(ステップ14)によって絞り込まれた評価表現候補毎に、該評価表現候補と同一文内で同時に出現する属性表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、単語区切り付き文書を格納した文書記憶手段から抽出する共起語抽出ステップ(ステップ15)と、
共起語格納手段が、評価表現候補毎に共起語の集合を共起語記憶手段に格納する共起語格納ステップ(ステップ16)と、
評価表現抽出手段が、共起語記憶手段に格納されている共起語の集合のうち、予め決められた数以上に同じ共起語を持つ評価表現候補をまとめて評価表現集合として抽出する評価表現抽出ステップ(ステップ17)と、を行う。
The present invention (Claim 8) includes attribute expression input means, evaluation expression candidate extraction means, evaluation expression candidate storage means, evaluation expression candidate narrowing means, co-occurrence word extraction means, co-occurrence word storage means, evaluation expression extraction means and a plurality of An evaluation expression acquisition method for acquiring, from a document, an evaluation expression, which is an expression representing an evaluation of an object thing, based on an attribute expression representing a property of the object object in an evaluation expression acquisition apparatus having a storage means ,
An attribute expression input step (step 11) in which the attribute expression input means inputs one attribute expression;
An evaluation expression candidate extraction unit uses a word from a document storage unit storing a word-delimited document prepared in advance as an expression (evaluation expression candidate) that simultaneously appears in the same sentence as one attribute expression acquired in the attribute expression input step. An evaluation expression candidate extraction step (step 12) for extracting based on information on the appearance position of
An evaluation expression candidate storage unit (step 13) in which the evaluation expression candidate storage unit stores the evaluation expression candidate in the evaluation expression candidate storage unit for each sentence;
An evaluation expression candidate narrowing-down step (step 14) for narrowing down the evaluation expression candidates from the evaluation expression candidate storage means using the appearance frequency of the evaluation expression candidates from the evaluation expression candidate storage means;
For each evaluation expression candidate narrowed down by the evaluation expression candidate narrowing step (step 14), the co-occurrence word extracting means selects a word (co-occurrence word) other than the attribute expression that simultaneously appears in the same sentence as the evaluation expression candidate. A co-occurrence word extraction step (step 15) for extracting from the document storage means storing the document with word delimiters based on the information on the appearance position of the word;
A co-occurrence word storage means for storing a set of co-occurrence words in the co-occurrence word storage means for each evaluation expression candidate (step 16);
Evaluation in which the evaluation expression extraction unit collectively extracts evaluation expression candidates having the same co-occurrence word in a predetermined number or more from the set of co-occurrence words stored in the co-occurrence word storage unit as an evaluation expression set An expression extraction step (step 17) is performed.

また、本発明(請求項9)は、評価表現候補抽出ステップ(ステップ12)において、
評価表現候補抽出手段が、予め用意した文書の単語自身に関する言語情報を格納した言語情報付き文書を格納した文書記憶手段から、言語情報を利用して評価表現候補を抽出するステップを行い、
共起語抽出ステップ(ステップ15)において、
共起語抽出手段が、言語情報付き文書を格納した文書記憶手段から言語情報を利用して共起語を抽出するステップを行う。
Further, the present invention (Claim 9), in the evaluation expression candidate extraction step (Step 12),
The evaluation expression candidate extraction means performs a step of extracting evaluation expression candidates using the language information from the document storage means storing the document with language information storing the language information about the word itself of the prepared document,
In the co-occurrence word extraction step (step 15),
The co-occurrence word extraction unit performs a step of extracting the co-occurrence word using the language information from the document storage unit storing the document with language information.

また、本発明(請求項10)は、評価表現候補抽出ステップ(ステップ12)において、
評価表現候補抽出手段が、予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段から、該構文情報を利用して評価表現候補を抽出するステップを行い、
共起語抽出ステップ(ステップ15)において、
共起語抽出手段が、構文情報付き文書を格納した文書記憶手段から、構文情報を利用して共起語を抽出するステップを行う。
Further, the present invention (Claim 10), in the evaluation expression candidate extraction step (Step 12),
The evaluation expression candidate extraction means performs a step of extracting evaluation expression candidates using the syntax information from a document storage means storing a document with syntax information related to words of a document prepared in advance,
In the co-occurrence word extraction step (step 15),
The co-occurrence word extraction unit performs a step of extracting the co-occurrence word from the document storage unit storing the document with syntax information using the syntax information.

図4は、本発明の原理構成図(その2)である。   FIG. 4 is a principle configuration diagram (part 2) of the present invention.

本発明(請求項11)は、対象事物の性質を表す属性表現を基に、該対象事物に対して評価を表す表現である評価表現を文書から獲得する評価表現獲得装置であって、
1つの属性表現を入力する属性表現入力手段210と、
属性表現入力手段210によって取得された1つの属性表現と同一文内で同時に出現する表現(評価表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段40から、単語の出現位置に関する情報を基に抽出する評価表現候補抽出手段220と、
評価表現候補を文毎に評価表現候補記憶手段50に格納する評価表現候補格納手段230と、
評価表現候補記憶手段50から、評価表現候補の出現頻度を利用して、評価表現候補を絞り込む評価表現候補絞り込み手段240と、
評価表現候補絞り込み手段240によって絞り込まれた評価表現候補毎に、該評価表現候補と同一文内で同時に出現する属性表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、単語区切り付き文書を格納した文書記憶手段40から抽出する共起語抽出手段250と、
評価表現候補毎に共起語の集合を共起語記憶手段60に格納する共起語格納手段260と、
共起語記憶手段60に格納されている共起語の集合のうち、予め決められた数以上に同じ共起語を持つ評価表現候補をまとめて評価表現集合として抽出する評価表現抽出手段270と、を有する。
The present invention (Claim 11) is an evaluation expression acquisition device for acquiring an evaluation expression, which is an expression representing an evaluation of a target thing, from a document based on an attribute expression indicating the property of the target thing.
Attribute expression input means 210 for inputting one attribute expression;
Expressions (evaluation expression candidates) that simultaneously appear in the same sentence as one attribute expression acquired by the attribute expression input unit 210 are related to the appearance position of the word from the document storage unit 40 that stores a word-delimited document prepared in advance. Evaluation expression candidate extraction means 220 for extracting based on the information;
Evaluation expression candidate storage means 230 for storing evaluation expression candidates in the evaluation expression candidate storage means 50 for each sentence;
An evaluation expression candidate narrowing means 240 that narrows down evaluation expression candidates from the evaluation expression candidate storage means 50 by using the appearance frequency of evaluation expression candidates;
For each evaluation expression candidate narrowed down by the evaluation expression candidate narrowing means 240, a word (co-occurrence word) other than the attribute expression that simultaneously appears in the same sentence as the evaluation expression candidate is determined based on information on the appearance position of the word. A co-occurrence word extracting means 250 for extracting the document with word delimiters from the document storage means 40;
Co-occurrence word storage means 260 for storing a set of co-occurrence words for each evaluation expression candidate in the co-occurrence word storage means 60;
An evaluation expression extraction unit 270 that collectively extracts evaluation expression candidates having the same co-occurrence word from a set of co-occurrence words stored in the co-occurrence word storage unit 60 as an evaluation expression set. Have.

また、本発明(請求項12)は、評価表現候補抽出手段220において、
予め用意した文書の単語自身に関する言語情報付き文書を格納した文書記憶手段40から言語情報を利用して評価表現候補を抽出する手段を含み、
共起語抽出手段250は、
言語情報付き文書を格納した文書記憶手段40から言語情報を利用して共起語を抽出する手段を含む。
Further, according to the present invention (Claim 12), in the evaluation expression candidate extraction unit 220,
Including means for extracting evaluation expression candidates using the language information from the document storage means 40 storing a document with language information relating to the word itself of the document prepared in advance,
The co-occurrence word extraction means 250
Means for extracting co-occurrence words using the language information from the document storage means 40 storing the document with language information;

また、本発明(請求項13)は、評価表現候補抽出手段220において、
予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段40から、該構文情報を利用して評価表現候補を抽出する手段を含み、
共起語抽出手段250は、
構文情報付き文書を格納した文書記憶手段40から、構文情報を利用して共起語を抽出する手段を含む。
The present invention (Claim 13) is characterized in that in the evaluation expression candidate extraction means 220,
Means for extracting evaluation expression candidates from the document storage means 40 storing a document with syntax information related to words of a document prepared in advance, using the syntax information;
The co-occurrence word extraction means 250
Means for extracting a co-occurrence word using the syntax information from the document storage means 40 storing the document with syntax information;

本発明(請求項14)は、コンピュータを、請求項11乃至13記載の評価表現獲得装置として機能させる評価表現獲得プログラムである。   The present invention (Claim 14) is an evaluation expression acquisition program that causes a computer to function as the evaluation expression acquisition device according to Claims 11 to 13.

上記のように本発明によれば、属性表現候補に対して、入力評価表現以外で同じ共起語を持つかどうかについて調べることによって、入力評価表現との共起頻度が少ない属性表現であっても獲得することが可能であり、また、評価表現候補に対して、入力属性表現以外で同じ共起語を持つかどうかについて調べることによって、入力属性表現との共起頻度が少ない評価表現であっても獲得することが可能であるという効果を奏する。   As described above, according to the present invention, an attribute expression having a low co-occurrence frequency with the input evaluation expression is obtained by examining whether or not the attribute expression candidate has the same co-occurrence word other than the input evaluation expression. It is also possible to obtain an evaluation expression that has a low co-occurrence frequency with the input attribute expression by examining whether the evaluation expression candidate has the same co-occurrence word other than the input attribute expression. However, there is an effect that it can be acquired.

以下、図面と共に本発明の実施の形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

[第1の実施の形態]
本発明の第1の実施の形態として、属性表現獲得装置について説明する。
[First Embodiment]
An attribute expression acquisition device will be described as a first embodiment of the present invention.

図5は、本発明の第1の実施の形態における属性表現獲得装置の基本ブロック構成図である。   FIG. 5 is a basic block configuration diagram of the attribute expression acquisition device according to the first exemplary embodiment of the present invention.

属性表現獲得装置100は、評価表現入力部110、属性表現候補抽出部120、属性表現候補格納部130、属性表現候補絞込み部140、共起語抽出部150、共起語格納部160、属性表現抽出部170、言語情報・構文情報・単語区切り付き文書記憶部10、属性表現候補記憶部20、及び共起語記憶部30から構成される。   The attribute expression acquisition apparatus 100 includes an evaluation expression input unit 110, an attribute expression candidate extraction unit 120, an attribute expression candidate storage unit 130, an attribute expression candidate narrowing unit 140, a co-occurrence word extraction unit 150, a co-occurrence word storage unit 160, an attribute expression The extraction unit 170, the language information / syntax information / document separator-attached document storage unit 10, the attribute expression candidate storage unit 20, and the co-occurrence word storage unit 30 are configured.

言語情報・構文情報・単語区切り付き文書記憶部10、属性表現候補記憶部20、及び共起語記憶部30は、ディスク装置や、メモリなどの記憶媒体である。   The language information / syntax information / word-delimited document storage unit 10, the attribute expression candidate storage unit 20, and the co-occurrence word storage unit 30 are storage devices such as a disk device and a memory.

なお、以下で用いる「属性表現」とは、例えば、入力される表現が、携帯電話などの対象事物に関する評価表現(「広い」「美しい」など)であれば、同一文内で入力評価表現と対の関係として出現する、その対象事物の性質を表す属性表現(「エリア」「画面」など)のことを指す。   The “attribute expression” used below is, for example, an input evaluation expression within the same sentence if the input expression is an evaluation expression (such as “broad” or “beautiful”) related to an object such as a mobile phone. This refers to attribute expressions (such as “area” and “screen”) that represent the properties of the target object that appear as a pair relationship.

評価表現入力部110は、1つの評価表現を入力する。   The evaluation expression input unit 110 inputs one evaluation expression.

属性表現候補抽出部120は、評価表現入力部110によって取得された1つの評価表現と同一文内で同時に出現する表現(属性表現候補)を、予め用意した言語情報・構文情報・単語区切り付き文書記憶部10から、品詞などの単語に関する情報、係り受けなどの構文に関する情報を基に抽出する。   The attribute expression candidate extraction unit 120 prepares language information / syntax information / word-delimited document prepared in advance for expressions (attribute expression candidates) that simultaneously appear in the same sentence as one evaluation expression acquired by the evaluation expression input unit 110. Extracted from the storage unit 10 based on information on words such as parts of speech and information on syntax such as dependency.

属性表現候補格納部130は、属性表現候補を文毎に属性表現候補記憶部20に格納する。   The attribute expression candidate storage unit 130 stores the attribute expression candidates in the attribute expression candidate storage unit 20 for each sentence.

属性表現候補絞込み部140は、属性表現候補記憶部20から、属性表現候補の出現頻度を利用して、属性表現候補を絞り込む。   The attribute expression candidate narrowing-down unit 140 narrows down the attribute expression candidates from the attribute expression candidate storage unit 20 by using the appearance frequency of the attribute expression candidates.

共起語抽出部150は、属性表現候補絞込み部140によって絞り込まれた属性表現候補毎に、属性表現候補と同一文内で同時に出現する入力評価表現以外の単語(共起語)を、予め用意した言語情報・構文情報・単語区切り付き文書記憶部10から、品詞などの単語に関する情報、係り受けなどの構文に関する情報を基に抽出する。   The co-occurrence word extraction unit 150 prepares in advance words (co-occurrence words) other than the input evaluation expression that simultaneously appear in the same sentence as the attribute expression candidates for each attribute expression candidate narrowed down by the attribute expression candidate narrowing unit 140. The extracted language information / syntax information / word-delimited document storage unit 10 is extracted based on information on words such as parts of speech and information on syntax such as dependency.

共起語格納部160は、属性表現候補毎に共起語の集合を共起語記憶部30に格納する。   The co-occurrence word storage unit 160 stores a set of co-occurrence words in the co-occurrence word storage unit 30 for each attribute expression candidate.

属性表現抽出部170は、共起語記憶部30に格納されている共起語の集合のうち、予め決められた数以上同じ共起語を持つ属性表現候補をまとめて属性表現集合として抽出する。   The attribute expression extraction unit 170 collectively extracts attribute expression candidates having the same number of co-occurrence words from a set of co-occurrence words stored in the co-occurrence word storage unit 30 as an attribute expression set. .

次に、属性表現獲得装置の動作について説明する。   Next, the operation of the attribute expression acquisition device will be described.

図6は、本発明の第1の実施の形態における属性表現獲得処理のフローチャートである。   FIG. 6 is a flowchart of attribute expression acquisition processing according to the first embodiment of this invention.

同図のフローチャートに基づいて、評価表現「多い」を入力した場合に属性表現を獲得する例について説明する。   An example of acquiring an attribute expression when an evaluation expression “many” is input will be described based on the flowchart of FIG.

図7は、本実施の形態における文ID毎の文の例であり、図8〜図10は、言語情報、構文情報、単語区切り付き文書記憶部10の内容の例を示す。   FIG. 7 is an example of a sentence for each sentence ID in the present embodiment, and FIGS. 8 to 10 show examples of contents of language information, syntax information, and word-delimited document storage unit 10.

ステップ101) 評価表現入力部110によって、1つの評価表現を入力する。   Step 101) One evaluation expression is input by the evaluation expression input unit 110.

この例の場合、「多い」が入力される。ここでは、1つの評価表現を入力しているが、予め入力する評価表現の集合をメモリやディスク等の記憶媒体に格納しておき、そこから評価表現を1つずつ入力する方法でもよい。   In this example, “many” is input. Although one evaluation expression is input here, a method may be used in which a set of evaluation expressions input in advance is stored in a storage medium such as a memory or a disk, and evaluation expressions are input one by one from there.

ステップ102) 属性表現候補抽出部120が、評価表現入力部10によって取得された1つの評価表現と同一文内で同時に出現する表現(属性表現候補)を、予め用意した言語情報、構文情報、単語区切り付き文書記憶部10から、品詞が名詞で、入力された評価表現と主語述語関係(主述関係)にある単語を抽出する。   Step 102) The linguistic information, syntax information, and words prepared in advance by the attribute expression candidate extraction unit 120 include expressions (attribute expression candidates) that simultaneously appear in the same sentence as one evaluation expression acquired by the evaluation expression input unit 10. A word having a part of speech as a noun and having a subject predicate relationship (subject relationship) is extracted from the delimited document storage unit 10.

例えば、図7に示す文に関して、一般に知られている形態素解析器を用いて単語を区切り、言語情報として品詞を取り出し、また、一般に知られている構文解析器を用いて、構文情報として主述関係を取り出した結果を、言語情報、構文情報、単語区切り付き文書記憶部10に格納した例として図8に示す。図8の主述関係の欄「(主)」は、その単語と主語の関係にある語を示し、「(述)」は、その単語と述語の関係にある語を示す。   For example, for the sentence shown in FIG. 7, words are separated using a generally known morphological analyzer, parts of speech are extracted as linguistic information, and main sentences are described as syntactic information using a generally known parser. FIG. 8 shows an example in which the relationship retrieval result is stored in the document storage unit 10 with language information, syntax information, and word delimiters. The column “(main)” of the main predicate relationship in FIG. 8 indicates a word that has a relationship between the word and the subject, and “(predicate)” indicates a word that has a relationship between the word and the predicate.

例えば、文ID1「きれいな画面が多い」の「画面」の述語は「多い」なので、「画面」の主述関係の欄は「(述)多い」となる。一方、同じ文の「多い」の主語は「画面」なので、「多い」の主述関係の欄は「(主)画面」と記述されている。ここでは、言語情報として品詞、構文情報として主述関係を用いて説明しているが、本発明は、形態素解析器、構文解析器によって得られ、本発明で効果のある言語情報(例えば、時制、活用など)、及び、構文情報(例えば、主辞や主文を取り出すなど)であればこれに限定しない。この例では、名詞であって、入力された評価表現「多い」と主述関係にある語を属性表現候補として抽出するので、例えば、文ID1「きれいな画面が多い」の場合、「画面」は、名詞であって入力された評価表現「多い」と主述関係にある語なので、属性表現候補として出力する。この例では、各文に対して1つの属性表現候補しかないが、抽出条件に合えば、1文から複数の属性表現候補を抽出することもできる。   For example, since the predicate of “screen” of the sentence ID 1 “many beautiful screens” is “many”, the main description relation column of “screen” is “(description) many”. On the other hand, since the subject of “many” in the same sentence is “screen”, the column of “main” predicate relationship is described as “(main) screen”. Here, the explanation is made by using the part of speech as the language information and the predicate relationship as the syntax information. However, the present invention is obtained by a morphological analyzer and a syntax analyzer and is effective in the present invention (for example, tense). , Utilization, etc.) and syntax information (for example, taking out a main word and a main sentence) is not limited to this. In this example, a word that is a noun and has a main description relationship with the input evaluation expression “many” is extracted as an attribute expression candidate. For example, in the case of sentence ID 1 “many beautiful screens”, “screen” Since the word is a noun and has a main predicate relationship with the input evaluation expression “many”, it is output as an attribute expression candidate. In this example, there is only one attribute expression candidate for each sentence, but a plurality of attribute expression candidates can be extracted from one sentence if the extraction condition is met.

ステップ103) 属性表現候補格納部130が、ステップ102で抽出された属性表現候補を文毎に属性表現候補記憶部20に格納する。   Step 103) The attribute expression candidate storage unit 130 stores the attribute expression candidates extracted in step 102 in the attribute expression candidate storage unit 20 for each sentence.

入力された評価表現が「多い」の場合に抽出された属性表現候補の結果を図11に示す。同図の「−」は、その文からは属性表現候補が抽出されなかったことを表している。   FIG. 11 shows the result of attribute expression candidates extracted when the input evaluation expression is “many”. "-" In the figure indicates that no attribute expression candidate was extracted from the sentence.

ステップ104) 属性表現候補絞り込み部140が、属性表現候補記憶部20から、1回しか出現しない属性表現候補に絞り込む。ここでは、1回としているが、これに限らず、例えば、属性表現候補全体の出現分布を参考にするなど、属性表現候補の頻度に係わる情報なら何でもよい。また、頻度が多いものは、この時点でそのまま属性表現と認定して取り出してもよい。例えば、頻度2回以上のものは、属性表現として信頼性が高いと判断する場合、図11からは、「回数」がそのまま属性表現として認定される。この場合、後述するステップ107での属性表現の抽出条件に係わらず、属性表現集合に加える。当該ステップ104において、この例の場合、属性表現候補記憶部20に格納されている図11からは、属性表現候補が「両面」と「エリア」と「ノイズ」に絞り込まれる。   Step 104) The attribute expression candidate narrowing-down unit 140 narrows down the attribute expression candidates that appear only once from the attribute expression candidate storage unit 20. Here, the information is once, but the present invention is not limited to this. For example, any information related to the frequency of attribute expression candidates may be used, such as referring to the appearance distribution of the entire attribute expression candidates. In addition, a frequently-used item may be recognized as an attribute expression at this time and taken out. For example, when it is determined that the frequency of twice or more is highly reliable as the attribute expression, “number of times” is recognized as the attribute expression as it is from FIG. In this case, the attribute expression is added to the attribute expression set regardless of the attribute expression extraction conditions in step 107 described later. In step 104, in this example, the attribute expression candidates are narrowed down to “double-sided”, “area”, and “noise” from FIG. 11 stored in the attribute expression candidate storage unit 20.

ステップ105) 共起語抽出部150が、ステップ104によって取得された属性表現候補毎に、属性表現候補と同一文内で同時に出現する入力評価表現以外の単語(共起語)を、予め用意した言語情報、構文情報、単語区切り付き文書記憶部10から、品詞が形容詞で、属性表現候補と主語述語関係(主述関係)にある単語を抽出する。   Step 105) The co-occurrence word extraction unit 150 previously prepares words (co-occurrence words) other than the input evaluation expression that appear simultaneously in the same sentence as the attribute expression candidates for each attribute expression candidate acquired in Step 104. A word having a part of speech as an adjective and having a subject predicate relationship (subject relationship) is extracted from the language information, syntax information, and word-delimited document storage unit 10.

ここでは、言語情報として品詞、構文情報として主述関係を用いて説明しているが、本発明は、形態素解析器、構文解析器によって得られ、本発明の効果のある言語情報(例えば、時制、活用など)、及び構文情報(例えば、主辞や主文を取り出すなど)であれば、これに限定しない。また、上記のステップ102で用いた情報と異なっていてもよい。   Here, the explanation is made using the part of speech as the language information and the predicate relationship as the syntax information. , Utilization, etc.) and syntactic information (for example, taking out main words and main sentences), the present invention is not limited to this. Also, it may be different from the information used in step 102 above.

この例では、形容詞であって、ステップ104で取り出された属性表現候補と主述関係にあり、入力された評価表現「多い」ではない語を共起語として抽出するので、例えば、図7に示す文ID6「この機種の画面は美しい」の場合、「美しい」は形容詞であって、属性表現候補「画面」と主述関係にある語で、入力された評価表現「多い」とは違う語なので、共起語として抽出する。図8〜図10に示す言語情報、構文情報、単語区切り付き文書記憶部10の例からは、図12に示す共起語が抽出される。この例では、1文に付き1つしか抽出されていないが、抽出条件に合えば複数の共起語を抽出することもできる。   In this example, words that are adjectives and have a predicate relationship with the attribute expression candidates extracted in step 104 and are not input as many evaluation expressions are extracted as co-occurrence words. In the case of the sentence ID 6 “the screen of this model is beautiful”, “beautiful” is an adjective and is a word that has a predicate relationship with the attribute expression candidate “screen” and is different from the input evaluation expression “many” So it is extracted as a co-occurrence word. The co-occurrence words shown in FIG. 12 are extracted from the examples of the language information, syntax information, and word-delimited document storage unit 10 shown in FIGS. In this example, only one is extracted per sentence, but a plurality of co-occurrence words can be extracted if the extraction conditions are met.

ステップ106) 共起語格納部160が、属性表現候補毎に共起語の集合を共起語記憶部30に格納する。この例の場合、上記のステップ105で抽出された共起語は、図13に示すように属性表現候補毎に共起語の集合が共起語記憶部30に格納される。   Step 106) The co-occurrence word storage unit 160 stores a set of co-occurrence words in the co-occurrence word storage unit 30 for each attribute expression candidate. In the case of this example, the co-occurrence words extracted in step 105 are stored in the co-occurrence word storage unit 30 for each attribute expression candidate as shown in FIG.

ステップ107) 属性表現抽出部170が、共起語記憶部30に格納されている共起語の集合のうち、1つ以上同じ共起語を持つ属性表現候補をまとめて属性表現集合として抽出する。   Step 107) The attribute expression extraction unit 170 collectively extracts one or more attribute expression candidates having the same co-occurrence word from the set of co-occurrence words stored in the co-occurrence word storage unit 30 as an attribute expression set. .

この例では、共起語記憶部30に格納されている図13の共起集合から、属性表現候補「画面」と「エリア」に対して、少なくとも1つの同じ共起語「広い」が格納されているので、属性表現集合として「画面」と「エリア」が抽出される。「ノイズ」は、抽出条件に合わないので抽出されない。この例では、同じ共起語の数を1つ以上としたが、整数であればこれに限らず指定できる。また、ステップ104で既に属性表現と認定された語を、無条件にステップ107で抽出された属性表現集合に追加することもできる。例えば、ステップ104で、2回以上出現した属性表現候補を属性表現と認定するならば、図11の例では「回数」が属性表現集合に加わる。   In this example, from the co-occurrence set of FIG. 13 stored in the co-occurrence word storage unit 30, at least one same co-occurrence word “wide” is stored for the attribute expression candidates “screen” and “area”. Therefore, “screen” and “area” are extracted as the attribute expression set. “Noise” is not extracted because it does not meet the extraction conditions. In this example, the number of the same co-occurrence words is one or more. However, any integer can be specified as long as it is an integer. In addition, the words already recognized as attribute expressions in step 104 can be unconditionally added to the attribute expression set extracted in step 107. For example, if an attribute expression candidate that appears twice or more is recognized as an attribute expression in step 104, “number of times” is added to the attribute expression set in the example of FIG.

このように、入力された評価表現と属性表現候補の組み合わせが同一文内で低頻度でしか出現しなくても、属性表現候補が入力評価表現以外で同じ共起語を持つかどうかについて調べることによって属性表現と認定し、属性表現集合を獲得することができる。   In this way, even if the combination of the input evaluation expression and the attribute expression candidate appears only infrequently in the same sentence, check whether the attribute expression candidate has the same co-occurrence word other than the input evaluation expression. It can be recognized as an attribute expression, and an attribute expression set can be acquired.

[第2の実施の形態]
以下に、本発明の第2の実施の形態として、評価表現獲得装置について説明する。
[Second Embodiment]
Hereinafter, an evaluation expression acquisition apparatus will be described as a second embodiment of the present invention.

図14は、本発明の第2の実施の形態における評価表現獲得装置の基本ブロック構成図である。   FIG. 14 is a basic block configuration diagram of the evaluation expression acquiring apparatus according to the second embodiment of the present invention.

評価表現獲得装置200は、属性表現入力部210、評価表現候補抽出部220、評価表現候補格納部230、評価表現候補絞り込み部240、共起語抽出部250、共起語格納部260、評価表現抽出部270、言語情報・構文情報・単語区切り付き文書記憶部40、評価表現候補記憶部50、共起語記憶部60から構成される。   The evaluation expression acquisition apparatus 200 includes an attribute expression input unit 210, an evaluation expression candidate extraction unit 220, an evaluation expression candidate storage unit 230, an evaluation expression candidate narrowing unit 240, a co-occurrence word extraction unit 250, a co-occurrence word storage unit 260, an evaluation expression. It comprises an extraction unit 270, language information / syntax information / document-with-word-breaking document storage unit 40, evaluation expression candidate storage unit 50, and co-occurrence word storage unit 60.

上記の言語情報・構文情報・単語区切り付き文書記憶部40、評価表現候補記憶部50、共起語記憶部60は、ディスク装置や、メモリなどの記憶媒体である。   The language information / syntax information / word-delimited document storage unit 40, the evaluation expression candidate storage unit 50, and the co-occurrence word storage unit 60 are storage media such as a disk device and a memory.

属性表現入力部210は、1つの属性表現を入力する。   The attribute expression input unit 210 inputs one attribute expression.

評価表現候補抽出部220は、1つの属性表現と同一文内で同時に出現する表現(評価表現候補)を、予め用意した言語情報・構文情報・単語区切り付き文書記憶部40から、品詞などの単語に関する情報、係り受けなどの構文に関する情報を基に抽出する。   The evaluation expression candidate extraction unit 220 obtains expressions (evaluation expression candidates) that simultaneously appear in the same sentence as one attribute expression from words, parts of speech, and the like from the language information / syntax information / word delimited document storage unit 40 prepared in advance. Information based on information on the syntax and information on the dependency, etc.

評価表現候補格納部230は、評価表現候補を文毎に評価表現候補記憶部50に格納する。   The evaluation expression candidate storage unit 230 stores evaluation expression candidates in the evaluation expression candidate storage unit 50 for each sentence.

評価表現候補絞り込み部240は、評価表現候補記憶部50から評価表現候補の出現頻度を利用して、評価表現候補を絞り込む。   The evaluation expression candidate narrowing unit 240 uses the appearance frequency of evaluation expression candidates from the evaluation expression candidate storage unit 50 to narrow down evaluation expression candidates.

共起語抽出部250は、評価表現候補絞り込み部240によって絞り込まれた評価表現候補毎に、評価表現候補と同一文内で同時に出現する入力属性表現以外の単語(共起語)を、予め用意した言語情報・構文情報・単語区切り付き文書記憶部40から、品詞などの単語に関する情報、係り受けなどの構文に関する情報を基に抽出する。   The co-occurrence word extraction unit 250 prepares in advance words (co-occurrence words) other than the input attribute expression that simultaneously appear in the same sentence as the evaluation expression candidate for each evaluation expression candidate narrowed down by the evaluation expression candidate narrowing unit 240. The extracted language information / syntax information / word-delimited document storage unit 40 is extracted based on information on words such as parts of speech and information on syntax such as dependency.

共起語格納部260は、評価表現候補毎に共起語の集合を共起語記憶部60に格納する。   The co-occurrence word storage unit 260 stores a set of co-occurrence words in the co-occurrence word storage unit 60 for each evaluation expression candidate.

評価表現抽出部270は、共起語記憶部60に格納されている共起語の集合のうち、予め決められた数以上同じ共起語を持つ評価表現候補をまとめて評価表現集合として抽出する。   The evaluation expression extraction unit 270 collectively extracts evaluation expression candidates having the same number of co-occurrence words from a set of co-occurrence words stored in the co-occurrence word storage unit 60 as an evaluation expression set. .

次に、評価表現獲得装置200の動作について説明する。   Next, the operation of the evaluation expression acquisition apparatus 200 will be described.

図15は、本発明の第2の実施の形態における評価表現獲得処理のフローチャートである。同図のフローチャートに基づいて、属性表現「動作」を入力した場合に評価表現を獲得する例を説明する。   FIG. 15 is a flowchart of evaluation expression acquisition processing according to the second embodiment of this invention. An example of obtaining an evaluation expression when an attribute expression “operation” is input will be described based on the flowchart of FIG.

ステップ201) 属性表現入力部210が1つの属性表現を入力する。   Step 201) The attribute expression input unit 210 inputs one attribute expression.

この例の場合、「動作」が入力される。ここでは、1つの属性表現を入力しているが、予め入力する属性表現の集合をメモリやディスク等の記憶媒体に格納しておき、そこから属性表現を1つずつ入力する方法でもよい。   In this example, “operation” is input. Here, one attribute expression is input, but a method may be used in which a set of attribute expressions to be input in advance is stored in a storage medium such as a memory or a disk, and the attribute expressions are input one by one from there.

ステップ202) 評価表現候補抽出部220が、属性表現入力部210によって取得された1つの属性表現と同一文内で同時に出現する表現(評価表現候補)を、予め用意した言語情報・構文情報・単語区切り付き文書記憶部40から、品詞が形容詞で、入力された属性表現と主語述語関係(主述関係)にある単語を抽出する。例えば、図16に示す文に関して、一般に知られている形態素解析器、構文解析器を用いて単語を区切り、言語情報として品詞、構文情報として主述関係を取り出した結果を、言語情報・構文情報・単語区切り付き文書記憶部40に格納した例として図17〜図19に示す。言語情報・構文情報・単語区切り付き文書記憶部40は、図8〜図10と同様に、図17〜図19の主述関係の欄「(主)」は、その単語と主語の関係にある語を示し、「(述)」は、その単語の述語の関係にある語を示す。例えば、文ID1「フォーカスの動作が速い」の「動作」の述語は「速い」なので、「動作」の主述関係の欄は、「(述)速い」となる。一方、同じ文の「速い」の主語は「動作」なので、「速い」の主述関係の欄は「(主)動作」と記述されている。   Step 202) Language expression / syntax information / word prepared in advance by the evaluation expression candidate extraction unit 220 as expressions (evaluation expression candidates) that simultaneously appear in the same sentence as one attribute expression acquired by the attribute expression input unit 210 A word having a part of speech as an adjective and having a subject predicate relationship (subject relationship) is extracted from the delimited document storage unit 40. For example, with respect to the sentence shown in FIG. 16, words are separated using generally known morphological analyzers and syntactic analyzers, the part of speech as linguistic information, and the result of extracting the main predicate relationship as linguistic information, FIG. 17 to FIG. 19 show examples stored in the document storage unit 40 with word breaks. In the document storage unit 40 with language information / syntax information / word delimiter, as in FIGS. 8 to 10, the column “(main)” in FIGS. 17 to 19 has a relationship between the word and the subject. “(Predicate)” indicates a word in the relationship of the predicate of the word. For example, since the predicate of “motion” of the sentence ID 1 “focus action is fast” is “fast”, the column of the main action relationship of “action” is “(description) fast”. On the other hand, since the subject of “fast” in the same sentence is “motion”, the “fast” main predicate relationship column is described as “(main) motion”.

ここでは、言語情報として品詞、構文情報として主述関係を用いて説明しているが、本発明は、形態素解析器、構文解析器によって得られ、本発明で効果のある言語情報(例えば、時制、活用など)、及び、構文情報(例えば、主辞や主文を取り出すなど)であればこれに限定しない。この例では、形容詞であって、入力された属性表現「動作」と主述関係にある語を評価表現候補として抽出するので、例えば、文ID1「フォーカスの動作が速い」の場合、「速い」は、形容詞であって入力された属性表現「動作」と主述関係にある語なので評価表現候補として抽出する。この例では、各文に対して1つの評価表現候補しかないが、抽出条件に合えば1文から複数の評価表現候補を抽出することもできる。   Here, the explanation is made by using the part of speech as the language information and the predicate relationship as the syntax information. However, the present invention is obtained by a morphological analyzer and a syntax analyzer and is effective in the present invention (for example, tense). , Utilization, etc.) and syntax information (for example, taking out a main word and a main sentence) is not limited to this. In this example, an adjective and a word that has a main predicative relationship with the input attribute expression “motion” are extracted as evaluation expression candidates. For example, in the case of sentence ID 1 “the focus operation is fast”, “fast” Is an adjective and is a word that is in a predicate relationship with the input attribute expression “action”, and is extracted as an evaluation expression candidate. In this example, there is only one evaluation expression candidate for each sentence, but a plurality of evaluation expression candidates can be extracted from one sentence if the extraction condition is met.

ステップ203) 評価表現候補格納部230が、ステップ202で抽出された評価表現候補を文毎に評価表現候補記憶部50に格納する。入力された属性表現が「動作」の場合に抽出された評価表現候補の結果を図20に示す。図20の「−」は、その文からは評価表現候補が抽出されなかったことを表している。   Step 203) The evaluation expression candidate storage unit 230 stores the evaluation expression candidates extracted in step 202 in the evaluation expression candidate storage unit 50 for each sentence. FIG. 20 shows the result of the evaluation expression candidate extracted when the input attribute expression is “motion”. “-” In FIG. 20 indicates that no evaluation expression candidate is extracted from the sentence.

ステップ204) 評価表現候補絞り込み部240が、評価表現候補記憶部50から、1回しか出現しない評価表現候補に絞り込む。ここでは1回としているが、これに限らず、例えば、評価表現候補全体の出現分布を参考にするなど、評価表現候補の頻度に係わる情報なら何でもよい。また、頻度の多いものは、この時点でそのまま評価表現と認定して取り出してもよい。例えば、頻度2回以上のものは、評価表現として信頼性が高いと判断する場合、図20からは「速い」がそのまま評価表現として認定される。この場合、後述するステップ207での評価表現の抽出条件にかかわらず評価表現集合に加える。ステップ204において、この例の場合、評価表現候補記憶部50に格納されている図20の内容からは、評価表現候補が「鈍い」と「遅い」と「重い」に絞り込まれる。   Step 204) The evaluation expression candidate narrowing-down unit 240 narrows down the evaluation expression candidates from the evaluation expression candidate storage unit 50 to evaluation expression candidates that appear only once. Here, it is assumed to be once, but the present invention is not limited to this. For example, any information related to the frequency of evaluation expression candidates may be used, such as referring to the appearance distribution of all evaluation expression candidates. Moreover, what has a high frequency may be taken out as an evaluation expression as it is at this point. For example, when it is determined that the frequency of two or more times is highly reliable as the evaluation expression, “fast” is recognized as the evaluation expression as it is from FIG. In this case, the evaluation expression is added to the evaluation expression set regardless of the evaluation expression extraction condition in step 207 described later. In step 204, in this example, the evaluation expression candidates are narrowed down to “dull”, “slow”, and “heavy” from the contents of FIG. 20 stored in the evaluation expression candidate storage unit 50.

ステップ205) 共起語抽出部260が、ステップ204によって取得された評価表現候補毎に、評価表現候補と同一文内で同時に出現する入力属性表現以外の単語(共起語)を、予め用意した言語情報・構文情報・単語区切り付き文書記憶部40から、品詞が名詞で、評価表現候補と主語述語関係(主述関係)にある単語を抽出する。   Step 205) The co-occurrence word extraction unit 260 prepares in advance words (co-occurrence words) other than the input attribute expression that simultaneously appear in the same sentence as the evaluation expression candidate for each evaluation expression candidate acquired in Step 204. A word having a part of speech as a noun and having a subject expression predicate relationship (subject relationship) is extracted from the language information / syntax information / word delimited document storage unit 40.

ここでは、言語情報として品詞、構文情報として主述関係を用いて説明しているが、本発明は、形態素解析器、構文解析器によって得られ、本発明で効果のある言語情報(例えば、時制、活用など)、及び構文情報(例えば、主辞や主文を取り出すなど)であれば、これに限定しない。また、ステップ202で用いた情報と異なっていてもよい。この例では、名詞であって、ステップ204で取り出された評価表現候補と主述関係にあり、入力された属性表現「動作」ではない語を共起語として抽出するので、例えば、文ID6「ボタンの反応が鈍い」の場合「反応」は、名詞であって、評価表現候補「鈍い」と主述関係にある語で、入力された属性表現「動作」とは違う語なので、共起語として抽出する。図17〜図19の例からは図21に示す共起語が抽出される。この例では、1文に付き1つしか抽出されていないが、抽出条件に合えば、複数の共起語を抽出することもできる。   Here, the explanation is made by using the part of speech as the language information and the predicate relationship as the syntax information. However, the present invention is obtained by a morphological analyzer and a syntax analyzer and is effective in the present invention (for example, tense). , Utilization, etc.) and syntactic information (for example, taking out main words and main sentences), the present invention is not limited to this. Further, it may be different from the information used in step 202. In this example, a word that is a noun and has a main-state relationship with the evaluation expression candidate extracted in step 204 and is not the input attribute expression “action” is extracted as a co-occurrence word. If the button response is "dull", "reaction" is a noun and is a word that has a predicate relationship with the evaluation expression candidate "dull" and is different from the input attribute expression "action". Extract as The co-occurrence words shown in FIG. 21 are extracted from the examples of FIGS. In this example, only one is extracted per sentence, but a plurality of co-occurrence words can be extracted if the extraction conditions are met.

ステップ206) 共起語格納部260が、評価表現候補毎に共起語の集合を共起語記憶部60に格納する。この例の場合、ステップ205で抽出された共起語は、図22に示すように評価表現候補毎に共起語の集合が共起語記憶部60に格納される。   Step 206) The co-occurrence word storage unit 260 stores a set of co-occurrence words in the co-occurrence word storage unit 60 for each evaluation expression candidate. In the case of this example, for the co-occurrence words extracted in step 205, a set of co-occurrence words is stored in the co-occurrence word storage unit 60 for each evaluation expression candidate as shown in FIG.

ステップ207) 評価表現抽出部270が、共起語記憶部60に格納されている共起語集合のうち、1つ以上同じ共起語を持つ評価表現候補をまとめて評価表現集合として抽出する。この例では、共起語記憶部60に格納されている図22に示す内容から、評価表現候補「鈍い」と「遅い」に対して、少なくとも1つの同じ共起語「反応」が格納されているので、評価表現集合として「鈍い」と「遅い」が抽出される。「重い」は、抽出条件に合わないので抽出されない。この例では、同じ共起語の数を1つ以上としたが、整数であれば、これに限らず指定できる。また、上記のステップ204で既に評価表現と認定された語を、無条件に当該ステップ207で抽出された評価表現集合に追加することもできる。例えば、ステップ204で、2回以上出現した評価表現候補を評価表現と認定するならば、図20の例では、「速い」が評価表現集合に加わる。   Step 207) The evaluation expression extraction unit 270 collectively extracts one or more evaluation expression candidates having the same co-occurrence word from the co-occurrence word sets stored in the co-occurrence word storage unit 60 as an evaluation expression set. In this example, from the contents shown in FIG. 22 stored in the co-occurrence word storage unit 60, at least one same co-occurrence word “reaction” is stored for the evaluation expression candidates “dull” and “slow”. Therefore, “dull” and “slow” are extracted as the evaluation expression set. “Heavy” is not extracted because it does not meet the extraction conditions. In this example, the number of the same co-occurrence words is one or more. However, the number can be specified as long as it is an integer. In addition, words that have already been recognized as evaluation expressions in step 204 can be unconditionally added to the evaluation expression set extracted in step 207. For example, if an evaluation expression candidate that appears twice or more in step 204 is recognized as an evaluation expression, “fast” is added to the evaluation expression set in the example of FIG.

このように、入力された属性表現と評価表現候補の組み合わせが同一文内で低頻度でしか出現しなくても、評価表現候補が、入力属性表現以外で同じ共起語を持つかどうかについて調べることによって評価表現と認定し、評価表現集合を獲得する事ができる。   In this way, even if the combination of the input attribute expression and the evaluation expression candidate appears only infrequently in the same sentence, it is checked whether the evaluation expression candidate has the same co-occurrence word other than the input attribute expression. It can be recognized as an evaluation expression and an evaluation expression set can be obtained.

なお、上記の第1の実施の形態及び第2の形態の機能をプログラムとして実現してもよい。   The functions of the first embodiment and the second embodiment described above may be realized as a program.

つまり、上記の第1の実施の形態では、属性表現を獲得するプログラムとして、1つの評価表現を入力する評価表現入力手順と、その評価表現入力手順によって取得された1つの評価表現と同一文内で同時に出現する単語(属性表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶部から単語の出現位置に関する情報を基に抽出する属性表現候補抽出手順と、その属性表現候補を文毎に属性表現候補記憶部に格納する属性表現候補格納手順と、その属性表現候補記憶部から属性表現候補の出現頻度を利用して属性表現候補を絞り込む属性表現候補絞り込み手順と、その属性表現候補絞り込み手順によって絞り込まれた属性表現候補毎に、その属性表現候補と同一文内で同時に出現する入力評価表現以外の語(共起語)を、単語の出現位置に関する情報を基に予め用意した単語区切り付き文書を格納した文書記憶部から抽出する共起語抽出手順と、その属性表現候補毎に共起語の集合を共起語記憶部に格納する共起語格納手順と、その共起語記憶部に格納されている共起語の集合の内、予め決められた数以上同じ共起語を持つ属性表現候補をまとめて属性表現集合として抽出する属性表現抽出手順と、をコンピュータに実行させることで実現できる。   That is, in the first embodiment described above, as a program for acquiring attribute expressions, an evaluation expression input procedure for inputting one evaluation expression, and one evaluation expression acquired by the evaluation expression input procedure in the same sentence Attribute expression candidate extraction procedure for extracting words (attribute expression candidates) that appear at the same time from a document storage unit storing a word-delimited document prepared in advance based on information on the appearance position of the word, and the attribute expression candidates as sentences Attribute expression candidate storage procedure for storing each attribute expression candidate in the attribute expression candidate storage unit, attribute expression candidate narrowing procedure for narrowing down attribute expression candidates using the frequency of appearance of attribute expression candidates from the attribute expression candidate storage unit, and the attribute expression candidates For each attribute expression candidate narrowed down by the narrowing-down procedure, a word (co-occurrence word) other than the input evaluation expression that appears simultaneously in the same sentence as the attribute expression candidate A co-occurrence word extraction procedure for extracting from a document storage unit storing a word-delimited document prepared in advance based on information on the appearance position, and a set of co-occurrence words for each attribute expression candidate are stored in the co-occurrence word storage unit From the co-occurrence word storage procedure and a set of co-occurrence words stored in the co-occurrence word storage unit, attribute expression candidates having the same co-occurrence word for a predetermined number or more are collectively extracted as an attribute expression set. This can be realized by causing the computer to execute the attribute expression extraction procedure.

また、上記の属性表現候補抽出手順に、予め用意した文書の単語自身に関する言語情報を格納した文書記憶部から、その言語情報を利用して属性表現候補を抽出する手順を含み、上記共起語抽出手順に予め用意した文書記憶部からその言語情報を利用して、共起語を抽出する手順を含むプログラムとしてもよい。   The attribute expression candidate extraction procedure includes a procedure of extracting attribute expression candidates from a document storage unit storing language information related to a word of a document prepared in advance using the language information, and the co-occurrence word A program including a procedure for extracting co-occurrence words using the language information from a document storage unit prepared in advance for the extraction procedure may be used.

また、上記の属性表現候補抽出手順に、予め用意した文書の単語間に係わる構文情報を格納した文書記憶部からその構文情報を利用して、属性表現候補を抽出する手順を含み、上記の共起語抽出手順に、予め用意した文書の単語間に係わる構文情報が格納された文書記憶部から、その構文情報を利用して、共起語を抽出する手順を含むプログラムとしてもよい。   The attribute expression candidate extraction procedure includes a procedure for extracting attribute expression candidates from a document storage unit storing syntax information related to words of a document prepared in advance using the syntax information. The word extraction procedure may be a program including a procedure for extracting a co-occurrence word from a document storage unit storing syntax information related to words in a document prepared in advance using the syntax information.

また、上記の第2の実施の形態における評価表現を獲得するプログラムとして、1つの属性表現を入力する属性表現入力手順と、その属性表現入力手順によって取得された1つの属性表現と同一文内で同時に出現する単語(評価表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶部から単語の出現位置に関する情報を基に抽出する評価表現候補抽出手順と、その評価表現候補記憶部に格納する評価表現候補格納手順と、その評価表現候補記憶部から評価表現候補の出現頻度を利用して、評価表現候補を絞り込む評価表現候補絞り込み手順と、その評価表現候補絞り込み手順によって絞り込まれた評価表現候補毎に、その評価表現候補と同一文内で同時に出現する入力属性表現以外の語(共起語)を、単語の出現位置に関する情報を基に、予め用意した単語区切り付き文書記憶媒体から抽出する共起語抽出手順と、その評価表現候補毎に共起語の集合を共起語記憶部に格納する共起語格納手順と、その共起語記憶部に格納されている共起語の集合のうち、予め決められた数以上同じ共起語を持つ評価表現候補をまとめて評価表現集合として抽出する評価表現抽出手順とを、コンピュータに実行させることで実現する。   In addition, as a program for acquiring an evaluation expression in the second embodiment, an attribute expression input procedure for inputting one attribute expression and an attribute expression acquired by the attribute expression input procedure in the same sentence An evaluation expression candidate extraction procedure for extracting simultaneously appearing words (evaluation expression candidates) from a document storage unit storing a word-delimited document prepared in advance based on information on the appearance position of the word, and the evaluation expression candidate storage unit Evaluation expression candidate storing procedure to be stored, evaluation expression candidate narrowing procedure for narrowing down evaluation expression candidates using the appearance frequency of evaluation expression candidates from the evaluation expression candidate storage unit, and evaluation narrowed down by the evaluation expression candidate narrowing procedure For each expression candidate, a word (co-occurrence word) other than the input attribute expression that appears simultaneously in the same sentence as the evaluation expression candidate is related to the appearance position of the word. A co-occurrence word extraction procedure for extracting from a document storage medium with word breaks prepared in advance, and a co-occurrence word storage procedure for storing a set of co-occurrence words for each evaluation expression candidate in the co-occurrence word storage unit; And an evaluation expression extraction procedure for extracting evaluation expression candidates having the same co-occurrence word more than a predetermined number from the set of co-occurrence words stored in the co-occurrence word storage unit as an evaluation expression set. This is realized by causing the computer to execute.

また、上記の評価表現候補抽出手順に、予め用意した文書の単語自身に関する言語情報が格納された文書記憶部から、その言語情報を利用して評価表現候補を抽出する手順を含み、上記共起語抽出手順に、予め用意した文書の単語自身に関する言語情報が格納された文書記憶部から、その言語情報を利用して、共起語を抽出する手順を含むプログラムとしてもよい。   Further, the evaluation expression candidate extraction procedure includes a procedure for extracting evaluation expression candidates from a document storage unit storing language information about a word of a document prepared in advance using the language information. The word extraction procedure may be a program including a procedure for extracting co-occurrence words from a document storage unit in which language information about a word of a document prepared in advance is stored.

また、上記の評価表現候補抽出手順に、予め用意した文書の単語間に係わる構文情報を格納した文書記憶部から、その構文情報を利用して評価表現候補を抽出する手順を含み、上記の共起語抽出手順に、予め用意した文書の単語間に係わる構文情報を格納した文書記憶部から、その構文情報を利用して共起語を抽出する手順を含むプログラムとしてもよい。   The evaluation expression candidate extraction procedure includes a procedure for extracting evaluation expression candidates from a document storage unit storing syntax information related to words of a document prepared in advance, using the syntax information. The word extraction procedure may be a program including a procedure for extracting a co-occurrence word from a document storage unit storing syntax information related to words of a document prepared in advance using the syntax information.

また、上記のプログラムを、ハードディスクや、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。   Further, the above program can be stored in a portable storage medium such as a hard disk, a flexible disk, or a CD-ROM, and can be installed or distributed in a computer.

なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。   The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.

本発明は、文書から対象事物の属性表現・評価表現を抽出するための技術に適用可能である。   The present invention can be applied to a technique for extracting an attribute expression / evaluation expression of an object from a document.

本発明の原理を説明するための図(その1)である。It is FIG. (1) for demonstrating the principle of this invention. 本発明の原理構成図(その1)である。It is a principle block diagram (the 1) of this invention. 本発明の原理を説明するための図(その2)である。It is FIG. (2) for demonstrating the principle of this invention. 本発明の原理構成図(その2)である。It is a principle block diagram (the 2) of this invention. 本発明の第1の実施の形態における属性表現獲得装置の基本ブロック構成図である。It is a basic block block diagram of the attribute expression acquisition apparatus in the 1st Embodiment of this invention. 本発明の第1の実施の形態における属性表現獲得処理のフローチャートである。It is a flowchart of the attribute expression acquisition process in the 1st Embodiment of this invention. 本発明の第1の実施の形態における文の例である。It is an example of the sentence in the 1st Embodiment of this invention. 本発明の第1の実施の形態における言語情報・構文情報・単語区切り付き文書記憶部の例(その1)である。It is an example (the 1) of the document storage part with language information, syntax information, and a word delimiter in the 1st Embodiment of this invention. 本発明の第1の実施の形態における言語情報・構文情報・単語区切り付き文書記憶部の例(その2)である。It is an example (the 2) of the document storage part with language information, syntax information, and a word delimiter in the 1st Embodiment of this invention. 本発明の第1の実施の形態における言語情報・構文情報・単語区切り付き文書記憶部の例(その3)である。It is an example (the 3) of the document storage part with language information, syntax information, and a word delimiter in the 1st Embodiment of this invention. 本発明の第1の実施の形態における属性表現候補の例である。It is an example of the attribute expression candidate in the 1st Embodiment of this invention. 本発明の第1の実施の形態における共起語の例である。It is an example of the co-occurrence word in the 1st Embodiment of this invention. 本発明の第1の実施の形態における属性表現候補毎の共起語集合の例である。It is an example of the co-occurrence word set for every attribute expression candidate in the 1st Embodiment of this invention. 本発明の第2の実施の形態における評価表現獲得装置の基本ブロック構成図である。It is a basic block block diagram of the evaluation expression acquisition apparatus in the 2nd Embodiment of this invention. 本発明の第2の実施の形態における評価表現獲得処理のフローチャートである。It is a flowchart of the evaluation expression acquisition process in the 2nd Embodiment of this invention. 本発明の第2の実施の形態における文の例である。It is an example of the sentence in the 2nd Embodiment of this invention. 本発明の第2の実施の形態における言語情報・構文情報・単語区切り付き文書記憶部の例(その1)である。It is an example (the 1) of the document storage part with language information, syntax information, and a word delimiter in the 2nd Embodiment of this invention. 本発明の第2の実施の形態における言語情報・構文情報・単語区切り付き文書記憶部の例(その2)である。It is an example (the 2) of the document storage part with language information, syntax information, and a word delimiter in the 2nd Embodiment of this invention. 本発明の第2の実施の形態における言語情報・構文情報・単語区切り付き文書記憶部の例(その3)である。It is an example (the 3) of the document memory | storage part with language information, syntax information, and a word delimiter in the 2nd Embodiment of this invention. 本発明の第2の実施の形態における評価表現候補の例である。It is an example of the evaluation expression candidate in the 2nd Embodiment of this invention. 本発明の第2の実施の形態における共起語の例である。It is an example of the co-occurrence word in the 2nd Embodiment of this invention. 本発明の第2の実施の形態における共起語集合の例である。It is an example of the co-occurrence word set in the 2nd Embodiment of this invention.

符号の説明Explanation of symbols

10 文書記憶手段、言語情報・構文情報・単語区切り付き文書記憶部
20 属性表現候補記憶手段、属性表現候補記憶部
30 共起語記憶手段、共起語記憶部
40 文書記憶手段、言語情報・構文情報・単語区切り付き文書記憶部
50 評価表現候補記憶手段、評価表現候補記憶部
60 共起語記憶手段、共起語記憶部
100 属性表現獲得装置
110 評価表現入力手段、評価表現入力部
120 属性表現候補抽出手段、属性表現候補抽出部
130 属性表現候補格納手段、属性表現候補格納部
140 属性表現候補絞り込み手段、属性表現候補絞り込み部
150 共起語抽出手段、共起語抽出部
160 共起語格納手段、共起語格納部
170 属性表現抽出手段、属性表現抽出部
200 評価表現獲得装置
210 属性表現入力手段、属性表現入力部
220 評価表現候補抽出手段、評価表現候補抽出部
230 評価表現候補格納手段、評価表現候補格納部
240 評価表現候補絞り込み手段、評価表現候補絞り込み部
250 共起語抽出手段、共起語抽出部
260 共起語格納手段、共起語格納部
270 評価表現抽出手段、評価表現抽出部
10. Document storage means, linguistic information / syntax information / document delimited document storage section 20 attribute expression candidate storage means, attribute expression candidate storage section 30 co-occurrence word storage means, co-occurrence word storage section 40 document storage means, language information / syntax Document storage unit with information / word delimiter 50 Evaluation expression candidate storage unit, evaluation expression candidate storage unit 60 Co-occurrence word storage unit, co-occurrence word storage unit 100 Attribute expression acquisition unit 110 Evaluation expression input unit, evaluation expression input unit 120 Attribute expression Candidate extraction means, attribute expression candidate extraction section 130 Attribute expression candidate storage means, attribute expression candidate storage section 140 Attribute expression candidate narrowing means, attribute expression candidate narrowing section 150 Co-occurrence word extraction means, co-occurrence word extraction section 160 Co-occurrence word storage Means, co-occurrence word storage unit 170 attribute expression extraction unit, attribute expression extraction unit 200 evaluation expression acquisition device 210 attribute expression input unit, attribute expression input unit 220 Value expression candidate extraction means, evaluation expression candidate extraction section 230 Evaluation expression candidate storage means, evaluation expression candidate storage section 240 Evaluation expression candidate narrowing means, evaluation expression candidate narrowing section 250 Co-occurrence word extraction means, Co-occurrence word extraction section 260 Co-occurrence Word storage means, co-occurrence word storage section 270 Evaluation expression extraction means, evaluation expression extraction section

Claims (14)

評価表現入力手段、属性表現候補抽出手段、属性表現候補格納手段、属性表現候補絞り込み手段、共起語抽出手段、共起語格納手段、属性表現抽出手段及び複数の記憶手段とを有する属性表現獲得装置における、対象事物に対して評価を表す表現である評価表現を基に、該対象事物の性質を表す属性表現を文書から獲得するための属性表現獲得方法であって、
前記評価表現入力手段が、1つの評価表現を入力する評価表現入力ステップと、
前記属性表現候補抽出手段が、前記評価表現入力ステップによって取得された前記1つの評価表現と同一文内で同時に出現する表現(属性表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段から、単語の出現位置に関する情報を基に抽出する属性表現候補抽出ステップと、
前記属性表現候補格納手段が、前記属性表現候補を文毎に属性表現候補記憶手段に格納する属性表現候補格納ステップと、
前記属性表現候補絞り込み手段が、前記属性表現候補記憶手段から前記属性表現候補の出現頻度を利用して、該属性表現候補を絞り込む属性表現候補絞り込みステップと、
前記共起語抽出手段が、前記属性表現候補絞り込みステップによって絞り込まれた属性表現候補毎に、該属性表現候補と同一文内で同時に出現する該評価表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、前記単語区切り付き文書格納した文書記憶手段から抽出する共起語抽出ステップと、
前記共起語格納手段が、前記属性表現候補毎に前記共起語の集合を共起語記憶手段に格納する共起語格納ステップと、
前記属性表現抽出手段が、前記共起語記憶手段に格納されている前記共起語の集合のうち、予め決められた数以上に同じ共起語を持つ属性表現候補をまとめて属性表現集合として抽出する属性表現抽出ステップと、
を行うことを特徴とする属性表現獲得方法。
Attribute expression acquisition means having evaluation expression input means, attribute expression candidate extraction means, attribute expression candidate storage means, attribute expression candidate narrowing means, co-occurrence word extraction means, co-occurrence word storage means, attribute expression extraction means, and a plurality of storage means An attribute expression acquisition method for acquiring, from a document, an attribute expression that represents a property of a target object based on an evaluation expression that is an expression that represents an evaluation of the target object in the device,
An evaluation expression input step in which the evaluation expression input means inputs one evaluation expression;
Document storage in which the attribute expression candidate extraction unit stores a word-delimited document prepared in advance for expressions (attribute expression candidates) that simultaneously appear in the same sentence as the one evaluation expression acquired in the evaluation expression input step Means for extracting an attribute expression candidate based on information on the appearance position of the word;
The attribute expression candidate storage means stores the attribute expression candidates in the attribute expression candidate storage means for each sentence, and an attribute expression candidate storage step;
The attribute expression candidate narrowing-down means uses the appearance frequency of the attribute expression candidates from the attribute expression candidate storage means to narrow down the attribute expression candidates, and
For each attribute expression candidate narrowed down by the attribute expression candidate narrowing-down step, the co-occurrence word extracting means selects a word (co-occurrence word) other than the evaluation expression that simultaneously appears in the same sentence as the attribute expression candidate. A co-occurrence word extraction step for extracting from the document storage means that stores the document with the word separator based on the information on the appearance position of
The co-occurrence word storage means stores a set of the co-occurrence words in the co-occurrence word storage means for each attribute expression candidate; and
The attribute expression extraction unit collects attribute expression candidates having the same co-occurrence word more than a predetermined number from the set of co-occurrence words stored in the co-occurrence word storage unit as an attribute expression set. An attribute expression extraction step to extract;
Attribute expression acquisition method characterized by performing
前記属性表現候補抽出ステップにおいて、
前記属性表現候補抽出手段が、予め用意した文書の単語自身に関する言語情報を格納した言語情報付き文書を格納した文書記憶手段から、該言語情報を利用して前記属性表現候補を抽出するステップを行い、
前記共起語抽出ステップにおいて、
前記共起語抽出手段が、前記言語情報付き文書格納した文書記憶手段から、前記言語情報を利用して前記共起語を抽出するステップを行う、
請求項1記載の属性表現獲得方法。
In the attribute expression candidate extraction step,
The attribute expression candidate extraction unit performs a step of extracting the attribute expression candidate from the document storage unit storing a document with language information storing language information about a word of the document prepared in advance using the language information. ,
In the co-occurrence word extraction step,
The co-occurrence word extraction means performs a step of extracting the co-occurrence word from the document storage means storing the document with language information using the language information.
The attribute expression acquisition method according to claim 1.
前記属性表現候補抽出ステップにおいて、
前記属性表現候補抽出手段が、予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段から、該構文情報を利用して前記属性表現候補を抽出するステップを行い、
前記共起語抽出ステップにおいて、
前記共起語抽出手段が、前記構文情報付き文書を格納した文書記憶手段から前記構文情報を利用して前記共起語を抽出するステップを行う
請求項1または2記載の属性表現獲得方法。
In the attribute expression candidate extraction step,
The attribute expression candidate extraction unit performs a step of extracting the attribute expression candidate from the document storage unit storing a document with syntax information related to words of a document prepared in advance using the syntax information;
In the co-occurrence word extraction step,
The attribute expression acquisition method according to claim 1 or 2, wherein the co-occurrence word extraction unit performs the step of extracting the co-occurrence word using the syntax information from a document storage unit storing the document with syntax information.
対象事物に対して評価を表す表現である評価表現を基に、該対象事物の性質を表す属性表現を文書から獲得するための属性表現獲得装置であって、
1つの評価表現を入力する評価表現入力手段と、
前記評価表現入力手段によって取得された前記1つの評価表現と同一文内で同時に出現する表現(属性表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段から、単語の出現位置に関する情報を基に抽出する属性表現候補抽出手段と、
前記属性表現候補を文毎に属性表現候補記憶手段に格納する属性表現候補格納手段と、
前記属性表現候補記憶手段から前記属性表現候補の出現頻度を利用して、該属性表現候補を絞り込む属性表現候補絞り込み手段と、
前記属性表現候補絞り込み手段によって絞り込まれた属性表現候補毎に、該属性表現候補と同一文内で同時に出現する該評価表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、前記単語区切り付き文書を格納した文書記憶手段から抽出する共起語抽出手段と、
前記属性表現候補毎に前記共起語の集合を共起語記憶手段に格納する共起語格納手段と、
前記共起語記憶手段に格納されている前記共起語の集合のうち、予め決められた数以上に同じ共起語を持つ属性表現候補をまとめて属性表現集合として抽出する属性表現抽出手段と、
を有することを特徴とする属性表現獲得装置。
An attribute expression acquisition device for acquiring, from a document, an attribute expression that represents a property of the target object, based on an evaluation expression that is an expression indicating evaluation of the target object,
An evaluation expression input means for inputting one evaluation expression;
Expressions (attribute expression candidates) that appear simultaneously in the same sentence as the one evaluation expression acquired by the evaluation expression input unit are related to the appearance position of the word from the document storage unit that stores the word-delimited document prepared in advance. Attribute expression candidate extraction means for extracting based on information;
Attribute expression candidate storage means for storing the attribute expression candidates in the attribute expression candidate storage means for each sentence;
Attribute expression candidate narrowing means for narrowing down the attribute expression candidates using the appearance frequency of the attribute expression candidates from the attribute expression candidate storage means;
For each attribute expression candidate narrowed down by the attribute expression candidate narrowing means, a word (co-occurrence word) other than the evaluation expression that appears at the same time in the same sentence as the attribute expression candidate is determined based on information on the appearance position of the word. , Co-occurrence word extraction means for extracting from the document storage means storing the word-delimited document;
Co-occurrence word storage means for storing the set of co-occurrence words in the co-occurrence word storage means for each attribute expression candidate;
Attribute expression extraction means for collectively extracting attribute expression candidates having the same co-occurrence word in a predetermined number or more from the set of co-occurrence words stored in the co-occurrence word storage means as an attribute expression set; ,
An attribute expression acquisition device characterized by comprising:
前記属性表現候補抽出手段は、
予め用意した文書の単語自身に関する言語情報付き文書を格納した文書記憶手段から、該言語情報を利用して前記属性表現候補を抽出する手段を含み、
前記共起語抽出手段は、
前記言語情報付き文書を格納した文書記憶手段から、前記言語情報を利用して前記共起語を抽出する手段を含む
請求項4記載の属性表現獲得装置。
The attribute expression candidate extraction means includes:
Means for extracting the attribute expression candidate from the document storage means storing a document with language information relating to the word itself of the document prepared in advance, using the language information;
The co-occurrence word extracting means includes
5. The attribute expression acquisition apparatus according to claim 4, further comprising means for extracting the co-occurrence word using the language information from a document storage means storing the document with language information.
前記属性表現候補抽出手段は、
予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段から、該構文情報を利用して前記属性表現候補を抽出する手段を含み、
前記共起語抽出手段は、
前記構文情報付き文書を格納した文書記憶手段から前記構文情報を利用して前記共起語を抽出する手段を含む
請求項4または5記載の属性表現獲得装置。
The attribute expression candidate extraction means includes:
Means for extracting the attribute expression candidate from the document storage means storing the document with syntax information related to the words of the document prepared in advance, using the syntax information;
The co-occurrence word extracting means includes
6. The attribute expression acquisition apparatus according to claim 4, further comprising means for extracting the co-occurrence word using the syntax information from a document storage means storing the document with syntax information.
コンピュータを、
請求項4乃至6記載の属性表現獲得装置として機能させることを特徴とする属性表現獲得プログラム。
Computer
An attribute expression acquisition program that functions as the attribute expression acquisition device according to claim 4.
属性表現入力手段、評価表現候補抽出手段、評価表現候補格納手段、評価表現候補絞り込み手段、共起語抽出手段、共起語格納手段、評価表現抽出手段及び複数の記憶手段とを有する評価表現獲得装置における、対象事物の性質を表す属性表現を基に、該対象事物に対して評価を表す表現である評価表現を文書から獲得する評価表現獲得方法であって、
前記属性表現入力手段が、1つの属性表現を入力する属性表現入力ステップと、
前記評価表現候補抽出手段が、前記属性表現入力ステップによって取得された前記1つの属性表現と同一文内で同時に出現する表現(評価表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段から単語の出現位置に関する情報を基に抽出する評価表現候補抽出ステップと、
前記評価表現候補格納手段が、前記評価表現候補を文毎に評価表現候補記憶手段に格納する評価表現候補格納ステップと、
前記評価表現候補絞り込み手段が、前記評価表現候補記憶手段から、前記評価表現候補の出現頻度を利用して、評価表現候補を絞り込む評価表現候補絞り込みステップと、
前記共起語抽出手段が、前記評価表現候補絞り込みステップによって絞り込まれた評価表現候補毎に、該評価表現候補と同一文内で同時に出現する属性表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、前記単語区切り付き文書を格納した文書記憶手段から抽出する共起語抽出ステップと、
前記共起語格納手段が、前記評価表現候補毎に前記共起語の集合を共起語記憶手段に格納する共起語格納ステップと、
前記評価表現抽出手段が、前記共起語記憶手段に格納されている前記共起語の集合のうち、予め決められた数以上に同じ共起語を持つ評価表現候補をまとめて評価表現集合として抽出する評価表現抽出ステップと、
を行うことを特徴とする評価表現獲得方法。
Evaluation expression acquisition having attribute expression input means, evaluation expression candidate extraction means, evaluation expression candidate storage means, evaluation expression candidate narrowing means, co-occurrence word extraction means, co-occurrence word storage means, evaluation expression extraction means, and a plurality of storage means An evaluation expression acquisition method for acquiring, from a document, an evaluation expression, which is an expression representing an evaluation of an object thing, based on an attribute expression representing a property of the object object in the apparatus,
An attribute expression input step in which the attribute expression input means inputs one attribute expression;
Document storage in which the evaluation expression candidate extraction unit stores a word-delimited document prepared in advance for an expression (evaluation expression candidate) that simultaneously appears in the same sentence as the one attribute expression acquired in the attribute expression input step. An evaluation expression candidate extraction step for extracting from the information on the appearance position of the word from the means;
The evaluation expression candidate storage means for storing the evaluation expression candidates in the evaluation expression candidate storage means for each sentence;
The evaluation expression candidate narrowing-down means uses the appearance frequency of the evaluation expression candidates from the evaluation expression candidate storage means to narrow down the evaluation expression candidates, and
For each evaluation expression candidate narrowed down by the evaluation expression candidate narrowing-down step, the co-occurrence word extracting means calculates a word (co-occurrence word) other than the attribute expression that simultaneously appears in the same sentence as the evaluation expression candidate. A co-occurrence word extraction step for extracting from the document storage means storing the word-delimited document based on the information on the appearance position;
The co-occurrence word storage means stores the set of co-occurrence words in the co-occurrence word storage means for each evaluation expression candidate;
The evaluation expression extraction means collectively sets evaluation expression candidates having the same co-occurrence words in a predetermined number or more out of the set of co-occurrence words stored in the co-occurrence word storage means as an evaluation expression set. An evaluation expression extraction step to be extracted;
The evaluation expression acquisition method characterized by performing.
前記評価表現候補抽出ステップにおいて、
前記評価表現候補抽出手段が、予め用意した文書の単語自身に関する言語情報を格納した言語情報付き文書を格納した文書記憶手段から該言語情報を利用して前記評価表現候補を抽出するステップを行い、
前記共起語抽出ステップにおいて、
前記共起語抽出手段が、前記言語情報付き文書を格納した文書記憶手段から前記言語情報を利用して共起語を抽出するステップを行う、
請求項8記載の評価表現獲得方法。
In the evaluation expression candidate extraction step,
The evaluation expression candidate extraction unit performs a step of extracting the evaluation expression candidate using the language information from a document storage unit that stores a document with language information that stores language information about a word of the document prepared in advance.
In the co-occurrence word extraction step,
The co-occurrence word extracting means performs a step of extracting a co-occurrence word using the language information from a document storage means storing the document with language information.
The evaluation expression acquisition method according to claim 8.
前記評価表現候補抽出ステップにおいて、
前記評価表現候補抽出手段が、予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段から、該構文情報を利用して前記評価表現候補を抽出するステップを行い、
前記共起語抽出ステップにおいて、
前記共起語抽出手段が、前記構文情報付き文書を格納した文書記憶手段から、前記構文情報を利用して前記共起語を抽出するステップを行う、
請求項8または9記載の評価表現獲得方法。
In the evaluation expression candidate extraction step,
The evaluation expression candidate extraction unit performs a step of extracting the evaluation expression candidate using the syntax information from a document storage unit that stores a document with syntax information related to words of a document prepared in advance.
In the co-occurrence word extraction step,
The co-occurrence word extraction means performs a step of extracting the co-occurrence word from the document storage means storing the document with syntax information using the syntax information.
The evaluation expression acquisition method according to claim 8 or 9.
対象事物の性質を表す属性表現を基に、該対象事物に対して評価を表す表現である評価表現を文書から獲得する評価表現獲得装置であって、
1つの属性表現を入力する属性表現入力手段と、
前記属性表現入力手段によって取得された前記1つの属性表現と同一文内で同時に出現する表現(評価表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段から、単語の出現位置に関する情報を基に抽出する評価表現候補抽出手段と、
前記評価表現候補を文毎に評価表現候補記憶手段に格納する評価表現候補格納手段と、
前記評価表現候補記憶手段から、前記評価表現候補の出現頻度を利用して、該評価表現候補を絞り込む評価表現候補絞り込み手段と、
前記評価表現候補絞り込み手段によって絞り込まれた評価表現候補毎に、該評価表現候補と同一文内で同時に出現する属性表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、前記単語区切り付き文書を格納した文書記憶手段から抽出する共起語抽出手段と、
前記評価表現候補毎に前記共起語の集合を共起語記憶手段に格納する共起語格納手段と、
前記共起語記憶手段に格納されている前記共起語の集合のうち、予め決められた数以上に同じ共起語を持つ評価表現候補をまとめて評価表現集合として抽出する評価表現抽出手段と、
を有することを特徴とする評価表現獲得装置。
An evaluation expression acquisition device that acquires an evaluation expression from a document, which is an expression representing an evaluation of the target object, based on an attribute expression that represents the property of the target object,
Attribute expression input means for inputting one attribute expression;
An expression (evaluation expression candidate) that simultaneously appears in the same sentence as the one attribute expression acquired by the attribute expression input unit is related to the appearance position of the word from the document storage unit that stores the word-delimited document prepared in advance. Evaluation expression candidate extraction means for extracting based on information;
Evaluation expression candidate storage means for storing the evaluation expression candidates in the evaluation expression candidate storage means for each sentence;
From the evaluation expression candidate storage means, using the appearance frequency of the evaluation expression candidates, evaluation expression candidate narrowing means for narrowing down the evaluation expression candidates;
For each evaluation expression candidate narrowed down by the evaluation expression candidate narrowing means, words other than the attribute expression that simultaneously appear in the same sentence as the evaluation expression candidate (co-occurrence words), based on the information about the appearance position of the word, Co-occurrence word extraction means for extracting from the document storage means storing the word-delimited document;
Co-occurrence word storage means for storing the set of co-occurrence words in the co-occurrence word storage means for each evaluation expression candidate;
An evaluation expression extracting unit that collectively extracts evaluation expression candidates having the same co-occurrence word in a predetermined number or more from the set of co-occurrence words stored in the co-occurrence word storage unit as an evaluation expression set; ,
An evaluation expression acquiring apparatus characterized by comprising:
前記評価表現候補抽出手段は、
予め用意した文書の単語自身に関する言語情報付き文書を格納した文書記憶手段から、該言語情報を利用して前記評価表現候補を抽出する手段を含み、
前記共起語抽出手段は、
前記言語情報付き文書を格納した文書記憶手段から前記言語情報を利用して前記共起語を抽出する手段を含む、
請求項11記載の評価表現獲得装置。
The evaluation expression candidate extraction means includes:
Means for extracting the evaluation expression candidate using the language information from a document storage means storing a document with language information relating to the word itself of the document prepared in advance;
The co-occurrence word extracting means includes
Means for extracting the co-occurrence word from the document storage means storing the document with language information using the language information;
The evaluation expression acquisition apparatus according to claim 11.
前記評価表現候補抽出手段は、
予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段から、該構文情報を利用して前記評価表現候補を抽出する手段を含み、
前記共起語抽出手段は、
前記構文情報付き文書を格納した文書記憶手段から、前記構文情報を利用して共起語を抽出する手段を含む、
請求項11または12記載の評価表現獲得装置。
The evaluation expression candidate extraction means includes:
Means for extracting the evaluation expression candidate using the syntax information from a document storage means storing a document with syntax information related to words of a document prepared in advance;
The co-occurrence word extracting means includes
Means for extracting a co-occurrence word from the document storage means storing the document with syntax information using the syntax information;
The evaluation expression acquisition apparatus according to claim 11 or 12.
コンピュータを、
請求項11乃至13記載の評価表現獲得装置として機能させることを特徴とする評価表現獲得プログラム。
Computer
14. An evaluation expression acquisition program that functions as the evaluation expression acquisition device according to claim 11.
JP2006064804A 2006-03-09 2006-03-09 Method for acquiring attribute expression, and method, device and program for acquiring evaluation expression Pending JP2007241765A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006064804A JP2007241765A (en) 2006-03-09 2006-03-09 Method for acquiring attribute expression, and method, device and program for acquiring evaluation expression

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006064804A JP2007241765A (en) 2006-03-09 2006-03-09 Method for acquiring attribute expression, and method, device and program for acquiring evaluation expression

Publications (1)

Publication Number Publication Date
JP2007241765A true JP2007241765A (en) 2007-09-20

Family

ID=38587230

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006064804A Pending JP2007241765A (en) 2006-03-09 2006-03-09 Method for acquiring attribute expression, and method, device and program for acquiring evaluation expression

Country Status (1)

Country Link
JP (1) JP2007241765A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012048291A (en) * 2010-08-24 2012-03-08 Dainippon Printing Co Ltd Synonym dictionary generation device, data analysis device, data detection device, synonym dictionary generation method, and synonym dictionary generation program
WO2014174797A1 (en) * 2013-04-23 2014-10-30 日本電気株式会社 Information processing system, information processing method, and storage medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012048291A (en) * 2010-08-24 2012-03-08 Dainippon Printing Co Ltd Synonym dictionary generation device, data analysis device, data detection device, synonym dictionary generation method, and synonym dictionary generation program
WO2014174797A1 (en) * 2013-04-23 2014-10-30 日本電気株式会社 Information processing system, information processing method, and storage medium

Similar Documents

Publication Publication Date Title
AU2015203818B2 (en) Providing contextual information associated with a source document using information from external reference documents
US20160299955A1 (en) Text mining system and tool
US20160140123A1 (en) Generating a query statement based on unstructured input
JP3983265B1 (en) Dictionary creation support system, method and program
JP2007141090A (en) Question answering system, data retrieval method and computer program
KR102334236B1 (en) Method and application of meaningful keyword extraction from speech-converted text data
US20120124467A1 (en) Method for automatically generating descriptive headings for a text element
KR101638535B1 (en) Method of detecting issue patten associated with user search word, server performing the same and storage medium storing the same
KR101654717B1 (en) Method for producing structured query based on knowledge database and apparatus for the same
KR101831058B1 (en) Open information extraction method and system for extracting reified ternary facts
Brooke et al. Unsupervised multiword segmentation of large corpora using prediction-driven decomposition of n-grams
JP2007140603A (en) Early adapter extraction method and device and program and topic word prediction method and device and program
JP2008262506A (en) Information extraction system, information extraction method, and information extraction program
JP2005149014A (en) Method, device and program for obtaining document related word
JP2007241765A (en) Method for acquiring attribute expression, and method, device and program for acquiring evaluation expression
JP2007164635A (en) Method, device and program for acquiring synonymous vocabulary
KR102519955B1 (en) Apparatus and method for extracting of topic keyword
JP4148247B2 (en) Vocabulary acquisition method and apparatus, program, and computer-readable recording medium
JP2009134378A (en) Document group presentation device and document group presentation program
JP4877930B2 (en) Document processing apparatus and document processing method
Toews et al. Determining Domain-Specific Differences of Polysemous Words Using Context Information.
JP2011180901A (en) Device, method and program for evaluating reusability of experience information
JP2011022809A (en) Important word extraction method, device, program, and recording medium
JP2010140107A (en) Method, apparatus, program, and computer readable recording medium for registering unknown word
JP2006331246A (en) Opinion analytical processing method, opinion analytical processing apparatus and program