JP2007241765A - Method for acquiring attribute expression, and method, device and program for acquiring evaluation expression - Google Patents
Method for acquiring attribute expression, and method, device and program for acquiring evaluation expression Download PDFInfo
- Publication number
- JP2007241765A JP2007241765A JP2006064804A JP2006064804A JP2007241765A JP 2007241765 A JP2007241765 A JP 2007241765A JP 2006064804 A JP2006064804 A JP 2006064804A JP 2006064804 A JP2006064804 A JP 2006064804A JP 2007241765 A JP2007241765 A JP 2007241765A
- Authority
- JP
- Japan
- Prior art keywords
- expression
- attribute
- evaluation
- document
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、属性表現獲得方法及び評価表現獲得方法及び装置及びプログラムに係り、特に、属性表現を基にその属性表現の評価を表す評価表現を、または、評価表現を基にその評価表現が何についての評価であるかを表す属性表現を、文書から獲得するための属性表現獲得方法及び評価表現獲得方法及び装置及びプログラムに関する。 The present invention relates to an attribute expression acquisition method, an evaluation expression acquisition method, an apparatus, and a program, and in particular, an evaluation expression that represents an evaluation of the attribute expression based on the attribute expression, or what the evaluation expression is based on the evaluation expression. The present invention relates to an attribute expression acquisition method, an evaluation expression acquisition method, an apparatus, and a program for acquiring an attribute expression indicating whether the evaluation is for a document from a document.
属性表現を基にその属性表現の評価を表す評価表現を、または、評価表現を基にその評価表現が何についての評価であるかを表す属性表現を、文書から獲得する場合、同一文内で属性表現と評価表現が同時に出現する頻度などの統計情報を利用した方法が知られている。例えば、携帯電話などの対象事物に関する評価表現(「小さい」「美しい」など)から、その対象物の性質を示す属性表現(「画面」「デザイン」など)を獲得する方法が知られている(例えば、非特許文献1参照)。
しかしながら、上記従来の評価表現を獲得する方法は、統計情報を利用しているので、頻度が少ない単語については自動で獲得することが困難である。例えば、評価表現から属性表現を獲得する場合、属性表現は非常に多種類の表現が存在するため、評価表現と属性表現の特定の組み合わせが同一文中に同時に出現する頻度が少ない属性表現も多く、このような頻度が少ない多くの属性表現を自動で獲得できない問題があった。 However, since the conventional method for obtaining an evaluation expression uses statistical information, it is difficult to automatically obtain a word with a low frequency. For example, when acquiring an attribute expression from an evaluation expression, since there are very many types of expression, there are many attribute expressions in which a specific combination of an evaluation expression and an attribute expression appears less frequently in the same sentence, There is a problem that many attribute expressions with such a low frequency cannot be automatically acquired.
本発明は、上記の点に鑑みなされたもので、頻度が少ない属性表現であっても、属性表現候補が、入力評価表現以外で同じ共起語を持つかどうかについて調べることによって、属性表現と認定でき、また、頻度が少ない評価表現であっても、評価表現候補が、入力属性表現以外で同じ共起語を持つかどうかについて調べることによって、評価表現と認定できることが可能な属性表現獲得方法及び評価表現獲得方法及び装置及びプログラムを提供することを目的とする。 The present invention has been made in view of the above points, and by examining whether an attribute expression candidate has the same co-occurrence word other than the input evaluation expression, even if the attribute expression is less frequent, Attribute expression acquisition method that can be recognized as an evaluation expression by examining whether the evaluation expression candidates have the same co-occurrence word other than the input attribute expression, even if the evaluation expression can be recognized and less frequently Another object of the present invention is to provide an evaluation expression acquisition method, apparatus, and program.
図1は、本発明の原理を説明するための図(その1)である。 FIG. 1 is a diagram (part 1) for explaining the principle of the present invention.
本発明(請求項1)は、評価表現入力手段、属性表現候補抽出手段、属性表現候補格納手段、属性表現候補絞り込み手段、共起語抽出手段、共起語格納手段、属性表現抽出手段及び複数の記憶手段を有する属性表現獲得装置における、対象事物に対して評価を表す表現である評価表現を基に、該対象事物の性質を表す属性表現を文書から獲得するための属性表現獲得方法であって、
評価表現入力手段が、1つの評価表現を入力する評価表現入力ステップ(ステップ1)と、
属性表現候補抽出手段が、評価表現入力ステップによって取得された1つの評価表現と同一文内で同時に出現する表現(属性表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段から、単語の出現位置に関する情報を基に抽出する属性表現候補抽出ステップ(ステップ2)と、
属性表現候補格納手段が、属性表現候補を文毎に属性表現候補記憶手段に格納する属性表現候補格納ステップ(ステップ3)と、
属性表現候補絞り込み手段が、属性表現候補記憶手段から属性表現候補の出現頻度を利用して、該属性表現候補を絞り込む属性表現候補絞り込みステップ(ステップ4)と、
共起語抽出手段が、属性表現候補絞り込みステップによって絞り込まれた属性表現候補毎に、該属性表現候補と同一文内で同時に出現する該評価表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、単語区切り付き文書格納した文書記憶手段から抽出する共起語抽出ステップ(ステップ5)と、
共起語格納手段が、属性表現候補毎に共起語の集合を共起語記憶手段に格納する共起語格納ステップ(ステップ6)と、
属性表現抽出手段が、共起語記憶手段に格納されている共起語の集合のうち、予め決められた数以上に同じ共起語を持つ属性表現候補をまとめて属性表現集合として抽出する属性表現抽出ステップ(ステップ7)と、を行う。
The present invention (Claim 1) includes evaluation expression input means, attribute expression candidate extraction means, attribute expression candidate storage means, attribute expression candidate narrowing means, co-occurrence word extraction means, co-occurrence word storage means, attribute expression extraction means, and a plurality of attribute expression extraction means An attribute expression acquisition method for acquiring, from a document, an attribute expression representing the property of a target object based on an evaluation expression that is an expression representing an evaluation of the target object in an attribute expression acquisition device having a storage means. And
An evaluation expression input step (step 1) in which the evaluation expression input means inputs one evaluation expression;
An attribute expression candidate extraction unit is a document storage unit that stores a word-delimited document prepared in advance as an expression (attribute expression candidate) that simultaneously appears in the same sentence as one evaluation expression acquired by the evaluation expression input step. An attribute expression candidate extraction step (step 2) for extracting based on information on the appearance position of the word;
An attribute expression candidate storage means for storing an attribute expression candidate in the attribute expression candidate storage means for each sentence in an attribute expression candidate storage step (step 3);
An attribute expression candidate narrowing-down means for narrowing down the attribute expression candidates by using the appearance frequency of the attribute expression candidates from the attribute expression candidate storage means (step 4);
For each attribute expression candidate narrowed down by the attribute expression candidate narrowing-down step, the co-occurrence word extracting means selects a word (co-occurrence word) other than the evaluation expression that simultaneously appears in the same sentence as the attribute expression candidate. A co-occurrence word extraction step (step 5) for extracting from the document storage means that stores the document with the word separator based on the information about the position;
A co-occurrence word storage means for storing a set of co-occurrence words for each attribute expression candidate in the co-occurrence word storage means (step 6);
Attribute expression extraction means extracts attribute expression candidates having the same co-occurrence word more than a predetermined number from the set of co-occurrence words stored in the co-occurrence word storage means and extracts them as an attribute expression set An expression extraction step (step 7) is performed.
また、本発明(請求項2)は、属性表現候補抽出ステップ(ステップ2)において、
属性表現候補抽出手段が、予め用意した文書の単語自身に関する言語情報を格納した言語情報付き文書を格納した文書記憶手段から、該言語情報を利用して属性表現候補を抽出するステップを行い、
共起語抽出ステップ(ステップ5)において、
共起語抽出手段が、言語情報付き文書格納した文書記憶手段から、言語情報を利用して共起語を抽出するステップを行う。
Further, the present invention (Claim 2), in the attribute expression candidate extraction step (Step 2),
The attribute expression candidate extraction means performs a step of extracting attribute expression candidates using the language information from the document storage means storing the document with language information storing the language information about the word itself of the document prepared in advance,
In the co-occurrence word extraction step (step 5),
The co-occurrence word extraction unit performs a step of extracting the co-occurrence word from the document storage unit storing the document with language information using the language information.
また、本発明(請求項3)は、属性表現候補抽出ステップ(ステップ2)において、
属性表現候補抽出手段が、予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段から、該構文情報を利用して属性表現候補を抽出するステップを行い、
共起語抽出ステップ(ステップ5)において、
共起語抽出手段が、構文情報付き文書を格納した文書記憶手段から構文情報を利用して共起語を抽出するステップを行う。
Further, the present invention (Claim 3), in the attribute expression candidate extraction step (Step 2),
The attribute expression candidate extraction means performs a step of extracting attribute expression candidates from the document storage means storing a document with syntax information related to words of a document prepared in advance using the syntax information;
In the co-occurrence word extraction step (step 5),
The co-occurrence word extraction unit performs a step of extracting the co-occurrence word using the syntax information from the document storage unit storing the document with syntax information.
図2は、本発明の原理構成図(その1)である。 FIG. 2 is a diagram illustrating the principle of the present invention (part 1).
本発明(請求項4)は、対象事物に対して評価を表す表現である評価表現を基に、該対象事物の性質を表す属性表現を文書から獲得するための属性表現獲得装置であって、
1つの評価表現を入力する評価表現入力手段110と、
評価表現入力手段110によって取得された1つの評価表現と同一文内で同時に出現する表現(属性表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段10から、単語の出現位置に関する情報を基に抽出する属性表現候補抽出手段120と、
属性表現候補を文毎に属性表現候補記憶手段20に格納する属性表現候補格納手段130と、
属性表現候補記憶手段20から属性表現候補の出現頻度を利用して、該属性表現候補を絞り込む属性表現候補絞り込み手段140と、
属性表現候補絞り込み手段140によって絞り込まれた属性表現候補毎に、該属性表現候補と同一文内で同時に出現する該評価表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、単語区切り付き文書を格納した文書記憶手段10から抽出する共起語抽出手段150と、
属性表現候補毎に共起語の集合を共起語記憶手段30に格納する共起語格納手段160と、
共起語記憶手段30に格納されている共起語の集合のうち、予め決められた数以上に同じ共起語を持つ属性表現候補をまとめて属性表現集合として抽出する属性表現抽出手段170と、を有する。
The present invention (Claim 4) is an attribute expression acquisition device for acquiring, from a document, an attribute expression that represents the property of a target object, based on an evaluation expression that is an expression that represents the evaluation of the target object.
Evaluation expression input means 110 for inputting one evaluation expression;
Expressions (attribute expression candidates) that simultaneously appear in the same sentence as one evaluation expression acquired by the evaluation
Attribute expression candidate storage means 130 for storing attribute expression candidates in the attribute expression candidate storage means 20 for each sentence;
Attribute expression candidate narrowing means 140 for narrowing down the attribute expression candidates using the appearance frequency of the attribute expression candidates from the attribute expression candidate storage means 20;
For each attribute expression candidate narrowed down by the attribute expression candidate narrowing means 140, a word (co-occurrence word) other than the evaluation expression that simultaneously appears in the same sentence as the attribute expression candidate is determined based on information on the appearance position of the word. A co-occurrence word extracting means 150 for extracting the document with word delimiter from the document storage means 10;
Co-occurrence word storage means 160 for storing a set of co-occurrence words for each attribute expression candidate in the co-occurrence word storage means 30;
An attribute
また、本発明(請求項5)は、属性表現候補抽出手段120において、
予め用意した文書の単語自身に関する言語情報付き文書を格納した文書記憶手段10から、該言語情報を利用して属性表現候補を抽出する手段を含み、
共起語抽出手段150は、
言語情報付き文書を格納した文書記憶手段10から、言語情報を利用して共起語を抽出する手段を含む。
Further, according to the present invention (Claim 5), in the attribute expression
Including means for extracting attribute expression candidates from the document storage means 10 storing a document with language information relating to the word itself of the document prepared in advance using the language information;
The co-occurrence word extraction means 150
Means for extracting a co-occurrence word using the language information from the document storage means 10 storing the document with language information;
また、本発明(請求項6)は、属性表現候補抽出手段120において、
予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段10から、該構文情報を利用して属性表現候補を抽出する手段を含み、
共起語抽出手段150は、
構文情報付き文書を格納した文書記憶手段10から構文情報を利用して共起語を抽出する手段を含む。
Further, according to the present invention (claim 6), the attribute expression
Means for extracting attribute expression candidates from the document storage means 10 storing a document with syntax information related to words of a document prepared in advance, using the syntax information;
The co-occurrence word extraction means 150
Means for extracting a co-occurrence word from the document storage means 10 storing the document with syntax information using the syntax information;
本発明(請求項7)は、コンピュータを、請求項4乃至6記載の属性表現獲得装置として機能させる属性表現獲得プログラムである。
The present invention (Claim 7) is an attribute expression acquisition program for causing a computer to function as the attribute expression acquisition apparatus according to
図3は、本発明の原理を説明するための図(その2)である。 FIG. 3 is a diagram (part 2) for explaining the principle of the present invention.
本発明(請求項8)は、属性表現入力手段、評価表現候補抽出手段、評価表現候補格納手段、評価表現候補絞り込み手段、共起語抽出手段、共起語格納手段、評価表現抽出手段及び複数の記憶手段とを有する評価表現獲得装置における、対象事物の性質を表す属性表現を基に、該対象事物に対して評価を表す表現である評価表現を文書から獲得する評価表現獲得方法であって、
属性表現入力手段が、1つの属性表現を入力する属性表現入力ステップ(ステップ11)と、
評価表現候補抽出手段が、属性表現入力ステップによって取得された1つの属性表現と同一文内で同時に出現する表現(評価表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段から単語の出現位置に関する情報を基に抽出する評価表現候補抽出ステップ(ステップ12)と、
評価表現候補格納手段が、評価表現候補を文毎に評価表現候補記憶手段に格納する評価表現候補格納ステップ(ステップ13)と、
評価表現候補絞り込み手段が、評価表現候補記憶手段から、評価表現候補の出現頻度を利用して、評価表現候補を絞り込む評価表現候補絞り込みステップ(ステップ14)と、
共起語抽出手段が、評価表現候補絞り込みステップ(ステップ14)によって絞り込まれた評価表現候補毎に、該評価表現候補と同一文内で同時に出現する属性表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、単語区切り付き文書を格納した文書記憶手段から抽出する共起語抽出ステップ(ステップ15)と、
共起語格納手段が、評価表現候補毎に共起語の集合を共起語記憶手段に格納する共起語格納ステップ(ステップ16)と、
評価表現抽出手段が、共起語記憶手段に格納されている共起語の集合のうち、予め決められた数以上に同じ共起語を持つ評価表現候補をまとめて評価表現集合として抽出する評価表現抽出ステップ(ステップ17)と、を行う。
The present invention (Claim 8) includes attribute expression input means, evaluation expression candidate extraction means, evaluation expression candidate storage means, evaluation expression candidate narrowing means, co-occurrence word extraction means, co-occurrence word storage means, evaluation expression extraction means and a plurality of An evaluation expression acquisition method for acquiring, from a document, an evaluation expression, which is an expression representing an evaluation of an object thing, based on an attribute expression representing a property of the object object in an evaluation expression acquisition apparatus having a storage means ,
An attribute expression input step (step 11) in which the attribute expression input means inputs one attribute expression;
An evaluation expression candidate extraction unit uses a word from a document storage unit storing a word-delimited document prepared in advance as an expression (evaluation expression candidate) that simultaneously appears in the same sentence as one attribute expression acquired in the attribute expression input step. An evaluation expression candidate extraction step (step 12) for extracting based on information on the appearance position of
An evaluation expression candidate storage unit (step 13) in which the evaluation expression candidate storage unit stores the evaluation expression candidate in the evaluation expression candidate storage unit for each sentence;
An evaluation expression candidate narrowing-down step (step 14) for narrowing down the evaluation expression candidates from the evaluation expression candidate storage means using the appearance frequency of the evaluation expression candidates from the evaluation expression candidate storage means;
For each evaluation expression candidate narrowed down by the evaluation expression candidate narrowing step (step 14), the co-occurrence word extracting means selects a word (co-occurrence word) other than the attribute expression that simultaneously appears in the same sentence as the evaluation expression candidate. A co-occurrence word extraction step (step 15) for extracting from the document storage means storing the document with word delimiters based on the information on the appearance position of the word;
A co-occurrence word storage means for storing a set of co-occurrence words in the co-occurrence word storage means for each evaluation expression candidate (step 16);
Evaluation in which the evaluation expression extraction unit collectively extracts evaluation expression candidates having the same co-occurrence word in a predetermined number or more from the set of co-occurrence words stored in the co-occurrence word storage unit as an evaluation expression set An expression extraction step (step 17) is performed.
また、本発明(請求項9)は、評価表現候補抽出ステップ(ステップ12)において、
評価表現候補抽出手段が、予め用意した文書の単語自身に関する言語情報を格納した言語情報付き文書を格納した文書記憶手段から、言語情報を利用して評価表現候補を抽出するステップを行い、
共起語抽出ステップ(ステップ15)において、
共起語抽出手段が、言語情報付き文書を格納した文書記憶手段から言語情報を利用して共起語を抽出するステップを行う。
Further, the present invention (Claim 9), in the evaluation expression candidate extraction step (Step 12),
The evaluation expression candidate extraction means performs a step of extracting evaluation expression candidates using the language information from the document storage means storing the document with language information storing the language information about the word itself of the prepared document,
In the co-occurrence word extraction step (step 15),
The co-occurrence word extraction unit performs a step of extracting the co-occurrence word using the language information from the document storage unit storing the document with language information.
また、本発明(請求項10)は、評価表現候補抽出ステップ(ステップ12)において、
評価表現候補抽出手段が、予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段から、該構文情報を利用して評価表現候補を抽出するステップを行い、
共起語抽出ステップ(ステップ15)において、
共起語抽出手段が、構文情報付き文書を格納した文書記憶手段から、構文情報を利用して共起語を抽出するステップを行う。
Further, the present invention (Claim 10), in the evaluation expression candidate extraction step (Step 12),
The evaluation expression candidate extraction means performs a step of extracting evaluation expression candidates using the syntax information from a document storage means storing a document with syntax information related to words of a document prepared in advance,
In the co-occurrence word extraction step (step 15),
The co-occurrence word extraction unit performs a step of extracting the co-occurrence word from the document storage unit storing the document with syntax information using the syntax information.
図4は、本発明の原理構成図(その2)である。 FIG. 4 is a principle configuration diagram (part 2) of the present invention.
本発明(請求項11)は、対象事物の性質を表す属性表現を基に、該対象事物に対して評価を表す表現である評価表現を文書から獲得する評価表現獲得装置であって、
1つの属性表現を入力する属性表現入力手段210と、
属性表現入力手段210によって取得された1つの属性表現と同一文内で同時に出現する表現(評価表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段40から、単語の出現位置に関する情報を基に抽出する評価表現候補抽出手段220と、
評価表現候補を文毎に評価表現候補記憶手段50に格納する評価表現候補格納手段230と、
評価表現候補記憶手段50から、評価表現候補の出現頻度を利用して、評価表現候補を絞り込む評価表現候補絞り込み手段240と、
評価表現候補絞り込み手段240によって絞り込まれた評価表現候補毎に、該評価表現候補と同一文内で同時に出現する属性表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、単語区切り付き文書を格納した文書記憶手段40から抽出する共起語抽出手段250と、
評価表現候補毎に共起語の集合を共起語記憶手段60に格納する共起語格納手段260と、
共起語記憶手段60に格納されている共起語の集合のうち、予め決められた数以上に同じ共起語を持つ評価表現候補をまとめて評価表現集合として抽出する評価表現抽出手段270と、を有する。
The present invention (Claim 11) is an evaluation expression acquisition device for acquiring an evaluation expression, which is an expression representing an evaluation of a target thing, from a document based on an attribute expression indicating the property of the target thing.
Attribute expression input means 210 for inputting one attribute expression;
Expressions (evaluation expression candidates) that simultaneously appear in the same sentence as one attribute expression acquired by the attribute
Evaluation expression candidate storage means 230 for storing evaluation expression candidates in the evaluation expression candidate storage means 50 for each sentence;
An evaluation expression candidate narrowing means 240 that narrows down evaluation expression candidates from the evaluation expression candidate storage means 50 by using the appearance frequency of evaluation expression candidates;
For each evaluation expression candidate narrowed down by the evaluation expression candidate narrowing means 240, a word (co-occurrence word) other than the attribute expression that simultaneously appears in the same sentence as the evaluation expression candidate is determined based on information on the appearance position of the word. A co-occurrence word extracting means 250 for extracting the document with word delimiters from the document storage means 40;
Co-occurrence word storage means 260 for storing a set of co-occurrence words for each evaluation expression candidate in the co-occurrence word storage means 60;
An evaluation
また、本発明(請求項12)は、評価表現候補抽出手段220において、
予め用意した文書の単語自身に関する言語情報付き文書を格納した文書記憶手段40から言語情報を利用して評価表現候補を抽出する手段を含み、
共起語抽出手段250は、
言語情報付き文書を格納した文書記憶手段40から言語情報を利用して共起語を抽出する手段を含む。
Further, according to the present invention (Claim 12), in the evaluation expression
Including means for extracting evaluation expression candidates using the language information from the document storage means 40 storing a document with language information relating to the word itself of the document prepared in advance,
The co-occurrence word extraction means 250
Means for extracting co-occurrence words using the language information from the document storage means 40 storing the document with language information;
また、本発明(請求項13)は、評価表現候補抽出手段220において、
予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段40から、該構文情報を利用して評価表現候補を抽出する手段を含み、
共起語抽出手段250は、
構文情報付き文書を格納した文書記憶手段40から、構文情報を利用して共起語を抽出する手段を含む。
The present invention (Claim 13) is characterized in that in the evaluation expression candidate extraction means 220,
Means for extracting evaluation expression candidates from the document storage means 40 storing a document with syntax information related to words of a document prepared in advance, using the syntax information;
The co-occurrence word extraction means 250
Means for extracting a co-occurrence word using the syntax information from the document storage means 40 storing the document with syntax information;
本発明(請求項14)は、コンピュータを、請求項11乃至13記載の評価表現獲得装置として機能させる評価表現獲得プログラムである。
The present invention (Claim 14) is an evaluation expression acquisition program that causes a computer to function as the evaluation expression acquisition device according to
上記のように本発明によれば、属性表現候補に対して、入力評価表現以外で同じ共起語を持つかどうかについて調べることによって、入力評価表現との共起頻度が少ない属性表現であっても獲得することが可能であり、また、評価表現候補に対して、入力属性表現以外で同じ共起語を持つかどうかについて調べることによって、入力属性表現との共起頻度が少ない評価表現であっても獲得することが可能であるという効果を奏する。 As described above, according to the present invention, an attribute expression having a low co-occurrence frequency with the input evaluation expression is obtained by examining whether or not the attribute expression candidate has the same co-occurrence word other than the input evaluation expression. It is also possible to obtain an evaluation expression that has a low co-occurrence frequency with the input attribute expression by examining whether the evaluation expression candidate has the same co-occurrence word other than the input attribute expression. However, there is an effect that it can be acquired.
以下、図面と共に本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[第1の実施の形態]
本発明の第1の実施の形態として、属性表現獲得装置について説明する。
[First Embodiment]
An attribute expression acquisition device will be described as a first embodiment of the present invention.
図5は、本発明の第1の実施の形態における属性表現獲得装置の基本ブロック構成図である。 FIG. 5 is a basic block configuration diagram of the attribute expression acquisition device according to the first exemplary embodiment of the present invention.
属性表現獲得装置100は、評価表現入力部110、属性表現候補抽出部120、属性表現候補格納部130、属性表現候補絞込み部140、共起語抽出部150、共起語格納部160、属性表現抽出部170、言語情報・構文情報・単語区切り付き文書記憶部10、属性表現候補記憶部20、及び共起語記憶部30から構成される。
The attribute
言語情報・構文情報・単語区切り付き文書記憶部10、属性表現候補記憶部20、及び共起語記憶部30は、ディスク装置や、メモリなどの記憶媒体である。
The language information / syntax information / word-delimited
なお、以下で用いる「属性表現」とは、例えば、入力される表現が、携帯電話などの対象事物に関する評価表現(「広い」「美しい」など)であれば、同一文内で入力評価表現と対の関係として出現する、その対象事物の性質を表す属性表現(「エリア」「画面」など)のことを指す。 The “attribute expression” used below is, for example, an input evaluation expression within the same sentence if the input expression is an evaluation expression (such as “broad” or “beautiful”) related to an object such as a mobile phone. This refers to attribute expressions (such as “area” and “screen”) that represent the properties of the target object that appear as a pair relationship.
評価表現入力部110は、1つの評価表現を入力する。
The evaluation
属性表現候補抽出部120は、評価表現入力部110によって取得された1つの評価表現と同一文内で同時に出現する表現(属性表現候補)を、予め用意した言語情報・構文情報・単語区切り付き文書記憶部10から、品詞などの単語に関する情報、係り受けなどの構文に関する情報を基に抽出する。
The attribute expression
属性表現候補格納部130は、属性表現候補を文毎に属性表現候補記憶部20に格納する。
The attribute expression
属性表現候補絞込み部140は、属性表現候補記憶部20から、属性表現候補の出現頻度を利用して、属性表現候補を絞り込む。
The attribute expression candidate narrowing-down
共起語抽出部150は、属性表現候補絞込み部140によって絞り込まれた属性表現候補毎に、属性表現候補と同一文内で同時に出現する入力評価表現以外の単語(共起語)を、予め用意した言語情報・構文情報・単語区切り付き文書記憶部10から、品詞などの単語に関する情報、係り受けなどの構文に関する情報を基に抽出する。
The co-occurrence
共起語格納部160は、属性表現候補毎に共起語の集合を共起語記憶部30に格納する。
The co-occurrence
属性表現抽出部170は、共起語記憶部30に格納されている共起語の集合のうち、予め決められた数以上同じ共起語を持つ属性表現候補をまとめて属性表現集合として抽出する。
The attribute
次に、属性表現獲得装置の動作について説明する。 Next, the operation of the attribute expression acquisition device will be described.
図6は、本発明の第1の実施の形態における属性表現獲得処理のフローチャートである。 FIG. 6 is a flowchart of attribute expression acquisition processing according to the first embodiment of this invention.
同図のフローチャートに基づいて、評価表現「多い」を入力した場合に属性表現を獲得する例について説明する。 An example of acquiring an attribute expression when an evaluation expression “many” is input will be described based on the flowchart of FIG.
図7は、本実施の形態における文ID毎の文の例であり、図8〜図10は、言語情報、構文情報、単語区切り付き文書記憶部10の内容の例を示す。
FIG. 7 is an example of a sentence for each sentence ID in the present embodiment, and FIGS. 8 to 10 show examples of contents of language information, syntax information, and word-delimited
ステップ101) 評価表現入力部110によって、1つの評価表現を入力する。
Step 101) One evaluation expression is input by the evaluation
この例の場合、「多い」が入力される。ここでは、1つの評価表現を入力しているが、予め入力する評価表現の集合をメモリやディスク等の記憶媒体に格納しておき、そこから評価表現を1つずつ入力する方法でもよい。 In this example, “many” is input. Although one evaluation expression is input here, a method may be used in which a set of evaluation expressions input in advance is stored in a storage medium such as a memory or a disk, and evaluation expressions are input one by one from there.
ステップ102) 属性表現候補抽出部120が、評価表現入力部10によって取得された1つの評価表現と同一文内で同時に出現する表現(属性表現候補)を、予め用意した言語情報、構文情報、単語区切り付き文書記憶部10から、品詞が名詞で、入力された評価表現と主語述語関係(主述関係)にある単語を抽出する。
Step 102) The linguistic information, syntax information, and words prepared in advance by the attribute expression
例えば、図7に示す文に関して、一般に知られている形態素解析器を用いて単語を区切り、言語情報として品詞を取り出し、また、一般に知られている構文解析器を用いて、構文情報として主述関係を取り出した結果を、言語情報、構文情報、単語区切り付き文書記憶部10に格納した例として図8に示す。図8の主述関係の欄「(主)」は、その単語と主語の関係にある語を示し、「(述)」は、その単語と述語の関係にある語を示す。
For example, for the sentence shown in FIG. 7, words are separated using a generally known morphological analyzer, parts of speech are extracted as linguistic information, and main sentences are described as syntactic information using a generally known parser. FIG. 8 shows an example in which the relationship retrieval result is stored in the
例えば、文ID1「きれいな画面が多い」の「画面」の述語は「多い」なので、「画面」の主述関係の欄は「(述)多い」となる。一方、同じ文の「多い」の主語は「画面」なので、「多い」の主述関係の欄は「(主)画面」と記述されている。ここでは、言語情報として品詞、構文情報として主述関係を用いて説明しているが、本発明は、形態素解析器、構文解析器によって得られ、本発明で効果のある言語情報(例えば、時制、活用など)、及び、構文情報(例えば、主辞や主文を取り出すなど)であればこれに限定しない。この例では、名詞であって、入力された評価表現「多い」と主述関係にある語を属性表現候補として抽出するので、例えば、文ID1「きれいな画面が多い」の場合、「画面」は、名詞であって入力された評価表現「多い」と主述関係にある語なので、属性表現候補として出力する。この例では、各文に対して1つの属性表現候補しかないが、抽出条件に合えば、1文から複数の属性表現候補を抽出することもできる。
For example, since the predicate of “screen” of the
ステップ103) 属性表現候補格納部130が、ステップ102で抽出された属性表現候補を文毎に属性表現候補記憶部20に格納する。
Step 103) The attribute expression
入力された評価表現が「多い」の場合に抽出された属性表現候補の結果を図11に示す。同図の「−」は、その文からは属性表現候補が抽出されなかったことを表している。 FIG. 11 shows the result of attribute expression candidates extracted when the input evaluation expression is “many”. "-" In the figure indicates that no attribute expression candidate was extracted from the sentence.
ステップ104) 属性表現候補絞り込み部140が、属性表現候補記憶部20から、1回しか出現しない属性表現候補に絞り込む。ここでは、1回としているが、これに限らず、例えば、属性表現候補全体の出現分布を参考にするなど、属性表現候補の頻度に係わる情報なら何でもよい。また、頻度が多いものは、この時点でそのまま属性表現と認定して取り出してもよい。例えば、頻度2回以上のものは、属性表現として信頼性が高いと判断する場合、図11からは、「回数」がそのまま属性表現として認定される。この場合、後述するステップ107での属性表現の抽出条件に係わらず、属性表現集合に加える。当該ステップ104において、この例の場合、属性表現候補記憶部20に格納されている図11からは、属性表現候補が「両面」と「エリア」と「ノイズ」に絞り込まれる。
Step 104) The attribute expression candidate narrowing-down
ステップ105) 共起語抽出部150が、ステップ104によって取得された属性表現候補毎に、属性表現候補と同一文内で同時に出現する入力評価表現以外の単語(共起語)を、予め用意した言語情報、構文情報、単語区切り付き文書記憶部10から、品詞が形容詞で、属性表現候補と主語述語関係(主述関係)にある単語を抽出する。
Step 105) The co-occurrence
ここでは、言語情報として品詞、構文情報として主述関係を用いて説明しているが、本発明は、形態素解析器、構文解析器によって得られ、本発明の効果のある言語情報(例えば、時制、活用など)、及び構文情報(例えば、主辞や主文を取り出すなど)であれば、これに限定しない。また、上記のステップ102で用いた情報と異なっていてもよい。
Here, the explanation is made using the part of speech as the language information and the predicate relationship as the syntax information. , Utilization, etc.) and syntactic information (for example, taking out main words and main sentences), the present invention is not limited to this. Also, it may be different from the information used in
この例では、形容詞であって、ステップ104で取り出された属性表現候補と主述関係にあり、入力された評価表現「多い」ではない語を共起語として抽出するので、例えば、図7に示す文ID6「この機種の画面は美しい」の場合、「美しい」は形容詞であって、属性表現候補「画面」と主述関係にある語で、入力された評価表現「多い」とは違う語なので、共起語として抽出する。図8〜図10に示す言語情報、構文情報、単語区切り付き文書記憶部10の例からは、図12に示す共起語が抽出される。この例では、1文に付き1つしか抽出されていないが、抽出条件に合えば複数の共起語を抽出することもできる。
In this example, words that are adjectives and have a predicate relationship with the attribute expression candidates extracted in step 104 and are not input as many evaluation expressions are extracted as co-occurrence words. In the case of the
ステップ106) 共起語格納部160が、属性表現候補毎に共起語の集合を共起語記憶部30に格納する。この例の場合、上記のステップ105で抽出された共起語は、図13に示すように属性表現候補毎に共起語の集合が共起語記憶部30に格納される。
Step 106) The co-occurrence
ステップ107) 属性表現抽出部170が、共起語記憶部30に格納されている共起語の集合のうち、1つ以上同じ共起語を持つ属性表現候補をまとめて属性表現集合として抽出する。
Step 107) The attribute
この例では、共起語記憶部30に格納されている図13の共起集合から、属性表現候補「画面」と「エリア」に対して、少なくとも1つの同じ共起語「広い」が格納されているので、属性表現集合として「画面」と「エリア」が抽出される。「ノイズ」は、抽出条件に合わないので抽出されない。この例では、同じ共起語の数を1つ以上としたが、整数であればこれに限らず指定できる。また、ステップ104で既に属性表現と認定された語を、無条件にステップ107で抽出された属性表現集合に追加することもできる。例えば、ステップ104で、2回以上出現した属性表現候補を属性表現と認定するならば、図11の例では「回数」が属性表現集合に加わる。
In this example, from the co-occurrence set of FIG. 13 stored in the co-occurrence
このように、入力された評価表現と属性表現候補の組み合わせが同一文内で低頻度でしか出現しなくても、属性表現候補が入力評価表現以外で同じ共起語を持つかどうかについて調べることによって属性表現と認定し、属性表現集合を獲得することができる。 In this way, even if the combination of the input evaluation expression and the attribute expression candidate appears only infrequently in the same sentence, check whether the attribute expression candidate has the same co-occurrence word other than the input evaluation expression. It can be recognized as an attribute expression, and an attribute expression set can be acquired.
[第2の実施の形態]
以下に、本発明の第2の実施の形態として、評価表現獲得装置について説明する。
[Second Embodiment]
Hereinafter, an evaluation expression acquisition apparatus will be described as a second embodiment of the present invention.
図14は、本発明の第2の実施の形態における評価表現獲得装置の基本ブロック構成図である。 FIG. 14 is a basic block configuration diagram of the evaluation expression acquiring apparatus according to the second embodiment of the present invention.
評価表現獲得装置200は、属性表現入力部210、評価表現候補抽出部220、評価表現候補格納部230、評価表現候補絞り込み部240、共起語抽出部250、共起語格納部260、評価表現抽出部270、言語情報・構文情報・単語区切り付き文書記憶部40、評価表現候補記憶部50、共起語記憶部60から構成される。
The evaluation
上記の言語情報・構文情報・単語区切り付き文書記憶部40、評価表現候補記憶部50、共起語記憶部60は、ディスク装置や、メモリなどの記憶媒体である。
The language information / syntax information / word-delimited
属性表現入力部210は、1つの属性表現を入力する。
The attribute
評価表現候補抽出部220は、1つの属性表現と同一文内で同時に出現する表現(評価表現候補)を、予め用意した言語情報・構文情報・単語区切り付き文書記憶部40から、品詞などの単語に関する情報、係り受けなどの構文に関する情報を基に抽出する。
The evaluation expression
評価表現候補格納部230は、評価表現候補を文毎に評価表現候補記憶部50に格納する。
The evaluation expression
評価表現候補絞り込み部240は、評価表現候補記憶部50から評価表現候補の出現頻度を利用して、評価表現候補を絞り込む。
The evaluation expression
共起語抽出部250は、評価表現候補絞り込み部240によって絞り込まれた評価表現候補毎に、評価表現候補と同一文内で同時に出現する入力属性表現以外の単語(共起語)を、予め用意した言語情報・構文情報・単語区切り付き文書記憶部40から、品詞などの単語に関する情報、係り受けなどの構文に関する情報を基に抽出する。
The co-occurrence
共起語格納部260は、評価表現候補毎に共起語の集合を共起語記憶部60に格納する。
The co-occurrence
評価表現抽出部270は、共起語記憶部60に格納されている共起語の集合のうち、予め決められた数以上同じ共起語を持つ評価表現候補をまとめて評価表現集合として抽出する。
The evaluation
次に、評価表現獲得装置200の動作について説明する。
Next, the operation of the evaluation
図15は、本発明の第2の実施の形態における評価表現獲得処理のフローチャートである。同図のフローチャートに基づいて、属性表現「動作」を入力した場合に評価表現を獲得する例を説明する。 FIG. 15 is a flowchart of evaluation expression acquisition processing according to the second embodiment of this invention. An example of obtaining an evaluation expression when an attribute expression “operation” is input will be described based on the flowchart of FIG.
ステップ201) 属性表現入力部210が1つの属性表現を入力する。
Step 201) The attribute
この例の場合、「動作」が入力される。ここでは、1つの属性表現を入力しているが、予め入力する属性表現の集合をメモリやディスク等の記憶媒体に格納しておき、そこから属性表現を1つずつ入力する方法でもよい。 In this example, “operation” is input. Here, one attribute expression is input, but a method may be used in which a set of attribute expressions to be input in advance is stored in a storage medium such as a memory or a disk, and the attribute expressions are input one by one from there.
ステップ202) 評価表現候補抽出部220が、属性表現入力部210によって取得された1つの属性表現と同一文内で同時に出現する表現(評価表現候補)を、予め用意した言語情報・構文情報・単語区切り付き文書記憶部40から、品詞が形容詞で、入力された属性表現と主語述語関係(主述関係)にある単語を抽出する。例えば、図16に示す文に関して、一般に知られている形態素解析器、構文解析器を用いて単語を区切り、言語情報として品詞、構文情報として主述関係を取り出した結果を、言語情報・構文情報・単語区切り付き文書記憶部40に格納した例として図17〜図19に示す。言語情報・構文情報・単語区切り付き文書記憶部40は、図8〜図10と同様に、図17〜図19の主述関係の欄「(主)」は、その単語と主語の関係にある語を示し、「(述)」は、その単語の述語の関係にある語を示す。例えば、文ID1「フォーカスの動作が速い」の「動作」の述語は「速い」なので、「動作」の主述関係の欄は、「(述)速い」となる。一方、同じ文の「速い」の主語は「動作」なので、「速い」の主述関係の欄は「(主)動作」と記述されている。
Step 202) Language expression / syntax information / word prepared in advance by the evaluation expression
ここでは、言語情報として品詞、構文情報として主述関係を用いて説明しているが、本発明は、形態素解析器、構文解析器によって得られ、本発明で効果のある言語情報(例えば、時制、活用など)、及び、構文情報(例えば、主辞や主文を取り出すなど)であればこれに限定しない。この例では、形容詞であって、入力された属性表現「動作」と主述関係にある語を評価表現候補として抽出するので、例えば、文ID1「フォーカスの動作が速い」の場合、「速い」は、形容詞であって入力された属性表現「動作」と主述関係にある語なので評価表現候補として抽出する。この例では、各文に対して1つの評価表現候補しかないが、抽出条件に合えば1文から複数の評価表現候補を抽出することもできる。
Here, the explanation is made by using the part of speech as the language information and the predicate relationship as the syntax information. However, the present invention is obtained by a morphological analyzer and a syntax analyzer and is effective in the present invention (for example, tense). , Utilization, etc.) and syntax information (for example, taking out a main word and a main sentence) is not limited to this. In this example, an adjective and a word that has a main predicative relationship with the input attribute expression “motion” are extracted as evaluation expression candidates. For example, in the case of
ステップ203) 評価表現候補格納部230が、ステップ202で抽出された評価表現候補を文毎に評価表現候補記憶部50に格納する。入力された属性表現が「動作」の場合に抽出された評価表現候補の結果を図20に示す。図20の「−」は、その文からは評価表現候補が抽出されなかったことを表している。
Step 203) The evaluation expression
ステップ204) 評価表現候補絞り込み部240が、評価表現候補記憶部50から、1回しか出現しない評価表現候補に絞り込む。ここでは1回としているが、これに限らず、例えば、評価表現候補全体の出現分布を参考にするなど、評価表現候補の頻度に係わる情報なら何でもよい。また、頻度の多いものは、この時点でそのまま評価表現と認定して取り出してもよい。例えば、頻度2回以上のものは、評価表現として信頼性が高いと判断する場合、図20からは「速い」がそのまま評価表現として認定される。この場合、後述するステップ207での評価表現の抽出条件にかかわらず評価表現集合に加える。ステップ204において、この例の場合、評価表現候補記憶部50に格納されている図20の内容からは、評価表現候補が「鈍い」と「遅い」と「重い」に絞り込まれる。
Step 204) The evaluation expression candidate narrowing-down
ステップ205) 共起語抽出部260が、ステップ204によって取得された評価表現候補毎に、評価表現候補と同一文内で同時に出現する入力属性表現以外の単語(共起語)を、予め用意した言語情報・構文情報・単語区切り付き文書記憶部40から、品詞が名詞で、評価表現候補と主語述語関係(主述関係)にある単語を抽出する。
Step 205) The co-occurrence
ここでは、言語情報として品詞、構文情報として主述関係を用いて説明しているが、本発明は、形態素解析器、構文解析器によって得られ、本発明で効果のある言語情報(例えば、時制、活用など)、及び構文情報(例えば、主辞や主文を取り出すなど)であれば、これに限定しない。また、ステップ202で用いた情報と異なっていてもよい。この例では、名詞であって、ステップ204で取り出された評価表現候補と主述関係にあり、入力された属性表現「動作」ではない語を共起語として抽出するので、例えば、文ID6「ボタンの反応が鈍い」の場合「反応」は、名詞であって、評価表現候補「鈍い」と主述関係にある語で、入力された属性表現「動作」とは違う語なので、共起語として抽出する。図17〜図19の例からは図21に示す共起語が抽出される。この例では、1文に付き1つしか抽出されていないが、抽出条件に合えば、複数の共起語を抽出することもできる。
Here, the explanation is made by using the part of speech as the language information and the predicate relationship as the syntax information. However, the present invention is obtained by a morphological analyzer and a syntax analyzer and is effective in the present invention (for example, tense). , Utilization, etc.) and syntactic information (for example, taking out main words and main sentences), the present invention is not limited to this. Further, it may be different from the information used in
ステップ206) 共起語格納部260が、評価表現候補毎に共起語の集合を共起語記憶部60に格納する。この例の場合、ステップ205で抽出された共起語は、図22に示すように評価表現候補毎に共起語の集合が共起語記憶部60に格納される。
Step 206) The co-occurrence
ステップ207) 評価表現抽出部270が、共起語記憶部60に格納されている共起語集合のうち、1つ以上同じ共起語を持つ評価表現候補をまとめて評価表現集合として抽出する。この例では、共起語記憶部60に格納されている図22に示す内容から、評価表現候補「鈍い」と「遅い」に対して、少なくとも1つの同じ共起語「反応」が格納されているので、評価表現集合として「鈍い」と「遅い」が抽出される。「重い」は、抽出条件に合わないので抽出されない。この例では、同じ共起語の数を1つ以上としたが、整数であれば、これに限らず指定できる。また、上記のステップ204で既に評価表現と認定された語を、無条件に当該ステップ207で抽出された評価表現集合に追加することもできる。例えば、ステップ204で、2回以上出現した評価表現候補を評価表現と認定するならば、図20の例では、「速い」が評価表現集合に加わる。
Step 207) The evaluation
このように、入力された属性表現と評価表現候補の組み合わせが同一文内で低頻度でしか出現しなくても、評価表現候補が、入力属性表現以外で同じ共起語を持つかどうかについて調べることによって評価表現と認定し、評価表現集合を獲得する事ができる。 In this way, even if the combination of the input attribute expression and the evaluation expression candidate appears only infrequently in the same sentence, it is checked whether the evaluation expression candidate has the same co-occurrence word other than the input attribute expression. It can be recognized as an evaluation expression and an evaluation expression set can be obtained.
なお、上記の第1の実施の形態及び第2の形態の機能をプログラムとして実現してもよい。 The functions of the first embodiment and the second embodiment described above may be realized as a program.
つまり、上記の第1の実施の形態では、属性表現を獲得するプログラムとして、1つの評価表現を入力する評価表現入力手順と、その評価表現入力手順によって取得された1つの評価表現と同一文内で同時に出現する単語(属性表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶部から単語の出現位置に関する情報を基に抽出する属性表現候補抽出手順と、その属性表現候補を文毎に属性表現候補記憶部に格納する属性表現候補格納手順と、その属性表現候補記憶部から属性表現候補の出現頻度を利用して属性表現候補を絞り込む属性表現候補絞り込み手順と、その属性表現候補絞り込み手順によって絞り込まれた属性表現候補毎に、その属性表現候補と同一文内で同時に出現する入力評価表現以外の語(共起語)を、単語の出現位置に関する情報を基に予め用意した単語区切り付き文書を格納した文書記憶部から抽出する共起語抽出手順と、その属性表現候補毎に共起語の集合を共起語記憶部に格納する共起語格納手順と、その共起語記憶部に格納されている共起語の集合の内、予め決められた数以上同じ共起語を持つ属性表現候補をまとめて属性表現集合として抽出する属性表現抽出手順と、をコンピュータに実行させることで実現できる。 That is, in the first embodiment described above, as a program for acquiring attribute expressions, an evaluation expression input procedure for inputting one evaluation expression, and one evaluation expression acquired by the evaluation expression input procedure in the same sentence Attribute expression candidate extraction procedure for extracting words (attribute expression candidates) that appear at the same time from a document storage unit storing a word-delimited document prepared in advance based on information on the appearance position of the word, and the attribute expression candidates as sentences Attribute expression candidate storage procedure for storing each attribute expression candidate in the attribute expression candidate storage unit, attribute expression candidate narrowing procedure for narrowing down attribute expression candidates using the frequency of appearance of attribute expression candidates from the attribute expression candidate storage unit, and the attribute expression candidates For each attribute expression candidate narrowed down by the narrowing-down procedure, a word (co-occurrence word) other than the input evaluation expression that appears simultaneously in the same sentence as the attribute expression candidate A co-occurrence word extraction procedure for extracting from a document storage unit storing a word-delimited document prepared in advance based on information on the appearance position, and a set of co-occurrence words for each attribute expression candidate are stored in the co-occurrence word storage unit From the co-occurrence word storage procedure and a set of co-occurrence words stored in the co-occurrence word storage unit, attribute expression candidates having the same co-occurrence word for a predetermined number or more are collectively extracted as an attribute expression set. This can be realized by causing the computer to execute the attribute expression extraction procedure.
また、上記の属性表現候補抽出手順に、予め用意した文書の単語自身に関する言語情報を格納した文書記憶部から、その言語情報を利用して属性表現候補を抽出する手順を含み、上記共起語抽出手順に予め用意した文書記憶部からその言語情報を利用して、共起語を抽出する手順を含むプログラムとしてもよい。 The attribute expression candidate extraction procedure includes a procedure of extracting attribute expression candidates from a document storage unit storing language information related to a word of a document prepared in advance using the language information, and the co-occurrence word A program including a procedure for extracting co-occurrence words using the language information from a document storage unit prepared in advance for the extraction procedure may be used.
また、上記の属性表現候補抽出手順に、予め用意した文書の単語間に係わる構文情報を格納した文書記憶部からその構文情報を利用して、属性表現候補を抽出する手順を含み、上記の共起語抽出手順に、予め用意した文書の単語間に係わる構文情報が格納された文書記憶部から、その構文情報を利用して、共起語を抽出する手順を含むプログラムとしてもよい。 The attribute expression candidate extraction procedure includes a procedure for extracting attribute expression candidates from a document storage unit storing syntax information related to words of a document prepared in advance using the syntax information. The word extraction procedure may be a program including a procedure for extracting a co-occurrence word from a document storage unit storing syntax information related to words in a document prepared in advance using the syntax information.
また、上記の第2の実施の形態における評価表現を獲得するプログラムとして、1つの属性表現を入力する属性表現入力手順と、その属性表現入力手順によって取得された1つの属性表現と同一文内で同時に出現する単語(評価表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶部から単語の出現位置に関する情報を基に抽出する評価表現候補抽出手順と、その評価表現候補記憶部に格納する評価表現候補格納手順と、その評価表現候補記憶部から評価表現候補の出現頻度を利用して、評価表現候補を絞り込む評価表現候補絞り込み手順と、その評価表現候補絞り込み手順によって絞り込まれた評価表現候補毎に、その評価表現候補と同一文内で同時に出現する入力属性表現以外の語(共起語)を、単語の出現位置に関する情報を基に、予め用意した単語区切り付き文書記憶媒体から抽出する共起語抽出手順と、その評価表現候補毎に共起語の集合を共起語記憶部に格納する共起語格納手順と、その共起語記憶部に格納されている共起語の集合のうち、予め決められた数以上同じ共起語を持つ評価表現候補をまとめて評価表現集合として抽出する評価表現抽出手順とを、コンピュータに実行させることで実現する。 In addition, as a program for acquiring an evaluation expression in the second embodiment, an attribute expression input procedure for inputting one attribute expression and an attribute expression acquired by the attribute expression input procedure in the same sentence An evaluation expression candidate extraction procedure for extracting simultaneously appearing words (evaluation expression candidates) from a document storage unit storing a word-delimited document prepared in advance based on information on the appearance position of the word, and the evaluation expression candidate storage unit Evaluation expression candidate storing procedure to be stored, evaluation expression candidate narrowing procedure for narrowing down evaluation expression candidates using the appearance frequency of evaluation expression candidates from the evaluation expression candidate storage unit, and evaluation narrowed down by the evaluation expression candidate narrowing procedure For each expression candidate, a word (co-occurrence word) other than the input attribute expression that appears simultaneously in the same sentence as the evaluation expression candidate is related to the appearance position of the word. A co-occurrence word extraction procedure for extracting from a document storage medium with word breaks prepared in advance, and a co-occurrence word storage procedure for storing a set of co-occurrence words for each evaluation expression candidate in the co-occurrence word storage unit; And an evaluation expression extraction procedure for extracting evaluation expression candidates having the same co-occurrence word more than a predetermined number from the set of co-occurrence words stored in the co-occurrence word storage unit as an evaluation expression set. This is realized by causing the computer to execute.
また、上記の評価表現候補抽出手順に、予め用意した文書の単語自身に関する言語情報が格納された文書記憶部から、その言語情報を利用して評価表現候補を抽出する手順を含み、上記共起語抽出手順に、予め用意した文書の単語自身に関する言語情報が格納された文書記憶部から、その言語情報を利用して、共起語を抽出する手順を含むプログラムとしてもよい。 Further, the evaluation expression candidate extraction procedure includes a procedure for extracting evaluation expression candidates from a document storage unit storing language information about a word of a document prepared in advance using the language information. The word extraction procedure may be a program including a procedure for extracting co-occurrence words from a document storage unit in which language information about a word of a document prepared in advance is stored.
また、上記の評価表現候補抽出手順に、予め用意した文書の単語間に係わる構文情報を格納した文書記憶部から、その構文情報を利用して評価表現候補を抽出する手順を含み、上記の共起語抽出手順に、予め用意した文書の単語間に係わる構文情報を格納した文書記憶部から、その構文情報を利用して共起語を抽出する手順を含むプログラムとしてもよい。 The evaluation expression candidate extraction procedure includes a procedure for extracting evaluation expression candidates from a document storage unit storing syntax information related to words of a document prepared in advance, using the syntax information. The word extraction procedure may be a program including a procedure for extracting a co-occurrence word from a document storage unit storing syntax information related to words of a document prepared in advance using the syntax information.
また、上記のプログラムを、ハードディスクや、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。 Further, the above program can be stored in a portable storage medium such as a hard disk, a flexible disk, or a CD-ROM, and can be installed or distributed in a computer.
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。 The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.
本発明は、文書から対象事物の属性表現・評価表現を抽出するための技術に適用可能である。 The present invention can be applied to a technique for extracting an attribute expression / evaluation expression of an object from a document.
10 文書記憶手段、言語情報・構文情報・単語区切り付き文書記憶部
20 属性表現候補記憶手段、属性表現候補記憶部
30 共起語記憶手段、共起語記憶部
40 文書記憶手段、言語情報・構文情報・単語区切り付き文書記憶部
50 評価表現候補記憶手段、評価表現候補記憶部
60 共起語記憶手段、共起語記憶部
100 属性表現獲得装置
110 評価表現入力手段、評価表現入力部
120 属性表現候補抽出手段、属性表現候補抽出部
130 属性表現候補格納手段、属性表現候補格納部
140 属性表現候補絞り込み手段、属性表現候補絞り込み部
150 共起語抽出手段、共起語抽出部
160 共起語格納手段、共起語格納部
170 属性表現抽出手段、属性表現抽出部
200 評価表現獲得装置
210 属性表現入力手段、属性表現入力部
220 評価表現候補抽出手段、評価表現候補抽出部
230 評価表現候補格納手段、評価表現候補格納部
240 評価表現候補絞り込み手段、評価表現候補絞り込み部
250 共起語抽出手段、共起語抽出部
260 共起語格納手段、共起語格納部
270 評価表現抽出手段、評価表現抽出部
10. Document storage means, linguistic information / syntax information / document delimited
Claims (14)
前記評価表現入力手段が、1つの評価表現を入力する評価表現入力ステップと、
前記属性表現候補抽出手段が、前記評価表現入力ステップによって取得された前記1つの評価表現と同一文内で同時に出現する表現(属性表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段から、単語の出現位置に関する情報を基に抽出する属性表現候補抽出ステップと、
前記属性表現候補格納手段が、前記属性表現候補を文毎に属性表現候補記憶手段に格納する属性表現候補格納ステップと、
前記属性表現候補絞り込み手段が、前記属性表現候補記憶手段から前記属性表現候補の出現頻度を利用して、該属性表現候補を絞り込む属性表現候補絞り込みステップと、
前記共起語抽出手段が、前記属性表現候補絞り込みステップによって絞り込まれた属性表現候補毎に、該属性表現候補と同一文内で同時に出現する該評価表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、前記単語区切り付き文書格納した文書記憶手段から抽出する共起語抽出ステップと、
前記共起語格納手段が、前記属性表現候補毎に前記共起語の集合を共起語記憶手段に格納する共起語格納ステップと、
前記属性表現抽出手段が、前記共起語記憶手段に格納されている前記共起語の集合のうち、予め決められた数以上に同じ共起語を持つ属性表現候補をまとめて属性表現集合として抽出する属性表現抽出ステップと、
を行うことを特徴とする属性表現獲得方法。 Attribute expression acquisition means having evaluation expression input means, attribute expression candidate extraction means, attribute expression candidate storage means, attribute expression candidate narrowing means, co-occurrence word extraction means, co-occurrence word storage means, attribute expression extraction means, and a plurality of storage means An attribute expression acquisition method for acquiring, from a document, an attribute expression that represents a property of a target object based on an evaluation expression that is an expression that represents an evaluation of the target object in the device,
An evaluation expression input step in which the evaluation expression input means inputs one evaluation expression;
Document storage in which the attribute expression candidate extraction unit stores a word-delimited document prepared in advance for expressions (attribute expression candidates) that simultaneously appear in the same sentence as the one evaluation expression acquired in the evaluation expression input step Means for extracting an attribute expression candidate based on information on the appearance position of the word;
The attribute expression candidate storage means stores the attribute expression candidates in the attribute expression candidate storage means for each sentence, and an attribute expression candidate storage step;
The attribute expression candidate narrowing-down means uses the appearance frequency of the attribute expression candidates from the attribute expression candidate storage means to narrow down the attribute expression candidates, and
For each attribute expression candidate narrowed down by the attribute expression candidate narrowing-down step, the co-occurrence word extracting means selects a word (co-occurrence word) other than the evaluation expression that simultaneously appears in the same sentence as the attribute expression candidate. A co-occurrence word extraction step for extracting from the document storage means that stores the document with the word separator based on the information on the appearance position of
The co-occurrence word storage means stores a set of the co-occurrence words in the co-occurrence word storage means for each attribute expression candidate; and
The attribute expression extraction unit collects attribute expression candidates having the same co-occurrence word more than a predetermined number from the set of co-occurrence words stored in the co-occurrence word storage unit as an attribute expression set. An attribute expression extraction step to extract;
Attribute expression acquisition method characterized by performing
前記属性表現候補抽出手段が、予め用意した文書の単語自身に関する言語情報を格納した言語情報付き文書を格納した文書記憶手段から、該言語情報を利用して前記属性表現候補を抽出するステップを行い、
前記共起語抽出ステップにおいて、
前記共起語抽出手段が、前記言語情報付き文書格納した文書記憶手段から、前記言語情報を利用して前記共起語を抽出するステップを行う、
請求項1記載の属性表現獲得方法。 In the attribute expression candidate extraction step,
The attribute expression candidate extraction unit performs a step of extracting the attribute expression candidate from the document storage unit storing a document with language information storing language information about a word of the document prepared in advance using the language information. ,
In the co-occurrence word extraction step,
The co-occurrence word extraction means performs a step of extracting the co-occurrence word from the document storage means storing the document with language information using the language information.
The attribute expression acquisition method according to claim 1.
前記属性表現候補抽出手段が、予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段から、該構文情報を利用して前記属性表現候補を抽出するステップを行い、
前記共起語抽出ステップにおいて、
前記共起語抽出手段が、前記構文情報付き文書を格納した文書記憶手段から前記構文情報を利用して前記共起語を抽出するステップを行う
請求項1または2記載の属性表現獲得方法。 In the attribute expression candidate extraction step,
The attribute expression candidate extraction unit performs a step of extracting the attribute expression candidate from the document storage unit storing a document with syntax information related to words of a document prepared in advance using the syntax information;
In the co-occurrence word extraction step,
The attribute expression acquisition method according to claim 1 or 2, wherein the co-occurrence word extraction unit performs the step of extracting the co-occurrence word using the syntax information from a document storage unit storing the document with syntax information.
1つの評価表現を入力する評価表現入力手段と、
前記評価表現入力手段によって取得された前記1つの評価表現と同一文内で同時に出現する表現(属性表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段から、単語の出現位置に関する情報を基に抽出する属性表現候補抽出手段と、
前記属性表現候補を文毎に属性表現候補記憶手段に格納する属性表現候補格納手段と、
前記属性表現候補記憶手段から前記属性表現候補の出現頻度を利用して、該属性表現候補を絞り込む属性表現候補絞り込み手段と、
前記属性表現候補絞り込み手段によって絞り込まれた属性表現候補毎に、該属性表現候補と同一文内で同時に出現する該評価表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、前記単語区切り付き文書を格納した文書記憶手段から抽出する共起語抽出手段と、
前記属性表現候補毎に前記共起語の集合を共起語記憶手段に格納する共起語格納手段と、
前記共起語記憶手段に格納されている前記共起語の集合のうち、予め決められた数以上に同じ共起語を持つ属性表現候補をまとめて属性表現集合として抽出する属性表現抽出手段と、
を有することを特徴とする属性表現獲得装置。 An attribute expression acquisition device for acquiring, from a document, an attribute expression that represents a property of the target object, based on an evaluation expression that is an expression indicating evaluation of the target object,
An evaluation expression input means for inputting one evaluation expression;
Expressions (attribute expression candidates) that appear simultaneously in the same sentence as the one evaluation expression acquired by the evaluation expression input unit are related to the appearance position of the word from the document storage unit that stores the word-delimited document prepared in advance. Attribute expression candidate extraction means for extracting based on information;
Attribute expression candidate storage means for storing the attribute expression candidates in the attribute expression candidate storage means for each sentence;
Attribute expression candidate narrowing means for narrowing down the attribute expression candidates using the appearance frequency of the attribute expression candidates from the attribute expression candidate storage means;
For each attribute expression candidate narrowed down by the attribute expression candidate narrowing means, a word (co-occurrence word) other than the evaluation expression that appears at the same time in the same sentence as the attribute expression candidate is determined based on information on the appearance position of the word. , Co-occurrence word extraction means for extracting from the document storage means storing the word-delimited document;
Co-occurrence word storage means for storing the set of co-occurrence words in the co-occurrence word storage means for each attribute expression candidate;
Attribute expression extraction means for collectively extracting attribute expression candidates having the same co-occurrence word in a predetermined number or more from the set of co-occurrence words stored in the co-occurrence word storage means as an attribute expression set; ,
An attribute expression acquisition device characterized by comprising:
予め用意した文書の単語自身に関する言語情報付き文書を格納した文書記憶手段から、該言語情報を利用して前記属性表現候補を抽出する手段を含み、
前記共起語抽出手段は、
前記言語情報付き文書を格納した文書記憶手段から、前記言語情報を利用して前記共起語を抽出する手段を含む
請求項4記載の属性表現獲得装置。 The attribute expression candidate extraction means includes:
Means for extracting the attribute expression candidate from the document storage means storing a document with language information relating to the word itself of the document prepared in advance, using the language information;
The co-occurrence word extracting means includes
5. The attribute expression acquisition apparatus according to claim 4, further comprising means for extracting the co-occurrence word using the language information from a document storage means storing the document with language information.
予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段から、該構文情報を利用して前記属性表現候補を抽出する手段を含み、
前記共起語抽出手段は、
前記構文情報付き文書を格納した文書記憶手段から前記構文情報を利用して前記共起語を抽出する手段を含む
請求項4または5記載の属性表現獲得装置。 The attribute expression candidate extraction means includes:
Means for extracting the attribute expression candidate from the document storage means storing the document with syntax information related to the words of the document prepared in advance, using the syntax information;
The co-occurrence word extracting means includes
6. The attribute expression acquisition apparatus according to claim 4, further comprising means for extracting the co-occurrence word using the syntax information from a document storage means storing the document with syntax information.
請求項4乃至6記載の属性表現獲得装置として機能させることを特徴とする属性表現獲得プログラム。 Computer
An attribute expression acquisition program that functions as the attribute expression acquisition device according to claim 4.
前記属性表現入力手段が、1つの属性表現を入力する属性表現入力ステップと、
前記評価表現候補抽出手段が、前記属性表現入力ステップによって取得された前記1つの属性表現と同一文内で同時に出現する表現(評価表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段から単語の出現位置に関する情報を基に抽出する評価表現候補抽出ステップと、
前記評価表現候補格納手段が、前記評価表現候補を文毎に評価表現候補記憶手段に格納する評価表現候補格納ステップと、
前記評価表現候補絞り込み手段が、前記評価表現候補記憶手段から、前記評価表現候補の出現頻度を利用して、評価表現候補を絞り込む評価表現候補絞り込みステップと、
前記共起語抽出手段が、前記評価表現候補絞り込みステップによって絞り込まれた評価表現候補毎に、該評価表現候補と同一文内で同時に出現する属性表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、前記単語区切り付き文書を格納した文書記憶手段から抽出する共起語抽出ステップと、
前記共起語格納手段が、前記評価表現候補毎に前記共起語の集合を共起語記憶手段に格納する共起語格納ステップと、
前記評価表現抽出手段が、前記共起語記憶手段に格納されている前記共起語の集合のうち、予め決められた数以上に同じ共起語を持つ評価表現候補をまとめて評価表現集合として抽出する評価表現抽出ステップと、
を行うことを特徴とする評価表現獲得方法。 Evaluation expression acquisition having attribute expression input means, evaluation expression candidate extraction means, evaluation expression candidate storage means, evaluation expression candidate narrowing means, co-occurrence word extraction means, co-occurrence word storage means, evaluation expression extraction means, and a plurality of storage means An evaluation expression acquisition method for acquiring, from a document, an evaluation expression, which is an expression representing an evaluation of an object thing, based on an attribute expression representing a property of the object object in the apparatus,
An attribute expression input step in which the attribute expression input means inputs one attribute expression;
Document storage in which the evaluation expression candidate extraction unit stores a word-delimited document prepared in advance for an expression (evaluation expression candidate) that simultaneously appears in the same sentence as the one attribute expression acquired in the attribute expression input step. An evaluation expression candidate extraction step for extracting from the information on the appearance position of the word from the means;
The evaluation expression candidate storage means for storing the evaluation expression candidates in the evaluation expression candidate storage means for each sentence;
The evaluation expression candidate narrowing-down means uses the appearance frequency of the evaluation expression candidates from the evaluation expression candidate storage means to narrow down the evaluation expression candidates, and
For each evaluation expression candidate narrowed down by the evaluation expression candidate narrowing-down step, the co-occurrence word extracting means calculates a word (co-occurrence word) other than the attribute expression that simultaneously appears in the same sentence as the evaluation expression candidate. A co-occurrence word extraction step for extracting from the document storage means storing the word-delimited document based on the information on the appearance position;
The co-occurrence word storage means stores the set of co-occurrence words in the co-occurrence word storage means for each evaluation expression candidate;
The evaluation expression extraction means collectively sets evaluation expression candidates having the same co-occurrence words in a predetermined number or more out of the set of co-occurrence words stored in the co-occurrence word storage means as an evaluation expression set. An evaluation expression extraction step to be extracted;
The evaluation expression acquisition method characterized by performing.
前記評価表現候補抽出手段が、予め用意した文書の単語自身に関する言語情報を格納した言語情報付き文書を格納した文書記憶手段から該言語情報を利用して前記評価表現候補を抽出するステップを行い、
前記共起語抽出ステップにおいて、
前記共起語抽出手段が、前記言語情報付き文書を格納した文書記憶手段から前記言語情報を利用して共起語を抽出するステップを行う、
請求項8記載の評価表現獲得方法。 In the evaluation expression candidate extraction step,
The evaluation expression candidate extraction unit performs a step of extracting the evaluation expression candidate using the language information from a document storage unit that stores a document with language information that stores language information about a word of the document prepared in advance.
In the co-occurrence word extraction step,
The co-occurrence word extracting means performs a step of extracting a co-occurrence word using the language information from a document storage means storing the document with language information.
The evaluation expression acquisition method according to claim 8.
前記評価表現候補抽出手段が、予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段から、該構文情報を利用して前記評価表現候補を抽出するステップを行い、
前記共起語抽出ステップにおいて、
前記共起語抽出手段が、前記構文情報付き文書を格納した文書記憶手段から、前記構文情報を利用して前記共起語を抽出するステップを行う、
請求項8または9記載の評価表現獲得方法。 In the evaluation expression candidate extraction step,
The evaluation expression candidate extraction unit performs a step of extracting the evaluation expression candidate using the syntax information from a document storage unit that stores a document with syntax information related to words of a document prepared in advance.
In the co-occurrence word extraction step,
The co-occurrence word extraction means performs a step of extracting the co-occurrence word from the document storage means storing the document with syntax information using the syntax information.
The evaluation expression acquisition method according to claim 8 or 9.
1つの属性表現を入力する属性表現入力手段と、
前記属性表現入力手段によって取得された前記1つの属性表現と同一文内で同時に出現する表現(評価表現候補)を、予め用意した単語区切り付き文書を格納した文書記憶手段から、単語の出現位置に関する情報を基に抽出する評価表現候補抽出手段と、
前記評価表現候補を文毎に評価表現候補記憶手段に格納する評価表現候補格納手段と、
前記評価表現候補記憶手段から、前記評価表現候補の出現頻度を利用して、該評価表現候補を絞り込む評価表現候補絞り込み手段と、
前記評価表現候補絞り込み手段によって絞り込まれた評価表現候補毎に、該評価表現候補と同一文内で同時に出現する属性表現以外の単語(共起語)を、単語の出現位置に関する情報を基に、前記単語区切り付き文書を格納した文書記憶手段から抽出する共起語抽出手段と、
前記評価表現候補毎に前記共起語の集合を共起語記憶手段に格納する共起語格納手段と、
前記共起語記憶手段に格納されている前記共起語の集合のうち、予め決められた数以上に同じ共起語を持つ評価表現候補をまとめて評価表現集合として抽出する評価表現抽出手段と、
を有することを特徴とする評価表現獲得装置。 An evaluation expression acquisition device that acquires an evaluation expression from a document, which is an expression representing an evaluation of the target object, based on an attribute expression that represents the property of the target object,
Attribute expression input means for inputting one attribute expression;
An expression (evaluation expression candidate) that simultaneously appears in the same sentence as the one attribute expression acquired by the attribute expression input unit is related to the appearance position of the word from the document storage unit that stores the word-delimited document prepared in advance. Evaluation expression candidate extraction means for extracting based on information;
Evaluation expression candidate storage means for storing the evaluation expression candidates in the evaluation expression candidate storage means for each sentence;
From the evaluation expression candidate storage means, using the appearance frequency of the evaluation expression candidates, evaluation expression candidate narrowing means for narrowing down the evaluation expression candidates;
For each evaluation expression candidate narrowed down by the evaluation expression candidate narrowing means, words other than the attribute expression that simultaneously appear in the same sentence as the evaluation expression candidate (co-occurrence words), based on the information about the appearance position of the word, Co-occurrence word extraction means for extracting from the document storage means storing the word-delimited document;
Co-occurrence word storage means for storing the set of co-occurrence words in the co-occurrence word storage means for each evaluation expression candidate;
An evaluation expression extracting unit that collectively extracts evaluation expression candidates having the same co-occurrence word in a predetermined number or more from the set of co-occurrence words stored in the co-occurrence word storage unit as an evaluation expression set; ,
An evaluation expression acquiring apparatus characterized by comprising:
予め用意した文書の単語自身に関する言語情報付き文書を格納した文書記憶手段から、該言語情報を利用して前記評価表現候補を抽出する手段を含み、
前記共起語抽出手段は、
前記言語情報付き文書を格納した文書記憶手段から前記言語情報を利用して前記共起語を抽出する手段を含む、
請求項11記載の評価表現獲得装置。 The evaluation expression candidate extraction means includes:
Means for extracting the evaluation expression candidate using the language information from a document storage means storing a document with language information relating to the word itself of the document prepared in advance;
The co-occurrence word extracting means includes
Means for extracting the co-occurrence word from the document storage means storing the document with language information using the language information;
The evaluation expression acquisition apparatus according to claim 11.
予め用意した文書の単語間に係わる構文情報付き文書を格納した文書記憶手段から、該構文情報を利用して前記評価表現候補を抽出する手段を含み、
前記共起語抽出手段は、
前記構文情報付き文書を格納した文書記憶手段から、前記構文情報を利用して共起語を抽出する手段を含む、
請求項11または12記載の評価表現獲得装置。 The evaluation expression candidate extraction means includes:
Means for extracting the evaluation expression candidate using the syntax information from a document storage means storing a document with syntax information related to words of a document prepared in advance;
The co-occurrence word extracting means includes
Means for extracting a co-occurrence word from the document storage means storing the document with syntax information using the syntax information;
The evaluation expression acquisition apparatus according to claim 11 or 12.
請求項11乃至13記載の評価表現獲得装置として機能させることを特徴とする評価表現獲得プログラム。 Computer
14. An evaluation expression acquisition program that functions as the evaluation expression acquisition device according to claim 11.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006064804A JP2007241765A (en) | 2006-03-09 | 2006-03-09 | Method for acquiring attribute expression, and method, device and program for acquiring evaluation expression |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006064804A JP2007241765A (en) | 2006-03-09 | 2006-03-09 | Method for acquiring attribute expression, and method, device and program for acquiring evaluation expression |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007241765A true JP2007241765A (en) | 2007-09-20 |
Family
ID=38587230
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006064804A Pending JP2007241765A (en) | 2006-03-09 | 2006-03-09 | Method for acquiring attribute expression, and method, device and program for acquiring evaluation expression |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007241765A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012048291A (en) * | 2010-08-24 | 2012-03-08 | Dainippon Printing Co Ltd | Synonym dictionary generation device, data analysis device, data detection device, synonym dictionary generation method, and synonym dictionary generation program |
WO2014174797A1 (en) * | 2013-04-23 | 2014-10-30 | 日本電気株式会社 | Information processing system, information processing method, and storage medium |
-
2006
- 2006-03-09 JP JP2006064804A patent/JP2007241765A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012048291A (en) * | 2010-08-24 | 2012-03-08 | Dainippon Printing Co Ltd | Synonym dictionary generation device, data analysis device, data detection device, synonym dictionary generation method, and synonym dictionary generation program |
WO2014174797A1 (en) * | 2013-04-23 | 2014-10-30 | 日本電気株式会社 | Information processing system, information processing method, and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2015203818B2 (en) | Providing contextual information associated with a source document using information from external reference documents | |
US20160299955A1 (en) | Text mining system and tool | |
US20160140123A1 (en) | Generating a query statement based on unstructured input | |
JP3983265B1 (en) | Dictionary creation support system, method and program | |
JP2007141090A (en) | Question answering system, data retrieval method and computer program | |
KR102334236B1 (en) | Method and application of meaningful keyword extraction from speech-converted text data | |
US20120124467A1 (en) | Method for automatically generating descriptive headings for a text element | |
KR101638535B1 (en) | Method of detecting issue patten associated with user search word, server performing the same and storage medium storing the same | |
KR101654717B1 (en) | Method for producing structured query based on knowledge database and apparatus for the same | |
KR101831058B1 (en) | Open information extraction method and system for extracting reified ternary facts | |
Brooke et al. | Unsupervised multiword segmentation of large corpora using prediction-driven decomposition of n-grams | |
JP2007140603A (en) | Early adapter extraction method and device and program and topic word prediction method and device and program | |
JP2008262506A (en) | Information extraction system, information extraction method, and information extraction program | |
JP2005149014A (en) | Method, device and program for obtaining document related word | |
JP2007241765A (en) | Method for acquiring attribute expression, and method, device and program for acquiring evaluation expression | |
JP2007164635A (en) | Method, device and program for acquiring synonymous vocabulary | |
KR102519955B1 (en) | Apparatus and method for extracting of topic keyword | |
JP4148247B2 (en) | Vocabulary acquisition method and apparatus, program, and computer-readable recording medium | |
JP2009134378A (en) | Document group presentation device and document group presentation program | |
JP4877930B2 (en) | Document processing apparatus and document processing method | |
Toews et al. | Determining Domain-Specific Differences of Polysemous Words Using Context Information. | |
JP2011180901A (en) | Device, method and program for evaluating reusability of experience information | |
JP2011022809A (en) | Important word extraction method, device, program, and recording medium | |
JP2010140107A (en) | Method, apparatus, program, and computer readable recording medium for registering unknown word | |
JP2006331246A (en) | Opinion analytical processing method, opinion analytical processing apparatus and program |