JP2001297100A - Device for supporting refining of keyword extraction rule - Google Patents
Device for supporting refining of keyword extraction ruleInfo
- Publication number
- JP2001297100A JP2001297100A JP2000114320A JP2000114320A JP2001297100A JP 2001297100 A JP2001297100 A JP 2001297100A JP 2000114320 A JP2000114320 A JP 2000114320A JP 2000114320 A JP2000114320 A JP 2000114320A JP 2001297100 A JP2001297100 A JP 2001297100A
- Authority
- JP
- Japan
- Prior art keywords
- rule
- keyword
- presented
- expression
- keyword extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、例えば表現のパタ
ーンマッチングにより文書中からキーワードを抽出する
キーワード抽出装置で用いられるキーワード抽出ルール
の精製(強化及び緩和)を支援するキーワード抽出ルール
精製支援装置や記憶媒体に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a keyword extraction rule refining support apparatus for supporting the refining (enhancement and relaxation) of a keyword extraction rule used in a keyword extraction apparatus for extracting a keyword from a document by, for example, pattern matching of expressions. It relates to a storage medium.
【0002】[0002]
【従来の技術】例えばパターンやキーワード抽出ルール
の生成を行う技術として、次のようなものがある。一例
として、特開平7−262189号公報(以下、文献1
と言う)に記載された文型パタン抽出装置では、テキス
トから文型パターンを抽出して統合する。ここでの文型
とは出現順のパターンである。2. Description of the Related Art For example, there are the following techniques for generating patterns and keyword extraction rules. As an example, JP-A-7-262189 (hereinafter referred to as Document 1)
The sentence pattern extraction device described in (1) extracts and integrates a sentence pattern from a text. Here, the sentence pattern is a pattern in the order of appearance.
【0003】また、例えば特開平9−6796号公報
(以下、文献2と言う)に記載された照合パターン生成
方法及び装置では、或る目的に対してユーザが適合/不
適合の判断を与え、各々の文書集合からパターンを自動
抽出する。また、特開平10−21249号公報(以
下、文献3と言う)に記載されたキーワード抽出ルール
生成方法では、文書を構造化するために用いるキーワー
ドの抽出ルールを自動生成し、与えられた出力書式定義
から抽出する文字列の条件を自動生成する。Further, in a method and apparatus for generating a matching pattern described in, for example, Japanese Patent Application Laid-Open No. 9-6796 (hereinafter referred to as Document 2), a user gives a judgment of conformity / non-conformity for a certain purpose, and Automatically extract patterns from a set of documents. Also, in the keyword extraction rule generation method described in Japanese Patent Application Laid-Open No. H10-21249 (hereinafter referred to as Reference 3), a keyword extraction rule used for structuring a document is automatically generated, and a given output format is provided. Automatically generate string conditions to be extracted from definitions.
【0004】ここで、上記文献1に記載された技術は、
文書からパターンを抽出するものである。パターンを抽
出するのみであり、それがどのようなことを意図するパ
ターンであるかは示されない。パターンの統合は複数の
ルールのマージであり、精製をしているわけではない。
また、上記文献2に記載された技術は、或る視点に対し
てユーザが適合/不適合の判断を与え、適合文書の集合
と不適合文書の集合からパターンを自動生成するもので
ある。しかし、この技術によって得られたパターンは或
る視点のみに特化されたものであり、その視点のみに固
有のものである保証はなく、しかもキーワードを抽出で
きるものではない。[0004] Here, the technology described in the above document 1 is as follows.
This is to extract a pattern from a document. It only extracts patterns and does not indicate what they are intended to be. Pattern unification is the merging of multiple rules, not refinement.
Further, the technique described in the above-mentioned document 2 is one in which a user gives a judgment of conformity / non-conformity to a certain viewpoint, and a pattern is automatically generated from a set of conforming documents and a set of non-conforming documents. However, the pattern obtained by this technique is specialized only for a certain viewpoint, there is no guarantee that the pattern is unique only to that viewpoint, and furthermore, no keyword can be extracted.
【0005】また、上記文献3に記載された技術は、文
書を構造化するためのキーワード抽出ルール生成技術で
あるが、ルールは語の出現順に依存するものである。あ
くまでも名前、日時などの構造を構成する属性毎のキー
ワード抽出であり、「問題」「要望」など視点別のキー
ワードを抽出するものではない。また、既存ルールを後
の文書に合わせて精製することはできない。以上のよう
に、パターンやキーワード抽出ルールを自動で生成する
技術はあるが、随時その精度が上がるような補正を支援
する技術はない。[0005] The technique described in Document 3 is a technique for generating a keyword extraction rule for structuring a document. The rule depends on the order in which words appear. It is a keyword extraction for each attribute constituting the structure such as a name and a date and time, and does not extract a keyword for each viewpoint such as “problem” or “request”. Also, existing rules cannot be refined for later documents. As described above, there is a technique for automatically generating a pattern or a keyword extraction rule, but there is no technique for supporting correction such that the accuracy is increased as needed.
【0006】[0006]
【発明が解決しようとする課題】上記従来例で示したよ
うに、従来では、キーワード抽出装置で用いられるキー
ワード抽出ルールの精製(強化及び緩和)を支援する技術
がなかったため、一旦生成されたキーワード抽出ルール
の精度を向上させることができないといった不具合があ
り、具体的には、例えばキーワード抽出装置における視
点別、意味的なキーワードの抽出ルールに対して、文書
に応じた精製の支援ができないといった不具合があっ
た。As shown in the above-mentioned conventional example, there is no conventional technique for supporting refinement (enhancement and relaxation) of a keyword extraction rule used in a keyword extraction apparatus. There is a problem that the accuracy of the extraction rule cannot be improved. Specifically, for example, a problem that the keyword extraction device cannot support refining according to the document for the viewpoint-specific and semantic keyword extraction rules. was there.
【0007】本発明は、上記のような従来の事情を鑑み
てなされたもので、例えば表現のパターンマッチングに
より文書中からキーワードを抽出するキーワード抽出装
置で用いられるキーワード抽出ルールの精製(強化及び
緩和)を支援することができるキーワード抽出ルール精
製支援装置や記憶媒体を提供することを目的とする。The present invention has been made in view of the above-mentioned conventional circumstances, and for example, refines (enhances and relaxes) a keyword extraction rule used in a keyword extraction device that extracts a keyword from a document by pattern matching of expression. It is an object of the present invention to provide a keyword extraction rule refining support device and a storage medium that can support (1).
【0008】[0008]
【課題を解決するための手段】上記目的を達成するた
め、本発明に係るキーワード抽出ルール精製支援装置で
は、次のようにして、所定のルールに基づいて文書から
キーワードを抽出するキーワード抽出装置の当該ルール
を精製することを支援する。ここで、ルールは、第1キ
ーワード群に含まれる第1キーワードに該当する語と第
2キーワード群に含まれる第2キーワードに該当する語
とが所定の関係をもって出現する文書中の表現から所定
のキーワードを抽出することを規定する。In order to achieve the above object, a keyword extraction rule refining support apparatus according to the present invention provides a keyword extraction apparatus for extracting keywords from a document based on a predetermined rule as follows. Help refine the rules. Here, the rule is based on the expression in the document in which a word corresponding to the first keyword included in the first keyword group and a word corresponding to the second keyword included in the second keyword group appear in a predetermined relationship. Specifies that keywords are extracted.
【0009】すなわち、提示手段がルールに適合した表
現及び当該ルールをユーザに提示し、受付手段が提示し
た表現に対して提示したルールを不適用とする指示をユ
ーザから受け付け、当該指示を受け付けた場合には、制
約強化手段が提示した表現に対して提示したルールが不
適用となるように当該ルールを変更する。従って、例え
ばユーザが提示された表現に対して提示されたルールを
不適用とする旨を判断した場合には、当該ユーザからの
このような指示に合うように当該ルールが変更されるた
め、ルールを強化する方向での当該ルールの精製を支援
することができる。That is, the presenting means presents to the user an expression conforming to the rule and the rule, and accepts from the user an instruction to apply the rule presented to the expression presented by the accepting means, and accepts the instruction. In this case, the rule is changed so that the rule presented to the expression presented by the constraint strengthening means is not applied. Therefore, for example, if the user determines that the presented rule is not applicable to the presented expression, the rule is changed to match such an instruction from the user. This can assist in refining the rule in the direction of strengthening.
【0010】また、好ましい態様として、上記のような
キーワード抽出ルール精製支援装置では、制約強化手段
は、提示した表現中の提示したルールに適合する語に該
当するキーワードを当該ルールで規定される当該語に対
応したキーワード群から削除することにより、提示した
表現に対して提示したルールが不適用となるようにす
る。In a preferred aspect, in the keyword extraction rule refining support device as described above, the constraint strengthening means includes a keyword corresponding to a word in the presented expression that matches the presented rule, defined by the rule. By deleting from the keyword group corresponding to the word, the presented rule is not applied to the presented expression.
【0011】また、他の好ましい態様として、上記のよ
うなキーワード抽出ルール精製支援装置では、制約強化
手段は、提示した表現中の提示したルールに適合する語
に該当するキーワードを下位概念の複数のキーワードへ
変換し、これら下位概念の複数のキーワードの中で当該
語に該当するキーワードを当該ルールで規定される当該
語に対応したキーワード群から削除することにより、提
示した表現に対して提示したルールが不適用となるよう
にする。[0011] In another preferred embodiment, in the keyword extraction rule refining support device as described above, the constraint strengthening means converts a keyword corresponding to a word that matches the presented rule in the presented expression into a plurality of subordinate concepts. Converted into keywords and deleted from the keyword group corresponding to the word specified by the rule among the plurality of keywords of these lower concepts, the rule presented for the presented expression Is not applicable.
【0012】また、本発明に係るキーワード抽出ルール
精製支援装置では、次のようにして、所定のルールに基
づいて文書からキーワードを抽出するキーワード抽出装
置の当該ルールを精製することを支援する。ここで、ル
ールは、第1キーワード群に含まれる第1キーワードに
該当する語と第2キーワード群に含まれる第2キーワー
ドに該当する語とが所定の関係をもって出現する文書中
の表現から所定のキーワードを抽出することを規定す
る。Further, the keyword extraction rule refining support device according to the present invention supports refining the rule of the keyword extraction device for extracting a keyword from a document based on a predetermined rule as follows. Here, the rule is based on the expression in the document in which a word corresponding to the first keyword included in the first keyword group and a word corresponding to the second keyword included in the second keyword group appear in a predetermined relationship. Specifies that keywords are extracted.
【0013】すなわち、提示手段がルールで規定される
第1キーワード及び第2キーワード及び関係の内の2つ
のみに適合した表現及び当該ルールをユーザに提示し、
受付手段が提示した表現に対して提示したルールを適用
する指示をユーザから受け付け、当該指示を受け付けた
場合には、制約緩和手段が提示した表現に対して提示し
たルールが適用されるように当該ルールを変更する。従
って、例えばユーザが提示された表現に対して提示され
たルールを適用する旨を判断した場合には、当該ユーザ
からのこのような指示に合うように当該ルールが変更さ
れるため、ルールを緩和する方向での当該ルールの精製
を支援することができる。[0013] That is, the presenting means presents to the user an expression that matches only two of the first keyword, the second keyword, and the relation defined by the rule, and the rule,
An instruction to apply the rule presented to the expression presented by the accepting means is received from the user, and when the instruction is accepted, the instruction is applied so that the rule presented to the expression presented by the constraint relaxation means is applied. Change rules. Therefore, for example, when the user determines that the presented rule is to be applied to the presented expression, the rule is changed to match such an instruction from the user, and the rule is relaxed. This can assist in refining the rule in the direction in which it is performed.
【0014】また、好ましい態様として、本発明に係る
キーワード抽出ルール精製支援装置では、制約緩和手段
は、提示した表現中の提示したルールに不適合であった
語の概念を示すキーワードを当該ルールで規定される当
該語に対応したキーワード群に追加することにより、提
示した表現に対して提示したルールが適用されるように
する。[0014] In a preferred embodiment, in the keyword extraction rule refining support device according to the present invention, the constraint relaxation means defines a keyword indicating a concept of a word in the presented expression that does not conform to the presented rule by the rule. By adding it to a keyword group corresponding to the word, the presented rule is applied to the presented expression.
【0015】また、他の好ましい態様として、本発明に
係るキーワード抽出ルール精製支援装置では、制約緩和
手段は、提示した表現中の提示したルールに不適合であ
った語の概念を示すキーワードと当該ルールで規定され
る当該語に対応したキーワード群中のキーワードとの共
通上位概念を示すキーワードに当該キーワード群中の当
該キーワードを置き換えることにより、提示した表現に
対して提示したルールが適用されるようにする。In another preferred embodiment, in the keyword extraction rule refining support device according to the present invention, the constraint relaxation means includes a keyword indicating a concept of a word in the presented expression that does not conform to the presented rule and the rule. By replacing the keyword in the keyword group with a keyword indicating a common superordinate concept with the keyword in the keyword group corresponding to the word specified in, the rule presented to the presented expression is applied. I do.
【0016】また、他の好ましい態様として、本発明に
係るキーワード抽出ルール精製支援装置では、制約緩和
手段は、提示した表現中の提示したルールに不適合であ
った語を当該ルールで規定される当該語に対応したキー
ワード群に追加することにより、提示した表現に対して
提示したルールが適用されるようにする。In another preferred embodiment, in the keyword extraction rule refining support device according to the present invention, the constraint relaxation means converts a word in the presented expression that does not conform to the presented rule into a word specified by the rule. By adding to the keyword group corresponding to the word, the presented rule is applied to the presented expression.
【0017】また、他の好ましい態様として、本発明に
係るキーワード抽出ルール精製支援装置では、制約緩和
手段は、提示した表現中の提示したルールに不適合であ
った語と当該ルールで規定される当該語に対応したキー
ワード群中の表層的なキーワードとの共通上位概念を示
すキーワードに当該表層的なキーワードを置き換えるこ
とにより、提示した表現に対して提示したルールが適用
されるようにする。In another preferred aspect, in the keyword extraction rule refining support device according to the present invention, the constraint relaxation means includes a word in the presented expression that does not conform to the presented rule and a word defined by the rule. By replacing the superficial keyword with a keyword indicating a common superordinate concept with the superficial keyword in the keyword group corresponding to the word, the presented rule is applied to the presented expression.
【0018】また、本発明に係るキーワード抽出ルール
精製支援装置では、マージ手段がルールで規定される第
1キーワード群及び第2キーワード群及び関係の内の1
つのみが異なる複数のルールを、当該異なる部分を総和
した1つのルールへ変換する。従って、例えば複数のル
ールの内容を実質的に変更することなく、これら複数の
ルールを1つのルールへ置き換えることができるため、
ルールを整理して当該ルールを記憶するメモリの記憶容
量を削減すること等ができる。Further, in the keyword extraction rule refining support device according to the present invention, the merging means includes one of the first keyword group, the second keyword group, and the relation defined by the rule.
A plurality of different rules are converted into a single rule obtained by summing the different portions. Therefore, for example, these rules can be replaced with one rule without substantially changing the contents of the rules,
The rules can be arranged to reduce the storage capacity of a memory for storing the rules.
【0019】また、以上に示したような本発明に係る各
種の処理は、例えば記憶媒体に記憶されたプログラムを
コンピュータにより読み取って実行することにより実現
することも可能である。一例として、本発明に係る記憶
媒体は、コンピュータに実行させるプログラムを当該コ
ンピュータの入力手段が読取可能に記憶しており、第1
キーワード群に含まれる第1キーワードに該当する語と
第2キーワード群に含まれる第2キーワードに該当する
語とが所定の関係をもって出現する表現から所定のキー
ワードを抽出するルールに基づいて文書からキーワード
を抽出するキーワード抽出装置の当該ルールを精製する
ことを支援するために用いられ、当該プログラムは、ル
ールに適合した表現及び当該ルールをユーザに提示する
処理と、提示した表現に対して提示したルールを不適用
とする指示をユーザから受け付ける処理と、当該指示を
受け付けた場合に提示した表現に対して提示したルール
が不適用となるように当該ルールを変更する処理とを当
該コンピュータに実行させる。The various processes according to the present invention as described above can also be realized by, for example, reading and executing a program stored in a storage medium by a computer. As an example, the storage medium according to the present invention stores a program to be executed by a computer so that the input means of the computer can read the program.
A keyword is extracted from a document based on a rule for extracting a predetermined keyword from an expression in which a word corresponding to a first keyword included in a keyword group and a word corresponding to a second keyword included in a second keyword group appear with a predetermined relationship. Is used to assist in refining the rules of the keyword extraction device that extracts the rules. The program includes an expression that matches the rules, a process of presenting the rules to the user, and a rule that is presented for the presented expressions. The computer causes the computer to execute a process of receiving an instruction to apply the rule from the user and a process of changing the rule so that the rule presented for the expression presented when the instruction is received is not applied.
【0020】また、同様に、本発明に係る記憶媒体は、
コンピュータに実行させるプログラムを当該コンピュー
タの入力手段が読取可能に記憶しており、第1キーワー
ド群に含まれる第1キーワードに該当する語と第2キー
ワード群に含まれる第2キーワードに該当する語とが所
定の関係をもって出現する表現から所定のキーワードを
抽出するルールに基づいて文書からキーワードを抽出す
るキーワード抽出装置の当該ルールを精製することを支
援するために用いられ、当該プログラムは、ルールで規
定される第1キーワード及び第2キーワード及び関係の
内の2つのみに適合した表現及び当該ルールをユーザに
提示する処理と、提示した表現に対して提示したルール
を適用する指示をユーザから受け付ける処理と、当該指
示を受け付けた場合に提示した表現に対して提示したル
ールが適用されるように当該ルールを変更する処理とを
当該コンピュータに実行させる。Similarly, the storage medium according to the present invention comprises:
A program to be executed by the computer is stored readable by the input means of the computer, and a word corresponding to the first keyword included in the first keyword group and a word corresponding to the second keyword included in the second keyword group are stored. Is used to assist in refining the rules of a keyword extraction device that extracts keywords from a document based on rules that extract predetermined keywords from expressions that appear with a predetermined relationship. A process of presenting to the user an expression that matches only two of the first keyword, the second keyword, and the relationship to be performed, and a process of receiving from the user an instruction to apply the rule presented to the presented expression And the rule presented to the expression presented when the instruction is received is applied And a process of changing the urchin the rule is executed on the computer.
【0021】[0021]
【発明の実施の形態】本発明に係る実施例を図面を参照
して説明する。まず、本発明の適用対象となるキーワー
ド抽出装置の一例を示しておく。なお、キーワード抽出
装置では例えばテキストを含む文書から予め用意された
キーワード抽出ルールとシソーラスを用いてその文書の
特徴を示すキーワードを自動抽出することが行われ、本
発明に係るキーワード抽出ルール精製装置ではこのよう
なキーワード抽出ルールの精製を支援することを行う。
ここで、キーワード抽出ルールは表現パターンに基づく
ものであり、係り受け関係などを利用することができ
る。以下では、係り受け関係を用いた場合を例として説
明を行う。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment according to the present invention will be described with reference to the drawings. First, an example of a keyword extraction device to which the present invention is applied will be described. In the keyword extraction device, for example, a keyword indicating a characteristic of the document is automatically extracted from a document including text using a keyword extraction rule and a thesaurus prepared in advance. The refinement of such a keyword extraction rule is supported.
Here, the keyword extraction rule is based on an expression pattern, and can use a dependency relationship or the like. In the following, a case where the dependency relationship is used will be described as an example.
【0022】図11には、係り受け関係を用いた場合に
おけるキーワード抽出装置の構成例を示してあり、この
キーワード抽出装置では、文書群保持装置1がキーワー
ド抽出ルール生成の対象となる文書群を保持し、係り受
け解析装置2が文書群保持装置1によって保持される文
書に対して係り受け解析処理を施し、パターンマッチン
グ装置3が係り受け解析結果に対してキーワード抽出ル
ール保持装置4によって保持されるキーワード抽出ルー
ルとのパターンマッチングを行う。また、キーワード抽
出ルール保持装置4は予め用意されたキーワード抽出ル
ールを保持しており、シソーラス5は語の階層構造をデ
ータとして保持している。FIG. 11 shows an example of the configuration of a keyword extraction device in the case of using a dependency relationship. In this keyword extraction device, the document group holding device 1 stores a document group for which a keyword extraction rule is to be generated. The dependency analysis device 2 performs the dependency analysis process on the document held by the document group holding device 1, and the pattern matching device 3 holds the result of the dependency analysis by the keyword extraction rule holding device 4. Pattern matching with the keyword extraction rules. The keyword extraction rule holding device 4 holds keyword extraction rules prepared in advance, and the thesaurus 5 holds the hierarchical structure of words as data.
【0023】次に、本発明の第1実施例に係るキーワー
ド抽出ルール精製支援装置を説明する。なお、本例で
は、ルールの制約を強化することを支援する装置(キー
ワード抽出ルール制約強化支援装置)を示す。図1に
は、本例に係るキーワード抽出ルール精製支援装置を組
み込んだキーワード抽出装置の一例を示してあり、この
装置には、例えば上記図11に示したものと同様な機能
を有する文書群保持装置1や係り受け解析装置2やパタ
ーンマッチング装置3やキーワード抽出ルール保持装置
4やシソーラス5と、本例の特徴的な構成部分であるキ
ーワード抽出ルール制約強化装置6とが備えられてい
る。なお、上記図11に示したものと同様な機能を有す
る構成部分1〜5については、同図に示したのと同じ符
号を用いて示してある。Next, a keyword extraction rule refinement support apparatus according to a first embodiment of the present invention will be described. In this example, a device (keyword extraction rule constraint strengthening support device) that supports strengthening of rule constraints is shown. FIG. 1 shows an example of a keyword extraction device incorporating the keyword extraction rule refining support device according to the present embodiment. This device has, for example, a document group holding function similar to that shown in FIG. The apparatus 1 includes a device 1, a dependency analysis device 2, a pattern matching device 3, a keyword extraction rule holding device 4, a thesaurus 5, and a keyword extraction rule constraint strengthening device 6, which is a characteristic component of the present embodiment. Components 1 to 5 having the same functions as those shown in FIG. 11 are denoted by the same reference numerals as those shown in FIG.
【0024】文書群保持装置1は、例えばルール精製の
対象となる文書群の入力を受け、それを保持する機能を
有している。本例では、文書群は複数の文書からなり、
各文書はテキストを含む。また、テキストは1個以上の
文によって構成される。以下では、次の文1〜文4を各
々含む文書1〜文書4を適用して「問題」を示すキーワ
ードを抽出ルールによって抽出する場合を例として示
す。なお、この場合、各々のテキストの各形態素の要素
位置は図2に示した通りであるとする。The document group holding device 1 has a function of receiving, for example, a document group to be subjected to rule refining and holding it. In this example, the document group consists of multiple documents,
Each document contains text. The text is composed of one or more sentences. Hereinafter, a case will be described as an example in which documents 1 to 4 including the following sentences 1 to 4 are applied to extract a keyword indicating “problem” by an extraction rule. In this case, it is assumed that the element position of each morpheme of each text is as shown in FIG.
【0025】 文1:ヨコの解像はできない。 文2:ヨコの解像はできる。 文3:バインダーののり付け部分にスキマができない。 文4:出力のスタックができない。Sentence 1: Horizontal resolution is not possible. Sentence 2: Horizontal resolution is possible. Statement 3: There is no gap at the glued portion of the binder. Statement 4: Cannot stack output.
【0026】係り受け解析装置2は、例えば文書群保持
装置1によって保持される文書に対して係り受け解析処
理を施して、得られた全ての係り受け関係のデータを保
持する機能を有している。なお、係り受け解析の技術と
しては、例えばキーワード抽出ルールに適合した表現を
発見することができるようなものであれば、種々なもの
が用いられてもよく、一例として、「野村浩郷: 自然言
語処理の基礎技術, 電子情報通信学会編, コロナ社, 19
88.」に開示されている公知の係り受け解析技術を利用
することができる。The dependency analysis device 2 has a function of performing a dependency analysis process on a document held by, for example, the document group holding device 1 and holding all obtained dependency relationship data. I have. As the technique of dependency analysis, for example, various techniques may be used as long as it is possible to find an expression that conforms to the keyword extraction rule. For example, “Hirogo Nomura: Nature Basic technology of language processing, IEICE, Corona, 19
88. "can be used.
【0027】係り側と受け側の要素は一文中の形態素出
現位置で表現され、次の形の組で保持される。 (fp, r, bp) ここで、fpと bpは各々係り側と受け側に関する文書中
での出現位置を示し、rは当該係り側と当該受け側との
間の関係を示す。The elements on the participant side and the receiving side are expressed by morpheme appearance positions in one sentence, and are held in the following pairs. (fp, r, bp) where fp and bp indicates the appearance position in the document relating to the dependent party and the recipient, respectively, and r indicates the relationship between the concerned party and the recipient.
【0028】上記した文1の場合には、係り受け関係を
解析することによって得られる係り受け関係は次の2つ
の通りである。なお、“(否)”は、その形態素(ここ
では、“でき”)に続く付属語の表現(ここでは、“な
い”)が否定の意味を持つことを示す。 (1, の, 3) ・・関係1 (3, は, 5(否)) ・・関係2In the case of the sentence 1, the dependency relation obtained by analyzing the dependency relation is as follows. Note that “(No)” indicates that the expression of the attached word (here, “none”) following the morpheme (here, “can”) has a negative meaning. (1, of 3) ・ ・ Relation 1 (3, is 5 (No)) ・ ・ Relation 2
【0029】また、文2の場合には、係り受け関係を解
析することによって得られる係り受け関係は次の2つの
通りである。 (1, の, 3) ・・関係3 (3, は, 5) ・・関係4In the case of sentence 2, the dependency relation obtained by analyzing the dependency relation is as follows. (1, of 3) ... Relation 3 (3, 5) ... Relation 4
【0030】また、文3の場合には、係り受け関係を解
析することによって得られる係り受け関係は次の4つの
通りである。なお、“無”は、2つの形態素(ここで
は、“のり付け”と“部分”)の間の関係を示す語が無
いことを示す。 (1, の, 3) ・・関係5 (3, (無), 4) ・・関係6 (4, に, 8(否)) ・・関係7 (6, が, 8(否)) ・・関係8In the case of sentence 3, the dependency relation obtained by analyzing the dependency relation is as follows. Note that "absence" indicates that there is no word indicating the relationship between two morphemes (here, "paste" and "part"). (1, 3) ・ ・ Relation 5 (3, (No), 4) ・ ・ Relation 6 (4, 2, 8 (No)) ・ ・ Relation 7 (6, 8 (No)) ・ ・Relationship 8
【0031】また、文4の場合には、係り受け関係を解
析することによって得られる係り受け関係は次の2つの
通りである。 (1, の, 3) ・・関係9 (3, が, 5(否)) ・・関係10 また、以上と同様に、各々の文書群の他の文書に対して
もこのような解析処理を施す。In the case of sentence 4, the dependency relation obtained by analyzing the dependency relation is as follows. (1,, 3) ... Relation 9 (3,, 5 (No)) ... Relation 10 In the same manner as above, such analysis processing is performed on other documents in each document group. Apply.
【0032】キーワード抽出ルール保持装置4は、例え
ば予め用意されたキーワード抽出ルールを保持し、キー
ワード抽出ルール制約強化装置6から得られる抽出ルー
ルを既存のキーワード抽出ルールに上書きする機能を有
している。1個のキーワード抽出ルールErは、 Er:(F, R, B) → A の形式で表現され、キーワード抽出ルール保持装置4に
はこの集合が保持される。The keyword extraction rule holding device 4 has, for example, a function of holding a keyword extraction rule prepared in advance and overwriting an extraction rule obtained from the keyword extraction rule constraint strengthening device 6 with an existing keyword extraction rule. . One keyword extraction rule Er is expressed in a format of Er: (F, R, B) → A, and the keyword extraction rule holding device 4 holds this set.
【0033】ここで、上記したF, R, B, Aは集合であ
り、以下に、これらの詳細を示す。Fは、係り語の表現
の集合であり、各要素は[c]もしくは“s”で表現され
る。Rは、関係の集合であり、各要素はrで示される。関
係を指定しない場合は「(無)」と表記する。Bは、受け
語の表現の集合であり、各要素は[c]もしくは“s”で表
現される。Aは、キーワード抽出動作の内容であり、各
要素は抽出する語の位置を示す。具体的には、係り語を
抽出する場合にはfであり、受け語を抽出する場合にはb
である。また、上記したcはシソーラスに含まれる概念
名を示し、上記したsは表層を示す。Here, F, R, B, and A are a set, and details thereof will be described below. F is a set of expressions related to each other, and each element is represented by [c] or “s”. R is a set of relations, and each element is represented by r. If no relationship is specified, it is described as "(none)". B is a set of expressions of the receiving word, and each element is represented by [c] or "s". A is the content of the keyword extraction operation, and each element indicates the position of the word to be extracted. Specifically, it is f when extracting a dependent word, and b when extracting a received word.
It is. Further, c described above indicates a concept name included in the thesaurus, and s described above indicates a surface layer.
【0034】なお、本実施例に言うキーワード抽出ルー
ルが本発明に言うルールに相当し、本実施例に言うFやB
やRがそれぞれ本発明に言う第1キーワード群や第2キ
ーワード群や所定の関係に相当し、本実施例に言うFの
各要素やBの各要素がそれぞれ本発明に言う第1キーワ
ードや第2キーワードに相当し、本実施例に言うAによ
り抽出されるキーワードが本発明に言う所定のキーワー
ドに相当する。The keyword extraction rule described in the present embodiment corresponds to the rule described in the present invention.
And R correspond to the first keyword group and the second keyword group according to the present invention, respectively, and a predetermined relationship. Each element of F and each element of B according to the present embodiment correspond to the first keyword and the second keyword according to the present invention, respectively. The keyword extracted by A in the present embodiment corresponds to two keywords, and corresponds to the predetermined keyword in the present invention.
【0035】シソーラス5は、例えば語の階層構造を表
現する機能を有しており、この構造は、例えば概念の木
構造のノードにその概念に属する語の集合が更に付随す
る構造を有している。本実施例では、図3に示されるシ
ソーラスT1が用いられる場合を示す。The thesaurus 5 has, for example, a function of expressing a hierarchical structure of words. This structure has, for example, a structure in which a node of a concept tree structure is further accompanied by a set of words belonging to the concept. I have. This embodiment shows a case where the thesaurus T 1 shown in FIG. 3 is used.
【0036】パターンマッチング装置3は、例えばキー
ワード抽出ルール保持装置4によって保持されるキーワ
ード抽出ルールを用いて、係り受け解析装置2から得ら
れる全ての係り受け関係に対して順次当該キーワード抽
出ルールとのパターンマッチングを行う機能を有してい
る。また、パターンマッチング装置3は、パターンがマ
ッチした場合(つまり、キーワード抽出ルールに適合し
た係り受けの表現が発見された場合)には、そのときの
係り受けをマッチ表現として、適用したキーワード抽出
ルールと共に出力する機能を有している。The pattern matching device 3 uses, for example, a keyword extraction rule held by the keyword extraction rule holding device 4 to sequentially change all the dependency relationships obtained from the dependency analysis device 2 with the keyword extraction rule. It has a function to perform pattern matching. When the pattern matches (that is, when a dependency expression that matches the keyword extraction rule is found), the pattern matching device 3 uses the dependency at that time as a match expression and applies the keyword extraction rule. And has the function of outputting the same.
【0037】ここで、上記したキーワード抽出ルール保
持装置4が次のキーワード抽出ルールEr1を保持する場
合を例として考える。 Er1:({[印字品質], [サービス]}, {が, は}, {“でき
(否)”}) → {f} 例えば上記した文1の関係2(「解像はできない」)は問
題を示す表現である。これに対してEr1を適用すると、
シソーラスT1より係り語「解像」は概念「印字品質」に
属し、関係は「は」であり、受け語は「でき(否)」で
あるので、Er1にマッチし、係り語「解像」を概念「印
字品質」のキーワードとして抽出する。[0037] Here, consider an example in which the keyword extraction rule holding unit 4 described above holds the next keyword extraction rule Er 1. Er 1 : ({[print quality], [service]}, {but, is}, {“
(No) "}) → {f} For example, the relation 2 (" cannot be resolved ") in sentence 1 described above is an expression indicating a problem. Applying Er 1 to this,
It relates language than thesaurus T 1 "resolution" belongs to the concept "print quality", the relationship is "is", because the received word is "can (not)", matches Er 1, relates word "solution The image is extracted as a keyword of the concept “print quality”.
【0038】また、例えば上記した文2の関係4(「解
像はできる」)は問題を示す表現ではない。これに対し
てEr1を適用すると、シソーラスT1より係り語「解像」
は概念「印字品質」に属し、関係は「は」であるが、受
け語が「できる」であるので、Er1にマッチせず、「解
像」をキーワードとして抽出しない。また、例えば上記
した文3の関係8(「スキマができない」)は問題を示す
表現ではない。しかしながら、これに対してEr1を適用
すると、シソーラスT1より係り語「スキマ」は概念「印
字品質」に属し、関係は「が」であり、受け語は「でき
(否)」であるので、Er1にマッチし、係り語「スキ
マ」を概念「印字品質」のキーワードとして抽出する。Also, for example, the relation 4 (“can be resolved”) of sentence 2 described above is not an expression indicating a problem. On the other hand, when Er 1 is applied, the relation term “resolution” is obtained from the thesaurus T 1
Belongs to the concept "print quality" is, but the relationship is "is", because the received word is "possible", does not match the Er 1, it does not extract the "resolution" as a keyword. Further, for example, the relation 8 (“cannot make a gap”) in sentence 3 described above is not an expression indicating a problem. However, when Er 1 is applied to this, from the thesaurus T 1 , the suffix “skin” belongs to the concept “print quality”, the relationship is “ga”, and the received word is “can (no)” , Er 1, and extract the word “spacing” as a keyword of the concept “print quality”.
【0039】また、例えば上記した文4の関係10
(「スタックができない」)は問題を示す表現である。こ
れに対してEr1を適用すると、関係は「が」であり、受
け語は「でき(否)」であるが、シソーラスT1より係り語
「スタック」は概念「印字品質」に属さないので、Er1
にマッチせず、「スタック」をキーワードとして抽出し
ない。Further, for example, the relation 10 of the above sentence 4
("Stacking not possible") is an expression indicating the problem. Applying Er 1 contrast, the relationship is "ga", it receives word is "can (not)", since the dependency words from the thesaurus T 1 "stack" does not belong to the concept "print quality" , Er 1
And does not extract "stack" as a keyword.
【0040】なお、上記したキーワード抽出ルールEr1
を例とすると、[印字品質]や[サービス]が本発明に
言う第1キーワードに相当し、これに該当する「解像」
や「スキマ」が本発明に言う第1キーワードに該当する
語に相当し、同様に、“でき(否)”が本発明に言う第
2キーワードに相当し、これに該当する「でき(否)」
が本発明に言う第2キーワードに該当する語に相当す
る。The above-described keyword extraction rule Er 1
As an example, [print quality] and [service] correspond to the first keyword of the present invention, and the "resolution"
And “spacing” correspond to the word corresponding to the first keyword according to the present invention, and similarly, “do (no)” corresponds to the second keyword according to the present invention, and “do (no)” corresponding thereto "
Corresponds to the word corresponding to the second keyword in the present invention.
【0041】上述のように、上記した文3の関係8
(「スキマができない」)は問題を示す表現ではないにも
関わらず、キーワード抽出ルールEr1とマッチしてしま
うため、「スキマ」を概念「印字品質」(上記図3の例
では、更に「印字エラー」の下)のキーワードとして抽
出してしまう。このマッチングが起こらないようにする
ために、適用したEr1の制約を強化する必要がある。As described above, the relation 8 of the above sentence 3
( "Clearance can not") Despite not express indicate a problem, since the result matches the keyword extraction rule Er 1, the "gap" concept "print quality" (in the example of FIG. 3, further " It is extracted as a keyword under “Printing error”. In order to prevent this matching from occurring, it is necessary to strengthen the constraint of Er 1 applied.
【0042】そこで、本例では、例えばパターンマッチ
ング装置3からの入力を受けて、キーワード抽出ルール
の制約を強化してキーワード抽出ルール保持装置4の該
当箇所に上書きする機能を有したキーワード抽出ルール
制約強化装置6を備えている。図4には、キーワード抽
出ルール制約強化装置6の内部動作の構成例を示してあ
り、このキーワード抽出ルール制約強化装置6は、本発
明に言う提示手段及び受付手段を構成する制約強化指示
装置11と、本発明に言う制約強化手段を構成する制約
強化精製装置12及び制約強化ルール候補提示装置13
とから構成されている。Therefore, in this embodiment, for example, a keyword extraction rule constraint having a function of receiving an input from the pattern matching device 3 and strengthening the constraint of the keyword extraction rule to overwrite the corresponding portion of the keyword extraction rule holding device 4 A reinforcement device 6 is provided. FIG. 4 shows an example of the configuration of the internal operation of the keyword extraction rule constraint strengthening device 6. The keyword extraction rule constraint strengthening device 6 is a constraint strengthening instruction device 11 that constitutes a presentation unit and a reception unit according to the present invention. And a constraint strengthening refining device 12 and a constraint strengthening rule candidate presenting device 13 constituting the constraint strengthening means according to the present invention.
It is composed of
【0043】制約強化指示装置11は、キーワード抽出
ルールの制約の強化を行うか否かをユーザに指示させ、
当該指示を受け付ける機能を有している。この制約強化
指示装置11は、例えば図5に示すように、キーワード
抽出ルールの内容及び当該ルールにマッチした表現及び
キーワードの抽出結果を並べて表示する。同図では、上
記したルールEr1を上記した文3の関係8に適用した場
合に抽出されるキーワード「スキマ」を強調表示してい
る。The constraint strengthening instruction device 11 instructs the user whether or not to strengthen the constraint of the keyword extraction rule,
It has a function of receiving the instruction. For example, as shown in FIG. 5, the constraint strengthening instruction device 11 displays the contents of the keyword extraction rule, the expression that matches the rule, and the extraction result of the keyword side by side. In the figure, the keyword “skin” extracted when applying the rule Er 1 to the relation 8 of the sentence 3 is highlighted.
【0044】このような表示画面をユーザが見て、この
ルールEr1の制約強化を行うべきかを判定し、Yes/Noの
指示を与える。そして、制約強化指示装置11がYesの
指示を受けた場合には後述する制約強化精製装置12や
制約強化ルール候補提示装置13による制約強化処理が
行われ、制約強化指示装置11がNoの指示を受けた場合
にはこのような制約強化処理は行われず、このまま処理
が終了させられて、例えば次のキーワードに関する制約
強化指示装置11による処理へ移行する。[0044] Such a display screen to see the user, to determine whether to carry out the constraints strengthening of the rule Er 1, give an indication of the Yes / No. Then, when the constraint strengthening instruction device 11 receives the instruction of Yes, the constraint strengthening refinement device 12 and the constraint strengthening rule candidate presenting device 13 described later perform the constraint strengthening process, and the constraint strengthening instruction device 11 issues the No instruction. If it is received, such a constraint strengthening process is not performed, and the process is terminated as it is, and the process proceeds to, for example, the process by the constraint strengthening instruction device 11 relating to the next keyword.
【0045】このように、制約強化指示装置11は、パ
ターンマッチング装置3によって或るキーワード抽出ル
ールと或る表現とがマッチしてキーワードが抽出された
ときに、当該装置3から得られるキーワード抽出ルー
ル、表現、キーワードをユーザに提示し、このキーワー
ドを実際には抽出すべきかどうかのユーザの判断を受け
て、その結果を出力する。そして、抽出すべきではない
と指示された場合にはキーワード抽出ルール、表現、キ
ーワードを制約強化精製装置12へ出力し、抽出すべき
であると指示された場合にはこのキーワードの抽出に関
する一連の処理を終了する。なお、ここで言う抽出すべ
きではないという指示が本発明に言う提示したルールを
不適用とする指示に相当する。As described above, when the pattern matching device 3 matches a certain keyword extraction rule with a certain expression and extracts a keyword, the constraint strengthening instruction device 11 obtains a keyword extraction rule obtained from the device 3. , Expressions, and keywords are presented to the user, and the result of the user is determined based on whether the user should actually extract the keywords. When it is instructed that the keyword should not be extracted, the keyword extraction rules, expressions, and keywords are output to the constraint strengthening / purifying device 12. The process ends. Note that the instruction that should not be extracted here corresponds to the instruction that the rule presented in the present invention is not applied.
【0046】制約強化精製装置12は、上記した制約強
化指示装置11によりYesの指示を受け付けた場合に、
このキーワード抽出ルールの制約を強化する精製を行う
機能を有している。本例の制約強化精製装置12は、2
つの異なる手法(各々、強化手法1、強化手法2と言う)
によりキーワード抽出ルールの制約を強化する機能を有
している。When the constraint strengthening refining device 12 receives an instruction of Yes from the constraint strengthening instructing device 11,
It has a function of performing refining to strengthen the restrictions on the keyword extraction rules. The restriction-enhancing purification device 12 of the present example
Two different methods (Reinforcement Method 1 and Reinforcement Method 2, respectively)
Has the function of strengthening the restrictions on the keyword extraction rules.
【0047】まず、強化手法1を説明する。すなわち、
キーワード抽出ルール Er:(F, R, B) → A に対して、例えば抽出しないようにしたい語が係り語で
ある場合には、当該係り語の概念をfcとすると、制約強
化後のキーワード抽出ルールEraは、 Era:(F−{fc}, R, B) → A となる。First, enhancement method 1 will be described. That is,
Keyword extraction rule Er: For (F, R, B) → A, for example, if the word that should not be extracted is a dependency, and the concept of the dependency is fc, keyword extraction after strengthening the constraints The rule Era is Era: (F− {fc}, R, B) → A.
【0048】同様に、例えば抽出しないようにしたい語
が受け語である場合には、当該受け語の概念をbcとする
と、制約強化後のキーワード抽出ルールErbは、 Erb:(F, R, B−{bc}) → A となる。Similarly, for example, if the word to be not extracted is a receiver word, and the concept of the receiver word is bc, the keyword extraction rule Erb after the constraint reinforcement is Erb: (F, R, B − {Bc}) → A.
【0049】具体的に、例えばキーワード抽出ルール保
持装置4が保持するキーワード抽出ルールEr1に対し
て、上記した文3とのマッチングによって当該文3の関
係8(「スキマができない」)とのマッチングを行った場
合には、当該関係8は Er1にマッチして係り語「スキ
マ」が概念「印字品質」のキーワードとして抽出され
る。しかし、実際にはこの表現「スキマができない」は
問題を示す表現ではないので、ユーザは、この抽出を行
わないようにEr1を強化したいと考え、その旨を指示す
る。この場合、抽出しないようにしたい語は係り語であ
るので上記したErが上記したEraへ変更されるような制
約強化を行う。すなわち、Er1から得られる制約強化後
のキーワード抽出ルールEra1は、 Era1:({[サービス]}, {が, は}, {“でき(否)”}) →
{f} となる。More specifically, for example, the keyword extraction rule Er 1 held by the keyword extraction rule holding device 4 is matched with the above sentence 3 by matching with the relation 8 of the sentence 3 (“cannot make a gap”). Is performed, the relation 8 matches Er 1 and the relation word “skin” is extracted as a keyword of the concept “print quality”. However, since the expression "cannot make a gap" is not an expression that actually indicates a problem, the user wants to strengthen Er 1 so as not to perform the extraction, and gives an instruction to that effect. In this case, since the word that should not be extracted is a related word, the constraint is strengthened so that Er is changed to Era. That is, the keyword extraction rule Era 1 after the constraint strengthening obtained from Er 1 is Era 1 : ({[service]}, {but, is}, {“can (no)”}) →
{f}.
【0050】なお、上記したキーワード抽出ルールEr1
を上記したキーワード抽出ルールEra 1へ変更する場合を
例とすると、上記した「スキマ」が本発明に言う提示し
た表現中の提示したルールに適合する語に相当し、上記
した「印字品質」が当該語に該当するキーワードに相当
し、上記したキーワード抽出ルールEr1で規定される係
り語側のキーワード群が本発明に言う(提示した)ルー
ルで規定される当該語に対応したキーワード群に相当
し、当該キーワード群から当該キーワード「印字品質」
が削除されている。ここで、本例では、係り語側の例を
示したが、受け語側についても同様である。The above-mentioned keyword extraction rule Er1
The above keyword extraction rule Era 1To change to
As an example, the “spacing” described above refers to the present invention.
Word that matches the rule presented in the expression
"Print quality" corresponds to the keyword corresponding to the word
And the above-mentioned keyword extraction rule Er1Section specified in
The keyword group on the word side is the
Equivalent to the keyword group corresponding to the word specified in the
And the keyword “print quality” from the keyword group
Has been removed. Here, in the present example,
However, the same applies to the receiving side.
【0051】このように、強化手法1では、制約強化精
製装置12は、制約強化指示装置11からキーワード抽
出ルール、表現、キーワードの入力を受けて、キーワー
ドの部分(本例のように係り受けの場合には、係り語或
いは受け語)の概念をキーワード抽出ルールから削減す
る方法により当該ルールの制約を強化する。As described above, in the strengthening method 1, the constraint strengthening refining device 12 receives the keyword extraction rule, the expression, and the keyword from the constraint strengthening instruction device 11, and receives the keyword portion (as in this example, the dependency portion). In such a case, the constraint of the rule is strengthened by a method of reducing the concept of the linguistic or receiving word) from the keyword extraction rule.
【0052】次に、強化手法2を説明する。すなわち、
キーワード抽出ルールErに対して、例えば抽出しないよ
うにしたい語が係り語である場合には、当該係り語の概
念fcのm個の下位概念をfcu1, …, fcumとし、これらの
下位概念の中で当該係り語を包含する概念をfcui (1≦i
≦m)とすると、Erの制約強化後のキーワード抽出ルール
Ercは、 Erc:(F−{fc}+{fcu1, …, fcui-1, fcui+1, …, fc
um}, R, B) → A となる。Next, enhancement method 2 will be described. That is,
The keyword extraction rule Er, when word you want to avoid such as extraction is dependency word, fcu 1 of m subgeneric concepts fc of the dependency word, ..., and fcu m, these subgeneric In fcu i (1 ≦ i
≤ m), the keyword extraction rule after strengthening Er constraints
Erc is Erc: (F− {fc} + {fcu 1 ,…, fcu i−1 , fcu i + 1 ,…, fc
u m }, R, B) → A.
【0053】同様に、例えば抽出しないようにしたい語
が受け語である場合には、当該受け語の概念bcのn個の
下位概念をbcu1, …, bcunとし、これらの下位概念の中
で当該受け語を包含する概念をbcuj (1≦j≦n)とする
と、Erの制約強化後のキーワード抽出ルールErdは、 Erd:(F, R, B−{bc}+{bcu1, …, bcuj-1, bcuj+1, …,
bcun}) → A となる。[0053] Similarly, for example, when word you do not want to extract is subjected word, bcu 1 n pieces of subordinate concepts of the receiving language concepts bc, ..., and bcu n, of these subgeneric Let bcu j (1 ≦ j ≦ n) be the concept including the received word in Er, the keyword extraction rule Erd after strengthening the constraint of Er is Erd: (F, R, B− {bc} + {bcu 1 , …, Bcu j-1 , bcu j + 1 ,…,
bcu n }) → A.
【0054】上記した強化手法1の場合と同様に、例え
ばキーワード抽出ルール保持装置4がキーワード抽出ル
ールEr1を保持し、上記した文3とのマッチングによっ
て当該文3の関係8(「スキマができない」)とのマッチ
ングを行った場合には、抽出しないようにしたい語は係
り語「スキマ」となるので、上記したErが上記したErc
へ変更されるような制約強化を行う。具体的には、概念
「印字品質」の下位概念は「印字状態」と「印字エラ
ー」であり、「スキマ」は「印字エラー」に属している
ので、概念「印字エラー」を削除する。すなわち、Er1
から得られる制約強化後のキーワード抽出ルールErc
1は、 Erc1:({[印字状態], [サービス]}, {が, は}, {“でき
(否)”}) → {f} となる。[0054] As with the reinforcing method 1 described above, for example, it holds the keyword extraction rule holding unit 4 is a keyword extraction rule Er 1, can not be related 8 ( "gap of the statement 3 by matching between sentences 3 described above )), The word that should not be extracted is the linguistic term “spacing”.
Enhance the constraint to change to Specifically, the subordinate concepts of the concept “print quality” are “print state” and “print error”, and the “clearance” belongs to the “print error”, so the concept “print error” is deleted. That is, Er 1
Keyword extraction rule Erc after strengthening constraints obtained from
1 is Erc 1 : ({[printing status], [service]}, {but, is}, {“
(No) ”}) → {f}.
【0055】なお、上記したキーワード抽出ルールEr1
を上記したキーワード抽出ルールErc 1へ変更する場合を
例とすると、上記した「印字状態」及び「印字エラー」
が本発明に言う下位概念の複数のキーワードに相当し、
これら下位概念の複数のキーワード中の「印字エラー」
が本発明に言う下位概念の複数のキーワードの中で(ル
ールに適合した)語に該当するキーワードに相当し、当
該語に該当した元々のキーワード「印字品質」が下位概
念の中で当該語に該当しない「印字状態」へ置き換えら
れている。ここで、本例では、係り語側の例を示した
が、受け語側についても同様である。The above-described keyword extraction rule Er1
The above keyword extraction rule Erc 1To change to
For example, the “print status” and “print error”
Corresponds to a plurality of keywords of the subordinate concept referred to in the present invention,
"Print error" in multiple keywords of these subordinate concepts
Among the keywords of the subordinate concept referred to in the present invention
Keyword that matches the word).
The original keyword "print quality" corresponding to the word is
Replaced with "printing state" which does not correspond to the word
Have been. Here, in this example, the example of the hang-up side was shown.
However, the same applies to the receiving side.
【0056】このように、強化手法2では、制約強化精
製装置12は、制約強化指示装置11からキーワード抽
出ルール、表現、キーワードの入力を受けて、キーワー
ドの部分(本例のように係り受けの場合には、係り語或
いは受け語)の概念をシソーラスを用いて下位概念に展
開した上で、当該部分が属する下位概念のみをキーワー
ド抽出ルールから削減する方法により当該ルールの制約
を強化する。As described above, in the strengthening method 2, the constraint strengthening refining device 12 receives the keyword extraction rule, the expression, and the keyword from the constraint strengthening instructing device 11, and receives the keyword portion (as in the present example, the dependency portion). In this case, the concept of the related word or the received word) is expanded into lower-level concepts using a thesaurus, and then the constraints of the rules are strengthened by a method of reducing only the lower-level concepts to which the part belongs from the keyword extraction rules.
【0057】制約強化ルール候補提示装置13は、上記
した制約強化精製装置12によって精製された制約強化
後のキーワード抽出ルールの候補(本例では、強化手法
1により生成されるルール及び強化手法2により生成さ
れるルール)をユーザに提示し、ユーザが提示された候
補の中から1個を選択した場合に、当該選択の指示に従
って上書き処理を行う機能を有している。つまり、制約
強化ルール候補提示装置13では、ユーザにより選択さ
れたルールが制約強化後のキーワード抽出ルールとして
決定され、当該ルールがキーワード抽出ルール保持装置
4中の制約強化前のルールに上書きされる。The constraint-strengthening rule candidate presentation device 13 generates a keyword extraction rule candidate after constraint strengthening refined by the above-described constraint-strengthening refinement device 12 (in this example, the rule generated by the reinforcement method 1 and the keyword extraction rule by the reinforcement method 2). (A generated rule) is presented to the user, and when the user selects one of the presented candidates, the user has a function of performing an overwrite process in accordance with the selection instruction. That is, in the constraint strengthening rule candidate presentation device 13, the rule selected by the user is determined as the keyword extraction rule after the constraint strengthening, and the rule is overwritten with the rule before the constraint strengthening in the keyword extracting rule holding device 4.
【0058】上記と同様に、例えばキーワード抽出ルー
ルEr1を例とすると、この場合の候補は上記したEra1及
び上記したErc1となり、例えば図6に示すような内容が
ユーザに対して表示される。同図の例では、各候補の元
ルールEr1に対する変更箇所を強調表示している。例え
ばユーザが同図中の“1”を選択した場合には、Era1が
キーワード抽出ルール保持装置4中のEr1に上書きさ
れ、また、例えばユーザが同図中の“元ルール”を選択
した場合には、上書き処理は行われずに、Er1がそのま
まキーワード抽出ルール保持装置4中に残る。[0058] Similar to the above, for example, the keyword extraction rule Er 1 as an example, a candidate in this case becomes Erc 1 were Era 1 and the mentioned above, for example, something like what is shown in FIG. 6 is displayed to the user You. In the example of the figure, highlighting the changes to the original rule Er 1 of each candidate. For example, when the user selects “1” in the figure, Era 1 is overwritten on Er 1 in the keyword extraction rule holding device 4 and, for example, the user selects “original rule” in the figure. In this case, Er 1 remains in the keyword extraction rule holding device 4 without performing the overwriting process.
【0059】以上のように、本例のキーワード抽出ルー
ル精製支援装置では、例えばキーワード抽出装置のパタ
ーンマッチング装置3が行うマッチングの結果を受け
て、ユーザの判断や選択に従ってキーワード抽出ルール
の制約を強化していくことができ、これにより、例えば
文書に合わせて既存のキーワード抽出ルールの制約強化
処理を繰り返して行うことによって当該ルールの精製を
実現することができる。As described above, in the keyword extraction rule refining support device of the present embodiment, for example, upon receiving the result of the matching performed by the pattern matching device 3 of the keyword extraction device, the constraint of the keyword extraction rule is strengthened in accordance with the judgment and selection of the user. Thus, for example, the refining of the existing keyword extraction rule can be realized by repeatedly performing the process of strengthening the constraint of the existing keyword extraction rule according to the document.
【0060】次に、本発明の第2実施例に係るキーワー
ド抽出ルール精製支援装置を説明する。なお、本例で
は、ルールの制約を緩和することを支援する装置(キー
ワード抽出ルール制約緩和支援装置)を示す。図7に
は、本例に係るキーワード抽出ルール精製支援装置を組
み込んだキーワード抽出装置の一例を示してあり、この
装置には、例えば上記第1実施例の図1に示したものと
同様な機能を有する文書群保持装置1や係り受け解析装
置2やパターンマッチング装置3やキーワード抽出ルー
ル保持装置4やシソーラス5と、本例の特徴的な構成部
分である類似ルール選択装置21及びキーワード抽出ル
ール制約緩和装置22とが備えられている。Next, a keyword extraction rule refining support apparatus according to a second embodiment of the present invention will be described. Note that, in this example, a device (keyword extraction rule constraint relaxation support device) that supports relaxation of rule constraints is shown. FIG. 7 shows an example of a keyword extraction device incorporating the keyword extraction rule refining support device according to the present embodiment. This device has, for example, the same function as that shown in FIG. 1 of the first embodiment. Group holding device 1, dependency analysis device 2, pattern matching device 3, keyword extraction rule holding device 4, thesaurus 5, and similar rule selection device 21 and keyword extraction rule constraint which are characteristic components of this example. A mitigation device 22 is provided.
【0061】なお、上記図1に示したものと同様な機能
を有する構成部分1〜5については、同図に示したのと
同じ符号を用いて示してある。また、説明の便宜上か
ら、上記第1実施例で示したのと同様な構成について
は、本例では、説明を省略する。The components 1 to 5 having the same functions as those shown in FIG. 1 are denoted by the same reference numerals as those shown in FIG. Further, for the sake of convenience of explanation, the description of the same configuration as that shown in the first embodiment will be omitted in this example.
【0062】本例では、キーワード抽出ルール保持装置
4が次のようなキーワード抽出ルールEr2を保持する場
合を例として示す。 Er2:({“丁合い”, [サービス]}, {が, は}, {“でき
(否)”}) → {f} この場合、パターンマッチング装置3が例えば上記した
文4の関係10(「スタックができない」)とキーワード
抽出ルールEr2とのマッチングを取ろうとすると、関係
「が」と受け語「できない」についてはEr2の該当部分
とマッチするが、係り語「スタック」についてはEr2の
該当部分とマッチしないため、キーワードは抽出されな
い。[0062] In this example, a case where the keyword extracting rule holding unit 4 holds the keyword extraction rule Er 2 as follows as an example. Er 2 : ({"collation, [service]}, {but, is}, {"
(Not) "}) → {f} In this case, when trying to match the relationship 10 sentence 4 a pattern matching device 3, for example above (the" can not stack ") and a keyword extraction rule Er 2, the relationship" but "and received word about the" can not "is to match the corresponding portion of the Er 2, but because relates word for the" stack "does not match the corresponding part of the Er 2, keyword is not extracted.
【0063】また、キーワード抽出ルール保持装置4が
保持する他のキーワード抽出ルールも全て上記した関係
10とマッチしない場合には、当該関係10からはキー
ワードが抽出されない。しかし、「スタックができな
い」というのは問題を示す表現であり、「スタック」を
キーワードとして抽出すべきである。If none of the other keyword extraction rules held by the keyword extraction rule holding device 4 match the above-mentioned relation 10, no keyword is extracted from the relation 10. However, "stacking is not possible" is an expression indicating a problem, and "stacking" should be extracted as a keyword.
【0064】そこで、本例では、このようなキーワード
の抽出を実現するための構成として、類似ルール選択装
置21やキーワード抽出ルール制約緩和装置22を備え
ている。類似ルール選択装置21は、例えばキーワード
抽出ルール保持装置4が保持する全てのキーワード抽出
ルールと或る表現とがマッチしなかった場合に、その表
現のパターンに近いキーワード抽出ルールをキーワード
抽出ルール保持装置4が保持するキーワード抽出ルール
の中から選択する機能を有している。Therefore, in the present embodiment, a similar rule selection device 21 and a keyword extraction rule constraint relaxation device 22 are provided as components for realizing such keyword extraction. For example, when all of the keyword extraction rules held by the keyword extraction rule holding device 4 do not match a certain expression, the similar rule selection device 21 converts the keyword extraction rule close to the pattern of the expression into a keyword extraction rule holding device. 4 has a function of selecting from among the keyword extraction rules held by the device.
【0065】本例のように係り受け関係が用いられてい
る場合には、ここで選択されるキーワード抽出ルール
は、次に示すUmaとUmbとUmcとのいずれかが成立するも
のとなる。Umaは、係り語がマッチせず、関係と受け語
はマッチするキーワード抽出ルールである。Umbは、関
係がマッチせず、係り語と受け語はマッチするキーワー
ド抽出ルールである。Umcは、受け語がマッチせず、係
り語と関係はマッチするキーワード抽出ルールである。
具体的に、上記したEr2と上記した関係10の場合に
は、係り語「スタック」はEr2の係り語部分とマッチし
ないが、関係「が」と受け語「できない」は各々マッチ
するので、上記のUmaに相当する。When the dependency relation is used as in this example, the keyword extraction rule selected here is one of the following Uma, Umb, and Umc. Uma is a keyword extraction rule in which the terms do not match and the relation and the receiving word match. Umb is a keyword extraction rule in which the relationship does not match and the dependency and the receiving word match. Umc is a keyword extraction rule in which the receiving word does not match and the dependency word and the relationship match.
Specifically, in the case of Er 2 described above and the relationship 10 described above, the dependency “stack” does not match the dependency portion of Er 2 , but the relationship “ga” and the receiving word “cannot” match, respectively. , Corresponds to the above Uma.
【0066】このように、類似ルール選択装置21は、
例えばパターンマッチング装置3によってマッチするキ
ーワード抽出ルールがなかった場合に、表現とキーワー
ド抽出ルールとの間で1箇所(本例のように係り受け関
係の場合には、係り語、関係、受け語のいずれか)以外
が全てマッチする(つまり、他の2個所がマッチする)
ようなキーワード抽出ルールをキーワード抽出ルール保
持装置4に保持されるキーワード抽出ルールの中から選
択し、選択したキーワード抽出ルール及び表現及びマッ
チしなかったために抽出されなかったキーワードをキー
ワード抽出ルール制約緩和装置22へ出力する。As described above, the similar rule selecting device 21
For example, if there is no keyword extraction rule that is matched by the pattern matching device 3, one place between the expression and the keyword extraction rule (in the case of a dependency relation as in this example, the relation word, relation, ), All other matches (that is, the other two locations match)
Such a keyword extraction rule is selected from among the keyword extraction rules held in the keyword extraction rule holding device 4, and the selected keyword extraction rule and the expression and the keyword that is not extracted because it did not match are extracted from the keyword extraction rule constraint relaxation device. 22.
【0067】キーワード抽出ルール制約緩和装置22
は、例えば類似パターン選択装置21からの結果を受
け、キーワード抽出ルールの制約を緩和してキーワード
抽出ルール保持装置4の該当箇所に上書きする機能を有
している。図8には、キーワード抽出ルール制約緩和装
置22の内部動作の構成例を示してあり、このキーワー
ド抽出ルール制約緩和装置22は、例えば上記した類似
ルール選択装置21と共に本発明に言う提示手段を構成
するとともに、本発明に言う受付手段を構成する制約緩
和指示装置31と、本発明に言う制約緩和手段を構成す
る制約緩和精製装置32及び制約緩和ルール候補提示装
置33とから構成されている。Keyword extraction rule constraint relaxation device 22
Has a function of, for example, receiving the result from the similar pattern selection device 21 and relaxing the restriction on the keyword extraction rule to overwrite the corresponding part of the keyword extraction rule holding device 4. FIG. 8 shows a configuration example of the internal operation of the keyword extraction rule constraint relaxation device 22. The keyword extraction rule constraint relaxation device 22 constitutes a presentation means according to the present invention together with, for example, the similar rule selection device 21 described above. In addition, it is composed of a constraint relaxation instructing device 31 constituting a receiving means according to the present invention, a constraint relaxation refining device 32 and a constraint relaxation rule candidate presenting device 33 constituting a constraint relaxing means according to the present invention.
【0068】制約緩和指示装置31は、キーワード抽出
ルールの制約の緩和を行うか否かをユーザに指示させ、
当該指示を受け付ける機能を有している。制約緩和指示
装置31は、例えば図9に示すように、キーワード抽出
ルールの内容及び例えば係り語と受け語とのいずれかが
一致しなかったために当該キーワード抽出ルールとマッ
チしなかった表現及び抽出結果を並べて表示する。The constraint relaxation instructing device 31 instructs the user whether or not to relax the constraint of the keyword extraction rule,
It has a function of receiving the instruction. For example, as shown in FIG. 9, the constraint relaxation instructing device 31 outputs the expression and the extraction result that did not match the keyword extraction rule because the content of the keyword extraction rule and, for example, either the lingo word or the received word did not match. Are displayed side by side.
【0069】このような表示画面をユーザが見て、この
ルールEr2の制約緩和を実際に行うべきかを判定し、Yes
/Noの指示を与える。そして、制約緩和指示装置31がY
esの指示を受けた場合には後述する制約緩和精製装置3
2や制約緩和ルール候補提示装置33による制約緩和処
理が行われ、制約緩和指示装置31がNoの指示を受けた
場合にはこのような制約緩和処理は行われず、このまま
処理が終了させられて、例えば次のキーワードに関する
類似ルール選択装置21や制約緩和指示装置31による
処理へ移行する。[0069] Such a display screen as viewed user determines whether to perform the constraint relaxation this rule Er 2 Indeed, Yes
/ No instruction is given. Then, the constraint relaxation instructing device 31
When the instruction of es is received, the constraint relaxation purification device 3 described later
2 and the constraint relaxation rule candidate presentation device 33 perform the constraint relaxation process, and when the constraint relaxation instructing device 31 receives an instruction of No, such a constraint relaxation process is not performed, and the process is terminated as it is. For example, the processing shifts to the processing by the similar rule selection device 21 and the constraint relaxation instructing device 31 for the next keyword.
【0070】このように、制約緩和指示装置31は、類
似ルール選択装置21から得られる文書、キーワード抽
出ルール、表現、一致しなかった部分の語をユーザに提
示し、この語を実際には抽出すべきかをユーザに判断さ
せ、その結果を出力する。そして、抽出すべきであると
指示された場合にはルール、表現、キーワードを制約緩
和精製装置32へ出力し、抽出すべきでないと指示され
た場合にはこのキーワードの抽出に関する一連の処理を
終了する。なお、ここで言う抽出すべきという指示が本
発明に言う提示したルールを適用する指示に相当する。As described above, the constraint relaxation instructing device 31 presents to the user the document obtained by the similar rule selecting device 21, the keyword extraction rule, the expression, and the word of the unmatched portion, and actually extracts this word. Let the user decide whether to do so and output the result. Then, when it is instructed to be extracted, the rule, expression, and keyword are output to the constraint relaxation refining device 32. When it is instructed not to be extracted, a series of processes related to extraction of this keyword is ended. I do. The instruction to be extracted here corresponds to the instruction to apply the presented rule according to the present invention.
【0071】制約緩和精製装置32は、上記した制約緩
和指示装置31によりYesの指示を受け付けた場合に、
このキーワード抽出ルールの制約を緩和する精製を行う
機能を有している。本例の制約緩和精製装置32は、4
つの異なる手法(各々、緩和手法1、緩和手法2、緩和
手法3、緩和手法4と言う)によりキーワード抽出ルー
ルの制約を緩和する機能を有している。When the constraint relaxation refining device 32 receives an instruction of Yes from the constraint relaxation instructing device 31,
It has a function of performing refining to relax the restrictions on the keyword extraction rules. The constraint relaxation purifying device 32 of this example has 4
It has a function to relax the restrictions on the keyword extraction rules by two different methods (referred to as relaxation method 1, relaxation method 2, relaxation method 3, and relaxation method 4, respectively).
【0072】まず、緩和手法1を説明する。すなわち、
上記したUmaの場合を例とすると、例えば係り語がシソ
ーラス中に存在すればキーワード抽出ルールErに対して
制約緩和を行うことができ、この場合の制約緩和後のキ
ーワード抽出ルールEreは、当該係り語の概念をfcとす
ると、 Ere:(F+{fc}, R, B) → A となる。First, the relaxation method 1 will be described. That is,
Taking the case of Uma described above as an example, for example, if a dependency exists in the thesaurus, the constraint can be relaxed on the keyword extraction rule Er. In this case, the keyword extraction rule Ere after the constraint is relaxed is If the concept of the word is fc, then Ere: (F + {fc}, R, B) → A.
【0073】同様に、上記したUmcの場合を例とする
と、例えば受け語がシソーラス中に存在すれば制約緩和
を行うことができ、この場合の制約緩和後のキーワード
抽出ルールErfは、当該受け語の概念をbcとすると、 Erf:(F, R, B+{bc}) → A となる。Similarly, taking the case of Umc as an example, if the received word exists in the thesaurus, the constraint can be relaxed. In this case, the keyword extraction rule Erf after the constraint is relaxed is the received word. If the concept of is bc, then Erf: (F, R, B + {bc}) → A.
【0074】具体的に、例えば上記したEr2が上記した
関係10に関して制約緩和対象として検出された場合
は、上記したUmaの場合に該当し、且つ、係り語はシソ
ーラスT 1中に存在するので、係り語「スタック」の概念
「ソート」を追加した次のような制約緩和後のキーワー
ド抽出ルールEre2が得られる。 Ere2:({“丁合い”, [サービス], [ソート]}, {が,
は}, {“でき(否)”}) →{f}Specifically, for example, the above-mentioned ErTwoWas mentioned above
When relation 10 is detected as a constraint relaxation target
Corresponds to the case of Uma described above, and
-Las T 1The concept of the stake "stack" because it exists in
Keyword after the relaxation of the following constraints with "Sort" added
E extraction ruleTwoIs obtained. EreTwo: ({"Collation", [service], [sort]}, {but,
Is}, {“can (no)”}) → {f}
【0075】なお、上記したキーワード抽出ルールEr2
を上記したキーワード抽出ルールEre 2へ変更する場合を
例とすると、上記した「スタック」が本発明に言う提示
した表現中の提示したルールに不適合であった語に相当
し、上記した[ソート]が本発明に言う当該語の概念を
示すキーワードに相当し、当該キーワード[ソート]が
キーワード抽出ルールに追加されている。ここで、本例
では、係り語がマッチしない場合の例を示したが、受け
語がマッチしない場合についても同様である。The above-described keyword extraction rule ErTwo
The above keyword extraction rule Ere TwoTo change to
As an example, the "stack" described above is the presentation
Equivalent to a word in the expression that did not conform to the rules presented
Then, the above [sort] describes the concept of the word in the present invention.
Keyword, and the keyword [sort]
Keyword extraction rules have been added. Here, this example
In the above, an example in which the stakeholders do not match was shown.
The same applies when the words do not match.
【0076】このように、緩和手法1では、制約緩和精
製装置32は、制約緩和指示装置31からキーワード抽
出ルール、表現、キーワードの入力を受けて、キーワー
ドの部分(本例のように係り受けの場合には、係り語或
いは受け語)の概念をキーワード抽出ルールの該当部分
に追加する方法により当該ルールの制約を緩和する。As described above, in the relaxation method 1, the constraint relaxation refining device 32 receives the keyword extraction rule, the expression, and the keyword from the constraint relaxation instructing device 31, and receives the keyword portion (as in this example, In this case, the concept of the rule is relaxed by a method of adding the concept of the linguistic word or the receiving word) to the corresponding part of the keyword extraction rule.
【0077】次に、緩和手法2を説明する。すなわち、
上記したUmaの場合を例とすると、例えば係り語がシソ
ーラス中に存在し、且つ、当該係り語の概念fcとキーワ
ード抽出ルールErの係り語部分の或る概念fecとの共通
上位概念があれば、その全ての共通上位概念fccに対し
て、この場合の制約緩和後のキーワード抽出ルールErg
は、 Erg:(F−{fec}+{fcc}, R, B) → A となる。Next, relaxation method 2 will be described. That is,
Taking the case of Uma as an example, if, for example, a dependency is present in the thesaurus and there is a common superordinate concept between the concept fc of the dependency and a certain concept fec of the dependency part of the keyword extraction rule Er, , The keyword extraction rule Erg after the constraint relaxation in this case for all the common superordinate concepts fcc
Becomes Erg: (F− {fec} + {fcc}, R, B) → A.
【0078】同様に、上記したUmcの場合を例とする
と、例えば受け語がシソーラス中に存在し、且つ、当該
受け語の概念bcとErの受け語部分の或る概念becとの共
通上位概念があれば、その全ての共通上位概念bccに対
して、この場合の制約緩和後のキーワード抽出ルールEr
hは、 Erh:(F, R, B−{bec}+{bcc}) → A となる。Similarly, taking the case of Umc as an example, for example, a receiving word exists in a thesaurus, and a common superordinate concept of the concept bc of the receiving word and a certain concept bec of the receiving word portion of Er If there is, the keyword extraction rule Er after the constraint is relaxed in this case for all the common superordinate concepts bcc
h becomes Erh: (F, R, B− {bec} + {bcc}) → A.
【0079】具体的に、例えば上記したキーワード抽出
ルールEr2が上記した関係10に関して制約緩和対象と
して検出された場合は、上記したUmaの場合に該当し、
且つ、係り語はシソーラスT1中に存在する。そして、係
り語「スタック」の概念「ソート」と共通上位概念を持
つ概念「サービス」がEr2の係り語部分に存在し、それ
らの共通上位概念は「症状」及び「問題」の2個とな
る。従って、次の2個の制約緩和後のキーワード抽出ル
ールErg2、Erg2'が得られる。 Erg2:({“丁合い”, [症状]}, {が, は}, {“でき
(否)”}) → {f} Erg2':({“丁合い”, [問題]}, {が, は}, {“でき
(否)”}) → {f}More specifically, for example, when the above-described keyword extraction rule Er 2 is detected as a constraint mitigation object with respect to the above-described relationship 10, it corresponds to the above-mentioned Uma,
And it relates words present in the thesaurus T 1. Then, the concept of having a common higher-level concepts and concept "sort" of relates word "stack", "service" is present in the relates word part of the Er 2, their common higher-level concepts and two of the "symptoms" and "problem" Become. Accordingly, the following two keyword extraction rules Erg 2 and Erg 2 ′ after the restriction is relaxed are obtained. Erg 2 : ({"collation", [symptom]}, {but, is}, {"
(No) ”)) → {f} Erg 2 ': ({“ collation ”, [problem]}, {but, is}, {“
(No) ”}) → {f}
【0080】なお、上記したキーワード抽出ルールEr2
を上記したキーワード抽出ルールErg 2、Erg2'へ変更す
る場合を例とすると、上記した「サービス」が本発明に
言う(提示した)ルールで規定される(当該ルールに不
適合であった)語に対応したキーワード群中のキーワー
ドに相当し、上記した[症状]や上記した[問題]が本
発明に言う(当該語の概念を示すキーワードと当該キー
ワード群中の当該キーワードとの)共通上位概念を示す
キーワードに相当し、当該キーワード群中の当該キーワ
ード「サービス」が当該共通上位概念を示すキーワード
である[症状]や[問題]に置き換えられている。ここ
で、本例では、係り語がマッチしない場合の例を示した
が、受け語がマッチしない場合についても同様である。The above-described keyword extraction rule ErTwo
The above keyword extraction rule Erg Two, ErgTwoChange to '
As an example, the “service” described above is applied to the present invention.
(Proposed)
Keywords in keyword group corresponding to (matched) words
The above [symptoms] and the above [problems] correspond to the book.
Say to the invention (keyword indicating the concept of the word and the key
Indicates a common superordinate concept (with the keyword in the word group)
The keyword corresponds to the keyword, and the keyword in the keyword group
The keyword that the code "service" indicates the common high-level concept
Are replaced by [symptoms] and [problems]. here
In this example, an example was shown in which the terms did not match.
However, the same applies to the case where the received words do not match.
【0081】このように、緩和手法2では、制約緩和精
製装置32は、上位概念の折り畳みによる制約緩和を行
い、具体的には、制約緩和指示装置31からキーワード
抽出ルール、表現、キーワードの入力を受けて、キーワ
ードの部分(本例のように係り受けの場合には、係り語
或いは受け語)の概念とキーワード抽出ルールの該当部
分の概念との共通上位概念に置き換える方法により当該
ルールの制約を緩和する。As described above, in the mitigation method 2, the constraint mitigation refinement device 32 performs constraint mitigation by folding the superordinate concept. Specifically, the constraint mitigation instruction device 31 inputs the keyword extraction rules, expressions, and keywords. Then, the constraint of the rule is replaced by a method that replaces the concept of the keyword part (in the case of a dependency as in the present example, the dependent word or the received word) with a common superordinate concept of the concept of the corresponding part of the keyword extraction rule. ease.
【0082】次に、緩和手法3を説明する。すなわち、
上記したUmaの場合を例とすると、例えば係り語をfsと
すると、この場合の制約緩和後のキーワード抽出ルール
Eriは、 Eri:(F+{“fs”}, R, B) → A となる。Next, relaxation method 3 will be described. That is,
Taking the case of Uma described above as an example, for example, if the stakeholder is fs, the keyword extraction rule after the constraint is relaxed in this case
Eri becomes Eri: (F + {“fs”}, R, B) → A.
【0083】同様に、上記したUmbの場合を例とする
と、例えば関係をrとすると、この場合の制約緩和後の
キーワード抽出ルールErjは、 Erj:(F, R+{r}, B) → A となる。また、上記したUmcの場合を例とすると、例え
ば受け語をbsとすると、この場合の制約緩和後のキーワ
ード抽出ルールErkは、 Erk:(F, R, B+{“bs”}) → A となる。Similarly, taking the case of the above Umb as an example, for example, assuming that the relationship is r, the keyword extraction rule Erj after the constraint is relaxed in this case is Erj: (F, R + {r}, B) → A Becomes Further, taking the case of Umc as an example, for example, if the receiving word is bs, the keyword extraction rule Erk after constraint relaxation in this case is Erk: (F, R, B + {“bs”}) → A Become.
【0084】具体的に、例えば上記したキーワード抽出
ルールEr2が上記した関係10に関して制約緩和対象と
して検出された場合は、上記したUmaの場合に該当し、
次の制約緩和後のキーワード抽出ルールEri2が得られ
る。 Eri2:({“丁合い”, [サービス], “スタック”},
{が, は}, {“でき(否)”})→ {f} ここで、本例では、係り語がマッチしない場合の例を示
したが、受け語がマッチしない場合についても同様であ
る。[0084] Specifically, if the keyword extraction rule Er 2 for example described above were detected as constraint relaxation object with respect to the relationship 10 described above, the case for Uma described above,
The following keyword extraction rule Eri 2 after constraint relaxation is obtained. Eri 2 : ({“collate”, [service], “stack”},
{But, is}, {“can (no)”}) → {f} Here, this example shows the case where the linguistic terms do not match, but the same applies to the case where the receiving terms do not match .
【0085】このように、緩和手法3では、制約緩和精
製装置32は、制約緩和指示装置31からキーワード抽
出ルール、表現、キーワードの入力を受けて、キーワー
ドの部分(本例のように係り受けの場合には、係り語或
いは受け語)の表層をキーワード抽出ルールの該当部分
に追加する方法により当該ルールの制約を緩和する。As described above, in the relaxation method 3, the constraint relaxation refining device 32 receives the keyword extraction rule, the expression, and the keyword from the constraint relaxation instructing device 31, and receives the keyword portion (as in this example, In such a case, the constraint of the rule is relaxed by a method of adding the surface layer of the related word or the received word) to the corresponding part of the keyword extraction rule.
【0086】次に、緩和手法4を説明する。すなわち、
上記したUmaの場合を例とすると、例えば係り語fsとキ
ーワード抽出ルールErの係り語部分における或る表層fe
sとがいずれもシソーラス中に存在し、それらの共通(上
位)概念があれば、その全ての共通上位概念fccに対し
て、制約緩和後のキーワード抽出ルールErlは、 Erl:(F−{“fes”}+{[fcc]}, R, B) → A となる。Next, relaxation method 4 will be described. That is,
Taking the case of the above Uma as an example, for example, a certain surface layer fe in the dependency part of the dependency fs and the keyword extraction rule Er
are present in the thesaurus, and if there is a common (superordinate) concept thereof, the keyword extraction rule Erl after the constraint relaxation for all the common superordinate concepts fcc is Erl: (F− {“ fes ”} + {[fcc]}, R, B) → A.
【0087】同様に、上記したUmcの場合を例とする
と、例えば受け語bsとキーワード抽出ルールErの受け語
部分における或る表層besとがいずれもシソーラス中に
存在し、それらの共通(上位)概念があれば、その全ての
共通上位概念bccに対して、制約緩和後のキーワード抽
出ルールErmは、 Erm:(F, R, B−{“bes”}+{[bcc]}) → A となる。Similarly, taking the case of Umc as an example, for example, both the receiving word bs and a certain surface layer bes in the receiving word portion of the keyword extraction rule Er exist in the thesaurus, and their common (higher) If there is a concept, for all the common superordinate concepts bcc, the keyword extraction rule Erm after constraint relaxation is Erm: (F, R, B − {“bes”} + {[bcc]}) → A Become.
【0088】具体的に、例えば上記したキーワード抽出
ルールEr2が上記した関係10に関して制約緩和対象と
して検出された場合は、上記したUmaの場合に該当し、
係り語「スタック」とEr2の係り語部分の表層「丁合
い」とはいずれもシソーラスT1中に存在し、それらの共
通(上位)概念「ソート」、「動作」、「症状」、「問
題」があるので、次のような4個の制約緩和後のキーワ
ード抽出ルールErm2、Erm2'、Erm2''、Erm2'''が得られ
る。 Erm2:({[ソート], [サービス]}, {が, は}, {“でき
(否)”}) → {f} Erm2':({[動作], [サービス]}, {が, は}, {“でき
(否)”}) → {f} Erm2'':({[症状], [サービス]}, {が, は}, {“でき
(否)”}) → {f} Erm2''':({[問題], [サービス]}, {が, は}, {“でき
(否)”}) → {f}More specifically, for example, when the above-described keyword extraction rule Er 2 is detected as a constraint relaxation target with respect to the above-described relationship 10, it corresponds to the above-mentioned Uma,
Both relates words and "collating" the surface layer of the relates word part of the "stack" and Er 2 is present in the thesaurus T 1, their common (upper) concept "sort", "Operation", "symptom", " because there is a problem ", keyword extraction rule Erm 2 after four constraint relaxation such as the following, Erm 2 ', Erm 2' ', Erm 2''' can be obtained. Erm 2 : ({[sort], [service]}, {but, is}, {“
(No) ”)) → {f} Erm 2 ': ({[action], [service]}, {but, is}, {“
(No) ”)) → {f} Erm 2 ″: ({[symptoms], [service]}, {but, is}, {“
(No) ”)) → {f} Erm 2 ''': ({[problem], [service]}, {but, is}, {“
(No) ”}) → {f}
【0089】なお、上記したキーワード抽出ルールEr2
を上記したキーワード抽出ルールErm 2、Erm2'、Er
m2''、Erm2'''へ変更する場合を例とすると、上記した
「丁合い」が本発明に言う(提示した)ルールで規定さ
れる(当該ルールに不適合であった)語に対応したキー
ワード群中の表層的なキーワードに相当し、当該キーワ
ード「丁合い」がこれと当該語「スタック」との共通上
位概念を示すキーワードである「ソート」や「動作」や
「症状」や「問題」に置き換えられている。ここで、本
例では、係り語がマッチしない場合の例を示したが、受
け語がマッチしない場合についても同様である。The above-mentioned keyword extraction rule ErTwo
The above keyword extraction rule Erm Two, ErmTwo', Er
mTwo'', ErmTwoIf you change to '' 'as an example,
"Collation" is defined by the rules stated (presented) in the present invention.
Key that corresponds to the word that did not comply with the rule
Corresponds to the surface keyword in the word group,
The word "collage" is common with this word "stack".
Keywords such as "sort" and "action"
It has been replaced by "symptoms" and "problems." Where the book
In the example, the case where the stakeholders do not match is shown.
The same applies to the case where the words do not match.
【0090】このように、緩和手法4では、制約緩和精
製装置32は、表層から概念への変換による制約緩和を
行い、具体的には、制約緩和指示装置31からキーワー
ド抽出ルール、表現、キーワードの入力を受けて、キー
ワードの部分(本例のように係り受けの場合には、係り
語或いは受け語)の表層とキーワード抽出ルールの該当
部分の表層との共通概念に置き換える方法により当該ル
ールの制約を緩和する。As described above, in the relaxation method 4, the constraint relaxation refining device 32 performs constraint relaxation by conversion from the surface layer to the concept. More specifically, the constraint relaxation instructing device 31 transmits the keyword extraction rules, expressions, and keywords. It receives the input and replaces it with the common concept of the surface of the keyword part (in the case of the dependency, in the case of the dependency, the received word) and the surface of the corresponding part of the keyword extraction rule, the restriction of the rule is applied. To relax.
【0091】制約緩和ルール候補提示装置33は、例え
ば上記した制約緩和精製装置32によって精製された制
約緩和後のキーワード抽出ルールの候補(本例では、緩
和手法1により生成されるルール及び緩和手法2により
生成されるルール及び緩和手法3により生成されるルー
ル及び緩和手法4により生成されるルール)をユーザに
提示し、ユーザが提示された候補の中から1個を選択し
た場合に、当該選択の指示に従って上書き処理を行う機
能を有している。つまり、制約緩和ルール候補提示装置
33では、ユーザにより選択されたルールが制約緩和後
のキーワード抽出ルールとして決定され、当該ルールが
キーワード抽出ルール保持装置4中の制約緩和前のルー
ルに上書きされる。The constraint mitigation rule candidate presentation device 33 is, for example, a keyword extraction rule candidate after the constraint mitigation refined by the constraint mitigation refinement device 32 (in this example, the rule generated by the mitigation method 1 and the relaxation method 2). And the rule generated by the relaxation method 3 and the rule generated by the relaxation method 4) to the user, and when the user selects one of the presented candidates, It has a function to perform overwrite processing according to instructions. That is, in the restriction mitigation rule candidate presentation device 33, the rule selected by the user is determined as the keyword extraction rule after the restriction mitigation, and the rule is overwritten with the rule in the keyword extraction rule holding device 4 before the restriction mitigation.
【0092】上記と同様に、例えばキーワード抽出ルー
ルEr2を例とすると、この場合の候補は上記したEre2, E
rg2, Erg2', Eri2, Erm2, Erm2', Erm2'', Erm2'''とな
り、例えば図10に示すような内容がユーザに対して表
示される。例えばユーザが同図中の“1”を選択した場
合には、Ere2がキーワード抽出ルール保持装置4中のEr
2に上書きされ、また、例えばユーザが同図中の“元ル
ール”を選択した場合には、上書き処理は行われずに、
Er2がそのままキーワード抽出ルール保持装置4中に残
る。Similarly to the above, taking the keyword extraction rule Er 2 as an example, the candidates in this case are Ere 2 , E
rg 2 , Erg 2 ′, Eri 2 , Erm 2 , Erm 2 ′, Erm 2 ″, Erm 2 ′ ″, for example, the contents shown in FIG. 10 are displayed to the user. For example, if the user selects “1” in the figure, Ere 2 in the keyword extraction rule holding device 4
2 is overwritten, and for example, when the user selects the “original rule” in FIG.
Er 2 remains in the keyword extraction rule holding device 4 as it is.
【0093】以上のように、本例のキーワード抽出ルー
ル精製支援装置では、例えばキーワード抽出装置のパタ
ーンマッチング装置3が行うマッチングの結果を受け
て、ユーザの判断や選択に従ってキーワード抽出ルール
の制約を緩和していくことができ、これにより、例えば
文書に合わせて既存のキーワード抽出ルールの制約緩和
処理を繰り返して行うことによって当該ルールの精製を
実現することができる。As described above, in the keyword extraction rule refining support device of the present example, upon receiving the result of the matching performed by the pattern matching device 3 of the keyword extraction device, for example, the restrictions on the keyword extraction rule are relaxed according to the user's judgment and selection. Thus, for example, the refining of the existing keyword extraction rule can be realized by repeatedly performing the constraint relaxation processing of the existing keyword extraction rule according to the document.
【0094】次に、本発明の第3実施例に係るキーワー
ド抽出ルール精製支援装置を説明する。本例のキーワー
ド抽出ルール精製支援装置の構成は、例えば上記第1実
施例の図1や上記第2実施例の図7に示したものとほぼ
同様であり、本例では、更に、本発明に言うマージ手段
を構成するマージ機能(図示せず)を備えており、この
マージ機能はキーワード抽出ルールをマージ(統合)す
る機能を有している。Next, a keyword extraction rule refinement support device according to a third embodiment of the present invention will be described. The configuration of the keyword extraction rule refining support device of this example is almost the same as that shown in FIG. 1 of the first embodiment and FIG. 7 of the second embodiment, for example. A merging function (not shown) constituting the merging means is provided, and this merging function has a function of merging (unifying) keyword extraction rules.
【0095】なお、上記図1や上記図7に示したものと
同様な機能を有する構成部分1〜5については、同図に
示したのと同じ符号を用いて示す。また、説明の便宜上
から、上記第1実施例や上記第2実施例で示したのと同
様な構成については、本例では、説明を省略する。Note that components 1 to 5 having the same functions as those shown in FIGS. 1 and 7 are denoted by the same reference numerals as those shown in FIG. Further, for the sake of convenience of explanation, in the present embodiment, the description of the same configuration as that shown in the first embodiment and the second embodiment is omitted.
【0096】本例のマージ機能は、例えばキーワード抽
出ルール保持装置4に保持されるキーワード抽出ルール
のマージを任意の時点で行うことができる機能を有して
おり、以下で、この機能について具体的に説明する。一
例として、キーワード抽出ルール保持装置4によって保
持されるキーワード抽出ルールの中に、次のような2個
のキーワード抽出ルールEr3、 Er4があるとする。 Er3:({[印字状態]}, {が, は}, {“でき(否)”, “し
(否)”}) → {f} Er4:({[印字状態]}, {が, は}, {“な(い)”}) → {f}The merging function of the present example has a function of merging keyword extraction rules held in the keyword extraction rule holding device 4 at any time, for example. Will be described. As an example, it is assumed that the following two keyword extraction rules Er 3 and Er 4 are included in the keyword extraction rules held by the keyword extraction rule holding device 4. Er 3 : ({[printing status]}, {but, is}, {“yes (no)”, “yes
(No) ”)) → {f} Er 4 : ({[printing state]}, {but, wo}, {“ na (i) ”}) → {f}
【0097】このとき、この2個のキーワード抽出ルー
ルを1個のキーワード抽出ルールにマージすると、ユー
ザによる見易さを改善することができ、マッチングのス
ピードのアップを図ることができ、抽出ルール精製の精
度のアップを図ることができるといった効果を得ること
ができる。具体的には、上記したEr3、Er4をマージして
得られるキーワード抽出ルールEr 34は次のようになる。 Er34:({[印字状態]}, {が, は}, {“でき(否)”, “し
(否)”, “な(い)”}) →{f}At this time, the two keyword extraction rules
Merged into a single keyword extraction rule
Can improve the readability of the
Speed up the extraction rule and refine the extraction rules.
Obtain the effect of increasing the degree
Can be. Specifically, the above ErThree, ErFourMerge
Keyword extraction rule Er obtained 34Is as follows. Er34: ({[Printing status]}, {but, is}, {“yes (no)”, “
(No) ”,“ na (i) ”}) → {f}
【0098】なお、この場合を例とすると、上記した2
個のキーワード抽出ルールEr3,、Er 4が本発明に言うル
ールで規定される第1キーワード群及び第2キーワード
群及び関係の内の1つのみが異なる複数のルールに相当
し、上記したキーワード抽出ルールEr34が本発明に言う
当該異なる部分を総和した1つのルールに相当する。Incidentally, taking this case as an example, the above-mentioned 2
Keyword extraction rules ErThree,, Er FourIs said in the present invention
Keywords and second keywords defined by rules
Only one of the groups and relationships is equivalent to different rules
And the above-mentioned keyword extraction rule Er34Says to the present invention
This corresponds to one rule in which the different parts are summed.
【0099】また、他の例として、キーワード抽出ルー
ル保持装置4によって保持されるキーワード抽出ルール
の中に、次のような2個のキーワード抽出ルールEr5、E
r6があるとする。 Er5:({[使い勝手]}, {が, は}, {“悪(い)”}) → {f} Er6:({[サービス]}, {が, は}, {“悪(い)”}) → {f}As another example, the following two keyword extraction rules Er 5 , E 5 are included in the keyword extraction rules held by the keyword extraction rule holding device 4.
and there is an r 6. Er 5 : ({[ease of use]}, {is, is}, {“evil”)} → {f} Er 6 : ({[service]}, {is, is}, {“evil ) ”}) → {f}
【0100】このとき、上記図3に示したシソーラスT1
における「使い勝手」、「サービス」の2個の概念に共
通する上位概念は「症状」であるので、上記したEr5、
Er6をマージして得られるキーワード抽出ルールEr56と
しては、一例として次のようなものが想定される。 Er56:({[症状]}, {が, は}, {“悪(い)”}) → {f}At this time, the thesaurus T 1 shown in FIG.
"Ease of use", because the higher-level concepts that are common to two of the concept of "service" is a "symptom" in, Er 5 described above,
The keyword extraction rule Er 56 obtained by merging the Er 6, as follows are assumed as an example. Er 56 : ({[symptoms]}, {but, is}, {“evil”)} → {f}
【0101】しかしながら、このようなマージを実行す
ると、元々包含されていた「使い勝手」及び「サービ
ス」の他に「故障」や「動作」や「品質」の概念も包含
されることになる。そこで、例えばユーザがこれを認め
る場合には、ユーザからの指示に従って、上記したEr56
をマージされたキーワード抽出ルールとする。一方、ユ
ーザがこれを認めない場合には、ユーザからの指示に従
って、例えば次のキーワード抽出ルールEr56'をマージ
されたキーワード抽出ルールとする。 Er56':({[使い勝手] , [サービス]}, {が, は}, {“悪
(い)”}) → {f}However, when such a merge is executed, the concepts of "failure", "operation", and "quality" are included in addition to the "usability" and "service" originally included. Therefore, for example, when the user recognizes this, according to the instruction from the user, the above Er 56
Is the merged keyword extraction rule. On the other hand, if the user does not recognize this, according to the instruction from the user, for example, the next keyword extraction rule Er 56 ′ is set as the merged keyword extraction rule. Er 56 ': ({[Convenience], [Service]}, {G, is}, {“Evil
(Yes) ”}) → {f}
【0102】なお、この場合を例とすると、上記した2
個のキーワード抽出ルールEr5、Er6が本発明に言うルー
ルで規定される第1キーワード群及び第2キーワード群
及び関係の内の1つのみが異なる複数のルールに相当
し、上記したキーワード抽出ルールEr56や上記したキー
ワード抽出ルールEr56'が本発明に言う当該異なる部分
を総和した1つのルールに相当する。Incidentally, taking this case as an example, the above-mentioned 2
Keyword extraction pieces of keyword extraction rule Er 5, Er 6 corresponds to only one different rules of the first keyword group and the second keyword group and relationships defined by the rules referred to in the present invention, the above-mentioned The rule Er 56 and the above-described keyword extraction rule Er 56 ′ correspond to one rule summing up the different parts according to the present invention.
【0103】ここで、本発明に係るキーワード抽出ルー
ル精製支援装置やキーワード抽出装置の構成としては、
必ずしも以上に示したものに限られず、種々な構成が用
いられてもよい。例えば、以上の実施例では、説明の便
宜上から、上記第1実施例においてキーワード抽出ルー
ルの制約を強化する機能を備えた装置を示す一方、上記
第2実施例においてキーワード抽出ルールの制約を緩和
する機能を備えた装置を示したが、このような制約強化
機能とこのような制約緩和機能との両方を備えた構成を
用いることも好ましい態様である。Here, the configuration of the keyword extraction rule refining support device and the keyword extraction device according to the present invention is as follows.
The configuration is not necessarily limited to the above, and various configurations may be used. For example, in the above embodiment, for the sake of convenience of explanation, while the device having the function of strengthening the constraint of the keyword extraction rule in the first embodiment is shown, the constraint of the keyword extraction rule is relaxed in the second embodiment. Although the device having the function has been described, it is also a preferable embodiment to use a configuration having both such a constraint strengthening function and such a constraint relaxing function.
【0104】また、例えば、以上の実施例では、好まし
い態様として、本発明に係るキーワード抽出ルール精製
支援装置やキーワード抽出装置により行われる各種の処
理としては、例えばプロセッサやメモリ等を備えたハー
ドウエア資源においてプロセッサがROMに格納された
制御プログラムを実行することにより制御される構成と
したが、例えば当該処理を実行するための各機能手段を
独立したハードウエア回路として構成することも可能で
ある。Also, for example, in the above embodiment, as a preferred mode, various processes performed by the keyword extraction rule refining support device and the keyword extraction device according to the present invention include, for example, a hardware including a processor and a memory. Although the configuration is such that the processor is controlled by executing the control program stored in the ROM in the resources, for example, each functional means for executing the processing may be configured as an independent hardware circuit.
【0105】また、本発明は上記のような制御プログラ
ムを格納したフロッピー(登録商標)ディスクやCD−
ROM等のコンピュータにより読み取り可能な記憶媒体
として把握することもでき、当該制御プログラムを記憶
媒体からコンピュータに入力してプロセッサに実行させ
ることにより、本発明に係る処理を遂行させることがで
きる。The present invention also relates to a floppy (registered trademark) disk or CD-ROM storing the above-described control program.
It can be understood as a computer-readable storage medium such as a ROM, and the processing according to the present invention can be performed by inputting the control program from the storage medium to the computer and causing the processor to execute the control program.
【0106】[0106]
【発明の効果】以上説明したように、本発明に係るキー
ワード抽出ルール精製支援装置や記憶媒体によると、例
えばキーワードを抽出すべきでないのに或るキーワード
抽出ルールとマッチしてしまうような場合であっても、
そのルールの制約を強化してマッチしないようにするこ
とができ、また、例えばキーワードを抽出すべきである
のにマッチするキーワード抽出ルールが存在しないよう
な場合であっても、その表現に近いキーワード抽出ルー
ルの制約を緩和してマッチするようにすることができ
る。こうしたことから、例えば文書に合わせて既存のキ
ーワード抽出ルールの制約強化処理や制約緩和処理を繰
り返して行うことによって、キーワード抽出ルールの精
製を実現することができる。As described above, according to the keyword extraction rule refining support apparatus and the storage medium of the present invention, for example, when a keyword is not to be extracted but matches a certain keyword extraction rule. Even so,
It is possible to strengthen the constraint of the rule so that it does not match, and even if, for example, a keyword should be extracted but there is no matching keyword extraction rule, a keyword close to its expression The constraint of the extraction rule can be relaxed so as to match. For this reason, for example, the keyword extraction rule can be refined by repeatedly performing the constraint strengthening process and the constraint relaxation process of the existing keyword extraction rule according to the document.
【図1】本発明の第1実施例に係るキーワード抽出ルー
ル精製支援装置を適用したキーワード抽出装置の一例を
示す図である。FIG. 1 is a diagram illustrating an example of a keyword extraction device to which a keyword extraction rule refinement support device according to a first embodiment of the present invention is applied.
【図2】形態素の要素位置の一例を示す図である。FIG. 2 is a diagram showing an example of element positions of a morpheme.
【図3】シソーラスのデータの一例を示す図である。FIG. 3 is a diagram showing an example of data of a thesaurus.
【図4】キーワード抽出ルール制約強化装置の構成例を
示す図である。FIG. 4 is a diagram illustrating a configuration example of a keyword extraction rule constraint strengthening device.
【図5】制約強化指示装置による表示例を示す図であ
る。FIG. 5 is a diagram illustrating a display example by the constraint strengthening instruction device.
【図6】制約強化ルール候補提示装置による表示例を示
す図である。FIG. 6 is a diagram illustrating a display example of the constraint strengthening rule candidate presentation device.
【図7】本発明の第2実施例に係るキーワード抽出ルー
ル精製支援装置を適用したキーワード抽出装置の一例を
示す図である。FIG. 7 is a diagram illustrating an example of a keyword extraction device to which a keyword extraction rule refinement support device according to a second embodiment of the present invention is applied.
【図8】キーワード抽出ルール制約緩和装置の構成例を
示す図である。FIG. 8 is a diagram illustrating a configuration example of a keyword extraction rule constraint relaxation device.
【図9】制約緩和指示装置による表示例を示す図であ
る。FIG. 9 is a diagram illustrating a display example by the constraint relaxation instructing device.
【図10】制約緩和ルール候補提示装置による表示例を
示す図である。FIG. 10 is a diagram showing a display example by the constraint relaxation rule candidate presentation device.
【図11】キーワード抽出装置の一例を示す図である。FIG. 11 is a diagram illustrating an example of a keyword extraction device.
1・・文書群保持装置、 2・・係り受け解析装置、3
・・パターンマッチング装置、 4・・キーワード抽出
ルール保持装置、5・・シソーラス、 6・・キーワー
ド抽出ルール制約強化装置、11・・制約強化指示装
置、 12・・制約強化精製装置、13・・制約強化ル
ール候補提示装置、 21・・類似ルール選択装置、2
2・・キーワード抽出ルール制約緩和装置、 31・・
制約緩和指示装置、32・・制約緩和精製装置、 33
・・制約緩和ルール候補提示装置、1. Document group holding device 2. Dependency analysis device 3,
··· Pattern matching device, 4 ·· Keyword extraction rule holding device, 5 ·· thesaurus, 6 ·· Keyword extraction rule constraint strengthening device, 11 ·· Constraint strengthening instruction device, 12 •• Constraint strengthening refinement device, 13 •• Constraint Reinforcement rule candidate presentation device, 21 ... Similar rule selection device, 2
2. Keyword extraction rule constraint relaxation device, 31
Constraint relaxation instruction device, 32 ... constraint relaxation refinement device, 33
..Constrained relaxation rule candidate presentation device
Claims (11)
ードに該当する語と第2キーワード群に含まれる第2キ
ーワードに該当する語とが所定の関係をもって出現する
表現から所定のキーワードを抽出するルールに基づいて
文書からキーワードを抽出するキーワード抽出装置の当
該ルールを精製することを支援するキーワード抽出ルー
ル精製支援装置であって、 ルールに適合した表現及び当該ルールをユーザに提示す
る提示手段と、 提示した表現に対して提示したルールを不適用とする指
示をユーザから受け付ける受付手段と、 当該指示を受け付けた場合に、提示した表現に対して提
示したルールが不適用となるように当該ルールを変更す
る制約強化手段と、 を備えたことを特徴とするキーワード抽出ルール精製支
援装置。1. A predetermined keyword is extracted from an expression in which a word corresponding to a first keyword included in a first keyword group and a word corresponding to a second keyword included in a second keyword group appear in a predetermined relationship. A keyword extraction rule refining support device that supports refining the rule of a keyword extraction device that extracts a keyword from a document based on the rule, and a presentation unit that presents an expression that conforms to the rule and the rule to a user, A receiving means for receiving from the user an instruction to apply the rule presented to the presented expression; and accepting the instruction so that, when the instruction is accepted, the rule presented to the presented expression is not applied. A keyword extraction rule refining support device, comprising: a constraint strengthening means for changing.
精製支援装置において、 制約強化手段は、提示した表現中の提示したルールに適
合する語に該当するキーワードを当該ルールで規定され
る当該語に対応したキーワード群から削除することによ
り、提示した表現に対して提示したルールが不適用とな
るようにすることを特徴とするキーワード抽出ルール精
製支援装置。2. The keyword extraction rule refining support device according to claim 1, wherein the constraint strengthening unit replaces a keyword corresponding to a word that matches the presented rule in the presented expression with the keyword specified by the rule. A keyword extraction rule refining support device characterized in that a presented rule is made unapplicable to a presented expression by deleting the keyword from a corresponding keyword group.
精製支援装置において、 制約強化手段は、提示した表現中の提示したルールに適
合する語に該当するキーワードを下位概念の複数のキー
ワードへ変換し、これら下位概念の複数のキーワードの
中で当該語に該当するキーワードを当該ルールで規定さ
れる当該語に対応したキーワード群から削除することに
より、提示した表現に対して提示したルールが不適用と
なるようにすることを特徴とするキーワード抽出ルール
精製支援装置。3. The keyword extraction rule refining support device according to claim 1, wherein the constraint strengthening means converts a keyword corresponding to a word that matches the presented rule in the presented expression into a plurality of subordinate concepts. , By removing the keyword corresponding to the word from the plurality of keywords of these lower concepts from the keyword group corresponding to the word specified in the rule, the rule presented for the presented expression is not applied. A keyword extraction rule refining support device characterized in that:
ードに該当する語と第2キーワード群に含まれる第2キ
ーワードに該当する語とが所定の関係をもって出現する
表現から所定のキーワードを抽出するルールに基づいて
文書からキーワードを抽出するキーワード抽出装置の当
該ルールを精製することを支援するキーワード抽出ルー
ル精製支援装置であって、 ルールで規定される第1キーワード及び第2キーワード
及び関係の内の2つのみに適合した表現及び当該ルール
をユーザに提示する提示手段と、 提示した表現に対して提示したルールを適用する指示を
ユーザから受け付ける受付手段と、 当該指示を受け付けた場合に、提示した表現に対して提
示したルールが適用されるように当該ルールを変更する
制約緩和手段と、 を備えたことを特徴とするキーワード抽出ルール精製支
援装置。4. A predetermined keyword is extracted from an expression in which a word corresponding to a first keyword included in a first keyword group and a word corresponding to a second keyword included in a second keyword group appear in a predetermined relationship. A keyword extraction rule refinement support device that assists a keyword extraction device that extracts a keyword from a document based on a rule to refine the rule, comprising: a first keyword and a second keyword defined by the rule; A presentation means for presenting to the user an expression that matches only two and the rule; a receiving means for receiving from the user an instruction to apply the rule presented to the presented expression; and a presentation means for receiving the instruction when the instruction is received. A constraint easing means for changing the rule so that the rule presented for the expression is applied. Keyword extraction rule refining assisting apparatus characterized.
精製支援装置において、 制約緩和手段は、提示した表現中の提示したルールに不
適合であった語の概念を示すキーワードを当該ルールで
規定される当該語に対応したキーワード群に追加するこ
とにより、提示した表現に対して提示したルールが適用
されるようにすることを特徴とするキーワード抽出ルー
ル精製支援装置。5. The keyword extraction rule refining support device according to claim 4, wherein the constraint relaxation unit defines a keyword indicating a concept of a word in the presented expression that does not conform to the presented rule in the rule. A keyword extraction rule refining support device, characterized in that a rule presented is applied to a presented expression by adding it to a keyword group corresponding to the word.
精製支援装置において、 制約緩和手段は、提示した表現中の提示したルールに不
適合であった語の概念を示すキーワードと当該ルールで
規定される当該語に対応したキーワード群中のキーワー
ドとの共通上位概念を示すキーワードに当該キーワード
群中の当該キーワードを置き換えることにより、提示し
た表現に対して提示したルールが適用されるようにする
ことを特徴とするキーワード抽出ルール精製支援装置。6. The keyword extraction rule refining support device according to claim 4, wherein the constraint relaxation unit is defined by a keyword indicating a concept of a word in the presented expression that does not conform to the presented rule and the rule. By replacing the keyword in the keyword group with a keyword indicating a common broad concept with the keyword in the keyword group corresponding to the word, the presented rule is applied to the presented expression. Keyword extraction rule refinement support device.
精製支援装置において、 制約緩和手段は、提示した表現中の提示したルールに不
適合であった語を当該ルールで規定される当該語に対応
したキーワード群に追加することにより、提示した表現
に対して提示したルールが適用されるようにすることを
特徴とするキーワード抽出ルール精製支援装置。7. The keyword extraction rule refining support device according to claim 4, wherein the constraint relaxation unit converts a word in the presented expression that does not conform to the presented rule to the word defined by the rule. A keyword extraction rule refining support apparatus characterized in that a rule presented is applied to a presented expression by adding it to a keyword group.
精製支援装置において、 制約緩和手段は、提示した表現中の提示したルールに不
適合であった語と当該ルールで規定される当該語に対応
したキーワード群中の表層的なキーワードとの共通上位
概念を示すキーワードに当該表層的なキーワードを置き
換えることにより、提示した表現に対して提示したルー
ルが適用されるようにすることを特徴とするキーワード
抽出ルール精製支援装置。8. The keyword extraction rule refining support device according to claim 4, wherein the constraint easing means corresponds to a word in the presented expression that does not conform to the presented rule and the word defined by the rule. Keyword extraction characterized by applying the presented rule to the presented expression by replacing the superficial keyword with a keyword indicating a common superordinate concept with the superficial keyword in the keyword group. Rule refinement support device.
記載のキーワード抽出ルール精製支援装置において、 ルールで規定される第1キーワード群及び第2キーワー
ド群及び関係の内の1つのみが異なる複数のルールを、
当該異なる部分を総和した1つのルールへ変換するマー
ジ手段を備えたことを特徴とするキーワード抽出ルール
精製支援装置。9. The keyword extraction rule refining support device according to claim 1, wherein only one of the first keyword group, the second keyword group, and the relation defined by the rule is provided. Different rules,
A refining support system for keyword extraction rules, comprising a merging means for converting the different parts into one rule that is the sum of the different parts.
を当該コンピュータの入力手段が読取可能に記憶した記
憶媒体において、 第1キーワード群に含まれる第1キーワードに該当する
語と第2キーワード群に含まれる第2キーワードに該当
する語とが所定の関係をもって出現する表現から所定の
キーワードを抽出するルールに基づいて文書からキーワ
ードを抽出するキーワード抽出装置の当該ルールを精製
することを支援するために用いられ、 当該プログラムは、ルールに適合した表現及び当該ルー
ルをユーザに提示する処理と、 提示した表現に対して提示したルールを不適用とする指
示をユーザから受け付ける処理と、 当該指示を受け付けた場合に、提示した表現に対して提
示したルールが不適用となるように当該ルールを変更す
る処理とを当該コンピュータに実行させることを特徴と
する記憶媒体。10. A storage medium in which a program to be executed by a computer is stored readable by input means of the computer, wherein a word corresponding to the first keyword included in the first keyword group and a second word included in the second keyword group are included. A keyword extraction device that extracts a keyword from a document based on a rule that extracts a predetermined keyword from an expression in which a word corresponding to the keyword appears with a predetermined relationship is used to assist in refining the rule. The program includes a process of presenting an expression that conforms to the rule and the rule to the user, a process of receiving from the user an instruction to apply the rule presented to the presented expression, and a process of presenting the instruction when the instruction is received. To change the rule so that the rule presented for the specified expression is not applicable Storage medium, characterized in that to execute the door to the computer.
を当該コンピュータの入力手段が読取可能に記憶した記
憶媒体において、 第1キーワード群に含まれる第1キーワードに該当する
語と第2キーワード群に含まれる第2キーワードに該当
する語とが所定の関係をもって出現する表現から所定の
キーワードを抽出するルールに基づいて文書からキーワ
ードを抽出するキーワード抽出装置の当該ルールを精製
することを支援するために用いられ、 当該プログラムは、ルールで規定される第1キーワード
及び第2キーワード及び関係の内の2つのみに適合した
表現及び当該ルールをユーザに提示する処理と、 提示した表現に対して提示したルールを適用する指示を
ユーザから受け付ける処理と、 当該指示を受け付けた場合に、提示した表現に対して提
示したルールが適用されるように当該ルールを変更する
処理とを当該コンピュータに実行させることを特徴とす
る記憶媒体。11. A storage medium storing a program to be executed by a computer in a manner readable by an input means of the computer, wherein a word corresponding to the first keyword included in the first keyword group and a second word included in the second keyword group are included. A keyword extraction device that extracts a keyword from a document based on a rule that extracts a predetermined keyword from an expression in which a word corresponding to the keyword appears with a predetermined relationship is used to assist in refining the rule. The program presents an expression that matches only two of the first keyword, the second keyword, and the relationship defined by the rule and a process of presenting the rule to the user, and applies the presented rule to the presented expression. The process of receiving an instruction from the user and, when the instruction is received, Storage medium and a process of changing the rule to the presented rule is applied, characterized in that to execute the computer to.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000114320A JP4042295B2 (en) | 2000-04-14 | 2000-04-14 | Keyword extraction rule refinement support device, storage medium, and keyword extraction rule refinement support method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000114320A JP4042295B2 (en) | 2000-04-14 | 2000-04-14 | Keyword extraction rule refinement support device, storage medium, and keyword extraction rule refinement support method |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2001297100A true JP2001297100A (en) | 2001-10-26 |
JP2001297100A5 JP2001297100A5 (en) | 2005-04-14 |
JP4042295B2 JP4042295B2 (en) | 2008-02-06 |
Family
ID=18626141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000114320A Expired - Fee Related JP4042295B2 (en) | 2000-04-14 | 2000-04-14 | Keyword extraction rule refinement support device, storage medium, and keyword extraction rule refinement support method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4042295B2 (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006323517A (en) * | 2005-05-17 | 2006-11-30 | Mitsubishi Electric Corp | Text classification device and program |
JP2006338133A (en) * | 2005-05-31 | 2006-12-14 | Ntt Data Corp | Information extracting device, information extracting method and program |
WO2007108529A1 (en) * | 2006-03-23 | 2007-09-27 | Nec Corporation | Information extraction system, information extraction method, information extraction program, and information service system |
JP2008008954A (en) * | 2006-06-27 | 2008-01-17 | Sony Ericsson Mobilecommunications Japan Inc | Personal digital assistant |
JP2011086167A (en) * | 2009-10-16 | 2011-04-28 | Nomura Research Institute Ltd | System for supporting creation of information extraction rule |
JP2014096164A (en) * | 2010-12-30 | 2014-05-22 | Facebook Inc | Composite term index method of graph data, computer readable medium, and system |
-
2000
- 2000-04-14 JP JP2000114320A patent/JP4042295B2/en not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006323517A (en) * | 2005-05-17 | 2006-11-30 | Mitsubishi Electric Corp | Text classification device and program |
JP2006338133A (en) * | 2005-05-31 | 2006-12-14 | Ntt Data Corp | Information extracting device, information extracting method and program |
JP4694258B2 (en) * | 2005-05-31 | 2011-06-08 | 株式会社エヌ・ティ・ティ・データ | Information extraction apparatus, information extraction method, and program |
WO2007108529A1 (en) * | 2006-03-23 | 2007-09-27 | Nec Corporation | Information extraction system, information extraction method, information extraction program, and information service system |
JP5083669B2 (en) * | 2006-03-23 | 2012-11-28 | 日本電気株式会社 | Information extraction system, information extraction method, information extraction program, and information service system |
US8886661B2 (en) | 2006-03-23 | 2014-11-11 | Nec Corporation | Information extraction system, information extraction method, information extraction program, and information service system |
JP2008008954A (en) * | 2006-06-27 | 2008-01-17 | Sony Ericsson Mobilecommunications Japan Inc | Personal digital assistant |
JP2011086167A (en) * | 2009-10-16 | 2011-04-28 | Nomura Research Institute Ltd | System for supporting creation of information extraction rule |
JP2014096164A (en) * | 2010-12-30 | 2014-05-22 | Facebook Inc | Composite term index method of graph data, computer readable medium, and system |
US9576060B2 (en) | 2010-12-30 | 2017-02-21 | Facebook, Inc. | Composite term index for graph data |
Also Published As
Publication number | Publication date |
---|---|
JP4042295B2 (en) | 2008-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5590039A (en) | Natural language processing apparatus and method for performing processing to analyze the meaning of an input sentence entered in the form of a natural language | |
US8484238B2 (en) | Automatically generating regular expressions for relaxed matching of text patterns | |
JPS62163173A (en) | Mechanical translating device | |
JP2001297100A (en) | Device for supporting refining of keyword extraction rule | |
JPH05120324A (en) | Language processing system | |
JPH05266069A (en) | Two-way machie translation system between chinese and japanese languages | |
US20050165712A1 (en) | Method for operating software object using natural language and program for the same | |
JP3429612B2 (en) | Dictionary registration device and machine translation device | |
JP4024137B2 (en) | Quantity expression search device | |
JP5879989B2 (en) | Machine translation system, machine translation method, and machine translation program | |
JP4881399B2 (en) | Bilingual information creation device, machine translation device, and program | |
JP2778025B2 (en) | Learning Co-occurrence Dictionary | |
JP4300056B2 (en) | CONCEPT EXPRESSION GENERATION METHOD, PROGRAM, STORAGE MEDIUM, AND CONCEPT EXPRESSION GENERATION DEVICE | |
JPH10207896A (en) | Method and device for retrieval term extension and method and device for information retrieval | |
JP3353647B2 (en) | Dictionary / rule learning device for machine translation system and storage medium storing dictionary / rule learning program for machine translation system | |
JP2004118461A (en) | Method and device for training language model, method and device for kana/kanji conversion, computer program, and computer readable recording medium | |
JP2011221662A (en) | Dictionary editing apparatus and program | |
JP2004264960A (en) | Example-based sentence translation device and computer program | |
JP2006235970A (en) | Source code search device, source code search method, source code search program, and recording medium which records source code search program | |
JP5454871B2 (en) | Dictionary evaluation support apparatus and program | |
JPS63136265A (en) | Mechanical translating device | |
JPS59140546A (en) | Forecasting conversion system | |
JPH04330565A (en) | Natural language processing system using universal file | |
JPH10340264A (en) | Machine translation device and computer-readable recording medium where machine translation processing program is recorded | |
JPH10307823A (en) | Translation method, translation device and recording medium storing translation program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040602 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040602 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070717 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070914 |
|
TRDD | Decision of grant or rejection written | ||
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20071003 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071023 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071105 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101122 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111122 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111122 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121122 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121122 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131122 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |