JPH1185766A - Method and device for extracting keyword and storage medium storing keyword extraction program - Google Patents
Method and device for extracting keyword and storage medium storing keyword extraction programInfo
- Publication number
- JPH1185766A JPH1185766A JP9245578A JP24557897A JPH1185766A JP H1185766 A JPH1185766 A JP H1185766A JP 9245578 A JP9245578 A JP 9245578A JP 24557897 A JP24557897 A JP 24557897A JP H1185766 A JPH1185766 A JP H1185766A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- verb
- phrase
- extracting
- conditional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、キーワード抽出方
法及び装置及びキーワード抽出プログラムを格納した記
憶媒体に係り、特に、情報案内サービスにおいて、利用
者からの問い合わせが自然文である場合に、検索キーと
して使用するキーワードを入力文から抽出することを可
能とする情報検索システムにおけるキーワード抽出方法
及び装置及びキーワード抽出プログラムを格納した記憶
媒体に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a keyword extracting method and apparatus, and a storage medium storing a keyword extracting program, and more particularly, to a search key in an information guidance service when an inquiry from a user is a natural sentence. The present invention relates to a keyword extraction method and apparatus in an information search system capable of extracting a keyword used as a keyword from an input sentence, and a storage medium storing a keyword extraction program.
【0002】[0002]
【従来の技術】自然文からのキーワード抽出において
は、形態素解析によって得られた単語集合から、指定し
た品詞、意味を持つ単語を抽出している。また、別の手
法としては、特開平9−114840に開示されている
ように、文献等のテキスト文に出現する頻度の多い単語
をキーワードとして抽出する統計的手法を用いている。2. Description of the Related Art In extracting keywords from natural sentences, words having a specified part of speech and meaning are extracted from a set of words obtained by morphological analysis. As another method, as disclosed in Japanese Patent Application Laid-Open No. 9-114840, a statistical method of extracting words frequently appearing in text sentences such as documents as keywords is used.
【0003】[0003]
【発明が解決しようとする課題】しかしながら、形態素
解析によって得られた単語集合から、指定した品詞、意
味を持つ単語を抽出する方法では、その単語の文中での
役割を考慮していないため、入力文においては重要でな
い単語もキーワードとして抽出してしまうという問題が
ある。However, in the method of extracting a word having a specified part of speech and meaning from a word set obtained by morphological analysis, the role of the word in the sentence is not taken into account. There is a problem that insignificant words are extracted as keywords in sentences.
【0004】また、このような重要でない単語を抽出し
ないようにするため、指定する品詞、意味の条件を制限
すると、逆に抽出すべき単語が抽出されないという問題
がある。例えば、「I want to buy a car to go to the
office 」という問い合わせ文に対し、「car dealer」
という分野が案内対象として対応するが、抽出キーワー
ドの条件を動詞と名詞にすると、分野に対応するキーワ
ードとして重要である「buy 」や「car 」のみならず、
重要でない「go」や「office」まで抽出される。条件を
名詞に制限すると、逆にキーワードとして重要な「buy
」が抽出されない。In order to prevent the extraction of such insignificant words, if the specified part of speech and the condition of the meaning are restricted, there is a problem that words to be extracted are not extracted. For example, "I want to buy a car to go to the
"car dealer" in response to the query "office"
Is the subject of guidance, but if the conditions of extracted keywords are verbs and nouns, not only "buy" and "car", which are important as keywords corresponding to the field,
Unimportant "go" and "office" are extracted. By restricting the condition to nouns, on the other hand, the keyword "buy
Is not extracted.
【0005】また、出現頻度を用いる統計的手法では、
検索システムへの問い合わせ文のように多くても2、3
文程度の短文では、単語の母数が少ないため、適切にキ
ーワードを抽出できないという問題がある。本発明は、
上記の点に鑑みなされたもので、キーワード抽出のノイ
ズを無くすことができ、検索システムの性能の向上を図
ることが可能なキーワード抽出方法及び装置及びキーワ
ード抽出プログラムを格納した記憶媒体を提供すること
を目的とする。In the statistical method using the appearance frequency,
At most a few, like queries to search systems
A short sentence of about a sentence has a problem that keywords cannot be appropriately extracted because the number of words is small. The present invention
In view of the above, it is possible to provide a keyword extraction method and apparatus, and a storage medium storing a keyword extraction program, which can eliminate noise in keyword extraction and can improve the performance of a search system. With the goal.
【0006】[0006]
【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。本発明は、自然文からキーワ
ードを抽出するキーワード抽出方法において、入力文と
して自然文が入力されると(ステップ1)、該自然文の
形態素解析及び構文解析を行い(ステップ2)、構文解
析された文の意味構造を求め(ステップ3)、キーワー
ド抽出規則を用いて、意味構造に基づいて構文解析され
た入力文の動詞に対する名詞句の役割及び句間の修飾関
係に基づいてキーワードを抽出する(ステップ4)。FIG. 1 is a diagram for explaining the principle of the present invention. According to the present invention, in a keyword extraction method for extracting a keyword from a natural sentence, when a natural sentence is input as an input sentence (step 1), morphological analysis and syntax analysis of the natural sentence are performed (step 2), and the syntax is analyzed. The semantic structure of the sentence is obtained (step 3), and the keyword is extracted based on the role of the noun phrase for the verb of the input sentence parsed based on the semantic structure and the modification relation between the phrases using the keyword extraction rule. (Step 4).
【0007】また、本発明は、キーワードを抽出する際
に、対象としている分野に応じて異なるキーワード抽出
規則を用いて、抽出するキーワードの種類を特定する。
また、本発明は、キーワードを抽出する際に、入力文か
ら、ユーザの要求を表す句である条件句を特定し、条件
句が動詞(以下、条件動詞)である場合に、該条件動詞
に対する名詞句の役割(以下、深層格)の種類及び該深
層格に格納されるキーワードの種類の組み合わせからな
るキーワード抽出規則を用いて、入力文中の動詞及び名
詞句に対しキーワードの種類を特定する。Further, according to the present invention, when extracting a keyword, the type of the keyword to be extracted is specified by using a different keyword extraction rule depending on the target field.
Further, when extracting a keyword, the present invention specifies, from an input sentence, a conditional phrase that is a phrase representing a user request, and when the conditional phrase is a verb (hereinafter, a conditional verb), specifies a conditional verb. A keyword type is specified for a verb and a noun phrase in an input sentence by using a keyword extraction rule including a combination of a role of a noun phrase (hereinafter referred to as a deep case) and a type of a keyword stored in the deep case.
【0008】また、本発明は、キーワードを抽出する際
に、入力文から、ユーザの要求を表す句である条件句を
特定し、条件句が職業を意味する名詞句(以下、条件名
詞句)である場合に、該条件名詞句を修飾するキーワー
ドの種類の組み合わせの規則を用いて、入力文中の動詞
及び名詞句に対してキーワードの種類を特定する。図2
は、本発明の原理構成図である。Further, according to the present invention, when extracting a keyword, a condition phrase which is a phrase representing a user request is specified from an input sentence, and the condition phrase is a noun phrase meaning an occupation (hereinafter, a condition noun phrase). In the case of, the type of the keyword is specified for the verb and the noun phrase in the input sentence using the rule of the combination of the type of the keyword that modifies the conditional noun phrase. FIG.
FIG. 1 is a diagram illustrating the principle of the present invention.
【0009】本発明は、自然文からキーワードを抽出す
るキーワード抽出装置であって、自然文を入力文として
入力する入力手段70と、単語の文法情報及び意味情報
を格納する単語情報記憶手段10と、単語情報記憶手段
10の内容を参照して入力文を形態素解析する形態素解
析手段20と、形態素解析された文の構文構造を求める
構文解析手段30と、構文解析手段により求められた構
文構造に基づいて入力文の意味構造を求める意味解析手
段40と、キーワードを抽出するための規則であるキー
ワード抽出規則を格納するキーワード抽出規則記憶手段
50と、キーワード抽出規則を用いて、意味構造に基づ
いて、動詞に対する名詞句の役割(以下、深層格)及
び、句間の修飾関係に基づいてキーワードを抽出するキ
ーワード抽出手段60とを有する。The present invention relates to a keyword extracting apparatus for extracting a keyword from a natural sentence, comprising an input means 70 for inputting a natural sentence as an input sentence, a word information storage means 10 for storing grammatical information and semantic information of the word. A morphological analysis means 20 for morphologically analyzing an input sentence with reference to the contents of the word information storage means 10, a syntactic analysis means 30 for obtaining a syntax structure of the morphologically analyzed sentence, and a syntax structure obtained by the syntax analysis means. Based on the semantic structure, the semantic analysis unit 40 for obtaining the semantic structure of the input sentence based on the semantic structure is used. Keyword extracting means 6 for extracting a keyword based on the role of a noun phrase for a verb (hereinafter referred to as a deep case) and the modification relation between the phrases With the door.
【0010】また、上記のキーワード抽出規則記憶手段
50は、対象としている分野に応じて異なるキーワード
抽出規則を格納し、キーワード抽出手段60は、抽出す
るキーワードの種類を特定し、キーワード抽出規則を参
照する第1の種類特定手段を含む。The keyword extraction rule storage means 50 stores different keyword extraction rules depending on the target field, and the keyword extraction means 60 specifies the type of keyword to be extracted and refers to the keyword extraction rule. And a first type specifying unit that performs the operation.
【0011】また、上記のキーワード抽出規則記憶手段
50は、ユーザの要求を表す条件句が動詞である場合
(以下、当該動詞を条件動詞と記す)に、該条件動詞の
深層格の種類及び該深層格に格納されるキーワードの種
類の組み合わせの規則を含み、キーワード抽出手段60
は、入力文から、ユーザの要求を表す句である条件句を
特定する条件句抽出手段と、条件動詞の深層格の種類及
び該深層格に格納されるキーワードの種類の組み合わせ
規則を用いて、入力文中の動詞及び名詞句に対してキー
ワードの種類を特定する第2の種類特定手段を含む。When the condition phrase representing the user's request is a verb (hereinafter, the verb is referred to as a conditional verb), the keyword extraction rule storage means 50 stores the type of the deep case of the conditional verb and the The keyword extraction means 60 includes rules for combinations of types of keywords stored in deep cases.
From the input sentence, using a conditional phrase extracting means for specifying a conditional phrase that is a phrase representing the user's request, and a combination rule of the type of the deep case of the conditional verb and the type of the keyword stored in the deep case, A second type specifying means for specifying the type of the keyword for the verb and the noun phrase in the input sentence is included.
【0012】また、上記のキーワード抽出規則記憶手段
50は、ユーザの要求を表す条件句が名詞句(条件名詞
句)である場合に、該条件名詞句を修飾するキーワード
の種類の組み合わせの規則を含み、キーワード抽出手段
60は、条件名詞句を修飾するキーワードの種類の組み
合わせの規則を用いて、入力文中の動詞及び名詞句に対
してキーワードの種類を特定する第3の種類特定手段を
含む。When the condition phrase representing the user's request is a noun phrase (condition noun phrase), the keyword extraction rule storage means 50 stores the rule of the combination of the types of keywords for modifying the conditional noun phrase. The keyword extracting unit 60 includes a third type specifying unit that specifies the type of the keyword for the verb and the noun phrase in the input sentence by using the rule of the combination of the type of the keyword that modifies the conditional noun phrase.
【0013】本発明は、自然文からキーワードを抽出す
るキーワード抽出プログラムを格納した記憶媒体であっ
て、自然文を入力文として入力させる入力プロセスと、
単語の文法情報及び意味情報を用いて入力文を形態素解
析する形態素解析プロセスと、形態素解析された文の構
文構造を求める構文解析プロセスと、構文解析プロセス
により求められた構文構造に基づいて入力文の意味構造
を求める意味解析プロセスと、キーワードを抽出するた
めの規則であるキーワード抽出規則を用いて、意味構造
に基づいて、動詞に対する名詞句の役割(以下、深層
格)及び、句間の修飾関係に基づいてキーワードを抽出
するキーワード抽出プロセスとを有する。[0013] The present invention is a storage medium storing a keyword extraction program for extracting a keyword from a natural sentence, comprising: an input process for inputting a natural sentence as an input sentence;
A morphological analysis process for morphologically analyzing an input sentence using grammatical information and semantic information of a word, a parsing process for obtaining a syntactic structure of the morphologically analyzed sentence, and an input sentence based on a syntactic structure obtained by the parsing process Based on the semantic structure, the role of the noun phrase for the verb (hereinafter referred to as the deep case) and the inter-phrase modification, using the semantic analysis process for finding the semantic structure of A keyword extraction process for extracting a keyword based on the relationship.
【0014】また、上記のキーワード抽出プロセスは、
抽出するキーワードの種類を特定し、対象としている分
野に応じて異なる規則を参照する第1の種類特定プロセ
スを含む。また、上記のキーワード抽出プロセスは、入
力文から、ユーザの要求を表す句である条件句を特定す
る条件句抽出プロセスと、ユーザの要求を表す条件句が
動詞である場合(以下、当該動詞を条件動詞と記す)
に、該条件動詞の深層格の種類及び該深層格に格納され
るキーワードの種類の組み合わせの規則を用いて、入力
文中の動詞及び名詞句に対してキーワードの種類を特定
する第2の種類特定プロセスを含む。[0014] The above-described keyword extraction process includes:
The method includes a first type specifying process of specifying the type of the keyword to be extracted and referring to a different rule depending on the target field. The above keyword extraction process includes a condition phrase extraction process that specifies a condition phrase that is a phrase representing a user's request from an input sentence, and a condition phrase that represents a user's request is a verb (hereinafter, the verb is referred to as a verb). Described as a conditional verb)
A second type specification for specifying a keyword type for a verb and a noun phrase in an input sentence using a rule of a combination of a deep case type of the conditional verb and a keyword type stored in the deep case. Including processes.
【0015】また、上記のキーワード抽出プロセスは、
ユーザの要求を表す条件句が名詞句である場合(以下、
当該名詞句を条件名詞句と記す)に、該条件名詞句を修
飾するキーワードの種類の組み合わせの規則を用いて、
入力文中の動詞及び名詞句に対してキーワードの種類を
特定する第3の種類特定プロセスを含む。[0015] The above-described keyword extraction process includes:
When the conditional phrase representing the user's request is a noun phrase (hereinafter,
The noun phrase is referred to as a conditional noun phrase), using a rule of a combination of types of keywords that modify the conditional noun phrase,
The method includes a third type specifying process for specifying the type of the keyword for the verb and the noun phrase in the input sentence.
【0016】上記のように、本発明は、文中において、
どの係り受け関係にある単語が文全体において重要であ
る単語かを考慮した上で、キーワードを抽出するので、
必要なキーワードのみを洩れなく抽出することが可能で
ある。また、対象としている分野毎に、抽出する規則を
変えることにより、分野毎に適切なキーワードの抽出を
行うことができる柔軟性を持つ。As described above, the present invention provides, in the text,
Keyword is extracted after considering which dependency word is important in the whole sentence,
Only necessary keywords can be extracted without omission. In addition, by changing the rule to be extracted for each target field, there is the flexibility to extract an appropriate keyword for each field.
【0017】[0017]
【発明の実施の形態】図3は、本発明のキーワード抽出
装置の構成を示す。同図に示すキーワード抽出装置10
0は、単語の文法情報、意味情報を格納する単語情報記
憶部10、単語情報記憶部10に格納されている情報を
用いて入力文を単語分割する形態素解析部20、形態素
解析結果に基づいて入力文の構文構造を求める構文解析
部30、構文構造に基づいて入力文の意味構造を求める
意味解析部40、キーワードを抽出するキーワード抽出
規則を格納するキーワード抽出規則記憶部50及び、キ
ーワード抽出規則を用いて意味構造に基づいてキーワー
ドを抽出する意図理解部60から構成される。FIG. 3 shows the configuration of a keyword extracting apparatus according to the present invention. Keyword extraction device 10 shown in FIG.
0 is a word information storage unit 10 that stores grammatical information and semantic information of a word, a morphological analysis unit 20 that divides an input sentence into words using information stored in the word information storage unit 10, and a morphological analysis result. A syntactic analysis unit 30 for obtaining the syntax structure of the input sentence, a semantic analysis unit 40 for obtaining the semantic structure of the input sentence based on the syntax structure, a keyword extraction rule storage unit 50 for storing keyword extraction rules for extracting keywords, and a keyword extraction rule And an intention understanding unit 60 for extracting a keyword based on the semantic structure using the keyword.
【0018】次に、本発明のキーワード抽出の動作を説
明する。図4は、本発明のキーワード抽出の動作を示す
フローチャートである。 ステップ101) 自然文が入力されると、形態素解析
部20は、単語情報記憶部10の単語情報を参照して入
力文を単語分割する。 ステップ102) 形態素解析結果に基づいて、構文解
析部30は、入力文の構文構造を求める。Next, the operation of keyword extraction according to the present invention will be described. FIG. 4 is a flowchart showing the operation of keyword extraction according to the present invention. Step 101) When a natural sentence is input, the morphological analysis unit 20 divides the input sentence into words by referring to the word information in the word information storage unit 10. Step 102) Based on the result of the morphological analysis, the syntax analyzer 30 obtains the syntax structure of the input sentence.
【0019】ステップ103) 意味解析部40は、構
文構造に基づいて入力文の意味構造を求める。 ステップ104) 意図理解部60は、キーワード抽出
規則記憶部50に格納されているキーワード抽出規則を
用いて、意味構造に基づいてキーワードを抽出する。Step 103) The semantic analysis unit 40 obtains the semantic structure of the input sentence based on the syntax structure. Step 104) The intention understanding unit 60 extracts a keyword based on the semantic structure using the keyword extraction rule stored in the keyword extraction rule storage unit 50.
【0020】[0020]
【実施例】以下、本発明の一実施例を図面と共に説明す
る。 [第1の実施例]以下、第1の実施例を前述の図4に示
すフローに従って説明する。まず、入力文を“I want t
o buy a car to go to the office ”とする。An embodiment of the present invention will be described below with reference to the drawings. [First Embodiment] The first embodiment will be described below with reference to the flow chart shown in FIG. First, the input sentence is “I want t
o buy a car to go to the office.
【0021】上記の入力文が形態素解析部20に入力さ
れると、単語情報記憶部10の内容を参照して、入力文
を単語分割する。上記の入力文の例は、英文なので、各
単語は予めスペースで分割されている。従って、当該形
態素解析部20では、各単語の品詞を同定する処理を行
う。これにより、以下のような形態素解析結果が得られ
る。 I /N want /V to/PREP buy /V a /DE
T car /N to/PREP go/V to/PREP the /DET
office/N 構文解析部30は、上記の形態素解析結果を入力とし
て、句構造規則を用いて、入力文の構文構造を出力す
る。図5にその例を示す。When the above-mentioned input sentence is input to the morphological analysis section 20, the input sentence is divided into words by referring to the contents of the word information storage section 10. Since the example of the above input sentence is an English sentence, each word is divided in advance by a space. Therefore, the morphological analysis unit 20 performs a process of identifying the part of speech of each word. As a result, the following morphological analysis result is obtained. I / N want / V to / PREP buy / V a / DE
T car / N to / PREP go / V to / PREP the / DET
The office / N syntax analysis unit 30 receives the above morphological analysis result as input, and outputs a syntax structure of the input sentence using phrase structure rules. FIG. 5 shows an example.
【0022】次に、意味解析部40は、図5に示す構文
構造を入力として、各文法規則を用いて、格フレームで
表現された意味構造を出力する。動詞の深層格と、句間
の修飾関係を解析する。図6(a)にその例を示す。次
に、意図理解部60は、図6(a)に示す意味構造を入
力として、キーワード抽出規則記憶部50の内容を参照
して、キーワードを抽出する。Next, the semantic analysis unit 40 receives the syntax structure shown in FIG. 5 and outputs a semantic structure represented by a case frame using each grammar rule. Analyze the deep case of verbs and the modification relations between phrases. FIG. 6A shows an example thereof. Next, the intention understanding unit 60 extracts the keyword by referring to the contents of the keyword extraction rule storage unit 50 by using the meaning structure shown in FIG.
【0023】図6(b)は、キーワード抽出規則の例で
ある。当該規則は、図6(b)において表されている意
味構造に対しては、所定の位置(太枠)の動詞はユーザ
の要求を表すものだとして動詞キーワードに、その対象
格である物、事、人、職業の意味をもつ名詞句は、商品
キーワードにすることを示している。意図理解部60
は、キーワード抽出規則記憶部50に格納されているキ
ーワード抽出規則のうち、図6(b)の意味構造が入力
文の意味構造(図6(a))と一致することを判断し、
当該抽出規則に基づいて「buy」を動詞キーワード、
「car」を商品キーワードとして抽出する。その結果
を図6(c)に示す。FIG. 6B is an example of a keyword extraction rule. The rule is that, for the semantic structure shown in FIG. 6B, a verb at a predetermined position (thick frame) indicates a user's request, A noun phrase having the meaning of thing, person, or occupation indicates that the keyword is used as a product keyword. Intention understanding unit 60
Determines that among the keyword extraction rules stored in the keyword extraction rule storage unit 50, the semantic structure of FIG. 6B matches the semantic structure of the input sentence (FIG. 6A),
Based on the extraction rule, “buy” is a verb keyword,
“Car” is extracted as a product keyword. The result is shown in FIG.
【0024】[第2の実施例]次に、第2の実施例とし
て、対象としている分野に応じて入力文から抽出するキ
ーワードの種類を特定する方法について説明する。図7
は、本発明の第2の実施例の対象とする分野に応じて入
力文から抽出するキーワードの種類を特定する動作のフ
ローチャートである。[Second Embodiment] Next, as a second embodiment, a method of specifying the type of a keyword to be extracted from an input sentence according to a target field will be described. FIG.
FIG. 9 is a flowchart of an operation of specifying a type of a keyword to be extracted from an input sentence according to a target field of the second embodiment of the present invention.
【0025】以下のフローチャートは、入力文として、
『8月に電車で神社めぐりに行きたい』が入力された場
合を例に説明する。 ステップ201〜ステップ203) 形態素解析部20
による形態素解析処理、構文解析部30による構文解析
処理、意味解析部40による意味解析処理を経て入力文
の意味構造が出力される。この例を図8(a)に示す。The following flow chart shows an input sentence
An example will be described in which "I want to go to a shrine tour by train in August" is input. Step 201 to step 203) Morphological analyzer 20
The semantic structure of the input sentence is output through the morphological analysis processing by the syntax analysis section, the syntax analysis processing by the syntax analysis section 30, and the semantic analysis processing by the semantic analysis section. This example is shown in FIG.
【0026】ステップ204) 意図理解部60におけ
る意図理解過程では、分野によらないキーワードである
商品、動詞、職業のキーワードを抽出する。即ち、意味
構造を入力として、キーワード抽出規則記憶部50から
分野によらないキーワード抽出規則(図8(b))を検
索し、意味構造(図8(a))とマッチングすることに
より、キーワード抽出結果(図8(c))を出力する。Step 204) In the intention understanding process in the intention understanding unit 60, keywords of goods, verbs, and occupations, which are keywords independent of the field, are extracted. That is, with the semantic structure as an input, the keyword extraction rule storage unit 50 searches the keyword extraction rule (FIG. 8B) irrespective of the field and matches the semantic structure (FIG. 8A) to extract the keyword. The result (FIG. 8C) is output.
【0027】ステップ205) 意図理解部60におけ
る分野推論過程は、キーワード抽出結果(図8(c))
を入力として、検索システムが案内する対象を分類する
分野名を推論する。図8(d)はその推論結果である。 ステップ206) 意図理解部60における意図理解過
程2は、分野に依存するキーワードを抽出する。即ち、
分野推論結果(図8(d))を入力として、キーワード
抽出規則記憶部50から、分野推論結果(図8(d))
の分野『観光案内』に対応するキーワード抽出規則を求
める。当該処理は、図9(a)に示す意味構造と、図9
(b)に示すキーワード抽出規則2をマッチングさせる
ことにより、図9(c)に示すキーワード抽出結果を出
力する。Step 205) The field inference process in the intention understanding unit 60 is a keyword extraction result (FIG. 8C).
Is used as an input to infer a field name for classifying a target to be guided by the search system. FIG. 8D shows the inference result. Step 206) In the intention understanding process 2 in the intention understanding unit 60, keywords depending on the field are extracted. That is,
The field inference result (FIG. 8D) is input from the keyword extraction rule storage unit 50 with the field inference result (FIG. 8D) as input.
For the keyword extraction rule corresponding to the field "Tourist information". This processing is performed by using the semantic structure shown in FIG.
By matching the keyword extraction rule 2 shown in (b), a keyword extraction result shown in FIG. 9C is output.
【0028】[第3の実施例]次に、第3の実施例とし
て、条件句が動詞(条件動詞)である場合に、条件動詞
の深層格の種類及びその深層格に格納されるキーワード
の種類の組み合わせの規則を格納したキーワード抽出規
則を用いて、入力文の動詞や名詞句に対してキーワード
の種類を特定する例について説明する。Third Embodiment Next, as a third embodiment, when the conditional phrase is a verb (conditional verb), the type of the deep case of the conditional verb and the keyword stored in the deep case are described. An example will be described in which a keyword type is specified for a verb or a noun phrase of an input sentence using a keyword extraction rule that stores a rule of a combination of types.
【0029】図10は、本発明の第3の実施例の意図理
解部の構成を示す。同図に示す意図理解部60は、条件
句抽出部61とキーワード抽出部62から構成される。
ここで、条件句とは、質問文の中心をなす語句で、その
他のキーワードを抽出する処理の基点となるものであ
る。以下に条件句抽出部61の動作を説明する。FIG. 10 shows the structure of the intention understanding section of the third embodiment of the present invention. The intention understanding unit 60 shown in FIG. 1 includes a conditional phrase extraction unit 61 and a keyword extraction unit 62.
Here, the conditional phrase is a word that forms the center of the question sentence, and serves as a base point for processing for extracting other keywords. The operation of the condition phrase extraction unit 61 will be described below.
【0030】図11は、本発明の第3の実施例の条件句
抽出部の動作のフローチャートである。以下の条件句抽
出処理では、日本語を入力した場合の条件句を抽出する
場合の処理を示す。ここで、「知りたい」「教えてほし
い」など、検索システムに店の情報を要求するのに用い
られる動詞を要求動詞と定義する。FIG. 11 is a flowchart of the operation of the conditional phrase extraction unit according to the third embodiment of the present invention. In the following conditional phrase extraction process, a process for extracting a conditional phrase when Japanese is input is shown. Here, a verb used to request information of a store from the search system, such as “I want to know” or “I want to teach”, is defined as a request verb.
【0031】ステップ301) 最初に入力文の最終文
節の動詞が要求動詞か否かを判定し、要求動詞でない場
合にはステップ302に移行し、要求動詞である場合に
はステップ303に移行する。 ステップ302) 要求動詞でない場合(例えば、「買
いたい」「食べたい」等)には、その最終文節の動詞を
条件句とする。Step 301) First, it is determined whether or not the verb of the last phrase of the input sentence is a request verb. If the verb is not a request verb, the process proceeds to step 302, and if it is a request verb, the process proceeds to step 303. Step 302) If the verb is not a request verb (for example, "want to buy" or "want to eat"), the verb of the last phrase is used as a conditional phrase.
【0032】ステップ303) 要求動詞である場合に
は、最終文節の動詞の対象格の意味が物、事、人かを判
断し、物、事、人の場合(例えば、入力文「ピアノを教
えてほしい」)には、ステップ304に移行し、そうで
ない場合にはステップ305に移行する。 ステップ304) 物、事、人の場合には、その最終文
節の動詞を条件句とする。Step 303) If the verb is a request verb, the meaning of the target case of the verb in the final phrase is determined to be an object, a thing, or a person. ), The process proceeds to step 304. Otherwise, the process proceeds to step 305. Step 304) In the case of a thing, thing, or person, the verb of the last clause is used as a conditional phrase.
【0033】ステップ305) 最終文節の動詞の対象
格が職業または職業相当の代名詞(店、所、業者等)か
を判断し、職業または、職業相当の代名詞の場合(例え
ば、入力文「レストランを教えてほしい」)には、ステ
ップ306に移行し、そうでない場合にはステップ30
7に移行する。 ステップ306) 職業または、職業相当の代名詞であ
る場合には、職業が重要な句なので、職業を条件句とす
る。ここで、「レストランの住所を教えてほしい」の
「住所」や「電話番号」のように店の属性を表す項目を
主題とする。Step 305) It is determined whether the target case of the verb in the final phrase is a profession or a profession-equivalent pronoun (store, place, trader, etc.). Tell me), go to step 306, otherwise go to step 30
Move to 7. Step 306) If the occupation is a pronoun equivalent to the occupation, the occupation is an important phrase, so the occupation is set as the conditional phrase. Here, an item representing the attribute of the store, such as "address" or "telephone number" of "I want to know the address of the restaurant", is the subject.
【0034】ステップ307) 最終文節の動詞の対象
格が主題であり、主題を連体修飾する職業があるかを判
定し、ある場合にはステップ308に移行し、そうでな
い場合にはステップ309に移行する。 ステップ308) 主題を連体修飾する職業がある場合
には、この連体修飾している職業が重要な句なので、職
業を条件句とする。Step 307) It is determined whether or not the target case of the verb in the final phrase is the subject, and if there is an occupation that modifies the subject, the process proceeds to step 308. If not, the process proceeds to step 309. I do. Step 308) If there is an occupation that modifies the subject, since the occupation that modifies the subject is an important phrase, the occupation is used as the conditional phrase.
【0035】ステップ309) これ以外の場合には、
条件句は無しとする。 上記のフローチャートにおいて、「テレビ」のように、
入力文の最終文節が動詞でなく、商品(物、事、人)の
場合は、情報案内システムへの質問であることを仮定し
ているので、意味解析部40において、「(商品)の店
を知りたい」のような補完処理をして意味構造を出力す
る。これにより、意図理解部60の条件句抽出部61で
は、「店」は、職業相当の代名詞なので、ステップ30
6において、「店」が条件句となる。Step 309) Otherwise,
There is no conditional phrase. In the above flowchart, like "TV"
If the last phrase of the input sentence is not a verb but a product (thing, thing, person), it is assumed that the input sentence is a question to the information guide system. And output the semantic structure. As a result, in the conditional phrase extraction unit 61 of the intention understanding unit 60, since “shop” is a pronoun equivalent to the occupation,
At 6, "store" is the conditional phrase.
【0036】「レストラン」のように、入力文の最終文
節が動詞でなく職業の場合や、「レストランの住所」の
ように主題である場合は、やはり情報案内システムへの
質問であることを仮定し、意味解析部40において、入
力文の後に「を知りたい」を補完して意味構造を出力す
る。これにより、意図理解部60の条件句抽出部61で
は、ステップ305または、ステップ307がマッチ
し、職業が条件句となる。If the last sentence of the input sentence is not a verb but a profession like "restaurant", or if it is a subject like "restaurant address", it is also assumed that the question is to the information guidance system. Then, the semantic analysis unit 40 complements “I want to know” after the input sentence and outputs a semantic structure. As a result, in the conditional phrase extracting unit 61 of the intention understanding unit 60, step 305 or step 307 matches, and the occupation becomes the conditional phrase.
【0037】次に、キーワード抽出部62の動作につい
て説明する。図12は、本発明の第3の実施例のキーワ
ード抽出規則の例であり、当該規則は、キーワード抽出
規則記憶部50に格納されている。条件動詞の深層格の
種類及びその深層格に格納されるキーワードの種類の組
み合わせの規則の例である。ここで、入力文「レストラ
ンでパーティーをしたい」が入力された時の意味構造を
図13に示す。Next, the operation of the keyword extracting unit 62 will be described. FIG. 12 is an example of a keyword extraction rule according to the third embodiment of the present invention. The rule is stored in the keyword extraction rule storage unit 50. It is an example of the rule of the combination of the type of the deep case of the conditional verb and the type of the keyword stored in the deep case. Here, FIG. 13 shows a semantic structure when the input sentence “I want to have a party at a restaurant” is input.
【0038】意図理解部60は、条件句抽出部61によ
り、動詞「する」を条件句と特定する。キーワード抽出
部62では、条件句が動詞である抽出規則について順次
入力の意味構造と照合していく。図12の規則1は、条
件動詞の対象格が物、事、人、職業の意味をもつ名詞句
ならば、その名詞句を商品キーワードに、条件動詞を動
詞キーワードにすることを表している。意図理解部60
は、対象格の意味構造が規則1の構造と一致するので、
「パーティー」を商品キーワードに、「する」を動詞キ
ーワードにする。The intention understanding unit 60 specifies the verb “do” as a conditional phrase by the conditional phrase extracting unit 61. The keyword extraction unit 62 sequentially compares the extraction rule whose conditional phrase is a verb with the semantic structure of the input. Rule 1 in FIG. 12 indicates that if the target case of the conditional verb is a noun phrase having the meaning of thing, thing, person, or occupation, the noun phrase is used as a product keyword, and the conditional verb is used as a verb keyword. Intention understanding unit 60
Is because the semantic structure of the target case matches the structure of rule 1,
“Party” is a product keyword, and “do” is a verb keyword.
【0039】また、図12の規則2では、条件動詞の場
所格が職業の意味を持つ名詞句ならば、その名詞句を職
業キーワードにすることを表している。意図理解部60
は、場所格の意味構造が規則2の構造と一致するので、
「レストラン」を職業キーワードにする。入力文『イン
ターネットを利用できる機器を買いたい』の意味構造
を、図14に示す。意図理解部60は、条件句抽出部6
1により、動詞「買う」を条件句と特定する。図12の
規則3は、条件動詞の対象格が物語尾、事語尾の意味を
もつ名詞句であり、その名詞句に修飾する動詞があり、
さらにその動詞の対象格が物、事、人、職業の意味をも
つ名詞句の場合のキーワードの種類の特定の規則を表し
ている。Rule 2 in FIG. 12 indicates that if the place verb of the conditional verb is a noun phrase having the meaning of occupation, the noun phrase is used as the occupation keyword. Intention understanding unit 60
Is because the semantic structure of the locative matches the structure of Rule 2,
“Restaurant” is used as the occupation keyword. FIG. 14 shows the semantic structure of the input sentence “I want to buy a device that can use the Internet”. The intention understanding unit 60 includes the conditional phrase extraction unit 6
1, the verb “buy” is specified as a conditional phrase. Rule 3 in FIG. 12 is a noun phrase in which the target case of the conditional verb has the meaning of a story tail or a word tail, and the noun phrase has a verb to modify,
Further, it indicates a specific rule of the type of keyword when the target case of the verb is a noun phrase having the meaning of thing, thing, person, or occupation.
【0040】意図理解部60は、対象格の意味構造が図
12の規則3の構造と一致するので、「インターネット
(事)を利用する(動詞)機器(物語尾)」を商品キー
ワードに、「買う」を動詞キーワードにする。この場
合、商品キーワードは「インターネット」+「利用す
る」という構造を持っており、分野推論過程(ステップ
205)では、「インターネット」+「利用する」はど
ういうものかをさらに推論することになる。Since the meaning structure of the target case matches the structure of Rule 3 in FIG. 12, the intention understanding unit 60 uses “(verb) device (story tail) using the Internet (thing)” as a product keyword and “ "Buy" as a verb keyword. In this case, the product keyword has a structure of “Internet” + “use”, and in the field inference process (step 205), what “internet” + “use” is further inferred.
【0041】次に、英語を入力したときの条件句抽出部
61の処理を説明する。図15は、本発明の第3の実施
例の英語を入力したときの条件句抽出処理のフローチャ
ートである。図16は、以下の例のキーワード抽出規則
の例であり、図17は、意味構造の例を示す。英語入力
文に対しては、意味解析において動詞の深層格、句間の
修飾関係、句間の主辞関係(主辞とは句に含まれる、文
法的に中心的な役割を果たす句のことである)を表す意
味構造が出力される。例えば、図17は、入力文“I wa
nt to buy a car to go to the office ”の意味構造で
あるが、入力文全体の主辞は動詞「want」である。Next, the processing of the conditional phrase extraction unit 61 when English is input will be described. FIG. 15 is a flowchart of the conditional phrase extraction processing when English is input according to the third embodiment of this invention. FIG. 16 shows an example of a keyword extraction rule in the following example, and FIG. 17 shows an example of a semantic structure. For English input sentence, deep case of verb, modification relation between phrases, head relation between phrases in semantic analysis (the head is a phrase included in the phrase that plays a central grammatical role) ) Is output. For example, FIG. 17 shows the input sentence “I wa
nt to buy a car to go to the office ”, but the head of the entire input sentence is the verb“ want ”.
【0042】以下、図17の入力文を用いて処理フロー
を説明する。まず、入力文の主辞の動詞「want」
を、条件句抽出処理の対象とする(ステップ401)。
対象とする動詞が要求動詞であるかを判定する。ここで
は、対象とする動詞「want」は、検索システムへの
要求を表し得るので、要求動詞である(ステップ40
2)。対象とする動詞が要求動詞でない場合には、対象
とする動詞を条件句とする(ステップ403)。The processing flow will be described below using the input sentence of FIG. First, the verb "want" of the head of the input sentence
Is the target of the conditional phrase extraction processing (step 401).
It is determined whether the target verb is a request verb. Here, the target verb “want” is a request verb because it can represent a request to the search system (step 40).
2). If the target verb is not a request verb, the target verb is used as a conditional phrase (step 403).
【0043】対象とする動詞の対象格が動詞であるかを
判定し、動詞である場合にはステップ405に移行す
る。この場合の「want」の対象格は動詞「buy」
であるので(ステップ404)、新たな動詞「buy」
を新たな対象とする(ステップ405)。対象とする動
詞「buy」は、要求動詞ではないので、「buy」を
条件句とする( ステップ403)。ステップ406以降
の処理は、図11のステップ303以降の処理と同様で
ある。It is determined whether or not the target case of the target verb is a verb. In this case, the target case of "want" is the verb "buy"
(Step 404), the new verb "buy"
Is set as a new target (step 405). Since the target verb "buy" is not a request verb, "buy" is used as a conditional phrase (step 403). The processing after step 406 is the same as the processing after step 303 in FIG.
【0044】「television」のように、入力文の主辞が
動詞でなく商品の場合は、日本語と同様に、意味解析部
40において、「know the shop of (商品)」のよう
な補完処理をして意味構造を出力する。これにより、意
図理解部60の条件句抽出部61では、「shop」は、職
業相当の名詞なので、ステップ408においてマッチ
し、「shop」が条件句となる。When the head of the input sentence is not a verb but a product, such as “television”, a supplementary process such as “know the shop of (product)” is performed in the semantic analysis unit 40 in the same manner as in Japanese. And output the semantic structure. As a result, in the conditional phrase extraction unit 61 of the intention understanding unit 60, "shop" is a noun equivalent to the occupation, so it is matched in step 408, and "shop" is the conditional phrase.
【0045】「restaurant」のように、入力文の最終文
節が動詞でなく、職業の場合や、「the address of a r
estaurant 」のように、主題である場合も、日本語と同
様に、意味解析部40において、入力文の前に「know」
を補完して意味構造を出力する。これにより、意図理解
部60の条件句抽出部61では、ステップ408とステ
ップ410においてマッチし、職業が条件句となる。As in the case of "restaurant", the last phrase of the input sentence is not a verb but is a occupation, or "the address of ar
Even in the case of a subject such as "estaurant", in the same way as in Japanese, the semantic analysis unit 40 precedes the input sentence with "know"
And output the semantic structure. As a result, the conditional phrase extraction unit 61 of the intention understanding unit 60 matches in step 408 and step 410, and the occupation becomes the conditional phrase.
【0046】次に、英語を入力した場合のキーワード抽
出部62の処理を説明する。意味構造として、図17に
示すものを用いて説明する。意図理解部60は、条件句
抽出部61により動詞「buy」を条件句と特定する。
キーワード抽出部62では、キーワード抽出規則記憶部
50に格納されている、条件句が動詞である抽出規則に
ついて順次入力の意味構造と照合していく。意図理解部
60は、対象格の意味構造が図16に示すキーワード抽
出規則の構造と一致するので、「car」を商品キーワ
ードに、「buy」を動詞キーワードにする。条件動詞
の目的格である動詞をキーワードにする抽出規則は、キ
ーワード抽出規則記憶部50にはないので、「go」は
キーワードにならない。Next, the processing of the keyword extracting unit 62 when English is input will be described. Description will be made using the semantic structure shown in FIG. The intention understanding unit 60 specifies the verb “buy” as a conditional phrase by the conditional phrase extracting unit 61.
In the keyword extraction unit 62, the extraction rules stored in the keyword extraction rule storage unit 50 and whose conditional phrases are verbs are sequentially collated with the semantic structure of the input. Since the meaning structure of the target case matches the structure of the keyword extraction rule shown in FIG. 16, the intention understanding unit 60 uses “car” as the product keyword and “buy” as the verb keyword. Since there is no extraction rule in the keyword extraction rule storage unit 50 that uses a verb as a target case of a conditional verb as a keyword, “go” is not a keyword.
【0047】[第4の実施例]次に、第4の実施例とし
て、条件句が職業を意味する名詞句である場合に、条件
名詞句を修飾するキーワードの種類の組み合わせの規則
を用いて、入力文中の動詞や名詞句に対してキーワード
の種類を特定する例を説明する。図18は、本発明の第
4の実施例のキーワード抽出規則の例を示す。[Fourth Embodiment] Next, as a fourth embodiment, when the conditional phrase is a noun phrase meaning an occupation, the rule of the combination of the types of keywords for modifying the conditional noun phrase is used. An example in which the type of keyword is specified for a verb or a noun phrase in an input sentence will be described. FIG. 18 shows an example of a keyword extraction rule according to the fourth embodiment of the present invention.
【0048】同図に示すキーワード抽出規則は、キーワ
ード抽出規則記憶部50に格納されている、条件名詞句
に修飾するキーワードの種類の組み合わせの規則の例で
ある。入力文『ステーキの食べられるレストラン』の意
味構造を図19に示す。意図理解部60の条件句抽出部
61により職業「レストラン」を条件句と特定する。キ
ーワード抽出部62では、条件句が職業であるキーワー
ド抽出規則について順次入力の意味構造と照合してい
く。図18の規則2では、条件名詞句に修飾する動詞が
あり、さらに、その動詞の対象格が物、事、人、職業の
意味をもつ名詞句の場合のキーワードの種類の特定の規
則を表している。意図理解部60は、入力の意味構造が
図18の規則2の構造と一致するので、「ステーキ」を
商品キーワードに、「食べる」を動詞キーワードに、
「レストラン」を職業キーワードにする。The keyword extraction rule shown in FIG. 6 is an example of a rule of a combination of types of keywords to be modified into conditional noun phrases stored in the keyword extraction rule storage unit 50. FIG. 19 shows the meaning structure of the input sentence “restaurant where steak can be eaten”. The occupation “restaurant” is specified as a conditional phrase by the conditional phrase extracting unit 61 of the intention understanding unit 60. The keyword extraction unit 62 sequentially compares the keyword extraction rules whose conditional phrase is occupation with the semantic structure of the input. In rule 2 of FIG. 18, there is a verb to be modified to a conditional noun phrase, and further, a specific rule of the type of keyword when the target case of the verb is a noun phrase having the meaning of thing, thing, person, or occupation is shown. ing. Since the meaning structure of the input matches the structure of rule 2 in FIG. 18, the intention understanding unit 60 specifies “steak” as a product keyword, “eats” as a verb keyword,
“Restaurant” is used as the occupation keyword.
【0049】入力文『restaurant famous for steak 』
の意味構造を図19(b)に示す。意図理解部60は、
条件句抽出部61により、職業「restaurant」を条件句
と特定する。図18の規則3では、条件名詞句に修飾す
る形容詞があり、さらに、その形容詞に修飾する物、
事、人、職業の意味をもつ名詞句がある場合のキーワー
ドの種類の特定の規則を表している。意図理解部60
は、入力の意味構造が図18の規則3の構造と一致する
ので、「steak」を商品キーワードに、「restaurant」
を職業キーワードにする。Input sentence "restaurant famous for steak"
Is shown in FIG. 19 (b). The intention understanding unit 60
The occupation “restaurant” is specified as a conditional phrase by the conditional phrase extracting unit 61. In rule 3 of FIG. 18, there is an adjective to modify the conditional noun phrase, and further, a thing to modify to the adjective,
This represents a specific rule for the type of keyword when there is a noun phrase having the meaning of thing, person, or occupation. Intention understanding unit 60
Since the semantic structure of the input matches the structure of rule 3 in FIG. 18, "steak" is used as a product keyword and "restaurant"
Is the occupation keyword.
【0050】このように、本発明は、入力文に対して形
態素解析、構文解析、意味解析の処理を行うことによ
り、動詞の深層格及び、句間等の修飾関係を表した意味
構造を得る。その意味構造を入力として、単語間の係り
受け関係を考慮したキーワード抽出規則に基づいてキー
ワードを抽出することが可能となる。また、本発明をプ
ログラム(ソフトウェア)で構築し、キーワ−ド抽出を
行うコンピュータに接続されるディスク装置やフロッピ
ーディスク、CD−ROM等の可搬記憶媒体に格納し、
必要に応じてインストールすることにより汎用的なキー
ワ−ド抽出が可能となる。なお、本発明は、上記の実施
例に限定されることなく、特許請求の範囲内で種々変更
・応用が可能である。As described above, according to the present invention, a morphological analysis, a syntactic analysis, and a semantic analysis process are performed on an input sentence, thereby obtaining a semantic structure representing a deep case of a verb and a modification relation between phrases. . Using the semantic structure as an input, a keyword can be extracted based on a keyword extraction rule that takes into account the dependency relationship between words. Further, the present invention is constructed by a program (software) and stored in a portable storage medium such as a disk device, a floppy disk, or a CD-ROM connected to a computer for extracting a keyword.
By installing as needed, general-purpose keywords can be extracted. It should be noted that the present invention is not limited to the above-described embodiment, but can be variously modified and applied within the scope of the claims.
【0051】[0051]
【発明の効果】上述のように、本発明によれば、文中に
おいて、どの係り受け関係にある単語が文全体において
重要である単語かを表現した規則を用いてキーワードを
抽出するので、必要なキーワードのみを洩れなく抽出す
ることができる。このため、キーワード抽出のノイズを
無くすことができ、検索システムの性能向上の効果をも
たらす。As described above, according to the present invention, a keyword is extracted by using a rule that expresses which dependency word in a sentence is a word that is important in the entire sentence. Only keywords can be extracted without omission. For this reason, noise of keyword extraction can be eliminated, and the performance of the search system can be improved.
【0052】また、対象としている分野に応じて、抽出
する規則を変えることにより、分野毎に適切なキーワー
ドの抽出を行うことができ、検索システムの保守の上で
も柔軟性をもたらす。Also, by changing the rule to be extracted according to the target field, an appropriate keyword can be extracted for each field, thereby providing flexibility in maintenance of the search system.
【図1】本発明の原理を説明するための図である。FIG. 1 is a diagram for explaining the principle of the present invention.
【図2】本発明の原理構成図である。FIG. 2 is a principle configuration diagram of the present invention.
【図3】本発明のキーワード抽出装置の構成図である。FIG. 3 is a configuration diagram of a keyword extraction device of the present invention.
【図4】本発明のキーワード抽出の動作を示すフローチ
ャートである。FIG. 4 is a flowchart illustrating an operation of keyword extraction according to the present invention.
【図5】本発明の第1の実施例の構文構造解析結果の例
である。FIG. 5 is an example of a syntax structure analysis result of the first embodiment of the present invention.
【図6】本発明の第1の実施例のキーワード抽出処理を
説明するための図である。FIG. 6 is a diagram for explaining keyword extraction processing according to the first embodiment of this invention.
【図7】本発明の第2の実施例の対象とする分野に応じ
て入力文から抽出するキーワードの種類を特定する動作
のフローチャートである。FIG. 7 is a flowchart of an operation of specifying a type of a keyword to be extracted from an input sentence according to a target field of the second embodiment of the present invention.
【図8】本発明の第2の実施例のキーワード抽出処理を
説明するための図(その1)である。FIG. 8 is a diagram (part 1) for describing a keyword extraction process according to the second embodiment of the present invention;
【図9】本発明の第2の実施例のキーワード抽出処理を
説明するための図(その2)である。FIG. 9 is a diagram (part 2) for explaining the keyword extraction process according to the second embodiment of the present invention;
【図10】本発明の第3の実施例の意図理解部の構成図
である。FIG. 10 is a configuration diagram of an intention understanding unit according to a third embodiment of the present invention.
【図11】本発明の第3の実施例の条件句抽出部の動作
のフローチャートである。FIG. 11 is a flowchart illustrating the operation of a conditional phrase extraction unit according to the third embodiment of this invention.
【図12】本発明の第3の実施例のキーワード抽出規則
の例(その1)である。FIG. 12 is an example (part 1) of a keyword extraction rule according to the third embodiment of the present invention.
【図13】本発明の第3の実施例の意味構造の例(その
1)である。FIG. 13 is an example (part 1) of a semantic structure according to the third embodiment of the present invention.
【図14】本発明の第3の実施例の意味構造の例(その
2)である。FIG. 14 is an example (part 2) of the semantic structure of the third embodiment of the present invention.
【図15】本発明の第3の実施例の英語を入力としたと
きの条件句抽出処理のフローチャートである。FIG. 15 is a flowchart of a conditional phrase extraction process when English is input according to the third embodiment of this invention.
【図16】本発明の第3の実施例のキーワード抽出規則
の例(その2)である。FIG. 16 is an example (part 2) of a keyword extraction rule according to the third embodiment of this invention.
【図17】本発明の第3の実施例の意味構造の例(その
3)である。FIG. 17 is an example (part 3) of a semantic structure according to the third embodiment of the present invention.
【図18】本発明の第4の実施例のキーワード抽出規則
の例である。FIG. 18 is an example of a keyword extraction rule according to the fourth embodiment of the present invention.
【図19】本発明の第4の実施例の意味構造の例であ
る。FIG. 19 is an example of a semantic structure of the fourth embodiment of the present invention.
10 単語情報記憶手段,単語情報記憶部 20 形態素解析手段,形態素解析部 30 構文解析手段、構文解析部 40 意味解析手段、意味解析部 50 キーワード抽出規則記憶手段、キーワード抽出規
則記憶部 60 キーワード抽出手段、意図解析部 61 条件句抽出部 62 キーワード抽出部 70 入力手段DESCRIPTION OF SYMBOLS 10 Word information storage means, word information storage part 20 Morphological analysis means, morphological analysis part 30 Syntax analysis means, syntax analysis part 40 Semantic analysis means, semantic analysis part 50 Keyword extraction rule storage means, Keyword extraction rule storage part 60 Keyword extraction means , Intention analysis unit 61 conditional phrase extraction unit 62 keyword extraction unit 70 input means
Claims (12)
ード抽出方法において、 入力文として前記自然文が入力されると、該自然文の形
態素解析及び構文解析を行い、 構文解析された文の意味構造を求め、 キーワード抽出規則を用いて、意味構造に基づいて構文
解析された入力文の動詞に対する名詞句の役割及び句間
の修飾関係に基づいてキーワードを抽出することを特徴
とするキーワード抽出方法。In a keyword extraction method for extracting a keyword from a natural sentence, when the natural sentence is input as an input sentence, morphological analysis and syntax analysis of the natural sentence are performed, and the semantic structure of the parsed sentence is determined. A keyword extraction method comprising extracting a keyword based on a role of a noun phrase for a verb of an input sentence parsed based on a semantic structure using a keyword extraction rule and a modification relation between the phrases.
している分野に応じて異なるキーワード抽出規則を用い
て、抽出するキーワードの種類を特定する請求項1記載
のキーワード抽出方法。2. The keyword extracting method according to claim 1, wherein when extracting the keyword, the type of keyword to be extracted is specified using a different keyword extraction rule depending on a target field.
特定し、 前記条件句が動詞(以下、条件動詞)である場合に、該
条件動詞に対する名詞句の役割(以下、深層格)の種類
及び該深層格に格納されるキーワードの種類の組み合わ
せからなるキーワード抽出規則を用いて、前記入力文中
の動詞及び名詞句に対しキーワードの種類を特定する請
求項1記載のキーワード抽出方法。3. When extracting a keyword, a conditional phrase that is a phrase representing a user request is specified from the input sentence. If the conditional phrase is a verb (hereinafter, a conditional verb), the conditional verb A keyword type for a verb and a noun phrase in the input sentence using a keyword extraction rule composed of a combination of a role of a noun phrase (hereinafter referred to as a deep case) and a type of a keyword stored in the deep case The keyword extracting method according to claim 1, wherein
特定し、 前記条件句が職業を意味する名詞句(以下、条件名詞
句)である場合に、該条件名詞句を修飾するキーワード
の種類の組み合わせの規則を用いて、前記入力文中の動
詞及び名詞句に対してキーワードの種類を特定する請求
項1記載のキーワード抽出方法。4. When extracting a keyword, a condition phrase that is a phrase representing a user's request is specified from the input sentence, and the condition phrase is a noun phrase meaning a job (hereinafter, a condition noun phrase). 2. The keyword extraction method according to claim 1, wherein the keyword type is specified for the verb and the noun phrase in the input sentence by using a rule of a combination of the keyword types for modifying the conditional noun phrase.
ード抽出装置であって、 自然文を入力文として入力する入力手段と、 単語の文法情報及び意味情報を格納する単語情報記憶手
段と、 前記単語情報記憶手段の情報を参照して、前記入力文を
形態素解析する形態素解析手段と、 形態素解析された文の構文構造を求める構文解析手段
と、 前記構文解析手段により求められた構文構造に基づいて
前記入力文の意味構造を求める意味解析手段と、 キーワードを抽出するための規則であるキーワード抽出
規則を格納するキーワード抽出規則記憶手段と、 前記キーワード抽出規則を用いて、前記意味構造に基づ
いて、動詞に対する名詞句の役割(以下、深層格)及
び、句間の修飾関係に基づいてキーワードを抽出するキ
ーワード抽出手段とを有することを特徴とするキーワー
ド抽出装置。5. A keyword extracting device for extracting a keyword from a natural sentence, an input unit for inputting a natural sentence as an input sentence, a word information storage unit for storing grammatical information and semantic information of the word, and the word information Morphological analysis means for morphologically analyzing the input sentence with reference to information in the storage means; syntactic analysis means for obtaining a syntax structure of the morphologically analyzed sentence; and A semantic analysis unit for obtaining a semantic structure of the input sentence; a keyword extraction rule storage unit for storing a keyword extraction rule that is a rule for extracting a keyword; a verb based on the semantic structure using the keyword extraction rule; And a keyword extracting means for extracting a keyword based on a modification relation between the phrases and a role of a noun phrase (hereinafter referred to as a deep case) for the phrase. Keyword extracting device, characterized in that.
を格納し、 前記キーワード抽出手段は、 抽出するキーワードの種類を特定し、前記キーワード抽
出規則を参照する第1の種類特定手段を含む請求項5記
載のキーワード抽出装置。6. The keyword extraction rule storage means stores different keyword extraction rules depending on a target field, and the keyword extraction means specifies a type of a keyword to be extracted and refers to the keyword extraction rule. 6. The keyword extracting device according to claim 5, further comprising a first type specifying unit.
該動詞を条件動詞と記す)に、該条件動詞の深層格の種
類及び該深層格に格納されるキーワードの種類の組み合
わせの規則を含み、 前記キーワード抽出手段は、 前記入力文から、ユーザの要求を表す句である条件句を
特定する条件句抽出手段と、 前記条件動詞の深層格の種類及び該深層格に格納される
キーワードの種類の組み合わせ規則を用いて、前記入力
文中の動詞及び名詞句に対してキーワードの種類を特定
する第2の種類特定手段を含む請求項5記載のキーワー
ド抽出装置。7. The keyword extraction rule storage means, when a conditional phrase representing a user request is a verb (hereinafter, the verb is referred to as a conditional verb), the type of the deep case of the conditional verb and the deep case The keyword extraction means includes: a condition phrase extraction means for specifying, from the input sentence, a condition phrase that is a phrase representing a user request; and a deep case of the conditional verb. 6. The method according to claim 5, further comprising a second type specifying unit that specifies a type of a keyword for a verb and a noun phrase in the input sentence using a combination rule of the type of the keyword and the type of the keyword stored in the deep case. Keyword extraction device.
当該名詞句を条件名詞句と記す)に、該条件名詞句を修
飾するキーワードの種類の組み合わせの規則を含み、 前記キーワード抽出手段は、 前記条件名詞句を修飾するキーワードの種類の組み合わ
せの規則を用いて、前記入力文中の動詞及び名詞句に対
してキーワードの種類を特定する第3の種類特定手段を
含む請求項5記載のキーワード抽出装置。8. The keyword extraction rule storage means according to claim 1, wherein the condition phrase representing the user's request is a noun phrase (hereinafter, referred to as a noun phrase).
The term noun phrase is referred to as a conditional noun phrase), and the rule of the combination of the types of keywords that modify the conditional noun phrase is included. 6. The keyword extracting apparatus according to claim 5, further comprising a third type specifying unit that specifies a type of a keyword for a verb and a noun phrase in the input sentence.
ード抽出プログラムを格納した記憶媒体であって、 自然文を入力文として入力させる入力プロセスと、 単語の文法情報及び意味情報を用いて前記入力文を形態
素解析する形態素解析プロセスと、 形態素解析された文の構文構造を求める構文解析プロセ
スと、 前記構文解析プロセスにより求められた構文構造に基づ
いて前記入力文の意味構造を求める意味解析プロセス
と、 キーワードを抽出するための規則であるキーワード抽出
規則を用いて、前記意味構造に基づいて、動詞に対する
名詞句の役割(以下、深層格)及び、句間の修飾関係に
基づいてキーワードを抽出するキーワード抽出プロセス
とを有することを特徴とするキーワード抽出プログラム
を格納した記憶媒体。9. A storage medium storing a keyword extraction program for extracting a keyword from a natural sentence, comprising: an input process for inputting a natural sentence as an input sentence; and the input sentence using grammatical information and semantic information of a word. A morphological analysis process for performing morphological analysis, a syntactic analysis process for obtaining a syntactic structure of the morphologically analyzed sentence, a semantic analysis process for obtaining a semantic structure of the input sentence based on the syntactic structure obtained by the syntactic analysis process, and a keyword. Keyword extraction for extracting a keyword based on the role of a noun phrase for a verb (hereinafter, deep case) based on the semantic structure and a modification relationship between phrases using a keyword extraction rule that is a rule for extracting And a storage medium storing a keyword extraction program characterized by having a process.
野に応じて異なる規則を参照する第1の種類特定プロセ
スを含む請求項9記載のキーワード抽出プログラムを格
納した記憶媒体。10. The keyword extracting program according to claim 9, wherein the keyword extracting process includes a first type specifying process for specifying a type of a keyword to be extracted and referring to a different rule depending on a target field. Storage media.
特定する条件句抽出プロセスと、 ユーザの要求を表す条件句が動詞である場合(以下、当
該動詞を条件動詞と記す)に、該条件動詞の深層格の種
類及び該深層格に格納されるキーワードの種類の組み合
わせの規則を用いて、前記入力文中の動詞及び名詞句に
対してキーワードの種類を特定する第2の種類特定プロ
セスを含む請求項9記載のキーワード抽出プログラムを
格納した記憶媒体。11. The keyword extraction process includes: a condition phrase extraction process that specifies a condition phrase that is a phrase representing a user request from the input sentence; and a condition phrase that represents a user request is a verb (hereinafter, referred to as a verb). The verb is referred to as a conditional verb), and the rules of the combination of the type of the deep case of the conditional verb and the type of the keyword stored in the deep case are used for the verb and the noun phrase in the input sentence. The storage medium storing the keyword extraction program according to claim 9, further comprising a second type specifying process for specifying a type.
当該名詞句を条件名詞句と記す)に、該条件名詞句を修
飾するキーワードの種類の組み合わせの規則を用いて、
前記入力文中の動詞及び名詞句に対してキーワードの種
類を特定する第3の種類特定プロセスを含む請求項9記
載のキーワード抽出プログラムを格納した記憶媒体。12. The keyword extraction process according to claim 1, wherein a condition phrase representing a user request is a noun phrase (hereinafter, referred to as a noun phrase).
The noun phrase is referred to as a conditional noun phrase), using a rule of a combination of types of keywords that modify the conditional noun phrase,
The storage medium according to claim 9, further comprising a third type specifying process for specifying a type of a keyword for a verb and a noun phrase in the input sentence.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24557897A JP3575242B2 (en) | 1997-09-10 | 1997-09-10 | Keyword extraction device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24557897A JP3575242B2 (en) | 1997-09-10 | 1997-09-10 | Keyword extraction device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1185766A true JPH1185766A (en) | 1999-03-30 |
JP3575242B2 JP3575242B2 (en) | 2004-10-13 |
Family
ID=17135820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP24557897A Expired - Fee Related JP3575242B2 (en) | 1997-09-10 | 1997-09-10 | Keyword extraction device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3575242B2 (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002063203A (en) * | 2000-08-15 | 2002-02-28 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieving device, its method and recording medium storing information retrieving program |
JP2008152774A (en) * | 2005-06-15 | 2008-07-03 | Matsushita Electric Ind Co Ltd | Characteristic expression extraction device, method, and program |
JP2010205265A (en) * | 2009-03-05 | 2010-09-16 | Nhn Corp | Content retrieval system and method using ontology |
JP2014164606A (en) * | 2013-02-26 | 2014-09-08 | Nippon Telegr & Teleph Corp <Ntt> | Intent classification device, method and program, and service selection support device, method and program |
CN111368540A (en) * | 2020-03-05 | 2020-07-03 | 国网安徽省电力有限公司 | Keyword information extraction method based on semantic role analysis |
CN112364153A (en) * | 2020-11-10 | 2021-02-12 | 中数通信息有限公司 | Keyword identification method and device based on interference characteristics |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105283916B (en) | 2013-06-11 | 2019-06-07 | 株式会社东芝 | Electronic watermark embedded device, electronic watermark embedding method and computer readable recording medium |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6282429A (en) * | 1985-10-07 | 1987-04-15 | Sharp Corp | Input system of interrogation and response system |
JPH04182871A (en) * | 1990-11-19 | 1992-06-30 | Mitsubishi Electric Corp | Similar document retrieval device |
JPH06195383A (en) * | 1992-09-25 | 1994-07-15 | Nec Corp | Knowledge base configuring system |
JPH06231178A (en) * | 1993-01-28 | 1994-08-19 | Toshiba Corp | Document retrieving device |
JPH07182370A (en) * | 1993-12-22 | 1995-07-21 | Canon Inc | Text retrieval device |
JPH0962684A (en) * | 1995-08-22 | 1997-03-07 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieval method and information retrieval device, and information guiding method and information guiding device |
-
1997
- 1997-09-10 JP JP24557897A patent/JP3575242B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6282429A (en) * | 1985-10-07 | 1987-04-15 | Sharp Corp | Input system of interrogation and response system |
JPH04182871A (en) * | 1990-11-19 | 1992-06-30 | Mitsubishi Electric Corp | Similar document retrieval device |
JPH06195383A (en) * | 1992-09-25 | 1994-07-15 | Nec Corp | Knowledge base configuring system |
JPH06231178A (en) * | 1993-01-28 | 1994-08-19 | Toshiba Corp | Document retrieving device |
JPH07182370A (en) * | 1993-12-22 | 1995-07-21 | Canon Inc | Text retrieval device |
JPH0962684A (en) * | 1995-08-22 | 1997-03-07 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieval method and information retrieval device, and information guiding method and information guiding device |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002063203A (en) * | 2000-08-15 | 2002-02-28 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieving device, its method and recording medium storing information retrieving program |
JP2008152774A (en) * | 2005-06-15 | 2008-07-03 | Matsushita Electric Ind Co Ltd | Characteristic expression extraction device, method, and program |
JP2010205265A (en) * | 2009-03-05 | 2010-09-16 | Nhn Corp | Content retrieval system and method using ontology |
JP2014164606A (en) * | 2013-02-26 | 2014-09-08 | Nippon Telegr & Teleph Corp <Ntt> | Intent classification device, method and program, and service selection support device, method and program |
CN111368540A (en) * | 2020-03-05 | 2020-07-03 | 国网安徽省电力有限公司 | Keyword information extraction method based on semantic role analysis |
CN111368540B (en) * | 2020-03-05 | 2023-07-14 | 国网安徽省电力有限公司 | Keyword information extraction method based on semantic role analysis |
CN112364153A (en) * | 2020-11-10 | 2021-02-12 | 中数通信息有限公司 | Keyword identification method and device based on interference characteristics |
Also Published As
Publication number | Publication date |
---|---|
JP3575242B2 (en) | 2004-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7567902B2 (en) | Generating speech recognition grammars from a large corpus of data | |
JP3429184B2 (en) | Text structure analyzer, abstracter, and program recording medium | |
US5878386A (en) | Natural language parser with dictionary-based part-of-speech probabilities | |
US8583422B2 (en) | System and method for automatic semantic labeling of natural language texts | |
US5890103A (en) | Method and apparatus for improved tokenization of natural language text | |
KR101136007B1 (en) | System and method for anaylyzing document sentiment | |
US20020077806A1 (en) | Method and computer system for part-of-speech tagging of incomplete sentences | |
JP2005165958A (en) | Information retrieval system, information retrieval support system and method therefor, and program | |
KR20080033325A (en) | Definition extraction | |
JP4967037B2 (en) | Information search device, information search method, terminal device, and program | |
JP3575242B2 (en) | Keyword extraction device | |
JPH04139580A (en) | Keyword searching system | |
JPH10149370A (en) | Document retrieval method and device using context information | |
JP4033093B2 (en) | Natural language processing system, natural language processing method, and computer program | |
JP3380077B2 (en) | Morphological analyzer | |
JPH096790A (en) | Natural language interacting device | |
JP2661934B2 (en) | Japanese processing system | |
JP4177195B2 (en) | Recognition grammar creation system | |
JP2000148755A (en) | Method and device for semantic analysis and record medium where semantic analysis program is recorded | |
JPH0410161A (en) | Omission compensating processing device | |
JPH103481A (en) | Document retrieval device | |
JPH11265385A (en) | Information retrieving device and method and storage medium storing information retrieving program | |
JPH01260494A (en) | Voice recognizing method | |
JP2000148757A (en) | Language converting method | |
JPS6395570A (en) | Language analysis system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040323 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040517 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040615 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040628 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080716 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080716 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090716 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |