JP2006053907A - Information extraction method, information extraction device, information extraction program, and recording medium recording information extraction program - Google Patents

Information extraction method, information extraction device, information extraction program, and recording medium recording information extraction program Download PDF

Info

Publication number
JP2006053907A
JP2006053907A JP2005205793A JP2005205793A JP2006053907A JP 2006053907 A JP2006053907 A JP 2006053907A JP 2005205793 A JP2005205793 A JP 2005205793A JP 2005205793 A JP2005205793 A JP 2005205793A JP 2006053907 A JP2006053907 A JP 2006053907A
Authority
JP
Japan
Prior art keywords
clause
phrase
independent word
information
extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005205793A
Other languages
Japanese (ja)
Inventor
Nahoko Sato
奈穂子 佐藤
Eiji Kenmochi
栄治 剣持
Atsuo Shimada
敦夫 嶋田
Masayuki Kameda
雅之 亀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2005205793A priority Critical patent/JP2006053907A/en
Publication of JP2006053907A publication Critical patent/JP2006053907A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide an information extraction method accurately simply realizing management of document or a document group, browsing, analysis, reuse, and the like, and to provide an information extraction device, an information extraction program, or a recording medium recording the information extraction program. <P>SOLUTION: The information extraction method extracting information of document has a language information obtaining step (S2) obtaining modification relation of content words, a depth information obtaining step (S3) obtaining depth information representing strength of modification relation of one content word obtained from the document with the language information obtaining step and other content word, and a partial structure data forming step (S4) forming partial structure data comprising content words having depth information of the prescribed value or more of one content word based on the depth information of each content word obtained with the depth information obtaining step. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、文書の要約や文書検索などのために、文書情報を抽出する情報抽出方法、情報抽出装置、情報抽出プログラム及びその記録媒体に関する。   The present invention relates to an information extraction method, an information extraction apparatus, an information extraction program, and a recording medium for extracting document information for document summarization, document search, and the like.

大量の電子化文書データが流通するようになり、文書や文書群の簡便な管理、再利用の方法が求められている。こうした電子化文書データの再利用を活性化させる方策の一つに、文書検索、文書分類、文書間比較などの、文書のトピックを抽出して、テキストを処理する技術が提案されている。また、文書の閲覧性を高めるための文書要約やダイジェスト生成などにおいても、文書中のトピック抽出技術が必要である。文書の分析や、文書の閲覧支援の際には、文書のトピック抽出にどのような処理を行うかが、後工程での処理に大きく影響する。   A large amount of electronic document data has been distributed, and a simple method for managing and reusing documents and document groups is required. As one of the measures for activating the reuse of digitized document data, a technique for processing text by extracting document topics such as document search, document classification, and inter-document comparison has been proposed. In addition, a topic extraction technique in a document is required for document summarization and digest generation for improving the viewability of the document. In document analysis and document browsing support, what kind of processing is performed for document topic extraction greatly affects processing in a later process.

従来、文書処理の際の処理単位として、キーワードや、共起キーワード、係り受けが成立する2文節の情報、などが提案されている。しかし、文書の内容を表現するには、これらから得られる情報では、意味のあるトピックを表現するにはあまりにも情報が少ない。
これに対し、文書検索の単位として構文的機能単位を用いる方法が提案されている(例えば、特許文献1参照。)。構文的機能単位とは、具体的には、名詞連続からなる名詞句、格成分と述語からなる動詞句、助詞「の」で連結された名詞などである。
しかしながら、特許文献1記載の方法では、これらの単位の拡張方法について言及がない。実際に文書を処理する場合、規定の単位での処理に加え、さらに拡張した単位での処理が可能であることが望ましい。なぜなら規定の単位で効果が得られない場合でも、拡張単位で効果が得られる場合があるからである。たとえば、文書検索システムにおいて、クエリーとなるキーワードに加えて、その拡張である「関連語」を利用した検索を行う方法は、検索精度を向上させるための施策として有効であることが知られている。ニュース文書間の記事内容の比較を行い、ダイジェストを生成する場合においても、ニュース文書中の基本トピック単位を抽出し、その上で、トピックの展開経緯を示す語句を取得し、基本トピック単位に付加した拡張トピック単位を生成することで、トピック単位間の類似や差異に加え、さらにトピックの展開経緯を見つけ出すことが可能となる。また、基本トピック単位同士では類似度が低かった文書が、拡張トピック単位で扱うことで、付加された情報により類似度が高くなる相乗効果も期待できる。
これに対し、対象文書を係り受け解析して、その結果を構文木や線形リストの形式で記憶し、単語と位置関係の頻出パタンを制約条件やパラメータを用いて自動抽出する方法が提案されている(例えば、特許文献2参照。)。特許文献2記載の方法は、頻出パタン内の語数が多い場合、文書の内容を表現するのに豊富な情報が取得可能となる場合がある。
特許第3040945号公報 特許第3353829号公報
Conventionally, keywords, co-occurrence keywords, information on two phrases in which dependency is established, and the like have been proposed as processing units for document processing. However, in order to express the contents of a document, the information obtained from them contains too little information to express a meaningful topic.
On the other hand, a method using a syntactic function unit as a document search unit has been proposed (see, for example, Patent Document 1). Specifically, the syntactic functional unit includes a noun phrase composed of a noun sequence, a verb phrase composed of a case component and a predicate, and a noun connected with the particle “no”.
However, in the method described in Patent Document 1, there is no mention of a method for expanding these units. When actually processing a document, it is desirable that processing in a further expanded unit is possible in addition to processing in a prescribed unit. This is because even if the effect cannot be obtained with the prescribed unit, the effect may be obtained with the expansion unit. For example, in a document search system, it is known that a method of performing a search using a “related word” that is an extension of a keyword as a query is effective as a measure for improving the search accuracy. . Even when comparing the contents of news articles and generating a digest, the basic topic unit in the news document is extracted, and then the words indicating the development of the topic are acquired and added to the basic topic unit. By generating the extended topic unit, it is possible to find out the development history of the topic in addition to the similarities and differences between the topic units. In addition, when a document having a low similarity between basic topic units is handled in an extended topic unit, a synergistic effect in which the similarity is increased by the added information can be expected.
On the other hand, a method has been proposed in which the target document is subjected to dependency analysis, the result is stored in the form of a syntax tree or a linear list, and the frequent pattern of the word and positional relationship is automatically extracted using constraints and parameters. (For example, refer to Patent Document 2). In the method described in Patent Document 2, when there are a large number of words in a frequent pattern, abundant information may be acquired to express the content of the document.
Japanese Patent No. 3040945 Japanese Patent No. 3353829

しかしながら、特許文献2記載の方法では、対象文書の種類によっては頻出パタンが抽出できないことがある。例えば、コールセンターなどで蓄積されるテキスト登録作法にぶれの少ない文書データでは、単語と位置関係を用いて有効に頻出パタンを取得できる可能性があるが、ニュースやアンケートなどの文書のように、扱う内容も記述作法も書き手の任意である文書データでは、単語と位置関係の頻度を計量しても頻出パタンが取れない。 However, with the method described in Patent Document 2, frequent patterns may not be extracted depending on the type of target document. For example, in document data with little fluctuation in the text registration method accumulated at a call center etc., there is a possibility that frequent patterns can be acquired effectively using words and positional relationships, but they are handled like documents such as news and questionnaires. In document data whose contents and description manner are arbitrary, the frequent pattern cannot be obtained even if the frequency of the word and the positional relationship is measured.

また、構文木や線形リストの構築ステップが入るため、処理の際に多くの記憶容量を要することが想定され、実用的ではない。さらに、構文木や線形リストから、分析単位としての頻出パタンを抽出する際には、パタンを指定する制約条件が必要であるが、この制約条件の登録は言語処理分野の専門知識がないと困難である。   In addition, since a construction step of a syntax tree and a linear list is included, it is assumed that a large amount of storage capacity is required for processing, which is not practical. Furthermore, when extracting a frequent pattern as an analysis unit from a syntax tree or a linear list, a constraint condition that specifies the pattern is necessary, but it is difficult to register this constraint condition unless you have expertise in the language processing field. It is.

本発明は、上記問題に鑑み、対象の文書に依存せず、文書または文書群の管理、閲覧、分析、再利用などを精度よくかつ簡便に実現できる情報抽出方法、情報抽出装置、情報抽出プログラム又は情報抽出プログラムが記録された記録媒体を提供することを目的とする。   In view of the above problems, the present invention provides an information extraction method, an information extraction apparatus, and an information extraction program that can accurately and easily realize management, browsing, analysis, reuse, and the like of a document or a document group without depending on a target document. Alternatively, an object is to provide a recording medium on which an information extraction program is recorded.

上記問題に鑑み、本発明は、文書の情報を抽出する情報抽出方法において、自立語の係り受け関係を取得する言語情報取得ステップと、言語情報取得ステップにより該文書から取得された一の自立語と、他の自立語との係り受け関係の強さを表す深さ情報を取得する深さ情報取得ステップと、深さ情報取得ステップにより取得した各自立語の深さ情報に基づき、一の自立語の、所定の値以上の深さ情報を有する自立語から成る部分構造データを生成する部分構造データ生成ステップと、を有することを特徴とする。   In view of the above problems, the present invention provides an information extraction method for extracting document information, a language information acquisition step for acquiring dependency relations of independent words, and one independent word acquired from the document by the language information acquisition step. Based on the depth information acquisition step for acquiring depth information indicating the strength of the dependency relationship with other independent words, and the depth information of each independent word acquired in the depth information acquisition step. And a partial structure data generation step of generating partial structure data composed of independent words having depth information equal to or greater than a predetermined value of the word.

本発明によれば、対象の文書に依存せず、文書または文書群の管理、閲覧、分析、再利用などを精度よくかつ簡便に実現できる情報抽出方法を提供することができる。   According to the present invention, it is possible to provide an information extraction method that can accurately and easily realize management, browsing, analysis, reuse, and the like of a document or a document group without depending on a target document.

また、本発明の一局面において、言語情報取得ステップは、係り元の自立語毎に係り先の自立語を取得し、深さ情報取得ステップは、自立語のうち所定の用言を抽出キーに選択する抽出キー選択ステップと、選択された抽出キーが係り先となっている自立語を取得して、該自立語に初期値の深さ情報を付与する自立語取得ステップと、取得された自立語が係り先となっている係り先自立語を取得して、該係り先自立語の深さ情報として、取得された自立語の深さ情報の値に所定値加算した値を付与する深さ情報加算ステップと、を有することを特徴とする。「取得された自立語」は抽出キーを修飾する自立語であり、係り先自立語は、「抽出キーを修飾する自立語」を修飾する自立語となる。したがって、深さ情報加算ステップは、修飾関係のある自立語を次々と辿り、深さ情報を所定値加算していく。修飾関係のある自立語を全て辿ったら、当該抽出キーについての深さ情報加算ステップは終了する。なお、「初期値」は例えば0(ゼロ)であり、深さ情報は0から、所定値ずつ加算されていく。所定値は、好適には1であるが、修飾関係に応じて所定値の大きさを一定ではなく変化させてもよい。例えば、用言を修飾する場合は深さ情報を大きく加算し、体言を修飾する場合は深さ情報の加算値を少なくする、などである。   Further, in one aspect of the present invention, the language information acquisition step acquires the independent word of the dependency for each independent word of the dependency source, and the depth information acquisition step uses the predetermined word of the independent word as an extraction key. An extraction key selection step to select; an independent word that is related to the selected extraction key; and an independent word acquisition step that gives depth information of an initial value to the independent word; and Depth that obtains a self-supporting independent word whose word is a dependency, and adds a value obtained by adding a predetermined value to the depth information of the acquired independent word as depth information of the related self-supporting word And an information adding step. The “acquired independent word” is an independent word that modifies the extraction key, and the dependency independent word is an independent word that modifies “the independent word that modifies the extraction key”. Therefore, in the depth information addition step, the independent words having the modification relationship are traced one after another, and the depth information is added by a predetermined value. When all the independent words having the modification relationship are traced, the depth information adding step for the extracted key is finished. The “initial value” is 0 (zero), for example, and the depth information is incremented from 0 by a predetermined value. The predetermined value is preferably 1, but the magnitude of the predetermined value may be changed instead of being constant according to the modification relationship. For example, the depth information is greatly added when the prescription is modified, and the added value of the depth information is decreased when the body is modified.

本発明によれば、抽出キーとして用言を用い、該抽出キーを直接連用修飾している自立語、さらに抽出した自立語を修飾している自立語を文中からあるだけ抽出することで、部分構造要素の抽出範囲を自動的に規定でき、情報豊富な文書情報を抽出することができる。なお、抽出キーが直接修飾している自立語を抽出し、抽出した該自立語を修飾している自立語を更に文中からあるだけ抽出する処理を行ってもよい。   According to the present invention, by using a predicate as an extraction key, and extracting an independent word that directly modifies the extracted key and further an independent word that modifies the extracted independent word from the sentence, The extraction range of structure elements can be automatically defined, and information-rich document information can be extracted. It is also possible to extract a self-supporting word that is directly modified by the extraction key, and to extract as many self-supporting words that have modified the extracted self-supporting word from the sentence.

また、本発明の一局面において、言語情報取得ステップは、係り元の自立語毎に係り先の自立語を取得し、深さ情報取得ステップは、自立語のうち所定の体言を抽出キーに選択する抽出キー選択ステップと、選択された抽出キーが係り先となっている自立語を取得して、該自立語に初期値の深さ情報を付与する自立語取得ステップと、取得された自立語が係り先となっている係り先自立語を取得して、該係り先自立語の深さ情報として、取得された自立語の深さ情報の値に所定値加算した値を付与する深さ情報加算ステップと、を有することを特徴とする。   Further, in one aspect of the present invention, the language information acquisition step acquires the independent word of the dependency for each independent word of the dependency source, and the depth information acquisition step selects a predetermined body language from the independent words as an extraction key. An extraction key selection step, an independent word acquisition step of acquiring an independent word on which the selected extraction key is related, and giving depth information of an initial value to the independent word, and the acquired independent word Depth information that obtains a self-supporting independent word that is a dependency and adds a value obtained by adding a predetermined value to the depth information of the acquired independent word as depth information of the self-supporting word And an adding step.

本発明によれば、抽出キーとして体言を用い、該抽出キーを直接連体修飾している自立語、さらに抽出した自立語を修飾している自立語を文中からあるだけ抽出することで、部分構造要素の抽出範囲を自動的に規定でき、情報豊富な文書情報を抽出することができる。   According to the present invention, by using a description as an extraction key, and extracting an independent word that directly modifies the extracted key and further an independent word that modifies the extracted independent word from the sentence, the partial structure The extraction range of elements can be automatically defined, and document information rich in information can be extracted.

また、本発明の一局面において、深さ情報取得ステップは、深さ情報の値を指定する深さ情報指定ステップを有し、深さ情報の値が前記深さ情報指定ステップにより指定された値以下の深さ情報の自立語を取得する、ことを特徴とする。   In one aspect of the present invention, the depth information acquisition step includes a depth information designation step for designating a value of depth information, and the value of the depth information is designated by the depth information designation step. Independent words of the following depth information are acquired.

本発明によれば、ユーザの指定した深さまでの修飾関係解析で解析処理を中止し、次の用言又は体言を抽出キーとした修飾関係解析へ移ることで、全体の解析時間を短縮することが可能になり、効率のよい処理が実現できる。   According to the present invention, the analysis process is stopped in the modification relation analysis up to the depth specified by the user, and the entire analysis time is shortened by moving to the modification relation analysis using the next predicate or body as the extraction key. And efficient processing can be realized.

また、本発明の一局面において、接続助詞又は接続助詞が記載された接続詞/接続助詞辞書を有し、深さ情報取得ステップは、取得された自立語が含まれる文節が有する接続詞又は接続助詞に基づき、接続詞/接続助詞辞書を参照し、当該接続詞又は接続助詞の接続の意味を抽出し、次いで、抽出された接続の意味を、取得された自立語の拡張要素に付加する、ことを特徴とする。   Further, in one aspect of the present invention, a connection particle or a connection particle having a connection particle or a connection particle is described, and the depth information acquisition step includes a connection particle or a connection particle included in a phrase including the acquired independent word. Based on the conjunction / junction particle dictionary, the connection meaning of the conjunction or the connection particle is extracted, and then the extracted connection meaning is added to the extension element of the acquired independent word. To do.

本発明によれば、抽出した自立語に接続の意味を付加することができ、文書処理の際に文書の展開経緯を見つけ出すことが可能となる。   According to the present invention, it is possible to add the meaning of connection to the extracted independent words, and it is possible to find out the development process of the document during document processing.

また、本発明の一局面において、意図を表す表現を記載した意図表現辞書を有し、深さ情報取得ステップは、記取得された自立語が含まれる文節が有する意図表現に基づき、意図表現辞書を参照し、当該意図表現の意味を抽出し、次いで、抽出された意図表現の意味を、取得された自立語の拡張要素に付加する、ことを特徴とする。   Further, in one aspect of the present invention, the information processing apparatus includes an intention expression dictionary that describes an expression that represents an intention, and the depth information acquisition step is based on an intention expression included in a phrase that includes the acquired independent word. The meaning of the intention expression is extracted, and then the meaning of the extracted intention expression is added to the extension element of the acquired independent word.

本発明によれば、抽出した自立語に意図を表す意図表現を付加することができ、文書処理の際に、意図情報を有効に利用した処理が可能となる。   According to the present invention, an intention expression representing an intention can be added to the extracted independent word, and processing using the intention information effectively is possible during document processing.

また、本発明の一局面において、深さ情報取得ステップは、取得された自立語が、一文中の最後尾の文節に含まれていた場合には、当該自立語の拡張要素に文末の表記を付加する、ことを特徴とする。   Further, in one aspect of the present invention, the depth information acquisition step, when the acquired independent word is included in the last phrase in one sentence, the end of the sentence is indicated in the extended element of the independent word It is characterized by adding.

本発明によれば、抽出した自立語が一文中の最後尾の文節に含まれていた場合には、当該自立語の拡張要素に、文末の表記を付加することができ、文書処理の際に、文末体言句を有効に利用した処理が可能となる。   According to the present invention, when the extracted independent word is included in the last phrase in one sentence, the end of the sentence can be added to the extended element of the independent word, and at the time of document processing , It is possible to effectively use the sentence end phrase.

また、本発明の一局面において、部分構造データ生成ステップは、深さ情報取得ステップにより取得した自立語が抽出キーを修飾する関係を示す修飾関係と、取得された自立語の拡張要素に付加されている接続の意味、意図表現の意味又は文末の表記とを、前記取得された自立語と関連付けて部分構造データを生成する、ことを特徴とする。   Further, in one aspect of the present invention, the partial structure data generation step is added to a modification relationship indicating a relationship in which the independent word acquired by the depth information acquisition step modifies the extraction key and an extension element of the acquired independent word. The partial structure data is generated by associating the meaning of the connected connection, the meaning of the intention expression, or the notation at the end of the sentence with the acquired independent word.

本発明によれば、抽出された拡張部分構造要素から文書情報を抽出生成する際に、深さ情報を指定して、文書情報の内容量をユーザの任意で増減して文書情報を抽出することができる。   According to the present invention, when extracting and generating document information from the extracted extended partial structure element, the depth information is designated, and the document information is extracted by arbitrarily increasing / decreasing the content of the document information. Can do.

また、本発明は、文書の情報を抽出する情報抽出装置において、自立語の係り受け関係を取得する言語情報取得手段と、言語情報取得手段により該文書から取得された一の自立語と、他の自立語との係り受け関係の強さを表す深さ情報を取得する深さ情報取得手段と、 深さ情報取得手段により取得した各自立語の深さ情報に基づき、一の自立語の、所定の値以上の深さ情報を有する自立語から成る部分構造データを生成する部分構造データ生成手段と、を有することを特徴とする。   Further, the present invention provides an information extraction apparatus for extracting information on a document, a language information acquisition unit that acquires a dependency relationship of independent words, a single independent word acquired from the document by the language information acquisition unit, and another Based on the depth information acquisition means for acquiring depth information indicating the strength of the dependency relationship with the independent word, and the depth information of each independent word acquired by the depth information acquisition means, And partial structure data generation means for generating partial structure data composed of independent words having depth information equal to or greater than a predetermined value.

また、本発明の一局面において、言語情報取得手段は、係り元の自立語毎に係り先の自立語を取得し、深さ情報取得手段は、自立語のうち所定の用言を抽出キーに選択する抽出キー選択手段と、選択された抽出キーが係り先となっている自立語を取得して、該自立語に初期値の深さ情報を付与する自立語取得手段と、取得された自立語が係り先となっている係り先自立語を取得して、該係り先自立語の深さ情報として、取得された自立語の深さ情報の値に所定値加算した値を付与する深さ情報加算手段と、を有することを特徴とする。   Moreover, in one aspect of the present invention, the language information acquisition unit acquires the independent word of the dependency for each independent word of the dependency source, and the depth information acquisition unit uses the predetermined word of the independent word as an extraction key. An extraction key selection means for selecting, an independent word acquisition means for acquiring an independent word that is related to the selected extraction key, and giving the initial value depth information to the independent word; and Depth that obtains a self-supporting independent word whose word is a dependency, and adds a value obtained by adding a predetermined value to the depth information of the acquired independent word as depth information of the related self-supporting word And an information adding means.

また、本発明の一局面において、言語情報取得手段は、係り元の自立語毎に係り先の自立語を取得し、深さ情報取得手段は、自立語のうち所定の体言を抽出キーに選択する抽出キー選択手段と、選択された抽出キーが係り先となっている係り先自立語を取得して、該自立語に初期値の深さ情報を付与する自立語取得手段と、取得された自立語が係り先となっている係り先自立語を取得して、該係り先自立語の深さ情報として、取得された自立語の深さ情報の値に所定値加算した値を付与する深さ情報加算手段と、を有することを特徴とする。   Further, in one aspect of the present invention, the language information acquisition unit acquires the independent word of the dependency destination for each independent word of the dependency source, and the depth information acquisition unit selects a predetermined body language from the independent words as an extraction key. An extraction key selection unit that acquires the independent word that is the destination of the selected extraction key and assigns initial depth information to the independent word; and A depth at which a self-supporting word whose dependency word is a dependency is acquired, and a value obtained by adding a predetermined value to the value of the acquired self-supporting word depth information is obtained as depth information of the dependency self-supporting word. And an information adding means.

また、本発明の一局面において、深さ情報取得手段は、深さ情報の値を指定する深さ情報指定手段を有し、深さ情報の値が前記深さ情報指定手段により指定された値以下の深さ情報の自立語を取得する、ことを特徴とする。   In one aspect of the present invention, the depth information acquisition means includes depth information specifying means for specifying a value of depth information, and the value of the depth information specified by the depth information specifying means. Independent words of the following depth information are acquired.

また、本発明の一局面において、接続助詞又は接続助詞が記載された接続詞/接続助詞辞書を有し、深さ情報取得手段は、取得された自立語が含まれる文節が有する接続詞又は接続助詞に基づき、前記接続詞/接続助詞辞書を参照し、当該接続詞又は接続助詞の接続の意味を抽出し、次いで、抽出された接続の意味を、取得された自立語の拡張要素に付加する、ことを特徴とする。   Further, in one aspect of the present invention, a connection particle or a connection particle is described as a connection particle or a connection particle, and the depth information acquisition unit includes a connection particle or connection particle included in a phrase including the acquired independent word. Based on the conjunction / junction particle dictionary, the connection meaning of the conjunction or connection particle is extracted, and then the extracted connection meaning is added to the acquired independent word extension element. And

また、本発明の一局面において、意図を表す表現を記載した意図表現辞書を有し、深さ情報取得手段は、取得された自立語が含まれる文節が有する意図表現に基づき、意図表現辞書を参照し、当該意図表現の意味を抽出し、次いで、抽出された意図表現の意味を、取得された自立語の拡張要素に付加する、ことを特徴とする。   Further, in one aspect of the present invention, there is an intention expression dictionary in which expressions representing intentions are described, and the depth information acquisition unit generates the intention expression dictionary based on the intention expressions included in the phrase including the acquired independent words. The meaning of the intention expression is extracted with reference, and then the meaning of the extracted intention expression is added to the obtained extension element of the independent word.

また、本発明の一局面において、深さ情報取得手段は、取得された自立語が、一文中の最後尾の文節に含まれていた場合には、当該自立語の拡張要素に文末の表記を付加する、ことを特徴とする。   Further, in one aspect of the present invention, the depth information acquisition means, when the acquired independent word is included in the last phrase in one sentence, the end of the sentence is indicated in the extended element of the independent word. It is characterized by adding.

また、部分構造データ生成手段は、深さ情報取得手段により取得した自立語が抽出キーを修飾する関係を示す修飾関係と、取得された自立語の拡張要素に付加されている接続の意味、意図表現の意味又は文末の表記とを、取得された自立語と関連付けて部分構造データを生成する、ことを特徴とする。   Further, the partial structure data generation means includes a modification relation indicating a relation in which the independent word acquired by the depth information acquisition means modifies the extraction key, and the meaning and intention of the connection added to the acquired extension element of the independent word. The partial structure data is generated by associating the meaning of the expression or the notation at the end of the sentence with the acquired independent word.

また、本発明は、上記の情報抽出方法をコンピュータに実行させる情報抽出プログラムを提供する。また、本発明は、情報抽出プログラムが記録された記録媒体を提供する。   Moreover, this invention provides the information extraction program which makes a computer perform said information extraction method. The present invention also provides a recording medium on which an information extraction program is recorded.

また、本発明は、文書の情報を抽出する情報抽出方法において、自立語の係り受け関係、文節の品詞情報を示す文節品詞又は文節の分類情報を示す文節種を取得する言語情報取得ステップと、文節品詞に対応づけて文節種を定めた抽出キー選出規則を参照して、抽出キーを選択する抽出キー選択ステップと、文節品詞、及び、係り受け関係に基づいて定められた拡張規則を抽出キーに基づき参照し、拡張規則に適合する文節を文章から抽出して拡張構造要素を生成する拡張構造要素生成ステップと、を有することを特徴とする。   Further, the present invention provides an information extraction method for extracting document information, a language information acquisition step of acquiring a dependency relation of independent words, a phrase part of speech indicating a part of speech information of a phrase, or a phrase type indicating phrase classification information, Referring to the extraction key selection rule that defines the phrase type in association with the phrase part of speech, the extraction key selection step for selecting the extraction key, and the extended rule defined based on the phrase part of speech and the dependency relationship are extracted keys And an extended structural element generation step for generating an extended structural element by extracting a clause that matches the extended rule from the sentence.

本発明によれば、拡張構造要素の抽出キーの選出規則を設け、また、拡張構造要素となる文節を選出する際の拡張規則を設けたことで、網羅的かつ冗長性の小さい拡張構造要素を生成できる。   According to the present invention, an extended structural element extraction key selection rule is provided, and an extended rule for selecting a clause to be an extended structural element is provided, so that an extended structural element with comprehensive and low redundancy can be obtained. Can be generated.

また、本発明の一形態において、文節品詞は、用言性文節、体言性文節、サ変性文節、コピュラ文節、形容性文節、副詞性文節、連体性文節、接続性文節又は不定文節、のいずれかであり、文節種は、文末、読点、係り、切断又は不定、のいずれか、であることを特徴とする。   Further, in one embodiment of the present invention, the phrase part of speech is any one of a predicative clause, a verbal clause, a sa modification clause, a copula clause, an adjective clause, an adverbial clause, a combined clause, a connectivity clause, or an indefinite clause. The phrase type is any one of sentence ending, punctuation, engagement, cut or indefinite.

また、本発明の一形態において、拡張構造要素は、用言性文節、体言性文節、サ変性文節、コピュラ文節、形容性文節、副詞性文節、連体性文節、接続性文節、若しくは、不定文節、のいずれかの基本単位、又は、該基本単位の組み合わせにより構成される、ことを特徴とする。   Further, in one embodiment of the present invention, the extended structural element includes a predicative clause, a verbal clause, a sacrificial clause, a copula clause, an adjective clause, an adverbial clause, a combined clause, a connectivity clause, or an indefinite clause. It is characterized by being comprised by the basic unit in any one of these, or the combination of this basic unit.

また、本発明の一形態において、基本単位の各文節は、読点、文末、係り無し、係り又は不定、のいずれか一つの文節種を有する、ことを特徴とする。   In one embodiment of the present invention, each clause of the basic unit has any one of the following types of clauses: reading, sentence ending, no relation, relation or indefinite.

また、本発明の一形態において、抽出キー選択ステップは、不定属性を持たない用言性文節、不定属性を持たないサ変性文節、コピュラ性文節、文末、読点、および切断のいずれかの属性を有する形容性文節、文末か切断の属性を有する副詞性文節、文末か切断の属性を有する体言性文節、のいずれかを前記抽出キーとして選択する、ことを特徴とする。   Further, in one aspect of the present invention, the extraction key selection step includes any of the attributes of a predicative phrase that does not have an indefinite attribute, a modified phrase that does not have an indefinite attribute, a copula phrase, a sentence end, a punctuation mark, and a disconnection attribute. Any one of an adjective phrase having an adverbial phrase having an end-of-sentence or disconnection attribute, or an episodic phrase having an end-of-sentence or disconnection attribute is selected as the extraction key.

また、本発明の一形態において、拡張構造要素生成ステップは、抽出キー選択ステップにより選択された前記抽出キーを、文章から文節を抽出するための拡張対象文節として、該拡張対象文節が、用言性文節、サ変性文節、コピュラ文節、形容性文節、又は副詞性文節、の場合、当該拡張対象文節に対し係りの属性を有する、用言性文節、サ変性文節、形容性文節、体言性文節、又は、副詞性文節を該抽出キーに追加して拡張構造要素を生成する前方拡張処理ステップを有し、前方拡張処理ステップにより追加される文節が、用言性文節、サ変性文節、形容性文節、又は、体言性文節の場合、当該文節を拡張対象文節として、更に前記前方拡張処理ステップを行う、ことを特徴とする。   In one embodiment of the present invention, the extended structural element generation step uses the extraction key selected in the extraction key selection step as an expansion target clause for extracting a phrase from a sentence. In the case of a sex clause, a samurai clause, a copula clause, an adjective clause, or an adverbial clause, a prescriptive clause, a sacrificial clause, an adjective clause, or a somatic clause that has an attribute related to the extension target clause Or a forward extension processing step of adding an adverbial clause to the extraction key to generate an extended structure element, and the clause added by the forward extension processing step is a prescriptive phrase, a sacrificial phrase, an adjective In the case of a clause or a body phrase, the forward extension processing step is further performed with the clause as an extension target clause.

また、本発明の一形態において、部分構造データ生成ステップは、抽出キー選択ステップにより選択された抽出キーを、文章から文節を抽出するための拡張対象文節として、該拡張対象文節が体言性文節の場合、当該拡張対象文節に対し係りの属性を有する、形容性文節、体言性文節又は副詞性文節、を該抽出キーに追加して拡張構造要素を生成する前方拡張処理ステップを有し、前方拡張処理ステップにより追加される文節が、形容性文節又は体言性文節の場合、文節を拡張対象文節として、更に前方拡張処理ステップを行う、ことを特徴とする。   In one embodiment of the present invention, the partial structure data generation step uses the extraction key selected in the extraction key selection step as an expansion target clause for extracting a phrase from a sentence, and the expansion target clause is an episodic phrase. A forward extension processing step of adding an adjective clause, a verbal clause or an adverbial clause having an attribute related to the extension target clause to generate an extended structural element by adding the extracted key, When the clause added by the processing step is an adjective clause or a body clause, the forward extension processing step is further performed with the clause as an extension target clause.

また、本発明の一形態において、部分構造データ生成ステップは、抽出キー選択ステップにより選択された抽出キーを、文章から文節を抽出するための拡張対象文節として、該拡張対象文節が係りの属性を有する、用言性文節、サ変性文節、形容性文節又は副詞性文節、の場合であって、当該拡張対象文節の係り先文節が、体言性文節の場合、抽出キーに係り先の文節を追加して拡張構造要素を生成する後方拡張処理ステップを有し、後方拡張処理ステップにより追加される体言性文節が係りの属性を有する場合であって、追加される体言性文節の係り先文節が体言性文節の場合、当該文節を前記拡張対象文節として、更に前記後方拡張処理ステップを行う、ことを特徴とする。   In one form of the present invention, the partial structure data generation step uses the extraction key selected in the extraction key selection step as an expansion target clause for extracting a phrase from the sentence, and sets the attribute related to the expansion target clause. If the clause has a predicative clause, a modified clause, an adjective clause, or an adverbial clause, and if the destination clause of the target clause is an episodic clause, add the destination clause to the extraction key A backward extension processing step for generating an extended structural element, and the verbal clause added by the backward extension processing step has a dependency attribute, and the destination clause of the added verbal phrase is In the case of a sex clause, the backward extension processing step is further performed with the clause as the extension target clause.

また、本発明の一形態において、部分構造データ生成ステップは、抽出キー選択ステップにより選択された抽出キーを文章から文節を抽出するための拡張対象文節として、該拡張対象文節が係りの属性を有する、体言性文節の場合であって、当該拡張対象文節の係り先文節が、体言性文節又はコピュラ文節の場合、抽出キーに係り先の文節を追加して拡張構造要素を生成する後方拡張処理ステップを有し、後方拡張処理ステップにより追加される体言性文節が係りの属性を有する場合であって、追加される体言性文節の係り先文節が体言性文節の場合、当該文節を拡張対象文節として、更に後方拡張処理ステップを行う、ことを特徴とする。   In one embodiment of the present invention, the partial structure data generation step uses the extraction key selected in the extraction key selection step as an expansion target clause for extracting a phrase from the sentence, and the expansion target clause has an associated attribute. A backward extension processing step for generating an extended structural element by adding a related clause to the extraction key if the related clause of the extension target clause is a semantic clause or a copula clause And the semantic clause added by the backward extension processing step has a dependency attribute, and if the destination clause of the added semantic clause is a semantic clause, that clause is used as the extension target clause. Further, a backward extension processing step is performed.

また、本発明は、文書の情報を抽出する情報抽出装置において、自立語の係り受け関係、文節の品詞情報を示す文節品詞又は文節の分類情報を示す文節種を取得する言語情報取得手段と、文節品詞に対応づけて文節種を定めた抽出キー選出規則を参照して、抽出キーを選択する抽出キー選択手段と、文節品詞、及び、係り受け関係に基づいて定められた拡張規則を抽出キーに基づき参照し、拡張規則に適合する文節を前記文章から抽出して拡張構造要素を生成する拡張構造要素生成手段と、を有することを特徴とする。   Further, the present invention provides an information extraction device for extracting document information, language information acquisition means for acquiring a dependency relationship of independent words, a phrase part of speech indicating a part of speech information of a phrase, or a phrase type indicating phrase classification information, With reference to the extraction key selection rule that defines the phrase type in association with the phrase part of speech, the extraction key selection means for selecting the extraction key, and the expansion rule defined based on the phrase part of speech and the dependency relationship are extracted keys And an extended structural element generating means for generating an extended structural element by extracting a clause that matches the extended rule from the sentence.

また、本発明の一形態において、文節品詞は、用言性文節、体言性文節、サ変性文節、コピュラ文節、形容性文節、副詞性文節、連体性文節、接続性文節又は不定文節、のいずれかであり、文節種は、文末、読点、係り、切断又は不定、のいずれか、であることを特徴とする。   Further, in one embodiment of the present invention, the phrase part of speech is any one of a predicative clause, a verbal clause, a sa modification clause, a copula clause, an adjective clause, an adverbial clause, a combined clause, a connectivity clause, or an indefinite clause. The phrase type is any one of sentence ending, punctuation, engagement, cut or indefinite.

また、本発明の一形態において、拡張構造要素は、用言性文節、体言性文節、サ変性文節、コピュラ文節、形容性文節、副詞性文節、連体性文節、接続性文節、若しくは、不定文節、のいずれかの基本単位、又は、該基本単位の組み合わせにより構成される、ことを特徴とする。   Further, in one embodiment of the present invention, the extended structural element includes a predicative clause, a verbal clause, a sacrificial clause, a copula clause, an adjective clause, an adverbial clause, a combined clause, a connectivity clause, or an indefinite clause. It is characterized by being comprised by the basic unit in any one of these, or the combination of this basic unit.

また、本発明の一形態において、基本単位の各文節は、読点、文末、係り無し、係り又は不定、のいずれか一つの文節種を有する、ことを特徴とする。   In one embodiment of the present invention, each clause of the basic unit has any one of the following types of clauses: reading, sentence ending, no relation, relation or indefinite.

また、本発明の一形態において、抽出キー選択手段は、不定属性を持たない用言性文節、不定属性を持たないサ変性文節、コピュラ性文節、文末、読点、および切断のいずれかの属性を有する形容性文節、文末か切断の属性を有する副詞性文節、文末か切断の属性を有する体言性文節、のいずれかを前記抽出キーとして選択する、ことを特徴とする。   Further, in one aspect of the present invention, the extraction key selection means includes any of the attributes of a predicative phrase having no indefinite attribute, a sacrificial phrase having no indefinite attribute, a copula phrase, a sentence end, a punctuation mark, and a disconnection attribute. Any one of an adjective phrase having an adverbial phrase having an end-of-sentence or disconnection attribute, or an episodic phrase having an end-of-sentence or disconnection attribute is selected as the extraction key.

また、本発明の一形態において、拡張構造要素生成手段は、抽出キー選択手段により選択された抽出キーを、文章から文節を抽出するための拡張対象文節として、該拡張対象文節が、用言性文節、サ変性文節、コピュラ文節、形容性文節、又は副詞性文節、の場合、当該拡張対象文節に対し係りの属性を有する、用言性文節、サ変性文節、形容性文節、体言性文節、又は、副詞性文節を該抽出キーに追加して拡張構造要素を生成する前方拡張処理手段を有し、前方拡張処理手段により追加される文節が、用言性文節、サ変性文節、形容性文節、又は、体言性文節の場合、当該文節を前記拡張対象文節として、更に前記前方拡張処理手段を行う、ことを特徴とする。   In one embodiment of the present invention, the extended structural element generation means uses the extraction key selected by the extraction key selection means as an extension target phrase for extracting a phrase from a sentence, and the extension target phrase has a descriptive property. In the case of a clause, sa modification clause, copula clause, adjective clause, or adverbial clause, a phrasal clause, a sacrificial clause, an adjective clause, a somatic clause, Alternatively, it has forward extension processing means for adding an adverbial clause to the extraction key to generate an extended structure element, and the clause added by the forward extension processing means is a prescriptive phrase, a sacrificial phrase, an adjective phrase Alternatively, in the case of an episodic clause, the forward extension processing means is further performed with the clause as the extension target clause.

また、本発明の一形態において、部分構造データ生成手段は、抽出キー選択手段により選択された抽出キーを、文章から文節を抽出するための拡張対象文節として、該拡張対象文節が体言性文節の場合、拡張対象文節に対し係りの属性を有する、形容性文節、体言性文節又は副詞性文節、を該抽出キーに追加して拡張構造要素を生成する前方拡張処理手段を有し、前方拡張処理手段により追加される文節が、形容性文節又は体言性文節の場合、当該文節を拡張対象文節として、更に前方拡張処理手段を行う、ことを特徴とする。   In one embodiment of the present invention, the partial structure data generation means uses the extraction key selected by the extraction key selection means as an extension target phrase for extracting a phrase from a sentence, and the extension target phrase is an episodic phrase. Forward expansion processing means for generating an extended structural element by adding an adjective clause, a verbal clause or an adverbial clause having an attribute related to the expansion target clause to the extraction key, When the clause added by the means is an adjective clause or an episodic clause, the forward extension processing means is further performed with the clause as an extension target clause.

また、本発明の一形態において、部分構造データ生成手段は、抽出キー選択手段により選択された抽出キーを、文章から文節を抽出するための拡張対象文節として、該拡張対象文節が係りの属性を有する、用言性文節、サ変性文節、形容性文節又は副詞性文節、の場合であって、当該拡張対象文節の係り先文節が、体言性文節の場合、抽出キーに係り先の文節を追加して拡張構造要素を生成する後方拡張処理手段を有し、後方拡張処理手段により追加される体言性文節が係りの属性を有する場合であって、追加される体言性文節の係り先文節が体言性文節の場合、当該文節を前記拡張対象文節として、更に前記後方拡張処理手段を行う、ことを特徴とする。   In one embodiment of the present invention, the partial structure data generation means uses the extraction key selected by the extraction key selection means as the extension target phrase for extracting a phrase from the sentence, and sets the attribute related to the extension target phrase. If the clause has a predicative clause, a modified clause, an adjective clause, or an adverbial clause, and if the destination clause of the target clause is an episodic clause, add the destination clause to the extraction key And a backward extension processing means for generating an extended structural element, and the verbal phrase added by the backward extension processing means has a dependency attribute, and the destination clause of the added verbal phrase is In the case of a sex clause, the backward extension processing means is further performed with the clause as the extension target clause.

また、部分構造データ生成手段は、抽出キー選択手段により選択された抽出キーを文章から文節を抽出するための拡張対象文節として、該拡張対象文節が係りの属性を有する、体言性文節の場合であって、当該拡張対象文節の係り先文節が、体言性文節又はコピュラ文節の場合、前記抽出キーに係り先の文節を追加して拡張構造要素を生成する後方拡張処理手段を有し、後方拡張処理手段により追加される体言性文節が係りの属性を有する場合であって、追加される体言性文節の係り先文節が体言性文節の場合、当該文節を拡張対象文節として、更に後方拡張処理手段を行う、ことを特徴とする。   Further, the partial structure data generation means is a syntactic phrase in which the extension target clause has an attribute related to the extraction key selected by the extraction key selection means as an extension target clause for extracting a phrase from the sentence. And the extension target clause includes a backward extension processing means for adding an extension clause to the extracted key and generating an extension structure element when the dependency clause of the clause to be expanded is a body phrase clause or a copula clause, If the verbal clause added by the processing means has a dependency attribute, and the dependency clause of the added verbal clause is a verbal clause, the clause is set as an extension target clause and further backward extension processing means It is characterized by performing.

また、本発明は、請求項19ないし27記載の情報抽出方法をコンピュータに実行させる情報抽出プログラムを提供する。また、本発明は、情報抽出プログラムが記録された記録媒体を提供する。   The present invention also provides an information extraction program for causing a computer to execute the information extraction method according to claims 19 to 27. The present invention also provides a recording medium on which an information extraction program is recorded.

対象の文書に依存せず、文書または文書群の管理、閲覧、分析、再利用などを精度よくかつ簡便に実現できる情報抽出方法、情報抽出装置、情報抽出プログラム又は情報抽出プログラムが記録された記録媒体を提供することができる。   An information extraction method, information extraction device, information extraction program, or information extraction program that can accurately and easily realize management, browsing, analysis, reuse, etc. of a document or a document group without depending on the target document A medium can be provided.

以下、本発明を実施するための最良の形態を図面を参照しながら実施例を挙げて説明する。   The best mode for carrying out the present invention will be described below with reference to the accompanying drawings.

図1(a)は、本実施例における情報抽出処理の全体の流れを示すフローチャート図である。実線は処理の流れを示し、破線は処理対象データの流れを示す。また、各ステップは、各ステップに記載された、文書登録手段31、言語情報取得手段32、部分構造要素拡張抽出手段33、部分構造データ生成手段34、出力手段35により実行される。   FIG. 1A is a flowchart showing the overall flow of information extraction processing in this embodiment. A solid line indicates the flow of processing, and a broken line indicates the flow of processing target data. Each step is executed by the document registration unit 31, the language information acquisition unit 32, the partial structure element extension extraction unit 33, the partial structure data generation unit 34, and the output unit 35 described in each step.

また、図1(b)は、情報抽出装置の機能構成図を示す。情報抽出装置は、文書登録手段31、言語情報取得手段32、部分構造要素拡張抽出手段33、部分構造データ生成手段34、出力手段35を有するように構成される。これらの手段が実行する処理について説明する。まず、情報抽出処理の全体の流れの概略を説明する。   FIG. 1B shows a functional configuration diagram of the information extraction apparatus. The information extraction apparatus is configured to include a document registration unit 31, a language information acquisition unit 32, a partial structure element extension extraction unit 33, a partial structure data generation unit 34, and an output unit 35. Processing executed by these means will be described. First, an outline of the overall flow of the information extraction process will be described.

(ステップS1)
情報抽出を開始すると、文書登録処理で文書を登録する。文書登録処理は、文書登録手段31により実行される。
(Step S1)
When the information extraction is started, the document is registered by the document registration process. The document registration process is executed by the document registration unit 31.

(ステップS2)
登録された文書は順に文書記憶手段11に記憶される。登録対象文書を全て登録すると、記憶された文書から言語情報取得処理を行う。言語情報取得処理は、言語情報取得手段により実行される。
(Step S2)
The registered documents are sequentially stored in the document storage unit 11. When all the registration target documents are registered, language information acquisition processing is performed from the stored documents. The language information acquisition process is executed by a language information acquisition unit.

言語情報の取得は、たとえば、言語解析処理を実施して取得する方法、ユーザの指示を受けながら自動ないしは半自動で取得する方法など、既存の方法を用いる。言語情報とは、少なくとも、文書を構成する単語の情報、文節(ひとつの自立語か、ひとつの自立語にひとつ以上の付属語がついた形式の日本語文法上の一単位)情報、文節間係り受け関係情報のことを言う。   The language information is acquired by using an existing method such as a method of acquiring language information by performing a language analysis process or a method of acquiring automatically or semi-automatically while receiving a user instruction. Language information is at least information on the words that make up the document, clauses (one independent word or one unit in Japanese grammar with one or more attached words attached to one independent word), information between phrases Refers to dependency relationship information.

文節間係り受け関係とは、文節と文節の間に存在する文法的関係であり、たとえば、「私が食べた林檎。」という文では、体言性文節「私が」は、用言性文節「食べた」を文法的に修飾しており、「私が」が「食べた」に係る、もしくは係り受け関係にある、という。その係り受け関係名は格助詞「ガ」を伴うことから「ガ格連用修飾関係」という。連用修飾とは、ある文節が用言性文節を修飾する現象をさす。また、用言性文節「食べた」は、体言性文節「林檎。」を文法的に修飾しており、その係り受け関係名は「連体修飾関係」という。連体修飾とは、ある文節が体言性文節を修飾する現象をさす。また、係り受け関係名のうち、「並列」は、連体修飾の1バリエーションとして処理する。実施例では、「システムと」→「新システムとの」という文節対の係り受け関係である「並列」を、連体修飾扱いで処理する。ここで、用言とは、単独で文節になりうる自立語のうち、活用がある単語であり、たとえば動詞や形容詞の類を言う。用言性文節とは、用言を含み、述語を形成する文節を言う。実施例では、用言性文節以外は体言性文節としている。体言句は活用しない自立語で構成され、最後に位置する自立語が名詞類である連文節と定義する。サ変名詞の自立語は、用言性文節も体言性文節も生成するが、たとえば直後に助詞や断定の助動詞などがついていれば体言性文節、直後に補助動詞「する」「できる」などがついていれば、用言性文節、と付属語の接続のし方で、係り受け解析処理時にどちらか判断することができる。言語情報が付加された文書は順に言語情報記憶手段12に記憶される。   The dependency relationship between clauses is a grammatical relationship that exists between clauses. For example, in the sentence “I ate apples”, the verbal phrase “I am” “I ate” is grammatically modified, and “I” ate “I ate”, or it ’s a dependency. Because the dependency relationship name is accompanied by the case particle “Ga”, it is called “Ga case continuous modification relationship”. Concurrent modification refers to a phenomenon in which a phrase modifies a idiom phrase. In addition, the prescriptive phrase “I ate” grammatically modifies the verbal phrase “Ringo.”, And its dependency relation name is “multiple modification relation”. Linkage modification refers to the phenomenon in which a certain clause modifies an episodic clause. Of the dependency relationship names, “parallel” is processed as one variation of the linkage modification. In the embodiment, “parallel”, which is a dependency relationship of the phrase pair “from the system” to “from the new system”, is processed as a combination modification. Here, a predicate is a word that can be used among independent words that can become a phrase alone, for example, a verb or an adjective. A prescriptive phrase is a phrase that includes a predicate and forms a predicate. In the embodiment, the verbal clauses other than the prescriptive clauses are set as the verbal clauses. A syntactic phrase is composed of independent words that are not used, and the last independent word is defined as a noun phrase. Self-independent words of sa variable nouns generate both prescriptive and somatic verbal clauses.For example, if there is a particle or asserted auxiliary verb immediately followed by a verbal phrase, the verbal verb "do" or "can" is added immediately after. If this is the case, it can be determined at the time of dependency analysis processing, depending on how to connect the idiom clause and the attached word. Documents to which language information is added are sequentially stored in the language information storage unit 12.

(ステップS3)
登録文書全部の言語情報取得処理が終了すると、次に、記憶された言語情報が付加された文書に対し、部分構造要素拡張抽出処理を実行する。部分構造要素拡張抽出処理は、部分構造要素拡張抽出手段33により実行される。
(Step S3)
When the linguistic information acquisition process for all the registered documents is completed, the substructure element extension extraction process is executed on the document to which the stored linguistic information is added. The partial structure element extension extraction process is executed by the partial structure element extension extraction means 33.

部分構造要素拡張抽出手段33は、図1(b)に示すように、深さ情報取得手段330を有し、深さ情報取得手段330は、抽出キー選択手段331、自立語取得手段332、深さ情報加算手段333、深さ情報指定手段334とを有する。   As shown in FIG. 1B, the partial structural element extension extraction unit 33 includes depth information acquisition unit 330. The depth information acquisition unit 330 includes extraction key selection unit 331, independent word acquisition unit 332, depth Depth information adding means 333 and depth information specifying means 334.

深さ情報取得手段330は、言語情報取得処理(S2)により該文書から取得された一の自立語(以下、抽出キーという)と、他の自立語との係り受け関係の強さを表す深さ情報を取得する。深さ情報取得手段330により、抽出キーと他の各自立語との係り受け関係の強さが深さ情報で表される。   The depth information acquisition means 330 is a depth indicating the strength of the dependency relationship between one independent word (hereinafter referred to as an extraction key) acquired from the document by the language information acquisition process (S2) and another independent word. Get information. By the depth information acquisition means 330, the strength of the dependency relationship between the extraction key and each other independent word is represented by the depth information.

抽出キー選択手段331は、文書を構成する用言又は体言の自立語を、文書の末尾から順に抽出キーとして抽出する。自立語取得手段332は、選択された抽出キーが係り先となっている自立語を全て取得する。そして、各自立語に初期値の深さ情報、例えば0を付与する。したがって、抽出キーを直接修飾する自立語の深さ情報は0となる。深さ情報加算手段333は、取得された自立語が係り先となっている自立語(以下、係り先自立語という)を取得して、係り先自立語の深さ情報として、取得された自立語の深さ情報の値に所定値加算した値を付与する。したがって、係り先自立語の深さ情報は、係り先自立語が深さ情報0の自立語を修飾するのであれば、所定値(例えば1)を0に加算して1の深さ情報となる。同様に、係り先自立語が、深さ情報1の自立語を修飾するのであれば、深さ情報は2となる。深さ情報指定手段334は、深さ情報の値を指定する。深さ情報指定手段334により深さ情報の指定があった場合は、指定された値以下の深さ情報の自立語を取得して情報抽出処理を終了する。   The extraction key selection means 331 extracts the words or the independent words constituting the document as extraction keys in order from the end of the document. The independent word acquisition unit 332 acquires all the independent words that are related to the selected extraction key. Then, initial depth information, for example, 0 is assigned to each independent word. Therefore, the depth information of the independent word that directly modifies the extraction key is zero. The depth information addition means 333 acquires the independent word in which the acquired independent word is a dependency (hereinafter referred to as a dependency independent word), and acquires the acquired independent as the depth information of the dependency independent word. A value obtained by adding a predetermined value to the value of the word depth information is assigned. Therefore, the depth information of the dependency independent word becomes the depth information of 1 by adding a predetermined value (for example, 1) to 0 if the dependency independent word modifies the independent word of depth information 0. . Similarly, if the dependency independent word modifies the independent word of the depth information 1, the depth information becomes 2. The depth information specifying unit 334 specifies the value of depth information. If depth information is specified by the depth information specifying means 334, an independent word of depth information equal to or less than the specified value is acquired, and the information extraction process is terminated.

一文書の一文毎に、言語情報を用いて、部分構造要素拡張抽出を行う。一文の部分構造要素拡張抽出が終了すると、抽出結果は部分構造要素記憶手段13に記憶され、また次の文の言語情報が付加された文書から、同様に部分構造要素拡張抽出処理と記憶を実行する。一文書の全文に対して部分構造要素拡張抽出処理と記憶が終了すると、次の文書の先頭文から、同様の拡張部分構造要素抽出処理と記憶を実行する。   For each sentence of one document, partial structure element extension extraction is performed using language information. When the partial structure element expansion extraction of one sentence is completed, the extraction result is stored in the partial structure element storage means 13, and the partial structure element expansion extraction process and storage are similarly executed from the document to which the language information of the next sentence is added. To do. When the partial structure element extension extraction process and storage are completed for the entire sentence of one document, the same extended partial structure element extraction process and storage are executed from the first sentence of the next document.

(ステップS4)
全ての登録文書に対して部分構造要素拡張抽出処理と記憶が終了すると、部分構造要素記憶手段13に記憶された拡張部分構造要素の先頭から順に、部分構造データを生成する部分構造データ生成処理を実行する。部分構造データ生成処理は、部分構造データ生成手段34により実行される。
(Step S4)
When the partial structure element extension extraction process and storage are completed for all registered documents, the partial structure data generation process for generating the partial structure data in order from the head of the extended partial structure element stored in the partial structure element storage unit 13 is performed. Execute. The partial structure data generation process is executed by the partial structure data generation means 34.

生成された部分構造データを順に部分構造データ記憶手段14に記憶し、所定の表示手段で表示され、全ての部分構造要素に対して部分構造データ生成処理と記憶と表示が終了すると、情報抽出処理を終了する。   The generated partial structure data is sequentially stored in the partial structure data storage means 14, displayed on a predetermined display means, and when the partial structure data generation processing, storage, and display are completed for all partial structure elements, information extraction processing is performed. Exit.

続いて、言語情報取得処理(S2)、部分構造要素抽出処理(S3)、部分構造データ生成処理(S4)について詳細に説明する。   Next, the language information acquisition process (S2), the partial structure element extraction process (S3), and the partial structure data generation process (S4) will be described in detail.

〔言語情報取得処理〕
S21)まず、文書の先頭から1文を取り出し、言語解析処理を行ない言語情報を取得する。
S22)言語解析処理は、既存の方法を用い、文中の単語の情報、文節の情報、係り受け関係の情報を取得する。例文の言語情報取得結果は上述の図2のようになる。
S23)1文の言語解析処理が終了したら、言語情報取得済みの文を言語情報記憶手段12に記憶する。
S24)登録文書に次の文があったら、S21)へ戻り次の文を対象に、言語解析を実施する。この操作を文書中の文がなくなるまで行い、全文の言語解析処理を終了したら、部分構造要素拡張抽出処理に進む。
[Language information acquisition processing]
S21) First, one sentence is extracted from the head of the document, language analysis processing is performed, and language information is acquired.
S22) The language analysis process uses existing methods to acquire word information, phrase information, and dependency relation information in a sentence. The language information acquisition result of the example sentence is as shown in FIG.
S23) When the language analysis process for one sentence is completed, the sentence whose language information has been acquired is stored in the language information storage means 12.
S24) If there is a next sentence in the registered document, the process returns to S21) to perform language analysis on the next sentence. This operation is performed until there are no more sentences in the document. When the language analysis process for the entire sentence is completed, the process proceeds to the partial structure element extension extraction process.

図2は言語解析の結果得られた言語情報取得結果の一例である。図2の言語情報取得結果は、「でもいずれ、現在所有しているシステムと新システムとのパフォーマンスの差が開けば、コンシューマーや企業はこうした新システムを購入したくなるということ。」を例文とした。   FIG. 2 is an example of a language information acquisition result obtained as a result of language analysis. The linguistic information acquisition result in FIG. 2 is “But, if the difference in performance between the current system and the new system opens, consumers and companies will want to purchase such a new system.” did.

言語解析の結果得られる言語情報付き文書は、1文節2行で表現され、第一行は、先頭から、「該当文節の文節番号」、「該当文節の係り先の文節番号」、「係り先文節への係り受け関係名」、「矢印」、「該当文節の表記」、「文節属性」で構成されている。文節属性とは、その文節が体言性か、用言性かの別をいう。   The document with linguistic information obtained as a result of the language analysis is expressed by two lines of one phrase, and the first line starts from the beginning with "Section number of the corresponding phrase", "Section number of the destination of the corresponding phrase", It consists of a dependency relation name for a phrase, an arrow, a description of the corresponding phrase, and a phrase attribute. The phrase attribute refers to whether the phrase is an episodic or a idiom.

第二行は、該当文節の構成単語情報であり、該当文節の先頭単語から、単語の表記、品詞のペアが、該当文節の構成単語数分、記載されている。図2の文書の最初の文節「でも、」を例に挙げると、文節番号が[0]であり、係り先文節は文節[14]であり、係り先文節への係り受け関係名は、連用修飾であり、この文節の表記は[でも、]であり、文節属性は体言性である。その構成単語は、接続詞「でも」と、読点「、」であることを示している。   The second line is constituent word information of the corresponding clause, and from the first word of the relevant clause, word notation and part-of-speech pairs are described for the number of constituent words of the relevant clause. In the example of the first clause “E even” in the document of FIG. 2, the clause number is [0], the dependency clause is the clause [14], and the dependency relation name to the dependency clause is It is a modification, and the notation of this clause is [But], and the clause attribute is episodic. The constituent words indicate the conjunction “even” and the punctuation mark “,”.

〔部分構造要素拡張抽出処理〕
図2の言語情報取得結果を用いて、部分構造要素拡張抽出処理を説明する。まず、全ての深さ階層の拡張部分構造要素を抽出する場合について説明する。
[Substructure element extension extraction process]
The partial structure element extension extraction process will be described using the language information acquisition result of FIG. First, a case where extended partial structural elements of all depth hierarchies are extracted will be described.

始めに、部分構造要素拡張抽出処理が行われた結果について簡単に説明する。図3及び図4は、図2の言語情報取得結果から拡張部分構造要素を抽出した抽出例である。1抽出キーについて、関係自立語の行が0個以上付帯した形式で、抽出キーの行は、抽出キーの種類(用言か体言)、抽出キーの表記、抽出キーの属性として品詞を抽出している。関係自立語の行は、関係の深さ(0から1ずつ加算の整数値)、抽出した単語の表記、属性としての品詞、抽出キーとの係り受けにおける修飾関係名、拡張要素(0個以上の可変数)を抽出している。拡張要素には、後述するように、意図表現や接続の意味などが付加される。拡張要素は、トピックの展開経緯を示したり、トピック単位間の類似や差異に加える。また、単語の表記や品詞名では類似度の低かった文書が、拡張要素の情報により類似度が高くなる効果も期待できる。   First, the result of the partial structure element extension extraction process will be briefly described. 3 and 4 are extraction examples in which extended partial structural elements are extracted from the language information acquisition result of FIG. For one extracted key, there are zero or more related independent words attached, and the extracted key line extracts the part of speech as the type of extracted key (prescriptive or syntactic), the extracted key notation, and the extracted key attribute. ing. The relation independent word line includes the depth of the relation (an integer value obtained by adding 0 to 1), the notation of the extracted word, the part of speech as the attribute, the qualified relation name in the dependency with the extraction key, and the extension element (0 or more) Variable number). As will be described later, intention expressions and connection meanings are added to the extension elements. The extension element indicates the development history of the topic and adds to the similarity and difference between the topic units. In addition, it can be expected that a document having a low similarity in word notation or part-of-speech name has a high similarity due to the information of the extension element.

部分構造要素拡張抽出処理は、関係の深さ、単語の表記、属性としての品詞、抽出キーとの係り受けにおける修飾関係名、拡張要素、の各要素を一文から抽出することで部分構造要素拡張抽出を行う。図3又は図4の抽出された拡張部分構造要素に基づき、部分構造データが生成される。   The substructure element extension extraction process extracts the substructure element by extracting each element of the relationship depth, word notation, part of speech as an attribute, modification relation name in the dependency with the extraction key, and extension element from one sentence. Perform extraction. Partial structure data is generated based on the extracted extended partial structure element shown in FIG.

(用言「いう」を抽出キーとする部分構造要素の抽出)
図5(a)は、用言を抽出キーとして拡張部分構造要素を抽出する場合の処理の流れを示すフローチャート図である。図5(a)のフローチャート図は、下記1)〜101)の処理の方針を示す。まず、図3の言語情報取得結果を参照して、文末から順に用言を1つづつ抽出キーとして抽出する(S101)。抽出キーが抽出されたら、抽出キーが意図表現を有するか否か後述の辞書を参照し、意図表現を有すれば抽出する(S102)。次いで、抽出キーを連用修飾する自立語を抽出して、それらの深さ情報を初期値0とし(S103)、また、深さ情報0の自立語が含まれる文節に意図表現があればそれを抽出する(S104)。次いで、深さ情報をカウントするカウント定数kに0を入力する。
(Extraction of substructure elements using the word "say" as an extraction key)
FIG. 5A is a flowchart showing a processing flow in the case of extracting an extended partial structure element using a prescription as an extraction key. The flowchart of FIG. 5A shows the policy of the processing 1) to 101) below. First, referring to the language information acquisition result of FIG. 3, the predicates are extracted one by one as an extraction key in order from the end of the sentence (S101). When the extraction key is extracted, a dictionary which will be described later is referred to whether or not the extraction key has an intention expression. If the extraction key has an intention expression, the extraction key is extracted (S102). Next, independent words that use the extracted key in combination are extracted and their depth information is set to an initial value of 0 (S103). Extract (S104). Next, 0 is input to the count constant k for counting the depth information.

なお、ステップS103の処理を、「抽出キー「が」直接修飾する自立語を深さ情報0の自立語として抽出」とすることで、抽出キーが係り元となる係り受け関係についても抽出できる。下記1)〜101)では、抽出キーが係り元となる係り受け関係についても抽出する(処理8)、163))。   Note that, by setting the processing of step S103 to “extract an independent word that directly modifies the extraction key“ ga ”as an independent word of depth information 0”, it is also possible to extract a dependency relationship from which the extraction key is a source. In the following 1) to 101), the dependency relationship from which the extraction key is the dependency source is also extracted (processing 8) and 163)).

次いで、深さ情報k(=0)の自立語を修飾する自立語を抽出して、抽出された自立語にk+1(=1)の深さ情報を付与する。また、深さ情報k+1の自立語が含まれる文節に意図表現があればそれを抽出する(S107)。   Next, an independent word that modifies the independent word of the depth information k (= 0) is extracted, and depth information of k + 1 (= 1) is given to the extracted independent word. Further, if there is an intention expression in the phrase including the independent word of the depth information k + 1, it is extracted (S107).

次いで、深さ情報がk(=0)の自立語(抽出キーを連用修飾する自立語)が他にあれば、ステップS106〜S107を繰り返す(S108)。   Next, if there is another independent word whose depth information is k (= 0) (an independent word that uses the extracted key for continuous modification), steps S106 to S107 are repeated (S108).

次いで、深さ情報k+1(=1)の自立語を修飾する自立語があるか否か判定し、あれば(ステップS109のN)、kにk+1を入力する(S110)。ここまでの処理で、深さ情報0と1の自立語が抽出され、カウント定数kは1になった。ステップS106〜S107を繰り返すことで、1つの抽出キーについて、係り受け関係がなくなるまでカウント定数kがインクリメントされ、係り先となった自立語にカウント定数kの値が深さ情報として付与される。   Next, it is determined whether or not there is an independent word that modifies the independent word of the depth information k + 1 (= 1) (N in Step S109), and if it exists, k + 1 is input to k (S110). Up to this point, independent words with depth information 0 and 1 have been extracted, and the count constant k has become 1. By repeating steps S106 to S107, the count constant k is incremented until there is no dependency relationship for one extracted key, and the value of the count constant k is given as depth information to the independent word that has become a dependency destination.

深さ情報k+1の自立を修飾する自立語がなければ(ステップS109のY)、次の用言を抽出キーとして同様の処理を繰り返す(ステップS111のN)。全ての用言について処理が終了したら(ステップS111のY)、図5(a)の処理が終了する。   If there is no self-supporting word that modifies the self-supporting of the depth information k + 1 (Y in step S109), the same processing is repeated using the next premise as an extraction key (N in step S111). When the processing is completed for all the predicates (Y in step S111), the processing in FIG.

続いて、図5(a)の部分構造要素抽出処理について例文に基づき詳細に説明する。なお、部分構造要素抽出処理では、図6に示す辞書を使用する。図6(a)は、接続助詞と接続詞と接続の意味の対応が記述された辞書の例であり、接続助詞、もしくは接続詞の表記と品詞と、対応する接続の意味が記載されている。図6(b)は、意図を示す表現と意図の対応が記述された辞書の例であり、意図を表現する語の表記と品詞と対応する意図が記載されている。   Next, the partial structural element extraction process of FIG. 5A will be described in detail based on example sentences. In the partial structure element extraction process, the dictionary shown in FIG. 6 is used. FIG. 6A is an example of a dictionary in which correspondence between connection particles, conjunctions, and connection meanings is described. Connection dictionary or conjunction notation and part of speech and corresponding connection meanings are described. FIG. 6B is an example of a dictionary in which the correspondence between the expression indicating the intention and the intention is described. The notation of the word expressing the intention and the intention corresponding to the part of speech are described.

1)まず、言語情報記憶手段12から、先頭から1文分の言語情報付き図2の文を取り出し、最後尾の文節から、用言を検索する。図2では最後尾の文節は文節番号[16]の文節である。
2)文節番号[16]は、体言性文節であるため、文節番号[15]を検査する。文節番号[15]は、用言性文節であるので、文節番号[15]から用言「いう」を抽出する。
3)抽出キーとして、「いう」の表記と品詞属性「動詞」を抽出、記憶する。また、図5(b)の辞書を参照して同文節内に意図表現があるか否か調べ、ある場合には対応する意図を拡張要素に登録する(以下、意図表現チェックと称す。)。同文節には意図表現はないので、拡張要素には登録しない。
4)次に、文節番号[15]から、先頭文節に向かって順に用言「いう」を直接連用修飾している文節の自立語を検索する。
5)文節番号[14]の係り先文節番号が[15]であることから、文節番号[14]の文節が「いう」を直接連用修飾していることがわかり、「なる」を発見する。「なる」は、抽出キーを直接修飾している自立語なので、深さ0と、「なる」の表記と、品詞属性「動詞」と、係り受け関係名「ト格連用修飾」を記憶する。また、同文節内に意図表現があるか否か意図表現チェックを行う。図6の辞書を参照するが、同文節には意図表現はない。
6)さらに、文節番号[14]から、先頭文節に向かって順に用言「いう」を直接連用修飾している文節の自立語を検索する。この検索のときに、直前文節の係り受け関係名が「並列」であって、その係り先文節番号が該当文節の文節番号であった場合、その直前の文節の自立語も抽出対象とし、係り受け関係は処理対象の文節の係り受け関係名で記憶する。これを並列チェックと呼ぶ。並列チェックを実施すると、文節番号[14]に直接「並列」で修飾する文節はないことがわかるので、先頭文節への検索を進める。
7)文節番号[13]〜先頭文節番号[0]まで検索する。係り先文節番号が[15]である文節はないので、次に「いう」が直接連体修飾している自立語を、文節番号[16]から文末文節に向かって検索する。
8)文節番号[15]の係り先文節番号が[16]であることから、文節番号[15]の文節が文節番号が[16]の「こと。」を直接連体修飾していることがわかり、「こと」を発見する。「こと」は、抽出キーが直接修飾している自立語なので、深さ0と、「こと」の表記と品詞属性「形式名詞」と、係り受け関係「連体修飾」とを記憶する。このとき、先の連用修飾関係の自立語との差異を示すフラグを立てる。図3では、アスタリスクでフラグを表現している。さらに、同文節内の意図表現チェックをするが、同文節には意図表現はない。
9)さらに、文節番号[16]から、文末文節に向かって順に用言「いう」が直接連体修飾している文節の自立語を検索する。この検索のときに、該当文節の係り受け関係名が「並列」であって、その係り先文節番号が直後の文節の文節番号であった場合、その直後の文節の自立語も抽出対象とし、係り受け関係は処理対象の文節の係り受け関係名で記憶する。これも並列チェックと呼ぶ。文節番号[16]に対して並列チェックを実施し、係り受け関係名が「並列」ではなく文末文節であるため、さらなる抽出対象の自立語はないということがわかる。
10)日本語文法の普遍的な制約「文節の係り先は一つである」により、「いう」が直接連体修飾している自立語が既に存在したため、用言「いう」を抽出キーとする深さ0の部分構造要素の抽出を終了する。
1) First, the sentence of FIG. 2 with one sentence of language information from the head is extracted from the language information storage means 12, and a predicate is searched from the last sentence. In FIG. 2, the last clause is the clause of clause number [16].
2) Since clause number [16] is an episodic clause, clause number [15] is examined. Since the phrase number [15] is a predicate phrase, the predicate “say” is extracted from the phrase number [15].
3) As an extraction key, the notation “say” and the part of speech attribute “verb” are extracted and stored. Further, it is checked whether or not there is an intention expression in the same phrase with reference to the dictionary of FIG. 5B, and if there is, the corresponding intention is registered in the extension element (hereinafter referred to as intention expression check). Since there is no intention expression in this clause, it is not registered as an extension element.
4) Next, from the phrase number [15], search for independent words in the phrase in which the predicate “say” is directly modified in order from the phrase number [15].
5) Since the destination clause number of clause number [14] is [15], it can be seen that the clause of clause number [14] directly modifies “say”, and “is” is found. Since “Naru” is an independent word that directly modifies the extracted key, the depth 0, the notation “Naru”, the part-of-speech attribute “verb”, and the dependency relation name “Glyph combination modification” are stored. Also, an intention expression check is performed to determine whether there is an intention expression in the same phrase. Referring to the dictionary of FIG. 6, there is no intention expression in the phrase.
6) Further, from the phrase number [14], search for independent words in the phrase in which the predicate “say” is directly modified in order from the phrase number [14]. In this search, if the dependency relationship name of the immediately preceding clause is “Parallel” and the dependency clause number is the clause number of the corresponding clause, the independent word of the immediately preceding clause is also extracted, The reception relationship is stored as the dependency relationship name of the phrase to be processed. This is called a parallel check. When the parallel check is performed, it can be seen that there is no clause that is directly qualified with “parallel” in clause number [14], so the search for the first clause is advanced.
7) Search from phrase number [13] to head phrase number [0]. Since there is no clause whose dependency clause number is [15], the next independent word directly modified by “say” is searched from the clause number [16] toward the end clause.
8) Since the destination clause number of clause number [15] is [16], it can be seen that the clause of clause number [15] directly modifies “that” of clause number [16]. , "Koto" is discovered. Since “Koto” is an independent word directly modified by the extraction key, the depth 0, the notation of “Koto”, the part-of-speech attribute “formal noun”, and the dependency relationship “combined modification” are stored. At this time, a flag indicating a difference from the independent word of the previous consecutive modification relationship is set. In FIG. 3, flags are represented by asterisks. Furthermore, the intention expression in the same clause is checked, but there is no intention expression in the same clause.
9) Further, from the phrase number [16], the self-supporting words of the phrases in which the predicate “say” is directly modified in the order from the phrase number [16] are searched. In this search, if the dependency relationship name of the corresponding clause is “parallel” and the dependency clause number is the clause number of the immediately following clause, the independent word of the immediately following clause is also extracted, The dependency relationship is stored as the dependency relationship name of the phrase to be processed. This is also called a parallel check. A parallel check is performed on clause number [16]. It can be seen that there is no further independent word to be extracted because the dependency relation name is not “parallel” but a sentence end clause.
10) Due to the universal restriction of Japanese grammar “there is only one clause destination”, there is already an independent word that is directly modified by “say”. The extraction of the partial structural element having the depth 0 is finished.

11)次に、抽出キーと係り受け関係がある自立語に、更に係り受け関係がある文節の自立語を抽出する。抽出キー「いう」に係り受け関係がある自立語は、「なる」と「こと」である。まず、「なる」を含む文節番号[14]を直接修飾する文節を、文節番号[13]から先頭文節に向かって検索する。
12)文節番号[13]の係り先文節が文節番号[14]であるため、文節番号[13]から自立語「購入」を発見する。「購入」は、深さ0の自立語「なる」を直接修飾している自立語なので、深さを加算して、深さ1と、「購入」の表記と、品詞属性「サ変」と、係り受け関係名「連用修飾」を記憶する。同文節内の意図表現チェックを実施すると、図5(b)の要望を示す表現「たい」と合致したため、拡張要素に意図「要望」を登録する。
11) Next, the independent words of the phrase having the dependency relationship are further extracted from the independent words having the dependency relationship with the extraction key. Independent words that have a dependency relationship with the extraction key “say” are “become” and “ko”. First, a phrase that directly modifies the phrase number [14] including “Naru” is searched from the phrase number [13] toward the first phrase.
12) Since the destination clause of the clause number [13] is the clause number [14], the independent word “purchase” is found from the clause number [13]. “Purchase” is an independent word that directly modifies the independent word “Naru” with a depth of 0. Therefore, by adding the depth, the depth 1 and the notation of “purchasing”, the part of speech attribute “sa kin”, The dependency relationship name “continuous modification” is stored. When the intention expression check in the same clause is performed, the intention “request” is registered in the extension element because it matches the expression “I want” shown in FIG. 5B.

13)さらに、文節番号[14] を直接修飾する文節を、文節番号[13]から先頭文節に向かって検索し、並列チェックを経ると、文節番号[10]から自立語「企業」を発見する。自立語「企業は」深さ0の自立語「なる」を直接修飾している自立語なので、深さを加算して、深さ1と、「企業」の表記と、品詞属性「名詞」と、係り受け関係名「連用修飾」を記憶する。同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
14)さらに、文節番号[14] を直接修飾する文節を、文節番号[9]から先頭文節に向かって検索する。このとき、並列チェックを実施すると、文節番号[9]の係り受け関係名が「並列」であるので、その係り先文節番号が該当文節[10]の文節番号であることから、その直前の文節[9]の自立語「コンシューマー」も抽出対象となる。したがって、深さ1と「コンシューマー」の表記と、品詞属性「名詞」と、係り受け関係名は、処理対象の文節の係り受け関係名「連用修飾」で記憶する。同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
15)さらに、文節番号[14] を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索し、並列チェックを経て、文節番号[0]から自立語「でも」を発見する。自立語「でも」は、深さ0の自立語「なる」を直接修飾している自立語なので、深さを加算して、深さ1と、「でも」の表記と、品詞属性「接続詞」と、係り受け関係名「連用修飾」を記憶する。品詞が接続詞であっても、該当自立語の深さが0でないため、接続助詞と接続詞と接続の意味の対応が記述された辞書は参照にいかない。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
13) Furthermore, a phrase that directly modifies clause number [14] is searched from clause number [13] toward the first clause, and through parallel checking, the independent word “company” is found from clause number [10]. . Since the independent word “Company” is an independent word that directly modifies the independent word “Naru” with a depth of 0, the depth is added to the depth 1 with the expression “Company” and the part-of-speech attribute “Noun”. , Store the dependency relation name “continuous modification”. When the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
14) Further, the phrase directly modifying the phrase number [14] is searched from the phrase number [9] toward the first phrase. At this time, if the parallel check is performed, the dependency relationship name of the clause number [9] is “parallel”, and the dependency clause number is the clause number of the corresponding clause [10]. The independent word “consumer” in [9] is also subject to extraction. Therefore, the notation of depth 1 and “consumer”, the part-of-speech attribute “noun”, and the dependency relation name are stored as the dependency relation name “continuous modification” of the clause to be processed. When the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
15) Further, the phrase directly modifying the phrase number [14] is searched from the phrase number [8] toward the first phrase, and through the parallel check, the independent word “Den” is found from the phrase number [0]. Since the independent word “but” is an independent word that directly modifies the independent word “being” with a depth of 0, the depth is added, the depth 1 is expressed with “even”, and the part-of-speech attribute “connective” And the dependency relation name “continuous modification” is stored. Even if the part-of-speech is a conjunctive, the depth of the corresponding independent word is not 0. Therefore, the dictionary in which the correspondence between the connecting particle, the conjunctive, and the meaning of the connection is described cannot be referenced. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.

16)さらに、文節番号[14] を直接修飾する文節を、文節番号[0]から先頭文節に向かって、並列チェックを経て、検索する。先頭文節まで検索すると、文節番号[14] を直接修飾する文節がないので、自立語「なる」を直接修飾する自立語の検索を終了する。   16) Further, a clause that directly modifies clause number [14] is searched from the clause number [0] toward the first clause through a parallel check. When searching up to the first clause, there is no clause that directly qualifies the clause number [14], so the search for the independent word that directly qualifies the independent word “Naru” ends.

17)次に自立語「こと」を含む文節番号[16]を直接修飾する文節を、文節番号[15]から先頭文節に向かって検索する。このとき抽出キー「いう」を含む文節番号[15]は検索対象としない。
18)先頭文節まで検索して、文節番号[16]を直接修飾する文節がないので、自立語「こと」を直接修飾する自立語の検索を終了する。
17) Next, a phrase that directly modifies the phrase number [16] including the independent word “koto” is searched from the phrase number [15] toward the first phrase. At this time, the phrase number [15] including the extraction key “say” is not searched.
18) Since the first phrase is searched and there is no phrase that directly modifies the phrase number [16], the retrieval of the independent word that directly modifies the independent word “Koto” is terminated.

19)次に、自立語「こと」を含む文節番号[16]が直接修飾する文節を、文末文節に向かって検索する。
20)文節番号[16]が文末文節であるため、自立語「こと」を含む文節番号[16]が直接修飾する文節がないので、自立語「こと」が直接修飾する自立語の検索を終了する。
19) Next, the phrase directly modified by the phrase number [16] including the independent word “Koto” is searched for toward the sentence end phrase.
20) Since clause number [16] is the end-of-sentence clause, there is no clause directly modified by clause number [16] containing the independent word “koto”, so the search for independent words directly modified by the independent word “koto” is terminated. To do.

21)次に、深さ1の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ1の抽出自立語は、「購入」と「企業」と「コンシューマー」と「でも」である。まず、「購入」を含む文節番号[13]を直接修飾する文節を、文節番号[12]から先頭文節に向かって検索する。   21) Next, an independent word of a phrase having a dependency relationship with the extracted independent word of depth 1 is extracted. The extracted independent words of depth 1 are “Purchase”, “Company”, “Consumer”, and “Even”. First, the phrase directly modifying the phrase number [13] including “purchase” is searched from the phrase number [12] toward the first phrase.

22)文節番号[12]の係り先文節が文節番号[13]であるため、文節番号[12]から自立語「システム」を発見する。自立語「システム」は、深さ1の自立語「購入」を直接修飾している自立語なので、深さを加算して、深さ2と、「システム」の表記と、品詞属性「名詞」と、係り受け関係名「ヲ格連用修飾」を記憶する。同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
23)さらに、文節番号[13] を直接修飾する文節を、文節番号[11]から先頭文節に向かって検索し、並列チェックを経て、文節番号[8]から自立語「開く」を発見する。自立語「開く」は、深さ1の自立語「購入」を直接修飾している自立語なので、深さを加算して、深さ2と、「開く」の表記と、品詞属性「動詞」と、係り受け関係名「連用修飾」を記憶する。さらに図6(a)の辞書で、「開く」が含まれる文節中の接続助詞の有無を検査すると、接続助詞「ば」が辞書とマッチするため、拡張要素に接続意味「順接仮定」を登録する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
24)さらに、文節番号[13] を直接修飾する文節を、文節番号[7]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索するが、文節番号[13] を直接修飾する文節がないので、自立語「購入」を直接修飾する自立語の検索を終了する。
22) Since the dependency clause of the clause number [12] is the clause number [13], the independent word “system” is found from the clause number [12]. Since the independent word “system” is an independent word that directly modifies the independent word “purchase” at depth 1, add the depth to the depth 2, the notation of “system”, and the part of speech attribute “noun” And the dependency relation name “wo case qualification” is stored. When the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
23) Further, the phrase directly modifying the phrase number [13] is searched from the phrase number [11] toward the first phrase, and through the parallel check, the independent word “open” is found from the phrase number [8]. Since the independent word “open” is an independent word that directly modifies the independent word “purchase” at depth 1, add the depth, the depth 2, the expression “open”, and the part of speech attribute “verb” And the dependency relation name “continuous modification” is stored. Further, in the dictionary of FIG. 6A, when the presence of a connection particle in a phrase including “open” is checked, the connection particle “ba” matches the dictionary, and therefore the connection meaning “forward assumption” is added to the extension element. sign up. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
24) Further, the phrase directly modifying the phrase number [13] is searched from the phrase number [7] toward the first phrase, and through the parallel check, the search is performed up to the first phrase, but the phrase number [13] is directly qualified. Since there is no clause to do, the search for the independent word that directly modifies the independent word “purchase” is terminated.

25)次に「企業」を含む文節番号[10]を直接修飾する文節を、文節番号[9]から先頭文節に向かって検索する。文節番号[9]の係り先文節が文節番号[10]であるため、文節番号[9]から自立語「コンシューマー」を発見する。自立語「コンシューマー」は、深さ1の自立語「企業」を直接修飾している自立語なので、深さを加算して深さ2と、「コンシューマー」の表記と、品詞属性「名詞」と、係り受け関係名「並列」を記憶する。同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。   25) Next, a phrase that directly modifies the phrase number [10] including “company” is searched from the phrase number [9] toward the first phrase. Since the destination clause of clause number [9] is clause number [10], the independent word “consumer” is found from clause number [9]. The independent word “consumer” is an independent word that directly modifies the independent word “enterprise” at depth 1. Therefore, add the depth to the depth 2, “consumer”, and the part of speech attribute “noun”. , The dependency relation name “parallel” is stored. When the intention expression check in the same phrase is performed, there is no target expression in the same phrase.

25)さらに文節番号[10] を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索するが、文節番号[10] を直接修飾する文節がないので、自立語「企業」を直接修飾する自立語の検索を終了する。   25) Furthermore, a clause that directly qualifies clause number [10] is searched from clause number [8] toward the first clause, and through the parallel check, the first clause is searched, but clause number [10] is directly modified. Since there are no clauses, the search for independent words that directly qualify the independent word “company” is terminated.

26)次に「コンシューマー」を含む文節番号[9]を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[9] を直接修飾する文節がないので、自立語「コンシューマー」を直接修飾する自立語の検索を終了する。   26) Next, a phrase that directly qualifies the phrase number [9] including “consumer” is searched from the phrase number [8] toward the first phrase. Since there is no clause that directly qualifies clause number [9] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “consumer” is terminated.

27)次に、「でも」を含む文節番号[0]を直接修飾する文節を、先頭文節に向かって検索する。文節番号[0]が先頭文節であることから、文節番号[0] を直接修飾する文節がないので、自立語「でも」を直接修飾する自立語の検索を終了する。   27) Next, the phrase directly modifying the phrase number [0] including “Even” is searched toward the first phrase. Since clause number [0] is the first clause, there is no clause that directly qualifies clause number [0], so the search for independent words that directly qualify the independent word “even” is terminated.

28)次に、深さ2の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ2の抽出自立語は、「システム」と「開く」と「コンシューマー」である。まず、「システム」を含む文節番号[12]を直接修飾する文節を、文節番号[11]から先頭文節に向かって検索する。
29)文節番号[11]の係り先文節が文節番号[12]であるため、文節番号[11]から自立語「こうした」を発見、深さ2の自立語「システム」を直接修飾している自立語なので、深さを加算して、深さ3と、「こうした」の表記と、品詞属性「連体詞」と、係り受け関係名「連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
30)さらに文節番号[12] を直接修飾する文節を、文節番号[10]から先頭文節に向かって、並列チェックを経て、検索する。先頭文節まで検索して、文節番号[12] を直接修飾する文節がないので、自立語「システム」を直接修飾する自立語の検索を終了する。
28) Next, an independent word of a phrase having a dependency relationship with the extracted independent word of depth 2 is extracted. The independent words of depth 2 are “system”, “open”, and “consumer”. First, a clause that directly modifies the clause number [12] including “system” is searched from the clause number [11] toward the first clause.
29) Since the dependency clause of clause number [11] is clause number [12], the independent word “Such” was found from clause number [11], and the independent word “system” of depth 2 was directly modified. Since it is an independent word, the depth is added, and a depth of 3, “notation of such”, a part-of-speech attribute “linkage”, and a dependency relation name “linkage modification” are stored. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
30) Further, a clause that directly modifies clause number [12] is searched from the clause number [10] toward the first clause through a parallel check. Since there is no clause that directly qualifies clause number [12] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “system” is terminated.

31)次に、「開く」を含む文節番号[8]を直接修飾する文節を、文節番号[7]から先頭文節に向かって検索する。
32)文節番号[7]の係り先文節が文節番号[8]であるため、文節番号[7]から自立語「差」を発見する。自立語「差」は、深さ2の自立語「開く」を直接修飾している自立語なので、深さを加算して深さ3と、「差」の表記と、品詞属性「名詞」と、係り受け関係名「ガ格連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
33)さらに文節番号[8]を直接修飾する文節を、文節番号[6]から先頭文節に向かって検索し、並列チェックを経て、文節番号[1]の係り先文節が文節番号[8]であるため、文節番号[1]から自立語「いずれ」を発見する。自立語「いずれ」は、深さ2の自立語「開く」を直接修飾している自立語なので、深さを加算して深さ3と、「いずれ」の表記と、品詞属性「副詞」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
34)さらに文節番号[8] を直接修飾する文節を、文節番号[0]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索して、文節番号[8] を直接修飾する文節がないので、自立語「開く」を直接修飾する自立語の検索を終了する。
31) Next, a clause that directly modifies clause number [8] including “open” is searched from clause number [7] toward the first clause.
32) Since the destination clause of the clause number [7] is the clause number [8], the independent word “difference” is found from the clause number [7]. The independent word “difference” is an independent word that directly modifies the independent word “open” with depth 2. Therefore, the depth 3 is added by adding the depth, the notation “difference”, the part-of-speech attribute “noun” , Store the dependency relationship name “qualification for continuous use”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
33) Further, a clause that directly modifies clause number [8] is searched from clause number [6] toward the first clause, and after parallel check, the destination clause of clause number [1] is the clause number [8]. Therefore, the self-supporting word “Any” is found from the phrase number [1]. Since the independent word “Any” is an independent word that directly modifies the independent word “Open” with a depth of 2, add the depth to the depth of 3, the notation of “Any”, and the part of speech attribute “adverb”. , Store the dependency relationship name “continuous modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
34) Further, a clause that directly qualifies clause number [8] is searched from clause number [0] toward the first clause, and through the parallel check, the first clause is searched to directly qualify clause number [8]. Since there is no clause, the search for the independent word that directly modifies the independent word “open” is terminated.

35)次に「コンシューマー」を含む文節番号[9]を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[9] を直接修飾する文節がないので、自立語「コンシューマー」を直接修飾する自立語の検索を終了する。   35) Next, the phrase directly including the phrase number [9] including “consumer” is searched from the phrase number [8] toward the first phrase. Since there is no clause that directly qualifies clause number [9] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “consumer” is terminated.

36)次に、深さ3の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ3の抽出自立語は、「こうした」と「差」と「いずれ」である。まず、「こうした」を含む文節番号[11]を直接修飾する文節を、文節番号[10]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[11] を直接修飾する文節がないので、自立語「こうした」を直接修飾する自立語の検索を終了する。   36) Next, an independent word of a phrase having a dependency relationship with the extracted independent word of depth 3 is extracted. The extracted independent words of depth 3 are “such”, “difference”, and “any”. First, a phrase that directly modifies the phrase number [11] including “these” is searched from the phrase number [10] toward the first phrase. Since there is no clause that directly qualifies the clause number [11] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “these” is terminated.

37)次に「差」を含む文節番号[7]を直接修飾する文節を、文節番号[6]から先頭文節に向かって検索する。
38)文節番号[6]の係り先文節が文節番号[7]であるため、文節番号[6]から自立語「パフォーマンス」を発見する。自立語「パフォーマンス」は、深さ3の自立語「差」を直接修飾している自立語なので、深さを加算して深さ4と、「パフォーマンス」の表記と、品詞属性「名詞」と、係り受け関係名「ノ連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
39)さらに文節番号[7]を直接修飾する文節を、文節番号[5]から先頭文節に向かって検索し、並列チェックを経て、文節番号[5]の係り先文節が文節番号[7]であるため、文節番号[5]から自立語「システム」を発見する。自立語「システム」は、深さ3の自立語「差」を直接修飾している自立語なので、深さを加算して、深さ4と、「システム」の表記と、品詞属性「名詞」と、係り受け関係名「ノ連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
40)さらに文節番号[7]を直接修飾する文節を、文節番号[5]から先頭文節に向かって検索し、並列チェックを実施すると、文節番号[4]の係り受け関係名が「並列」であって、その係り先文節番号が該当文節[5]の文節番号であるため、その直前の文節[4]の自立語「システム」も抽出対象となる。このため、深さ4と「システム」の表記と、品詞属性「名詞」と、係り受け関係名は処理対象の文節の係り受け関係名「ノ連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
41)さらに文節番号[7]を直接修飾する文節を、文節番号[4]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[7] を直接修飾する文節がないので、自立語「差」を直接修飾する自立語の検索を終了する。
37) Next, a phrase that directly modifies the phrase number [7] including “difference” is searched from the phrase number [6] toward the first phrase.
38) Since the dependency clause of clause number [6] is clause number [7], the independent word “performance” is found from clause number [6]. Since the independent word “performance” is an independent word that directly modifies the independent word “difference” at depth 3, add the depth to the depth 4, the notation “performance”, and the part of speech attribute “noun”. , Store the dependency relationship name "no-complex modification". Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
39) Further, a clause that directly modifies clause number [7] is searched from clause number [5] toward the first clause, and after parallel check, the destination clause of clause number [5] is the clause number [7]. Therefore, the self-supporting word “system” is found from the phrase number [5]. Since the independent word “system” is an independent word that directly modifies the independent word “difference” at the depth 3, the depth is added to the depth 4, the expression “system”, and the part of speech attribute “noun”. And, the dependency relation name “no-complex modification” is stored. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
40) If a clause that directly modifies clause number [7] is searched from clause number [5] toward the first clause and parallel check is performed, the dependency relation name of clause number [4] is “parallel”. Since the related clause number is the clause number of the corresponding clause [5], the independent word “system” of the immediately preceding clause [4] is also extracted. Therefore, the notation of depth 4 and “system”, the part-of-speech attribute “noun”, and the dependency relationship name store the dependency relationship name “no-complex modification” of the clause to be processed. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
41) Furthermore, the phrase directly modifying the phrase number [7] is searched from the phrase number [4] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly modifies clause number [7], the search for the independent word that directly modifies the independent word “difference” is terminated.

42)次に、「いずれ」を含む文節番号[1]を直接修飾する文節を、文節番号[0]から先頭文節に向かって検索し、先頭文節まで検索する。文節番号[1] を直接修飾する文節がないので、自立語「いずれ」を直接修飾する自立語の検索を終了する。   42) Next, the phrase directly modifying the phrase number [1] including “any” is searched from the phrase number [0] toward the first phrase, and the first phrase is searched. Since there is no clause that directly qualifies clause number [1], the search for the independent word that directly qualifies the independent word “any” is terminated.

43)次に、深さ4の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ4の抽出自立語は、「パフォーマンス」と「システム」と「システム」である。まず、「パフォーマンス」を含む文節番号[6]を直接修飾する文節を、文節番号[5]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[6] を直接修飾する文節がないので、自立語「パフォーマンス」を直接修飾する自立語の検索を終了する。   43) Next, an independent word of a phrase having a dependency relationship with the extracted independent word of depth 4 is extracted. The extracted independent words of depth 4 are “performance”, “system”, and “system”. First, a clause that directly modifies clause number [6] including “performance” is searched from clause number [5] toward the first clause. Since there is no clause that directly qualifies the clause number [6] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “performance” is terminated.

44)次に「システム」を含む文節番号[5]を直接修飾する文節を、文節番号[4]から先頭文節に向かって検索する。文節番号[4]の係り先文節が文節番号[5]であるため、文節番号[4]から自立語「システム」を発見する。自立語「システム」は、深さ4の自立語「システム」を直接修飾している自立語なので、深さを加算して、深さ5と、「システム」の表記と、品詞属性「名詞」と、係り受け関係名「並列」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
45)さらに文節番号[5]を直接修飾する文節を、文節番号[3]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[5] を直接修飾する文節がないので、自立語「システム」を直接修飾する自立語の検索を終了する。
44) Next, a phrase that directly modifies the phrase number [5] including “system” is searched from the phrase number [4] toward the first phrase. Since the destination clause of clause number [4] is clause number [5], the self-supporting word “system” is found from clause number [4]. Since the independent word “system” is an independent word that directly modifies the independent word “system” with a depth of 4, add the depth, the depth of “5”, the notation of “system”, and the part of speech attribute “noun” And the dependency relationship name “parallel” is stored. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
45) Further, a clause that directly modifies clause number [5] is searched from clause number [3] toward the first clause, and through the parallel check, the first clause is searched. Since there is no clause that directly qualifies clause number [5], the search for the independent word that directly qualifies the independent word “system” is terminated.

46)次に「システム」を含む文節番号[4]を直接修飾する文節を、文節番号[3]から先頭文節に向かって検索する。文節番号[3]の係り先文節が文節番号[4]であるため、文節番号[3]から自立語「所有」を発見する。自立語「所有」は、深さ4の自立語「システム」を直接修飾している自立語なので、深さを加算して、深さ5と、「所有」の表記と、品詞属性「サ変」と、係り受け関係名「連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
47)さらに文節番号[4]を直接修飾する文節を、文節番号[2]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[4] を直接修飾する文節がないので、自立語「システム」を直接修飾する自立語の検索を終了する。
46) Next, a phrase that directly modifies the phrase number [4] including “system” is searched from the phrase number [3] toward the first phrase. Since the destination clause of clause number [3] is clause number [4], the independent word “owned” is found from clause number [3]. The independent word “owned” is an independent word that directly modifies the independent word “system” with a depth of 4. Therefore, the depth is added, the depth of “5”, the notation of “owned”, and the part of speech attribute “sa change” Then, the dependency relation name “modification modification” is stored. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
47) Further, a clause that directly modifies clause number [4] is searched from clause number [2] toward the first clause, and through the parallel check, the first clause is searched. Since there is no clause that directly qualifies clause number [4], the search for independent words that directly qualify the independent word “system” is terminated.

48)次に、深さ5の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ5の抽出自立語は、「システム」と「所有」である。まず、「システム」を含む文節番号[4]を直接修飾する文節を、文節番号[3]から先頭文節に向かって検索する。文節番号[3]の係り先文節が文節番号[4]であるため、文節番号[3]から自立語「所有」を発見する。自立語「所有」は、深さ5の自立語「システム」を直接修飾している自立語なので、深さを加算して深さ6と、「所有」の表記と、品詞属性「サ変」と、係り受け関係名「連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はなかった。
49)さらに文節番号[4]を直接修飾する文節を、文節番号[2]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[4] を直接修飾する文節がないので、自立語「システム」を直接修飾する自立語の検索を終了する。
48) Next, an independent word of a phrase having a dependency relationship with the extracted independent word of depth 5 is extracted. The extracted independent words of depth 5 are “system” and “owned”. First, a clause that directly modifies clause number [4] including “system” is searched from clause number [3] toward the first clause. Since the destination clause of clause number [3] is clause number [4], the independent word “owned” is found from clause number [3]. The freestanding word “owned” is a freestanding word that directly modifies the freestanding word “system” with depth 5; , Store the dependency relationship name "modification modification". Moreover, when the intention expression check in the same phrase was performed, there was no target expression in the same phrase.
49) Further, a clause that directly modifies clause number [4] is searched from clause number [2] toward the first clause, and through the parallel check, the first clause is searched. Since there is no clause that directly qualifies clause number [4], the search for independent words that directly qualify the independent word “system” is terminated.

50)次に、「所有」を含む文節番号[3]を直接修飾する文節を、文節番号[2]から先頭文節に向かって検索する。文節番号[2]の係り先文節が文節番号[3]であるため、文節番号[2]から自立語「現在」を発見する。自立語「現在」は、深さ5の自立語「所有」を直接修飾している自立語なので、深さを加算して深さ6と、「現在」の表記と、品詞属性「副詞」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
51)さらに文節番号[3]を直接修飾する文節を、文節番号[1]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索して、文節番号[3] を直接修飾する文節がないので、自立語「所有」を直接修飾する自立語の検索を終了する。
50) Next, a phrase that directly modifies the phrase number [3] including “owned” is searched from the phrase number [2] toward the first phrase. Since the destination clause of clause number [2] is clause number [3], the independent word “present” is found from clause number [2]. Since the independent word “present” is an independent word that directly modifies the independent word “owned” at a depth of 5, the depth is added to the depth of 6, the expression “current”, and the part of speech attribute “adverb”. , Store the dependency relationship name “continuous modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
51) Furthermore, a clause that directly qualifies clause number [3] is searched from clause number [1] toward the first clause, and through the parallel check, the first clause is searched, and clause number [3] is directly modified. Since there are no clauses, the search for independent words that directly qualify the independent word “owned” is terminated.

52)次に、深さ6の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ6の抽出自立語は、「所有」と「現在」である。まず、「所有」を含む文節番号[3]を直接修飾する文節を、文節番号[2]から先頭文節に向かって検索する。文節番号[2]の係り先文節が文節番号[3]であるため、文節番号[2]から自立語「現在」を発見する。自立語「現在」は、深さ6の自立語「所有」を直接修飾している自立語なので、深さを加算して深さ7と、「現在」の表記と、品詞属性「副詞」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
53)さらに文節番号[3]を直接修飾する文節を、文節番号[1]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索して、文節番号[3] を直接修飾する文節がないので、自立語「所有」を直接修飾する自立語の検索を終了する。
52) Next, an independent word of a phrase having a dependency relationship with the extracted independent word having a depth of 6 is extracted. The extracted independent words of depth 6 are “owned” and “present”. First, a clause that directly modifies clause number [3] including “owned” is searched from clause number [2] toward the first clause. Since the destination clause of clause number [2] is clause number [3], the independent word “present” is found from clause number [2]. Since the independent word “present” is an independent word that directly modifies the independent word “owned” at a depth of 6, the depth is added to the depth of 7, the notation of “current”, and the part of speech attribute “adverb”. , Store the dependency relationship name “continuous modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
53) In addition, a clause that directly modifies clause number [3] is searched from clause number [1] toward the first clause, and through the parallel check, the first clause is searched, and clause number [3] is directly modified. Since there are no clauses, the search for independent words that directly qualify the independent word “owned” is terminated.

54)次に、「現在」を含む文節番号[2]を直接修飾する文節を、文節番号[1]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[2] を直接修飾する文節がないので、自立語「現在」を直接修飾する自立語の検索を終了する。   54) Next, the phrase directly modifying the phrase number [2] including “present” is searched from the phrase number [1] toward the first phrase. Since there is no clause that directly qualifies clause number [2] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “present” is terminated.

55)次に、深さ7の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ7の抽出自立語は、「現在」である。「現在」を含む文節番号[2]を直接修飾する文節を、文節番号[1]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[2] を直接修飾する文節がないので、自立語「現在」を直接修飾する自立語の検索を終了する。以上の抽出処理で抽出キー「いう」を抽出キーとする部分構造要素の抽出を終了する。その結果は、図3(a)のようになる。   55) Next, an independent word of a phrase having a dependency relationship with the extracted independent word of depth 7 is extracted. The extracted free standing word of depth 7 is “present”. A phrase that directly modifies the phrase number [2] including “current” is searched from the phrase number [1] toward the first phrase. Since there is no clause that directly qualifies clause number [2] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “present” is terminated. The extraction of the partial structure element using the extraction key “say” as the extraction key is completed by the above extraction process. The result is as shown in FIG.

(用言「なる」を抽出キーとする部分構造要素の抽出)
56)次に、文節番号[14]から先頭文節に向かって用言を検索すると、文節番号[14]は用言性文節であるので、文節番号[14]から用言「なる」を発見する。
57)抽出キーとして、「なる」の表記と品詞属性「動詞」を抽出、記憶する。また、意図表現チェックを実施するが、同文節には意図表現はない。
(Extraction of substructure elements using the predicate “Naru” as an extraction key)
56) Next, when a predicate is searched from the phrase number [14] toward the first phrase, the phrase number [14] is a predicative phrase, and therefore the predicate “is” is found from the phrase number [14]. .
57) As an extraction key, the notation “Naru” and the part of speech attribute “verb” are extracted and stored. In addition, an intention expression check is performed, but there is no intention expression in the same clause.

58)次に、文節番号[13]から、先頭文節に向かって順に用言「なる」を直接連用修飾している文節の自立語を検索する。
59)文節番号[13]の係り先文節が文節番号[14]であるため、文節番号[13]から自立語「購入」を発見する。「購入」は、抽出キー「なる」を直接修飾している自立語なので、深さ0と、「購入」の表記と、品詞属性「サ変」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、図5(b)の意図を示す表現と意図の対応が記述された辞書の助動詞「たい」 と合致したため、拡張要素に意図「要望」を登録する。
58) Next, from the phrase number [13], the independent words of the phrases in which the predicate “Naru” is directly modified are sequentially searched from the first phrase in order.
59) Since the dependency clause of the clause number [13] is the clause number [14], the independent word “purchase” is found from the clause number [13]. Since “Purchase” is an independent word that directly modifies the extraction key “Naru”, the depth 0, the notation of “Purchase”, the part-of-speech attribute “sa change”, and the dependency relation name “Continuous modification” are stored. . In addition, when the intention expression check in the same clause is performed, the intention “request” is registered in the extension element because the correspondence between the expression indicating the intention and the intention shown in FIG. To do.

60)さらに、文節番号[14] を直接修飾する文節を、文節番号[13]から先頭文節に向かって検索し、並列チェックを経て、文節番号[10]から自立語「企業」を発見する。自立語「企業」は、抽出キー「なる」を直接修飾している自立語なので、深さ0と、「企業」の表記と、品詞属性「名詞」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施するが、同文節内には意図表現はない。
61)さらに、文節番号[14] を直接修飾する文節を、文節番号[10]から先頭文節に向かって検索し、並列チェックを実施すると、文節番号[9]の係り受け関係名が「並列」である。このため、係り先文節番号が該当文節[10]の文節番号であった場合、その直前の文節[9]の自立語「コンシューマー」も抽出対象とし、深さ0と「コンシューマー」の表記と、品詞属性「名詞」と、係り受け関係名を記憶する。係り受け関係名は処理対象の文節の係り受け関係名「連用修飾」で記憶する。また、同文節内の意図表現チェックを実施するが同文節内には意図表現はない。
62)さらに、文節番号[14] を直接修飾する文節を、文節番号[9]から先頭文節に向かって検索し、並列チェックを経て、文節番号[0]から自立語「でも」を発見する。自立語「でも」は、抽出キー「なる」を直接修飾している自立語なので、深さ0と、「でも」の表記と、品詞属性「接続詞」と、係り受け関係名「連用修飾」を記憶する。品詞が接続詞であり、該当自立語の深さが0であるため、接続助詞と接続詞と接続の意味の対応が記述された辞書を参照にいき、一致があったため、抽出キー「なる」の拡張要素に接続意味「逆接」を登録する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
63)さらに、文節番号[14] を直接修飾する文節を、文節番号[0]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[14] を直接修飾する文節がないので、自立語「なる」を直接修飾する自立語の検索を終了する。
60) Further, the phrase directly modifying the phrase number [14] is searched from the phrase number [13] toward the first phrase, and through a parallel check, the independent word “company” is found from the phrase number [10]. Since the independent word “company” is an independent word that directly modifies the extraction key “Naru”, the depth 0, the expression “company”, the part of speech attribute “noun”, and the dependency relation name “continuous modification” Remember. In addition, although the intention expression check in the same clause is performed, there is no intention expression in the same clause.
61) Furthermore, when a clause that directly qualifies clause number [14] is searched from clause number [10] toward the first clause and parallel check is performed, the dependency relation name of clause number [9] is “parallel”. It is. For this reason, when the dependency clause number is the clause number of the corresponding clause [10], the independent word “consumer” of the immediately preceding clause [9] is also extracted, and the depth 0 and “consumer” notation, The part-of-speech attribute “noun” and the dependency relation name are stored. The dependency relationship name is stored as the dependency relationship name “continuous modification” of the clause to be processed. In addition, the intention expression check in the same phrase is performed, but there is no intention expression in the same phrase.
62) Further, a phrase that directly modifies the phrase number [14] is searched from the phrase number [9] toward the first phrase, and through the parallel check, the independent word “Den” is found from the phrase number [0]. Since the independent word “Dai” is an independent word that directly modifies the extracted key “Naru”, the depth 0, the expression “Dai”, the part-of-speech attribute “connective”, and the dependency relation name “Continuous modification” Remember. Since the part of speech is a conjunction, and the depth of the corresponding independent word is 0, the reference to the dictionary in which the correspondence between the connection particle, the conjunction, and the meaning of the connection is described, and there is a match. Register the connection meaning “reverse connection” in the element. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
63) Further, the phrase directly modifying the phrase number [14] is searched from the phrase number [0] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly modifies the clause number [14], the search for the independent word that directly qualifies the independent word “becomes” ends.

64)次に、抽出キーと関係があって抽出した深さ0の自立語に直接係り受け関係がある文節の自立語を抽出する。抽出キー「なる」に関する自立語は、「購入」と「企業」と「コンシューマー」と「でも」である。まず、「購入」を含む文節番号[13]を直接修飾する文節を、文節番号[12]から先頭文節に向かって検索する。   64) Next, extract the independent words of the phrase that are related to the extraction key and directly related to the extracted independent words of depth 0. Independent words regarding the extraction key “Naru” are “Purchase”, “Company”, “Consumer”, and “Even”. First, the phrase directly modifying the phrase number [13] including “purchase” is searched from the phrase number [12] toward the first phrase.

65)文節番号[12]の係り先文節が文節番号[13]であるため、文節番号[12]から自立語「システム」を発見する。「システム」は、深さ0の自立語「購入」を直接修飾している自立語なので、深さを加算して深さ1と、「システム」の表記と、品詞属性「名詞」と、係り受け関係名「ヲ格連用修飾」を記憶する。また、同文節内の意図表現チェックを実施するが同文節内には意図表現はない。
66)さらに、文節番号[13] を直接修飾する文節を、文節番号[12]から先頭文節に向かって検索し、並列チェックを経て、文節番号[8]から自立語「開く」を発見する。深さ0の自立語「購入」を直接修飾している自立語なので、深さを加算して、深さ1と、「開く」の表記と、品詞属性「動詞」と、係り受け関係名「連用修飾」を記憶する。さらに「開く」が含まれる文節中の接続助詞の有無を検査すると、接続助詞「ば」が辞書とマッチしたため、拡張要素に接続意味「順接仮定」を登録する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
67)さらに、文節番号[13] を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索して、文節番号[13] を直接修飾する文節がないので、自立語「購入」を直接修飾する自立語の検索を終了する。
65) Since the dependency clause of the clause number [12] is the clause number [13], the independent word “system” is found from the clause number [12]. Since “system” is an independent word that directly modifies the independent word “purchase” with a depth of 0, the depth is added to the depth 1, the expression “system”, the part of speech attribute “noun”, Receiving relation name “wo case qualification” is stored. In addition, the intention expression check in the same phrase is performed, but there is no intention expression in the same phrase.
66) Further, the phrase directly modifying the phrase number [13] is searched from the phrase number [12] toward the first phrase, and through the parallel check, the independent word “open” is found from the phrase number [8]. Since it is a self-supporting word that directly modifies the self-supporting word “purchase” at depth 0, the depth is added to the depth 1, the expression “open”, the part-of-speech attribute “verb”, and the dependency relation name “ “Continuous modification” is stored. Further, when the presence or absence of a connection particle in a phrase including “open” is checked, since the connection particle “BA” matches the dictionary, the connection meaning “forward assumption” is registered in the extension element. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
67) Furthermore, the phrase directly modifying clause number [13] is searched from clause number [8] toward the first clause, and after parallel checking, the first clause is searched and clause number [13] is directly qualified. Since there is no clause to do, the search for free words that directly qualify the free word “purchase” is terminated.

68)次に「企業」を含む文節番号[10]を直接修飾する文節を、文節番号[9]から先頭文節に向かって検索する。文節番号[9]の係り先文節が文節番号[10]であるため、文節番号[9]から自立語「コンシューマー」を発見する。自立語「コンシューマー」は、深さ0の自立語「企業」を直接修飾している自立語なので、深さを加算して深さ1と、「コンシューマー」の表記と、品詞属性「名詞」と、係り受け関係名「並列」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
69)さらに文節番号[10] を直接修飾する文節を、文節番号[9]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[10] を直接修飾する文節がないので、自立語「企業」を直接修飾する自立語の検索を終了する。
68) Next, a phrase that directly modifies the phrase number [10] including “company” is searched from the phrase number [9] toward the first phrase. Since the destination clause of clause number [9] is clause number [10], the independent word “consumer” is found from clause number [9]. The independent word “consumer” is an independent word that directly modifies the independent word “enterprise” with a depth of 0. , The dependency relationship name “parallel” is stored. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
69) Further, the phrase directly modifying the phrase number [10] is searched from the phrase number [9] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly qualifies clause number [10], the search for the independent word that directly qualifies the independent word “company” is terminated.

70)次に「コンシューマー」を含む文節番号[9]を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[9] を直接修飾する文節がないので、自立語「コンシューマー」を直接修飾する自立語の検索を終了する。   70) Next, a phrase that directly modifies the phrase number [9] including “consumer” is searched from the phrase number [8] toward the first phrase. Since there is no clause that directly qualifies clause number [9] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “consumer” is terminated.

71)次に、「でも」を含む文節番号[0]を直接修飾する文節を、先頭文節に向かって検索する。文節番号[0]が先頭文節であることから、文節番号[0] を直接修飾する文節がないので、自立語「でも」を直接修飾する自立語の検索を終了する。   71) Next, the phrase directly modifying the phrase number [0] including “Even” is searched toward the first phrase. Since clause number [0] is the first clause, there is no clause that directly qualifies clause number [0], so the search for independent words that directly qualify the independent word “even” is terminated.

72)次に、深さ1の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ1の抽出自立語は、「システム」と「開く」と「コンシューマー」である。まず、「システム」を含む文節番号[12]を直接修飾する文節を、文節番号[11]から先頭文節に向かって検索する。
73)文節番号[11]の係り先文節が文節番号[12]であるため、文節番号[11]から自立語「こうした」を発見する。「こうした」は、深さ1の自立語「システム」を直接修飾している自立語なので、深さを加算して深さ2と、「こうした」の表記と、品詞属性「連体詞」と、係り受け関係名「連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
74)さらに文節番号[12] を直接修飾する文節を、文節番号[11]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[12] を直接修飾する文節がないので、自立語「システム」を直接修飾する自立語の検索を終了する。
72) Next, an independent word of a phrase having a dependency relationship with the extracted independent word having a depth of 1 is extracted. The extracted independent words of depth 1 are “system”, “open”, and “consumer”. First, a clause that directly modifies the clause number [12] including “system” is searched from the clause number [11] toward the first clause.
73) Since the destination clause of the clause number [11] is the clause number [12], the self-supporting word “such” is found from the clause number [11]. “Such” is a self-supporting word that directly modifies the self-supporting word “system” at depth 1, so add depth to depth 2, “notice” and the part-of-speech attribute “communicative” Receiving relationship name “modification modification” is stored. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
74) Further, the phrase directly modifying the phrase number [12] is searched from the phrase number [11] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly qualifies clause number [12], the search for independent words that directly qualify the independent word “system” is terminated.

75)次に、「開く」を含む文節番号[8]を直接修飾する文節を、文節番号[7]から先頭文節に向かって検索する。
76)文節番号[7]の係り先文節が文節番号[8]であるため、文節番号[7]から自立語「差」を発見する。自立語「差」は、深さ1の自立語「開く」を直接修飾している自立語なので、深さを加算して深さ2と、「差」の表記と、品詞属性「名詞」と、係り受け関係名「ガ格連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
77)さらに文節番号[8]を直接修飾する文節を、文節番号[7]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[1]の係り先文節が文節番号[8]であるため、文節番号[1]から自立語「いずれ」を発見する。自立語「いずれ」は、深さ1の自立語「開く」を直接修飾している自立語なので、深さを加算して深さ2と、「いずれ」の表記と、品詞属性「副詞」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
78)さらに文節番号[8] を直接修飾する文節を、文節番号[1]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[8] を直接修飾する文節がないので、自立語「開く」を直接修飾する自立語の検索を終了する。
75) Next, the phrase directly modifying the phrase number [8] including “open” is searched from the phrase number [7] toward the first phrase.
76) Since the destination clause of the clause number [7] is the clause number [8], the independent word “difference” is found from the clause number [7]. Since the independent word “difference” is an independent word that directly modifies the independent word “open” with depth 1, the depth is added by adding depth 2, the notation of “difference”, and the part of speech attribute “noun”. , Store the dependency relationship name “qualification for continuous use”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
77) Further, a clause that directly modifies clause number [8] is searched from clause number [7] toward the first clause, and through the parallel check, the first clause is searched. Since the destination clause of clause number [1] is clause number [8], the independent word “any” is found from clause number [1]. Since the independent word “Any” is an independent word that directly modifies the independent word “open” at the depth 1, the depth is added to the depth 2, the expression “any”, and the part of speech attribute “adverb”. , Store the dependency relationship name “continuous modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
78) Further, a clause that directly modifies clause number [8] is searched from clause number [1] toward the first clause, and through the parallel check, the first clause is searched. Since there is no clause that directly qualifies clause number [8], the search for the independent word that directly qualifies the independent word “open” is terminated.

79)次に「コンシューマー」を含む文節番号[9]を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[9] を直接修飾する文節がないので、自立語「コンシューマー」を直接修飾する自立語の検索を終了する。   79) Next, the phrase directly modifying the phrase number [9] including “consumer” is searched from the phrase number [8] toward the first phrase. Since there is no clause that directly qualifies clause number [9] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “consumer” is terminated.

80)次に、深さ2の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ2の抽出自立語は、「こうした」と「差」と「いずれ」である。まず、「こうした」を含む文節番号[11]を直接修飾する文節を、文節番号[10]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[11] を直接修飾する文節がないので、自立語「こうした」を直接修飾する自立語の検索を終了する。   80) Next, an independent word of a phrase having a dependency relationship with the extracted independent word of depth 2 is extracted. The extracted independent words of depth 2 are “such”, “difference”, and “any”. First, a phrase that directly modifies the phrase number [11] including “these” is searched from the phrase number [10] toward the first phrase. Since there is no clause that directly qualifies the clause number [11] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “these” is terminated.

81)次に「差」を含む文節番号[7]を直接修飾する文節を、文節番号[6]から先頭文節に向かって検索する。
82)文節番号[6]の係り先文節が文節番号[7]であるため、文節番号[6]から自立語「パフォーマンス」を発見する。自立語「パフォーマンス」は、深さ2の自立語「差」を直接修飾している自立語なので、深さを加算して深さ3と、「パフォーマンス」の表記と、品詞属性「名詞」と、係り受け関係名「ノ連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
83)さらに文節番号[7]を直接修飾する文節を、文節番号[6]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[5]の係り先文節が文節番号[7]であるため、文節番号[5]から自立語「システム」を発見する。自立語「システム」は、深さ2の自立語「差」を直接修飾している自立語なので、深さを加算して深さ3と、「システム」の表記と、品詞属性「名詞」と、係り受け関係名「ノ連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
84)さらに文節番号[7]を直接修飾する文節を、文節番号[5]から先頭文節に向かって検索し、並列チェックを実施する。文節番号[4]の係り受け関係名が「並列」であって、その係り先文節番号が該当文節[5]の文節番号であるため、その直前の文節[4]の自立語「システム」も抽出対象とする。深さ3と「システム」の表記と、品詞属性「名詞」と、係り受け関係名は処理対象の文節の係り受け関係名「ノ連体修飾」で記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
85)さらに文節番号[7]を直接修飾する文節を、文節番号[4]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[7] を直接修飾する文節がないので、自立語「差」を直接修飾する自立語の検索を終了する。
81) Next, the phrase directly modifying the phrase number [7] including “difference” is searched from the phrase number [6] toward the first phrase.
82) Since the destination clause of clause number [6] is clause number [7], the independent word “performance” is found from clause number [6]. The independent word “Performance” is an independent word that directly modifies the independent word “Difference” at depth 2. Therefore, add the depth to the depth 3, “Performance”, and the part of speech attribute “Noun”. , Store the dependency relation name "no-complex modification". Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
83) Further, the phrase directly modifying the phrase number [7] is searched from the phrase number [6] toward the first phrase, and through the parallel check, the first phrase is searched. Since the destination clause of clause number [5] is clause number [7], the independent word “system” is found from clause number [5]. Since the independent word “system” is an independent word that directly modifies the independent word “difference” of depth 2, the depth is added to the depth 3, the expression “system”, the part of speech attribute “noun” , Store the dependency relation name "no-complex modification". Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
84) Further, the phrase directly modifying the phrase number [7] is searched from the phrase number [5] toward the first phrase, and the parallel check is performed. Since the dependency relation name of clause number [4] is “Parallel” and the destination clause number is the clause number of the corresponding clause [5], the independent word “system” of the immediately preceding clause [4] is also Extraction target. The notation of depth 3 and “system”, the part-of-speech attribute “noun”, and the dependency relation name are stored as the dependency relation name “no-complex modification” of the clause to be processed. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
85) Further, the phrase directly modifying the phrase number [7] is searched from the phrase number [4] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly modifies clause number [7], the search for the independent word that directly modifies the independent word “difference” is terminated.

86)次に、「いずれ」を含む文節番号[1]を直接修飾する文節を、文節番号[0]から先頭文節に向かって検索し、先頭文節まで検索する。文節番号[1] を直接修飾する文節がないので、自立語「いずれ」を直接修飾する自立語の検索を終了する。   86) Next, the phrase directly modifying the phrase number [1] including “any” is searched from the phrase number [0] toward the first phrase, and the first phrase is searched. Since there is no clause that directly qualifies clause number [1], the search for the independent word that directly qualifies the independent word “any” is terminated.

87)次に、深さ3の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ3の抽出自立語は、「パフォーマンス」と「システム」と「システム」である。まず、「パフォーマンス」を含む文節番号[6]を直接修飾する文節を、文節番号[5]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[6] を直接修飾する文節がないので、自立語「パフォーマンス」を直接修飾する自立語の検索を終了する。   87) Next, the independent words of the phrase having a dependency relationship with the extracted independent words of depth 3 are extracted. The extracted independent words of depth 3 are “performance”, “system”, and “system”. First, a clause that directly modifies clause number [6] including “performance” is searched from clause number [5] toward the first clause. Since there is no clause that directly qualifies the clause number [6] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “performance” is terminated.

88)次に「システム」を含む文節番号[5]を直接修飾する文節を、文節番号[4]から先頭文節に向かって検索する。文節番号[4]の係り先文節が文節番号[5]であるため、文節番号[4]から自立語「システム」を発見する。自立語「システム」は、深さ3の自立語「システム」を直接修飾している自立語なので、深さを加算して深さ4と、「システム」の表記と、品詞属性「名詞」と、係り受け関係名「並列」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
89)さらに文節番号[5]を直接修飾する文節を、文節番号[3]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[5] を直接修飾する文節がないので、自立語「システム」を直接修飾する自立語の検索を終了する。
88) Next, a phrase that directly modifies the phrase number [5] including “system” is searched from the phrase number [4] toward the first phrase. Since the destination clause of clause number [4] is clause number [5], the self-supporting word “system” is found from clause number [4]. Since the independent word “system” is an independent word that directly modifies the independent word “system” at depth 3, the depth is added to the depth 4, the expression “system”, and the part of speech attribute “noun”. , The dependency relationship name “parallel” is stored. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
89) Further, the phrase directly modifying the phrase number [5] is searched from the phrase number [3] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly qualifies clause number [5], the search for the independent word that directly qualifies the independent word “system” is terminated.

90)次に「システム」を含む文節番号[4]を直接修飾する文節を、文節番号[3]から先頭文節に向かって検索する。文節番号[3]の係り先文節が文節番号[4]であるため、文節番号[3]から自立語「所有」を発見する。自立語「所有」は、深さ3の自立語「システム」を直接修飾している自立語なので、深さを加算して深さ4と、「所有」の表記と、品詞属性「サ変」と、係り受け関係名「連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
91)さらに文節番号[4]を直接修飾する文節を、文節番号[2]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[4] を直接修飾する文節がないので、自立語「システム」を直接修飾する自立語の検索を終了する。
90) Next, a phrase that directly modifies the phrase number [4] including “system” is searched from the phrase number [3] toward the first phrase. Since the destination clause of clause number [3] is clause number [4], the independent word “owned” is found from clause number [3]. The freestanding word “owned” is a freestanding word that directly modifies the freestanding word “system” at depth 3. Therefore, the depth is added to the depth 4 and the notation of “owned” and the part of speech attribute “sa change” , Store the dependency relation name “linkage modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
91) Further, a clause that directly modifies clause number [4] is searched from clause number [2] toward the first clause, and through the parallel check, the first clause is searched. Since there is no clause that directly qualifies clause number [4], the search for independent words that directly qualify the independent word “system” is terminated.

92)次に、深さ4の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ4の抽出自立語は、「システム」と「所有」である。まず、「システム」を含む文節番号[4]を直接修飾する文節を、文節番号[3]から先頭文節に向かって検索する。文節番号[3]の係り先文節が文節番号[4]であるため、文節番号[3]から自立語「所有」を発見する。自立語「所有」は、深さ4の自立語「システム」を直接修飾している自立語なので、深さを加算して深さ5と、「所有」の表記と、品詞属性「サ変」と、係り受け関係名「連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
93)さらに文節番号[4]を直接修飾する文節を、文節番号[2]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[4] を直接修飾する文節がないので、自立語「システム」を直接修飾する自立語の検索を終了する。
92) Next, an independent word of a phrase having a dependency relationship with the extracted independent word having a depth of 4 is extracted. The extracted independent words of depth 4 are “system” and “owned”. First, a clause that directly modifies clause number [4] including “system” is searched from clause number [3] toward the first clause. Since the destination clause of clause number [3] is clause number [4], the independent word “owned” is found from clause number [3]. Since the independent word “owned” is an independent word that directly modifies the independent word “system” with a depth of 4, add the depth to the depth of 5 and the notation of “owned” and the part-of-speech attribute “sa change” , Store the dependency relation name “linkage modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
93) Further, a clause that directly modifies clause number [4] is searched from clause number [2] toward the first clause, and through the parallel check, the first clause is searched. Since there is no clause that directly qualifies clause number [4], the search for independent words that directly qualify the independent word “system” is terminated.

94)次に、「所有」を含む文節番号[3]を直接修飾する文節を、文節番号[2]から先頭文節に向かって検索し、文節番号[2]の係り先文節が文節番号[3]であるため、文節番号[2]から自立語「現在」を発見する。自立語「現在」は、深さ4の自立語「所有」を直接修飾している自立語なので、深さを加算して深さ5と、「現在」の表記と、品詞属性「副詞」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
95)さらに文節番号[3]を直接修飾する文節を、文節番号[1]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[3] を直接修飾する文節がないので、自立語「所有」を直接修飾する自立語の検索を終了する。
94) Next, a clause that directly modifies clause number [3] including “owned” is searched from clause number [2] toward the first clause, and the destination clause of clause number [2] is clause number [3]. ], The self-supporting word “present” is found from the phrase number [2]. Since the independent word “present” is an independent word that directly modifies the independent word “owned” at a depth of 4, the depth is added to the depth of 5, the notation of “current”, and the part of speech attribute “adverb”. , Store the dependency relation name “continuous modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
95) Further, a clause that directly modifies clause number [3] is searched from clause number [1] toward the first clause, and through the parallel check, the first clause is searched. Since there is no clause that directly qualifies clause number [3], the search for the independent word that directly qualifies the independent word “owned” is terminated.

96)次に、深さ5の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ5の抽出自立語は、「所有」と「現在」である。まず、「所有」を含む文節番号[3]を直接修飾する文節を、文節番号[2]から先頭文節に向かって検索する。文節番号[2]の係り先文節が文節番号[3]であるため、文節番号[2]から自立語「現在」を発見する。自立語「現在」は、深さ5の自立語「所有」を直接修飾している自立語なので、深さを加算して深さ6と、「現在」の表記と、品詞属性「副詞」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
97)さらに文節番号[3]を直接修飾する文節を、文節番号[1]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[3] を直接修飾する文節がないので、自立語「所有」を直接修飾する自立語の検索を終了する。
96) Next, an independent word of a phrase having a dependency relationship with the extracted independent word of depth 5 is extracted. The extracted independent words of depth 5 are “owned” and “present”. First, a clause that directly modifies clause number [3] including “owned” is searched from clause number [2] toward the first clause. Since the destination clause of clause number [2] is clause number [3], the independent word “present” is found from clause number [2]. Since the independent word “present” is an independent word that directly modifies the independent word “owned” at a depth of 5, the depth is added to the depth of 6, the expression “current”, and the part of speech attribute “adverb”. , Store the dependency relationship name “continuous modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
97) Furthermore, the phrase directly modifying the phrase number [3] is searched from the phrase number [1] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly qualifies clause number [3], the search for the independent word that directly qualifies the independent word “owned” is terminated.

98)次に、「現在」を含む文節番号[2]を直接修飾する文節を、文節番号[1]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[2] を直接修飾する文節がないので、自立語「現在」を直接修飾する自立語の検索を終了する。   98) Next, the phrase directly modifying the phrase number [2] including “current” is searched from the phrase number [1] toward the first phrase. Since there is no clause that directly qualifies clause number [2] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “present” is terminated.

99)次に、深さ6の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ6の抽出自立語は、「現在」である。「現在」を含む文節番号[2]を直接修飾する文節を、文節番号[1]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[2] を直接修飾する文節がないので、自立語「現在」を直接修飾する自立語の検索を終了する。以上の抽出処理で抽出キー「なる」を抽出キーとする部分構造要素拡張抽出処理を終了する。その結果は、図3(b)のようになる。   99) Next, an independent word of a phrase having a dependency relationship with the extracted independent word having a depth of 6 is extracted. The extracted free standing word of depth 6 is “present”. A phrase that directly modifies the phrase number [2] including “current” is searched from the phrase number [1] toward the first phrase. Since there is no clause that directly qualifies clause number [2] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “present” is terminated. With the above extraction process, the partial structure element extension extraction process using the extraction key “Naru” as the extraction key is completed. The result is as shown in FIG.

100)続いて次の抽出キーを選択して、部分構造要素拡張抽出処理を行う。文節番号[13]から先頭文節に向かって用言を検索すると、文節番号[13]は用言性文節であるので、文節番号[13]から用言「購入」を発見する。
101)抽出キーとして、「購入」の表記と品詞属性「サ変」を抽出、記憶し、同文節内の意図表現チェックを実施すると、図5(b)の意図を示す表現と意図の対応が記述された辞書の助動詞「たい」 と合致したため、拡張要素に意図「要望」を登録する。
100) Next, the next extraction key is selected to perform the partial structure element extension extraction process. When the phrase is searched from the phrase number [13] toward the first phrase, the phrase “Purchase” is found from the phrase number [13] because the phrase number [13] is a phrase phrase.
101) As the extraction key, the notation of “purchase” and the part-of-speech attribute “sa change” are extracted and stored, and when the intention expression check in the same phrase is performed, the correspondence between the expression indicating the intention in FIG. 5B and the intention is described. The intention “request” is registered in the extension element because it matches the auxiliary verb “tai” in the dictionary.

以上の手順に準じて、例文の言語情報取得結果の最後尾の文節から先頭文節に向かって、用言を検索し、用言キーと係り受け関係にある自立語、さらにその自立語と係り受けにある自立語を深さの階層を持たせて抽出し、拡張要素も登録していく。先頭文節まで用言キーの検索と関連自立語と拡張要素の抽出が終了したら、例文中の用言キーでの部分構造要素の拡張抽出を終了する。以降の処理については省略する。   In accordance with the above procedure, search for a predicate from the last sentence of the linguistic information acquisition result of the example sentence to the first sentence, and the independent word that is in a dependency relationship with the predicate key, and further, the independent word and the dependency Independent words in are extracted with a hierarchy of depth, and extension elements are also registered. When the search for the predicate key and the extraction of the related independent words and the extended elements are completed up to the first phrase, the extended extraction of the partial structure element with the prescriptive key in the example sentence is ended. The subsequent processing is omitted.

(体言「こと」を抽出キーとする部分構造要素の抽出)
図5(b)は、体言を抽出キーとして拡張部分構造要素を抽出する場合の処理の流れを示すフローチャート図である。図5(b)のフローチャート図は、下記102)〜154)の処理の方針を示す。図5(b)のフローチャート図において、図5(a)と同様の処理については説明を省略する。図5(b)の処理は、抽出キーとして体言を抽出する点、抽出キーがある文節が文末であるか否かを判断する点で図5(a)と異なる。文末であった場合には、拡張要素に「文末」と記憶することで文末体言区を有効に利用した処理が可能となる。
(Extraction of substructure elements using the word “Koto” as an extraction key)
FIG. 5B is a flowchart showing the flow of processing in the case of extracting an extended partial structural element using the body language as an extraction key. The flowchart of FIG. 5B shows the processing policy of the following 102) to 154). In the flowchart of FIG. 5B, the description of the same processing as that of FIG. The process of FIG. 5B is different from that of FIG. 5A in that a description is extracted as an extraction key and whether or not a phrase having the extraction key is the end of a sentence. In the case of the end of a sentence, “end of sentence” is stored in the extension element, thereby enabling processing using the end of sentence syntactic vocabulary effectively.

102)まず、同じ先頭から1文分の言語解析処理結果の最後尾の文節から、体言性の文節を検索する。
103)文節番号[16]から「こと」を発見する。
104)「こと」の表記と品詞属性「形式名詞」を記憶し、同文節が文末文節であることから、拡張要素に「文末」を登録する。さらに同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
102) First, a sentence clause is retrieved from the last sentence of the language analysis processing result for one sentence from the same head.
103) “Koto” is found from the phrase number [16].
104) The notation of “Koto” and the part-of-speech attribute “formal noun” are stored, and since the phrase is the sentence end sentence, “end of sentence” is registered in the extension element. Furthermore, when the intention expression check is performed in the same phrase, there is no target expression in the same phrase.

105)「こと」の品詞属性が名詞類であり、体言句の最後に位置する体言とみなせるため、次に、文節番号[15]から、先頭文節に向かって順に体言「こと」を直接連体修飾している文節の自立語を検索する。
106)文節番号[15]の係り先文節番号が[16]であることから、文節番号[15]の文節が「こと」を直接連体修飾している、「いう」を発見する。「いう」は、抽出キー「こと」を直接就職しているので、深さ0、「いう」の表記と品詞属性「動詞」と、係り受け関係「連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
107)さらに、文節番号[15]から、先頭文節に向かって順に体言「こと」を直接連体修飾している文節の自立語を、並列チェックを経て検索する。本実施例では、文節[15]を直接「並列」で修飾している文節はない。
108)先頭文節まで検索し、「こと」を直接連体修飾している文節の自立語がないので、体言「こと」を抽出キーとする部分構造要素の抽出を終了する。
105) Since the part-of-speech attribute of “Koto” is a noun class and can be regarded as a dialect positioned at the end of the dialect phrase, then the phrase “Koto” is directly linked and modified in order from the phrase number [15] toward the first phrase. Search for free-standing words in the current phrase.
106) Since the destination clause number of the clause number [15] is [16], the phrase of the clause number [15] finds “say” that directly modifies “that”. Since “Take” directly employs the extraction key “Koto”, it stores the notation of depth 0, “Take”, the part-of-speech attribute “verb”, and the dependency relationship “multiple modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
107) Further, from the clause number [15], the independent words of the clauses in which the body phrase “Koto” is directly modified in order from the clause number [15] are searched through the parallel check. In this embodiment, there is no clause that directly modifies clause [15] with “parallel”.
108) Search up to the first phrase, and since there is no independent word of the phrase that directly modifies “koto”, the extraction of the partial structural element with the synonym “koto” as the extraction key is finished.

109)次に、抽出キーを直接修飾して抽出した深さ0の自立語に直接係り受け関係がある文節の自立語を抽出する。抽出キー「こと」に関する自立語は、「いう」である。まず、「いう」を含む文節番号[15]を直接修飾する文節を、文節番号[14]から先頭文節に向かって検索する。   109) Next, the independent words of the phrase having a dependency relationship directly with the independent words of depth 0 extracted by directly modifying the extraction key are extracted. An independent word for the extraction key “Koto” is “say”. First, the phrase directly modifying the phrase number [15] including “say” is searched from the phrase number [14] toward the first phrase.

110)文節番号[14]の係り先文節が文節番号[15]であるため、文節番号[14]から自立語「なる」を発見する。自立語「なる」は、深さ0の自立語「いう」を直接修飾している自立語なので、深さを加算して深さ1と、「なる」の表記と、品詞属性「動詞」と、係り受け関係名「ト格連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
111)さらに、文節番号[15] を直接修飾する文節を、文節番号[14]から先頭文節に向かって検索する。その際、107)同様の並列チェックを実施する。文節[14]を直接「並列」で修飾している文節はない。
112)先頭文節まで検索し、「いう」を直接連体修飾している文節の自立語がないので、自立語「いう」を抽出キーとする部分構造要素の抽出を終了する。
110) Since the destination clause of the clause number [14] is the clause number [15], the independent word “becomes” is found from the clause number [14]. The independent word “Naru” is an independent word that directly modifies the independent word “say” with a depth of 0. Therefore, the depth is added to the depth 1, the expression “Naru”, and the part of speech attribute “verb”. , Store the dependency relationship name “Gift qualification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
111) Further, the phrase directly modifying the phrase number [15] is searched from the phrase number [14] toward the first phrase. At that time, 107) the same parallel check is performed. There is no clause that directly modifies clause [14] with “parallel”.
112) Search up to the first phrase, and since there is no independent word of the phrase that directly modifies “say”, the extraction of the partial structural element using the independent word “say” as the extraction key is finished.

113)次に、深さ1の自立語に直接係り受け関係がある文節の自立語を抽出する。深さ1の自立語は、「なる」である。まず、「なる」を含む文節番号[14]を直接修飾する文節を、文節番号[13]から先頭文節に向かって検索する。
114)文節番号[13]の係り先文節が文節番号[14]であるため、文節番号[13]から自立語「購入」を発見する。自立語「購入」は、深さ1の自立語「なる」を直接修飾している自立語なので、深さを加算して深さ2と、「購入」の表記と、品詞属性「サ変」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、図5(b)の意図を示す表現と意図の対応が記述された辞書の助動詞「たい」 と合致したため、拡張要素に、意図「要望」を登録する。
113) Next, an independent word of a phrase having a dependency relationship directly with an independent word having a depth of 1 is extracted. A self-supporting word of depth 1 is “become”. First, a phrase that directly modifies the phrase number [14] including “Naru” is searched from the phrase number [13] toward the first phrase.
114) Since the destination clause of the clause number [13] is the clause number [14], the independent word “purchase” is found from the clause number [13]. The independent word “Purchase” is an independent word that directly modifies the independent word “Naru” with a depth of 1. Therefore, add the depth to the depth 2, “Purchase”, and the part-of-speech attribute “sa change”. , Store the dependency relation name “continuous modification”. In addition, when the intention expression check in the same clause is performed, the intention “request” is added to the extension element because it matches the auxiliary word “tai” in the dictionary in which the correspondence between the expression indicating the intention and the intention shown in FIG. 5B is described. sign up.

115)さらに、文節番号[14] を直接修飾する文節を、文節番号[13]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[10]から自立語「企業」を発見する。自立語「企業」は、深さ1の自立語「なる」を直接修飾している自立語なので、深さを加算して深さ2と、「企業」の表記と、品詞属性「名詞」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
116)さらに、文節番号[14] を直接修飾する文節を、文節番号[9]から先頭文節に向かって検索し、並列チェックを実施すると、文節番号[9]の係り受け関係名が「並列」である。その係り先文節番号が該当文節[10]の文節番号であるから、その直前の文節[9]の自立語「コンシューマー」も抽出対象とし、深さ2と「コンシューマー」の表記と、品詞属性「名詞」と、係り受け関係を記憶する。係り受け関係名は処理対象の文節の係り受け関係名「連用修飾」で記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
117)さらに、文節番号[14] を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索し、並列チェックを経て、文節番号[0]から自立語「でも」を発見する。自立語「でも」は、深さ1の自立語「なる」を直接修飾している自立語なので、深さを加算して深さ2と、「でも」の表記と、品詞属性「接続詞」と、係り受け関係名「連用修飾」を記憶する。品詞が接続詞であっても、該当自立語の深さが0でないため、接続助詞と接続詞と接続の意味の対応が記述された辞書は参照にいかない。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
118)さらに、文節番号[14] を直接修飾する文節を、文節番号[0]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[14] を直接修飾する文節がないので、自立語「なる」を直接修飾する自立語の検索を終了する。
115) Further, the phrase directly modifying the phrase number [14] is searched from the phrase number [13] toward the first phrase, and through the parallel check, the first phrase is searched. Discover the self-supporting word “company” from clause number [10]. The independent word “company” is an independent word that directly modifies the independent word “become” with depth 1. Therefore, the depth 2 is added by adding the depth, the expression “company”, and the part-of-speech attribute “noun”. , Store the dependency relationship name “continuous modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
116) Furthermore, when a clause that directly modifies clause number [14] is searched from clause number [9] toward the first clause and parallel check is performed, the dependency relation name of clause number [9] is “parallel”. It is. Since the related clause number is the clause number of the corresponding clause [10], the independent word “consumer” in the immediately preceding clause [9] is also extracted, the depth 2 and “consumer” notation, and the part of speech attribute “ "Noun" and the dependency relationship are memorized. The dependency relationship name is stored as the dependency relationship name “continuous modification” of the clause to be processed. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
117) Further, a phrase that directly modifies the phrase number [14] is searched from the phrase number [8] toward the first phrase, and through the parallel check, the independent word “even” is found from the phrase number [0]. Since the independent word “but” is an independent word that directly modifies the independent word “becomes” with a depth of 1, add the depth to the depth 2, the notation of “even”, and the part-of-speech attribute “connective”. , Store the dependency relationship name “continuous modification”. Even if the part-of-speech is a conjunctive, the depth of the corresponding independent word is not 0. Therefore, the dictionary in which the correspondence between the connecting particle, the conjunctive, and the meaning of the connection is described cannot be referenced. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
118) Further, the phrase directly modifying the phrase number [14] is searched from the phrase number [0] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly modifies the clause number [14], the search for the independent word that directly qualifies the independent word “becomes” ends.

119)次に、深さ2の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ2の抽出自立語は、「購入」と「企業」と「コンシューマー」と「でも」である。まず、「購入」を含む文節番号[13]を直接修飾する文節を、文節番号[12]から先頭文節に向かって検索する。
120)文節番号[12]の係り先文節が文節番号[13]であるため、文節番号[12]から自立語「システム」を発見する。自立語「システム」は、深さ2の自立語「購入」を直接修飾している自立語なので、深さを加算して深さ3と、「システム」の表記と、品詞属性「名詞」と、係り受け関係名「ヲ格連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
121)さらに、文節番号[13] を直接修飾する文節を、文節番号[11]から先頭文節に向かって検索し、並列チェックを経て、文節番号[8]から自立語「開く」を発見する。自立語「開く」は、深さ2の自立語「購入」を直接修飾している自立語なので、深さを加算して深さ3と、「開く」の表記と、品詞属性「動詞」と、係り受け関係名「連用修飾」を記憶する。さらに「開く」が含まれる文節中の接続助詞の有無を検査すると、接続助詞「ば」が辞書とマッチしたため、拡張要素に接続意味「順接仮定」を登録する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
122)さらに、文節番号[13] を直接修飾する文節を、文節番号[7]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[13] を直接修飾する文節がないので、自立語「購入」を直接修飾する自立語の検索を終了する。
119) Next, an independent word of a phrase having a dependency relationship with the extracted independent word of depth 2 is extracted. The independent words of depth 2 are “Purchase”, “Company”, “Consumer”, and “Even”. First, the phrase directly modifying the phrase number [13] including “purchase” is searched from the phrase number [12] toward the first phrase.
120) Since the relation clause of the clause number [12] is the clause number [13], the independent word “system” is found from the clause number [12]. Since the independent word “system” is an independent word that directly modifies the independent word “purchase” at depth 2, add depth to depth 3, “system”, and part-of-speech attribute “noun” , Store the dependency relation name "wo case qualification". Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
121) Further, the phrase directly modifying the phrase number [13] is searched from the phrase number [11] toward the first phrase, and through the parallel check, the independent word “open” is found from the phrase number [8]. Since the independent word “open” is an independent word that directly modifies the independent word “purchase” at depth 2, add the depth to the depth 3, the expression “open”, and the part of speech attribute “verb” , Store the dependency relationship name “continuous modification”. Further, when the presence or absence of a connection particle in a phrase including “open” is checked, since the connection particle “BA” matches the dictionary, the connection meaning “forward assumption” is registered in the extension element. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
122) Further, the phrase directly modifying the phrase number [13] is searched from the phrase number [7] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly modifies the clause number [13], the search for the independent word that directly modifies the independent word “purchase” is terminated.

123)次に「企業」を含む文節番号[10]を直接修飾する文節を、文節番号[9]から先頭文節に向かって検索する。文節番号[9]の係り先文節が文節番号[10]であるため、文節番号[9]から自立語「コンシューマー」を発見する。自立語「コンシューマー」は、深さ2の自立語「企業」を直接修飾している自立語なので、深さを加算して深さ3と、「コンシューマー」の表記と、品詞属性「名詞」と、係り受け関係名「並列」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
124)さらに文節番号[10] を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[10] を直接修飾する文節がないので、自立語「企業」を直接修飾する自立語の検索を終了する。
123) Next, a phrase that directly modifies the phrase number [10] including “company” is searched from the phrase number [9] toward the first phrase. Since the destination clause of clause number [9] is clause number [10], the independent word “consumer” is found from clause number [9]. The independent word “consumer” is an independent word that directly modifies the independent word “enterprise” of depth 2. Therefore, add the depth to the depth 3, “consumer”, and the part-of-speech attribute “noun”. , The dependency relationship name “parallel” is stored. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
124) Further, the phrase directly modifying the phrase number [10] is searched from the phrase number [8] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly qualifies clause number [10], the search for the independent word that directly qualifies the independent word “company” is terminated.

125)次に「コンシューマー」を含む文節番号[9]を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[9] を直接修飾する文節がないので、自立語「コンシューマー」を直接修飾する自立語の検索を終了する。   125) Next, a phrase that directly qualifies the phrase number [9] including “consumer” is searched from the phrase number [8] toward the first phrase. Since there is no clause that directly qualifies clause number [9] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “consumer” is terminated.

126)次に、「でも」を含む文節番号[0]を直接修飾する文節を、先頭文節に向かって検索する。文節番号[0]が先頭文節であることから、文節番号[0] を直接修飾する文節がないので、自立語「でも」を直接修飾する自立語の検索を終了する。   126) Next, the phrase directly modifying the phrase number [0] including “Even” is searched toward the first phrase. Since clause number [0] is the first clause, there is no clause that directly qualifies clause number [0], so the search for independent words that directly qualify the independent word “even” is terminated.

127)次に、深さ3の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ3の抽出自立語は、「システム」と「開く」と「コンシューマー」である。まず、「システム」を含む文節番号[12]を直接修飾する文節を、文節番号[11]から先頭文節に向かって検索する。
128)文節番号[11]の係り先文節が文節番号[12]であるため、文節番号[11]から自立語「こうした」を発見する。自立語「こうした」は、深さ3の自立語「システム」を直接修飾している自立語なので、深さを加算して深さ4と、「こうした」の表記と、品詞属性「連体詞」と、係り受け関係名「連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
127) Next, an independent word of a phrase having a dependency relationship with the extracted independent word of depth 3 is extracted. The extracted free words of depth 3 are “system”, “open”, and “consumer”. First, a clause that directly modifies the clause number [12] including “system” is searched from the clause number [11] toward the first clause.
128) Since the destination clause of the clause number [11] is the clause number [12], the self-supporting word “such” is found from the clause number [11]. The independent word “Such” is a self-supporting word that directly modifies the independent word “system” with a depth of 3. , Store the dependency relation name “linkage modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.

129)さらに文節番号[12] を直接修飾する文節を、文節番号[10]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[12] を直接修飾する文節がないので、自立語「システム」を直接修飾する自立語の検索を終了する。   129) Further, the phrase directly modifying the phrase number [12] is searched from the phrase number [10] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly qualifies clause number [12], the search for the independent word that directly qualifies the independent word “system” is terminated.

130)次に、「開く」を含む文節番号[8]を直接修飾する文節を、文節番号[7]から先頭文節に向かって検索する。
131)文節番号[7]の係り先文節が文節番号[8]であるため、文節番号[7]から自立語「差」を発見する。自立語「差」は、深さ3の自立語「開く」を直接修飾している自立語なので、深さを加算して深さ4と、「差」の表記と、品詞属性「名詞」と、係り受け関係名「ガ格連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
132)さらに文節番号[8]を直接修飾する文節を、文節番号[6]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[1]の係り先文節が文節番号[8]であるため、文節番号[1]から自立語「いずれ」を発見する。自立語「いずれ」は、深さ3の自立語「開く」を直接修飾している自立語なので、深さを加算して深さ4と、「いずれ」の表記と、品詞属性「副詞」と、係り受け関係名「連用修飾」を記憶する。また。同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
133)さらに文節番号[8] を直接修飾する文節を、文節番号[0]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[8] を直接修飾する文節がないので、自立語「開く」を直接修飾する自立語の検索を終了する。
130) Next, the phrase directly modifying the phrase number [8] including “open” is searched from the phrase number [7] toward the first phrase.
131) Since the destination clause of the clause number [7] is the clause number [8], the independent word “difference” is found from the clause number [7]. The independent word “difference” is an independent word that directly modifies the independent word “open” with a depth of 3. Therefore, the depth is added by adding the depth of 4, the notation of “difference”, and the part of speech attribute “noun”. , Store the dependency relationship name “qualification for continuous use”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
132) Further, the phrase directly modifying the phrase number [8] is searched from the phrase number [6] toward the first phrase, and through the parallel check, the first phrase is searched. Since the destination clause of clause number [1] is clause number [8], the independent word “any” is found from clause number [1]. Since the independent word “any” is an independent word that directly modifies the independent word “open” at the depth 3, the depth is added to the depth 4, the expression “any”, and the part of speech attribute “adverb”. , Store the dependency relation name “continuous modification”. Also. When the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
133) Further, the phrase directly modifying the phrase number [8] is searched from the phrase number [0] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly qualifies clause number [8], the search for the independent word that directly qualifies the independent word “open” is terminated.

134)次に「コンシューマー」を含む文節番号[9]を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[9] を直接修飾する文節がないので、自立語「コンシューマー」を直接修飾する自立語の検索を終了する。   134) Next, the phrase directly modifying the phrase number [9] including “consumer” is searched from the phrase number [8] toward the first phrase. Since there is no clause that directly qualifies clause number [9] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “consumer” is terminated.

135)次に、深さ4の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ4の抽出自立語は、「こうした」と「差」と「いずれ」である。まず、「こうした」を含む文節番号[11]を直接修飾する文節を、文節番号[10]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[11] を直接修飾する文節がないので、自立語「こうした」を直接修飾する自立語の検索を終了する。   135) Next, an independent word of a phrase having a dependency relationship with the extracted independent word of depth 4 is extracted. The extracted independent words of depth 4 are “such”, “difference”, and “any”. First, a phrase that directly modifies the phrase number [11] including “these” is searched from the phrase number [10] toward the first phrase. Since there is no clause that directly qualifies the clause number [11] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “these” is terminated.

136)次に「差」を含む文節番号[7]を直接修飾する文節を、文節番号[6]から先頭文節に向かって検索する。
137)文節番号[6]の係り先文節が文節番号[7]であるため、文節番号[6]から自立語「パフォーマンス」を発見する。自立語「パフォーマンス」は、深さ4の自立語「差」を直接修飾している自立語なので、深さを加算して深さ5と、「パフォーマンス」の表記と、品詞属性「名詞」と、係り受け関係名「ノ連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
138)さらに文節番号[7]を直接修飾する文節を、文節番号[5]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[5]の係り先文節が文節番号[7]であるため、文節番号[5]から自立語「システム」を発見する。自立語「システム」は、深さ4の自立語「差」を直接修飾している自立語なので、深さを加算して深さ5と、「システム」の表記と、品詞属性「名詞」と、係り受け関係名「ノ連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
139)さらに文節番号[7]を直接修飾する文節を、文節番号[5]から先頭文節に向かって検索し、並列チェックを実施する。文節番号[4]の係り受け関係名が「並列」であって、その係り先文節番号が該当文節[5]の文節番号であるため、その直前の文節[4]の自立語「システム」も抽出対象とする。深さ5と、「システム」の表記と、品詞属性「名詞」と、係り受け関係名は処理対象の文節の係り受け関係名「ノ連体修飾」で記憶する。また、文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
140)さらに文節番号[7]を直接修飾する文節を、文節番号[4]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[7] を直接修飾する文節がないので、自立語「差」を直接修飾する自立語の検索を終了する。
136) Next, the phrase directly modifying the phrase number [7] including “difference” is searched from the phrase number [6] toward the first phrase.
137) Since the destination clause of clause number [6] is clause number [7], the independent word “performance” is found from clause number [6]. The independent word “Performance” is an independent word that directly modifies the independent word “Difference” with a depth of 4. Therefore, the depth is added to the depth of 5. , Store the dependency relationship name "no-complex modification". Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
138) Further, the phrase directly modifying the phrase number [7] is searched from the phrase number [5] toward the first phrase, and through the parallel check, the first phrase is searched. Since the destination clause of clause number [5] is clause number [7], the independent word “system” is found from clause number [5]. Since the independent word “system” is an independent word that directly modifies the independent word “difference” with a depth of 4, add the depth to the depth of 5 and the notation of “system” and the part of speech attribute “noun”. , Store the dependency relationship name "no-complex modification". Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
139) Further, the phrase directly modifying the phrase number [7] is searched from the phrase number [5] toward the first phrase, and the parallel check is performed. Since the dependency relation name of clause number [4] is “Parallel” and the destination clause number is the clause number of the corresponding clause [5], the independent word “system” of the immediately preceding clause [4] is also Extraction target. The depth 5, the description of “system”, the part-of-speech attribute “noun”, and the dependency relation name are stored as the dependency relation name “no-complex modification” of the clause to be processed. Moreover, when the intention expression check in the clause is performed, there is no target expression in the clause.
140) Further, the phrase directly modifying the phrase number [7] is searched from the phrase number [4] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly modifies clause number [7], the search for the independent word that directly modifies the independent word “difference” is terminated.

141)次に、「いずれ」を含む文節番号[1]を直接修飾する文節を、文節番号[0]から先頭文節に向かって検索し、先頭文節まで検索する。文節番号[1] を直接修飾する文節がないので、自立語「いずれ」を直接修飾する自立語の検索を終了する。   141) Next, the phrase directly modifying the phrase number [1] including “any” is searched from the phrase number [0] toward the first phrase, and the first phrase is searched. Since there is no clause that directly qualifies clause number [1], the search for the independent word that directly qualifies the independent word “any” is terminated.

142)次に、深さ5の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ5の抽出自立語は、「パフォーマンス」と「システム」と「システム」である。まず、「パフォーマンス」を含む文節番号[6]を直接修飾する文節を、文節番号[5]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[6] を直接修飾する文節がないので、自立語「パフォーマンス」を直接修飾する自立語の検索を終了する。   142) Next, an independent word of a phrase having a dependency relationship with the extracted independent word of depth 5 is extracted. The extracted independent words of depth 5 are “performance”, “system”, and “system”. First, a clause that directly modifies clause number [6] including “performance” is searched from clause number [5] toward the first clause. Since there is no clause that directly qualifies the clause number [6] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “performance” is terminated.

143)次に「システム」を含む文節番号[5]を直接修飾する文節を、文節番号[4]から先頭文節に向かって検索する。文節番号[4]の係り先文節が文節番号[5]であるため、文節番号[4]から自立語「システム」を発見する。自立語「システム」は、深さ5の自立語「システム」を直接修飾している自立語なので、深さを加算して深さ6と、「システム」の表記と、品詞属性「名詞」と、係り受け関係名「並列」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
144)さらに文節番号[5]を直接修飾する文節を、文節番号[3]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[5] を直接修飾する文節がないので、自立語「システム」を直接修飾する自立語の検索を終了する。
143) Next, the phrase directly modifying the phrase number [5] including “system” is searched from the phrase number [4] toward the first phrase. Since the destination clause of clause number [4] is clause number [5], the self-supporting word “system” is found from clause number [4]. Since the independent word “system” is an independent word that directly modifies the independent word “system” with a depth of 5, the depth is added to a depth of 6, a description of “system”, and a part-of-speech attribute “noun”. , The dependency relation name “parallel” is stored. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
144) Further, the phrase directly modifying the phrase number [5] is searched from the phrase number [3] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly qualifies clause number [5], the search for the independent word that directly qualifies the independent word “system” is terminated.

145)次に「システム」を含む文節番号[4]を直接修飾する文節を、文節番号[3]から先頭文節に向かって検索する。文節番号[3]の係り先文節が文節番号[4]であるため、文節番号[3]から自立語「所有」を発見する。自立語「所有」は、深さ5の自立語「システム」を直接修飾している自立語なので、深さを加算して深さ6と、「所有」の表記と、品詞属性「サ変」と、係り受け関係名「連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
146)さらに文節番号[4]を直接修飾する文節を、文節番号[2]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[4] を直接修飾する文節がないので、自立語「システム」を直接修飾する自立語の検索を終了する。
145) Next, a phrase that directly modifies the phrase number [4] including “system” is searched from the phrase number [3] toward the first phrase. Since the destination clause of clause number [3] is clause number [4], the independent word “owned” is found from clause number [3]. The freestanding word “owned” is a freestanding word that directly modifies the freestanding word “system” with depth 5; , Store the dependency relationship name "modification modification". Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
146) Further, the phrase directly modifying the phrase number [4] is searched from the phrase number [2] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly qualifies clause number [4], the search for independent words that directly qualify the independent word “system” is terminated.

147)次に、深さ6の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ6の抽出自立語は、「システム」と「所有」である。まず、「システム」を含む文節番号[4]を直接修飾する文節を、文節番号[3]から先頭文節に向かって検索する。文節番号[3]の係り先文節が文節番号[4]であるため、文節番号[3]から自立語「所有」を発見する。自立語「所有」は、深さ6の自立語「システム」を直接修飾している自立語なので、深さを加算して深さ7と、「所有」の表記と、品詞属性「サ変」と、係り受け関係名「連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
148)さらに文節番号[4]を直接修飾する文節を、文節番号[2]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[4] を直接修飾する文節がないので、自立語「システム」を直接修飾する自立語の検索を終了する。
147) Next, an independent word of a phrase having a dependency relationship with the extracted independent word having a depth of 6 is extracted. The extracted independent words of depth 6 are “system” and “owned”. First, a clause that directly modifies clause number [4] including “system” is searched from clause number [3] toward the first clause. Since the destination clause of clause number [3] is clause number [4], the independent word “owned” is found from clause number [3]. Since the independent word “owned” is an independent word that directly modifies the independent word “system” with a depth of 6, the depth is added to the depth of 7, the notation of “owned”, the part-of-speech attribute “sa change” , Store the dependency relation name “linkage modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
148) Further, the phrase directly modifying the phrase number [4] is searched from the phrase number [2] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly qualifies clause number [4], the search for independent words that directly qualify the independent word “system” is terminated.

149)次に、「所有」を含む文節番号[3]を直接修飾する文節を、文節番号[2]から先頭文節に向かって検索する。文節番号[2]の係り先文節が文節番号[3]であるため、文節番号[2]から自立語「現在」を発見する。自立語「現在」は、深さ6の自立語「所有」を直接修飾している自立語なので、深さを加算して深さ7と、「現在」の表記と、品詞属性「副詞」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
150)さらに文節番号[3]を直接修飾する文節を、文節番号[1]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[3] を直接修飾する文節がないので、自立語「所有」を直接修飾する自立語の検索を終了する。
149) Next, the phrase directly modifying the phrase number [3] including “owned” is searched from the phrase number [2] toward the first phrase. Since the destination clause of clause number [2] is clause number [3], the independent word “present” is found from clause number [2]. Since the independent word “present” is an independent word that directly modifies the independent word “owned” at a depth of 6, the depth is added to the depth of 7, the notation of “current”, and the part of speech attribute “adverb”. , Store the dependency relationship name “continuous modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
150) Further, the phrase directly modifying the phrase number [3] is searched from the phrase number [1] toward the first phrase, and after the parallel check, the first phrase is searched. Since there is no clause that directly qualifies clause number [3], the search for the independent word that directly qualifies the independent word “owned” is terminated.

151)次に、深さ7の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ7の抽出自立語は、「所有」と「現在」である。まず、「所有」を含む文節番号[3]を直接修飾する文節を、文節番号[2]から先頭文節に向かって検索する。文節番号[2]の係り先文節が文節番号[3]であるため、文節番号[2]から自立語「現在」を発見する。自立語「現在」は、深さ7の自立語「所有」を直接修飾している自立語なので、深さを加算して深さ8と、「現在」の表記と、品詞属性「副詞」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
152)さらに文節番号[3]を直接修飾する文節を、文節番号[1]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[3] を直接修飾する文節がないので、自立語「所有」を直接修飾する自立語の検索を終了する。
151) Next, an independent word of a phrase having a dependency relationship with the extracted independent word having a depth of 7 is extracted. The extracted independent words of depth 7 are “owned” and “present”. First, a clause that directly modifies clause number [3] including “owned” is searched from clause number [2] toward the first clause. Since the destination clause of clause number [2] is clause number [3], the independent word “present” is found from clause number [2]. Since the independent word “present” is an independent word that directly modifies the independent word “owned” at a depth of 7, the depth is added to the depth of 8, the notation of “current”, and the part of speech attribute “adverb”. , Store the dependency relation name “continuous modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
152) Further, the phrase directly modifying the phrase number [3] is searched from the phrase number [1] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly qualifies clause number [3], the search for the independent word that directly qualifies the independent word “owned” is terminated.

153)次に、「現在」を含む文節番号[2]を直接修飾する文節を、文節番号[1]から先頭文節に向かって検索し、先頭文節まで検索する。文節番号[2] を直接修飾する文節がないので、自立語「現在」を直接修飾する自立語の検索を終了する。   153) Next, the phrase directly modifying the phrase number [2] including “current” is searched from the phrase number [1] toward the first phrase, and the first phrase is searched. Since there is no clause that directly qualifies clause number [2], the search for the independent word that directly qualifies the independent word “present” is terminated.

154)次に、深さ8の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ8の抽出自立語は、「現在」である。「現在」を含む文節番号[2]を直接修飾する文節を、文節番号[1]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[2] を直接修飾する文節がないので、自立語「現在」を直接修飾する自立語の検索を終了する。以上の抽出処理で抽出キー「こと」を抽出キーとする部分構造要素の抽出を終了する。その結果は、図4のようになる。   154) Next, an independent word of a phrase having a dependency relationship with the extracted independent word having a depth of 8 is extracted. The extracted free standing word of depth 8 is “present”. A phrase that directly modifies the phrase number [2] including “current” is searched from the phrase number [1] toward the first phrase. Since there is no clause that directly qualifies clause number [2] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “present” is terminated. With the above extraction process, the extraction of the partial structure element using the extraction key “ko” as the extraction key is completed. The result is as shown in FIG.

以上の手順に準じて、例文の言語情報取得結果の最後尾の文節から先頭文節に向かって、体言性の文節を検索し、その文節の自立語の品詞属性が名詞類であり、体言句の最後に位置する体言とみなせれば抽出キーとして抽出し、係り受け関係にある自立語、さらにその自立語と係り受けにある自立語を深さの階層を持たせて抽出し、拡張要素も登録していく。先頭文節まで抽出キーの検索と関連自立語と拡張要素の抽出が終了したら、例文中の体言キーでの部分構造要素の拡張抽出を終了する。   In accordance with the above procedure, we search for the syntactic phrase from the last phrase of the linguistic information acquisition result of the example sentence toward the first phrase, the part of speech attribute of the independent word of that phrase is a noun class, If it can be regarded as the last term, it is extracted as an extraction key, and the independent words that are in the dependency relationship, and the independent words that are in the dependency relationship with the independent words are extracted with a depth hierarchy, and the extended elements are also registered. I will do it. When the extraction key search and related independent words and extension elements are extracted up to the first phrase, the extension extraction of the partial structure element with the body key in the example sentence is ended.

155)記憶されている言語情報取得結果に次の文の言語情報取得結果があったら、1)へ戻り次の文の言語情報取得結果を対象に、記憶されている言語情報取得結果がなくなるまで、一文毎に部分構造要素拡張抽出を実施する。次の文の言語情報取得結果がなかったら、部分構造要素拡張抽出処理を終了し、部分構造データ生成処理に進む。   155) If there is a language information acquisition result of the next sentence in the stored language information acquisition result, return to 1) until there is no stored language information acquisition result for the language information acquisition result of the next sentence , Partial structure element extension extraction is performed for each sentence. If there is no language information acquisition result for the next sentence, the substructure element extension extraction process is terminated, and the process proceeds to the substructure data generation process.

〔ユーザから深さ情報の指定があった場合の部分構造要素拡張抽出処理(用言)〕
次に、ユーザから深さn = 2の指定があった場合の部分構造要素拡張抽出処理を、入力された深さnまでで中止した場合の処理について説明する。
図7は、ユーザから深さの指定があった場合に、拡張部分構造要素を抽出する処理の流れを示すフローチャート図である。なお、図7では用言を抽出キーとする。
[Substructure element extension extraction process when user specifies depth information (precaution)]
Next, a description will be given of a process in the case where the substructure element extension extraction process when the depth n = 2 is specified by the user up to the input depth n.
FIG. 7 is a flowchart showing a flow of processing for extracting an extended partial structural element when a depth is designated by the user. In FIG. 7, the word is used as an extraction key.

図7のフローチャート図は、下記156)〜211)の処理の方針を示す。図7のフローチャート図において、図6(a)と同様の処理については説明を省略する。図7の処理は、深さを指定するnの入力設定ステップ(S301)を有する点、カウント定数kがn以下となった時点で、それ以上の深さの部分構造要素拡張抽出処理を行わない点(S302)で、図6(a)と異なる。すなわち、ユーザから指定のあった深さまで達すると、それ以上の深さの係り受け関係を検出せずに、次の用言を抽出キーとした処理が行われる。したがって、全体の解析時間が短縮でき、効率のよい処理が実現できる。n=2の場合の部分構造要素拡張抽出処理の結果は図8のようになる。   The flowchart of FIG. 7 shows the processing policy of the following 156) to 211). In the flowchart of FIG. 7, the description of the same processing as in FIG. The process of FIG. 7 has n input setting steps (S301) for designating the depth, and when the count constant k becomes n or less, the substructure element expansion extraction process with a depth greater than that is not performed. This is different from FIG. 6A in the point (S302). That is, when the depth specified by the user is reached, the processing using the next predicate as the extraction key is performed without detecting a dependency relationship of a depth greater than that. Therefore, the entire analysis time can be shortened and efficient processing can be realized. The result of the partial structure element extension extraction process in the case of n = 2 is as shown in FIG.

156)言語情報記憶手段から、図2のような先頭から1文分の言語情報付き文を取り出し、最後尾の文節から、用言を検索する。最後尾の文節は文節番号[16]の文節である。   156) A sentence with language information for one sentence from the beginning as shown in FIG. 2 is extracted from the language information storage means, and a predicate is searched from the last sentence. The last clause is the clause with clause number [16].

157)文節番号[16]は、体言性文節であるため、次に、文節番号[15]を検査すると、用言性文節であるので、文節番号[15]から用言「いう」を発見する。   157) Since the phrase number [16] is an episodic phrase, the next examination of the phrase number [15] finds the phrase “say” from the phrase number [15] because it is a phrase phrase .

158)抽出キーとして、「いう」の表記と品詞属性「動詞」を抽出、記憶し、同文節内に意図表現があれば、図5(b)の辞書を参照して、対応意図を拡張要素に登録する(同文節には意図表現はない)。
159)次に、文節番号[15]から、先頭文節に向かって順に用言「いう」を直接連用修飾している文節の自立語を検索する。
160)文節番号[14]の係り先文節番号が[15]であることから、文節番号[14]の文節が「いう」を直接連用修飾している「なる」を発見する。「なる」は、抽出キーを直接修飾している自立語なので、深さ0と、「なる」の表記と、品詞属性「動詞」と、係り受け関係名「ト格連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
161)さらに、文節番号[14]から、先頭文節に向かって順に用言「いう」を直接連用修飾している文節の自立語を検索すると共に、並列チェックを行う。並列チェックを実施すると、文節番号[14]に直接「並列」で修飾する文節はないことがわかり、先頭文節への検索を進める。
158) As the extraction key, the notation “say” and the part-of-speech attribute “verb” are extracted and stored. (There is no intention expression in the same clause).
159) Next, from the phrase number [15], the independent words of the phrase in which the phrase “say” is directly modified are sequentially searched from the first phrase toward the first phrase.
160) Since the destination clause number of the clause number [14] is [15], the phrase of the clause number [14] finds “Naru” in which “say” is directly modified. Since “Naru” is an independent word that directly modifies the extracted key, the depth 0, the notation “Naru”, the part-of-speech attribute “verb”, and the dependency relation name “Glyph combination modification” are stored. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
161) Further, from the phrase number [14], the independent words of the phrases in which the predicate “say” is directly modified are sequentially searched in order from the phrase number [14], and a parallel check is performed. When the parallel check is performed, it is found that there is no clause that is directly qualified with “parallel” in clause number [14], and the search to the first clause is advanced.

162)文節番号[13]〜先頭文節番号[0]まで検索する。係り先文節番号が[15]である文節がないので、次に「いう」が直接連体修飾している自立語を文節番号[16]から文末文節に向かって検索する。
163)文節番号[15]の係り先文節番号が[16]であることから、文節番号[15]の文節が、文節番号[16]の「こと。」を直接連体修飾していることがわかる。「こと」は、抽出キーが直接修飾している自立語なので、深さ0と、「こと」の表記と品詞属性「形式名詞」と、係り受け関係「連体修飾」とを記憶する。このとき、先の連用修飾関係の自立語との差異を示すフラグを立てる。図8では、アスタリスクでフラグを表現している。さらに、同文節内の意図表現チェックをし、同文節には意図表現はないことがわかる。
162) Search from phrase number [13] to head phrase number [0]. Since there is no clause whose dependency clause number is [15], the next step is to search for independent words directly modified by “say” from clause number [16] toward the end clause.
163) Since the destination clause number of the clause number [15] is [16], it can be seen that the clause of the clause number [15] directly modifies the “number” of the clause number [16]. . Since “Koto” is an independent word directly modified by the extraction key, the depth 0, the notation of “Koto”, the part-of-speech attribute “formal noun”, and the dependency relationship “combined modification” are stored. At this time, a flag indicating a difference from the independent word of the previous consecutive modification relationship is set. In FIG. 8, flags are represented by asterisks. Furthermore, the intention expression in the same phrase is checked, and it can be seen that there is no intention expression in the same phrase.

164)さらに、文節番号[16]から、文末文節に向かって順に用言「いう」が直接連体修飾している文節の自立語を検索する。文節番号[16]に対して並列チェックを実施し、係り受け関係名が「並列」ではなく文末文節であるため、さらなる抽出対象の自立語はないということがわかる。   164) Further, from the phrase number [16], the independent words of the phrases in which the predicate “say” is directly linked and modified from the phrase number [16] are searched in order. A parallel check is performed on clause number [16], and it can be seen that there is no further independent word to be extracted because the dependency relation name is not “parallel” but a sentence end clause.

165)日本語文法の普遍的な制約「文節の係り先は一つである」により、「いう」が直接連体修飾している自立語が既に存在したため、用言「いう」を抽出キーとする深さ0の部分構造要素の抽出を終了する。   165) Due to the universal restriction of Japanese grammar “There is only one clause destination”, there is already a self-supporting word that is directly modified with “say”. The extraction of the partial structural element having the depth 0 is finished.

166)次に、抽出キーと関係があって抽出した自立語に係り受け関係がある文節の自立語を抽出する。抽出キー「いう」に関する自立語は、「なる」と「こと」である。まず、「なる」を含む文節番号[14]を直接修飾する文節を、文節番号[13]から先頭文節に向かって検索する。
167)文節番号[13]の係り先文節が文節番号[14]であるため、文節番号[13]から自立語「購入」を発見する。「購入」は、深さ0の自立語「なる」を直接修飾している自立語なので、深さを加算して深さ1と、「購入」の表記と、品詞属性「サ変」と、係り受け関係名「連用修飾」を記憶する。同文節内の意図表現チェックを実施すると、図5(b)の意図を示す表現と意図の対応が記述された辞書の助動詞「たい」 と合致したため、拡張要素に、意図「要望」を登録する。
168)さらに、文節番号[14] を直接修飾する文節を、文節番号[13]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[10]から自立語「企業」を発見する。深さ0の自立語「なる」を直接修飾している自立語なので、深さを加算して、深さ1と、「企業」の表記と、品詞属性「名詞」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
169)さらに、文節番号[14] を直接修飾する文節を、文節番号[9]から先頭文節に向かって検索し、並列チェックを実施すると、文節番号[9]の係り受け関係名が「並列」である。その係り先文節番号が該当文節[10]の文節番号であるから、その直前の文節[9]の自立語「コンシューマー」も抽出対象とし、深さ1と「コンシューマー」の表記と、品詞属性「名詞」と、係り受け関係を記憶する。係り受け関係名は処理対象の文節の係り受け関係名「連用修飾」で記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
166) Next, an independent word of a phrase having a dependency relationship with the extracted independent word that is related to the extraction key is extracted. Independent words for the extraction key “say” are “become” and “ko”. First, a phrase that directly modifies the phrase number [14] including “Naru” is searched from the phrase number [13] toward the first phrase.
167) Since the dependency clause of the clause number [13] is the clause number [14], the independent word “purchase” is found from the clause number [13]. “Purchase” is an independent word that directly modifies the independent word “Naru” with a depth of 0. Receiving relationship name “continuous modification” is stored. When the intention expression check in the same phrase is performed, the intention “request” is registered in the extension element because the correspondence between the expression indicating the intention and the intention shown in FIG. .
168) Further, the phrase directly modifying the phrase number [14] is searched from the phrase number [13] toward the first phrase, and through the parallel check, the first phrase is searched. Discover the self-supporting word “company” from clause number [10]. Because it is an independent word that directly modifies the independent word “Naru” with a depth of 0, the depth is added, and the depth 1, the notation of “company”, the part of speech attribute “noun”, and the dependency relation name “ “Continuous modification” is stored. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
169) Further, when a clause that directly modifies clause number [14] is searched from clause number [9] toward the first clause and parallel check is performed, the dependency relation name of clause number [9] is “parallel”. It is. Since the related clause number is the clause number of the corresponding clause [10], the independent word “consumer” of the immediately preceding clause [9] is also extracted, the depth 1 and “consumer” notation, and the part of speech attribute “ "Noun" and the dependency relationship are memorized. The dependency relationship name is stored as the dependency relationship name “continuous modification” of the clause to be processed. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.

170)さらに、文節番号[14] を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索し、並列チェックを経て、文節番号[0]から自立語「でも」を発見する。「でも」は、深さ0の自立語「なる」を直接修飾している自立語なので、深さを加算して深さ1と、「でも」の表記と、品詞属性「接続詞」と、係り受け関係名「連用修飾」を記憶する。品詞が接続詞であっても、該当自立語の深さが0でないため、接続助詞と接続詞と接続の意味の対応が記述された辞書は参照にいかない。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
171)さらに、文節番号[14] を直接修飾する文節を、文節番号[0]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[14] を直接修飾する文節がないので、自立語「なる」を直接修飾する自立語の検索を終了する。
170) Further, the phrase directly modifying the phrase number [14] is searched from the phrase number [8] toward the first phrase, and through the parallel check, the self-supporting word “even” is found from the phrase number [0]. “But” is a free-standing word that directly modifies the free-standing word “Naru” with a depth of 0, so the depth is added by adding the depth of 1 and the notation of “but” and the part-of-speech attribute “connective”. Receiving relationship name “continuous modification” is stored. Even if the part-of-speech is a conjunctive, the depth of the corresponding independent word is not 0. Therefore, the dictionary in which the correspondence between the connecting particle, the conjunctive, and the meaning of the connection is described cannot be referenced. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
171) Further, a clause that directly modifies clause number [14] is searched from clause number [0] toward the first clause, and through the parallel check, the first clause is searched. Since there is no clause that directly modifies the clause number [14], the search for the independent word that directly qualifies the independent word “becomes” ends.

172)次に自立語「こと」を含む文節番号[16]を直接修飾する文節を、文節番号[15]から先頭文節に向かって検索する。このとき抽出キー「いう」を含む文節番号[15]は検索対象としない。
173)先頭文節まで検索して、文節番号[16]を直接修飾する文節がないので、自立語「こと」を直接修飾する自立語の検索を終了する。
172) Next, the phrase directly modifying the phrase number [16] including the independent word “koto” is searched from the phrase number [15] toward the first phrase. At this time, the phrase number [15] including the extraction key “say” is not searched.
173) Since the first phrase is searched and there is no phrase that directly modifies the phrase number [16], the retrieval of the independent word that directly modifies the independent word “Koto” is terminated.

174)次に、自立語「こと」を含む文節番号[16]が直接修飾する文節を、文末文節に向かって検索する。
175)文節番号[16]が文末文節であるため、自立語「こと」を含む文節番号[16]が直接修飾する文節がないので、自立語「こと」が直接修飾する自立語の検索を終了する。
174) Next, the phrase directly modified by the phrase number [16] including the independent word “Koto” is searched for toward the sentence end phrase.
175) Since clause number [16] is the end-of-sentence clause, there is no clause directly modified by clause number [16] containing the independent word “koto”. To do.

176)次に、深さ1の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ1の抽出自立語は、「購入」と「企業」と「コンシューマー」と「でも」である。まず、「購入」を含む文節番号[13]を直接修飾する文節を、文節番号[12]から先頭文節に向かって検索する。
177)文節番号[12]の係り先文節が文節番号[13]であるため、文節番号[12]から自立語「システム」を発見する。自立語「システム」は、深さ1の自立語「購入」を直接修飾している自立語なので、深さを加算して深さ2と、「システム」の表記と、品詞属性「名詞」と、係り受け関係名「ヲ格連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
178)さらに、文節番号[13] を直接修飾する文節を、文節番号[11]から先頭文節に向かって検索し、並列チェックを経て、文節番号[8]から自立語「開く」を発見する。自立語「開く」は、深さ1の自立語「購入」を直接修飾している自立語なので、深さを加算して深さ2と、「開く」の表記と、品詞属性「動詞」と、係り受け関係名「連用修飾」を記憶する。さらに「開く」が含まれる文節中の接続助詞の有無を検査すると、接続助詞「ば」が辞書とマッチしたため、拡張要素に接続意味「順接仮定」を登録する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
179)さらに、文節番号[13] を直接修飾する文節を、文節番号[7]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[13] を直接修飾する文節がないので、自立語「購入」を直接修飾する自立語の検索を終了する。
176) Next, an independent word of a phrase having a dependency relationship with the extracted independent word of depth 1 is extracted. The extracted independent words of depth 1 are “Purchase”, “Company”, “Consumer”, and “Even”. First, the phrase directly modifying the phrase number [13] including “purchase” is searched from the phrase number [12] toward the first phrase.
177) Since the dependency clause of the clause number [12] is the clause number [13], the independent word “system” is found from the clause number [12]. Since the independent word “system” is an independent word that directly modifies the independent word “purchase” at depth 1, add the depth to the depth 2, the notation of “system”, the part-of-speech attribute “noun” , Store the dependency relation name "wo case qualification". Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
178) Further, the phrase directly modifying the phrase number [13] is searched from the phrase number [11] toward the first phrase, and through the parallel check, the independent word “open” is found from the phrase number [8]. Since the independent word “open” is an independent word that directly modifies the independent word “purchase” at depth 1, add the depth to the depth 2, the expression “open”, and the part of speech attribute “verb” , Store the dependency relation name “continuous modification”. Further, when the presence or absence of a connection particle in a phrase including “open” is checked, since the connection particle “BA” matches the dictionary, the connection meaning “forward assumption” is registered in the extension element. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
179) Further, the phrase directly modifying the phrase number [13] is searched from the phrase number [7] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly modifies the clause number [13], the search for the independent word that directly modifies the independent word “purchase” is terminated.

180)次に「企業」を含む文節番号[10]を直接修飾する文節を、文節番号[9]から先頭文節に向かって検索する。文節番号[9]の係り先文節が文節番号[10]であるため、文節番号[9]から自立語「コンシューマー」を発見する。自立語「コンシューマー」は、深さ1の自立語「企業」を直接修飾している自立語なので、深さを加算して深さ2と、「コンシューマー」の表記と、品詞属性「名詞」と、係り受け関係名「並列」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
181)さらに文節番号[10] を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[10] を直接修飾する文節がないので、自立語「企業」を直接修飾する自立語の検索を終了する。
180) Next, a phrase that directly modifies the phrase number [10] including “company” is searched from the phrase number [9] toward the first phrase. Since the destination clause of clause number [9] is clause number [10], the independent word “consumer” is found from clause number [9]. The independent word “consumer” is an independent word that directly modifies the independent word “enterprise” of depth 1. Therefore, add the depth to the depth 2, “consumer”, and the part of speech attribute “noun”. , The dependency relation name “parallel” is stored. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
181) Further, the phrase directly modifying the phrase number [10] is searched from the phrase number [8] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly qualifies clause number [10], the search for the independent word that directly qualifies the independent word “company” is terminated.

182)次に「コンシューマー」を含む文節番号[9]を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[9] を直接修飾する文節がないので、自立語「コンシューマー」を直接修飾する自立語の検索を終了する。   182) Next, a phrase that directly modifies the phrase number [9] including “consumer” is searched from the phrase number [8] toward the first phrase. Since there is no clause that directly qualifies clause number [9] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “consumer” is terminated.

183)次に、「でも」を含む文節番号[0]を直接修飾する文節を、先頭文節に向かって検索する。文節番号[0]が先頭文節であることから、文節番号[0] を直接修飾する文節がないので、自立語「でも」を直接修飾する自立語の検索を終了する。   183) Next, the phrase directly modifying the phrase number [0] including “Even” is searched toward the first phrase. Since clause number [0] is the first clause, there is no clause that directly qualifies clause number [0], so the search for independent words that directly qualify the independent word “even” is terminated.

184)ここで、入力された深さ2までで部分構造要素拡張抽出処理を中止するため、深さ2の抽出自立語「システム」「開く」「コンシューマー」を修飾する自立語の抽出は行なわず、以上の抽出処理で「いう」を抽出キーとする部分構造要素拡張抽出処理を終了する。その結果は、図8(a)のようになる。図8(a)では、深さ情報2までの自立語が抽出されている。   184) Here, since the substructure element expansion extraction process is stopped up to the input depth 2, the extraction of independent words that modify the extracted independent words “system”, “open”, and “consumer” at the depth 2 is not performed. In the above extraction process, the partial structure element extension extraction process using “say” as the extraction key is completed. The result is as shown in FIG. In FIG. 8A, independent words up to depth information 2 are extracted.

185)次に、文節番号[14]から先頭文節に向かって用言を検索すると、文節番号[14]は用言性文節であるので、文節番号[14]から用言「なる」を発見する。
186)抽出キーとして、「なる」の表記と品詞属性「動詞」を抽出、記憶し、意図表現チェックを実施するが、同文節には意図表現はない。
185) Next, when a predicate is searched from the phrase number [14] toward the first phrase, the phrase number [14] is a predicative phrase, and therefore the predicate “is” is found from the phrase number [14]. .
186) “Naru” notation and part-of-speech attribute “verb” are extracted and stored as an extraction key, and an intention expression check is performed, but the phrase does not have an intention expression.

187)次に、文節番号[13]から、先頭文節に向かって順に用言「なる」を直接連用修飾している文節の自立語を検索する。
188)文節番号[13]の係り先文節が文節番号[14]であるため、文節番号[13]から自立語「購入」を発見する。自立語「購入」は、抽出キー「なる」を直接修飾している自立語なので、深さ0と、「購入」の表記と、品詞属性「サ変」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、図5(b)の意図を示す表現と意図の対応が記述された辞書の助動詞「たい」 と合致したため、拡張要素に意図「要望」を登録する。
189)さらに、文節番号[14] を直接修飾する文節を、文節番号[13]から先頭文節に向かって検索し、並列チェックを経て、文節番号[10]から自立語「企業」を発見する。自立語「企業」は、抽出キー「なる」を直接修飾している自立語なので、深さ0と、「企業」の表記と、品詞属性「名詞」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施するが、同文節内には意図表現はない。
190)さらに、文節番号[14] を直接修飾する文節を、文節番号[10]から先頭文節に向かって検索し、並列チェックを実施する。文節番号[9]の係り受け関係名が「並列」であって、その係り先文節番号が該当文節[10]の文節番号であるから、その直前の文節[9]の自立語「コンシューマー」も抽出対象とし、深さ0と「コンシューマー」の表記と、品詞属性「名詞」と、係り受け関係を記憶する。係り受け関係名は処理対象の文節の係り受け関係名「連用修飾」で記憶する。また、同文節内の意図表現チェックを実施するが同文節内には意図表現はない。
191)さらに、文節番号[14] を直接修飾する文節を、文節番号[9]から先頭文節に向かって検索し、並列チェックを経て、文節番号[0]から自立語「でも」を発見する。自立語「でも」は、抽出キー「なる」を直接修飾している自立語なので、深さ0と、「でも」の表記と、品詞属性「接続詞」と、係り受け関係名「連用修飾」を記憶する。品詞が接続詞であり、該当自立語の深さが0であるため、接続助詞と接続詞と接続の意味の対応が記述された辞書を参照にいき、一致があったため、抽出キー「なる」の拡張要素に接続意味「逆接」を登録する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はなかった。
192)さらに、文節番号[14] を直接修飾する文節を、文節番号[0]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[14] を直接修飾する文節がないので、自立語「なる」を直接修飾する自立語の検索を終了する。
187) Next, from the phrase number [13], the independent words of the phrase in which the predicate “Naru” is directly modified are sequentially searched from the first phrase toward the first phrase.
188) Since the dependency clause of the clause number [13] is the clause number [14], the independent word “purchase” is found from the clause number [13]. Since the independent word “purchase” is an independent word that directly modifies the extraction key “Naru”, the depth 0, the “purchase” notation, the part-of-speech attribute “sa change”, and the dependency relationship name “continuous modification” Remember. In addition, when the intention expression check in the same clause is performed, the intention “request” is registered in the extension element because the correspondence between the expression indicating the intention and the intention shown in FIG. To do.
189) Further, the phrase directly modifying the phrase number [14] is searched from the phrase number [13] toward the first phrase, and through the parallel check, the independent word “company” is found from the phrase number [10]. Since the independent word “company” is an independent word that directly modifies the extraction key “Naru”, the depth 0, the expression “company”, the part of speech attribute “noun”, and the dependency relation name “continuous modification” Remember. In addition, although the intention expression check in the same clause is performed, there is no intention expression in the same clause.
190) Further, a clause that directly modifies clause number [14] is searched from clause number [10] toward the first clause, and a parallel check is performed. Since the dependency relation name of clause number [9] is “Parallel” and the destination clause number is the clause number of the corresponding clause [10], the independent word “consumer” of the immediately preceding clause [9] is also As an extraction target, the notation of depth 0, “consumer”, the part of speech attribute “noun”, and the dependency relationship are stored. The dependency relationship name is stored as the dependency relationship name “continuous modification” of the clause to be processed. In addition, the intention expression check in the same phrase is performed, but there is no intention expression in the same phrase.
191) Further, a phrase that directly modifies the phrase number [14] is searched from the phrase number [9] toward the first phrase, and through the parallel check, the independent word “Den” is found from the phrase number [0]. Since the independent word “Dai” is an independent word that directly modifies the extracted key “Naru”, the depth 0, the expression “Dai”, the part-of-speech attribute “connective”, and the dependency relation name “Continuous modification” Remember. Since the part of speech is a conjunction, and the depth of the corresponding independent word is 0, the reference to the dictionary in which the correspondence between the connection particle, the conjunction, and the meaning of the connection is described, and there is a match. Register the connection meaning “reverse connection” in the element. Moreover, when the intention expression check in the same phrase was performed, there was no target expression in the same phrase.
192) Further, the phrase directly modifying the phrase number [14] is searched from the phrase number [0] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly modifies the clause number [14], the search for the independent word that directly qualifies the independent word “becomes” ends.

193)次に、抽出キーと関係があって抽出した深さ0の自立語に直接係り受け関係がある文節の自立語を抽出する。抽出キー「なる」に関する自立語は、「購入」と「企業」と「コンシューマー」と「でも」である。まず、「購入」を含む文節番号[13]を直接修飾する文節を、文節番号[12]から先頭文節に向かって検索する。
194)文節番号[12]の係り先文節が文節番号[13]であるため、文節番号[12]から自立語「システム」を発見する。自立語「システム」は、深さ0の自立語「購入」を直接修飾している自立語なので、深さを加算して深さ1と、「システム」の表記と、品詞属性「名詞」と、係り受け関係名「ヲ格連用修飾」を記憶する。また、同文節内の意図表現チェックを実施するが同文節内には意図表現はない。
195)さらに、文節番号[13] を直接修飾する文節を、文節番号[12]から先頭文節に向かって検索し、並列チェックを経て、文節番号[8]から自立語「開く」を発見する。自立語「開く」は、深さ0の自立語「購入」を直接修飾している自立語なので、深さを加算して深さ1と、「開く」の表記と、品詞属性「動詞」と、係り受け関係名「連用修飾」を記憶する。さらに「開く」が含まれる文節中の接続助詞の有無を検査すると、接続助詞「ば」が辞書とマッチしたため、拡張要素に接続意味「順接仮定」を登録する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
196)さらに、文節番号[13] を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[13] を直接修飾する文節がないので、自立語「購入」を直接修飾する自立語の検索を終了する。
193) Next, the independent words of the phrase that are directly related to the extracted independent words of depth 0 and related to the extraction key are extracted. Independent words regarding the extraction key “Naru” are “Purchase”, “Company”, “Consumer”, and “Even”. First, the phrase directly modifying the phrase number [13] including “purchase” is searched from the phrase number [12] toward the first phrase.
194) Since the dependency clause of the clause number [12] is the clause number [13], the independent word “system” is found from the clause number [12]. Since the independent word “system” is an independent word that directly modifies the independent word “purchase” with a depth of 0, the depth is added to the depth 1, the notation of “system”, the part-of-speech attribute “noun” , Store the dependency relation name "wo case qualification". In addition, the intention expression check in the same phrase is performed, but there is no intention expression in the same phrase.
195) Further, the phrase directly modifying the phrase number [13] is searched from the phrase number [12] toward the first phrase, and through the parallel check, the independent word “open” is found from the phrase number [8]. Since the independent word “open” is an independent word that directly modifies the independent word “purchase” with a depth of 0, the depth is added to the depth 1, the expression “open”, and the part of speech attribute “verb”. , Store the dependency relationship name “continuous modification”. Further, when the presence or absence of a connection particle in a phrase including “open” is checked, since the connection particle “BA” matches the dictionary, the connection meaning “forward assumption” is registered in the extension element. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
196) Further, the phrase directly modifying the phrase number [13] is searched from the phrase number [8] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly modifies the clause number [13], the search for the independent word that directly modifies the independent word “purchase” is terminated.

197)次に「企業」を含む文節番号[10]を直接修飾する文節を、文節番号[9]から先頭文節に向かって検索する。文節番号[9]の係り先文節が文節番号[10]であるため、文節番号[9]から自立語「コンシューマー」を発見する。自立語「コンシューマー」は、深さ0の自立語「企業」を直接修飾している自立語なので、深さを加算して深さ1と、「コンシューマー」の表記と、品詞属性「名詞」と、係り受け関係名「並列」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
198)さらに文節番号[10] を直接修飾する文節を、文節番号[9]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[10] を直接修飾する文節がないので、自立語「企業」を直接修飾する自立語の検索を終了する。
197) Next, a phrase that directly modifies the phrase number [10] including “company” is searched from the phrase number [9] toward the first phrase. Since the destination clause of clause number [9] is clause number [10], the independent word “consumer” is found from clause number [9]. The independent word “consumer” is an independent word that directly modifies the independent word “enterprise” with a depth of 0. , The dependency relationship name “parallel” is stored. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
198) Further, the phrase directly modifying the phrase number [10] is searched from the phrase number [9] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly qualifies clause number [10], the search for the independent word that directly qualifies the independent word “company” is terminated.

199)次に「コンシューマー」を含む文節番号[9]を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[9] を直接修飾する文節がないので、自立語「コンシューマー」を直接修飾する自立語の検索を終了する。   199) Next, a phrase that directly qualifies the phrase number [9] including “consumer” is searched from the phrase number [8] toward the first phrase. Since there is no clause that directly qualifies clause number [9] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “consumer” is terminated.

200)次に、「でも」を含む文節番号[0]を直接修飾する文節を、先頭文節に向かって検索する。文節番号[0]が先頭文節であることから、文節番号[0] を直接修飾する文節がないので、自立語「でも」を直接修飾する自立語の検索を終了する。   200) Next, the phrase directly modifying the phrase number [0] including “Even” is searched toward the first phrase. Since clause number [0] is the first clause, there is no clause that directly qualifies clause number [0], so the search for independent words that directly qualify the independent word “even” is terminated.

201)次に、深さ1の抽出自立語に係り受け関係がある文節の自立語を抽出する。深さ1の抽出自立語は、「システム」と「開く」と「コンシューマー」である。まず、「システム」を含む文節番号[12]を直接修飾する文節を、文節番号[11]から先頭文節に向かって検索する。
202)文節番号[11]の係り先文節が文節番号[12]であるため、文節番号[11]から自立語「こうした」を発見する。自立語「こうした」は、深さ1の自立語「システム」を直接修飾している自立語なので、深さを加算して深さ2と、「こうした」の表記と、品詞属性「連体詞」と、係り受け関係名「連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
203)さらに文節番号[12] を直接修飾する文節を、文節番号[11]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[12] を直接修飾する文節がないので、自立語「システム」を直接修飾する自立語の検索を終了する。
201) Next, an independent word of a phrase having a dependency relationship with the extracted independent word having a depth of 1 is extracted. The extracted independent words of depth 1 are “system”, “open”, and “consumer”. First, a clause that directly modifies the clause number [12] including “system” is searched from the clause number [11] toward the first clause.
202) Since the relation clause of the clause number [11] is the clause number [12], the self-supporting word “such” is found from the clause number [11]. The freestanding word “Such” is a freestanding word that directly modifies the freestanding word “system” with a depth of 1. Therefore, the depth is added by adding the depth of 2. , Store the dependency relationship name "modification modification". Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
203) The phrase directly modifying the phrase number [12] is searched from the phrase number [11] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly qualifies clause number [12], the search for independent words that directly qualify the independent word “system” is terminated.

204)次に、「開く」を含む文節番号[8]を直接修飾する文節を、文節番号[7]から先頭文節に向かって検索する。
205)文節番号[7]の係り先文節が文節番号[8]であるため、文節番号[7]から自立語「差」を発見する。自立語「差」は、深さ1の自立語「開く」を直接修飾している自立語なので、深さを加算して、深さ2と、「差」の表記と、品詞属性「名詞」と、係り受け関係名「ガ格連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
206)さらに文節番号[8]を直接修飾する文節を、文節番号[7]から先頭文節に向かって検索し、並列チェックを経て、文節番号[1]の係り先文節が文節番号[8]であるため、文節番号[1]から自立語「いずれ」を発見する。自立語「いずれ」は、深さ1の自立語「開く」を直接修飾している自立語なので、深さを加算して深さ2と、「いずれ」の表記と、品詞属性「副詞」と、係り受け関係名「連用修飾」を記録する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
207)さらに文節番号[8] を直接修飾する文節を、文節番号[1]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[8] を直接修飾する文節がないので、自立語「開く」を直接修飾する自立語の検索を終了する。
204) Next, the phrase directly modifying the phrase number [8] including “open” is searched from the phrase number [7] toward the first phrase.
205) Since the destination clause of the clause number [7] is the clause number [8], the independent word “difference” is found from the clause number [7]. Since the independent word “difference” is an independent word that directly modifies the independent word “open” with depth 1, add the depth, the depth 2, the difference, and the part-of-speech attribute “noun” And the dependency relation name “qualification for continuous use” is stored. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
206) Further, a clause directly modifying clause number [8] is searched from clause number [7] toward the first clause, and after parallel check, the destination clause of clause number [1] is the clause number [8]. Therefore, the self-supporting word “Any” is found from the phrase number [1]. Since the independent word “any” is an independent word that directly modifies the independent word “open” at the depth 1, the depth is added to the depth 2, the expression “any”, and the part of speech attribute “adverb”. , Record the dependency relation name “continuous modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
207) Further, a clause that directly modifies clause number [8] is searched from clause number [1] toward the first clause, and through the parallel check, the first clause is searched. Since there is no clause that directly qualifies clause number [8], the search for the independent word that directly qualifies the independent word “open” is terminated.

208)次に「コンシューマー」を含む文節番号[9]を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索する。先頭文節まで検索して、文節番号[9] を直接修飾する文節がないので、自立語「コンシューマー」を直接修飾する自立語の検索を終了する。   208) Next, the phrase directly modifying the phrase number [9] including “consumer” is searched from the phrase number [8] toward the first phrase. Since there is no clause that directly qualifies clause number [9] after searching up to the first clause, the search for the independent word that directly qualifies the independent word “consumer” is terminated.

209)ここで、入力された深さ2までで部分構造要素拡張抽出処理を中止するため、深さ2の抽出自立語「こうした」「差」「いずれ」を修飾する自立語の抽出は行なわず、以上の抽出処理で「なる」を抽出キーとする部分構造要素の抽出を終了する。その結果は、図8(b)のようになる。   209) Here, since the substructure element expansion extraction process is stopped up to the input depth 2, the extraction independent words of “depth 2” “these” “difference” “any” are not extracted. Thus, the extraction of the partial structure element using “Naru” as the extraction key is completed by the above extraction process. The result is as shown in FIG.

210)更に、文節番号[13]から先頭文節に向かって用言を検索すると、文節番号[13]は用言性文節であるので、文節番号[13]から用言「購入」を発見する。
211)抽出キーとして、「購入」の表記と品詞属性「サ変」を抽出、記憶し、同文節内の意図表現チェックを実施すると、図5(b)の意図を示す表現と意図の対応が記述された辞書の助動詞「たい」 と合致したため、拡張要素に意図「要望」を登録する。
210) Further, when the phrase is searched from the phrase number [13] toward the first phrase, the phrase “Purchase” is found from the phrase number [13] because the phrase number [13] is a phrase phrase.
211) When the notation of “purchase” and the part-of-speech attribute “sa change” are extracted and stored as the extraction key, and the intention expression check in the same phrase is performed, the correspondence between the expression indicating the intention in FIG. 5B and the intention is described. The intention “request” is registered in the extension element because it matches the auxiliary verb “tai” in the dictionary.

以上の手順に準じて、例文の言語情報取得結果の最後尾の文節から先頭文節に向かって、用言を検索し、抽出キーと係り受け関係にある自立語、さらにその自立語と係り受けにある自立語をユーザ指定の深さの階層まで持たせて抽出し、拡張要素も登録していく。先頭文節まで用言キーの検索と関連自立語と拡張要素の抽出が終了したら、用言を抽出キーとした部分構造要素拡張抽出処理を終了する。   In accordance with the above procedure, search for a predicate from the last sentence of the linguistic information acquisition result of the example sentence to the first sentence, and use the independent words that are in a dependency relationship with the extraction key, and also the independent words and dependencies. A self-supporting word is extracted up to a user-specified depth, and an extension element is registered. When the search for the predicate key and the extraction of the related independent words and the extension elements are completed up to the first clause, the partial structure element extension extraction process using the prey as the extraction key is ended.

〔ユーザから深さの指定があった場合の部分構造要素拡張抽出処理(体言)〕
212)同じ先頭から1文分の言語解析処理結果の最後尾の文節から、体言性の文節を検索する。
213)文節番号[16]から「こと」を発見する。
214)「こと」の表記と品詞属性「形式名詞」を記憶し、同文節が文末文節であることから、拡張要素に「文末」を登録する。さらに同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
[Extraction extraction process for substructure element when depth is specified by the user (syntax)]
212) Search for the phrase of the semantic sentence from the last sentence of the language analysis processing result for one sentence from the same head.
213) Find “Koto” from clause number [16].
214) The notation of “Koto” and the part-of-speech attribute “formal noun” are stored, and since the phrase is a sentence end phrase, “end of sentence” is registered in the extension element. Furthermore, when the intention expression check is performed in the same phrase, there is no target expression in the same phrase.

215)「こと」の品詞属性が名詞類であり、体言句の最後に位置する体言とみなせるため、次に、文節番号[15]から、先頭文節に向かって順に体言「こと」を直接連体修飾している文節の自立語を検索する。
216)文節番号[15]の係り先文節番号が[16]であることから、文節番号[15]の文節が「こと」を直接連体修飾していることがわかり、「いう」を発見する。「いう」は、抽出キー「こと」を直接就職しているので、深さ0、「いう」の表記と品詞属性「動詞」と、係り受け関係「連体修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
217)さらに、文節番号[15]から、先頭文節に向かって順に体言「こと」を直接連体修飾している文節の自立語を検索すると共に、並列チェックを行う。文節[15]を直接「並列」で修飾している文節はない。
218)先頭文節まで検索し、「こと」を直接連体修飾している文節の自立語がないので、体言「こと」を抽出キーとする部分構造要素の抽出を終了する。
215) Since the part-of-speech attribute of “Koto” is a noun class and can be regarded as a dialect positioned at the end of the dialect phrase, next, the phrase “Koto” is directly linked and modified in order from the phrase number [15] toward the first phrase. Search for free-standing words in the current phrase.
216) Since the destination clause number of the clause number [15] is [16], it can be seen that the clause of the clause number [15] directly modifies “ko”, and “say” is found. Since “Take” directly employs the extraction key “Koto”, it stores the notation of depth 0, “Take”, the part-of-speech attribute “verb”, and the dependency relationship “multiple modification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
217) Further, from the phrase number [15], the independent words of the phrase in which the body phrase “Koto” is directly modified are sequentially searched in order from the phrase number [15], and a parallel check is performed. There is no clause that directly modifies clause [15] with “parallel”.
218) Search up to the first phrase, and since there is no independent word of the phrase that directly modifies “Koto”, the extraction of the substructure element with the word “Koto” as the extraction key is finished.

219)次に、抽出キーを直接修飾して抽出した深さ0の自立語に直接係り受け関係がある文節の自立語を抽出する。抽出キー「こと」に関する自立語は、「いう」である。まず、「いう」を含む文節番号[15]を直接修飾する文節を、文節番号[14]から先頭文節に向かって検索する。   219) Next, the independent words of the phrase that are directly related to the independent words of depth 0 extracted by directly modifying the extraction key are extracted. An independent word for the extraction key “Koto” is “say”. First, the phrase directly modifying the phrase number [15] including “say” is searched from the phrase number [14] toward the first phrase.

220)文節番号[14]の係り先文節が文節番号[15]であるため、文節番号[14]から自立語「なる」を発見する。自立語「なる」は、深さ0の自立語「いう」を直接修飾している自立語なので、深さを加算して深さ1と、「なる」の表記と、品詞属性「動詞」と、係り受け関係名「ト格連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
221)さらに、文節番号[15] を直接修飾する文節を、文節番号[14]から先頭文節に向かって検索する。その際、107)同様の並列チェックを実施する。文節[14]を直接「並列」で修飾している文節はない。
222)先頭文節まで検索し、「いう」を直接連体修飾している文節の自立語がないので、自立語「いう」を抽出キーとする部分構造要素の抽出を終了する。
220) Since the destination clause of the clause number [14] is the clause number [15], the independent word “becomes” is found from the clause number [14]. The independent word “Naru” is an independent word that directly modifies the independent word “say” with a depth of 0. Therefore, the depth is added to the depth 1, the expression “Naru”, and the part of speech attribute “verb”. , Store the dependency relationship name “Gift qualification”. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
221) Further, the phrase directly modifying the phrase number [15] is searched from the phrase number [14] toward the first phrase. At that time, 107) the same parallel check is performed. There is no clause that directly modifies clause [14] with “parallel”.
222) Search up to the first phrase, and since there is no independent word of the phrase that directly modifies “say”, the extraction of the partial structural element with the independent word “say” as the extraction key is finished.

223)次に、深さ1の自立語に直接係り受け関係がある文節の自立語を抽出する。深さ1の自立語は、「なる」である。まず、「なる」を含む文節番号[14]を直接修飾する文節を、文節番号[13]から先頭文節に向かって検索する。
224)文節番号[13]の係り先文節が文節番号[14]であるため、文節番号[13]から自立語「購入」を発見する。自立語「購入」は、深さ1の自立語「なる」を直接修飾している自立語なので、深さを加算して、深さ2と、「購入」の表記と、品詞属性「サ変」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、図5(b)の意図を示す表現と意図の対応が記述された辞書の助動詞「たい」 と合致したため、拡張要素に意図「要望」を登録する。
225)さらに、文節番号[14] を直接修飾する文節を、文節番号[13]から先頭文節に向かって検索し、並列チェックを経て、文節番号[10]から自立語「企業」を発見する。自立語「企業」は、深さ1の自立語「なる」を直接修飾している自立語なので、深さを加算して、深さ2と、「企業」の表記と、品詞属性「名詞」と、係り受け関係名「連用修飾」を記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
226)さらに、文節番号[14] を直接修飾する文節を、文節番号[9]から先頭文節に向かって検索し、並列チェックを実施すると、文節番号[9]の係り受け関係名が「並列」である。その係り先文節番号が該当文節[10]の文節番号であるから、その直前の文節[9]の自立語「コンシューマー」も抽出対象とし、深さ2と「コンシューマー」の表記と、品詞属性「名詞」と、係り受け関係を記憶する。係り受け関係名は処理対象の文節の係り受け関係名「連用修飾」で記憶する。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
227)さらに、文節番号[14] を直接修飾する文節を、文節番号[8]から先頭文節に向かって検索し、並列チェックを経て、文節番号[0]から自立語「でも」を発見する。自立語「でも」は、深さ1の自立語「なる」を直接修飾している自立語なので、深さを加算して深さ2と、「でも」の表記と、品詞属性「接続詞」と、係り受け関係名「連用修飾」を記憶する。品詞が接続詞であっても、該当自立語の深さが0でないため、接続助詞と接続詞と接続の意味の対応が記述された辞書は参照にいかない。また、同文節内の意図表現チェックを実施すると、同文節中には対象表現はない。
228)さらに、文節番号[14] を直接修飾する文節を、文節番号[0]から先頭文節に向かって検索し、並列チェックを経て、先頭文節まで検索する。文節番号[14] を直接修飾する文節がないので、自立語「なる」を直接修飾する自立語の検索を終了する。
223) Next, the phrase independent words directly related to the independent word of depth 1 are extracted. A self-supporting word of depth 1 is “become”. First, a phrase that directly modifies the phrase number [14] including “Naru” is searched from the phrase number [13] toward the first phrase.
224) Since the relation clause of the clause number [13] is the clause number [14], the independent word “purchase” is found from the clause number [13]. The independent word “Purchase” is an independent word that directly modifies the independent word “Naru” with a depth of 1, so add the depth, the depth 2, “Purchase”, and the part-of-speech attribute “sa change”. And the dependency relation name “continuous modification” is stored. In addition, when the intention expression check in the same clause is performed, the intention “request” is registered in the extension element because the correspondence between the expression indicating the intention and the intention shown in FIG. To do.
225) Further, the phrase directly modifying the phrase number [14] is searched from the phrase number [13] toward the first phrase, and through the parallel check, the independent word “company” is found from the phrase number [10]. Since the independent word “company” is an independent word that directly modifies the independent word “become” with depth 1, add depth, depth 2, “notice”, and part-of-speech attribute “noun” And the dependency relation name “continuous modification” is stored. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
226) Further, when a clause that directly modifies clause number [14] is searched from clause number [9] toward the first clause and parallel check is performed, the dependency relation name of clause number [9] is “parallel”. It is. Since the related clause number is the clause number of the corresponding clause [10], the independent word “consumer” in the immediately preceding clause [9] is also extracted, the depth 2 and “consumer” notation, and the part of speech attribute “ "Noun" and the dependency relationship are memorized. The dependency relationship name is stored as the dependency relationship name “continuous modification” of the clause to be processed. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
227) Further, a phrase that directly modifies the phrase number [14] is searched from the phrase number [8] toward the first phrase, and through the parallel check, the independent word “Den” is found from the phrase number [0]. Since the independent word “but” is an independent word that directly modifies the independent word “becomes” with a depth of 1, add the depth to the depth 2, the notation of “even”, and the part-of-speech attribute “connective”. , Store the dependency relationship name “continuous modification”. Even if the part-of-speech is a conjunctive, the depth of the corresponding independent word is not 0. Therefore, the dictionary in which the correspondence between the connecting particle, the conjunctive, and the meaning of the connection is described cannot be referenced. Moreover, when the intention expression check in the same phrase is performed, there is no target expression in the same phrase.
228) Further, the phrase directly modifying the phrase number [14] is searched from the phrase number [0] toward the first phrase, and through the parallel check, the first phrase is searched. Since there is no clause that directly modifies the clause number [14], the search for the independent word that directly qualifies the independent word “becomes” ends.

229)ここで、入力された深さ2までで部分構造要素拡張抽出処理を中止するため、深さ2の抽出自立語「購入」「企業」「コンシューマー」「でも」を修飾する自立語の抽出は行なわず、以上の抽出処理で「こと」を抽出キーとする部分構造要素の抽出を終了する。その結果は、図8(c)のようになる。   229) Here, in order to stop the sub-structure element expansion extraction process up to the input depth 2, the extraction of independent words that qualify the extracted independent words “purchase”, “enterprise”, “consumer”, and “even” at depth 2 Is not performed, and the extraction of the partial structure element using “to” as the extraction key is completed by the above extraction process. The result is as shown in FIG.

以上の手順に準じて、例文の言語情報取得結果の最後尾の文節から先頭文節に向かって、体言性の文節を検索し、その文節の自立語の品詞属性が名詞類であり、体言句の最後に位置する体言とみなせれば抽出キーとして抽出し、係り受け関係にある自立語、さらにその自立語と係り受けにある自立語をユーザ指定の深さの階層まで持たせて抽出し、拡張要素も登録していく。先頭文節まで抽出キーの検索と関連自立語と拡張要素の抽出が終了したら、例文中の体言キーでの部分構造要素の拡張抽出を終了する。   In accordance with the above procedure, we search for the syntactic phrase from the last phrase of the linguistic information acquisition result of the example sentence toward the first phrase, the part of speech attribute of the independent word of that phrase is a noun class, If it can be regarded as the last body phrase, it is extracted as an extraction key, and the independent words that are in the dependency relationship, and the independent words that are in the dependency relationship with the independent words, are extracted up to the user-specified depth and expanded. Elements are also registered. When the extraction key search and related independent words and extension elements are extracted up to the first phrase, the extension extraction of the partial structure element with the body key in the example sentence is ended.

230)記憶されている言語情報取得結果に次の文の言語情報取得結果があったら、156)へ戻り次の文の言語情報取得結果を対象に、記憶されている言語情報取得結果がなくなるまで、一文毎に部分構造要素拡張抽出を実施する。次の文の言語情報取得結果がなかったら、部分構造要素拡張抽出処理を終了し、部分構造データ生成処理に進む。以上で、図1のステップS3の処理「部分構造要素拡張抽出ステップ」の説明を終了する。   230) If there is a language information acquisition result of the next sentence in the stored language information acquisition result, return to 156) until there is no stored language information acquisition result for the language information acquisition result of the next sentence. , Partial structure element extension extraction is performed for each sentence. If there is no language information acquisition result for the next sentence, the substructure element extension extraction process is terminated, and the process proceeds to the substructure data generation process. Above, description of the process "partial element expansion extraction step" of step S3 of FIG. 1 is complete | finished.

〔部分構造データ生成処理〕
部分構造要素拡張抽出が行われたら、図1のステップS4の部分構造データ生成処理を実行する。部分構造データ生成処理は、各抽出キーについて、指定された値以下の深さ情報を有する自立語を用いて、当該文書の部分構造データを生成する。
[Partial structure data generation processing]
When the partial structure element extension extraction is performed, the partial structure data generation process of step S4 in FIG. 1 is executed. In the partial structure data generation process, the partial structure data of the document is generated using an independent word having depth information equal to or less than a specified value for each extraction key.

例えば、ユーザから深さの値を指定する入力mがあった場合、図3及び図4のすべての拡張部分構造要素から、抽出キーと、深さm以下の拡張部分構造要素を選択して部分構造データを生成する。ユーザから深さの値の入力がなかった場合は、全ての深さ階層の拡張部分構造要素を選択して部分構造データを生成する。   For example, when there is an input m for designating a depth value from the user, an extraction key and an extended partial structure element having a depth of m or less are selected from all the extended partial structure elements shown in FIGS. Generate structure data. If there is no input of a depth value from the user, the partial structure data is generated by selecting the extended partial structure elements of all depth layers.

また、図8のように、部分構造要素拡張抽出処理を入力された深さnまでで中止した場合は、n=<mならば抽出された拡張部分構造要素をすべて選択して部分構造データを生成する(n>mならばmで指定された深さの自立語で部分構造データを生成する)。   Also, as shown in FIG. 8, when the partial structure element extension extraction process is stopped up to the input depth n, if n = <m, all the extracted extended partial structure elements are selected and the partial structure data is selected. Generate (if n> m, partial structure data is generated with an independent word having a depth specified by m).

図9は、部分構造要素記憶手段13に記憶されている図3及び図4の部分構造要素拡張抽出結果から、深さm=2までの部分構造データを生成した生成結果例を示す。図9の生成結果例について説明する。   FIG. 9 shows a generation result example in which partial structure data up to a depth m = 2 is generated from the partial structure element extension extraction results of FIGS. 3 and 4 stored in the partial structure element storage unit 13. An example of the generation result in FIG. 9 will be described.

a)本発明の情報抽出装置を処理精度の高さを要求される文書要約や、精度の高い文書の類似判定を行うアプリケーションに用いる場合、部分構造データ生成処理の際、各抽出キー毎に、抽出キーとその単語属性、拡張要素、その要素として抽出キーと係り受け関係にある自立語の深さと表記とその単語属性、係り受け関係、拡張要素を登録する。深さm=2の入力があったため、深さ2以下の自立語要素が選択される結果、図8の部分構造データ例のような内容が生成される。すなわち、深さ3以上の自立語要素は抽出されない。部分構造データは、抽出キーとその他の自立語が区別され、各単語属性や、係り受け関係、拡張要素などの情報を保持したデータとなる。   a) When the information extraction apparatus of the present invention is used for a document summary that requires high processing accuracy or an application that performs similarity determination of a document with high accuracy, for each extraction key during partial structure data generation processing, The extraction key and its word attributes, extension elements, and the depth and notation of independent words that have a dependency relationship with the extraction key and their word attributes, dependency relationships, and expansion elements are registered as the elements. Since there is an input of depth m = 2, as a result of selecting an independent word element having a depth of 2 or less, contents such as the partial structure data example of FIG. 8 are generated. That is, independent word elements having a depth of 3 or more are not extracted. The partial structure data is data that distinguishes the extracted key from other independent words and retains information such as word attributes, dependency relationships, and extended elements.

b)一方、本発明の情報抽出装置を処理速度の速さを要求される文書検索や、高速に文書の類似判定を行うアプリケーションに用いる場合、またメモリの少ないコンピュータで処理を実行する場合、各抽出キー毎に、抽出キー、抽出キーと係り受け関係にある自立語の深さと表記を登録する。   b) On the other hand, when the information extraction apparatus of the present invention is used for a document search that requires a high processing speed or an application that makes a document similarity determination at high speed, For each extraction key, the depth and notation of independent words that have a dependency relationship with the extraction key and the extraction key are registered.

深さm=2の入力があったため、深さ2以下の自立語要素が選択された結果、たとえば図10の部分構造データ例のような内容を生成する。図10は、抽出キーとその他の自立語を区別せず、単語表記と拡張要素を保持した部分構造データである。   Since there is an input of depth m = 2, as a result of selecting an independent word element having a depth of 2 or less, contents such as the partial structure data example of FIG. 10 are generated. FIG. 10 shows partial structure data that retains word notation and extension elements without distinguishing the extracted key from other independent words.

c)拡張部分構造要素に対して一文毎に部分構造データ生成を実施した後、図9又は図10のように生成された部分構造データは、部分構造データ記憶手段14に記憶される。   c) After the partial structure data is generated for each sentence with respect to the extended partial structure element, the partial structure data generated as shown in FIG. 9 or 10 is stored in the partial structure data storage means 14.

d)全ての拡張部分構造要素に対して、部分構造データ生成処理が終了したら、部分構造データ生成処理を終了する。   d) When the partial structure data generation process is completed for all the extended partial structure elements, the partial structure data generation process is ended.

〔解析中止処理がある部分構造データ生成処理〕
次に、ユーザから深さn = 2の入力があったため、深さ2で解析が中止された場合の部分構造データ生成処理について説明する。
[Partial structure data generation processing with analysis stop processing]
Next, the partial structure data generation process when the analysis is stopped at the depth 2 because the user inputs the depth n = 2 will be described.

5)本発明の情報抽出装置を処理精度の高さを要求される文書要約や、精度の高い文書の類似判定を行うアプリケーションに用いる場合、部分構造データ生成処理の際、各抽出キー毎に、抽出キーとその単語属性、拡張要素、その要素として抽出キーと係り受け関係にある自立語の深さと表記とその単語属性、係り受け関係、拡張要素を登録する。深さm=2の入力があったため、図8のすべての要素が選択された結果、たとえば図11の部分構造データ例のような内容が生成される。図11は、抽出キーとその他の自立語が区別され、各単語属性や、係り受け関係、拡張要素などの情報を保持したデータである。   5) When the information extraction apparatus of the present invention is used for a document summary that requires high processing accuracy or an application that performs similarity determination of a document with high accuracy, for each extraction key during partial structure data generation processing, The extraction key and its word attributes, extension elements, and the depth and notation of independent words that have a dependency relationship with the extraction key and their word attributes, dependency relationships, and expansion elements are registered as the elements. Since there is an input of depth m = 2, as a result of selecting all the elements in FIG. 8, contents such as the partial structure data example in FIG. 11 are generated. FIG. 11 shows data in which the extracted key and other independent words are distinguished and information such as each word attribute, dependency relationship, and extended element is retained.

6)一方、本発明の情報抽出装置を処理速度の速さを要求される文書検索や、高速に文書の類似判定を行うアプリケーションに用いる場合、またメモリの少ないコンピュータで処理を実行する場合、各抽出キー毎に、抽出キー、抽出キーと係り受け関係にある自立語の深さと表記を登録する。深さm=2の入力があったため、図8のすべての要素から各抽出キー毎に、抽出キー、抽出キーと係り受け関係にある自立語の深さと表記が選択され、結果、たとえば図12の部分構造データ例のような内容が生成される。図12は、抽出キーとその他の自立語を区別せず、単語表記と拡張要素を保持した部分構造データである。   6) On the other hand, when the information extraction apparatus of the present invention is used for a document search that requires a high processing speed or an application that makes a similarity determination of documents at high speed, For each extraction key, the depth and notation of independent words that have a dependency relationship with the extraction key and the extraction key are registered. Since there is an input of depth m = 2, the extraction key and the depth and notation of independent words that are in a dependency relationship with the extraction key are selected for each extraction key from all the elements in FIG. Contents such as the partial structure data example are generated. FIG. 12 shows partial structure data that retains word notation and extension elements without distinguishing the extracted key from other independent words.

7)拡張部分構造要素に対して一文毎に部分構造データ生成を実施した後、図11又は12のように生成された部分構造データは、部分構造データ記憶手段14に記憶される。   7) After the partial structure data is generated for each sentence for the extended partial structure element, the partial structure data generated as shown in FIG. 11 or 12 is stored in the partial structure data storage unit 14.

8)全ての拡張部分構造要素に対して、部分構造データ生成処理が終了したら、部分構造データ生成処理を終了する。   8) When the partial structure data generation process is completed for all the extended partial structure elements, the partial structure data generation process is ended.

〔出力処理〕
ユーザが任意に設定した出力方法で、部分構造データ記憶手段に記憶されている抽出情報を出力する(ステップS5)。出力は、用紙に印刷してもよいし、コンピュータのディスプレーに表示してもよい。また、別のプログラムへ出力してもよい。出力処理が終了すると図1の処理が終了する。
[Output processing]
The extraction information stored in the partial structure data storage means is output by an output method arbitrarily set by the user (step S5). The output may be printed on paper or displayed on a computer display. Moreover, you may output to another program. When the output process ends, the process of FIG. 1 ends.

以上説明したように、本実施例の情報抽出方法は、対象文書の分野が変わっても影響がなく、メンテナンスを要する制約のための辞書が不要である。また、ユーザは言語処理分野の専門的な知識を必要とせず、文書トピックの展開経緯を見つけ出すことが可能で、実用に即した文書情報を精度良く抽出できる。   As described above, the information extraction method of the present embodiment has no effect even if the field of the target document changes, and does not require a dictionary for restrictions requiring maintenance. In addition, the user does not need specialized knowledge in the language processing field, can find out the development process of the document topic, and can extract document information suitable for practical use with high accuracy.

〔情報抽出プログラム及びその記録媒体〕
これまで説明した情報抽出方法を実現するプログラム(以下、情報抽出プログラムという)及びその記録媒体について説明する。図13は、情報抽出プログラムを実行するコンピュータのハードウェア構成図の一例を示す。
[Information extraction program and its recording medium]
A program for realizing the information extraction method described so far (hereinafter referred to as an information extraction program) and its recording medium will be described. FIG. 13 shows an example of a hardware configuration diagram of a computer that executes an information extraction program.

図13のハードウェア構成図は、それぞれバスで相互に接続されているCPU21、入出力装置22、ドライブ装置23、通信装置24、主記憶装置25、記憶装置26、表示装置27を有するように構成される。   The hardware configuration diagram of FIG. 13 includes a CPU 21, an input / output device 22, a drive device 23, a communication device 24, a main storage device 25, a storage device 26, and a display device 27 that are mutually connected by a bus. Is done.

CPU21は、コンピュータが行う処理を統括的に制御する。入出力装置22は、キーボード及びマウスなどで構成され、ユーザからの様々な操作指示を入力するために用いられる。通信装置24は、インターネットやLANなどのネットワークに接続するためのインターフェイスであり、例えばモデム、ルータ等で構成される。主記憶装置25は、オペレーティングシステムやプログラム、データを一時保管する記憶領域である。記憶装置26には、情報抽出方法を実現するプログラムがインストールされている。ドライブ装置23は、DVD−ROMやCD−ROMが挿入可能であり、記録媒体20からプログラムやデータを読み込み、また記録媒体20にプログラムやデータを書き込むことも可能である。表示装置27は、GUI(Graphycal User Interface)画面を形成し、操作に必要な各種ウィンドウやデータ等を表示する。   The CPU 21 comprehensively controls processing performed by the computer. The input / output device 22 includes a keyboard and a mouse, and is used to input various operation instructions from the user. The communication device 24 is an interface for connecting to a network such as the Internet or a LAN, and includes, for example, a modem, a router, and the like. The main storage device 25 is a storage area for temporarily storing an operating system, programs, and data. A program that realizes the information extraction method is installed in the storage device 26. The drive device 23 can be inserted into a DVD-ROM or CD-ROM, can read programs and data from the recording medium 20, and can write programs and data to the recording medium 20. The display device 27 forms a GUI (Graphical User Interface) screen and displays various windows and data necessary for operation.

情報抽出プログラムは、図1の文書登録手段、言語情報取得手段、部分構造要素拡張抽出手段、部分構造データ生成手段、出力手段、の各手段をコンピュータに実行させる。一例としては、図6、7で説明したフローチャート図、1)〜230)の処理を所定のプログラム言語でコード化し、コンパイルなどされたものである。   The information extraction program causes the computer to execute each of the document registration unit, language information acquisition unit, partial structure element extension extraction unit, partial structure data generation unit, and output unit shown in FIG. As an example, the flowcharts described in FIGS. 6 and 7 are encoded by a predetermined program language, compiled, and the like.

情報抽出プログラムは、例えばDVD−ROM等の記録媒体20によって提供される。情報抽出プログラムを記録した記録媒体20は、ドライブ装置23にセットされ、記憶装置26にインストールされる。   The information extraction program is provided by a recording medium 20 such as a DVD-ROM. The recording medium 20 on which the information extraction program is recorded is set in the drive device 23 and installed in the storage device 26.

なお、情報抽出プログラムを記録した記憶媒体20は、CD−ROM、DVD−ROM、フレキシブルディスク、光磁気ディスク(MO)等のように、情報を光学的、電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることが可能である。また、情報抽出プログラムは、ネットワークを介してダウンロードしてもよい。   The storage medium 20 on which the information extraction program is recorded is a recording medium that records information optically, electrically, or magnetically, such as a CD-ROM, DVD-ROM, flexible disk, magneto-optical disk (MO), or the like. Various types of recording media such as a semiconductor memory that electrically records information, such as a ROM and a flash memory, can be used. Further, the information extraction program may be downloaded via a network.

実施例1では、自立語の係り受け関係を用いて、文法的に限定をかけた部分構造要素を規則的に抽出し、これらの要素の組み合わせをテキスト処理のための基本トピック単位に同定する情報抽出方法において、さらに部分構造要素を拡張する情報抽出方法について説明した。   In the first embodiment, by using the dependency relationship of independent words, partial structural elements with grammatical limitations are regularly extracted, and information for identifying combinations of these elements as basic topic units for text processing In the extraction method, the information extraction method for further extending the partial structural elements has been described.

ところで、抽出した部分構造要素を、文書検索や文書要約といった高次の文書処理手法における材料(以下、特徴量という)とする場合、特徴量は対象文書全体に対し、網羅的でありかつ冗長性が低いことが望まれる。冗長性は部分構造要素が重複して抽出されるほど増大する。   By the way, when the extracted partial structural elements are used as materials in high-level document processing methods such as document retrieval and document summarization (hereinafter referred to as feature quantities), the feature quantities are comprehensive and redundant with respect to the entire target document. Is desired to be low. Redundancy increases as substructure elements are extracted redundantly.

例えば、“犬はいるが、猫はいないと思う。”という文は、
(1:犬は:体言性:係り:2)、
(2:いるが、:用言性:係り・読点:4)、
(3:猫は:体言性:係り:4)、
(4:いないと:用言性:係り:5)、
(5:思う:用言性:文末:−1)、
という文節列に分解できる。
For example, the sentence “I think there are dogs but no cats”
(1: dogs: verbality: engagement: 2)
(2: Yes, but: Usefulness: Dependency / Reading marks: 4),
(3: cat is: body language: relationship: 4),
(4: If not: Usefulness: Dependency: 5),
(5: Think: Usefulness: End of sentence: -1),
Can be broken down into phrases such as

ここでは文を()内の“:”をセパレータとして5つ組み要素として表現し、それぞれ順に、文節番号、文節表記、文節品詞、文節種、および係り先文節番号を示す。また、係り先文節がない場合、かかり先文節番号を「-1」とした。なお、文節品詞等の定義については後述する。   Here, a sentence is expressed as a five-element element using “:” in parentheses as a separator, and a phrase number, a phrase notation, a phrase part of speech, a phrase type, and a related phrase number are shown in this order. When there is no dependency clause, the destination clause number is set to “−1”. The definition of phrase parts of speech etc. will be described later.

この文を実施例1に記載されている抽出手順に従って、拡張部分構造要素を抽出すると、
・抽出キーを文節2とする文節1と文節2からなる拡張部分構造要素、
・抽出キーを文節4とする文節1、文節2、文節3、および文節4からなる拡張部分構造要素、
・抽出キーを文節5とする文節1、文節2、文節3、文節4、および文節5からなる拡張部分構造要素、
の3つの拡張部分構造要素を抽出することができる。
According to the extraction procedure described in Example 1, this sentence is extracted as an extended substructure element.
An extended substructure element consisting of clause 1 and clause 2 with the extraction key being clause 2;
An extended substructure element consisting of clause 1, clause 2, clause 3 and clause 4 with the extraction key being clause 4;
An extended substructure element consisting of clause 1, clause 2, clause 3, clause 4 and clause 5 with the extraction key as clause 5;
The three extended substructure elements can be extracted.

しかしながら、この拡張部分構造要素は対象の文に対し、網羅的ではあるが、文節1と文節2が三回抽出されるなど冗長性が高いものとなってしまう。   However, although this extended partial structural element is exhaustive with respect to the target sentence, it becomes highly redundant, for example, the phrase 1 and the phrase 2 are extracted three times.

抽出した拡張部分構造要素が網羅的ではあるが冗長性が高くなる、という実施例1の不都合は、拡張部分構造要素の抽出キーの選出規則が少ないこと、また、拡張部分構造要素メンバである文節を選出する際の規則に制約が少ないこと、が原因であると考えられる。   The inconvenience of Example 1 that the extracted extended substructure elements are exhaustive but the redundancy is high is that there are few rules for selecting the extraction key of the extended substructure elements, and the clauses that are the extended substructure element members This is thought to be due to the fact that there are few restrictions on the rules for selecting the.

そこで、本実施例では、文書中の言語情報を用いて、文法的に限定をかけた所定の拡張部分構造要素を規則的に抽出し、これらの要素の組み合わせをテキスト処理のための基本トピック単位に同定する情報抽出方法を説明する。以下、本実施例で抽出する拡張部分構造要素を、実施例1と区別するため拡張構造要素という。   Therefore, in this embodiment, predetermined extended substructure elements with grammatical limitations are regularly extracted using language information in the document, and a combination of these elements is a basic topic unit for text processing. An information extraction method to be identified will be described. Hereinafter, the extended partial structural element extracted in the present embodiment is referred to as an extended structural element in order to distinguish it from the first embodiment.

本実施例では、読点、文末、係りなし、係り、又は、不定、のいずれか1つの文節種と、用言性、体言性、サ変性、コピュラ、形容性、副詞性、連体性、接続性、又は、不定、のいずれか1つの文節品詞を有する文節を拡張構造要素の基本単位として用い、文節種と文節品詞から成る文節情報をもとに拡張構造要素の抽出キーの選出規則および拡張構造要素の構成規則を記述することで、拡張構造要素の抽出対象である文書、文書集合に対し、網羅的かつ冗長性の低い拡張構造要素を抽出できる情報抽出情報を提供する。なお、コピュラ(copula)については後述するが、英語文におけるbe動詞など、主語と述語をつなぐ「文の構成要素」としての名称であって、品詞名ではない。   In this embodiment, any one of the phrase types of reading, sentence end, no relation, relation, or indefinite, prescriptiveness, verbality, sa modification, copula, adjective, adverbiality, connectivity, connectivity , Or indefinite, using a clause with one of the clause parts of speech as the basic unit of the extension structure element, the extraction rule of the extension structure element key and the extension structure based on the clause information consisting of the clause type and the clause part of speech By describing element configuration rules, information extraction information is provided that can extract an extended structural element that is exhaustive and has low redundancy for a document or a document set from which an extended structural element is to be extracted. Although copula will be described later, it is a name as a “sentence component” that connects a subject and a predicate, such as a be verb in an English sentence, and is not a part of speech name.

図14(a)は本実施例の情報抽出処理の手順の一例を、図14(b)は情報抽出装置の機能ブロック図をそれぞれ示す。なお、図14において、図1と同一部分には同一の符号を付し、その説明は一部省略する。また、各ステップは、各ステップに記載された、文書登録手段31、言語情報取得手段32、拡張構造要素生成手段530、出力手段35により実行される。   FIG. 14A shows an example of the procedure of the information extraction process of this embodiment, and FIG. 14B shows a functional block diagram of the information extraction apparatus. In FIG. 14, the same parts as those in FIG. Each step is executed by the document registration unit 31, the language information acquisition unit 32, the extended structural element generation unit 530, and the output unit 35 described in each step.

(ステップS1)
情報抽出を開始すると、文書登録処理で文書を登録する。文書登録処理は、文書登録手段31により実行される。
(Step S1)
When the information extraction is started, the document is registered by the document registration process. The document registration process is executed by the document registration unit 31.

(ステップS2)
登録された文書は順に文書記憶手段11に記憶される。登録対象文書を全て登録すると、記憶された文書から言語情報取得処理を行う。言語情報取得処理は、言語情報取得手段により実行される。
(Step S2)
The registered documents are sequentially stored in the document storage unit 11. When all the registration target documents are registered, language information acquisition processing is performed from the stored documents. The language information acquisition process is executed by a language information acquisition unit.

(ステップS30)
登録文書全部の言語情報取得処理が終了すると、次に、記憶された言語情報が付加された文書に対し、拡張構造要素生成処理を実行する。拡張構造要素生成処理は、拡張構造要素生成手段530により実行される。
(Step S30)
When the linguistic information acquisition processing for all the registered documents is completed, the extended structural element generation processing is executed for the document to which the stored linguistic information is added. The extension structure element generation process is executed by the extension structure element generation means 530.

拡張構造要素生成手段530は、抽出キー選択手段531、前方拡張処理手段532及び後方拡張処理手段533、とを有する。拡張構造要素生成手段530は、文節品詞及び言語情報取得ステップで取得された係り受け情報に基づいて定められた拡張規則132を参照して、文章から文節を抽出して拡張構造要素を生成する。抽出キー選択手段531は、後述する抽出キー選出規則131を参照して抽出キーを選択する。前方拡張処理手段532は、注目している文節(後述の拡張対象文節)より前にある文節を拡張構造要素に追加する。後方拡張処理手段533は、注目している文節(後述の拡張対象文節)より後にある文節を拡張構造要素に追加する。なお、拡張構造要素生成手段530が有する各手段についての詳細は後述する。   The extension structure element generation unit 530 includes an extraction key selection unit 531, a front extension processing unit 532, and a rear extension processing unit 533. The extended structural element generation unit 530 generates an extended structural element by extracting a phrase from a sentence with reference to the extended rule 132 defined based on the dependency part information acquired in the phrase part of speech and language information acquisition step. The extraction key selection unit 531 selects an extraction key with reference to an extraction key selection rule 131 described later. The forward extension processing means 532 adds a clause preceding the clause of interest (an extension target clause described later) to the extension structure element. The backward extension processing means 533 adds a clause after the clause of interest (an extension target clause described later) to the extension structure element. Details of each unit included in the extended structural element generation unit 530 will be described later.

(ステップS5)
拡張構造要素が生成されると、ユーザが任意に設定した出力方法で、出力装置から拡張構造要素が出力される(ステップS5)。出力は、用紙に印刷してもよいし、コンピュータのディスプレーに表示してもよい。
(Step S5)
When the extended structural element is generated, the extended structural element is output from the output device by an output method arbitrarily set by the user (step S5). The output may be printed on paper or displayed on a computer display.

ステップS1からS4のうち、文書登録処理(S1)及び出力処理(S5)については実施例1と同様であるので説明を省略する。続いて、言語情報取得処理(S2)及び拡張構造要素生成処理(S30)について詳細に説明する。   Of steps S1 to S4, the document registration process (S1) and the output process (S5) are the same as those in the first embodiment, and thus description thereof is omitted. Next, the language information acquisition process (S2) and the extended structure element generation process (S30) will be described in detail.

〔言語情報取得処理〕
言語情報取得処理における処理は、実施例1と同様であるが、取得された言語情報の表現形式を変える。言語情報の取得は、たとえば、言語解析処理を実施して取得する方法、ユーザの指示を受けながら自動ないしは半自動で取得する方法など、既存の方法を用いる。
[Language information acquisition processing]
The processing in the language information acquisition processing is the same as that in the first embodiment, but the expression format of the acquired language information is changed. The language information is acquired by using an existing method such as a method of acquiring language information by performing language analysis processing or a method of acquiring automatically or semi-automatically while receiving a user instruction.

言語情報取得手段32は、自立語の係り受け関係、文節の品詞情報を示す文節品詞又は文節の分類情報を示す文節種を、文章から取得する。   The linguistic information acquisition means 32 acquires from the sentence the dependency relationship of the independent words, the phrase part of speech indicating the part of speech information of the phrase, or the phrase type indicating the classification information of the phrase.

図15は文章の言語解析の結果得られる言語情報の一例である。この文章の本文は、
「大きい熊がゆっくり歩いているが、そばに小熊はいない。そこで、静かに近寄ってみようと思った自分は愚か。」 … 文章S
である。
FIG. 15 shows an example of language information obtained as a result of sentence language analysis. The text of this sentence is
“A big bear is walking slowly, but there is no small bear nearby. So, I thought I would try to approach quietly.”… Sentence
It is.

図15では、 “:”をセパレータとして5つ組み要素として、それぞれ順に、文節番号、文節表記、文節品詞、文節種、およびかかり先文節番号を示す。また、かかり先文節がない場合、かかり先文節番号を「-1」とする。   In FIG. 15, “:” is used as a separator and five elements are shown, and the phrase number, the phrase notation, the phrase part of speech, the phrase type, and the destination phrase number are sequentially shown. If there is no destination clause, the destination clause number is set to “−1”.

例えば、図15の文節4は、文節番号が4、文節品詞は連用性、文節種は読点、および係り先文節はないことを示している。なお、本実施例では、簡単のため単語情報を別途管理していないが、効率化のため、文節情報と単語情報を独立に管理してもよい。   For example, clause 4 in FIG. 15 indicates that the clause number is 4, the clause part of speech is continuity, the clause type is a punctuation mark, and there is no dependency clause. In this embodiment, word information is not managed separately for simplicity, but phrase information and word information may be managed independently for efficiency.

〔拡張構造要素生成処理〕
続いて、拡張構造要素生成処理について説明する。はじめに、本実施例における単語と文節を定義する。
a)単語
・単語は、すくなくとも実表記、代表表記、および品詞に関する情報を有する。
・単語は、それが有する品詞により自立語と機能語に分類される。
・付属語品詞をもつ単語は付属語とする。
・付属語品詞以外の品詞をもつ単語は自立語とする。
[Extended structure element generation processing]
Next, the extended structural element generation process will be described. First, words and phrases in this embodiment are defined.
a) A word / word has at least information about a real expression, a representative expression, and a part of speech.
・ Words are classified into independent words and functional words according to the part of speech they have.
・ Words with adjunct parts of speech shall be adjunct words.
・ Words with parts of speech other than the adjunct part of speech are independent words.

b)単語品詞
・名詞、記号、数詞、および未登録語に類する品詞を体言系品詞と称する。
・動詞、サ変名詞、形容詞、および形容動詞に類する品詞を用言系品詞と称する。
・副詞に類する品詞を副詞性品詞と称する。
・接続詞に類する品詞を接続性品詞と称する。
・連体詞に類する品詞を連体性品詞と称する。
・助詞、助動詞、補助動詞、補助形容詞、接頭辞、および接尾辞に類する品詞を付属語品詞と称する。
・名詞、記号、数詞、未登録語、動詞、サ変名詞、形容詞、形容動詞、副詞、接続詞、連体詞、助詞、助動詞、補助動詞、補助形容詞、接頭辞、および接尾辞のいずれにも類さない品詞を不定品詞と称する。
b) Word parts of speech / nouns, symbols, numbers, and parts of speech similar to unregistered words are referred to as body part of speech.
・ Parts of speech similar to verbs, sa variable nouns, adjectives, and adjective verbs are called prescriptive parts of speech.
・ Parts of speech similar to adverbs are called adverb parts of speech.
・ Parts of speech similar to conjunctions are called connectivity parts of speech.
・ Parts of speech similar to conjunctions are referred to as conjunction parts of speech.
・ Parts of speech similar to particles, auxiliary verbs, auxiliary verbs, auxiliary adjectives, prefixes, and suffixes are referred to as adjunct parts of speech.
・ Nouns, symbols, numerals, unregistered words, verbs, sa-variant nouns, adjectives, adjective verbs, adverbs, conjunctions, conjunctions, particles, auxiliary verbs, auxiliary verbs, auxiliary adjectives, prefixes, and suffixes Part of speech is called indefinite part of speech.

c)文節
・文節とは、1つ以上の自立語に付属語が0個以上付随した、単語で構成される文構成要素の1単位である。ただし、複数の自立語が存在する場合、最初に出現する自立語以外の自立語は付属語として扱われる。
・文節は、少なくとも構成単語、文節品詞、文節種、係り先文節に関する情報を有する。
・文節品詞とは、文節を構成する単語情報に従う情報である。
・文節種とは、文節を構成する単語情報と、係り先文節との修飾関係に従って文節を分類する分類情報である。
c) A phrase / sentence is one unit of a sentence component composed of words in which one or more independent words are accompanied by zero or more attached words. However, when there are a plurality of independent words, the independent words other than the first independent word are treated as appendages.
A phrase has information on at least constituent words, phrase parts of speech, phrase types, and related phrases.
The phrase part-of-speech is information according to the word information constituting the phrase.
The phrase type is classification information that classifies the phrase according to the modification relationship between the word information constituting the phrase and the related phrase.

d)文節品詞
・“コピュラ”とは、自立語が体言系品詞であり、断定の助動詞、体言止などで文末文節を形成する文節が有する文節品詞である。
・“サ変性”とは、自立語が体言系品詞のうち、サ変名詞を含む文節が有する文節品詞である。
・“形容性”とは、自立語が用言系品詞のうち、形容詞、形容動詞を含む文節が有する文節品詞である。
・“体言性”とは、自立語が体言系品詞であり、コピュラ文節該当以外の文節が有する文節品詞である。
・“副詞性”とは、自立語が副詞である文節が有する文節品詞である。
・“用言性”とは、自立語が用言系品詞のうち動詞を含む文節が有する文節品詞である。
・“連体性”とは、自立語が連体詞である文節が有する文節品詞である。
・“接続性”とは、自立語が接続詞である文節が有する文節品詞である。
・“不定”とは、上記の文節品詞の成立条件を全く満たさない文節が有する文節品詞である。
d) The phrase part-of-speech / "copula" is a phrase part-of-speech that a self-supporting word is a body part-of-speech part, and a phrase that forms a sentence-end sentence with assertive auxiliary verbs, body stop, and the like.
“Sa modification” is a phrase part-of-speech possessed by a phrase containing a sa-variant noun among the verbal parts of speech.
“Adjective” is a phrase part-of-speech possessed by a phrase including an adjective and an adjective verb among self-supporting part-of-speech parts of speech.
“Verbalism” is a phrase part of speech that a self-supporting word has a body part of speech and a phrase other than a copula phrase corresponds to.
“Adverbiality” is a phrase part of speech that a clause whose independent word is an adverb has.
“Peculiarity” is a phrase part of speech that a self-supporting word has in a phrase containing a verb among the part of speech idiom.
“Community” is a phrase part of speech that a phrase whose independence word is a combination word has.
“Connectivity” is a phrase part-of-speech possessed by a phrase whose independent word is a conjunction.
“Undetermined” is a phrase part of speech that has a phrase that does not satisfy the above-mentioned conditions for the phrase part of speech.

e)文節種
・文節種は、文末、読点、係り、切断、不定の順に降順の優先順位を有する。
・“文末”とは、文節内に句点またはそれに代わる記号が存在する文節が有する属性である。
・“読点”とは、文節内に読点またはそれに代わる記号が存在し、かつ用言性かサ変性の文節品詞を有する文節が有する属性である。
・“係り”とは、係り先文節に対し連体修飾か連用修飾をするか、係り先文節と複合語を形成する文節が有する属性である。
・“切断”とは、他の文節と係り関係を持たない文節が有する属性である。
・“不定”とは、上記の文節種の成立条件を満たさない文節が有する文節種である。
e) Phrase types / phrase types have descending priorities in the order of sentence ending, punctuation, engagement, disconnection, and indefinite.
“End of sentence” is an attribute of a phrase in which a phrase or an alternative symbol exists in the phrase.
“Reading mark” is an attribute of a phrase that has a punctuation mark or a substitute symbol in the phrase, and that has a phrase part of speech that is idiom or degenerate.
“Relationship” is an attribute of a clause that forms a compound word with a dependency clause, whether the modification of the dependency clause is a combination modification or a combination modification.
“Disconnect” is an attribute of a clause that has no relationship with another clause.
“Undetermined” is a phrase type possessed by a phrase that does not satisfy the above-mentioned conditions for the phrase type.

拡張構造要素生成処理では、拡張構造要素生成手段530が、言語情報取得処理により抽出もしくは記憶された言語情報を用いて拡張構造要素を抽出する。   In the extension structure element generation process, the extension structure element generation means 530 extracts the extension structure element using the language information extracted or stored by the language information acquisition process.

拡張構造要素の抽出は、
(i)まず文節品詞と文節種で構成される抽出キー選出規則131を用いて抽出キーを選出し、
(ii)選出した抽出キーごとに、文節品詞で構成される拡張規則132を用いて、文章から文節を抽出し拡張構造要素を生成する。
Extraction of extended structural elements
(I) First, an extraction key is selected using an extraction key selection rule 131 composed of a phrase part of speech and a phrase type.
(Ii) For each selected extraction key, the clause is extracted from the sentence using the extension rule 132 composed of the phrase part of speech, and an extended structural element is generated.

(i)抽出キーの選出
抽出キー選出規則131とは、抽出キーを選出するための規則である。図16は、抽出キー選出規則131の一例を示す。図16において1つの抽出キー選出規則131は、1つの括弧対内に記述されており、”:”をセパレータとする2つ組み要素として表現されている。
(I) Selection of extraction key The extraction key selection rule 131 is a rule for selecting an extraction key. FIG. 16 shows an example of the extraction key selection rule 131. In FIG. 16, one extraction key selection rule 131 is described in one pair of parentheses, and is expressed as a double element having “:” as a separator.

2つ組み要素は、それぞれ、文節品詞と文節種であり、文節種は選択の意味をもつ”|”をセパレータとして1つ以上含むように設定されている。図16の抽出キー選出規則131は、第一要素の文節品詞をもち、かつ第二要素のいずれかの文節種をもつ文節を抽出キーとする規則を意味する。   Each of the two elements is a phrase part of speech and a phrase type, and the phrase type is set to include one or more “|” having a selection meaning as a separator. The extraction key selection rule 131 in FIG. 16 means a rule that uses a phrase having the phrase part of speech of the first element and any of the phrase types of the second element as the extraction key.

例えば、図16の一行目の規則は、文節品詞が用言性であり、文節種が、文末、読点、係り、又は切断である文節が抽出キーとなる規則を表している。抽出キー選択手段531は、図15に示す言語情報に対し、図16の一行目に示す抽出キー選出規則を用いて抽出キーを選出すると、文節4、文節7、文節10、および文節11が抽出キーとして選出する。   For example, the rule on the first line in FIG. 16 represents a rule in which a phrase whose part of speech is a predicate and a phrase whose phrase type is a sentence end, a punctuation mark, a relation, or a cut is an extraction key. When the extraction key selection unit 531 selects an extraction key for the language information shown in FIG. 15 using the extraction key selection rule shown in the first line of FIG. 16, the phrase 4, the phrase 7, the phrase 10, and the phrase 11 are extracted. Elect as key.

なお、抽出された抽出キーそれ自体が1つの拡張構造要素となる。本実施例では、拡張規則132に基づき抽出した文節を拡張構造要素(ここでは抽出キー。抽出キーに文節が追加された後は抽出キーと文節)に追加していくことで拡張構造要素を生成する。   The extracted key itself becomes one extended structural element. In this embodiment, the clause extracted based on the extension rule 132 is added to the extension structure element (here, the extraction key. After the clause is added to the extraction key, the extension structure element is generated). To do.

(ii)文章から文節を抽出する拡張構造要素の生成
本実施例では、拡張構造要素生成処理(S30)において、抽出キーである文節より文書内位置が前である文節を対象として生成処理を行う処理を「前方拡張」、逆に抽出キーより文書内位置が後ろである文節を対象として生成処理を行う処理を「後方拡張」と称し、拡張規則132としては前方拡張と後方拡張とで別のものを用いる。抽出された拡張構造要素は適切な形式で拡張構造要素記憶手段130に記憶される。
(Ii) Generation of Extended Structure Element for Extracting Phrase from Sentence In this embodiment, in the extended structure element generation process (S30), generation processing is performed for a phrase whose position in the document is before the phrase that is the extraction key. Processing is called “forward extension”, and conversely, processing that performs generation processing for a clause whose position in the document is behind the extraction key is called “backward extension”. Use things. The extracted extension structure element is stored in the extension structure element storage unit 130 in an appropriate format.

図17は拡張構造要素生成処理における前方拡張の拡張規則132(以下、前方拡張処理規則という)の一例を示す。図17の前方拡張処理規則において、1つの前方拡張処理規則は1つの括弧対内に記述されており、”:”をセパレータとする4つ組み要素として表現されている。各要素は、それぞれ順に、文節品詞、抽出キーからの係り受け深さ、および2つの、文節品詞であり、文節品詞は選択の意味をもつ”|”をセパレータとして1つ以上設定されている。   FIG. 17 shows an example of an extension rule 132 for forward extension (hereinafter referred to as a forward extension process rule) in the extension structure element generation process. In the forward extension processing rule of FIG. 17, one forward extension processing rule is described in one parenthesis pair, and is expressed as a quadruple element having “:” as a separator. Each element is a phrase part of speech, a dependency depth from the extraction key, and two phrase parts of speech, respectively. One or more of the phrase parts of speech are set with “|” having a selection meaning as a separator.

前方拡張処理規則又は後方拡張処理は、処理の対象となる文節を拡張構造文節として処理を行う。前方拡張処理規則に基づいて、前方拡張処理手段532が拡張構造要素を生成する処理を図18のフローチャート図に基づき説明する。
・まず抽出キーを拡張構造文節として、拡張対象文節が第一要素に示される文節品詞である前方拡張処理を抽出する(S11)。
・抽出した前方拡張処理の第二要素が、抽出キーからの係り深さであるか否かを判定する(S12)。
・次いで、抽出キーに”係り”の文節種をもつ文節が第三要素に示されるいずれかの文節品詞であるか否かを判定する(S13)。
・抽出キーに”係り”の文節種をもつ文節が第三要素にある場合、当該文節を拡張構造要素に追加する(S14)。
・また、当該文節の文節品詞が第四要素に示されるいずれかの文節品詞であるか否かを判定し(S15)、第四要素のいずれかの文節品詞である場合、当該文節を拡張対象文節として、前方拡張処理規則に従い同様の処理を行う(S16)。
In the forward extension processing rule or the backward extension process, the clause to be processed is processed as an extended structure clause. A process in which the forward extension processing means 532 generates the extension structure element based on the forward extension processing rule will be described with reference to the flowchart of FIG.
First, using the extracted key as an extended structure clause, a forward extension process in which the extension target clause is the phrase part of speech indicated in the first element is extracted (S11).
It is determined whether or not the extracted second element of the forward extension process is the engagement depth from the extraction key (S12).
Next, it is determined whether or not the phrase having the phrase type “involved” as the extraction key is any of the phrase parts of speech indicated in the third element (S13).
If the third element has a phrase having the phrase type “Relationship” in the extraction key, the phrase is added to the extended structure element (S14).
-Also, it is determined whether or not the phrase part of speech of the clause is any of the clause parts of speech shown in the fourth element (S15). If it is any of the clause parts of speech of the fourth element, the clause is expanded As a phrase, the same processing is performed according to the forward extension processing rule (S16).

ただし、図17に示す前方拡張処理規則の第二要素において、抽出キーからの係り深さが「0」の場合、明示されないすべての係り深さ(すなわち、一行目と二行目で明示されている「0」「1」以外の全て)を代表するものとする。   However, in the second element of the forward extension processing rule shown in FIG. 17, when the engagement depth from the extraction key is “0”, all the engagement depths that are not specified (that is, specified in the first and second lines). All other than “0” and “1”).

例えば、図17に示す一行目の規則は、抽出キー又は抽出キーから深さ1以外の拡張対象文節の文節品詞が用言性である場合であって、その文節に”係り”の文節種をもつ文節が用言性、サ変性、形容性、副詞性、もしくは体言性である場合、その文節を拡張構造要素に追加し、さらに用言性、サ変性、もしくは形容性の場合はその文節を拡張対象文節とする、規則を示す。また二行目に示す規則は、 抽出キーから深さ1の拡張対象文節の文節品詞が用言性である場合、その文節に”係り”の文節種をもつ文節が用言性、サ変性、形容性、副詞性、もしくは体言性である場合、その文節を拡張構造要素に追加し、さらに用言性、サ変性、形容性、もしくは体言性の場合はその文節を拡張対象文節とする規則を示している。   For example, the rule on the first line shown in FIG. 17 is the case where the phrase part of speech of the extension target phrase other than depth 1 from the extraction key or the extraction key is a predicate, and the phrase type of “relation” is assigned to the phrase. If the clause has a idiom, submorphism, adjective, adverbial, or verbal, add that clause to the extension structure element, and if the clause has a idiom, submodification, or adjective, add the clause Indicates a rule that is an expansion target clause. Also, the rule shown on the second line is that if the clause part of speech of the extension target clause with a depth of 1 from the extraction key is a predicate, the clause with the clause type of “related” in the clause is a predicate, If it is adjective, adverbial, or episodic, add the clause to the extended structure element, and if it is a prescriptive, subdenaturing, adjective, or syntactic, make the clause a clause to be expanded Show.

図15に示す言語情報と図16の抽出キー選出規則131により選出した抽出キーとして文節4とを用い、図17に示す前方拡張規則に基づき拡張構造要素を生成する処理について説明する。まず、図15から文節4の文節品詞は用言性であることがわかり、文節4は抽出キーであるので前方拡張規則は図17の一行目の規則が選択される。次に、図15より、文節4に”係り”の関係をもつ文節は文節3と文節2であり、また文節2と文節3の文節品詞はそれぞれ体言性と副詞性であることがわかる。選択した拡張規則の第3要素をみると、体言性および副詞性ともに要素に存在するため、文節2と文節3とも拡張構造要素として追加する。さらに、前方拡張処理規則の第4要素に体言性があるため、体言性文節の文節2は拡張対象文節となる。   A process of generating an extended structural element based on the forward extension rule shown in FIG. 17 using the language information shown in FIG. 15 and the phrase 4 as the extraction key selected by the extraction key selection rule 131 of FIG. 16 will be described. First, it can be seen from FIG. 15 that the phrase part-of-speech of the phrase 4 is a predicate, and since the phrase 4 is an extraction key, the rule on the first line in FIG. 17 is selected as the forward extension rule. Next, it can be seen from FIG. 15 that the clauses having the relationship “related” to the clause 4 are the clause 3 and the clause 2, and the phrase part of speech of the clause 2 and the clause 3 are the verbal and adverbial properties, respectively. Looking at the third element of the selected extension rule, both the verbality and adverbity are present in the element, so both the phrase 2 and the phrase 3 are added as extension structure elements. Furthermore, since the fourth element of the forward extension process rule has an episodic character, clause 2 of the episodic clause is an extension target clause.

文節2は文節品詞が体言性であり、抽出キーからの係り深さは1であるので、前方拡張処理規則は図17の11行目の規則が選択される。図15から、文節2に”係り”の関係をもつ文節は文節1であり、また文節1の文節品詞は形容性であることがわかるので、選択した前方拡張処理規則の第3要素に形容性が存在するため、文節1も拡張構造要素に追加する。また、第4要素にも形容性が存在するため、文節1は拡張対象文節になる。   Since the phrase 2 has a verbal part of speech and the depth of engagement from the extracted key is 1, the forward extension processing rule is selected as the 11th line rule in FIG. From FIG. 15, it can be seen that the phrase having the relationship “related” to the phrase 2 is the phrase 1, and the phrase part of speech of the phrase 1 is adjective. Therefore, the adjective is added to the third element of the selected forward extension processing rule. Therefore, clause 1 is also added to the extended structure element. Moreover, since the fourth element also has a description, clause 1 becomes an extension target clause.

文節1は文節品詞が形容性であり、抽出キーからの係り深さは2であるので、前方拡張処理規則は図17の七行目の規則が選択されるが、図15より文節1に“係り”の関係をもつ文節は存在しないため処理は終了し、結果として文節1、文節2、文節3、および文節4からなる拡張構造要素が抽出される。   Since phrase 1 has an adjective phrase part-of-speech and the depth of engagement from the extraction key is 2, the forward extension processing rule is selected as the rule on the seventh line in FIG. 17, but from FIG. Since there is no clause having a relationship of “relation”, the processing is ended, and as a result, an extended structural element including the clause 1, the clause 2, the clause 3, and the clause 4 is extracted.

同様にして、図15に示す言語情報と、図16の抽出キー選出規則に基づき選出した抽出キーを用いて、図17に示す前方拡張処理規則に基づき拡張構造要素を生成した結果を図19に示す。ただし、図19において、1つの拡張構造要素は、1つの括弧対内に記述されており、“:”をセパレータとする1つ以上の文節情報からなる。また、各文節情報は“、”をセパレータとする2つ組要素であり、第一要素が文節番号、第二要素が抽出キーからの係り深さを示す。図19では、文節4、7、11及び13を抽出キーとして、各抽出キーより前方にある(文節番号の若い)文節が拡張構造要素として追加されている。なお、図19では、文節品詞と文節種とが拡張構造要素に含まれていないが、図15の言語情報を参照すれば、拡張構造要素に文節品詞と文節種を含めることができる(図21において同じ)。   Similarly, FIG. 19 shows the result of generating an extended structural element based on the forward extension processing rule shown in FIG. 17 using the language information shown in FIG. 15 and the extracted key selected based on the extracted key selection rule in FIG. Show. However, in FIG. 19, one extended structural element is described in one pair of parentheses, and consists of one or more pieces of clause information with “:” as a separator. Each phrase information is a double element with “,” as a separator. The first element indicates the phrase number, and the second element indicates the depth of engagement from the extraction key. In FIG. 19, clauses 4, 7, 11 and 13 are extracted keys, and a clause ahead of each extraction key (with a younger clause number) is added as an extended structural element. In FIG. 19, the phrase part of speech and the phrase type are not included in the extended structural element. However, referring to the language information in FIG. 15, the extended structural element can include the phrase part of speech and the phrase type (FIG. 21). The same).

続いて、後方拡張処理について説明する。図20は拡張構造要素生成処理における拡張規則(以下、後方拡張処理規則という)132の一例である。図20において、1つの後方拡張処理規則は、1つの括弧対内に記述されている。なお、第三、第四要素の文節品詞が文字列”無”の場合、候補品詞がないこと、すなわち、拡張構造要素に追加を行わないことを示すものとする。   Subsequently, the backward expansion process will be described. FIG. 20 shows an example of an extension rule (hereinafter referred to as a backward extension process rule) 132 in the extension structure element generation process. In FIG. 20, one backward extension processing rule is described in one parenthesis pair. When the phrase part-of-speech of the third and fourth elements is the character string “none”, it indicates that there is no candidate part-of-speech, that is, no addition is made to the extended structural element.

後方拡張処理手段533が行う後方拡張処理について、図21のフローチャート図に基づき説明する。
・まず抽出キーを拡張対象文節として、拡張対象文節が第一要素に示される文節品詞である後方拡張処理規則を抽出する(S21)。
・抽出した後方拡張処理規則の第二要素が、抽出キーからの係り深さであるか否かを判定する(S22)。
・ついで、拡張対象文節が“係り”の文節種を有するか否かを判定する(S23)。
・ついで、拡張対象文節の係り先文節が第三要素に示されるいずれかの文節品詞であるか否かを判定する(S24)。
・拡張対象文節の係り先文節が第三要素のいずれかの文節品詞である場合、係り先文節を拡張構造要素に追加する(S25)。
・また係り先文節の文節品詞が第四要素に示されるいずれかの文節品詞であるか否かを判定し(S26)、係り先文節の文節品詞が第四要素のいずれかの文節品詞である場合、係り先文節を拡張対象文節として、後方拡張処理を繰り返す(S27)。
The backward extension process performed by the backward extension processing unit 533 will be described with reference to the flowchart of FIG.
First, using the extraction key as an extension target clause, a backward extension processing rule in which the extension target clause is the phrase part of speech indicated in the first element is extracted (S21).
It is determined whether or not the extracted second element of the backward extension processing rule is the engagement depth from the extraction key (S22).
Next, it is determined whether or not the expansion target clause has a clause type of “relation” (S23).
Next, it is determined whether or not the destination clause of the clause to be expanded is any of the clause parts of speech indicated in the third element (S24).
When the dependency clause of the extension target clause is any of the phrase parts of speech of the third element, the dependency clause is added to the extension structure element (S25).
It is also determined whether or not the phrase part of speech of the dependency clause is any of the phrase parts of speech indicated in the fourth element (S26), and the phrase part of speech of the dependency clause is any of the phrase parts of speech of the fourth element In this case, the backward extension process is repeated with the dependency clause as the extension target clause (S27).

例えば、図20に示す二行目の規則によれば、抽出キーの文節種が“係り”で、文節品詞が用言性である場合であってその文節の係り先文節が体言性である場合、その文節を拡張構造要素に追加し、さらに追加した文節を拡張対象文節とする。また、一行目に示す規則は、抽出キーではない拡張対象文節の文節種が“係り”で、文節品詞が用言性である場合、拡張処理は行わない規則を示している。   For example, according to the rule on the second line shown in FIG. 20, when the phrase type of the extraction key is “relation”, the phrase part of speech is a predicate, and the dependency clause of the phrase is a discourse The clause is added to the extension structure element, and the added clause is set as the extension target clause. Further, the rule shown in the first line indicates a rule that does not perform the extension process when the phrase type of the expansion target phrase that is not the extraction key is “relation” and the phrase part of speech is a predicate.

図19のように生成された拡張構造要素に、図20に示す後方拡張処理規則に基づき拡張構造要素を追加する処理について説明する。なお、拡張構造要素の前方拡張処理と後方拡張処理の実行順序により、生成される拡張構造要素に影響はない。したがって、本実施例とは逆に、先に後方拡張処理を実行し、その結果に対し前方拡張処理を実行してもよいし、用途によっては前方拡張処理と後方拡張処理のいずれかひとつのみを実行してもよい。   A process for adding an extension structure element to the extension structure element generated as shown in FIG. 19 based on the backward extension process rule shown in FIG. 20 will be described. Note that the extension structure element to be generated is not affected by the execution order of the extension extension element forward extension process and the backward extension process. Therefore, contrary to the present embodiment, the backward extension process may be executed first, and the forward extension process may be executed on the result, or only one of the forward extension process and the backward extension process may be performed depending on the application. May be executed.

図19において一行目の拡張構造要素の抽出キーは文節4であり、文節4は文節情報が係りでない。また、二行目の拡張構造要素の抽出キーは文節7であり、文節7は文節情報が係りでない。また、三行目の拡張構造要素の抽出キーは文節10であり、文節10は係り先の文節11の文節情報が体言性でない。また、五行目の拡張構造要素の抽出キーは文節13であり、文節13の文節情報は係りでない。したがって、図19の一行目、二行目、三行目及び五行目については後方拡張処理により拡張構造要素に追加されない。   In FIG. 19, the extraction key of the extended structural element on the first line is clause 4, and clause 4 is not related to clause information. Also, the extraction key of the extended structural element on the second line is the phrase 7, and the phrase 7 is not related to the phrase information. In addition, the extraction key of the extended structural element on the third line is the phrase 10, and the phrase information of the phrase 11 that is the relation destination of the phrase 10 is not syntactic. Further, the extraction key of the extended structure element on the fifth line is the phrase 13, and the phrase information of the phrase 13 is not relevant. Accordingly, the first, second, third, and fifth lines in FIG. 19 are not added to the expansion structure element by the backward expansion process.

四行目の拡張構造要素の抽出キーは文節11であり、図15より文節種は“係り”、文節品詞は用言性であることがわかるので、後方拡張処理規則は図20の二行目の規則が選択される。次に、図15より文節11の係り先文節は文節12であり、また文節12の文節品詞は体言性であることがわかるので、選択した後方拡張処理規則の第3要素をみると、体言性が存在するため、文節12を拡張構造要素として追加する。さらに、拡張規則の第4要素により体言性文節である文節12は拡張対象文節となる。   The extraction key of the extended structural element on the fourth line is the phrase 11, and from FIG. 15, it can be seen that the phrase type is “related” and the phrase part of speech is a predicate, so the backward extension processing rule is the second line in FIG. 20. Rules are selected. Next, it can be seen from FIG. 15 that the dependency clause of the clause 11 is the clause 12 and the clause part of speech of the clause 12 is episodic, so when looking at the third element of the selected backward extension processing rule, Therefore, the clause 12 is added as an extended structural element. Furthermore, the phrase 12 which is a body phrase according to the fourth element of the extension rule becomes the extension target phrase.

次に、文節12は文節品詞が体言性なので、後方拡張処理規則は図20の九行目の規則が選択される。図15より文節12の文節種は”係り”であり係り先文節は文節13であることがわかる。さらに、図15より文節13の文節品詞は形容性であるが、選択した後方拡張処理規則の第3要素に形容性は存在しないため、処理を終了し、結果として拡張構造要素には文節12が追加される。   Next, the phrase 12 has a phrase part-of-speech, so the backward expansion process rule is selected from the rule on the ninth line in FIG. From FIG. 15, it can be seen that the phrase type of the phrase 12 is “relation” and the relation destination phrase is the phrase 13. Further, from FIG. 15, the phrase part of speech of the phrase 13 is adjective, but since the adjective is not present in the third element of the selected backward extension processing rule, the processing is ended, and as a result, the phrase 12 is included in the extended structure element. Added.

図22は、図19に示す拡張構造要素に対し、後方拡張処理規則に基づき生成した拡張構造要素を示す。表現形式は、図19の拡張構造要素と同一である。   FIG. 22 shows an extension structure element generated based on the backward extension processing rule with respect to the extension structure element shown in FIG. The expression format is the same as the extended structural element in FIG.

図23は、図21に示す拡張構造要素を文章Sの文字により表示した拡張構造要素を示す。図23によれば、抽出した拡張構造要素は、網羅的であり、かつ、冗長性の小さくなるように抽出できていることがわかる。   FIG. 23 shows an extended structural element in which the extended structural element shown in FIG. According to FIG. 23, it can be seen that the extracted extended structural elements are exhaustive and can be extracted so as to reduce redundancy.

したがって、拡張構造要素の抽出キーの選出規則を設け、また、拡張構造要素となる文節を選出する際の拡張規則132を設けたことで、網羅的かつ冗長性の小さい拡張構造要素を生成できる。   Therefore, by providing an extraction key selection rule for an extension structure element and providing an extension rule 132 for selecting a clause to be an extension structure element, an extension structure element with comprehensive and low redundancy can be generated.

〔情報抽出プログラム及びその記録媒体〕
これまで説明した情報抽出方法を実現するプログラム(以下、情報抽出プログラムという)及びその記録媒体について説明する。なお、情報抽出プログラムを実行するコンピュータのハードウェア構成図は図13と同様であるので説明を省略する。
[Information extraction program and its recording medium]
A program for realizing the information extraction method described so far (hereinafter referred to as an information extraction program) and its recording medium will be described. The hardware configuration diagram of the computer that executes the information extraction program is the same as that in FIG.

情報抽出プログラムは、図1の文書登録手段31、言語情報取得手段32、拡張構造要素生成手段530、出力手段35、の各手段をコンピュータに実行させる。一例としては、図18、21で説明したフローチャート図の処理を所定のプログラム言語でコード化し、コンパイルなどされたものである。   The information extraction program causes the computer to execute each unit of the document registration unit 31, the language information acquisition unit 32, the extended structural element generation unit 530, and the output unit 35 of FIG. As an example, the processes in the flowcharts described with reference to FIGS. 18 and 21 are coded in a predetermined program language and compiled.

情報抽出プログラムは、例えばDVD−ROM等の記録媒体20やネットワークを介して提供される。情報抽出プログラムを記録した記録媒体20は、ドライブ装置23にセットされ、記憶装置26にインストールされる。   The information extraction program is provided via a recording medium 20 such as a DVD-ROM or a network. The recording medium 20 on which the information extraction program is recorded is set in the drive device 23 and installed in the storage device 26.

なお、情報抽出プログラムを記録した記憶媒体20は、CD−ROM、DVD−ROM、フレキシブルディスク、光磁気ディスク(MO)等のように、情報を光学的、電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることが可能である。   The storage medium 20 on which the information extraction program is recorded is a recording medium that records information optically, electrically, or magnetically, such as a CD-ROM, DVD-ROM, flexible disk, magneto-optical disk (MO), or the like. Various types of recording media such as a semiconductor memory that electrically records information, such as a ROM and a flash memory, can be used.

以上説明したように、本実施例の情報抽出方法は、対象文書の分野が変わっても影響がなく、メンテナンスを要する制約のための辞書が不要である。また、ユーザは言語処理分野の専門的な知識を必要とせず、文書トピックの展開経緯を見つけ出すことが可能で、実用に即した文書情報を精度良く抽出できる。また、拡張構造要素の抽出キーの選出規則を設け、また、拡張構造要素となる文節を選出する際の拡張規則を設けたことで、網羅的かつ冗長性の小さい拡張構造要素を生成できる。   As described above, the information extraction method of the present embodiment has no effect even if the field of the target document changes, and does not require a dictionary for restrictions requiring maintenance. In addition, the user does not need specialized knowledge in the language processing field, can find out the development process of the document topic, and can extract document information suitable for practical use with high accuracy. Also, an extended structural element extraction key selection rule is provided, and an extended rule for selecting a clause to be the extended structural element is provided, so that an extended structural element with comprehensive and low redundancy can be generated.

情報抽出処理の全体の流れを示すフローチャート図である。It is a flowchart figure which shows the whole flow of an information extraction process. 言語情報取得結果の一例を示す図である。It is a figure which shows an example of a linguistic information acquisition result. 用言の拡張部分構造要素を抽出した抽出例である。It is the extraction example which extracted the extended partial structure element of the precaution. 体言の拡張部分構造要素を抽出した抽出例である。It is the extraction example which extracted the extended partial structure element of the word. 部分構造要素抽出処理のフローチャート図の一例である。It is an example of the flowchart figure of a partial structural element extraction process. 接続助詞又は接続詞について接続の意味、及び、意図表現が記載された辞書である。It is a dictionary in which connection meanings and intention expressions are described for connection particles or conjunctions. 深さ情報の指定がある部分構造要素抽出処理のフローチャート図の一例である。It is an example of the flowchart figure of the partial structural element extraction process with designation | designated depth information. 深さ情報の指定がある場合の拡張部分構造要素を抽出した抽出例である。It is the extraction example which extracted the extended substructure element in case there is specification of depth information. 図3又は4の部分構造要素拡張抽出結果から深さn=2までの部分構造データを生成した生成結果例である。FIG. 5 is a generation result example in which partial structure data from a partial structure element extension extraction result of FIG. 3 or 4 to a depth n = 2 is generated. 抽出キーとその他の自立語を区別せず、単語表記と拡張要素を保持した部分構造データである。This is partial structure data that retains word notation and extension elements without distinguishing the extracted key from other independent words. 図8の部分構造要素拡張抽出結果から深さn=2までの部分構造データを生成した生成結果例である。FIG. 9 is a generation result example in which partial structure data from a partial structure element extension extraction result of FIG. 8 to a depth n = 2 is generated. 抽出キーとその他の自立語を区別せず、単語表記と拡張要素を保持した部分構造データである。This is partial structure data that retains word notation and extension elements without distinguishing the extracted key from other independent words. 情報抽出プログラムを実行するコンピュータのハードウェア構成図の一例である。It is an example of the hardware block diagram of the computer which performs an information extraction program. 実施例2の情報抽出処理の手順の一例を示すフローチャート図である。FIG. 10 is a flowchart illustrating an example of a procedure of information extraction processing according to the second embodiment. 文章の言語解析の結果得られる言語情報の一例である。It is an example of the linguistic information obtained as a result of the linguistic analysis of a sentence. 抽出キー選出規則の一例である。It is an example of an extraction key selection rule. 拡張規則(前方拡張処理規則)の一例である。It is an example of an extension rule (forward extension process rule). 前方拡張処理手段が拡張構造要素を生成する処理の手順を示すフローチャート図の一例である。It is an example of the flowchart figure which shows the procedure of the process which a front expansion process means produces | generates an expansion structure element. 前方拡張処理規則に基づき生成した拡張構造要素の一例である。It is an example of the extension structure element produced | generated based on the forward extension process rule. 拡張規則(後方拡張処理規則)の一例である。It is an example of an extension rule (backward extension process rule). 後方拡張処理手段が拡張構造要素を生成する処理の手順を示すフローチャート図の一例である。It is an example of the flowchart figure which shows the procedure of the process which a back extension process means produces | generates an expansion structure element. 後方拡張処理規則に基づき生成した拡張構造要素の一例である。It is an example of the extension structural element produced | generated based on the back extension process rule. 図21の拡張構造要素を文章の文字により表示した拡張構造要素である。FIG. 22 is an extended structural element in which the extended structural element in FIG. 21 is displayed with text characters.

符号の説明Explanation of symbols

11 文書記憶手段
12 言語情報記憶手段
13 部分構造要素記憶手段
14 部分構造データ記憶手段
31 文書登録手段
32 言語情報取得結果
33 部分構造要素拡張抽出手段
34 部分構造データ生成手段
35 出力手段
131 抽出キー選出規則
132 拡張規則
330 深さ情報取得手段
331 抽出キー選択手段
332 自立語取得手段
333 深さ情報加算手段
334 深さ情報指定手段
530 拡張構造要素生成手段
531 抽出キー選出手段
532 前方拡張処理手段
533 後方拡張処理手段
DESCRIPTION OF SYMBOLS 11 Document storage means 12 Language information storage means 13 Partial structure element storage means 14 Partial structure data storage means 31 Document registration means 32 Language information acquisition result 33 Partial structure element expansion extraction means 34 Partial structure data generation means 35 Output means 131 Extraction key selection Rule 132 Extended rule 330 Depth information acquisition means 331 Extraction key selection means 332 Autonomous word acquisition means 333 Depth information addition means 334 Depth information designation means 530 Extended structure element generation means 531 Extraction key selection means 532 Forward extension processing means 533 Back Extended processing means

Claims (38)

文書の情報を抽出する情報抽出方法において、
自立語の係り受け関係を取得する言語情報取得ステップと、
前記言語情報取得ステップにより該文書から取得された一の自立語と、他の自立語との係り受け関係の強さを表す深さ情報を取得する深さ情報取得ステップと、
前記深さ情報取得ステップにより取得した各自立語の深さ情報に基づき、前記一の自立語の、所定の値以上の深さ情報を有する自立語から成る部分構造データを生成する部分構造データ生成ステップと、
を有することを特徴とする情報抽出方法。
In an information extraction method for extracting document information,
A language information acquisition step for acquiring a dependency relationship of independent words;
A depth information acquisition step of acquiring depth information indicating the strength of the dependency relationship between one independent word acquired from the document and the other independent words by the language information acquisition step;
Partial structure data generation for generating partial structure data composed of independent words having depth information greater than or equal to a predetermined value of the one independent word based on the depth information of each independent word acquired in the depth information acquisition step Steps,
An information extraction method characterized by comprising:
前記言語情報取得ステップは、係り元の自立語毎に係り先の自立語を取得し、
前記深さ情報取得ステップは、
前記自立語のうち所定の用言を抽出キーに選択する抽出キー選択ステップと
選択された抽出キーが係り先となっている自立語を取得して、該自立語に初期値の深さ情報を付与する自立語取得ステップと、
取得された自立語が係り先となっている係り先自立語を取得して、該係り先自立語の深さ情報として、前記取得された自立語の深さ情報の値に所定値加算した値を付与する深さ情報加算ステップと、
を有することを特徴とする請求項1記載の情報抽出方法。
The linguistic information acquisition step acquires the independent word of the destination for each independent word of the source,
The depth information acquisition step includes:
An extraction key selection step for selecting a predetermined word out of the independent words as an extraction key and an independent word on which the selected extraction key is related are acquired, and initial value depth information is acquired in the independent word. An independent word acquisition step to be given;
A value obtained by acquiring a dependency independent word whose dependency is the acquired independent word and adding a predetermined value to the value of the acquired independent word depth information as depth information of the dependency independent word A depth information adding step for providing
The information extracting method according to claim 1, further comprising:
前記言語情報取得ステップは、係り元の自立語毎に係り先の自立語を取得し、
前記深さ情報取得ステップは、
前記自立語のうち所定の体言を抽出キーに選択する抽出キー選択ステップと
選択された抽出キーが係り先となっている自立語を取得して、該自立語に初期値の深さ情報を付与する自立語取得ステップと、
取得された自立語が係り先となっている係り先自立語を取得して、該係り先自立語の深さ情報として、前記取得された自立語の深さ情報の値に所定値加算した値を付与する深さ情報加算ステップと、
を有することを特徴とする請求項1記載の情報抽出方法。
The linguistic information acquisition step acquires the independent word of the destination for each independent word of the source,
The depth information acquisition step includes:
An extraction key selection step for selecting a predetermined word from the independent words as an extraction key, and obtaining an independent word on which the selected extraction key is related, and giving initial value depth information to the independent word An independent word acquisition step,
A value obtained by acquiring a dependency independent word whose dependency is the acquired independent word and adding a predetermined value to the value of the acquired independent word depth information as depth information of the dependency independent word A depth information adding step for providing
The information extracting method according to claim 1, further comprising:
前記深さ情報取得ステップは、深さ情報の値を指定する深さ情報指定ステップを有し、
深さ情報の値が前記深さ情報指定ステップにより指定された値以下の深さ情報の自立語を取得する、
ことを特徴とする請求項2又は3記載の情報抽出方法。
The depth information acquisition step includes a depth information designation step for designating a value of depth information,
Obtaining an independent word of depth information whose depth information value is less than or equal to the value specified by the depth information specifying step;
The information extraction method according to claim 2 or 3, wherein
接続助詞又は接続助詞が記載された接続詞/接続助詞辞書を有し、
前記深さ情報取得ステップは、
前記取得された自立語が含まれる文節が有する接続詞又は接続助詞に基づき、前記接続詞/接続助詞辞書を参照し、当該接続詞又は接続助詞の接続の意味を抽出し、
次いで、抽出された接続の意味を、前記取得された自立語の拡張要素に付加する、
ことを特徴とする請求項2ないし4いずれか記載の情報抽出方法。
Conjunctive particle or Conjunctive particle / conjunctive particle dictionary with connection particle described
The depth information acquisition step includes:
Based on the conjunction or connective particle that the clause containing the acquired independent word has, refer to the conjunction / connective particle dictionary, and extract the connection meaning of the conjunction or connective particle,
Then, the meaning of the extracted connection is added to the obtained independent word extension element.
The information extracting method according to claim 2, wherein the information extracting method is an information extracting method.
意図を表す表現を記載した意図表現辞書を有し、
前記深さ情報取得ステップは、
前記取得された自立語が含まれる文節が有する意図表現に基づき、前記意図表現辞書を参照し、当該意図表現の意味を抽出し、
次いで、抽出された意図表現の意味を、前記取得された自立語の拡張要素に付加する、
ことを特徴とする請求項2ないし4いずれか記載の情報抽出方法。
It has an intention expression dictionary describing expressions expressing intentions,
The depth information acquisition step includes:
Based on the intention expression that the clause containing the acquired independent word has, refer to the intention expression dictionary, extract the meaning of the intention expression,
Then, the meaning of the extracted intention expression is added to the obtained independent word extension element.
The information extracting method according to claim 2, wherein the information extracting method is an information extracting method.
前記深さ情報取得ステップは、
前記取得された自立語が、一文中の最後尾の文節に含まれていた場合には、当該自立語の拡張要素に文末であることの表記を付加する、
ことを特徴とする請求項3記載の情報抽出方法。
The depth information acquisition step includes:
When the acquired independent word is included in the last clause in one sentence, a notation that the sentence is at the end is added to the extended element of the independent word.
The information extraction method according to claim 3, wherein:
前記部分構造データ生成ステップは、
前記深さ情報取得ステップにより取得した自立語が前記抽出キーを修飾する関係を示す修飾関係と、前記取得された自立語の拡張要素に付加されている接続の意味、意図表現の意味又は文末の表記と、
を前記取得された自立語と関連付けて、部分構造データとして生成する、
ことを特徴とする請求項1記載の情報抽出方法。
The partial structure data generation step includes:
The modification relationship indicating the relationship in which the independent word acquired by the depth information acquisition step modifies the extraction key, the meaning of the connection added to the extended element of the acquired independent word, the meaning of the intention expression, or the end of the sentence Notation and
Is generated as partial structure data in association with the acquired independent word,
The information extraction method according to claim 1, wherein:
文書の情報を抽出する情報抽出装置において、
自立語の係り受け関係を取得する言語情報取得手段と、
前記言語情報取得手段により該文書から取得された一の自立語と、他の自立語との係り受け関係の強さを表す深さ情報を取得する深さ情報取得手段と、
前記深さ情報取得手段により取得した各自立語の深さ情報に基づき、前記一の自立語の、所定の値以上の深さ情報を有する自立語から成る部分構造データを生成する部分構造データ生成手段と、
を有することを特徴とする情報抽出装置。
In an information extraction device for extracting document information,
Language information acquisition means for acquiring dependency relations of independent words;
Depth information acquisition means for acquiring depth information indicating the strength of the dependency relationship between one independent word acquired from the document by the language information acquisition means and another independent word;
Partial structure data generation for generating partial structure data composed of independent words having depth information of a predetermined value or more of the one independent word based on the depth information of each independent word acquired by the depth information acquisition means Means,
An information extraction apparatus comprising:
前記言語情報取得手段は、係り元の自立語毎に係り先の自立語を取得し、
前記深さ情報取得手段は、
前記自立語のうち所定の用言を抽出キーに選択する抽出キー選択手段と
選択された抽出キーが係り先となっている自立語を取得して、該自立語に初期値の深さ情報を付与する自立語取得手段と、
取得された自立語が係り先となっている係り先自立語を取得して、該係り先自立語の深さ情報として、前記取得された自立語の深さ情報の値に所定値加算した値を付与する深さ情報加算手段と、
を有することを特徴とする請求項9記載の情報抽出装置。
The linguistic information acquisition means acquires the independent word of the destination for each independent word of the source,
The depth information acquisition means includes
An extraction key selection means for selecting a predetermined word out of the independent words as an extraction key and an independent word on which the selected extraction key is related are acquired, and initial depth information is stored in the independent word. An independent word acquisition means to be given;
A value obtained by acquiring a dependency independent word whose dependency is the acquired independent word and adding a predetermined value to the value of the acquired independent word depth information as depth information of the dependency independent word Depth information adding means for providing
10. The information extraction device according to claim 9, further comprising:
前記言語情報取得手段は、係り元の自立語毎に係り先の自立語を取得し、
前記深さ情報取得手段は、
前記自立語のうち所定の体言を抽出キーに選択する抽出キー選択手段と
選択された抽出キーが係り先となっている係り先自立語を取得して、該自立語に初期値の深さ情報を付与する自立語取得手段と、
取得された自立語が係り先となっている係り先自立語を取得して、該係り先自立語の深さ情報として、前記取得された自立語の深さ情報の値に所定値加算した値を付与する深さ情報加算手段と、
を有することを特徴とする請求項9記載の情報抽出装置。
The linguistic information acquisition means acquires the independent word of the destination for each independent word of the source,
The depth information acquisition means includes
An extraction key selection means for selecting a predetermined body language as an extraction key from the independent words and a dependency independent word having the selected extraction key as a dependency, and obtaining depth information of an initial value in the independent word An independent word acquisition means for providing
A value obtained by acquiring a dependency independent word whose dependency is the acquired independent word and adding a predetermined value to the value of the acquired independent word depth information as depth information of the dependency independent word Depth information adding means for providing
10. The information extraction device according to claim 9, further comprising:
前記深さ情報取得手段は、深さ情報の値を指定する深さ情報指定手段を有し、
深さ情報の値が前記深さ情報指定手段により指定された値以下の深さ情報の自立語を取得する、
ことを特徴とする請求項10又は11記載の情報抽出装置。
The depth information acquisition means includes depth information designation means for designating a value of depth information,
Obtaining an independent word of depth information whose depth information value is equal to or less than the value specified by the depth information specifying means;
12. The information extraction apparatus according to claim 10 or 11, wherein
接続助詞又は接続助詞が記載された接続詞/接続助詞辞書を有し、
前記深さ情報取得手段は、
前記取得された自立語が含まれる文節が有する接続詞又は接続助詞に基づき、前記接続詞/接続助詞辞書を参照し、当該接続詞又は接続助詞の接続の意味を抽出し、
次いで、抽出された接続の意味を、前記取得された自立語の拡張要素に付加する、
ことを特徴とする請求項10ないし13いずれか記載の情報抽出装置。
Conjunctive particle or Conjunctive particle / conjunctive particle dictionary with connection particle described
The depth information acquisition means includes
Based on the conjunction or connective particle that the clause containing the acquired independent word has, refer to the conjunction / connective particle dictionary, and extract the connection meaning of the conjunction or connective particle,
Then, the meaning of the extracted connection is added to the obtained independent word extension element.
14. The information extraction device according to claim 10, wherein the information extraction device is a device.
意図を表す表現を記載した意図表現辞書を有し、
前記深さ情報取得手段は、
前記取得された自立語が含まれる文節が有する意図表現に基づき、前記意図表現辞書を参照し、当該意図表現の意味を抽出し、
次いで、抽出された意図表現の意味を、前記取得された自立語の拡張要素に付加する、
ことを特徴とする請求項10ないし13いずれか記載の情報抽出装置。
It has an intention expression dictionary describing expressions expressing intentions,
The depth information acquisition means includes
Based on the intention expression that the clause containing the acquired independent word has, refer to the intention expression dictionary, extract the meaning of the intention expression,
Then, the meaning of the extracted intention expression is added to the obtained independent word extension element.
14. The information extraction device according to claim 10, wherein the information extraction device is a device.
前記深さ情報取得手段は、
取得された自立語が、一文中の最後尾の文節に含まれていた場合には、当該自立語の拡張要素に文末であることの表記を付加する、
ことを特徴とする請求項11記載の情報抽出装置。
The depth information acquisition means includes
If the acquired independent word is included in the last sentence in a sentence, a notation that the sentence ends is added to the extended element of the independent word.
The information extraction apparatus according to claim 11, wherein
前記部分構造データ生成手段は、
前記深さ情報取得手段により取得した自立語が前記抽出キーを修飾する関係を示す修飾関係と、前記取得された自立語の拡張要素に付加されている接続の意味、意図表現の意味又は文末の表記と、
を前記取得された自立語と関連付けて、部分構造データとして生成する、
ことを特徴とする請求項9記載の情報抽出装置。
The partial structure data generating means
A modification relationship indicating a relationship in which the independent word acquired by the depth information acquisition unit modifies the extraction key, a meaning of connection added to an extension element of the acquired independent word, a meaning of intention expression, or a sentence end Notation and
Is generated as partial structure data in association with the acquired independent word,
The information extraction device according to claim 9.
請求項1ないし8記載の情報抽出方法をコンピュータに実行させる情報抽出プログラム。   An information extraction program for causing a computer to execute the information extraction method according to claim 1. 請求項17記載の情報抽出プログラムが記録された記録媒体。   A recording medium on which the information extraction program according to claim 17 is recorded. 文書の情報を抽出する情報抽出方法において、
自立語の係り受け関係、文節の品詞情報を示す文節品詞又は文節の分類情報を示す文節種を取得する言語情報取得ステップと、
前記文節品詞に対応づけて前記文節種を定めた抽出キー選出規則を参照して、抽出キーを選択する抽出キー選択ステップと、
前記文節品詞、及び、前記係り受け関係に基づいて定められた拡張規則を前記抽出キーに基づき参照し、前記拡張規則に適合する文節を前記文章から抽出して拡張構造要素を生成する拡張構造要素生成ステップと、
を有することを特徴とする情報抽出方法。
In an information extraction method for extracting document information,
A language information acquisition step of acquiring a dependency relation of independent words, a phrase part of speech indicating a part of speech information of a phrase or a phrase type indicating classification information of the phrase;
An extraction key selection step of selecting an extraction key with reference to an extraction key selection rule that defines the phrase type in association with the phrase part of speech;
An extended structural element that generates an extended structural element by referring to the extended rule defined based on the phrase part of speech and the dependency relationship based on the extraction key and extracting a clause that matches the extended rule from the sentence. Generation step;
An information extraction method characterized by comprising:
前記文節品詞は、用言性文節、体言性文節、サ変性文節、コピュラ文節、形容性文節、副詞性文節、連体性文節、接続性文節又は不定文節、のいずれかであり、
前記文節種は、文末、読点、係り、切断又は不定、のいずれか、
であることを特徴とする請求項19記載の情報抽出方法。
The phrase part-of-speech is one of a predicative clause, a verbal clause, a sacrificial clause, a copula clause, an adjective clause, an adverbial clause, a conjunctive clause, a connectivity clause, or an indefinite clause,
The phrase type is one of the following:
The information extraction method according to claim 19, wherein:
前記拡張構造要素は、
用言性文節、体言性文節、サ変性文節、コピュラ文節、形容性文節、副詞性文節、連体性文節、接続性文節、若しくは、不定文節、のいずれかの基本単位、又は、該基本単位の組み合わせにより構成される、
ことを特徴とする請求項19記載の情報抽出方法。
The extended structural element is
The basic unit of any of the predicative clauses, the verbal clauses, the samurai clauses, the copula clauses, the adjective clauses, the adverbial clauses, the conjunctive clauses, the connectivity clauses, or the indefinite clauses, or Composed of combinations,
20. The information extraction method according to claim 19, wherein:
前記基本単位の各文節は、読点、文末、係り無し、係り又は不定、のいずれか一つの文節種を有する、
ことを特徴とする請求項21記載の情報抽出方法。
Each clause of the basic unit has any one of the following phrase types: reading, end of sentence, unrelated, unrelated or undefined
The information extraction method according to claim 21, wherein:
前記抽出キー選択ステップは、
不定属性を持たない用言性文節、
不定属性を持たないサ変性文節、
コピュラ性文節、
文末、読点、および切断のいずれかの属性を有する形容性文節、
文末か切断の属性を有する副詞性文節、
文末か切断の属性を有する体言性文節、のいずれかを前記抽出キーとして選択する、
ことを特徴とする請求項19ないし22いずれか記載の情報抽出方法。
The extraction key selection step includes:
Predicate clauses that do not have indefinite attributes,
A modified clause that does not have indefinite attributes,
Copula clause,
An adjective clause with one of the following attributes:
Adverbial clauses with end-of-sentence or truncation attributes,
Selecting either the end of sentence or the narrative phrase having a cutting attribute as the extraction key,
23. The information extracting method according to claim 19, wherein the information extracting method is performed.
前記拡張構造要素生成ステップは、
前記抽出キー選択ステップにより選択された前記抽出キーを前記文章から文節を抽出するための拡張対象文節として、該拡張対象文節が、用言性文節、サ変性文節、コピュラ文節、形容性文節、又は副詞性文節、の場合、
当該拡張対象文節に対し係りの属性を有する、用言性文節、サ変性文節、形容性文節、体言性文節、又は、副詞性文節を該抽出キーに追加して拡張構造要素を生成する前方拡張処理ステップを有し、
前記前方拡張処理ステップにより追加される文節が、用言性文節、サ変性文節、形容性文節、又は、体言性文節の場合、当該文節を前記拡張対象文節として、更に前記前方拡張処理ステップを行う、
ことを特徴とする請求項19ないし23いずれか記載の情報抽出方法。
The extended structural element generation step includes:
Using the extracted key selected in the extraction key selection step as an extension target clause for extracting a clause from the sentence, the extension target clause is a prescriptive phrase, a samurai phrase, a copula phrase, an adjective phrase, or In the case of adverbial clauses,
Forward extension that generates an extended structure element by adding a predicative clause, a sacrificial clause, an adjective clause, an episodic clause, or an adverbial clause having an attribute related to the extension target clause to the extraction key Has processing steps,
If the clause added by the forward extension processing step is a prescriptive clause, a sacrificial clause, an adjective clause, or a verbal clause, the clause is set as the extension target clause, and the forward extension processing step is further performed. ,
24. The information extracting method according to claim 19, wherein the information extracting method is performed.
前記拡張構造要素生成ステップは、
前記抽出キー選択ステップにより選択された前記抽出キーを前記文章から文節を抽出するための拡張対象文節として、該拡張対象文節が体言性文節の場合、
当該拡張対象文節に対し係りの属性を有する、形容性文節、体言性文節又は副詞性文節、を該抽出キーに追加して拡張構造要素を生成する前方拡張処理ステップを有し、
前記前方拡張処理ステップにより追加される文節が、形容性文節又は体言性文節の場合、当該文節を前記拡張対象文節として、更に前記前方拡張処理ステップを行う、
ことを特徴とする請求項19ないし23いずれか記載の情報抽出方法。
The extended structural element generation step includes:
When the extraction key selected in the extraction key selection step is an expansion target clause for extracting a clause from the sentence, and when the expansion target clause is a body phrase,
A forward extension processing step of adding an adjective clause, a verbal clause or an adverbial clause having an attribute related to the extension target clause to generate an extended structural element by adding to the extraction key;
When the clause added by the forward extension processing step is an adjective clause or a verbal clause, the forward extension processing step is further performed with the clause as the extension target clause.
24. The information extracting method according to claim 19, wherein the information extracting method is performed.
前記拡張構造要素生成ステップは、
前記抽出キー選択ステップにより選択された前記抽出キーを前記文章から文節を抽出するための拡張対象文節として、該拡張対象文節が係りの属性を有する、用言性文節、サ変性文節、形容性文節又は副詞性文節、の場合であって、
当該拡張対象文節の係り先文節が、体言性文節の場合、前記抽出キーに係り先の文節を追加して拡張構造要素を生成する後方拡張処理ステップを有し、
前記後方拡張処理ステップにより追加される体言性文節が係りの属性を有する場合であって、追加される体言性文節の係り先文節が体言性文節の場合、当該文節を前記拡張対象文節として、更に前記後方拡張処理ステップを行う、
ことを特徴とする請求項19ないし23いずれか記載の情報抽出方法。
The extended structural element generation step includes:
The extraction key selected in the extraction key selection step is used as an expansion target clause for extracting a clause from the sentence, and the expansion target clause has a related attribute, a prescriptive phrase, a modified phrase, and an adjective phrase Or adverbial clauses,
If the destination clause of the extension target clause is a body clause, it has a backward extension processing step of generating an extension structure element by adding the destination clause to the extraction key,
In the case where the verbal clause added by the backward extension processing step has a dependency attribute, and the dependency clause of the added verbal clause is a verbal clause, the clause is further set as the extension target clause. Performing the backward extension processing step;
24. The information extracting method according to claim 19, wherein the information extracting method is performed.
前記拡張構造要素生成ステップは、
前記抽出キー選択ステップにより選択された前記抽出キーを前記文章から文節を抽出するための拡張対象文節として、該拡張対象文節が係りの属性を有する、体言性文節の場合であって、
当該拡張対象文節の係り先文節が、体言性文節又はコピュラ文節の場合、前記抽出キーに係り先の文節を追加して拡張構造要素を生成する後方拡張処理ステップを有し、
前記後方拡張処理ステップにより追加される体言性文節が係りの属性を有する場合であって、追加される体言性文節の係り先文節が体言性文節の場合、当該文節を前記拡張対象文節として、更に前記後方拡張処理ステップを行う、
ことを特徴とする請求項19ないし23いずれか記載の情報抽出方法。
The extended structural element generation step includes:
When the extracted key selected by the extraction key selection step is an expansion target clause for extracting a clause from the sentence, the expansion target clause has a related attribute,
If the destination clause of the extension target clause is a body clause or a copula clause, a backward extension processing step of generating an extension structure element by adding the clause of the destination to the extraction key;
In the case where the verbal clause added by the backward extension processing step has a dependency attribute, and the dependency clause of the added verbal clause is a verbal clause, the clause is further set as the extension target clause. Performing the backward extension processing step;
24. The information extracting method according to claim 19, wherein the information extracting method is performed.
文書の情報を抽出する情報抽出装置において、
自立語の係り受け関係、文節の品詞情報を示す文節品詞又は文節の分類情報を示す文節種を取得する言語情報取得手段と、
前記文節品詞に対応づけて前記文節種を定めた抽出キー選出規則を参照して、抽出キーを選択する抽出キー選択手段と、
前記文節品詞、及び、前記係り受け関係に基づいて定められた拡張規則を前記抽出キーに基づき参照し、前記拡張規則に適合する文節を前記文章から抽出して拡張構造要素を生成する拡張構造要素生成手段と、
を有することを特徴とする情報抽出装置。
In an information extraction device for extracting document information,
Language information acquisition means for acquiring dependency relations of independent words, phrase part of speech indicating the part of speech information of the phrase or phrase type indicating the classification information of the phrase;
An extraction key selection means for selecting an extraction key with reference to an extraction key selection rule that defines the phrase type in association with the phrase part of speech;
An extended structural element that generates an extended structural element by referring to the extended rule defined based on the phrase part of speech and the dependency relation based on the extraction key and extracting a clause that matches the extended rule from the sentence. Generating means;
An information extraction apparatus comprising:
前記文節品詞は、用言性文節、体言性文節、サ変性文節、コピュラ文節、形容性文節、副詞性文節、連体性文節、接続性文節又は不定文節、のいずれかであり、
前記文節種は、文末、読点、係り、切断又は不定、のいずれか、
であることを特徴とする請求項28記載の情報抽出装置。
The phrase part-of-speech is one of a predicative clause, a verbal clause, a sacrificial clause, a copula clause, an adjective clause, an adverbial clause, a conjunctive clause, a connectivity clause, or an indefinite clause,
The phrase type is one of the following:
29. The information extraction device according to claim 28, wherein:
前記拡張構造要素は、
用言性文節、体言性文節、サ変性文節、コピュラ文節、形容性文節、副詞性文節、連体性文節、接続性文節、若しくは、不定文節、のいずれかの基本単位、又は、該基本単位の組み合わせにより構成される、
ことを特徴とする請求項28記載の情報抽出装置。
The extended structural element is
The basic unit of any of the predicative clauses, the verbal clauses, the samurai clauses, the copula clauses, the adjective clauses, the adverbial clauses, the conjunctive clauses, the connectivity clauses, or the indefinite clauses, or Composed of combinations,
29. The information extraction device according to claim 28.
前記基本単位の各文節は、読点、文末、係り無し、係り又は不定、のいずれか一つの文節種を有する、
ことを特徴とする請求項29情報抽出装置。
Each clause of the basic unit has any one of the following phrase types: reading, end of sentence, unrelated, unrelated or undefined
30. The information extracting apparatus according to claim 29.
前記抽出キー選択手段は、
不定属性を持たない用言性文節、
不定属性を持たないサ変性文節、
コピュラ性文節、
文末、読点、および切断のいずれかの属性を有する形容性文節、
文末か切断の属性を有する副詞性文節、
文末か切断の属性を有する体言性文節、のいずれかを前記抽出キーとして選択する、
ことを特徴とする請求項28ないし31いずれか記載の情報抽出装置。
The extraction key selection means includes
Predicate clauses that do not have indefinite attributes,
A modified clause that does not have indefinite attributes,
Copula clause,
An adjective clause with one of the following attributes:
Adverbial clauses with end-of-sentence or truncation attributes,
Selecting either the end of sentence or the narrative phrase having a cutting attribute as the extraction key,
32. The information extraction device according to claim 28, wherein the information extraction device is a device.
前記拡張構造要素生成手段は、
前記抽出キー選択手段により選択された前記抽出キーを前記文章から文節を抽出するための拡張対象文節として、該拡張対象文節が、用言性文節、サ変性文節、コピュラ文節、形容性文節、又は副詞性文節、の場合、
当該拡張対象文節に対し係りの属性を有する、用言性文節、サ変性文節、形容性文節、体言性文節、又は、副詞性文節を該抽出キーに追加して拡張構造要素を生成する前方拡張処理手段を有し、
前記前方拡張処理手段により追加される文節が、用言性文節、サ変性文節、形容性文節、又は、体言性文節の場合、当該文節を前記拡張対象文節として、更に前記前方拡張処理手段を行う、
ことを特徴とする請求項28ないし32いずれか記載の情報抽出装置。
The extended structural element generation means includes
Using the extracted key selected by the extraction key selection means as an extension target clause for extracting a clause from the sentence, the extension target clause is a prescriptive phrase, a sacrificial phrase, a copula phrase, an adjective phrase, or In the case of adverbial clauses,
Forward extension that generates an extended structure element by adding a predicative clause, a sacrificial clause, an adjective clause, an episodic clause, or an adverbial clause having an attribute related to the extension target clause to the extraction key Having processing means,
When the clause added by the forward extension processing means is a predicative clause, a modified clause, an adjective clause, or a semantic clause, the forward extension processing means is further performed with the clause as the extension target clause. ,
33. The information extraction device according to claim 28, wherein the information extraction device is a device.
前記拡張構造要素生成手段は、
前記抽出キー選択手段により選択された前記抽出キーを前記文章から文節を抽出するための拡張対象文節として、該拡張対象文節が体言性文節の場合、
当該拡張対象文節に対し係りの属性を有する、形容性文節、体言性文節又は副詞性文節、を該抽出キーに追加して拡張構造要素を生成する前方拡張処理手段を有し、
前記前方拡張処理手段により追加される文節が、形容性文節又は体言性文節の場合、当該文節を前記拡張対象文節として、更に前記前方拡張処理手段を行う、
ことを特徴とする請求項28ないし32いずれか記載の情報抽出装置。
The extended structural element generation means includes
When the extraction target selected by the extraction key selection means is an expansion target clause for extracting a clause from the sentence, and the expansion target clause is a body phrase,
Forward extension processing means for generating an extended structural element by adding an adjective clause, a verbal clause or an adverbial clause having an attribute related to the extension target clause to the extraction key;
If the clause added by the forward extension processing means is an adjective clause or a verbal clause, the forward extension processing means is further performed with the clause as the extension target clause;
33. The information extraction device according to claim 28, wherein the information extraction device is a device.
前記拡張構造要素生成手段は、
前記抽出キー選択手段により選択された前記抽出キーを前記文章から文節を抽出するための拡張対象文節として、該拡張対象文節が係りの属性を有する、用言性文節、サ変性文節、形容性文節又は副詞性文節、の場合であって、
当該拡張対象文節の係り先文節が、体言性文節の場合、前記抽出キーに係り先の文節を追加して拡張構造要素を生成する後方拡張処理手段を有し、
前記後方拡張処理手段により追加される体言性文節が係りの属性を有する場合であって、追加される体言性文節の係り先文節が体言性文節の場合、当該文節を前記拡張対象文節として、更に前記後方拡張処理手段を行う、
ことを特徴とする請求項28ないし32いずれか記載の情報抽出装置。
The extended structural element generation means includes
Using the extracted key selected by the extraction key selecting means as an expansion target clause for extracting a clause from the sentence, a predicative phrase, a sacrificial phrase, an adjective phrase having an attribute related to the expansion target phrase Or adverbial clauses,
If the destination clause of the extension target clause is a body clause, it has a backward extension processing means for generating an extension structure element by adding the clause of the destination to the extraction key,
In the case where the verbal clause added by the backward extension processing means has a dependency attribute, and the dependency clause of the added verbal clause is a verbal clause, the clause is further set as the extension target clause. Performing the backward extension processing means;
33. The information extraction device according to claim 28, wherein the information extraction device is a device.
前記拡張構造要素生成手段は、
前記抽出キー選択手段により選択された前記抽出キーを前記文章から文節を抽出するための拡張対象文節として、該拡張対象文節が係りの属性を有する、体言性文節の場合であって、
当該拡張対象文節の係り先文節が、体言性文節又はコピュラ文節の場合、前記抽出キーに係り先の文節を追加して拡張構造要素を生成する後方拡張処理手段を有し、
前記後方拡張処理手段により追加される体言性文節が係りの属性を有する場合であって、追加される体言性文節の係り先文節が体言性文節の場合、当該文節を前記拡張対象文節として、更に前記後方拡張処理手段を行う、
ことを特徴とする請求項28ないし32いずれか記載の情報抽出方法。
The extended structural element generation means includes
The extraction key selected by the extraction key selection means is an extension target clause for extracting a clause from the sentence, and the extension target clause has a related attribute,
If the destination clause of the extension target clause is a body language clause or a copula clause, it has a backward extension processing means for generating an extension structure element by adding the clause of the destination to the extraction key,
In the case where the verbal clause added by the backward extension processing means has a dependency attribute, and the dependency clause of the added verbal clause is a verbal clause, the clause is further set as the extension target clause. Performing the backward extension processing means;
33. The information extraction method according to any one of claims 28 to 32, wherein:
請求項19ないし27記載の情報抽出方法をコンピュータに実行させる情報抽出プログラム。   An information extraction program for causing a computer to execute the information extraction method according to claim 19 to 27. 請求項37記載の情報抽出プログラムが記録された記録媒体。   38. A recording medium on which the information extraction program according to claim 37 is recorded.
JP2005205793A 2004-07-14 2005-07-14 Information extraction method, information extraction device, information extraction program, and recording medium recording information extraction program Pending JP2006053907A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005205793A JP2006053907A (en) 2004-07-14 2005-07-14 Information extraction method, information extraction device, information extraction program, and recording medium recording information extraction program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004207572 2004-07-14
JP2005205793A JP2006053907A (en) 2004-07-14 2005-07-14 Information extraction method, information extraction device, information extraction program, and recording medium recording information extraction program

Publications (1)

Publication Number Publication Date
JP2006053907A true JP2006053907A (en) 2006-02-23

Family

ID=36031318

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005205793A Pending JP2006053907A (en) 2004-07-14 2005-07-14 Information extraction method, information extraction device, information extraction program, and recording medium recording information extraction program

Country Status (1)

Country Link
JP (1) JP2006053907A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010117832A (en) * 2008-11-12 2010-05-27 Nippon Telegr & Teleph Corp <Ntt> Related information extraction device, related information extraction method, program, and recording medium
JP2010122823A (en) * 2008-11-18 2010-06-03 Nec Corp Text processing system, information processing apparatus, method for processing text and information, and processing program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010117832A (en) * 2008-11-12 2010-05-27 Nippon Telegr & Teleph Corp <Ntt> Related information extraction device, related information extraction method, program, and recording medium
JP2010122823A (en) * 2008-11-18 2010-06-03 Nec Corp Text processing system, information processing apparatus, method for processing text and information, and processing program

Similar Documents

Publication Publication Date Title
Singh et al. A systematic review of text stemming techniques
Castellví et al. Automatic term detection
US7774198B2 (en) Navigation system for text
Ding et al. Ontology research and development. Part 1-a review of ontology generation
CN104252533B (en) Searching method and searcher
US6269189B1 (en) Finding selected character strings in text and providing information relating to the selected character strings
US8484238B2 (en) Automatically generating regular expressions for relaxed matching of text patterns
US7689411B2 (en) Concept matching
US6829605B2 (en) Method and apparatus for deriving logical relations from linguistic relations with multiple relevance ranking strategies for information retrieval
Srihari et al. Infoxtract: A customizable intermediate level information extraction engine
Miller et al. BBN: Description of the SIFT system as used for MUC-7
JP2005526317A (en) Method and system for automatically searching a concept hierarchy from a document corpus
Jabbar et al. A survey on Urdu and Urdu like language stemmers and stemming techniques
Chiarcos et al. Analyzing middle high German syntax with RDF and SPARQL
Galvez et al. Term conflation methods in information retrieval: Non‐linguistic and linguistic approaches
JP3594701B2 (en) Key sentence extraction device
Fauzi et al. Image understanding and the web: a state-of-the-art review
Fudholi et al. Ontology-based information extraction for knowledge enrichment and validation
JP2006053907A (en) Information extraction method, information extraction device, information extraction program, and recording medium recording information extraction program
JP2894301B2 (en) Document search method and apparatus using context information
Shrawankar et al. Construction of news headline from detailed news article
JP4378106B2 (en) Document search apparatus, document search method and program
JP3856388B2 (en) Similarity calculation method, similarity calculation program, and computer-readable recording medium recording the similarity calculation program
Jacquemin et al. Enriching a text by semantic disambiguation for information extraction
JP7227705B2 (en) Natural language processing device, search device, natural language processing method, search method and program