JPH0350631A - Information extraction device - Google Patents

Information extraction device

Info

Publication number
JPH0350631A
JPH0350631A JP1184430A JP18443089A JPH0350631A JP H0350631 A JPH0350631 A JP H0350631A JP 1184430 A JP1184430 A JP 1184430A JP 18443089 A JP18443089 A JP 18443089A JP H0350631 A JPH0350631 A JP H0350631A
Authority
JP
Japan
Prior art keywords
anaphora
tables
local
concepts
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1184430A
Other languages
Japanese (ja)
Other versions
JPH0650503B2 (en
Inventor
Eiji Komatsu
小松 英二
Yasuhiko Kato
加藤 安彦
Takashi Hibi
孝 日比
Hiroshi Yasuhara
宏 安原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Agency of Industrial Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency of Industrial Science and Technology filed Critical Agency of Industrial Science and Technology
Priority to JP18443089A priority Critical patent/JPH0650503B2/en
Publication of JPH0350631A publication Critical patent/JPH0350631A/en
Publication of JPH0650503B2 publication Critical patent/JPH0650503B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Devices For Executing Special Programs (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PURPOSE:To improve the identity of information and facility for understanding a result by dividing an information extraction function into a function making information on a noun phrase into a local table and a function connecting local tables and using the character of correspondence to the connection function. CONSTITUTION:The word of modification structure from a syntax analysis part 1 is replaced with the groups of concept and classification in a table generation part 2 and a participial adjective and a pronoun are replaced with concept so as to treat them as nouns. Then, concept is connected by using a knowledge relation by fields and the local tables are generated. A table connection part 3 sequentially selects the local tables from the head of a document and checks the possibility of a corresponding relation with all the local tables which are previously generated by using a corresponding relation check rule. Then, one table is selected by using the rule of a corresponding relation selection rule base 9 and the tables having the corresponding relation by using the rule of a table connection rule base 10. Thus, the identity of information and facility for understanding the result improve.

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は電子化された文書から情報を自動抽出し、表
形式の情報を出力する装置に関するものである。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a device that automatically extracts information from an electronic document and outputs information in a tabular format.

(従来の技術) 従来、文書から情報を自動抽出し、表形式で表示するソ
フトウェアとしては、「「技術抄録文からの関係情報の
自動抽出」、高松氏・日下氏・西田氏著、情報処理学会
論文誌、Vol、25 No、2.1984年3月発行
、P、 216〜P、 224Jに開示されるものがあ
り、これは構文解析した係り受け構造を、知識を用いて
、交電に表形式に変換するものであった。
(Conventional technology) Conventionally, software that automatically extracts information from documents and displays it in a table format includes "Automatic Extraction of Related Information from Technical Abstracts," by Mr. Takamatsu, Mr. Kusaka, and Mr. Nishida, Information. There is something disclosed in Processing Society Transactions, Vol. 25 No. 2. Published March 1984, P. 216-P. 224J. It was intended to be converted into a tabular format.

この他の方法としては、文書の単語を事前に用意した表
にアトホックに埋め込んでい(ものがあった。
Another method is to embed the words of the document in a pre-prepared table at hoc.

(発明が解決しようとする課題) しかしながら、上記係り受け構造を交電に変換する方法
では、分野移行性や拡張性はあるが、異なる文から抽出
した情報を結び付ける処理を行っていないため、文書全
体の情報をまとめることができなかった。また、−文内
の情報だけで表を生成しているため、文の表現方法によ
り、様々な表が生成され、理解が容易でなく、場合によ
っては、1文内の情報からだけではうま(表が生成でき
ないという問題点があった。
(Problem to be Solved by the Invention) However, although the above method for converting the dependency structure to alternating current has field transferability and expandability, it does not perform processing to link information extracted from different sentences, so I couldn't put all the information together. In addition, since tables are generated using only the information in a sentence, various tables are generated depending on how the sentence is expressed, making it difficult to understand, and in some cases, it may not be possible to use only the information in a single sentence. There was a problem that the table could not be generated.

また、上記アトホックな方法では、これらの問題点を部
分的に解決したものもあるが、文型や内容の制限が強(
、手続き的に作成しているため、改良が容易でなく、分
野移行性や拡張性がないという問題点があった。
In addition, although some of the above adhoc methods have partially solved these problems, they have strong restrictions on sentence structure and content (
, since it was created procedurally, it was not easy to improve, and there were problems in that it was not transferable or extensible to different fields.

この発明は、上記の係り受け構造を利用した方式が具備
している移行性と拡張性を満たしつつ、情報の同−性及
び結果の理解容易性の問題点を解決するために、まず各
交電に表を生成し、さらに、照応処理により表を結合す
るという方法をとることにより、上記の問題点を改善し
た、情報抽出のための優れた装置を提供することを目的
とする。
This invention first solves the problems of information homogeneity and understandability of results while satisfying the portability and extensibility of the above-mentioned method using the dependency structure. It is an object of the present invention to provide an excellent apparatus for extracting information, which solves the above-mentioned problems by automatically generating tables and then combining the tables through anaphora processing.

(課題を解決するための手段) 本発明は前記問題点を解決するために、入力された文書
を、格を用いた係り受け構造に変換する構文解析部と、
体言の単語に対して概念と概念の分類の組のリストが記
述されている体言用概念変換辞書と、主な格がとりうる
対象概念が記述されている用言用概念変換辞書と、概念
同士の関係を示すものであって概念同士がネットワーク
状に結合されている分野別知識・ベースと、省略されて
いる概念を補足するための省略補足ルールが登録されて
いる省略補足ルール・ベースと、体言用概念変換辞書、
用言用概念変換辞書、分野別知識及び省略補足ルールに
基づいて、−文内の情報を用いて局所的な表を生成する
表生成部と、この表生成部により生成された全ての表に
ついて照応関係の可能性を調べるための照応関係チェッ
ク・ルールが登録されている照応関係チェック・ルール
・ベースと、照応の言語的な性質を利用し、1つの表を
選択するための照応関係選択ルールが登録されている照
応関係ルール・ベースと、照応関係を持つ表同士を結合
するための表結合ルールが登録されている表結合ルール
・ベースと、照応関係チェック・ルール、照応関係選択
ルール及び表結合ルールに基づいて、文書の先頭から順
に局所的な表をそれより前にある局所的な表と結合させ
る表結合部とを具備することに特徴がある。
(Means for Solving the Problems) In order to solve the above-mentioned problems, the present invention includes a syntax analysis unit that converts an input document into a dependency structure using cases;
A concept conversion dictionary for nominal language that describes a list of concepts and concept classification pairs for nominal words, a concept conversion dictionary for predicates that describes the target concepts that the main case can take, and a concept conversion dictionary for nominal language that describes the target concepts that the main case can take. A field-specific knowledge/base in which concepts are connected in a network to show the relationship between the two, and an abbreviation supplementary rule base in which omitted supplementary rules are registered to supplement omitted concepts. Nominal concept conversion dictionary,
Based on the concept conversion dictionary for pragmatics, field-specific knowledge, and rules for supplementary abbreviations, - a table generation unit that generates local tables using information in sentences, and all tables generated by this table generation unit; An anaphora relationship check rule base in which anaphora relationship check rules are registered to check the possibility of anaphora relationships, and an anaphora relationship selection rule that uses the linguistic properties of anaphora to select one table. The anaphora relationship rule base in which anaphora relationships are registered, the table join rule base in which table join rules for joining tables that have anaphora relationships are registered, anaphora relationship check rules, anaphora relationship selection rules, and table A feature of the document is that it includes a table join unit that joins a local table with a preceding local table in order from the beginning of the document based on a join rule.

(作用) 以上のような構成を有する本発明によれば、入力された
文書が構文解析部により、格を用いた係り受け構造に変
換される。そして、この係り受け構造から表生成部は体
言用概念変換辞書、用言用概念変換辞書、分野別知識及
び省略補足ルールに基づいて、−文内の情報を用いて局
所的な表を生成する。表結合部は照応関係チェック・ル
ール、照応関係選択ルール及び表結合ルールに基づいて
、局所的な表同士の同一性を判定して文書の先頭から順
に局所的な表をそれより前にある局所的な表と結合させ
る。この際、1文内ではあいまいな情報は、表の結合に
より、完全な情報になる可能性がある。また、1文毎の
情報抽出については、従来システムと同様の処理ができ
る。さらに、分野の移行については、分野別知識、概念
変換辞書の修正により容易に対応できる。
(Operation) According to the present invention having the above configuration, an input document is converted by the syntax analysis unit into a dependency structure using cases. Then, based on this dependency structure, the table generation unit generates a local table using the information in the -sentence, based on the nominal concept conversion dictionary, the predicate concept conversion dictionary, field-specific knowledge, and omission supplementary rules. . The table join part determines the identity of local tables based on anaphora relationship check rules, anaphora relationship selection rules, and table join rules, and sequentially connects local tables to the previous local tables from the beginning of the document. join with other tables. At this time, information that is ambiguous within one sentence may become complete information by joining tables. Furthermore, information extraction for each sentence can be performed in the same way as the conventional system. Furthermore, field transitions can be easily handled by modifying field-specific knowledge and concept conversion dictionaries.

したがって、本発明は前記問題点を解決でき、移行性と
拡張性を満たしつつ、情報の同−性及び結果の理解容易
性を向上できる情報抽出装置を提供できる。
Therefore, the present invention can solve the above-mentioned problems, and can provide an information extraction device that can improve the sameness of information and the ease of understanding of results while satisfying portability and expandability.

(実施例) 以下、本発明の一実施例を図面に基づいて説明する。(Example) Hereinafter, one embodiment of the present invention will be described based on the drawings.

第1図は本発明の一実施例を示すシステム構成図である
。同図において、1は入力された文書を、第2図に示す
ような格を用いた係り受け構造に変換する構文解析部、
2は一文内の情報を用いて表(以下、この表を「局所的
な表」と呼ぶ。)を生成する表生成部、3は文書の先頭
から順に局所的な表をそれより前にある局所的な表と結
合させる表結合部、4は概念を表わす言葉のなかで活用
の無いもの例えば名詞、代名詞、数詞のような体言の単
語に対して概念と概念の分類の組のリストが記述されて
いる体言用概念変換辞書、5は主な格の名詞句が含む可
能性のある概念が記述されている用言用概念変換辞書、
6は例えば第3図に示すような概念同士の関係を示すも
のであって概念同士がネットワーク状に結合されている
分野別知識・ベース、7は例えば第4図に示すような省
略補足ルールが登録されている省略補足ルール・ベース
、8は例えば第5図に示すような照応関係チェック・ル
ールが登録されている照応関係チェック・ルール・ベー
ス、9は例えば第6図に示すような照応関係選択ルール
が登録されている照応関係選択ルール・ベース、lOは
例えば第7図に示すような表結合ルールが格納されてい
る表結合ルール・ベースである。ここで、第8図は本実
施例における出力となる表の形式を示す図である。第9
図は局所的な表の形式を示す図である。第9図において
、局所的な表には生成された順に識別子と呼ぶ番号をつ
ける。第1O図は概念の分類を示す図である。同義語や
異表記等、表記上は異なっているが、同じ意味を持つと
解釈すべき単語に与えられる共通の記号を以下で「概念
」と呼ぶことにする。概念は、表のどの位置に入りつる
かに基づいて分類されている。以下、分類が対象、属性
、属性値である概念を、それぞれ、「対象概念」、「属
性概念」、「属性値概念」と呼ぶことにする。第11図
は係り受け構造中の単語を概念に変換するための体言用
概念変換辞書と用言用概念変換辞書の形式と例を示す図
である。
FIG. 1 is a system configuration diagram showing an embodiment of the present invention. In the figure, 1 is a syntax analysis unit that converts an input document into a dependency structure using cases as shown in Figure 2;
2 is a table generator that generates a table (hereinafter referred to as a "local table") using information in one sentence; 3 is a table generator that generates local tables sequentially from the beginning of the document before it. 4 is a list of pairs of concepts and concept classifications for words expressing concepts that are not conjugated, such as nouns, pronouns, and numerals. 5 is a concept conversion dictionary for nominals in which concepts that may be included in the main case noun phrase are described.
6 indicates the relationship between concepts as shown in Figure 3, and the knowledge base by field in which the concepts are connected in a network, and 7 indicates the omitted supplementary rule as shown in Figure 4, for example. 8 is a registered omitted supplementary rule base, 8 is a anaphoric relationship check rule base in which anaphoric relationship check rules as shown in FIG. 5 are registered, and 9 is an anaphoric relationship as shown in FIG. 6, for example. The anaphora selection rule base in which selection rules are registered, IO, is a table join rule base in which table join rules as shown in FIG. 7 are stored, for example. Here, FIG. 8 is a diagram showing the format of the table that is output in this embodiment. 9th
The figure shows the format of a local table. In FIG. 9, local tables are assigned numbers called identifiers in the order in which they are generated. FIG. 1O is a diagram showing the classification of concepts. Common symbols given to words that are different in notation, such as synonyms and different notations, but should be interpreted as having the same meaning, are hereinafter referred to as "concepts." Concepts are categorized based on where they fit into the table. Hereinafter, concepts classified as object, attribute, and attribute value will be referred to as "object concept,""attributeconcept," and "attribute value concept," respectively. FIG. 11 is a diagram showing formats and examples of a nominal concept conversion dictionary and a predicate concept conversion dictionary for converting words in a dependency structure into concepts.

次に、文書から、一文内の情報を用いて局所的な表を生
成する手順について述べる。
Next, we will describe the procedure for generating a local table from a document using information within one sentence.

第1図の体言用概念変換辞書4には、体言の単語に対し
て、概念と概念の分類の組のリストが記述されている。
In the nominal language concept conversion dictionary 4 shown in FIG. 1, a list of concepts and concept classification pairs is described for nominal words.

代名詞等の指示語については、分野別知識概念の概念の
うちから、指示することのできない概念を下位に含まな
い最も上位の概念を記述してお(。用言用概念変換辞書
5には、主な格がとりうる対象概念が記述されている。
For demonstrative words such as pronouns, the highest-ranking concept that does not include lower-level concepts that cannot be denotative is written from among the concepts of field-specific knowledge concepts. The target concepts that the main case can take are described.

対象概念は選択のための条件をつけて複数個記述するこ
とができる。分野別知識6は概念同士の関係を示すもの
で、概念同士がネットワーク状に結合されている。また
、分野別知識はシソーラスの拡張であり、シソーラスが
概念を上位−下位だけで分類しているのに対し、分野別
知識は上述した関係を用い、しかも、2つ以上の上位概
念を持てる。第1図の表生成部2では、まず、係り受け
構造の単語を概念と分類の組に置き換える。連体詞や代
名詞等も概念に置き換え、以下名詞と同様に扱う。
Multiple target concepts can be described with conditions for selection. The field-specific knowledge 6 shows the relationship between concepts, and the concepts are connected in a network. In addition, field-specific knowledge is an extension of a thesaurus, and while a thesaurus classifies concepts only by upper and lower ranks, field-specific knowledge uses the above-mentioned relationships and can have two or more higher-level concepts. The table generation unit 2 in FIG. 1 first replaces words in a dependency structure with pairs of concepts and categories. Adnominals and pronouns are also replaced with concepts and treated in the same way as nouns.

辞書に登録されていない単語は、単語をそのまま対象概
念として用いる。ただし、上述した概念変換辞書は、未
知語処理機能をつけ、辞書に登録されていない単語でも
、アルファベットからなる固有名詞や金額を表す単語は
属性値概念とする。そして、分野別知識の関係を用いて
概念を結び付け、局所的な表を生成する。第12図に局
所的な表の生成例を示す。1つの名詞句から複数個の表
が生成された場合は、以下で述べる表結合処理に先立っ
て、同じ名詞句内の表を結合する。このとき、対象概念
同士に第13図のうちの1つの関係がある場合は、その
関係で表同士を結合し、対象概念同士に関係がみられな
い場合には、係り受け構造の修飾関係を表同士の関係と
して表同士を結合する。表の生成に当たって、省略され
ている概念は、分野別知識、用言用概念変換辞書及び省
略補足ルールを用いて補う。
For words that are not registered in the dictionary, the words are used as they are as target concepts. However, the concept conversion dictionary described above is equipped with an unknown word processing function, and even if the words are not registered in the dictionary, proper nouns consisting of the alphabet or words representing monetary amounts are treated as attribute value concepts. Then, concepts are connected using relationships in field-specific knowledge to generate local tables. FIG. 12 shows an example of local table generation. When a plurality of tables are generated from one noun phrase, the tables within the same noun phrase are joined prior to the table joining process described below. At this time, if the target concepts have one of the relationships shown in Figure 13, the tables are joined using that relationship, and if there is no relationship between the target concepts, the modifying relationships of the dependency structure are used. Join tables as a relationship between tables. In generating the table, omitted concepts are supplemented using field-specific knowledge, a concept conversion dictionary for terminology, and omitted supplementary rules.

以上のようにして、文書の総ての文から局所的な表を生
成する。
In the manner described above, a local table is generated from all sentences of the document.

次に、局所的な表を結合し、最終的な表とする処理につ
いて述べる。
Next, we will describe the process of joining local tables to form a final table.

第1図の表結合部3では、文書の先頭から順に、局所的
な表をそれより前にある局所的な表と結合してい(。以
下、局所的な表同士の関係を「照応関係」と呼ぶ。また
、各種ルールについては、上から順に処理が完了するま
で適用するものとする。文書の先頭の文から順に局所的
な表を選び、照応関係チェック・ルール・ベース8の照
応関係チェック・ルールを用いて、それより以前に生成
された総ての局所的な表との照応関係の可能性を調べる
。ただし、局所的な表同士が既に結合されている場合に
は、まとめてチエツクするため、チエツクの対象となる
局所的な表の数は単語の増加に対して、必ずしも線形に
は増加しない。
The table joining unit 3 in Figure 1 joins local tables with previous local tables in order from the beginning of the document (hereinafter, the relationship between local tables is referred to as an ``anaphora relationship''). In addition, various rules shall be applied in order from the top until the processing is completed.Select local tables in order from the first sentence of the document, and perform the anaphora relationship check in Rule Base 8 for anaphora relationship check.・Use rules to check the possibility of anaphora relationships with all previously generated local tables.However, if local tables are already joined, check them all at once. Therefore, the number of local tables to be checked does not necessarily increase linearly as the number of words increases.

チエツクで照応関係の可能性があることが判明した表の
識別子は総て記録しておく。上記の照応のチエツクでは
、通常照応関係を持つ可能性のある表が複数個存在する
ため、照応関係の可能性がある表の中から、照応関係選
択ルール・ベース9の照応関係選択ルールを用いて、1
つの表を選ぶ。
Record all identifiers of tables that are found to have a possibility of anaphora relationship during the check. In the above anaphora check, since there are usually multiple tables that may have an anaphora relationship, the anaphora relationship selection rule of Base 9 is used to select from among the tables that may have an anaphora relationship. Te, 1
Select one table.

照応関係選択ルールは、照応の言語的な性質を利用して
いる。表結合ルール・ベース10の表結合ルールを用い
て、照応関係を持つ表同士を結合する。なお、第7図の
例では、ある1つの表とは上位−下位関係にあり、別の
表とは全体一部分関係にあるような場合でも、どちらか
一つに決定すれば、注)に示される処理が必ず行われる
ため、表結合ルールの処理の結果は、両方の関係で結合
したのと同じ結果になる。
Anaphoric relation selection rules utilize the linguistic properties of anaphors. The table join rules of the table join rule base 10 are used to join tables that have anaphora relationships. In the example in Figure 7, even if there is a superior-subordinate relationship with one table and a whole-part relationship with another table, if one of them is determined, the result shown in note) The result of the table join rule processing is the same as joining with both relationships.

第14図は以上の処理の後に得られた結合された表の例
を示す図である。表結合処理の結果、表は同じ識別子を
持つか、或は、互いにリンクされた少数の表にまとめら
れる。そのうち、項目及び値がひとつもなく、見出しだ
けの表は除いて、出力とする。
FIG. 14 is a diagram showing an example of a combined table obtained after the above processing. As a result of the table join process, tables are grouped into fewer tables that have the same identifier or are linked to each other. Among them, all tables excluding tables with only headings and no items or values are output.

(発明の効果) 以上のように、この発明によれば、情報抽出機能を名詞
句の情報を局所的な表にする機能と局所的な表同士を結
合する機能に分け、さらに、結合機能に照応の性質を用
いたため、以下のような効果が期待できる。
(Effects of the Invention) As described above, according to the present invention, the information extraction function is divided into the function of converting noun phrase information into a local table and the function of combining local tables, and furthermore, the By using the properties of anaphora, the following effects can be expected.

■−文交円はあいまいな情報が、表の結合処理により、
他の文の情報と結びつけられるため、明確化される。
■-Bunkoen has ambiguous information, but due to table join processing,
It is clarified because it is connected to information in other sentences.

■結果が文型に左右されず、理解しやすい。■Results are not affected by sentence structure and are easy to understand.

■分野移行に際して、手続きを変更する必要がなく、分
野別知識及び概念変換辞書の変更ですみ、分野移行性が
ある。
■When transferring to a field, there is no need to change procedures, and only the field-specific knowledge and concept conversion dictionary need to be changed, making it field-transferable.

■情報の同一性の判定には、言語的な照応の性質を利用
しているため、精度が高く、拡張性がある。
■Since the property of linguistic correspondence is used to determine the identity of information, it is highly accurate and scalable.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例のシステム構成を示すブロッ
ク図、第2図は係り受け構造の一例を示す図、第3図は
分野別知識の一例を示す図、第4図は省略補足ルールの
一例を示す図、第5図は照応関係チェック・ルールの一
例を示す図、第6図は照応関係選択ルールの一例を示す
図、第7図は表結合ルールの一例を示す図、第8図は本
実施例における出力となる表の形式を示す図、第9図は
局所的な表の形式を示す図、第1O図は概念の分類を示
す図、第11図は概念変換辞書の形式と例を示す図、第
12図は局所的な表の生成例を示す図、第13図は分野
別知識の関係を示す図、第14図は結合された表の一例
を示す図である。 1 ・ 2 ・ 3 ・ 4 ・ 5 ・ 6 ・ 7 ・ 8 ・ 9 ・ lO・ 構文解析部、 表生成部、 表結合部、 体言用概念変換辞書、 用言用概念変換辞書、 分野別知識・ベース、 省略補足ルール・ベース、 照応関係チェック・ルール・ベース、 照応関係選択ルール・ベース、 表結合ルール・ベース。 主力とζ4衣0形武 仔り受Iアfン12乏−9イジ・j 第2図 甲但11項令、) 一3性 4デ討冥リ ズd懺 の 卆r] 第 図 [J内122]草3むと今gt碑、a 第 2 図 省鴨シ呻゛疋ルールの伸・J 第4図 M、、、; 聞%チェックリL−ルの伊1第 図 !!!、< &’14’g ’J!y rレー−1,=
=、/FJ第 図 第 図 青くン(辷コ4た!赳aJダ1j 第14図 を所的ζ表9セ式゛ 第 ? 図 采牝匙の会様 第 Q 図 13μ燵!舒) 草巧−−千巧kS圀向分槽 1’!l<、’l′Mr”f ”武ζイ9す第 1 図 9財別胞茗敷゛9間作 第 3 図
Figure 1 is a block diagram showing the system configuration of an embodiment of the present invention, Figure 2 is a diagram showing an example of a dependency structure, Figure 3 is a diagram showing an example of field-specific knowledge, and Figure 4 is omitted. Figure 5 is a diagram showing an example of a rule, Figure 5 is a diagram showing an example of a comparison relation check rule, Figure 6 is a diagram showing an example of a comparison relation selection rule, Figure 7 is a diagram showing an example of a table join rule, Figure 8 shows the format of the output table in this embodiment, Figure 9 shows the format of the local table, Figure 1O shows the concept classification, and Figure 11 shows the concept conversion dictionary. Figure 12 shows an example of local table generation, Figure 13 shows relationships between field-specific knowledge, and Figure 14 shows an example of a combined table. . 1 ・ 2 ・ 3 ・ 4 ・ 5 ・ 6 ・ 7 ・ 8 ・ 9 ・ IO・ Syntax analysis section, table generation section, table combination section, concept conversion dictionary for nominals, concept conversion dictionary for predicates, field-specific knowledge/base , Omitted Supplementary Rule Base, Anaphora Check Rule Base, Anaphora Selection Rule Base, Table Join Rule Base. The main force and ζ 4 clothes 0 form Takeshi Riju I Af 12 Scarce - 9 Iji・j Figure 2 Kotan 11th Order,) Inside 122] Grass 3 and now gt monument, a Fig. 2 - J of the Ministry of Fire and Fire Prevention Rules - J Fig. 4 M,...; ! ! , <&'14'g 'J! y r ray−1,=
=, /FJ fig. Takumi--Sen Takumi kS Kunimuki Buntan 1'! l<,'l'Mr”f ”WuζI9S 1st Fig. 9 Zaibetsu Shumeishiki゛9 Intercrop Fig. 3

Claims (1)

【特許請求の範囲】 入力された文書を、格を用いた係り受け構造に変換する
構文解析部と、 体言の単語に対して概念と概念の分類の組のリストが記
述されている体言用概念変換辞書と、主な格がとりうる
概念が記述されている用言用概念変換辞書と、 概念同士の関係を示すものであって概念同士がネットワ
ーク状に結合されている分野別知識・ベースと、 省略されている概念を補足するための省略補足ルールが
登録されている省略補足ルール・ベースと、 前記体言用概念変換辞書、前記用言用概念変換辞書、前
記分野別知識及び省略補足ルールに基づいて、一文内の
情報を用いて文の内容についての局所的な表を生成する
表生成部と、 該表生成部により生成された局所的な表同士の可能性を
調べるための照応関係チェック・ルールが登録されてい
る照応関係チェック・ルール・ベースと、 照応の言語的な性質を利用し、複数の結合の可能性の中
から1つの表を選択するための照応関係選択ルールが登
録されている照応関係選択ルール・ベースと、 照応関係を持つ表同士を書き換えて、1つの表に結合す
るための表結合ルールが登録されている表結合ルール・
ベースと、 前記照応関係チェック・ルール、前記照応関係選択ルー
ル及び前記表結合ルールに基づいて、文書の先頭から順
に局所的な表をそれより前にある局所的な表と結合させ
る表結合部とを具備することを特徴とする情報抽出装置
[Scope of Claims] A syntactic analysis unit that converts an input document into a dependency structure using cases, and a concept for nominal language in which a list of pairs of concepts and concept classifications is described for words in nominal language. A conversion dictionary, a pragmatic concept conversion dictionary that describes the concepts that the main cases can take, and a field-specific knowledge/base that shows the relationships between concepts and connects them in a network. , an abbreviation supplementary rule base in which omitted supplementary rules for supplementing omitted concepts are registered, the aforementioned concept conversion dictionary for nominal language, the aforementioned concept conversion dictionary for predicates, the field-specific knowledge and the omitted supplementary rules; a table generator that generates a local table about the contents of a sentence based on the information in a sentence, and a anaphora relation check to check the possibility of local tables generated by the table generator・An anaphora relationship check rule base in which rules are registered, and an anaphora relationship selection rule that uses the linguistic properties of anaphora to select one table from among multiple join possibilities. The anaphora selection rule base that has anaphora relations, and the table join rule base that has registered table join rules for rewriting tables that have anaphora relationships and joining them into one table.
a table joiner that joins a local table with a previous local table in order from the beginning of the document based on the anaphora relationship check rule, the anaphora relationship selection rule, and the table join rule; An information extraction device comprising:
JP18443089A 1989-07-19 1989-07-19 Information extraction device Expired - Lifetime JPH0650503B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18443089A JPH0650503B2 (en) 1989-07-19 1989-07-19 Information extraction device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18443089A JPH0650503B2 (en) 1989-07-19 1989-07-19 Information extraction device

Publications (2)

Publication Number Publication Date
JPH0350631A true JPH0350631A (en) 1991-03-05
JPH0650503B2 JPH0650503B2 (en) 1994-06-29

Family

ID=16153016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18443089A Expired - Lifetime JPH0650503B2 (en) 1989-07-19 1989-07-19 Information extraction device

Country Status (1)

Country Link
JP (1) JPH0650503B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5340960A (en) * 1991-10-11 1994-08-23 Kawasaki Jukogyo Kabushiki Kaisha Control apparatus for spot welding robot
US6098047A (en) * 1995-02-13 2000-08-01 Fujitsu Limited Constructing method of organization activity database, analysis sheet used therein, and organization activity management system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5340960A (en) * 1991-10-11 1994-08-23 Kawasaki Jukogyo Kabushiki Kaisha Control apparatus for spot welding robot
US6098047A (en) * 1995-02-13 2000-08-01 Fujitsu Limited Constructing method of organization activity database, analysis sheet used therein, and organization activity management system

Also Published As

Publication number Publication date
JPH0650503B2 (en) 1994-06-29

Similar Documents

Publication Publication Date Title
US5848385A (en) Machine translation system using well formed substructures
Yaqub The liar speaks the truth: A defense of the revision theory of truth
Calzolari Acquiring and representing semantic information in a lexical knowledge base
Baud et al. Representing clinical narratives using conceptual graphs
JPH02281372A (en) Inserted adverbe phrase processing method in machine translation equipment
Balakrishna et al. Semi-Automatic Domain Ontology Creation from Text Resources.
Boudol et al. The Discriminating Power of Multiplicities in theλ-Calculus
Krstev et al. An approach to efficient processing of multi-word units
JPH0350631A (en) Information extraction device
Simov et al. The role of the WordNet relations in the knowledge-based word sense disambiguation task
Feili et al. An application of lexicalized grammars in English-Persian translation
Kuhns A PROLOG implementation of government-binding theory
Hajičová et al. The current status of the prague dependency treebank
Cojocaru et al. Text Generation Starting from an Ontology.
Piton et al. Electronic dictionaries and transducers for automatic processing of the Albanian language
KR101116471B1 (en) Method of Coder-oriented machine-understandable natural language text representation
Evans et al. Automaton-based Parsing for Lexicalised Grammars
McNaught Computational lexicography and computational linguistics
Carroll et al. Grammar compaction and computation sharing in automaton-based parsing
Kalouli et al. Graph knowledge representations for sick
Petit et al. The B method and the component-based approach
Tham NLP Tools for Khasi, a low resource language
Farwell An interlingual-based approach to reference resolution
Grishman Conjunctions and modularity in language analysis procedures
Mathews et al. Extracting Ontological Knowledge from Textual Descriptions

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term