JPH02188870A - Context processor - Google Patents

Context processor

Info

Publication number
JPH02188870A
JPH02188870A JP1007856A JP785689A JPH02188870A JP H02188870 A JPH02188870 A JP H02188870A JP 1007856 A JP1007856 A JP 1007856A JP 785689 A JP785689 A JP 785689A JP H02188870 A JPH02188870 A JP H02188870A
Authority
JP
Japan
Prior art keywords
rhetorical
text
context
connection
expressions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1007856A
Other languages
Japanese (ja)
Other versions
JPH0715692B2 (en
Inventor
Kenji Ono
顕司 小野
Masaie Amano
天野 真家
Teruhiko Ukita
浮田 輝彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Agency of Industrial Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency of Industrial Science and Technology filed Critical Agency of Industrial Science and Technology
Priority to JP1007856A priority Critical patent/JPH0715692B2/en
Publication of JPH02188870A publication Critical patent/JPH02188870A/en
Publication of JPH0715692B2 publication Critical patent/JPH0715692B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PURPOSE:To effectively and accurately decide a context structure even in case the context structure includes the unregistered words by noting the rhetoric expressions emerging in a text to obtain a rhetoric structure and analyzing the context structure of the text based on the rhetoric structure. CONSTITUTION:A corresponding table memory part 5 stores a corresponding table which shows the rhetoric expressions and the connecting relations shown by the rhetoric expressions. A connecting relation extracting part 4 is added together with a rhetoric structure deciding part 6. Then the connecting structure of the connecting relation among the sentence parts is checked from the rhetoric expressions for decision of a rhetroic structure. A context structure is decided based on the rhetoric structure. Thus it is possible to effectively decide a context structure even though the information on the nouns and verbs are insufficient. Furthermore a proper context process is secured since the context structure is checked based on the rhetoric structure secured among sentence parts.

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は自然言語処理においてテキストの文脈構造を効
果的に決定することのできる文脈処理装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention] (Industrial Application Field) The present invention relates to a context processing device that can effectively determine the context structure of a text in natural language processing.

(従来の技術) 近時、自然言語処理の研究が種々進められており、テキ
ストの文脈構造を調べてその意味解析することまでも行
なわれるようになってきた。従来、この種の文脈構造の
決定は、専らテキスト中に出現する名詞や動詞を調べ、
それら単語に関する係り受は条件や品詞の繋がり関係等
の情報を登録した辞書を参照して上記名詞や動作の繋が
り関係を調べながら行なわれている。つまりテキスト中
に出現する名詞や動詞を手掛りとしてその文脈構造を求
めている。
(Prior Art) In recent years, various researches on natural language processing have been carried out, and efforts have even begun to be made to examine the context structure of text and analyze its meaning. Traditionally, this type of context structure determination has focused on examining the nouns and verbs that appear in the text.
Modifications regarding these words are performed while checking the relationships among the nouns and actions by referring to a dictionary that stores information such as conditions and relationships between parts of speech. In other words, the context structure is determined using the nouns and verbs that appear in the text as clues.

ところがテキスト中に出現可能性のある全ての名詞や動
詞に関する情報を辞書登録しておくことい。この為、例
えばテキストが言及している内容に応じて、その対象分
野で用いられる名詞や動詞に関する情報をその都度作成
し、これを単語辞書に登録することが必要となった。し
かしその作業自体が非常に大変であり、種々対象分野の
テキストに適合させてそのまま文脈構造の決定に用いる
ことが困難であった。
However, it is important to register information about all nouns and verbs that may appear in a text in a dictionary. For this reason, it has become necessary to create information on nouns and verbs used in the target field each time, depending on the content mentioned in the text, for example, and to register this information in a word dictionary. However, the work itself is very difficult, and it has been difficult to adapt it to texts in various target fields and use it as is to determine the context structure.

またテキストは複数のパラグラフ間で前提と結論、或い
は判断と例示と云うような修辞構造を取ることが多々あ
る。しかし従来ては上述したようにテキスト中の名詞や
動詞を手掛りとして文脈構造を調べているだけなので、
求められた文脈構造が上述した修辞構造にそぐわず、不
適切なものとなることがあった。
Additionally, texts often use rhetorical structures such as premises and conclusions, or judgments and illustrations, between multiple paragraphs. However, as mentioned above, conventionally, only the nouns and verbs in the text are used as cues to examine the context structure.
Sometimes the required context structure did not match the above-mentioned rhetorical structure and was inappropriate.

(発明が解決しようとする課題) このように従来では、専らテキスト中に出現する名詞や
動詞を手掛りとしてその文脈構造を調べているだけなの
で、その文脈構造を決定するにはテキスト中に出現する
名詞や動詞に関する情報を予め辞書登録しておく必要が
ある等、幾つかのキストの文脈構造を良好に決定するこ
とのできる実用性に優れた文脈処理装置を提供すること
にある。
(Problem to be solved by the invention) In this way, in the past, only the nouns and verbs that appear in a text are used as clues to examine the context structure. It is an object of the present invention to provide a highly practical context processing device that can satisfactorily determine the context structure of some texts, such as the need to register information regarding nouns and verbs in a dictionary in advance.

[発明の構成] (課題を解決するための手段) 本発明に係る文脈処理装置は、名詞や動詞に比較して出
現頻度が少ないにも拘らず、個々のテキストにおいては
頻繁に出現する接続詞等の修辞表現に着目して修辞表現
とその修辞表現が意味する接続関係とを示す対応テーブ
ルを準備し、この対応テーブルを参照してテキスト中に
出現する修辞表現から上記テキストを構成する文章部分
間の接続関係を調べて前記テキストの修辞構造を求め、
この修辞構造を利用して前記テキストの文脈構造を決定
するようにしたことを特徴とするものである。
[Structure of the Invention] (Means for Solving the Problems) The context processing device according to the present invention can process conjunctions, etc. that appear frequently in individual texts, even though they occur less frequently than nouns and verbs. Focusing on the rhetorical expressions in the text, we prepare a correspondence table that shows the rhetorical expressions and the connection relationships that the rhetorical expressions mean, and then refer to this correspondence table to determine the relationship between the sentence parts that make up the text based on the rhetorical expressions that appear in the text. find the rhetorical structure of the text by examining the connectivity of
The present invention is characterized in that the context structure of the text is determined using this rhetorical structure.

また更には前記修辞表現が意味する接続関係間の接続規
則を示す関係テーブルを準備し、前記対応テーブルを参
照して求められる前記テキストを構成する文章部分間の
接続関係の系列の接続構造(作 用) 本発明によれば、テキスト中に出現する名詞や動詞に関
する情報の全てが辞書登録されていない状態であっても
、上記テキスト中の修辞表現に着目し、修辞表現から文
章部分間の接続関係の接続構造を調べてその修辞構造を
決定し、この修辞構造に従って文脈構造を決定するので
、名詞や動詞に関する情報が不足する場合であってもそ
の文脈構造を効果的に決定することが可能となる。しか
も文章部分間の修辞構造を活用してその文脈構造を調べ
るので、適切な文脈処理を行なうことが可能となる。
Furthermore, a relational table indicating connection rules between the connection relations implied by the rhetorical expression is prepared, and a connection structure (structure) of a series of connection relations between sentence parts constituting the text is obtained by referring to the correspondence table. According to the present invention, even if all the information about nouns and verbs that appear in a text is not registered in a dictionary, the connections between sentence parts can be determined from the rhetorical expressions by focusing on the rhetorical expressions in the text. It examines the connection structure of relationships to determine its rhetorical structure, and determines the context structure according to this rhetorical structure, so it is possible to effectively determine the context structure even when information about nouns and verbs is insufficient. becomes. Furthermore, since the context structure is examined by utilizing the rhetorical structure between sentence parts, it becomes possible to perform appropriate context processing.

(実施例) 以下、図面を参照して本発明の一実施例に係る文脈処理
装置につき説明する。
(Embodiment) Hereinafter, a context processing device according to an embodiment of the present invention will be described with reference to the drawings.

第1図は実施例装置の要部概略構成図で、1は解析処理
対象となる文書データや記録データ等のテキストを入力
するテキスト入力部である。書式構造解析部2は上記テ
キスト人力部1から入力されるテキストに含まれる章や
節等の書式的な情報含まれる文の形態素解析を実行する
。この形態素解析によってテキスト中の名詞や動詞等の
形態素が個々に求められる。
FIG. 1 is a schematic diagram of the main parts of the apparatus according to the embodiment. Reference numeral 1 denotes a text input section for inputting text such as document data or recorded data to be analyzed. The format structure analysis section 2 executes morphological analysis of sentences containing format information such as chapters and sections contained in the text inputted from the text human resource section 1. Through this morphological analysis, morphemes such as nouns and verbs in the text are individually determined.

以上の処理機能は従来の文脈処理装置と同様な機能を呈
するものであり、また従来より種々提唱されている手法
を用いて実現される。
The processing functions described above exhibit the same functions as those of conventional context processing devices, and are realized using various techniques that have been proposed in the past.

ここで本装置が特徴とすることろは、上記形態素解析部
3により求められたテキストの形態素解析結果に従い、
テキスト中の修辞表現を手掛りとして当該テキストを構
成する複数の文章部分(例えばバラグラフ)の接続関係
を求める接続関係抽出部4が設けられている点にある。
Here, the feature of this device is that according to the morphological analysis results of the text obtained by the morphological analysis section 3,
The apparatus is provided with a connection relation extraction section 4 that uses rhetorical expressions in the text as clues to find connection relations between a plurality of sentence parts (for example, bar graphs) that make up the text.

この接続関係抽出部4は、例えば第2図に示すように接
続詞等の修辞表現とその接続関係を示す対応テーブルを
格納した対応テーブル記憶部5を参照して前記テキスト
中の修辞表現を調べ、その修辞表現にて結び付けられて
いるバラグラフ間等の接続関係を求めるものである。例
えば「但し」なる修辞表現が求められた場合には、その
修辞表現の前に存在す峯5とが「補足」の関係にあるこ
とを示す接続関係を求めている。
For example, as shown in FIG. 2, the connection relation extraction unit 4 refers to a correspondence table storage unit 5 that stores a correspondence table showing rhetorical expressions such as conjunctions and their connection relations, and examines the rhetorical expressions in the text. This is to find the connection relationship between baragraphs etc. that are connected by the rhetorical expression. For example, when the rhetorical expression "however" is required, a connection relationship indicating that the rhetorical expression is in a "supplementary" relationship with the peak 5 that precedes the rhetorical expression is determined.

この接続関係抽出部4にて前記テキスト中に出現する全
ての修辞表現が順次求められ、且つその修辞表現で示さ
れる文章部分間の接続関係が個々に求められる。
The connection relation extraction unit 4 sequentially obtains all rhetorical expressions appearing in the text, and also obtains individual connection relations between sentence parts indicated by the rhetorical expressions.

このような接続関係抽出部4に加えて本装置が特徴とす
る今1つの点は、修辞構造決定部Bを備えている点にあ
る。この修辞構造決定部Bは、例えば第3図に示すよう
に上記修辞表現が示す接続関係の接続に関する禁止規則
を関係テーブルとして格納した関係テーブル記憶部7を
参照し、前記接続関係抽出部4にて求められた文章部分
間の接続関係の系列からバラグラフ内、およびバラグラ
フ間の修辞構造を求めるものである。
In addition to the connection relation extraction section 4, another feature of this apparatus is that it includes a rhetorical structure determination section B. For example, as shown in FIG. 3, the rhetorical structure determining section B refers to a relational table storage section 7 that stores, as a relational table, prohibition rules relating to the connections indicated by the above-mentioned rhetorical expressions. The rhetorical structure within a baragraph and between baragraphs is determined from the series of connection relationships between sentence parts found in the above.

この関係テーブルは第3図(a)に示すような修辞表現
によって示される接続関係の構造的な接続禁止規則を示
す情報と、第3図(b)に示すような上記接続関係の否
定的な接続規則を示す情報とを登録したテーブルからな
り、テキストの修辞構造として不適切な接続関係間の構
造を示している。
This relationship table contains information indicating structural connection prohibition rules for the connection relationship shown by rhetorical expressions as shown in Figure 3(a), and information indicating the negative rules for the connection relationship as shown in Figure 3(b). It consists of a table in which information indicating connection rules is registered, and shows a structure between connection relationships that is inappropriate as a rhetorical structure of a text.

に出現する品詞の接続関係に関する知識や係り受は関係
の知識等を用い、上述したテキストの修辞構造に従いな
がら、或いはテキストの修辞構造を決定してその文脈構
造を決定する。つまりこの文にしろ、−射的には殆んど
用いられるこのとない組合せ構造を示している。
The context structure is determined by following the rhetorical structure of the text as described above, or by determining the rhetorical structure of the text, using knowledge of the connections and dependencies of the parts of speech that appear in the text. In other words, this sentence shows an unusual combinatorial structure that is almost always used in -morphisms.

修辞構造決定部Bはこのような情報を有する関係テーブ
ル記憶部7を参照し、前記接続関係抽出部4で求められ
た修辞表現によって結ばれるバラグラフ間の接続関係を
示す系列から、テキストの修辞構造として不適切な組合
せを排除しながらその組合せ構造を求めて該テキストの
修辞構造を決定している。尚、テキストの修辞構造が一
義的に決定されず、複数の修辞構造候補が求められた場
合には、その決定は次の文脈構造決定部8に委ねられる
The rhetorical structure determination section B refers to the relational table storage section 7 having such information, and determines the rhetorical structure of the text from the series indicating the connection relations between bar graphs connected by the rhetorical expressions obtained by the connection relation extraction section 4. The rhetorical structure of the text is determined by finding the combination structure while eliminating inappropriate combinations. Note that if the rhetorical structure of the text is not uniquely determined and a plurality of rhetorical structure candidates are found, the decision is left to the next context structure determining section 8.

しかして文脈構造決定部8は、基本的には知識記憶部9
に格納された知識、例えばテキストが言及している内容
が属する分野の情報、テキスト中このようにして求めら
れたテキストの文脈構造に従い、アプリケーション部1
0は要約作成等の所定の文章編集処理を実行する。
Therefore, the context structure determination section 8 basically consists of the knowledge storage section 9
According to the knowledge stored in the text, such as information about the field to which the content mentioned in the text belongs, and the context structure of the text found in this way, the application part 1
0 executes predetermined text editing processing such as creating a summary.

以上が本装置の構成とその機能である。The above is the configuration of this device and its functions.

ここで上述した修辞表現に基づく修辞構造の決定処理に
ついて第4図および第5図を参照して更に詳しく説明す
る。
The process of determining a rhetorical structure based on the above-mentioned rhetorical expressions will now be described in more detail with reference to FIGS. 4 and 5.

第4図は文脈処理の対象とするテキストの例を示す図で
ある。このようなテキストが入力されると前記書式構造
解析部2は、例えばインデンテーションや句読点、コン
マ、ピリオド等の書式的情報から上記テキストを構成す
る文章部分を複数のパラグラフや文に分割し、例えばこ
こではパラグラフ$11. #2.〜#5をそれぞれ求
める。このようにして求められた各パラグラフについて
形態素解析部3はその形態素解析を実行することになる
FIG. 4 is a diagram showing an example of text to be subjected to context processing. When such a text is input, the format structure analysis unit 2 divides the sentence part constituting the text into a plurality of paragraphs or sentences based on format information such as indentations, punctuation marks, commas, periods, etc. Here is paragraph $11. #2. Find each of ~#5. The morphological analysis unit 3 executes morphological analysis for each paragraph obtained in this way.

しかして接続関係抽出部4は上記各パラグラフの形態素
解析結果に基づき、前記対応テーブル記憶部5を参照し
て各パラグラフ中の修辞表現を探し出し、検出された修
辞表現についてその修辞表前記第4図に示すテキストが
第5図Aに示すように [1対比 2 順接 3 順接 4 参照 5]なる接
続関係でパラグラフ#1. #2.〜#5が順次繋がっ
ていることを求める。
Based on the morphological analysis results of each paragraph, the connection relation extraction section 4 searches the rhetorical expressions in each paragraph by referring to the correspondence table storage section 5, and for the detected rhetorical expressions, the rhetorical table shown in FIG. As shown in Figure 5A, the text shown in Paragraph #1 has the following connection relationship [1 contrast 2 direct conjunction 3 direct conjunction 4 reference 5]. #2. ~#5 is required to be connected in sequence.

しかしこのような接続関係系列は、単に複数のパラグラ
フ間での接続関係を個々に示しているだけであり、その
修辞構造がどのように組合わさっているかについては示
していない。
However, such a connection relationship series merely indicates the connection relationships between multiple paragraphs, but does not show how their rhetorical structures are combined.

しかして修辞構造をなす上記接続関係系列の組合せにつ
いて考えてみると、この5つのパラグラ接続関係が「対
比」であることが求められる。またパラグラフs3から
は「これらの」なる修辞表現とその接続関係r順接」が
求められる。同様にしてパラグラフ#4からは「このよ
うな理由から」なる表示表現と「順接」なる接続関係、
パラグラフ#5からはr以下にその」なる修辞表現と「
参照」なる接続関係が求められる。
However, when considering the combination of the above connection relation series that forms a rhetorical structure, it is required that these five paragraph connection relations are "contrastive." Furthermore, from paragraph s3, the rhetorical expression ``these'' and their connection relation ``conjunction'' are required. Similarly, from paragraph #4, the display expression "for this reason" and the connection relationship "conjunct",
From paragraph #5, below r there is the rhetorical expression "that" and "
A connection relationship called "reference" is required.

このような接続関係から接続関係抽出部4は、合にはそ
の組合せ構造が取り得る形態は2通りである。そして4
つのパラグラフの場合には5通りであり、パラグラフの
数によってその組合せ構造が取り得る形態の数が理論的
に定まる。
Based on such a connection relationship, the connection relationship extraction unit 4 can have two types of combination structures. and 4
In the case of one paragraph, there are five ways, and the number of forms that the combination structure can take is theoretically determined by the number of paragraphs.

尚、この接続関係の系列が取る組合せ構造は、テキスト
中の各文章部分(パラグラフ)がどこに。
The combinatorial structure of this series of connections is where each sentence part (paragraph) in the text is located.

どのような関係で接続するかを示すもので、例えば [1対比[[2順接3]順接[4参照5]]]なる修辞
構造(組合せ構造)は、第1のパラグラフ#1が第2の
パラグラフ#2から第5のパラグラフ#5までの全体に
対して「対比」の関係にあることを示している。そして
第2のパラグラフ#2から第5のパラグラフ#5までに
ついては、第2のパラグラフ善2から「順接」関係にて
第3のパラグラフ#3が導かれ、更にこれらを踏まえて
第4のパラグラフ#4が「順接」関係にて導かれている
ことが示され、その上で第5のパラグラフ#5は「参照
」関係にて第4のパラグラフ#4に附随し、この第4の
パラグラフII4の内容に関連する部分が当該テキスト
め−゛他の部分に存在することを示唆することを示して
いる。
For example, in the rhetorical structure (combinative structure) [1 contrast [[2 injunction 3] injunction [4 reference 5]]], the first paragraph #1 is the first It shows that there is a "contrastive" relationship with the entirety of paragraph #2 of paragraph #2 to paragraph #5 of fifth paragraph. Regarding the second paragraph #2 to the fifth paragraph #5, the third paragraph #3 is derived from the second paragraph #2 in a "conjunctive" relationship, and based on these, the fourth paragraph It is shown that paragraph #4 is derived in a "conjunctive" relationship, and that the fifth paragraph #5 is attached to the fourth paragraph #4 in a "reference" relationship, and this fourth paragraph #5 is attached to the fourth paragraph #4 in a "reference" relationship. This indicates that a portion related to the content of paragraph II4 exists in another portion of the text.

このような修辞構造の表現により複数のパラグラフ間の
接続構造関係が示される。しかし前述したBに示す接続
関係の系列が取る組合せ構造は、単純にその組合せの構
造形態を表わしたものに過ぎず、中には文章構造におけ
る修辞構造として不適切なものもある。そこで修辞構造
決定部6は関係テーブル記憶部7を参照して上記組合せ
構造中の不適切な修辞関係にある構造を見出し、これを
修辞構造の候補から除外している。
This expression of rhetorical structure indicates the connection structure relationship between multiple paragraphs. However, the combinational structure adopted by the series of connection relationships shown in B above simply represents the structural form of the combination, and some of them are inappropriate as rhetorical structures in the sentence structure. Therefore, the rhetorical structure determination section 6 refers to the relational table storage section 7 to find a structure in an inappropriate rhetorical relationship among the combination structures, and excludes this structure from the rhetorical structure candidates.

例えば第5図Cに示すように関係テーブルに示される接
続禁止規則 「順接[・・・[X 順接」 X;パラグラフから上記
組合せ構造中の「順接[3順接」なる組合せ構造を含む
ものは修辞構造として不適切であることが検出される。
For example, as shown in FIG. 5C, the connection prohibition rule "Order connection [... contains is detected to be inappropriate as a rhetorical structure.

そこでこの「順接[3順接」なる組合せ構造を含む接続
関係系列の組合せ構造[1対比[[2順接[3順接[4
参照]]5]1を、その修辞構造の候補から除外する。
Therefore, the combinatorial structure of the connection relation series including the combination structure of "order tangent [3 order tangent"] [1 contrast [[2 order tangent [3 order tangent [4 order tangent]
Reference ] ] 5] 1 is excluded from the candidates for its rhetorical structure.

同様にして関係テーブルの否定的な接続規則「対比[・
・・[X 順接」 から「対比[[2順接Jなる組合せを含む接続関係系列
の組合せ構造 を、その修辞構造の候補から除外する。尚、この否定的
な接続規則に適合するだけの場合には、その組合せの系
列を修辞構造候補として残しておく場合もある。
Similarly, the negative connection rule "contrast [・
...Exclude the combinatorial structure of the connection relation series that includes the combination ``contrast [[2 order connection J'' from [X order connection] from the rhetorical structure candidates. In some cases, the series of combinations may be left as rhetorical structure candidates.

このようにして修辞構造決定部6は、前記接続関係抽出
部4にて求められた接続関係の系列に従い、その系列が
理論的に取り得る修辞構造の組合せの中から修辞構造と
して不適切なものを前記関係テーブル記憶部7を参照し
て検出・除外し、修辞構造としての候補の絞り込みを行
なう。そしてこの候補の絞り込みにおいて修辞構造が一
義的に求められた場合には、これをその修辞構造として
決定し、複数の候補が残されている場合には、その決定
を知識を用いた文脈構造決定部8に委ねる。
In this way, the rhetorical structure determining section 6 selects inappropriate rhetorical structures from among the combinations of rhetorical structures that the series can theoretically take, according to the series of connective relationships determined by the connective relationship extracting section 4. are detected and excluded by referring to the relational table storage unit 7, and the candidates as rhetorical structures are narrowed down. If a rhetorical structure is uniquely found in this narrowing down of candidates, this is determined as the rhetorical structure, and if multiple candidates remain, the decision is made by determining the context structure using knowledge. Leave it to Department 8.

そしてこのようにして決定されたテキストの修辞構造を
参酌し、テキスト内容の構造等を決定して最終的な文脈
構造を決定する。
Then, taking into consideration the rhetorical structure of the text determined in this way, the structure of the text content, etc. is determined, and the final context structure is determined.

かくしてこのように構成された本装置によれば、テキス
トの名詞や動詞を解析するだけではなく、テキスト中に
出現する修辞表現によって示されるテキストの修辞構造
を解析し、この修辞構造を参酌して上記テキストの文脈
構造を決定して文脈路理を行なうので、テキスト中に出
現する名詞や動詞に関する情報が辞書登録されていない
場合であっても、その未登録語に左右されることなく適
切な文脈処理を行なうことが可能となる。しかも修辞表
現から解析される修辞構造を利用して文脈処理を行なう
ので、例えば前提と結論や判断と例示等のような修辞構
造を適確に捉えて文脈処理することができ、その文脈を
適確に捉えた言語処理を実行することが可能となる。
According to this device configured in this way, it not only analyzes nouns and verbs in a text, but also analyzes the rhetorical structure of the text indicated by the rhetorical expressions that appear in the text, and takes this rhetorical structure into consideration. Since the above-mentioned context structure of the text is determined and context logic is performed, even if information about nouns and verbs that appear in the text is not registered in the dictionary, appropriate information can be determined without being influenced by the unregistered words. It becomes possible to perform context processing. Furthermore, since context processing is performed using rhetorical structures analyzed from rhetorical expressions, it is possible to accurately capture and context-process rhetorical structures such as premises and conclusions, judgments and illustrations, and the context can be appropriately processed. It becomes possible to execute language processing that is accurately captured.

尚、本発明は上述した実施例に限定されるものではなく
、書式構造の解析や形態素解析等は従来より提唱されて
いる種々のアルゴリズムを適宜用いて行なえば良いもの
である。また対応テーブルや関係テーブルに登録してお
く情報も上述した例に限定されるものではない。更には
ここでは日本語処理について説明したが、英語等の他の
言語に対する文脈処理についても同様に適用することが
できる。その他、本発明はその要旨を逸脱しない範囲で
種々変形して実施することができる。
It should be noted that the present invention is not limited to the above-described embodiments, and format structure analysis, morphological analysis, etc. may be performed using various conventionally proposed algorithms as appropriate. Furthermore, the information registered in the correspondence table and relational table is not limited to the above-mentioned example. Furthermore, although Japanese processing has been described here, context processing for other languages such as English can be similarly applied. In addition, the present invention can be implemented with various modifications without departing from the gist thereof.

[発明の効果] 以上説明したように本発明によれば、テキスト中に出現
する修辞表現に着目してその修辞構造を求め、この修辞
構造を利用して上記テキストの文脈構造を解析するので
、テキスト中に未登録語が含まれるような場合であって
も効果的に、且つ適確にその文脈構造を決定することが
できる等の一実用上多大なる効果が奏せられる。
[Effects of the Invention] As explained above, according to the present invention, the rhetorical structure of the text is determined by focusing on the rhetorical expressions that appear in the text, and the context structure of the text is analyzed using this rhetorical structure. Even in cases where unregistered words are included in a text, the context structure can be determined effectively and accurately, which provides a great practical effect.

【図面の簡単な説明】[Brief explanation of the drawing]

図は本発明の一実施例に係る文脈処理装置につき示すも
ので、第1図は実施例装置の要部概略構成図、第2図は
対応テーブルの構成例を示す図、第3図は関係テーブル
の構成例を示す図、第4図は文脈処理されるテキストの
例を示す図、第5図はテキストの修辞構造解析処理の形
態を模式的に示す図である。 ■・・・テキスト入力部、2・・・書式構造解析部、3
・・・形態素解析部、4・・・接続関係抽出部、5・・
・対応テーブル記憶部、B・・・修辞構造決定部、7・
・・関係テーブル記憶部、8・・・文脈構造決定部、9
・・・知識記憶部、IO・・・アプリケーション部。 出願人 工業技術院長 飯塚幸三 第 図 第 因 (a) 第 図 第 図
The figures show a context processing device according to an embodiment of the present invention. FIG. 1 is a schematic diagram of the main parts of the embodiment device, FIG. 2 is a diagram showing an example of the configuration of a correspondence table, and FIG. 3 is a diagram showing the relationship between FIG. 4 is a diagram showing an example of the structure of a table, FIG. 4 is a diagram showing an example of a text subjected to context processing, and FIG. 5 is a diagram schematically showing a form of text rhetorical structure analysis processing. ■...Text input section, 2...Format structure analysis section, 3
...Morphological analysis unit, 4...Connection relationship extraction unit, 5...
・Correspondence table storage unit, B...rhetorical structure determination unit, 7.
...Relationship table storage section, 8...Context structure determination section, 9
...knowledge storage section, IO...application section. Applicant Director of the Agency of Industrial Science and Technology Kozo Iizuka Figure 1 (a) Figure 1

Claims (3)

【特許請求の範囲】[Claims] (1)修辞表現とその修辞表現が意味する接続関係とを
示す対応テーブルを備え、この対応テーブルを参照して
テキスト中に出現する修辞表現から上記テキストを構成
する文章部分間の接続関係を調べて前記テキストの修辞
構造を求める手段と、この修辞構造を利用して前記テキ
ストの文脈構造を決定する手段とを具備したことを特徴
とする文脈処理装置。
(1) A correspondence table showing rhetorical expressions and the connection relationships implied by the rhetorical expressions is provided, and the connection relationships between the sentence parts that make up the text are checked from the rhetorical expressions appearing in the text by referring to this correspondence table. A context processing device comprising: means for determining the rhetorical structure of the text; and means for determining the context structure of the text using the rhetorical structure.
(2)修辞表現とその修辞表現が意味する接続関係とを
示す対応テーブルと、接続関係間の接続規則を示す関係
テーブルとを備え、前記対応テーブルを参照してテキス
ト中に出現する修辞表現から上記テキストを構成する文
章部分間の接続関係の系列を求める手段と、前記関係テ
ーブルを参照して上記接続関係の系列の接続・構造を調
べて前記テキストの修辞構造を求める手段と、この修辞
構造を利用して前記テキストの文脈構造を決定する手段
を具備したことを特徴とする文脈処理装置。
(2) A correspondence table showing rhetorical expressions and connection relations implied by the rhetorical expressions, and a relation table showing connection rules between connection relations, and by referring to the correspondence table, the rhetorical expressions appearing in the text are means for determining a series of connection relationships between sentence parts constituting the text; means for determining the rhetorical structure of the text by referring to the relationship table and examining the connection/structure of the series of connection relationships; and the rhetorical structure of the text. 1. A context processing device comprising: means for determining a context structure of the text using the method.
(3)関係テーブルは接続関係間の接続禁止規則からな
り、接続関係の系列が取り得ない接続構造の排除に用い
られるものであり請求項第(2)項に記載の文脈処理装
置。
(3) The context processing device according to claim (2), wherein the relationship table is made up of connection prohibition rules between connection relationships, and is used to eliminate connection structures in which the series of connection relationships cannot be taken.
JP1007856A 1989-01-18 1989-01-18 Context processor Expired - Lifetime JPH0715692B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1007856A JPH0715692B2 (en) 1989-01-18 1989-01-18 Context processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1007856A JPH0715692B2 (en) 1989-01-18 1989-01-18 Context processor

Publications (2)

Publication Number Publication Date
JPH02188870A true JPH02188870A (en) 1990-07-24
JPH0715692B2 JPH0715692B2 (en) 1995-02-22

Family

ID=11677277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1007856A Expired - Lifetime JPH0715692B2 (en) 1989-01-18 1989-01-18 Context processor

Country Status (1)

Country Link
JP (1) JPH0715692B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04157567A (en) * 1990-10-22 1992-05-29 Agency Of Ind Science & Technol Context structure display device
JPH0612447A (en) * 1992-03-31 1994-01-21 Toshiba Corp Summary sentence preparing device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04157567A (en) * 1990-10-22 1992-05-29 Agency Of Ind Science & Technol Context structure display device
JPH0612447A (en) * 1992-03-31 1994-01-21 Toshiba Corp Summary sentence preparing device

Also Published As

Publication number Publication date
JPH0715692B2 (en) 1995-02-22

Similar Documents

Publication Publication Date Title
Bouma et al. Alpino: Wide-coverage computational analysis of Dutch
JPS6299865A (en) Maintenance system for co-occurrence relation dictionary of natural language
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
US6876963B1 (en) Machine translation method and apparatus capable of automatically switching dictionaries
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JP2883153B2 (en) Keyword extraction device
Ehsan et al. A Pairwise Document Analysis Approach for Monolingual Plagiarism Detection.
JPH02188870A (en) Context processor
Hellwig Performance of a Lexical and POS Tagger for Sanskrit
JPH1139313A (en) Automatic document classification system, document classification oriented knowledge base creating method and record medium recording its program
JP2536633B2 (en) Compound word extraction device
JP4054035B2 (en) Database construction apparatus, database construction method, database construction program, and recording medium
Oostdijk et al. Constructing a broad-coverage lexicon for text mining in the patent domain
Sass The verb argument browser
JP4289871B2 (en) Rhetorical structure analysis method for patent claims, rhetorical structure analysis program for patent claims, and rhetorical structure analysis system for claims
JP3752535B2 (en) Translation selection device and translation device
JPH0743728B2 (en) Summary sentence generation method
JPH0474259A (en) Document summarizing device
JP2000090110A (en) Full-text retrieval method, device therefor and recording medium recorded with full-text retrieving program
Badia et al. A modular architecture for the processing of free text
JPH077418B2 (en) Natural language context processor
Mitkov How far are we from (semi-) automatic annotation of anaphoric links in corpora?
JPH0795323B2 (en) Natural language processor
JP3222173B2 (en) Japanese parsing system
JPH06325018A (en) Device for supporting dictionary preparation and method thereof

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term