JPH0715692B2 - Context processor - Google Patents

Context processor

Info

Publication number
JPH0715692B2
JPH0715692B2 JP1007856A JP785689A JPH0715692B2 JP H0715692 B2 JPH0715692 B2 JP H0715692B2 JP 1007856 A JP1007856 A JP 1007856A JP 785689 A JP785689 A JP 785689A JP H0715692 B2 JPH0715692 B2 JP H0715692B2
Authority
JP
Japan
Prior art keywords
rhetorical
text
connection
context
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1007856A
Other languages
Japanese (ja)
Other versions
JPH02188870A (en
Inventor
顕司 小野
真家 天野
輝彦 浮田
Original Assignee
工業技術院長
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 工業技術院長 filed Critical 工業技術院長
Priority to JP1007856A priority Critical patent/JPH0715692B2/en
Publication of JPH02188870A publication Critical patent/JPH02188870A/en
Publication of JPH0715692B2 publication Critical patent/JPH0715692B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は自然言語処理においてテキストの文脈構造を効
果的に決定することのできる文脈処理装置に関する。
The present invention relates to a context processing device capable of effectively determining the context structure of text in natural language processing.

(従来の技術) 近時、自然言語処理の研究が種々進められており、テキ
ストの文脈構造を調べてその意味解析することまでも行
なわれるようになってきた。従来、この種の文脈構造の
決定は、専らテキスト中に出現する名詞や動詞を調べ、
それら単語に関する係り受け条件や品詞の繋がり関係等
の情報を登録した辞書を参照して上記名詞や動作の繋が
り関係を調べながら行なわれている。つまりテキスト中
に出現する名詞や動詞を手掛りとしてその文脈構造を求
めている。
(Prior Art) Recently, various studies on natural language processing have been advanced, and even the investigation of the context structure of texts and their semantic analysis have been performed. Conventionally, the determination of this kind of context structure is done by examining the nouns and verbs that appear in the text,
It is performed while referring to a dictionary in which information such as dependency conditions and relations of part-of-speech relations regarding these words is registered and checking the relations of connection of the nouns and actions. That is, the nouns and verbs appearing in the text are used as clues to obtain the context structure.

ところがテキスト中に出現可能性のある全ての名詞や動
詞に関する情報を辞書登録しておくことは現実的に殆ん
ど不可能であり、辞書登録されていない単語がテキスト
中に出現した場合にはその文脈構造の決定が非常に難し
くなることが否めない。この為、例えばテキストが言及
している内容に応じて、その対象分野で用いられる名詞
や動詞に関する情報をその都度作成し、これを単語辞書
に登録することが必要となった。しかしその作業自体が
非常に大変であり、種々対象分野のテキストに適合させ
てそのまま文脈構造の決定に用いることが困難であっ
た。
However, it is practically impossible to register information about all nouns and verbs that may appear in the text in the dictionary. It is undeniable that determining its contextual structure will be very difficult. For this reason, for example, it is necessary to create information about nouns and verbs used in the target field each time according to the content referred to by the text, and register this in the word dictionary. However, the work itself is extremely difficult, and it is difficult to adapt it to the texts of various target fields and use it as it is for determining the context structure.

またテキストは複数のパラグラフ間で前提と結論、或い
は判断と例示と云うような修辞構造を取ることが多々あ
る。しかし従来では上述したようにテキスト中の名詞や
動詞を手掛りとして文脈構造を調べているだけなので、
求められた文脈構造が上述した修辞構造にそぐわず、不
適切なものとなることがあった。
In addition, text often has a rhetorical structure such as a premise and a conclusion, or a judgment and an illustration among a plurality of paragraphs. However, conventionally, as mentioned above, we are only investigating the context structure using the nouns and verbs in the text as clues.
The required context structure did not match the rhetorical structure described above, and was sometimes inappropriate.

(発明が解決しようとする課題) このような従来では、専らテキスト中に出現する名詞や
動詞を手掛りとしてその文脈構造を調べているだけなの
で、その文脈構造を決定するにはテキスト中に出現する
名詞や動詞に関する情報を予め辞書登録しておく必要が
ある等、幾つかの課題が残されている。
(Problems to be Solved by the Invention) In such a conventional technique, the context structure is examined only by using the nouns and verbs that appear in the text as clues, so that the context structure is determined in the text. Some problems remain, such as having to register information about nouns and verbs in a dictionary in advance.

本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、個々の名詞や動詞に関する情報
が不足している場合であってもテキストの文脈構造を良
好に決定することのできる実用性に優れた文脈処理装置
を提供することにある。
The present invention has been made in consideration of such circumstances, and an object thereof is to properly determine the context structure of a text even when information about individual nouns or verbs is insufficient. An object of the present invention is to provide a context processing device that is capable of achieving excellent practicality.

[発明の構成] (課題を解決するための手段) 本発明に係る文脈処理装置は、修辞表現とその修辞表現
が意味する接続関係とを示す対応テーブルと、接続関係
間の接続禁止規則からなり、接続関係の系列が取り得な
い接続構造の接除に用いられる関係テーブルとを備え、 前記対応テーブルを参照してテキスト中に出現する修辞
表現から上記テキストを構成する文章部分間の接続関係
の系列を求める手段と、 前記関係テーブルを参照して上記接続関係の系列の接続
構造を調べて前記テキストの修辞構造を求める手段と、 この修辞構造を利用して前記テキストの文脈構造を決定
する手段とを具備したことを特徴とする。
[Structure of the Invention] (Means for Solving the Problem) A context processing device according to the present invention comprises a correspondence table showing rhetorical expressions and connection relationships that the rhetorical expressions mean, and connection prohibition rules between the connection relationships. , A relational table used for removing connection structures that cannot be taken by a sequence of connection relations, and a sequence of connection relations between sentence parts forming the text from rhetorical expressions appearing in the text with reference to the correspondence table. A means for obtaining the rhetorical structure of the text by examining the connection structure of the series of connection relations with reference to the relation table, and a means for determining the context structure of the text by using the rhetorical structure. Is provided.

また更には前記修辞表現が意味する接続関係間の接続規
制を示す関係テーブルを準備し、前記対応テーブルを参
照して求められる前記テキストを構成する文章部分間の
接続関係の系列の接続構造を前記関係テーブルを参照し
て調べてその修辞構造を求め、この修辞構造を利用して
前記テキストの文脈構造を決定するようにしたことを特
徴とするものである。
Furthermore, a relation table showing the connection regulation between the connection relations indicated by the rhetorical expression is prepared, and the connection structure of the connection relation series between the sentence parts constituting the text obtained by referring to the correspondence table is described. It is characterized in that the relational table is checked to find the rhetorical structure, and the contextual structure of the text is determined using this rhetorical structure.

(作 用) 本発明によれば、テキスト中に出現する名詞や動詞に関
する情報の全てが辞書登録されていない状態であって
も、上記テキスト中の修辞表現に着目し、修辞表現から
文章部分間の接続関係の接続構造を調べてその修辞構造
を決定し、この修辞構造に従って文脈構造を決定するの
で、名詞や動詞に関する情報が不足する場合であっても
その文脈構造を効果的に決定することが可能となる。し
かも文章部分間の修辞構造を活用してその文脈構造を調
べるので、適切な文脈処理を行なうことが可能となる。
(Operation) According to the present invention, even if all the information about nouns and verbs appearing in a text is not registered in the dictionary, attention is paid to the rhetorical expression in the text, and the text part is separated from the rhetorical expression. Since the rhetorical structure is determined by examining the connection structure of the connection relations and the contextual structure is determined according to this rhetorical structure, the contextual structure can be effectively determined even when information about nouns and verbs is insufficient. Is possible. Moreover, since the context structure is examined by utilizing the rhetorical structure between the sentence parts, it is possible to perform an appropriate context processing.

(実施例) 以下、図面を参照して本発明の一実施例に係る文脈処理
装置につき説明する。
(Embodiment) Hereinafter, a context processing device according to an embodiment of the present invention will be described with reference to the drawings.

第1図は実施例装置の要部概略構成図で、1は解析処理
対象となる文書データや記録データ等のテキストを入力
するテキスト入力部である。書式構造解析部2は上記テ
キスト入力部1から入力されるテキストに含まれる章や
節等の書式的な情報からテキスト全体の書式的構造を解
析し、その構造を決定するものである。このようにして
書式的構造が決定されたテキストに対して形態素解析部
3は、例えばパラグラフ単位にそのパラグラフに含まれ
る文の形態素解析を実行する。この形態素解析によって
テキスト中の名詞や動詞等の形態素が個々に求められ
る。
FIG. 1 is a schematic configuration diagram of a main part of the embodiment apparatus, and 1 is a text input unit for inputting text such as document data or recorded data to be analyzed. The format structure analysis unit 2 analyzes the format structure of the entire text from the format information such as chapters and sections included in the text input from the text input unit 1 and determines the structure. The morpheme analysis unit 3 executes the morpheme analysis of the sentence included in the paragraph, for example, on a paragraph-by-paragraph basis with respect to the text for which the formal structure is determined in this manner. By this morphological analysis, morphemes such as nouns and verbs in the text are individually obtained.

以上の処理機能は従来の文脈処理装置と同様な機能を呈
するものであり、また従来より種々提唱されている手法
を用いて実現される。
The above processing functions have the same functions as those of the conventional context processing device, and are realized by using various conventionally proposed methods.

ここで本装置が特徴とするところは、上記形態素解析部
3により求められたテキストの形態素解析結果に従い、
テキスト中の修辞表現を手掛りとして当該テキストを構
成する複数の文章部分(例えばパラグラフ)の接続関係
を求める接続関係抽出部4が設けられている点にある。
この接続関係抽出部4は、例えば第2図に示すように接
続詞等の修辞表現とその接続関係を示す対応テーブルを
格納した対応テーブル記憶部5を参照して前記テキスト
中の修辞表現を調べ、その修辞表現にて結び付けられて
いるパラグラフ間等の接続関係を求めるものである。例
えば『但し』なる修辞表現が求められた場合には、その
修辞表現の前に存在するパラグラフと、上記修辞表現が
付されたパラグラフとが「捕足」の関係にあることを示
す接続関係を求めている。
Here, the feature of this device is that according to the morphological analysis result of the text obtained by the morphological analysis unit 3,
The point is that the connection relation extraction unit 4 is provided for obtaining connection relations between a plurality of sentence parts (for example, paragraphs) forming the text using the rhetorical expression in the text as a clue.
The connection relation extracting unit 4 checks the rhetorical expression in the text by referring to a correspondence table storage unit 5 which stores a rhetorical expression such as a conjunction and a correspondence table showing the connection relation as shown in FIG. It seeks the connection relation between paragraphs connected by the rhetorical expression. For example, when a rhetorical expression of "But" is requested, a connection relation indicating that the paragraph existing before the rhetorical expression and the paragraph with the above rhetorical expression have a "capture" relationship Looking for.

この接続関係抽出部4にて前記テキスト中に出現する全
ての修辞表現が順次求められ、且つその修辞表現で示さ
れる文章部分間の接続関係が個々に求められる。
The connection relation extracting unit 4 sequentially finds all rhetorical expressions that appear in the text, and individually finds the connection relations between the text parts indicated by the rhetorical expressions.

このような接続関係抽出部4に加えて本装置が特徴とす
る今1つの点は、修辞構造決定部6を備えている点にあ
る。この修辞構造決定部6は、例えば第3図に示すよう
に上記修辞表現が示す接続関係の接続に関する禁止規則
を関係テーブルとして格納した関係テーブル記憶部7を
参照し、前記接続関係抽出部4にて求められた文章部分
間の接続関係の系列からパラグラフ内、およびパラグラ
フ間の修辞構造を求めるものである。
Another feature of the present device in addition to the connection relation extracting unit 4 is that it has a rhetorical structure determining unit 6. The rhetorical structure determination unit 6 refers to the relation table storage unit 7 that stores, as a relation table, a prohibition rule regarding the connection of the connection relation indicated by the rhetorical expression as shown in FIG. The rhetorical structure within and between paragraphs is obtained from the series of connection relations between the sentence parts obtained as described above.

この関係テーブルは第3図(a)に示すような修辞表現
によって示される接続関係の構造的な接続禁止規則を示
す情報と、第3図(b)に示すような上記接続関係の否
定的な接続規則を示す情報とを登録したテーブルからな
り、テキストの修辞構造として不適切な接続関係間の構
造を示している。特に上記接続禁止規則は、修辞表現に
よって結ばれるパラグラフ間の接続関係の中での実際的
に出現することのない組合せ構造を示している。また否
定的な接続規則は上記接続禁止規則ほどでないにしろ、
一般的には殆んど用いられることのない組合せ構造を示
している。
This relation table contains information indicating structural connection prohibition rules of connection relations represented by rhetorical expressions as shown in FIG. 3 (a) and negative connection relations as shown in FIG. 3 (b). It is composed of a table in which information indicating connection rules is registered, and indicates a structure between connection relationships that is inappropriate as a rhetorical structure of text. In particular, the above connection prohibition rule indicates a combinational structure that does not actually appear in the connection relation between paragraphs connected by rhetorical expressions. Also, even if the negative connection rule is not the same as the above connection prohibition rule,
Generally, it shows a combination structure that is rarely used.

修辞構造決定部6はこのような情報を有する関係テーブ
ル記憶部7を参照し、前記接続関係抽出部4で求められ
た修辞表現によって結ばれるパラグラフ間の接続関係を
示す系列から、テキストの修辞構造として不適切な組合
せを排除しながらその組合せ構造を求めて該テキストの
修辞構造を決定している。尚、テキストの修辞構造が一
義的に決定されず、複数の修辞構造候補が求められた場
合には、その決定は次の文脈構造決定部8に委ねられ
る。
The rhetorical structure determination unit 6 refers to the relation table storage unit 7 having such information, and from the sequence showing the connection relation between the paragraphs connected by the rhetorical expression obtained by the connection relation extraction unit 4, the rhetorical structure of the text. As a result, the rhetorical structure of the text is determined by finding the combination structure while eliminating inappropriate combinations. When the rhetorical structure of the text is not uniquely determined and a plurality of rhetorical structure candidates are obtained, the decision is entrusted to the next context structure determination unit 8.

しかして文脈構造決定部8は、基本的には知識記憶部9
に格納された知識、例えばテキストが言及している内容
が属する分野の情報、テキスト中に出現する品詞の接続
関係に関する知識や係り受け関係の知識等を用い、上述
したテキストの修辞構造に従いながら、或いはテキスト
の修辞構造を決定してその文脈構造を決定する。つまり
この文脈構造の決定は、基本的には従来の文脈処理装置
と同様にして行なわれるが、この際、上述した修辞表現
から解析される修辞構造に従ってその文脈構造を決定し
ていくことを特徴としている。
Therefore, the context structure determination unit 8 basically has the knowledge storage unit 9
Using the knowledge stored in, for example, information on the field to which the content referred to by the text belongs, knowledge about the connection relation of the part of speech appearing in the text, and the dependency relation, while following the rhetorical structure of the text described above, Alternatively, determine the rhetorical structure of the text and determine its contextual structure. In other words, this context structure is basically determined in the same manner as a conventional context processing device, but at this time, the context structure is determined according to the rhetorical structure analyzed from the rhetorical expression described above. I am trying.

このようにして求められたテキストの文脈構造に従い、
アプリケーション部10は要約作成等の所定の文章編集処
理を実行する。
According to the context structure of the text obtained in this way,
The application unit 10 executes a predetermined text editing process such as creating a summary.

以上が本装置の構成とその機能である。The above is the configuration and function of the present apparatus.

ここで上述した修辞表現に基づく修辞構造の決定処理に
ついて第4図および第5図を参照して更に詳しく説明す
る。
The rhetorical structure determination process based on the rhetorical expression described above will be described in more detail with reference to FIGS. 4 and 5.

第4図は文脈処理の対象とするテキストの例を示す図で
ある。このようなテキストが入力されると前記書式構造
解析部2は、例えばインデンテーションや句読点,コン
マ,ピリオド等の書式的情報から上記テキストを構成す
る文章構造を複数のパラグラフや文に分割し、例えばこ
こではパラグラフ#1,#2,〜#5をそれぞれ求める。こ
のようにして求められた各パラグラフについて形態素解
析部3はその形態素解析を実行することになる。
FIG. 4 is a diagram showing an example of text to be subjected to context processing. When such text is input, the format structure analysis unit 2 divides the text structure constituting the text into a plurality of paragraphs or sentences from the format information such as indentation, punctuation marks, commas, periods, etc. Here, paragraphs # 1, # 2, and # 5 are respectively obtained. The morpheme analysis unit 3 executes the morpheme analysis for each paragraph thus obtained.

しかして接続関係抽出部4は上記各パラグラフの形態素
解析結果に基づき、前記対応テーブル記憶部5を参照し
て各パラグラフ中の修辞表現を探し出し、検出された修
辞表現についてその修辞表現が意味する接続関係の情報
を前記対応テーブル記憶部5から求める。
Then, the connection relation extracting unit 4 looks up the rhetorical expression in each paragraph by referring to the correspondence table storage unit 5 based on the morphological analysis result of each of the above paragraphs, and the connection that the rhetorical expression means for the detected rhetorical expression. Relationship information is obtained from the correspondence table storage unit 5.

この例では図中波下線で示すように、パラグラフ#2か
ら『一方』なる修辞表現が求められ、その接続関係が
『対比』であることが求められる。またパラグラフ#3
からは『これらの』なる修辞表現とその接続関係『順
接』が求められる。同様にしてパラグラフ#4からは
『このような理由から』なる表示表現と『順接』なる接
続関係、パラグラフ#5からは『以下にその』なる修辞
表現『参照』なる接続関係が求められる。
In this example, as shown by the underlined wave in the figure, the rhetorical expression "one side" is obtained from paragraph # 2, and the connection relation is required to be "contrast". See also paragraph # 3
Requires the rhetorical expression "these" and its connection relation "junction". Similarly, from paragraph # 4, the display relation “for this reason” and the connection relation “junction” are obtained, and from paragraph # 5, the relation relation rhetorical expression “reference” “below” is obtained.

このような接続関係から接続関係抽出部4は、前記第4
図に示すテキストが第5図Aに示すように [1 対比 2 順接 3 順接 4 参照 5] なる接続関係でパラグラフ#1,#2,〜#5が順次繋がっ
ていることを求める。
From such a connection relation, the connection relation extracting unit 4
As shown in FIG. 5A, the text shown in the figure requires that paragraphs # 1, # 2, and # 5 are sequentially connected in a connection relation [1 contrast 2 forward 3 forward 4 reference 5].

しかしこのような接続関係系列は、単に複数のパラグラ
フ間での接続関係を個々に示しているだけであり、その
修辞構造がどのように組合わさっているかについては示
していない。
However, such a connection relation series merely shows connection relations among a plurality of paragraphs individually, and does not show how the rhetorical structures are combined.

しかして修辞構造をなす上記接続関係系列の組合せにつ
いて考えてみると、この5つのパラグラフが存在する場
合には、理論的には第5図Bに示すように14通りの組合
せが考えられる。尚、パラグラフが2つの場合には、そ
の組合せ構造が取り得る形態は1つであり、パラグラフ
が3つの場合にはその組合せ構造が取り得る形態は2通
りである。そして4つのパラグラフの場合には5通りで
あり、パラグラフの数によってその組合せ構造が取り得
る形態の数が理論的に定まる。
Then, considering the combination of the connection relation series forming the rhetorical structure, if these five paragraphs exist, theoretically, there are 14 possible combinations as shown in FIG. 5B. When there are two paragraphs, the combination structure can take one form, and when there are three paragraphs, the combination structure can take two forms. In the case of four paragraphs, there are five types, and the number of paragraphs theoretically determines the number of forms that the combined structure can take.

尚、この接続関係の系列が取る組合せ構造は、テキスト
中の各文章部分(パラグラフ)がどこに,どのような関
係で接続するかを示すもので、例えば [1対比[[2順接3]順接[参照5]]] なる修辞構造(組合せ構造)は、第1のパラグラフ#1
が第2のパラグラフ#2から第5のパラグラフ#5まで
の全体に対して『対比』の関係にあることを示してい
る。そして第2のパラグラム#2から第5のパラグラフ
#5までについては、第2のパラグラフ#2から『順
接』関係にて第3のパラグラフ#3が導かれ、更にこれ
らを踏まえて第4のパラグラフ#4が『順接』関係にて
導かれていることが示され、その上で第5のパラグラフ
#5は『参照』関係にて第4のパラグラフ#4に附随
し、この第4のパラグラフ#4の内容を関連する部分が
当該テキストの他の部分に存在することを示唆すること
を示している。
The combinational structure taken by the series of connection relations indicates where each sentence portion (paragraph) in the text is connected and in what relation. For example, [1 contrast [[2 concatenation 3] order The contact [Ref 5]]] rhetorical structure (combinational structure) is the first paragraph # 1.
Indicates that there is a "contrast" relationship with the whole of the second paragraph # 2 to the fifth paragraph # 5. Then, regarding the second paragraph # 2 to the fifth paragraph # 5, the third paragraph # 3 is derived from the second paragraph # 2 in a "forward connection" relationship, and further, based on these, the fourth paragraph # 3 is introduced. It is shown that paragraph # 4 is guided in a "forward" relationship, on which the fifth paragraph # 5 follows the fourth paragraph # 4 in a "reference" relationship. The content of paragraph # 4 is shown to indicate that the relevant portion is present elsewhere in the text.

このような修辞構造の表現により複数のパラグラフ間の
接続構造関係が示される。しかし前述したBに示す接続
関係の系列が取る組合せ構造は、単純にその組合せの構
造形態を表わしたものに過ぎず、中には文章構造におけ
る修辞構造として不適切なものもある。そこで修辞構造
決定部6は関係テーブル記憶部7を参照して上記組合せ
構造中の不適切な修辞関係にある構造を見出し、これを
修辞構造の候補から除外している。
The expression of such rhetorical structure shows the connection structure relation between a plurality of paragraphs. However, the above-mentioned combination structure taken by the series of connection relations shown in B merely represents the structural form of the combination, and some of them are unsuitable as rhetorical structures in the text structure. Therefore, the rhetorical structure determination unit 6 refers to the relationship table storage unit 7 to find a structure having an inappropriate rhetorical relationship in the combined structure, and excludes this structure from candidates for rhetorical structure.

例えば第5図Cに示すように関係テーブルに示される接
続禁止規則 『順接[…[X 順接』 X;パラグラフ から上記組合せ構造中の『順接[3順接』なる組合せ構
造を含むものは修辞構造として不適切であることが検出
される。そこでこの『順接[3順接』なる組合せ構造を
含む接続関係系列の組合せ構造 [1対比[[順接[3順接[4参照]]5]] を、その修辞構造の候補から除外する。
For example, as shown in FIG. 5C, the connection prohibition rule "junction [... [X order"X; Paragraph includes a combination structure of "order [3 order]" in the above combination structure. Is detected as inappropriate as a rhetorical structure. Therefore, this combination structure of the connection relation series including the combination structure of "junction [3 order"] [1 contrast [[ order [3 order [4]] 5]] is excluded from the rhetorical structure candidates. .

同様にして関係テーブルの否定的な接続規則 『対比[…[X 順接』 から『対比[[2順接』なる組合せを含む接続関係系列
の組合せ構造 [1対比[[2順接[3]順接[4参照5]]] を、その修辞構造の候補から除外する。尚、この否定的
な接続規則に適合するだけの場合には、その組合せの系
列を修辞構造候補として残しておく場合もある。
Similarly, the negative connection rule of the relation table includes a combination structure of connection relation series including a combination of "contrast [... [X ordering]" to "contrast [[2 ordering]" [1 contrasting [[2 ordering [3] [4 [5]]]] is excluded from the candidates for the rhetorical structure. In addition, when only this negative connection rule is satisfied, the series of the combination may be left as a rhetorical structure candidate.

このようにして修辞構造決定部6は、前記接続関係抽出
部4にて求められた接続関係の系列に従い、その系列が
理論的に取り得る修辞構造の組合せの中から修辞構造と
して不適切なものを前記関係テーブル記憶部7を参照し
て検出・除外し、修辞構造としての候補の絞り込みを行
なう。そしてこの候補の絞り込みにおいて修辞構造が一
義的に求められた場合には、これをその修辞構造として
決定し、複数の候補が残されている場合には、その決定
を知識を用いた文脈構造決定部8に委ねる。そしてこの
ようにして決定されたテキストの修辞構造を参酌し、テ
キスト内容の構造等を決定して最終的な文脈構造を決定
する。
In this way, the rhetorical structure determining unit 6 is inadequate as a rhetorical structure among combinations of rhetorical structures which the sequence can theoretically take in accordance with the series of the connecting relations obtained by the connecting relation extracting unit 4. Is detected / excluded by referring to the relationship table storage unit 7, and candidates as a rhetorical structure are narrowed down. Then, when the rhetorical structure is uniquely obtained in narrowing down the candidates, this is determined as the rhetorical structure, and when a plurality of candidates are left, the decision is made on the context structure determination using knowledge. Leave it to Part 8. Then, the rhetorical structure of the text determined in this way is taken into consideration, the structure of the text contents and the like are determined, and the final context structure is determined.

かくしてこのように構成された本装置によれば、テキス
トの名詞や動詞を解析するだけでなく、テキスト中に出
現する修辞表現によって示されるテキストの修辞構造を
解析し、この修辞構造を参酌して上記テキストの文脈構
造を決定して文脈処理を行なうので、テキスト中に出現
する名詞や動詞に関する情報が辞書登録されていない場
合であっても、その未登録語に左右されることなく適切
な文脈処理を行なうことが可能となる。しかも修辞表現
から解析される修辞構造を利用して文脈処理を行なうの
で、例えば前提と結論や判断と例示等のような修辞構造
を適確に捉えて文脈処理することができ、その文脈を適
確に捉えた言語処理を実行することが可能となる。
Thus, according to the present apparatus thus configured, not only the nouns and verbs of the text are analyzed, but also the rhetorical structure of the text indicated by the rhetorical expressions appearing in the text is analyzed, and this rhetorical structure is taken into consideration. Since the context structure of the above text is determined and context processing is performed, even if the information about the noun or verb appearing in the text is not registered in the dictionary, an appropriate context is not affected by the unregistered word. It becomes possible to perform processing. Moreover, since the context processing is performed by using the rhetorical structure analyzed from the rhetorical expression, the context processing can be performed by appropriately grasping the rhetorical structure such as premise, conclusion, judgment, and illustration. It is possible to execute the language processing that is accurately captured.

尚、本発明は上述した実施例に限定されるものではな
く、書式構造の解析や形態素解析等は従来より提唱され
ている種々のアルゴリズムを適宜用いて行なえば良いも
のである。また対応テーブルや関係テーブルに登録して
おく情報も上述した例に限定されるものではない。更に
はここでは日本語処理について説明したが、英語等の他
の言語に対する文脈処理についても同様に適用すること
ができる。その他、本発明はその要旨を逸脱しない範囲
で種々変形して実施することができる。
It should be noted that the present invention is not limited to the above-described embodiment, and the analysis of the format structure, the morphological analysis, etc. may be performed by appropriately using various algorithms conventionally proposed. Further, the information registered in the correspondence table or the relation table is not limited to the above example. Furthermore, although the Japanese processing has been described here, the context processing for other languages such as English can be similarly applied. In addition, the present invention can be variously modified and implemented without departing from the scope of the invention.

[発明の効果] 以上説明したように本発明によれば、テキスト中に出現
する修辞表現に着目してその修辞構造を求め、この修辞
構造を利用して上記テキストの文脈構造を解析するの
で、テキスト中に未登録語が含まれるような場合であっ
ても効果的に、且つ適確にその文脈構造を決定すること
ができる等の実用上多大なる効果が奏せられる。
[Effects of the Invention] As described above, according to the present invention, the rhetorical expression that appears in a text is focused on, the rhetorical structure is obtained, and the contextual structure of the text is analyzed using this rhetorical structure. Even in the case where an unregistered word is included in the text, it is possible to effectively and accurately determine the context structure, which is very effective in practice.

【図面の簡単な説明】[Brief description of drawings]

図は本発明の一実施例に係る文脈処理装置につき示すも
ので、第1図は実施例装置の要部概略構成図、第2図は
対応テーブルの構成例を示す図、第3図は関係テーブル
の構成例を示す図、第4図は文脈処理されるテキストの
例を示す図、第5図はテキストの修辞構造解析処理の形
態を模式的に示す図である。 1……テキスト入力部、2……書式構造解析部、3……
形態素解析部、4……接続関係抽出部、5……対応テー
ブル記憶部、6……修辞構造決定部、7……関係テーブ
ル記憶部、8……文脈構造決定部、9……知識記憶部、
10……アプリケーション部。
FIG. 1 shows a context processing device according to an embodiment of the present invention. FIG. 1 is a schematic configuration diagram of a main part of the embodiment device, FIG. 2 is a diagram showing a configuration example of a correspondence table, and FIG. FIG. 4 is a diagram showing a configuration example of a table, FIG. 4 is a diagram showing an example of text to be context-processed, and FIG. 5 is a diagram schematically showing a form of rhetorical structure analysis processing of text. 1 ... Text input part, 2 ... Format structure analysis part, 3 ...
Morphological analysis unit, 4 ... Connection relation extraction unit, 5 ... Correspondence table storage unit, 6 ... Rhetorical structure determination unit, 7 ... Relation table storage unit, 8 ... Context structure determination unit, 9 ... Knowledge storage unit ,
10 ... Application Department.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】修辞表現とその修辞表現が意味する接続関
係とを示す対応テーブルと、接続関係間の接続禁止規則
からなり、接続関係の系列が取り得ない接続構造の接除
に用いられる関係テーブルとを備え、 前記対応テーブルを参照してテキスト中に出現する修辞
表現から上記テキストを構成する文章部分間の接続関係
の系列を求める手段と、 前記関係テーブルを参照して上記接続関係の系列の接続
構造を調べて前記テキストの修辞構造を求める手段と、 この修辞構造を利用して前記テキストの文脈構造を決定
する手段とを具備したことを特徴とする文脈処理装置。
1. A relation table used for removing a connection structure, which is composed of a correspondence table showing rhetorical expressions and connection relationships that the rhetorical expressions mean, and a connection prohibition rule between the connection relationships, which is used in a connection structure that cannot be taken by a series of connection relationships. And a means for obtaining a series of connection relations between the sentence parts constituting the text from rhetorical expressions appearing in the text by referring to the correspondence table, and a series of connection relations of the series by referring to the relation table. A context processing device comprising: means for determining a rhetorical structure of the text by examining a connection structure; and means for determining a contextual structure of the text using the rhetorical structure.
JP1007856A 1989-01-18 1989-01-18 Context processor Expired - Lifetime JPH0715692B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1007856A JPH0715692B2 (en) 1989-01-18 1989-01-18 Context processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1007856A JPH0715692B2 (en) 1989-01-18 1989-01-18 Context processor

Publications (2)

Publication Number Publication Date
JPH02188870A JPH02188870A (en) 1990-07-24
JPH0715692B2 true JPH0715692B2 (en) 1995-02-22

Family

ID=11677277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1007856A Expired - Lifetime JPH0715692B2 (en) 1989-01-18 1989-01-18 Context processor

Country Status (1)

Country Link
JP (1) JPH0715692B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04157567A (en) * 1990-10-22 1992-05-29 Agency Of Ind Science & Technol Context structure display device
JPH0612447A (en) * 1992-03-31 1994-01-21 Toshiba Corp Summary sentence preparing device

Also Published As

Publication number Publication date
JPH02188870A (en) 1990-07-24

Similar Documents

Publication Publication Date Title
Bouma et al. Alpino: Wide-coverage computational analysis of Dutch
JP3691844B2 (en) Document processing method
US10296584B2 (en) Semantic textual analysis
JPH083815B2 (en) Natural language co-occurrence relation dictionary maintenance method
JP2883153B2 (en) Keyword extraction device
JP4361299B2 (en) Evaluation expression extraction apparatus, program, and storage medium
JP4054035B2 (en) Database construction apparatus, database construction method, database construction program, and recording medium
JPH0715692B2 (en) Context processor
JP3300142B2 (en) Natural language processor
JPH06318202A (en) Document storage system, document managing system and document display system
JPH0343662B2 (en)
JP2812511B2 (en) Keyword extraction device
JPH0795323B2 (en) Natural language processor
JP4071657B2 (en) Text processing device
JP2840258B2 (en) Method of creating bilingual dictionary and co-occurrence dictionary for machine translation system
JPH077418B2 (en) Natural language context processor
KR100371135B1 (en) Declinable-word morphology analyzing apparatus using a declinable-word derivative-dictionary and method therefor
Sinha Translating News Headings from English to Hindi
JP4103311B2 (en) Natural language processing apparatus and method
JP3244286B2 (en) Translation processing device
JPH0320866A (en) Text base retrieval system
JPH04152458A (en) Word processor
JP2004265014A (en) Personal environment frequency storage device, personal environment language conversion device, personal environment difference emphasis device and program
JPH07200592A (en) Text processor
JPS63136264A (en) Mechanical translating device

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term