JPH0795323B2 - Natural language processor - Google Patents

Natural language processor

Info

Publication number
JPH0795323B2
JPH0795323B2 JP1155902A JP15590289A JPH0795323B2 JP H0795323 B2 JPH0795323 B2 JP H0795323B2 JP 1155902 A JP1155902 A JP 1155902A JP 15590289 A JP15590289 A JP 15590289A JP H0795323 B2 JPH0795323 B2 JP H0795323B2
Authority
JP
Japan
Prior art keywords
unit
connection
sentence
text
argument
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1155902A
Other languages
Japanese (ja)
Other versions
JPH0322083A (en
Inventor
顕司 小野
真家 天野
Original Assignee
工業技術院長
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 工業技術院長 filed Critical 工業技術院長
Priority to JP1155902A priority Critical patent/JPH0795323B2/en
Publication of JPH0322083A publication Critical patent/JPH0322083A/en
Publication of JPH0795323B2 publication Critical patent/JPH0795323B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は自然言語からなるテキスト(文章)の文構造か
らその論旨構造を求めて文章校正を効果的に支援するこ
とのできる自然言語処理装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention] (Industrial field of application) The present invention aims to effectively support sentence proofreading by finding the logical structure of a sentence structure of a text (sentence) composed of natural language. The present invention relates to a natural language processing device.

(従来の技術) 近時、自然言語処理の研究が種々進められており、例え
ば作成済みの文章(テキスト)を校正する為の手立てと
して利用すること等が試みられている。ところが自然言
語処理を利用して文章校正を支援する従来の装置では、
専らテキストに対する誤字や脱字,送り仮名表記のゆれ
等の語彙的,形態的なチェックを行ったり、或いは文法
誤りや一文の長さに対する規定値超過のチェックを行っ
て、その文章校正を支援するように構成されているに過
ぎない。この為、自然言語処理を利用して文章を構成す
る複数の文の間の相対的な関係によってその良否が判断
されるような事項、例えばその論旨展開が不明瞭な部分
の検出とその指摘等を行うことが非常に困難であった。
(Prior Art) Recently, various researches on natural language processing have been advanced, and for example, it has been attempted to use it as a means for proofreading a prepared sentence (text). However, in the conventional device that supports proofreading using natural language processing,
Support grammatical correction by checking lexical and morphological checks such as typographical errors and omissions in texts, and fluctuations in sending kana notation, or by checking for grammatical errors and exceeding specified values for sentence length. It is simply composed of. For this reason, matters that can be judged as good or bad by the relative relationship between multiple sentences that make up a sentence using natural language processing, such as detection and indication of a part where the development of the theory is unclear Was very difficult to do.

ところで、例えば『情報処理学会研究会報告V01.89,No.
6 89−NL−70』に紹介されるように、文中に出現する接
続詞等の修辞表現を手掛りとし、この修辞表現から複数
の文間の接続関係として許されている系列を接続規則を
参照して調べることでその文脈構造を求めることが試み
られている。しかし上記文献には、文章(テキスト)か
らその論旨構造(文脈構造)を抽出する手法が開示され
るているに過ぎない。しかもテキストを構成する複数の
文に必ず接続詞等の接続表現があるとは限らないので、
この文献に示されるような修辞表現を利用しても、その
文脈構造を正確に決定するには幾つかの問題が残されて
いる。この為、その論旨展開の不明瞭な部分を検出して
文章校正を支援するまでには至っていないのが実情であ
る。
By the way, for example, "Information Processing Society of Japan Study Group Report V01.89, No.
6 89-NL-70 ”, the rhetorical expressions such as conjunctions appearing in a sentence are used as clues, and the rhetorical expressions are used to refer to the connection rules for the series permitted as the connection relation between multiple sentences. It is attempted to find the context structure by investigating. However, the above-mentioned document merely discloses a method of extracting the argument structure (context structure) from a sentence (text). Moreover, because the sentences that make up a text do not always have a connective expression such as a connective,
Even using rhetorical expressions such as those shown in this document, some problems remain for accurately determining the context structure. For this reason, the fact is that the proofreading has not been supported by detecting the unclear part of the theory development.

(発明が解決しようとする課題) このように従来の自然言語処理を用いて文書校正を支援
する場合、専らテキスト中に出現する名詞や動詞を手掛
りとしてその文章内容に近い文脈構造を調べたり、また
テキスト中に出現する単語に対する語彙的・形態的なチ
ェックや文法的なチェックを行っているに過ぎない。こ
れ故、従来の自然言語処理の技術を用いるだけでは文書
校正を支援するにしても限界があり、例えばその論旨展
開の不明瞭な部分を検出して文章校正を効率的に支援す
ることが望めなかった。
(Problems to be solved by the invention) In the case of supporting document proofreading by using conventional natural language processing in this manner, a noun or verb appearing exclusively in a text is used as a clue to examine a context structure close to the text content, Moreover, it only performs lexical and morphological checks and grammatical checks on the words that appear in the text. Therefore, there is a limit in supporting document proofreading only by using the conventional natural language processing technology. For example, it is hoped that an unclear part of the development of the theory can be detected to efficiently support grammar proofreading. There wasn't.

本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、文章の論旨展開構造を調べて、
複数の文の間の相対的な関係によってその良否が判断さ
れるような事項(文章部分)を効果的に検出し、論旨展
開の不明瞭な部分等の文章校正を効果的に支援すること
のできる自然言語処理装置を提供することにある。
The present invention has been made in consideration of such circumstances, and the purpose thereof is to examine the theory expansion structure of a sentence,
To effectively detect matters (sentences) whose quality is judged by the relative relationship between multiple sentences, and to effectively support proofreading of unclear parts such as the development of the theory. It is to provide a natural language processing device capable of performing.

[発明の構成] (課題を解決するための手段) 自然言語からなる文書を入力するテキスト入力部と、前
記テキスト入力部から入力された文書に含まれる章・節
の書式的な情報から文書全体の書式的構造を解析する書
式構造処理部と、前記テキスト入力部から入力された文
書に対し形態素解析を行う形態素解析部と、前記形態素
解析部の形態素解析結果を構文解析する構文解析部と、
前記書式的構造、形態素及び構文の解析結果に従い、前
記テキスト入力部から入力された文書中の修辞表現に基
づいて、接続詞の修辞表現とその接続関係との対応付け
を記憶してなる対応テーブル記憶部を用いて文書中の文
章間の接続関係を求める接続関係抽出部と、前記接続関
係抽出部にて求められた文章間の接続関係の系列から、
文章の論旨構造として不適切な排除した論旨構造の候補
を生成し、論旨構造の各候補の尤度評価を行う論旨構造
評価部と、前記論旨構造評価部で用いられる不適切な組
合せは、予め記憶された接続禁止規則及び否定的な接続
規則に対応づけて記憶してなる関係テーブル記憶部と、
前記論旨構造評価部にて尤度評価された各論旨構造の候
補に対する評価値を、前記構文解析部にて求められた構
文解析結果に従い、各論旨構造についての文脈構造を求
める文脈処理をする文脈処理部と、前記文脈処理部で得
られた文脈構造と、前記論旨構造評価部で得られた尤度
評価結果とから、予め知識記憶部に記憶されている文章
間の繋がりを示す知識を参照して、論旨構造の候補から
所定の論旨構造を決定する論旨構造決定部と、前記論旨
構造決定部による所定の論旨構造決定結果について前記
論旨構造評価部で得られた尤度評価結果を判定し、不適
切と判定された論旨構造を検出する不適切箇所検出部
と、前記不適切箇所検出部で検出された論旨構造と等価
な代替表現を前記関係テーブル記憶部に記憶されている
規則を参照して求める構造修正部と、前記構造修正部で
得られた代替表現を提示する代替表現提示部と、を具備
したことを特徴とする。
[Structure of the Invention] (Means for Solving the Problems) A text input section for inputting a document in natural language, and the entire document based on the formal information of chapters / sections included in the document input from the text input section A format structure processing unit that analyzes the formal structure of the, a morphological analysis unit that performs a morphological analysis on the document input from the text input unit, and a syntax analysis unit that parses the morphological analysis result of the morphological analysis unit,
Correspondence table storage that stores correspondences between rhetorical expressions of connectives and their connection relations based on rhetorical expressions in the document input from the text input unit according to the analysis result of the formal structure, morpheme, and syntax From the connection relation extraction unit that obtains the connection relation between the sentences in the document using the section, and the series of the connection relations between the sentences obtained by the connection relation extraction unit,
An inappropriate combination used in the theory structure evaluation unit that generates a candidate for the excluded structure structure that is inappropriate as the structure structure of a sentence and evaluates the likelihood of each candidate structure structure is used in advance. A relation table storage unit that stores the connection prohibition rule and the negative connection rule stored in association with each other;
Context for performing a context process for obtaining a context structure for each argument structure according to the syntactic analysis result obtained by the syntactic analysis unit, based on the evaluation value for each argument structure candidate that has been likelihood evaluated by the argument structure evaluation unit. From the processing unit, the context structure obtained by the context processing unit, and the likelihood evaluation result obtained by the argument structure evaluation unit, refer to the knowledge indicating the connection between sentences stored in the knowledge storage unit in advance. Then, the likelihood structure determination unit that determines the predetermined logical structure from the logical structure candidates and the likelihood evaluation result obtained by the logical structure evaluation unit with respect to the predetermined logical structure determination result by the logical structure determination unit are determined. , Refer to a rule stored in the relation table storage section for an inappropriate part detection unit that detects a logical structure determined to be inappropriate and an alternative expression equivalent to the logical structure detected by the inappropriate part detection unit Then asked And structure modifying unit, characterized in that anda alternative representation presentation section for presenting the alternative representation obtained by the structure modification unit.

(作用) 本発明によれば、テキスト中の修辞表現に着目してその
修辞表現から文章部分間の接続関係を調べ、接続関係の
系列の相対的な接続規則に従ってその文構造を評価して
その文構造が表し得る論旨構造を評価するので、論旨展
開の不明瞭な部分を効果的に検出することができる。こ
の結果、その文章の論旨構造を効果的に評価して提示
し、論旨展開の判り難い部分やそれに対する代替表現等
を提示出力することが可能となるので、語彙的,形態的
なチェック結果や文法誤り等に対するチェック結果の提
示と相俟って、その文章校正を効果的に支援することが
可能となる。
(Operation) According to the present invention, paying attention to the rhetorical expression in the text, the connection relation between the sentence parts is examined from the rhetorical expression, and the sentence structure is evaluated according to the relative connection rule of the series of connection relations. Since the theoretical structure that can be represented by the sentence structure is evaluated, the unclear part of the theoretical development can be effectively detected. As a result, it is possible to effectively evaluate and present the theory structure of the sentence, and to output the difficult-to-understand part of the theory development and alternative expressions, etc., so that lexical and morphological check results and In combination with the presentation of check results for grammatical errors, it becomes possible to effectively support the proofreading.

(実施例) 以下、図面を参照して本発明の一実施例に係る文脈処理
装置につき説明する。
(Embodiment) Hereinafter, a context processing device according to an embodiment of the present invention will be described with reference to the drawings.

第1図は実施例装置の要部概略構成図で、1は解析処理
対象となる文章データや記録データ等のテキストを入力
するテキスト入力部である。このテキスト入力部1を介
して入力される自然言語のテキスト(文章)は文解析部
2に与えられ、書式構造解析、および形態素解析され
る。尚、文解析部2を構成する書式構造解析部2aは上記
テキスト入力部1から入力されるテキストに含まれる章
や節等の書式的な情報からテキスト全体の書式的構造を
解析し、その構造を決定するものである。また上記文解
析部2を構成する形態素解析部2bは、上記書式構造解析
部2aによる解析によってその書式的構造が決定されたテ
キストに対して、例えばパラグラフ単位にそのパラグラ
フに含まれる文の形態素解析を実行する。この形態素解
析によってテキスト中の名詞や動詞等の形態素が個々に
求められる。
FIG. 1 is a schematic configuration diagram of a main part of the embodiment apparatus, and 1 is a text input unit for inputting text such as text data or recorded data to be analyzed. A natural language text (sentence) input via the text input unit 1 is given to the sentence analysis unit 2 and subjected to format structure analysis and morpheme analysis. The format structure analysis unit 2a that constitutes the sentence analysis unit 2 analyzes the format structure of the entire text based on the format information such as chapters and sections included in the text input from the text input unit 1 and the structure thereof. Is to determine. Further, the morpheme analysis unit 2b constituting the sentence analysis unit 2 performs morpheme analysis of the sentence included in the paragraph, for example, in paragraph units, with respect to the text whose formal structure is determined by the analysis by the formal structure analysis unit 2a. To execute. By this morphological analysis, morphemes such as nouns and verbs in the text are individually obtained.

以上の文解析部2における処理機能は従来の文脈処理装
置と同様な機能を呈するものであり、また従来より種々
提唱されている手法を適宜用いて実現される。
The processing functions of the sentence analysis unit 2 described above have the same functions as those of the conventional context processing device, and can be realized by appropriately using various conventionally proposed methods.

ここで本装置が特徴とする第1の点は、上記文解析部2
により求められたテキストの書式的構造解析結果、およ
び形態素解析結果に従い、テキスト中の修辞表現を手掛
りとして当該テキストを構成する複数の文章部分(例え
ばパラグラフ)の接続関係を求める接続関係抽出部3と
論旨構造評価部4とが設けられると共に、後述する論旨
構造決定部5が設けられている点にある。
Here, the first feature of the present device is that the sentence analysis unit 2 described above.
According to the result of the formal structure analysis of the text and the result of the morpheme analysis, the connection relation extracting unit 3 for obtaining the connection relation between a plurality of sentence parts (for example, paragraphs) forming the text using the rhetorical expression in the text as a clue. The point is that the logical structure evaluation unit 4 and the logical structure determination unit 5 described later are provided.

上記接続関係抽出部3は、前記文解析部2での解析結果
に基づいて、例えば品詞の情報等に従ってその構文構造
を解析する構文解析部6による構文解析結果と、対応テ
ーブル記憶部7に記憶されている情報とを用いて文章
(入力テキスト)を構成する複数の文間の接続関係を個
々に求めるものである。対応テーブル記憶部7に記憶さ
れている対応テーブルは、例えば第2図に示すように接
続詞等の修辞表現とその接続関係との対応付けを示すも
ので、接続関係抽出部3はこのような対応テーブル記憶
部7を参照して前記テキスト中の修辞表現を調べ、その
修辞表現にて結び付けられているパラグラフ間等の接続
関係を求める。
The connection relation extraction unit 3 stores in the correspondence table storage unit 7 a syntactic analysis result obtained by the syntactic analysis unit 6 that analyzes the syntactic structure according to, for example, the information of the part of speech based on the analysis result of the sentence analysis unit 2. The connection relation between a plurality of sentences forming a sentence (input text) is individually obtained by using the stored information. The correspondence table stored in the correspondence table storage unit 7 shows correspondence between rhetorical expressions such as conjunctions and their connection relations, as shown in FIG. 2, for example. The rhetorical expression in the text is checked with reference to the table storage unit 7, and the connection relation between the paragraphs connected by the rhetorical expression is obtained.

例えば『但し』なる修辞表現が求められた場合には、接
続関係抽出部3はその修辞表現の前に存在するパラグラ
フと、上記修辞表現が付されたパラグラフとが「捕足」
の関係にあることを示す接続関係を求めている。この接
続関係抽出部3にて前記テキスト中に出現する全ての修
辞表現が順次求められ、且つその修辞表現で示される文
章部分(文)間の接続関係が個々に求められる。
For example, when a rhetorical expression "But" is requested, the connection relation extraction unit 3 "captures" the paragraph existing before the rhetorical expression and the paragraph with the rhetorical expression.
We are looking for a connection relationship that indicates that The connection relation extracting unit 3 sequentially finds all rhetorical expressions that appear in the text, and individually finds the connection relations between the sentence parts (sentences) indicated by the rhetorical expressions.

しかして論旨構造評価部4は、例えば第3図(a)
(b)に示すように上記修辞表現が示す接続関係の接続
に関する禁止規則を関係テーブルとして格納した関係テ
ーブル記憶部8を参照し、前記接続関係抽出部3にて求
められた文章部分間の接続関係の系列からパラグラフ
内、およびパラグラフ間の論旨構造(論旨展開の構造)
を求めるものである。
Then, the argument structure evaluation unit 4 is, for example, shown in FIG.
As shown in (b), the relation table storage unit 8 that stores a prohibition rule regarding the connection of the connection relation indicated by the rhetorical expression as a relation table is referred to, and the connection between the sentence parts obtained by the connection relation extraction unit 3 Structure of the theory from the series of relations to the paragraph and between paragraphs
Is to seek.

具体的には上記関係テーブル記憶部8に格納される関係
テーブルは第3図(a)に示すような修辞表現によって
示される接続関係の構造的な接続禁止規則を示す情報
と、第3図(b)に示すような上記接続関係の否定的な
接続規則を示す情報とを登録したテーブルからなり、テ
キストの論旨構造として不適切な接続関係間の構造を規
則として示している。特に第3図(a)に示す接続禁止
規則は、修辞表現によって結ばれるパラグラフ間の接続
関係の中での実際的に出現することのない組合せ構造を
示している。また第3図(b)に示す否定的な接続規則
は上記接続禁止規則ほどでないにしろ、一般的には殆ん
ど用いられることのない組合せ構造を示している。
Specifically, the relation table stored in the relation table storage unit 8 has information indicating structural connection prohibition rules of connection relations represented by rhetorical expressions as shown in FIG. 3 (a), and FIG. A table in which information indicating a negative connection rule of the above-mentioned connection relation as shown in b) is registered, and the structure between the connection relations which is inappropriate as the textual structure of the text is shown as a rule. In particular, the connection prohibition rule shown in FIG. 3 (a) shows a combination structure that does not actually appear in the connection relation between paragraphs connected by rhetorical expressions. The negative connection rule shown in FIG. 3 (b) shows a combination structure that is rarely used in general, if not as much as the above connection prohibition rule.

論旨構造評価部4はこのような情報を有する関係テーブ
ル記憶部8を参照し、前記接続関係抽出部3で求められ
た修辞表現によって結ばれるパラグラフ間の接続関係を
示す系列から、テキストの論旨構造として不適切な組合
せを排除しながらその組合せ構造を求め、該テキストの
論旨構造の候補を作成し、これらの候補に対する尤度評
価を行う。
The argument structure evaluation unit 4 refers to the relation table storage unit 8 having such information, and from the series showing the connection relation between the paragraphs connected by the rhetorical expression obtained by the connection relation extraction unit 3, the argument structure of the text As the combination structure is excluded, the combination structure is obtained, candidates for the argument structure of the text are created, and the likelihood evaluation is performed on these candidates.

文脈処理部9はこのようにして論旨構造評価部4にて尤
度評価される前記論旨候補に対する評価値と、前記構文
解析部6で求められた構文解析結果とに従い、当該テキ
ストの論旨構造候補について文脈処理を実行し、例えば
照応表現に対する参照解決等の処理を実行する。この文
脈処理は、例えば前記文解析部2で求められたテキスト
の解析結果に従い、例えばテキスト(文)中に出現する
単語を調べ、各文中に出現する単語の関係から複数の文
間の関連性を判定している。
In this way, the context processing unit 9 follows the evaluation value for the argument candidate whose likelihood is evaluated by the argument structure evaluating unit 4 and the syntactic analysis result obtained by the syntactic analyzing unit 6 according to the argument structure candidate of the text. Context processing is performed for, for example, processing such as reference resolution for anaphoric expressions is performed. In this context processing, for example, according to the analysis result of the text obtained by the sentence analysis unit 2, for example, the words appearing in the text (sentence) are examined, and the relationship between a plurality of sentences is determined from the relationship between the words appearing in each sentence. Is being determined.

即ち、文脈処理部9は、入力文章(テキスト)を構成す
る複数の文について各文毎にそこに出現する単語を調べ
ており、例えば話題表現抽出部にて文中の話題提示表現
としての単語を求めている。この話題提示表現としての
単語は、例えばその単語に付された助詞が「は」や
「も」であること等を条件として抽出される。具体的に
は、『Xは』なる表現が存在した場合、単語「X」を話
題提示表現としての単語として抽出する。また『XのY
は』なる表現が存在する場合には、「X」と「Y」とを
共に話題提示する単語として抽出している。
That is, the context processing unit 9 checks words appearing in each sentence of a plurality of sentences forming an input sentence (text). For example, the topic expression extracting unit determines a word as a topic presentation expression in the sentence. Looking for. The word as the topic presentation expression is extracted, for example, on the condition that the particle attached to the word is “ha” or “mo”. Specifically, when the expression "Xwa" exists, the word "X" is extracted as a word as a topic presentation expression. Also, "Y of X
When the expression "ha" exists, both "X" and "Y" are extracted as words that present a topic.

尚、このようにして抽出される単語の全てが話題提示表
現しているものとは限らない。例えば上記助詞を手掛か
りとして抽出される単語の中には、例えば『最近では』
とか『第X図は』や、『〜の場合には』等の話題提示表
現とは云えず、文間の接続関係を調べるための手掛かり
とならないものがある。このような単語については、例
えばこれらを不要語として予め定めて不要語テーブル記
憶部に格納しておき、この不要語テーブル記憶部を参照
することで話題提示表現としての単語から除外するよう
にしておけば良い。
It should be noted that not all of the words extracted in this way represent the topic presentation. For example, among the words extracted using the particle as a clue, for example, "recently"
It cannot be said that it is a topic presentation expression such as "Fig. X is" or "in the case of ...", and there is something that does not serve as a clue for checking the connection relation between sentences. For such words, for example, these are determined beforehand as unnecessary words and stored in the unnecessary word table storage unit, and by referring to this unnecessary word table storage unit, they are excluded from words as topic presentation expressions. You can leave it.

また文脈処理部9では、基本的には同一の単語が複数の
文間において反復的に使用されているか否かを調べる。
そして特に或る文において話題提示表現としての単語が
求められた場合、その単語が他の文においても用いられ
ているか否かを調べ、他の文において用いられている場
合には当該文を識別する情報(文管理番号)を求めてい
る。そして話題提示表現としての単語、および単語反復
抽出処理にて求められた出現単語の情報に従い、これら
の単語情報に従って入力テキストを構成する複数の文間
の関連性を判定処理している。
Further, the context processing unit 9 basically checks whether or not the same word is repeatedly used between a plurality of sentences.
When a word as a topic presentation expression is sought in a certain sentence, it is checked whether the word is also used in another sentence, and if the word is used in another sentence, the sentence is identified. The information (sentence management number) is requested. Then, according to the word as the topic presentation expression and the information of the appearing word obtained by the word repetitive extraction processing, the relationship between a plurality of sentences forming the input text is determined according to the word information.

具体的には話題表現抽出処理にて或る文から話題提示表
現としての単語が抽出された場合、この単語について単
語反復抽出処理にて求められた各文における出現単語の
情報を調べ、上記話題提示表現としての単語が抽出され
た文より先行する文において当該単語と同じ単語が出現
している文を求め、この文を上記話題提示表現が抽出さ
れた文と関連付けている。また話題提示表現として抽出
された単語が指示詞や代名詞である場合には、文関連性
判定処理によりこの指示詞や代名詞からなる話題提示表
現を含む文より先行する文章中で話題提示表現としての
単語を持つ文を調べ、この文以降の文章に上記指示詞や
代名詞が求められた文を関連付けている。
Specifically, when a word as a topic presentation expression is extracted from a certain sentence by the topic expression extraction process, the information of the appearing word in each sentence obtained by the word repetition extraction process for this word is checked, A sentence in which the same word as the word appears in a sentence preceding the sentence in which the word as the presentation expression is extracted is obtained, and this sentence is associated with the sentence in which the topic presentation expression is extracted. If the word extracted as a topic presentation expression is a demonstrative or a pronoun, the sentence relevance judgment processing determines that the word as a topic presentation expression in the sentence preceding the sentence including the topic presentation expression composed of this demonstrative or pronoun. A sentence having a word is examined, and sentences subsequent to this sentence are associated with the sentence for which the above-mentioned demonstrative or pronoun is obtained.

このような判定処理によって入力テキストを構成する複
数の文が相互にどのような関係を持つかが各文に出現す
る単語を手掛かりとして調べられ、その文脈処理が実行
される。
By such a determination process, the relationship between a plurality of sentences forming the input text and each other is examined with the word appearing in each sentence as a clue, and the context process is executed.

このようにして求められる文脈処理結果と、前記論旨構
造評価部4で求められた論旨構造候補とその尤度評価結
果が論旨構造決定部5に与えられる。
The context processing result thus obtained, the argument structure candidate obtained by the argument structure evaluation unit 4 and the likelihood evaluation result thereof are given to the argument structure determination unit 5.

論旨構造決定部5は上述した論旨構造評価部4で求めら
れる文間の関連性の情報(キストの論旨構造候補とその
尤度評価結果)と、前記文脈処理部9で求められる入力
テキストの文脈構造とから、知識記憶部10に記憶されて
いる文章構造の知識を参照してその論旨構造を決定す
る。
The argument structure determining unit 5 includes information about the relevance between sentences (the Kist argument structure candidate and its likelihood evaluation result) obtained by the argument structure evaluating unit 4 and the context of the input text obtained by the context processing unit 9. From the structure, the knowledge structure of the sentence structure stored in the knowledge storage unit 10 is referred to determine the logical structure.

即ち、論旨構造決定部5は知識記憶部10に格納された知
識、例えばテキスト中に出現する品詞の文章間の繋がり
を示す知識を用い、上述したテキストの論旨構造に従い
ながら、その論旨構造を一意に決定する。この際、論旨
構造決定部5は必要に応じてユーザ入出力部11を起動
し、論旨構造の決定に必要な情報をユーザからインタラ
クティブに取り込んで、その論旨構造の決定処理を進め
る。
That is, the logical structure determining unit 5 uses the knowledge stored in the knowledge storage unit 10, for example, the knowledge indicating the connection between the sentences of the parts of speech appearing in the text, and the logical structure of the logical structure is unique while following the logical structure of the text described above. To decide. At this time, the logical structure determining unit 5 activates the user input / output unit 11 as necessary, interactively takes in information necessary for determining the logical structure from the user, and proceeds with the processing for determining the logical structure.

しかして不適切箇所検出部12は上記論旨構造決定部5に
よって決定された論旨構造について前記論旨構造評価部
4で求められた尤度評価結果を判定する。そして評価が
低い場合にはその原因となっている接続表現の系列部分
を論旨構造上、不適切(不明瞭)な部分であるとして検
出している。このようにして検出される論旨構造の不適
切(不明瞭)な部分の情報は前記ユーザ入出力部11を介
してユーザに提示出力される。
Therefore, the inappropriate portion detection unit 12 determines the likelihood evaluation result obtained by the above-mentioned theory structure evaluation unit 4 with respect to the theme structure determined by the above-mentioned theory structure determination unit 5. Then, when the evaluation is low, the sequence part of the connection expression that is the cause is detected as an unsuitable (unclear) part due to the theoretical structure. The information on the inappropriate (unclear) portion of the argument structure thus detected is presented and output to the user via the user input / output unit 11.

構造修正部13は上記不適切箇所検出部12にて検出された
不適切箇所について、前記論旨構造決定部5で決定され
た論旨構造と等価であり、且つ前記関係テーブル記憶部
8に記憶されている前述した接続禁止規則に抵触するこ
とのない接続関係の系列を、その文間での組み替えによ
って生成するものである。このようにして組み替え生成
される新たな接続関係構造の情報は前記ユーザ入出力部
11にてユーザに提示出力され、その確認が促される。し
かして代替表現呈示部14は上記構造修正部13にて修正さ
れた構造に対して、その構造中に現れる各接続関係に対
する修辞表現を、前述した対応テーブルを参照しながら
検索し、また前述した各種の解析結果に基づいて、より
適切な代替表現があるか否かを調べる。そして適切な代
替表現が見出だされた場合、これを前記ユーザ入出力部
11より呈示出力する。
The structure correction unit 13 is equivalent to the argument structure determined by the argument structure determination unit 5 for the inappropriate portion detected by the inappropriate portion detection unit 12, and is stored in the relationship table storage unit 8. A sequence of connection relationships that does not conflict with the above-mentioned connection prohibition rule is generated by rearranging the sentences. The information on the new connection relation structure rearranged and generated in this way is the user input / output unit.
At 11, the information is presented to the user and the confirmation is prompted. Then, the alternative expression presenting unit 14 searches the structure modified by the structure modifying unit 13 for the rhetorical expression for each connection appearing in the structure with reference to the above-mentioned correspondence table, and also as described above. Based on the results of various analyses, we investigate whether there is a more appropriate alternative expression. When an appropriate alternative expression is found, this is used as the user input / output unit.
Presented from 11.

以上が本装置の主要な構成とその機能である。The above is the main configuration of the apparatus and its function.

ここで上述した修辞表現に基づく論旨構造の決定処理に
ついて第4図乃至第6図を参照して更に詳しく説明す
る。
Here, the above-mentioned rhetorical expression-based structure determination processing will be described in more detail with reference to FIGS. 4 to 6.

第4図は文脈処理の対象とするテキストの例を示す図で
ある。このようなテキストが入力されると前記書式構造
解析部2aは、例えばインデンテーションや句読点,コン
マ,ピリオド等の書式的情報から上記テキストを構成す
る文章部分を文やパラグラフに分割してその書式構造を
求めるものである。ここでは第4図に示す入力テキスト
を複数の文に分割し、例えばここでは文,,〜を
それぞれ求める。このようにして求められた各文につい
て前記形態素解析部2bはその形態素解析を実行する。
FIG. 4 is a diagram showing an example of text to be subjected to context processing. When such text is input, the format structure analysis unit 2a divides the text part constituting the text into texts or paragraphs based on the textual information such as indentation, punctuation marks, commas, periods, etc. Is to seek. Here, the input text shown in FIG. 4 is divided into a plurality of sentences, and here, for example, sentences, ... Are respectively obtained. The morphological analysis unit 2b executes the morphological analysis on each sentence thus obtained.

この形態素解析については、例えば『長尾真監修“日本
語情報処理”電子通信学会発行,(昭和59年)』等に示
される解析法を用いれば良い。このような日本語文の解
析法によれば、例えば 「以下では図面を参考にする。」 なる文が与えられた場合、 『以下(名詞)+で(助詞)+は(助詞)+図面(名
詞)+を(助詞)+参考(名詞)+に(助詞)+する
(動詞)。』 なる形態素解析結果が求められることになる。
For this morphological analysis, the analysis method shown in, for example, "Makoto Nagao," Japanese Information Processing "published by The Institute of Electronics, Information and Communication Engineers, (1984)" may be used. According to such a Japanese sentence analysis method, for example, when a sentence “The following refers to drawings.” Is given, “below (noun) + (particle) + is (particle) + drawing (noun ) + To (particle) + reference (noun) + to (particle) + (verb). The result of morphological analysis will be required.

しかして接続関係抽出部3は入力テキストを構成する各
文についてそれぞれ求められた形態素解析結果に基づ
き、前記対応テーブル記憶部7を参照して各文中の修辞
表現を探し出し、検出された修辞表現についてその修辞
表現が意味する接続関係の情報を当該対応テーブル記憶
部7から求める。
Then, the connection relation extraction unit 3 searches for the rhetorical expression in each sentence by referring to the correspondence table storage unit 7 based on the morphological analysis result obtained for each sentence constituting the input text, and detects the detected rhetorical expression. Information about the connection relationship that the rhetorical expression means is obtained from the correspondence table storage unit 7.

この第4図に示す例では、文から『従って』なる修辞
表現を求め、その接続関係が『順接』であることを求め
る。また文からは『また』なる修辞表現とその接続関
係『並列』を求め、同様にして文から『従って』なる
修辞表現とその接続関係『順接』を求める。
In the example shown in FIG. 4, a rhetorical expression "following" is obtained from a sentence and its connection relation is "junction". In addition, the rhetorical expression "Mata" and its connection relation "parallel" are obtained from the sentence, and the rhetorical expression "Following" and its connection relation "junction" are similarly obtained from the sentence.

このような接続関係から接続関係抽出部3は、前記第4
図に示すテキストが第5図のAに示すように [順接並列順接] なる接続関係で複数の文,,〜が順次繋がってい
ることを求める。
From such a connection relation, the connection relation extracting unit 3 determines the fourth relation.
As shown in A of FIG. 5, the text shown in the figure requests that a plurality of sentences, ...

しかしこのような接続関係系列は、単に複数の文間での
接続関係を個々に示しているだけであり、その論旨構造
がどのように組合わさっているかについては示していな
い。
However, such a connection relation series merely shows connection relations between a plurality of sentences individually, and does not show how the argument structures are combined.

しかして論旨構造をなす上記接続関係系列の組合せにつ
いて考えてみると、この4つのパラグラフが存在する場
合には、理論的には第5図のBに示すように5通りの組
合せが考えられる。尚、文が2つの場合には、その組合
せ構造が取り得る形態は1つであり、文が3つの場合に
はその組合せ構造が取り得る形態は2通りである。そし
て5つの文の場合には14通りであり、文の数によってそ
の組合せ構造が取り得る形態の数が理論的に定まる。
Then, considering the combination of the connection relation series forming the argument structure, if there are these four paragraphs, theoretically, there are five possible combinations as shown in FIG. 5B. When there are two sentences, the combination structure can take one form, and when there are three sentences, the combination structure can take two forms. In the case of 5 sentences, there are 14 types, and the number of forms that the combination structure can take is theoretically determined by the number of sentences.

尚、この接続関係の系列が取る組合せ構造は、テキスト
中の各文がどこに,どのような関係で接続するかを示す
もので、例えば [[[順接]並列]順接] なる論旨構造(文の組合せの構造)は、文から文が
導かれ、これに対して別のことについて述べて文が並
列に存在し、これらを踏まえて文が導かれていると云
う論旨構造が示される。
The combination structure taken by the series of connection relations indicates where and in what relation each sentence in the text is connected. For example, [[[ordering] parallel] ordering] (Structure of sentence combination) indicates that a sentence is derived from a sentence, a sentence is present in parallel by describing another thing, and the sentence is derived based on these.

同様にして、例えば [[順接]並列[順接]] なる論旨構造では、文から文が導かれ、また文か
ら文が導かれている。そして全体的には、これらが並
列に記述されていると云う論旨構造が示される。
Similarly, for example, in the theory structure of [[junction] parallel [junction]], sentences are derived from sentences and sentences are derived from sentences. And, as a whole, a logical structure that these are described in parallel is shown.

しかし第5図のBに示す接続関係の系列が取る組合せ構
造は、単純にその組合せの構造形態を表わしたものに過
ぎず、中には文章構造における論旨構造として不適切な
ものもある。そこで論旨構造評価部4は前述した関係テ
ーブル記憶部8を参照して上記組合せ構造中の不適切な
修辞関係にある構造を見出し、これを論旨構造の候補か
ら除外している。
However, the combination structure taken by the series of connection relations shown in FIG. 5B merely represents the structural form of the combination, and some of them are unsuitable as the argument structure in the sentence structure. Therefore, the argument structure evaluation unit 4 refers to the relationship table storage unit 8 described above, finds a structure having an inappropriate rhetorical relationship in the combination structure, and excludes the structure from candidates for the argument structure.

例えば第3図(a)に示すような関係テーブルに示され
る接続禁止規則 『順接[…[X 順接』 (但し、Xはそこに1文または接続関係で結ばれた複数
の文が位置することを示す)から上記組合せ構造中に
『順接[X順接』なる組合せ構造を含むものがある場
合、これを論旨構造として不適切であるとして、その論
旨構造の候補に[BAD]なる評価を与える。具体的には
第5図のBに示す2番目の論旨構造の候補 [順接[[並列]順接]] の下線部分がこれに該当することから、この論旨構造候
補に対して尤度評価[BAD]を与える。
For example, the connection prohibition rule "forward connection [... [X forward connection" (where X is one sentence or a plurality of sentences connected by a connection relation is located in the relational table shown in FIG. 3A). If any of the above combination structures includes a combination structure of "ordered [X-ordered]", it is regarded as inappropriate as an argument structure, and it becomes [BAD] as a candidate for the argument structure. Give a rating. Specifically, since the underlined portion of the second candidate structure structure [ forward [[parallel] forward ]] shown in B of FIG. 5 corresponds to this, the likelihood evaluation is performed on this candidate structure structure. Give [BAD].

しかして第5図のBに示す1番目の論旨構造宝候補 [順接[並列[順接]]] や、3番目の論旨構造候補 [[順接[並列]]順接] や、4番目の論旨構造候補 [[順接]並列[順接]] については、第3図(b)に示す関係テーブルに示され
る否定的な接続規則 『順接[…[X 並列』 『並列[…[X 順接』 等に抵触することから、これらの論旨構造候補に対して
尤度評価[NG]が与えられる。そして5番目の論旨構造
候補 [[[順接]並列]順接] だけが、前述した接続禁止規則や否定的な接続規則に抵
触しないことから、その尤度評価として[OK]が与えら
れる。
Therefore, the first argument structure treasure candidate [forward [parallel [forward]]] and the third theoretical structure candidate [[forward [parallel]] forward] and the fourth shown in FIG. 5B. For the candidate structure structure [[forward] parallel [forward]], the negative connection rule "forward [... [X parallel]" parallel [... [] shown in the relationship table shown in FIG. Therefore, the likelihood evaluation [NG] is given to these argument structure candidates. Since only the fifth argument structure candidate [[[ordering] parallel] ordering] does not conflict with the above-mentioned connection prohibition rule or negative connection rule, [OK] is given as its likelihood evaluation.

しかして前記文脈処理部9は構文解析部から求められる
構文解析結果に対して、上述した論旨構造候補の尤度評
価結果を踏まえて照応表現の参照解決等の文脈処理を実
行する。
Therefore, the context processing unit 9 executes context processing such as reference resolution of the anaphoric expression on the syntactic analysis result obtained from the syntactic analysis unit based on the likelihood evaluation result of the above-mentioned argument structure candidate.

例えば前述した [[順接]並列[順接]] なる論旨構造候補の尤度評価が高い場合、テキスト中の
文に示される照応表現『これ』の指示対象として文
の話題提示表現『定理3』を優先的に求めて文脈処理す
る。このような文脈処理結果が前記論旨構造決定部5に
与えられる。
For example, when the likelihood evaluation of the theory structure candidate [[ordering] parallel [ordering]] described above is high, the topic presentation expression of the sentence “Theorem 3” is the target of the anaphoric expression “kore” shown in the sentence in the text. ] Is given priority and context processing is performed. Such a context processing result is given to the argument structure determining unit 5.

すると論旨構造決定部5は、文脈処理結果と前記論旨構
造候補についての尤度評価結果とに従い、前記知識記憶
部10に登録されている知識情報を参照して、その論旨構
造をその候補の中から決定する。具体的には、尤度評価
の高い論旨構造候補から順に、その解釈がテキストで言
及されている内容(内容の構造)に矛盾しないか否か
を、その内容に関する知識を参照しながら調べる。
Then, the logical structure determination unit 5 refers to the knowledge information registered in the knowledge storage unit 10 according to the context processing result and the likelihood evaluation result of the logical structure candidate, and determines the logical structure among the candidates. To decide from. Specifically, in order from the argument structure candidate with the highest likelihood evaluation, whether or not the interpretation is consistent with the content (structure of the content) referred to in the text is examined with reference to the knowledge about the content.

例えばこの例では、テキスト中に現れる話題提示表現し
ている単語「定理1」「定理2」「証明できる」等が示
す対象やその意味内容等の文章間の繋がりを示す知識を
前記知識記憶部10を検索して調べ、これらが持つ情報内
容の繋がり構造に矛盾が存在しないか否かを前記文脈解
析結果に基づいて調べ、その論旨構造を決定する。この
例では、文と文で言及されている「定理1」および
「定理2」の内容と、文と文で言及されている「定
理3」および「定理4」の内容とが独立であることが知
識情報の参照によって求められる。しかしてこのような
テキスト内容に関する知識が得られたならば、論旨構造
決定部5は前述した尤度評価によって最も高い評価を受
けた5番目の論旨構造候補(論旨構造候補)について、
その論旨構造の矛盾性について調べる。するとこの5番
目の論旨構造候補においては、文がが文のみなら
ず、文,文との間でも内容的依存性を持つ論旨構造
であることが示されることから、上述した知識情報と矛
盾することが判明する。この結果、5番目の論旨構造候
補については、最も高い尤度評価を受けたものではある
が、その論旨内容の展開に矛盾があるとして前記テキス
トに対する論旨構造としては不適切であると棄却され
る。
For example, in this example, the knowledge storage unit is provided with knowledge indicating the connection between sentences such as the target indicated by the words “Theorem 1”, “Theorem 2”, “Proof”, etc. that appear in the text and which represent the topic. 10 is searched and checked, whether or not there is a contradiction in the connection structure of the information contents possessed by these is checked based on the above-mentioned context analysis result, and the argument structure is determined. In this example, the contents of "Theorem 1" and "Theorem 2" mentioned in sentences and sentences and the contents of "Theorem 3" and "Theorem 4" mentioned in sentences and sentences are independent. Is obtained by referring to knowledge information. If knowledge about such text contents is obtained, then the logical structure determining unit 5 determines the fifth logical structure candidate (logical structure candidate) that has received the highest evaluation by the likelihood evaluation described above.
Examine the inconsistency of the argument structure. Then, in the fifth candidate structure structure, it is shown that the sentence is a structure having a content dependency not only with the sentence but also with the sentence, so that it contradicts the knowledge information described above. It turns out. As a result, although the fifth argument structure candidate received the highest likelihood evaluation, it is rejected as being unsuitable as the argument structure for the text because the development of the argument content is inconsistent. .

しかる後、同様にして次に高い尤度評価を受けた論旨構
造候補について、知識記憶部10を参照して求められる文
中の単語についての知識情報に従い、その矛盾性を判断
する。この例では、[NG]なる評価が得られた1番目,3
番目,4番目の各論旨構造候補について内容的な矛盾の有
無を調べる。
Thereafter, similarly, the inconsistency of the argument structure candidate having the next highest likelihood evaluation is determined according to the knowledge information about the word in the sentence obtained by referring to the knowledge storage unit 10. In this example, [NG] is the first, 3
Examine whether there is any contradiction in the contents of the second and fourth candidate structure structures.

しかしてこれらの論旨構造候補の中では、文と文,
文と文とが内容的に独立であることを示している構
造が4番目の論旨構造だけであることが判断される。こ
の結果、論旨構造決定部5は、4番目の論旨構造候補が
内容的にテキストにおける論旨の展開構造を示している
と判断し、その論旨構造を当該テキストの論旨構造とし
て一意に決定する。
Then, among these argument structure candidates, sentences and sentences,
It is judged that the structure showing that the sentences are independent from each other in content is only the fourth argument structure. As a result, the argument structure determining unit 5 determines that the fourth argument structure candidate shows the development structure of the argument in the text in content, and uniquely determines the argument structure as the argument structure of the text.

かくしてここに、前記入力テキストの論旨構造がその論
旨展開の内容的な矛盾を招くことなく決定され、そのテ
キスト展開構造が明らかにされる、自然言語で与えられ
る入力テキストに対する解析結果(論旨構造)が求めら
れることになる。
Thus, here, the analysis result of the input text given in natural language (theoretical structure), in which the logical structure of the input text is determined without causing a contradiction in the content of the logical expansion, and the text expansion structure is clarified Will be required.

さてこのようにして入力テキストに対する論旨構造が決
定されると、不適切箇所検出部12はその決定された論旨
構造について求められている尤度評価結果を調べる。そ
してその評価結果が、前述した複数の候補に対する評価
結果の中で最大でない場合には、つまりその評価結果が
低い場合には、テキスト中に論旨展開の判り難い部分が
存在すると認定する。そしてこの場合には、どの接続関
係部分が原因となって論旨展開が判り難くなっているか
を、前述した尤度評価の際に用いた接続関係の禁止規則
や否定的な接続規則を参照して調べる。
Now, when the logical structure for the input text is determined in this way, the inappropriate portion detection unit 12 checks the likelihood evaluation result obtained for the determined logical structure. Then, when the evaluation result is not the maximum among the evaluation results for the plurality of candidates described above, that is, when the evaluation result is low, it is determined that there is a part in the text that is difficult to understand. In this case, refer to the connection relation prohibition rule and the negative connection rule used in the above-mentioned likelihood evaluation to find out which connection relation part is the cause of difficulty in understanding the theory development. Find out.

ここで示す例の場合には、文と文との間におかれて
いる接続表現(修辞表現)「また」と、文と文との
間におかれている接続表現(修辞表現)「従って」と
が、その論旨展開構造を不明瞭にしている部分であると
認定する。何故ならば、ここではその論理的内容として
が文だけから導かれているにも拘らず、文が文
と文で述べられたことと文で述べられていることと
の双方から導かれているように解釈することができる。
このような曖昧性から、上述した2つの修辞表現が論旨
展開を不明瞭にしている原因として判断される。不適切
箇所検出部12はこのようにして検出した不明瞭な文章部
分を前記ユーザ入出力部11を介してユーザに提示出力す
る。
In the case of the example shown here, the connection expression (lethal expression) “also” placed between sentences and the connection expression (letter expression) “according to between sentences” ”Is the part that obscures the structure of the development of the theory. This is because, although the logical content here is derived only from sentences, sentences are derived both from the sentence and from the sentence. Can be interpreted as:
From such ambiguity, it is judged that the above two rhetorical expressions obscure the theory development. The inappropriate portion detection unit 12 presents and outputs the ambiguous text portion thus detected to the user via the user input / output unit 11.

しかして構造修正部13は、不明瞭な文章部分として検出
された各不適切部分に対して、前記論旨構造決定部5に
て一意に決定された論旨構造と等価であり、且つ前記関
係テーブル記憶部8に記憶されている接続禁止規則等に
抵触することのない部分構造と、その部分についての接
続関係の系列を代替表現構造として求める。つまりその
文構造の組み替えを行い、上述した条件を満たす文構造
を求める。
Therefore, the structure correction unit 13 is equivalent to the argument structure uniquely determined by the argument structure determination unit 5 for each inappropriate portion detected as the ambiguous sentence portion, and the relation table storage A partial structure that does not conflict with the connection prohibition rule and the like stored in the unit 8 and a series of connection relationships for the part are obtained as an alternative expression structure. That is, the sentence structure is rearranged to obtain a sentence structure that satisfies the above-mentioned conditions.

具体的には、前述した4番目の論旨構造の中から、その
不適切部分を 『並列[順接」』 として求め、これに代わる構造を、例えば 『並列[理由]』 として求める。この結果、テキスト全体の論旨構造が [[順接]並列[理由]] として求められ、入力テキストの論旨展開を明確に表現
し得る代替表現の論旨構造が求められる。
Specifically, from the above-mentioned fourth argument structure, the inappropriate part is obtained as "parallel [forward]", and an alternative structure is obtained as "parallel [reason]". As a result, the argument structure of the entire text is obtained as [[junction] parallel [reason]], and the argument structure of an alternative expression that can clearly express the argument development of the input text is required.

前記代替表現提示部14は、その構造中に現れる各接続関
係に対応する修辞表現を前記対応テーブル記憶部7から
求め、前述した構文解析結果等の情報を利用して、また
知識記憶部10から得られる知識記憶を利用して前記不適
切箇所に対するより良い代替表現を求め、これを前記ユ
ーザ入力部11を介して、例えば第6図に示すようにユー
ザに提示出力する。
The alternative expression presentation unit 14 obtains rhetorical expressions corresponding to each connection relation appearing in the structure from the correspondence table storage unit 7, uses information such as the above-mentioned syntactic analysis result, and from the knowledge storage unit 10. Using the obtained knowledge memory, a better alternative expression for the inappropriate portion is obtained, and this is presented and output to the user via the user input unit 11 as shown in FIG. 6, for example.

かくしてこのように構成された本装置によれば、テキス
トの名詞や動詞を解析するだけではなく、テキスト中に
出現する修辞表現によって示されるテキストの論旨構造
を解析し、この論旨構造を評価して上記テキストの論旨
構造を決定するので、テキスト中に出現する名詞や動詞
に関する情報が辞書登録されていない場合であっても、
その未登録語に左右されることなく適切な自然言語処理
による論旨構造の決定処理を行なうことが可能となる。
しかも修辞表現から解析される論旨構造を利用して自然
言語処理を行なうので、例えば前提と結論や判断と例示
等のような論旨構造を適確に捉えることができ、その文
脈を適確に捉えて論旨構造を評価し、解釈していくこと
可能となる。
Thus, according to the present apparatus thus configured, not only the nouns and verbs of the text are analyzed, but also the discourse structure of the text indicated by the rhetorical expressions appearing in the text is analyzed, and the discourse structure is evaluated. Since the logical structure of the above text is determined, even if information about nouns and verbs appearing in the text is not registered in the dictionary,
It is possible to perform the determination process of the logical structure by appropriate natural language processing without being influenced by the unregistered word.
Moreover, since the natural language processing is performed by using the theoretical structure analyzed from the rhetorical expression, it is possible to accurately grasp the theoretical structure such as the premise, the conclusion, the judgment, the illustration, etc., and accurately grasp the context. It is possible to evaluate and interpret the argument structure.

その上で、論旨展開の不明瞭な部分を検出してその該当
部分を指摘表示すると共に、論旨構造の不明瞭な文構造
に代わる代替表現を求めてユーザに提示出力するので、
テキストの論旨展開のどの部分が不明瞭であり、どのよ
うに修正すればその不明瞭な論旨展開を解消することが
できるかを効果的に見出すことが可能となる。
After that, the unclear part of the theory development is detected, the corresponding part is pointed out and displayed, and an alternative expression to replace the unclear sentence structure of the theoretical structure is sought and output to the user.
It is possible to effectively find out which part of the textual development of the text is unclear and how it can be corrected to eliminate the unclear textual development.

この結果、テキストに対する校正処理を行うに際し、上
述した自然言語処理を有効に活かしてその文章校正を効
果的に支援することが可能となる等の実用上多大なる効
果が奏せられる。
As a result, when the proofreading process is performed on the text, the natural language process described above can be effectively utilized to effectively support the proofreading of the text.

尚、本発明は上述した実施例に限定されるものではな
く、書式構造の解析や形態素解析等は従来より提唱され
ている種々のアルゴリズムを適宜用いて行なえば良いも
のである。また対応テーブルや関係テーブルに登録して
おく情報も上述した例に限定されるものではない。た論
旨構造候補についての評価の仕方や、論旨構造を一意に
決定する為のアルゴリズムについても種々変形可能であ
る。
It should be noted that the present invention is not limited to the above-described embodiment, and the analysis of the format structure, the morphological analysis, etc. may be performed by appropriately using various algorithms conventionally proposed. Further, the information registered in the correspondence table or the relation table is not limited to the above example. The method of evaluating the argument structure candidate and the algorithm for uniquely determining the argument structure can be variously modified.

更にはここでは日本語処理について説明したが、英語等
の他の言語に対する文脈処理についても同様に適用する
ことができる。その他、本発明はその要旨を逸脱しない
範囲で種々変形して実施することができる。
Furthermore, although the Japanese processing has been described here, the context processing for other languages such as English can be similarly applied. In addition, the present invention can be variously modified and implemented without departing from the scope of the invention.

[発明の効果] 以上説明したように本発明によれば、テキスト中に出現
する修辞表現に着目してその論旨構造の候補を求ると共
に、その論旨構造の候補を評価して上記テキストの論旨
構造を調べ、その上で論旨展開の構造として不明瞭な部
分を求めていくので、テキストに対する自然言語処理を
効果的に進めてその論旨構造を適確に捉えていくことが
可能となる。その上で、論旨構造の展開として不明瞭な
部分を検出し、該当部分を指摘表示したり、或いはその
代替表現を提供出力するので、自然言語処理をもって文
章校正を効果的に支援することができる等の実用上多大
なる効果が奏せられる。
[Effects of the Invention] As described above, according to the present invention, the rhetorical expressions appearing in a text are focused on to find candidates for the argument structure, and the candidates for the argument structure are evaluated to evaluate the arguments of the text. Since the structure is examined and the unclear part is searched for as the structure of the theory development, it is possible to effectively advance the natural language processing on the text and accurately grasp the theory structure. Then, unclear parts are detected as the development of the argument structure, the corresponding parts are pointed out and displayed, or alternative expressions thereof are provided and output, so that natural language processing can effectively support proofreading. And so on, a great effect is practically achieved.

【図面の簡単な説明】[Brief description of drawings]

図は本発明の一実施例に係る文脈処理装置につき示すも
ので、第1図は実施例装置の要部概略構成図、第2図は
対応テーブル記憶部の構成例を示す図、第3図は関係テ
ーブル記憶部の構成例を示す図、第4図は文脈処理され
る入力テキストの例を示す図、第5図はテキストの論旨
構造解析処理の形態を模式的に示す図、第6図は代替表
現により示されるテキストの修正例を示す図である。 1…テキスト入力部、2…文解析部、2a…書式構造解析
部、2b…形態素解析部、3…接続関係抽出部、4…論旨
関係評価部、5…論旨構造決定部、6…構文解析部、7
…対応テーブル記憶部、8…関係テーブル記憶部、9…
文脈処理部、10…知識記憶部、11…ユーザ入出力部、12
…不適切箇所検出部、13…構造修正部、14…代替表現提
示部。
FIG. 1 shows a context processing device according to an embodiment of the present invention. FIG. 1 is a schematic configuration diagram of a main part of the embodiment device, FIG. 2 is a diagram showing a configuration example of a correspondence table storage part, and FIG. Is a diagram showing a configuration example of a relation table storage unit, FIG. 4 is a diagram showing an example of input text to be context-processed, FIG. 5 is a diagram schematically showing a form of text argument structure analysis processing, FIG. FIG. 6 is a diagram showing a modification example of text shown by an alternative expression. 1 ... Text input unit, 2 ... Sentence analysis unit, 2a ... Format structure analysis unit, 2b ... Morphological analysis unit, 3 ... Connection relation extraction unit, 4 ... Logical relation evaluation unit, 5 ... Logical structure determination unit, 6 ... Syntactic analysis Division, 7
... correspondence table storage unit, 8 ... relation table storage unit, 9 ...
Context processing unit, 10 ... Knowledge storage unit, 11 ... User input / output unit, 12
… Inappropriate part detection unit, 13… Structure correction unit, 14… Alternative expression presentation unit.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】自然言語からなる文書を入力するテキスト
入力部と、 前記テキスト入力部から入力された文書に含まれる章・
節の書式的な情報から文書全体の書式的構造を解析する
書式構造処理部と、 前記テキスト入力部から入力された文書に対し形態素解
析を行う形態素解析部と、 前記形態素解析部の形態素解析結果を構文解析する構文
解析部と、 前記書式的構造、形態素及び構文の解析結果に従い、前
記テキスト入力部から入力された文書中の修辞表現に基
づいて、接続詞の修辞表現とその接続関係との対応付け
を記憶してなる対応テーブル記憶部を用いて文書中の文
章間の接続関係を求める接続関係抽出部と、 前記接続関係抽出部にて求められた文章間の接続関係の
系列から、文章の論旨構造として不適切な排除した論旨
構造の候補を生成し、論旨構造の各候補の尤度評価を行
う論旨構造評価部と、 前記論旨構造評価部で用いられる不適切な組合せは、予
め記憶された接続禁止規則及び否定的な接続規則に対応
づけて記憶してなる関係テーブル記憶部と、 前記論旨構造評価部にて尤度評価された各論旨構造の候
補に対する評価値を、前記構文解析部にて求められた構
文解析結果に従い、各論旨構造についての文脈構造を求
める文脈処理をする文脈処理部と、 前記文脈処理部で得られた文脈構造と、前記論旨構造評
価部で得られた尤度評価結果とから、予め知識記憶部に
記憶されている文章間の繋がりを示す知識を参照して、
論旨構造の候補から所定の論旨構造を決定する論旨構造
決定部と、 前記論旨構造決定部による所定の論旨構造決定結果につ
いて前記論旨構造評価部で得られた尤度評価結果を判定
し、不適切と判定された論旨構造を検出する不適切箇所
検出部と、 前記不適切箇所検出部で検出された論旨構造と等価な代
替表現を前記関係テーブル記憶部に記憶されている規則
を参照して求める構造修正部と、 前記構造修正部で得られた代替表現を提示する代替表現
提示部と、 を具備したことを特徴とする自然言語処理装置。
1. A text input unit for inputting a document in natural language, and chapters included in the document input from the text input unit.
A format structure processing unit that analyzes the format structure of the entire document from the format information of the section, a morphological analysis unit that performs a morphological analysis on the document input from the text input unit, and a morphological analysis result of the morphological analysis unit And a correspondence between the rhetorical expression of the conjunction and its connection relationship based on the rhetorical expression in the document input from the text input unit according to the analysis result of the formal structure, morpheme and syntax. From the connection relation extraction unit that obtains the connection relation between the sentences in the document using the correspondence table storage unit that stores the attachment, and the sequence of the connection relations between the sentences obtained by the connection relation extraction unit, Inappropriate combinations as the logical structure are generated by generating excluded candidate logical structure candidates and performing likelihood evaluation of each candidate of the logical structure and the inappropriate combinations used in the logical structure evaluating unit. A relation table storage unit that stores the relation between the stored connection prohibition rule and the negative connection rule, and an evaluation value for each candidate structure structure that has been likelihood evaluated by the structure structure evaluation unit. According to the syntactic analysis result obtained by the analysis unit, a context processing unit that performs a context process for obtaining a context structure for each argument structure, a context structure obtained by the context processing unit, and an argument structure evaluation unit. From the likelihood evaluation result, the knowledge indicating the connection between the sentences stored in advance in the knowledge storage unit is referred to,
It is inappropriate to judge the likelihood evaluation result obtained by the theoretical structure evaluation unit with respect to the predetermined logical structure determination result by the logical structure determination unit, which determines a predetermined logical structure from candidate logical structures. An inappropriate portion detection unit that detects the argument structure determined to be, and an alternative expression equivalent to the argument structure detected by the inappropriate portion detection unit are obtained by referring to the rules stored in the relationship table storage unit. A natural language processing apparatus comprising: a structure correction unit; and an alternative expression presentation unit that presents the alternative expression obtained by the structure correction unit.
JP1155902A 1989-06-20 1989-06-20 Natural language processor Expired - Lifetime JPH0795323B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1155902A JPH0795323B2 (en) 1989-06-20 1989-06-20 Natural language processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1155902A JPH0795323B2 (en) 1989-06-20 1989-06-20 Natural language processor

Publications (2)

Publication Number Publication Date
JPH0322083A JPH0322083A (en) 1991-01-30
JPH0795323B2 true JPH0795323B2 (en) 1995-10-11

Family

ID=15616013

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1155902A Expired - Lifetime JPH0795323B2 (en) 1989-06-20 1989-06-20 Natural language processor

Country Status (1)

Country Link
JP (1) JPH0795323B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07122876B2 (en) * 1993-03-08 1995-12-25 日本電気株式会社 Machine translation device
JPH06259420A (en) * 1993-03-10 1994-09-16 Fuji Xerox Co Ltd Sentence editing support device
JP4764119B2 (en) * 2005-09-15 2011-08-31 田丸 重徳 Bottom reed aquaculture reef with canopy and method for rearing bottom reed organisms
JP6499537B2 (en) * 2015-07-15 2019-04-10 日本電信電話株式会社 Connection expression structure analysis apparatus, method, and program

Also Published As

Publication number Publication date
JPH0322083A (en) 1991-01-30

Similar Documents

Publication Publication Date Title
US8185377B2 (en) Diagnostic evaluation of machine translators
JP4940325B2 (en) Document proofreading support apparatus, method and program
EP2354967A1 (en) Semantic textual analysis
US20100332217A1 (en) Method for text improvement via linguistic abstractions
JPH077419B2 (en) Abbreviated proper noun processing method in machine translation device
JP2003196274A (en) Syntax analyzing method and device
EP0839357A1 (en) Method and apparatus for automated search and retrieval processing
JPH0351020B2 (en)
KR20140021838A (en) Method for detecting grammar error and apparatus thereof
Zhang et al. Automated multiword expression prediction for grammar engineering
US5065318A (en) Method of translating a sentence including a compound word formed by hyphenation using a translating apparatus
Östling et al. Compounding in a Swedish blog corpus
JPH0795323B2 (en) Natural language processor
JP2007072841A (en) Word extraction method, database construction method, database constructing device, database construction program, and recording medium
Ligeti-Nagy et al. What does the Nom say? An algorithm for case disambiguation in Hungarian
JP4103311B2 (en) Natural language processing apparatus and method
KR100413966B1 (en) Natural Language Analyzing Apparatus and Method for Controlled Korean Grammar
JP2818185B2 (en) Document creation support device
JPH077418B2 (en) Natural language context processor
JP2719453B2 (en) Machine translation equipment
JP3810809B2 (en) Parser
JPH0715692B2 (en) Context processor
JPH08235180A (en) Machine translation system
JP2895137B2 (en) Japanese sentence error automatic detection and correction device
JPH05225232A (en) Automatic text pre-editor

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term