JPH0756923A - Japanese sentence generating device capable of eliminating ambiguity - Google Patents

Japanese sentence generating device capable of eliminating ambiguity

Info

Publication number
JPH0756923A
JPH0756923A JP5202338A JP20233893A JPH0756923A JP H0756923 A JPH0756923 A JP H0756923A JP 5202338 A JP5202338 A JP 5202338A JP 20233893 A JP20233893 A JP 20233893A JP H0756923 A JPH0756923 A JP H0756923A
Authority
JP
Japan
Prior art keywords
sentence
word
japanese
information
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5202338A
Other languages
Japanese (ja)
Inventor
Kayoko Yamamoto
佳代子 山本
Satoshi Watanabe
敏 渡辺
Sadaji Emori
貞治 江守
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5202338A priority Critical patent/JPH0756923A/en
Publication of JPH0756923A publication Critical patent/JPH0756923A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To provide a Japanese sentence generating device generating a Japanese sentence without ambiguity on a computer. CONSTITUTION:A construction check device 3 judges whether a unit sentence including a declinable word is a normal unit sentence which agrees with the regulations of sentence construction information given to the declinable word or not. When it does not agree, correction is urged so that it becomes the normal unit sentence and a sentence connector is detected. It is judged whether two unit sentences connected by the sentence connector have normal structure based on a rule on sentence structure given to the sentence connector or not. When they do not have normal structure, correction is urged so that they have normal structure. A meaning check device 5 uses concept information regulated by a word dictionary storage device 4 and details the modification relation of the respective words in an inputted Japanese original sentence to a range regulated on the computer. A Japanese sentence generation device 6 unifies the processing results of the construction check device and the meaning check device and constitutes the normal Japanese sentence which is uniquely analyzed on the computer.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、入力される日本語原文
から曖昧性を除去し一意に解釈できる日本語文を生成す
る日本語文生成装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a Japanese sentence generator for generating a Japanese sentence that can be uniquely interpreted by removing ambiguity from an input Japanese original sentence.

【0002】[0002]

【従来の技術】電子計算機をより使い易くするために
は、ヒューマン・マシン・インタフェース(HMI,Hu
man Machine Interface)に自然言語を利用することが
望まれている。しかし、人間が自然言語で文を記述する
場合、表現の省略、表現の抽象化等が起こり、曖昧性を
含んだ内容となることが多く、電子計算機で表現の多様
性、内容の曖昧性を含んだ文を一意に解釈することは容
易ではない。そのため、HMIに利用できる構文パター
ンおよび用語を限定した方式がデータベースの検索等に
おいて一部用いられているものの、計算機に処理方法を
指示する時には、一般的に自然言語は用いられない。
2. Description of the Related Art In order to make an electronic computer easier to use, human-machine interfaces (HMI, Hu
It is desired to use natural language for man machine interface). However, when humans describe sentences in natural language, the expressions are often omitted, the expressions are abstracted, and the contents often contain ambiguity. It is not easy to uniquely interpret the included sentence. Therefore, although a method that limits the syntax patterns and terms that can be used in the HMI is partially used in database searches and the like, natural language is generally not used when instructing a processing method to a computer.

【0003】[0003]

【発明が解決しようとする課題】本発明は上記問題点に
鑑み、特に日本語を対象とし、日本語で記述された文中
の省略を補充し、計算機上で見た表現を厳密にすること
により、文の曖昧性を除去することができる日本語文生
成装置を提供し、自然言語を用いた高度な指示性によ
り、計算機をエンドユーザが簡単に利用可能な環境をつ
くることを目的とする。特に、HMIの高度化、および
自然言語ベースのプログラミングを可能とすることにあ
る。
SUMMARY OF THE INVENTION In view of the above problems, the present invention is particularly directed to Japanese language, and by supplementing omissions in sentences written in Japanese and stricter expressions seen on a computer. We provide a Japanese sentence generator that can remove ambiguity of sentences, and aims to create an environment where end users can easily use a computer with a high degree of directivity using natural language. In particular, it is to enable the sophistication of HMI and natural language-based programming.

【0004】[0004]

【課題を解決するための手段】本発明の日本語文生成装
置は、入力される日本語原文から曖昧性を除去し所望の
日本語文を会話形式で生成する日本語文生成装置であっ
て、各単語をそれぞれ見出し語として記憶し、各見出し
語には各見出し語がそれぞれ具備する計算機上における
属性と、各見出し語に対する上位概念および下位概念に
相当する他の見出し語に関する概念情報とが与えられ、
さらに各見出し語がそれぞれ用言である場合には、前記
用言が用いられる単位文の文構造を規定する規則である
文構造情報が与えられている用語辞書記憶部と、入力さ
れた日本語原文から前記用言を検出し、前記用言を含む
単位文が前記用言に与えられた文構造情報の規定に合致
している正規単位文であるか否か判定し、合致していな
い場合には、その旨を表示器に表示して正規単位文にな
るように修正を促す第1の構文チェック手段と、入力さ
れた日本語原文から文結合子を検出し、文結合子によっ
て結合されている2つの単位文が、前記文結合子毎に予
め与えられている文結合規則に基づく正規構造をしてい
るか否か判断し、正規構造をしていない場合には、その
旨を表示器に表示して正規構造になるように修正を促す
第2の構文チェック手段と、第1,第2の構文チェック
手段が処理した日本語原文中で他の語を修飾していない
単語について、前記単語を見出し語として前記用語辞書
記憶部より前記見出し語の下位概念を表す単語を読み出
し、読み出した単語から1つが選択されると、選択され
た単語を保持するとともに選択された単語を見出し語と
してさらに下位概念を表す単語を前記用語辞書記憶部よ
り読み出すことを下位概念を持たない単語が選択される
まで繰り返す第1の意味チェック手段と、第1,第2の
構文チェック手段が処理した日本語原文中で他の語から
修飾されていない単語について、前記単語を見出し語と
して前記用語辞書記憶部より前記見出し語の上位概念を
表す単語を読み出し、読み出した単語から1つが選択さ
れると、選択された単語を保持するとともに選択された
単語を見出し語としてさらに上位概念を表す単語を前記
用語辞書記憶部より読み出すことを上位概念を持たない
単語が選択されるまで繰り返す第2の意味チェック手段
と、入力された日本語原文の文構造に対して前記第1,
第2の構文チェック手段により正規化され、さらに入力
された日本語原文の修飾語、被修飾語を持たない各単語
に対して前記第1および第2の意味チェック手段により
抽出され保持された単語が付加された文から、計算機で
認識可能な日本語文の形式を構成する日本語文構成手段
とを有する。
A Japanese sentence generator according to the present invention is a Japanese sentence generator that removes ambiguity from an input Japanese original sentence and generates a desired Japanese sentence in a conversational manner. Are stored as respective headwords, each headword is provided with a computer attribute of each headword, and conceptual information about other headwords corresponding to a superordinate concept and a subordinate concept for each headword,
Furthermore, when each headword is a syllable, a term dictionary storage unit to which sentence structure information, which is a rule that defines the sentence structure of a unit sentence in which the mnemonic is used, is given, and the input Japanese When the above-mentioned idiom is detected from the original sentence, it is judged whether or not the unit sentence including the above-mentioned idiom is a regular unit sentence that matches the rule of the sentence structure information given to the above-mentioned idiom, and if it does not match. Is displayed on the display unit and prompts the user to correct it so that it becomes a regular unit sentence, and a sentence connector is detected from the input Japanese original sentence, and the sentence connector is combined. It is determined whether or not the two unit sentences that have the regular structure have a regular structure based on a sentence combination rule given in advance for each sentence connector, and if they do not have a regular structure, a display to that effect is provided. The second syntax check that prompts you to correct it by displaying it in the Means and a word in which the other words are not modified in the Japanese original sentence processed by the first and second syntax checking means, the word is used as a headword, and the subordinate concept of the headword is stored in the term dictionary storage unit. A subordinate concept is to read out a word to be represented and, when one of the read out words is selected, hold the selected word and read out a word representing a subordinate concept from the term dictionary storage unit using the selected word as a headword. A first meaning checking unit that repeats until a word having no is selected and a word that is not modified from other words in the Japanese original sentence processed by the first and second syntax checking units finds the word. As a word, a word representing a superordinate concept of the entry word is read from the term dictionary storage unit, and when one of the read words is selected, the selected word is held. Second meaning checking means for repeating the reading of a word representing a superordinate concept from the term dictionary storage unit using the selected word as a headword until a word having no superordinate concept is selected, and input Japanese For the sentence structure of the original sentence,
Words that have been normalized by the second syntax checking means and that have been input by the first and second meaning checking means for each word that does not have a modifier or modified word in the Japanese original text that has been input. And a Japanese sentence composing means for composing a form of a Japanese sentence that can be recognized by a computer from the sentence to which is added.

【0005】また、第1の構文チェック手段が処理した
日本語原文を、第2の構文チェック手段が入力して、さ
らに処理を行なうのが好ましく、さらには、前記日本語
文構成手段は、構成した日本語文を表示するとともに、
日本語文生成の過程に発生し表示された日本語文から認
識できない情報である、単語の別候補の提示、日本語文
の正規化、詳細化、日本語文の構成において発生した誤
りに関する情報の提示を行うのも好ましい。
Further, it is preferable that the Japanese original sentence processed by the first syntax checking means is input to the second syntax checking means and further processed. Further, the Japanese sentence constructing means is configured. In addition to displaying Japanese sentences,
It presents different candidates for words, normalization and refinement of Japanese sentences, and information about errors that occurred in the construction of Japanese sentences, which is information that cannot be recognized from the displayed Japanese sentences during the process of generating Japanese sentences. Is also preferable.

【0006】[0006]

【作用】入力された日本語原文に対し、第1の構文チェ
ック手段が各用言を検出し、検出した用言を含む単位文
が用言に与えられた文構造情報の規定に合致している正
規単位文であるか否か判定し、合致していない場合に
は、その旨を表示器に表示して正規単位文になるように
修正を促す。また、第2の構文チェック手段は、入力さ
れた日本語原文から文結合子を検出し、文結合子によっ
て結合されている2つの単位文が、前記文結合子に与え
られている文構造に関する規則に基づく正規構造をして
いるか否か判断し、正規構造をしていない場合には、そ
の旨を表示器に表示して正規構造になるように修正を促
す。
In the input Japanese original sentence, the first syntax check means detects each verb and the unit sentence including the detected verb matches the rule of sentence structure information given to the verb. It is determined whether or not it is a regular unit sentence that exists, and if it does not match, a message to that effect is displayed on the display unit, and correction is urged so that it becomes a regular unit sentence. Further, the second syntax check means detects a sentence connector from the input Japanese original sentence, and two unit sentences connected by the sentence connector relate to a sentence structure given to the sentence connector. It is determined whether or not the regular structure is based on the rules, and if the regular structure is not established, a message to that effect is displayed on the display to prompt correction so that the regular structure is obtained.

【0007】第1,第2の意味チェック手段は、用語辞
書記憶部に規定される概念情報を用いて、入力された日
本語原文の各単語の修飾関係を計算機上で規定される範
囲まで詳細化する。日本語文生成手段は、第1,第2の
構文チェック手段および第1,第2の意味チェックの処
理結果を統合して、計算機上において一意に解釈される
正規な日本語文を構成する。
The first and second meaning checking means use the concept information defined in the term dictionary storage section to detail the modification relation of each word of the input Japanese original sentence up to the range specified on the computer. Turn into. The Japanese sentence generating means integrates the processing results of the first and second syntax checking means and the first and second semantic checking to form a regular Japanese sentence uniquely interpreted on a computer.

【0008】[0008]

【実施例】次に、本発明の実施例について図面を参照し
て説明する。図1は本発明の曖昧性除去可能な日本語文
生成装置の一実施例を示すブロック図、図2は図1の実
施例の入力装置からデータ記憶装置に記憶された文例、
および構文チェック装置、意味チェック装置における処
理結果を示す図、図3は図1の実施例の用語辞書記憶装
置に記憶された内容を示す図である。
Embodiments of the present invention will now be described with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of a disambiguating Japanese sentence generation apparatus of the present invention, and FIG. 2 is a sentence example stored in a data storage device from an input device of the embodiment of FIG.
FIG. 3 is a diagram showing a processing result in the syntax check device and the meaning check device, and FIG. 3 is a diagram showing contents stored in the term dictionary storage device of the embodiment of FIG.

【0009】利用者により記述された日本語原文(原文
と記す)が入力情報として入力装置1に与えられると、
入力装置1はその入力情報をデータ記憶装置2に記憶さ
せる。構文チェック装置3は、原文の日本語解析を行
い、図2(b)を参照すれば明らかなように、文構造を
構文木形式で表現する。すなわち、構文木は、文節間、
単位文間の関係、および用言に対する句の役割を示す情
報を備えている。次に原文中の用語に着目し、計算機で
一意に文構造を認識可能とするために規定された用語を
中心とした文構造に関する情報を、用語辞書記憶装置4
から参照し、日本語解析の結果により明らかになった原
文の文構造と比較する。比較の結果、原文中に欠落した
構造が有れば表示器に提示し補完を促す。また、過分な
構造が有れば削除するように提示する。
When a Japanese original sentence (written as an original sentence) described by the user is given to the input device 1 as input information,
The input device 1 stores the input information in the data storage device 2. The syntax check device 3 analyzes the original sentence in Japanese and expresses the sentence structure in a syntax tree format, as is apparent from FIG. That is, the syntax tree is
It has information indicating the relationship between unit sentences and the role of a phrase with respect to a idiom. Next, paying attention to the terms in the original sentence, information about the sentence structure centered on the terms defined so that the computer can uniquely recognize the sentence structure is stored in the term dictionary storage device 4.
, And compare it with the sentence structure of the original sentence revealed by the result of Japanese analysis. As a result of the comparison, if there is a missing structure in the original sentence, it is presented on the display unit to prompt the completion. Also, if there is an excessive structure, it is suggested to delete it.

【0010】さらに、構文チェック装置3は、文と文を
接続する文結合子に着目し、計算機で一意に文構造を認
識可能とするために規定した文結合子を中心とする文構
造に関する規則に基づき、正規の文構造と原文の文構造
とを比較する。用言の場合と同様、比較の結果、原文の
文構造上の過不足を補完させ、図2(c)が示すよう
に、補完させた結果をデータ記憶装置2に記憶させる。
Further, the syntax check device 3 pays attention to sentence connectors that connect sentences, and rules regarding sentence structures centered on sentence connectors specified so that a computer can uniquely recognize sentence structures. Based on, the regular sentence structure is compared with the original sentence structure. As in the case of the idiom, as a result of the comparison, excess or deficiency in the sentence structure of the original sentence is complemented, and the complemented result is stored in the data storage device 2 as shown in FIG.

【0011】意味チェック装置5は、データ記憶装置2
に記憶された前記構文チェック装置3における処理結果
を入力情報として読み出し、入力情報の各単語に関する
概念情報を用語辞書記憶装置4を参照して検出する。参
照した概念情報を利用し、入力情報の意味的曖昧性、お
よび誤りを検出し、計算機上の表現に直接対応付け可能
なレベルまで入力情報を詳細化(各単語の上位および下
位概念の単語の用語辞書記憶装置4からの抽出等)す
る。詳細化の結果をデータ記憶装置2に記憶させる。
The meaning check device 5 is a data storage device 2.
The processing result stored in the syntax check device 3 is read as input information, and the conceptual information on each word of the input information is detected by referring to the term dictionary storage device 4. Using the referenced conceptual information, the semantic ambiguity and errors of the input information are detected, and the input information is refined to a level at which it can be directly associated with computer expressions (words of higher and lower concepts of each word). Extraction from the term dictionary storage device 4). The detailing result is stored in the data storage device 2.

【0012】日本語文生成装置6は、データ記憶装置2
に記憶された前記意味チェック装置5における処理結果
を入力情報として読み出し、計算機が一意に認識可能
な、表現形式を限定した日本語文(表現限定文と記す)
を生成する。前記構文チェック装置3によって追加され
た構造において、対応する単語が不明の場合、例えば便
宜上記号等に置き換えて文生成する。生成した表現限定
文をデータ記憶装置2に記憶させる。
The Japanese sentence generation device 6 includes a data storage device 2
A Japanese sentence with a limited expression format that can be uniquely recognized by a computer by reading out the processing result in the meaning checking device 5 stored in (1) as an expression limited sentence.
To generate. In the structure added by the syntax check device 3, when the corresponding word is unknown, the sentence is generated by replacing it with a symbol or the like for convenience. The generated expression limiting sentence is stored in the data storage device 2.

【0013】日本語文修正装置7は、データ記憶装置2
から原文を前記日本語文生成装置6において生成された
表現限定文と文構造、単語候補情報、エラー情報等を入
力情報として読み出し、原文、表現限定文を提示する。
表現限定文中の単語候補存在箇所、および記号表現箇所
に対し、候補となる単語の提示等により利用者との会話
形式で単語の特定を支援する。さらに構文チェック装置
3、意味チェック装置5、日本語文生成装置6の各装置
において検出された誤りに関しても、利用者との会話形
式で誤りの情報の提示、応答によっては表現限定文に対
する修正作業を行う。
The Japanese sentence correction device 7 is a data storage device 2.
The original sentence is read as the input sentence, the sentence structure, the word structure, the word candidate information, the error information and the like generated by the Japanese sentence generation device 6, and the original sentence and the expression sentence are presented.
It supports the identification of words in the conversational form with the user by presenting candidate words and the like for the word candidate existing position and the symbolic expression position in the expression-limited sentence. Further, regarding the error detected by each of the syntax check device 3, the semantic check device 5, and the Japanese sentence generation device 6, the error information is presented in the form of conversation with the user, and depending on the response, correction work may be performed on the expression-limited sentence. To do.

【0014】表現限定文を修正した場合は、修正結果を
データ記憶装置2に記憶させ、処理を入力装置1に戻
す。修正されなかった場合は出力装置8に処理を移行
し、出力装置8は曖昧性の排除した日本語文として表現
限定文を出力する。
When the expression limitation sentence is corrected, the correction result is stored in the data storage device 2 and the process is returned to the input device 1. If not corrected, the process shifts to the output device 8, and the output device 8 outputs the expression-limited sentence as a Japanese sentence with ambiguity removed.

【0015】ここで用語辞書記憶装置4について図3を
参照して説明する。用語辞書記憶装置4は、見出し、属
性、概念情報、文構造情報を単語毎に記憶し、更に各装
置からの単語情報の参照要求に対し、単語の「見出し」
をキーとした情報検索を行い、検索結果を各装置に返却
する装置である。
The term dictionary storage device 4 will now be described with reference to FIG. The term dictionary storage device 4 stores a headline, an attribute, concept information, and sentence structure information for each word, and further responds to a request for reference of word information from each device, to obtain a “headline” of the word.
This is a device that performs information search using the key as a key and returns the search result to each device.

【0016】各単語における属性は、単語を計算機上の
表現に対応付けた場合に計算機上の表現が示す性質を表
し、関数、フレーム、スロット等に分類される。また、
概念情報は単語間の意味関係を示し、上位/下位概念間
でポインタが張られている、。さらに、文構造情報は、
単語が持つ正規の文構造として、各単語毎一意に文構造
を規定している。
The attribute of each word represents a property of the computer expression when the word is associated with the computer expression, and is classified into a function, a frame, a slot and the like. Also,
Conceptual information indicates the semantic relationship between words, and pointers are set between upper and lower concepts. Furthermore, the sentence structure information is
As a regular sentence structure of a word, the sentence structure is uniquely defined for each word.

【0017】図4は構文チェック装置3における文構造
上の曖昧性、および誤り検出の全体の手順を示すフロー
チャートである。
FIG. 4 is a flow chart showing the overall procedure of ambiguity in sentence structure and error detection in the syntax check device 3.

【0018】図5は意味チェック装置5における意味上
の曖昧性、および誤り検出の全体の手順を示すフローチ
ャート、図6は単語に関する下位概念情報を利用し、図
7は単語に関する上位概念情報を利用し、入力情報の内
容を計算機上の表現に直接対応付けが可能となるまで詳
細化する手順を示すフローチャートである。
FIG. 5 is a flow chart showing the overall procedure of ambiguity in meaning and error detection in the meaning checking device 5, FIG. 6 uses lower-level concept information on words, and FIG. 7 uses higher-level concept information on words. 9 is a flowchart showing a procedure for refining the contents of the input information until it becomes possible to directly associate the contents of the input information with the expression on the computer.

【0019】いま、図2(a)に示す日本語文「商品コ
ードが“3”と等しいならば、“ファックス”が存在す
る」が図1の実施例の入力装置1より入力されたとす
る。入力情報はデータ記憶装置2に記憶され、制御は構
文チェック装置3へ移行する。用語辞書記憶装置4が図
3に示すような情報を記憶しているならば、構文チェッ
ク装置3は、用語辞書記憶装置4を単語の見出しで検索
し、単語の文構造情報を得る。更に、構文チェック装置
3は、参照した文構造情報を利用して、入力情報が表す
内容を、計算機が一意に認識可能な文構造に変更する正
規化を行う。正規化は図4に示す手順に従って行われ
る。
It is assumed that the Japanese sentence "if the product code is equal to" 3 "," fax "exists""shown in FIG. 2A is input from the input device 1 of the embodiment shown in FIG. The input information is stored in the data storage device 2, and control is transferred to the syntax check device 3. If the term dictionary storage device 4 stores the information as shown in FIG. 3, the syntax check device 3 searches the term dictionary storage device 4 by the word heading and obtains the sentence structure information of the word. Further, the syntax check device 3 uses the referred sentence structure information to perform normalization for changing the content represented by the input information into a sentence structure that can be uniquely recognized by the computer. The normalization is performed according to the procedure shown in FIG.

【0020】まず、データ記憶装置2より読み出した原
文を日本語解析することによって原文の文構造(入力文
構造と記す)を明らかにする(ステップS1)。入力文
構造は、原文の文節間の依存関係に着目して整理される
(図2(b)参照)。
First, the sentence structure of the original sentence (referred to as an input sentence structure) is clarified by analyzing the original sentence read from the data storage device 2 in Japanese (step S1). The input sentence structure is organized by focusing on the dependency relation between the clauses of the original sentence (see FIG. 2B).

【0021】次に、入力文構造中で用言となる単語に着
目して単語Aとし、用語辞書記憶装置4を単語Aの見出
しで検索し、文構造情報を得る(ステップS2)。
Next, the word which becomes a mnemonic in the input sentence structure is focused on as the word A, and the term dictionary storage device 4 is searched by the heading of the word A to obtain sentence structure information (step S2).

【0022】単語Aを中心とした入力文構造中の部分文
構造と、単語Aの正規の文構造を表す文構造情報を比較
し、構造上の誤りを検出する(ステップS3)。比較の
結果、構造が一致しているか否か判断する(ステップS
4)。構造が一致しない場合、正規の文構造に対応させ
て欠落部分の補完、余剰部分の削除を行い、入力文構造
を変更し、削除した部分の関してはエラー情報としてデ
ータ記憶装置2に記憶させる(ステップS5)。入力文
構造中の全用言に対する検査が終了したか判断し(ステ
ップS6)、終了でなければステップS2に戻り、終了
であれば、入力構造中の文結合子に着目し単語Bとし、
単語Bを中心とした入力構造中の部分文構造と、予め規
定された単語Bの正規の文構造を表す文構造規則を比較
し、構造上の誤りを検出する(ステップS7)。比較の
結果、構造が一致しているか否か判断する(ステップS
8)。構造が一致しない場合には、正規の文構造に対応
させて欠落部分の補完、余剰部分の削除を行い、入力文
構造を変更し、削除した部分の関してはエラー情報とし
てデータ記憶装置2に記憶させる(ステップS9)。入
力文構造中の総ての文結合子に対する検査が終了したか
判断し(ステップS10)、終了でなければステップS
7に戻り、終了であれば構文チェック処理を終了する。
The partial sentence structure in the input sentence structure centering on the word A is compared with the sentence structure information representing the regular sentence structure of the word A to detect a structural error (step S3). As a result of the comparison, it is determined whether or not the structures match (step S
4). If the structures do not match, the missing part is complemented and the surplus part is deleted in accordance with the regular sentence structure, the input sentence structure is changed, and the deleted part is stored in the data storage device 2 as error information. (Step S5). It is judged whether or not the inspection for all the idioms in the input sentence structure has been completed (step S6), and if not completed, the process returns to step S2, and if completed, the sentence connector in the input structure is focused and set as the word B,
The partial sentence structure in the input structure centering on the word B is compared with the sentence structure rule representing the regular sentence structure of the word B defined in advance, and a structural error is detected (step S7). As a result of the comparison, it is determined whether or not the structures match (step S
8). If the structures do not match, the missing part is complemented and the surplus part is deleted in accordance with the regular sentence structure, the input sentence structure is changed, and the deleted part is stored in the data storage device 2 as error information. It is stored (step S9). It is judged whether or not the inspections for all sentence connectors in the input sentence structure have been completed (step S10), and if not completed, step S
Returning to 7, if it is finished, the syntax check process is finished.

【0023】前述の説明から構文チェック装置3の動作
は明らかになったが、図2(a)の日本語文に基づい
て、さらに具体的に説明する。構文チェック装置3にお
いて、まず入力情報である日本語文は日本語解析され、
入力文構造として、図2(b)が示すような依存構造が
生成される。
Although the operation of the syntax check device 3 has been clarified from the above description, it will be described more specifically based on the Japanese sentence in FIG. 2 (a). In the syntax check device 3, first, the Japanese sentence that is the input information is analyzed into Japanese,
A dependency structure as shown in FIG. 2B is generated as the input sentence structure.

【0024】入力文構造中の単語の中から前述の用言で
ある単語Aとして「等しい」が選ばれると、用語辞書記
憶装置4を参照して「等しい」の文構造情報を得る。図
3より、「等しい」は正規の文構造として主格と対象格
を持ち、各格の文中での表示順序は不特定であり、主
格、対象格共に格に対応する単語としてdataの属性を持
つものを要求することがわかる。
When "equal" is selected as the above-mentioned word A from the words in the input sentence structure, the term dictionary storage device 4 is referred to obtain the sentence structure information of "equal". As shown in FIG. 3, “equal” has a nominative case and a subject case as a regular sentence structure, the display order in each sentence is unspecified, and both the nominative case and the subject case have an attribute of data as a word corresponding to the case. You know that you want things.

【0025】次に、入力文構造中の「等しい」を中心と
した部分文構造と用語辞書記憶装置4から参照した正規
の文構造とを比較する、例において、入力文構造は主
格、対象格を持ち正規の文構造と一致することがわか
る。
Next, the partial sentence structure centered on "equal" in the input sentence structure is compared with the regular sentence structure referred from the term dictionary storage device 4. In the example, the input sentence structure is the nominative case, the target case. It can be seen that it matches with the regular sentence structure.

【0026】さらに、用語である単語Aとして「存在す
る」に関しても同様の処理を行う。「存在する」は入力
文構造として主格を持ち(図2(b)参照)、一方、正
規の文構造として主格と場所格を必要とする(図3参
照)ことから、入力文構造には場所格が欠落しているこ
とがわかる。場所格にあたる単語を便宜上、記号「XX
X」で表し、場所格の構造を入力文構造に付加すること
により、入力文構造を正規の文構造に変更する。
Further, similar processing is performed for "exists" as the word A which is a term. Since “exists” has a nominative case as an input sentence structure (see FIG. 2B), and requires a nominative case and a place case as a regular sentence structure (see FIG. 3), there is no place in the input sentence structure. You can see that the case is missing. For the sake of convenience, the word corresponding to the place is the symbol "XX
The input sentence structure is changed to a regular sentence structure by adding the place structure to the input sentence structure.

【0027】用語を中心とした文構造の正規化の後、文
結合子を中心とした文構造のチェックを行う。文結合子
「ならば」に対し、正規の文構造として以下の文構造が
規定されている。
After normalizing the sentence structure centered on terms, the sentence structure centered on the sentence connector is checked. The following sentence structure is defined as a regular sentence structure for the sentence connector “Nara”.

【0028】正規文構造規則:「文結合子「ならば」に
は、条件と状態を表す2つの文が従属する」(図2
(b)構文木構造から明らか) 入力文構造と上記正規文構造とを比較すると、図2
(b)より、入力文構造と正規文構造が一致することが
わかる。
Regular sentence structure rule: "A sentence connector" if "is subordinate to two sentences representing a condition and a state" (Fig. 2).
(B) Obvious from the syntax tree structure) When the input sentence structure and the above regular sentence structure are compared, FIG.
From (b), it can be seen that the input sentence structure matches the regular sentence structure.

【0029】入力文構造中には「ならば」以外の文結合
子がないので繰り返しを終了し、正規化した文構造をデ
ータ記憶装置2に記憶させ、構文チェック処理を終了
し、制御は意味チェック装置5へ移行する(「ならば」
のほかの文結合子として例を挙げれば、並列を規定する
「と」あるいは「または」、等位を規定する「かつ」等
がある)。
Since there is no sentence connector other than "if" in the input sentence structure, the iteration is terminated, the normalized sentence structure is stored in the data storage device 2, the syntax check process is terminated, and the control is executed. Move to check device 5 (“if”)
Other examples of sentence connectors include "and" or "or" that specify parallelism, and "and" that specify coordination.

【0030】用語辞書記憶装置4が図3に示すような情
報を記憶しているので、意味チェック装置5は、用語辞
書記憶装置4を単語の見出しで検索し、各単語の概念情
報を得る。さらに、意味チェック装置5は、参照した概
念情報を利用して、入力情報が表す内容を、計算機上の
表現に対応可能なれべるまで詳細化し、具体的な表現に
対応付ける。詳細化は図5および図6,7に示す手順に
従って行われる。
Since the term dictionary storage device 4 stores the information as shown in FIG. 3, the meaning checking device 5 searches the term dictionary storage device 4 by the word heading to obtain the conceptual information of each word. Further, the meaning check device 5 uses the referred conceptual information to refine the content represented by the input information to the extent that the expression on the computer can be dealt with, and associates it with a concrete expression. The detailing is performed according to the procedure shown in FIG. 5 and FIGS.

【0031】まず、名詞句となる構文木の修飾関係に着
目し、他の単語を修飾しない名詞を単語Aとする。単語
Aの下位概念語情報を基に、計算機上の表現に対応する
レベルまで知識表現を詳細化する(ステップS11)。
この詳細化は図6に示される手順で行われる。入力情報
にエラーが検出されず、正常に詳細化が終了したか否か
判断する(ステップS12)。詳細化が異常終了してい
る場合、単語Aの上位概念語情報を基に、意味が一意に
限定されるまで知識表現を詳細化(図7参照)する(ス
テップS16)。一方、詳細化が正常終了している場
合、以下の処理を行う。文構造上用言から単語Aが対応
する格に対し要求される属性と一致するまで、単語Aの
詳細化が行われていることを確認する(ステップS1
3)。確認の結果、属性が一致しているか否かを判断し
(ステップS14)、一致する場合は、ステップS16
に移行し、一致しない場合は、単語A、要求された属性
等をエラー情報として記憶(ステップS15)した後、
ステップS16に移行する。入力情報中の全単語の検査
が終了したか判断し、終了でなければステップS11に
戻り、終了であれば詳細化した入力情報をデータ記憶装
置2に記憶して処理を終了する。
First, paying attention to the modification relation of the syntactic tree serving as a noun phrase, the word A is defined as a noun that does not modify other words. Based on the subordinate word information of word A, the knowledge expression is refined to a level corresponding to the expression on the computer (step S11).
This detailing is performed by the procedure shown in FIG. No error is detected in the input information, and it is determined whether the refinement has been completed normally (step S12). If the refinement has ended abnormally, the knowledge representation is refined (see FIG. 7) until the meaning is uniquely limited based on the superordinate word information of the word A (step S16). On the other hand, when the refinement has been completed normally, the following processing is performed. It is confirmed that the word A is refined until the word A in the sentence structure matches the attribute required for the corresponding case (step S1).
3). As a result of the confirmation, it is judged whether or not the attributes match (step S14), and if they match, step S16.
If there is no match, the word A, the requested attribute, etc. are stored as error information (step S15),
Control goes to step S16. It is determined whether or not the inspection of all the words in the input information is completed, and if not completed, the process returns to step S11, and if completed, the detailed input information is stored in the data storage device 2 and the process is completed.

【0032】次に前述のステップS11の詳細について
図6を参照して説明する。上述の単語Aが修飾する語で
ある。被修飾語の存在の確認を行い(ステップS2
1)、被修飾語があるか否か判断する(ステップS2
2)。ステップS22で被修飾語があった場合、単語A
の下位概念語の存在を確認し(ステップS23)、下位
概念語が在るか否か判断する(ステップS24)。下位
概念語が有った場合、被修飾語は下位概念語であるか否
か判断する(ステップS25)。被修飾語が下位概念語
でない場合、下位概念語と被修飾語の概念関係を確認し
(ステップS26)、関係付け可能か否か判断する(ス
テップS27)。関係付け可能であれば、入力情報に、
下位概念語と被修飾語の概念関係を示す文構造を付加し
(ステップS28,パスの形成−後述)、被修飾語を対
象としてステップS21に戻り、上述の処理を繰り返す
(ステップS29)。
Next, the details of step S11 will be described with reference to FIG. The above-mentioned word A is a modified word. The existence of the modified word is confirmed (step S2
1), it is determined whether there is a modified word (step S2)
2). If there is a modified word in step S22, the word A
The existence of a subordinate concept word is confirmed (step S23), and it is determined whether or not there is a subordinate concept word (step S24). When there is a subordinate concept word, it is determined whether or not the modified word is a subordinate concept word (step S25). If the modified word is not a subordinate concept word, the conceptual relationship between the subordinate concept word and the modified word is confirmed (step S26), and it is determined whether or not the relation can be associated (step S27). If you can relate it to the input information,
A sentence structure showing a conceptual relationship between the subordinate concept word and the modified word is added (step S28, path formation-described later), the modified word is targeted, the process returns to step S21, and the above-described processing is repeated (step S29).

【0033】ステップS24で下位概念語がなかった場
合、およびステップS27で関係付け可能でない場合に
は、入力情報にエラーが検出されたとし、エラー情報と
して被修飾語、単語Aの下位概念情報等をデータ記憶装
置2に記憶し、処理を終了する(ステップS30)。ス
テップS22で被修飾語がなかった場合、単語Aの下位
概念語の存在を確認し(ステップS31)、下位概念語
が在るか否か判断する(ステップS32)。下位概念語
がなければ終了し、あれば下位概念語が複数存在するか
否かを判断する(ステップS33)。下位概念語が複数
存在する場合は、被修飾語として適切な下位概念語を一
つ選択して入力情報に付加し、選択されなかった下位概
念語を被修飾語候補としてデータ記憶装置2に記憶し
(ステップS34)、処理を終了する。下位概念語が一
つだけ存在する場合、下位概念語を被修飾語として入力
情報に付加し(ステップS35)、付加した被修飾語を
対象としてステップS21に戻り、処理を繰り返す(ス
テップS36)。
If there is no subordinate concept word in step S24, and if it is not possible to relate them in step S27, it is assumed that an error is detected in the input information, and the modified word, subordinate concept information of word A, etc. are used as error information. Is stored in the data storage device 2, and the process ends (step S30). When there is no modified word in step S22, the existence of a subordinate concept word of word A is confirmed (step S31), and it is determined whether or not there is a subordinate concept word (step S32). If there is no subordinate concept word, the process ends, and if there is, one determines whether or not there are a plurality of subordinate concept words (step S33). When there are a plurality of subordinate concept words, one proper subordinate concept word is selected as a modified word and added to the input information, and the unselected subordinate concept word is stored in the data storage device 2 as a modified word candidate. Then (step S34), the process ends. When only one subordinate concept word exists, the subordinate concept word is added to the input information as a modified word (step S35), the added modified word is returned to step S21, and the process is repeated (step S36).

【0034】次に前述のステップS16の詳細について
図7を参照して説明する。上述の単語Aを修飾する修飾
語の存在の確認を行い(ステップS41)、修飾語があ
るか否か判断する(ステップS42)。ステップS42
で修飾語があった場合、単語Aの上位概念語の存在を確
認し(ステップS43)、上位概念語が有るか否か判断
する(ステップS44)。上位概念語が有った場合、被
修飾語は上位概念語であるか否か判断する(ステップS
45)。被修飾語が上位概念語でない場合、上位概念語
と被修飾語の概念関係を確認し(ステップS46)、関
係付け可能か否か判断する(ステップS47)。関係付
け可能であれば、入力情報である文構造に、上位概念語
と被修飾語の概念関係を示す文構造を付加し(ステップ
S48,パスの形成−後述)、被修飾語を対象としてス
テップS41に戻り、上述の処理を繰り返す(ステップ
S49)。
Details of step S16 will be described below with reference to FIG. The presence of a modifier that modifies the above-mentioned word A is confirmed (step S41), and it is determined whether there is a modifier (step S42). Step S42
If there is a modifier, the presence of a superordinate concept of word A is confirmed (step S43), and it is determined whether or not there is a superordinate concept (step S44). If there is a superordinate concept word, it is judged whether or not the modified word is a superordinate concept word (step S).
45). If the modified word is not a superordinate concept word, the conceptual relationship between the superordinate concept word and the modified word is confirmed (step S46), and it is determined whether the relation can be established (step S47). If the relation is possible, a sentence structure indicating the conceptual relationship between the superordinate concept word and the modified word is added to the sentence structure which is the input information (step S48, path formation-described later), and the modified word is subjected to the step. It returns to S41 and repeats the above-mentioned processing (step S49).

【0035】ステップS44で上位概念語がなかった場
合、およびステップS47で関係付け可能でない場合に
は、入力情報にエラーが検出されたとし、エラー情報と
して修飾語、単語Aの上位概念情報等をデータ記憶装置
2に記憶し、処理を終了する(ステップS50)。ステ
ップS42で修飾語がなかった場合、単語Aの上位概念
語の存在を確認し(ステップS51)、上位概念語があ
るか否か判断する(ステップS52)。上位概念語がな
ければ終了し、あれば上位概念語が複数存在するか否か
を判断する(ステップS53)。上位概念語が複数存在
する場合は、修飾語として適切な上位概念語を一つ選択
して入力情報に付加し、選択されなかった上位概念語を
被修飾語候補としてデータ記憶装置2に記憶し(ステッ
プS54)、処理を終了する。上位概念語が一つだけ存
在する場合、上位概念語を修飾語として入力情報に付加
し(ステップS55)、付加した修飾語を対象としてス
テップS41に戻り、処理を繰り返す(ステップS5
6)。
If there is no superordinate concept word in step S44, and if it is not possible to relate them in step S47, it is assumed that an error is detected in the input information, and the modifier word, superordinate concept information of word A, etc. are used as error information. The data is stored in the data storage device 2, and the process ends (step S50). When there is no modifier in step S42, the existence of a superordinate concept word of word A is confirmed (step S51), and it is determined whether or not there is a superordinate concept word (step S52). If there is no superordinate concept word, the processing ends. If there is, there is determined whether or not there are a plurality of superordinate concept words (step S53). When there are a plurality of superordinate concept words, one proper superordinate concept word is selected as a modifier and added to the input information, and the superordinate conceptual word that is not selected is stored in the data storage device 2 as a modified word candidate. (Step S54), the process ends. If there is only one superordinate concept word, the superordinate concept word is added to the input information as a modifier (step S55), the added modifier is returned to step S41, and the process is repeated (step S5).
6).

【0036】前述の説明から各装置の動作は明らかにな
ったが、図2(c)の構文チェック結果に基づいて、さ
らに具体的に説明する。入力情報中の単語の中から前述
の単語Aとして「商品コード」が選択されたとする。ま
ず、「商品コード」の下位概念情報を利用して表現を詳
細化する処理を行う(下位概念情報に基づく詳細化は図
6に従って行われる)。
Although the operation of each device has been clarified from the above description, it will be described more specifically based on the syntax check result of FIG. It is assumed that the "product code" is selected as the above-mentioned word A from the words in the input information. First, the process of refining the expression is performed by using the subordinate concept information of the "product code" (the refining based on the subordinate concept information is performed according to FIG. 6).

【0037】「商品コード」の場合、入力情報より被修
飾語を持たないことがわかる。このため、「商品コー
ド」の下位概念語の存在を確認する。図3より、「商品
コード」は下位概念語として、「値」、「欄」、「形
式」を持つことがわかる。このように、詳細化の過程
で、入力情報で省略されていた下位概念語の存在が複数
個確認された場合は、被修飾語として適当な下位概念語
を一つ選択し、残りの被修飾語候補として記憶し、処理
を終了する。上記「商品コード」の場合、文構造上が従
属する用語「等しい」は属性として「data」を要求して
いることなどから、被修飾語として「値」が選択され、
「欄」と「形式」が被修飾語候補として記憶され、下位
概念情報に基づく詳細化処理が終了する。
In the case of "product code", it can be seen from the input information that it does not have a modified word. Therefore, the existence of a subordinate term of "product code" is confirmed. It can be seen from FIG. 3 that “product code” has “value”, “column”, and “format” as subordinate terms. In this way, in the process of refinement, when the existence of multiple subordinate terms omitted in the input information is confirmed, one appropriate subordinate term is selected as a modified word, and the remaining modified words are selected. It is stored as a word candidate and the process ends. In the case of "product code", the term "equal" depending on the sentence structure requires "data" as an attribute, etc., so "value" is selected as the modifier.
The “column” and the “form” are stored as the modified word candidates, and the detailed processing based on the subordinate concept information ends.

【0038】次に、下位概念語を基にした詳細化が正常
に終了したか否かを判断する。上記「商品コード」の場
合は正常に終了しているため、詳細化された最下位レベ
ルの単語「値」の属性と、文構造上「商品コード」の対
応する格に対し用語が要求する属性とを比較する。「商
品コード」は用語「等しい」の主格であり(図2(c)
参照)、「等しい」が主格に要求する属性は「data」で
ある(図3参照)。一方、「値」の属性は「data」であ
る(図3参照)ことから、属性の一致が確認され、その
結果、制御は上位概念情報を利用した詳細化処理に移行
する(上位概念情報に基づく詳細化は図7に従って行わ
れる)。
Next, it is judged whether or not the refinement based on the subordinate term has been completed normally. In the case of the above "commodity code", it has been completed normally. Therefore, the attribute of the refined lowest level word "value" and the attribute required by the term for the corresponding case of "commodity code" in the sentence structure. Compare with. "Product code" is the nominative of the term "equal" (Fig. 2 (c)
), The attribute that "equal" requires in the nominative case is "data" (see FIG. 3). On the other hand, since the attribute of “value” is “data” (see FIG. 3), it is confirmed that the attributes match, and as a result, the control shifts to the refinement process using the higher-level concept information (to the higher-level concept information). The refinement based on FIG. 7 is performed).

【0039】上位概念情報を利用した詳細化処理では、
まず対象となる単語に対する修飾語の存在を確認する。
「商品コード」の場合、入力情報中に修飾語を持たな
い。このため、「商品コード」の上位概念語の存在を確
認する。図3より、「商品コード」は上位概念語とすて
「注文票」、「基本情報」を持つことが確認される。こ
のように、詳細化の過程で、入力情報で省略されていた
上位概念語の存在が複数個確認された場合は、修飾語と
して適当な上位概念語を一つ選択し、残りを修飾語候補
として記憶し、処理を終了する。
In the detailing process using the superordinate concept information,
First, the existence of a modifier for the target word is confirmed.
In the case of "product code", there is no modifier in the input information. Therefore, the existence of a broader term of "product code" is confirmed. From FIG. 3, it is confirmed that "product code" has "order slip" and "basic information" as superordinate terms. In this way, in the process of refinement, if the existence of multiple superordinate terms omitted in the input information is confirmed, one proper superordinate term is selected as a modifier, and the rest are qualified candidate words. Then, the process ends.

【0040】上記「商品コード」の場合、修飾語として
「注文票」が選択され、修飾語候補として「基本情報」
がデータ記憶装置2に記憶されて上位概念情報に基づい
た詳細化が終了する。
In the case of the "product code", "order slip" is selected as the modifier, and "basic information" is selected as the modifier candidate.
Is stored in the data storage device 2, and the refinement based on the superordinate concept information ends.

【0041】概念情報を利用した表現の詳細化におい
て、例えば修飾語が上位概念語の中に含まれない場合、
上位概念語と修飾語の間に省略された単語があるものと
して考え、上位概念語からさらにその上位概念語語へと
概念関係をたどり、修飾語までのパスを探す処理を行
う。この結果、上位概念語と修飾語との関係付けが可能
であれば、入力情報にパスの構造を付加する。これは、
下位概念情報を利用した詳細化処理においても、上位概
念語と修飾語間の関係が下位概念語と被修飾語間の関係
に代わるだけで基本的に同様である。
In the refinement of the expression using the concept information, for example, when the modifier is not included in the superordinate concept,
It is assumed that there is an abbreviated word between the superordinate concept word and the modifier, and the concept relation is further traced from the superordinate concept word to the superordinate concept word, and a process to find a path to the modifier is performed. As a result, if it is possible to associate the superordinate concept word and the modifier, the path structure is added to the input information. this is,
Also in the detailed processing using the subordinate concept information, the relationship between the superordinate concept word and the modifier is basically the same except that the relationship between the subordinate concept word and the modified word is replaced.

【0042】概念情報を利用した詳細化処理において入
力情報に誤りが検出された場合は、誤り対象となる単語
および概念情報等をデータ記憶装置2にエラー情報とし
て記憶し、該単語に関する処理を終了し、他の単語に関
する詳細化を行う。
When an error is detected in the input information in the refinement process using the conceptual information, the word to be erroneous, the conceptual information and the like are stored in the data storage device 2 as error information, and the process relating to the word is completed. Then refine the other words.

【0043】入力情報中の全単語に対する詳細化が終了
した場合、入力情報に用語辞書記憶装置4から得た情
報、および詳細化処理の結果を付加(図2(d)参
照)、データ記憶装置2へ記憶した後、制御を日本語文
生成装置6へ移行する。
When the refinement of all the words in the input information is completed, the information obtained from the term dictionary storage device 4 and the result of the refinement processing are added to the input information (see FIG. 2D), the data storage device. After storing in 2, the control is transferred to the Japanese sentence generator 6.

【0044】日本語文生成装置6では、データ記憶装置
2から前記意味チェック装置5で変更された入力情報
(図2(d)参照)を読み出し、計算機で一意に認識可
能とするために、表現形式を限定した表現限定文を生成
する。表現限定文を生成する規則は、用言に関しては用
語辞書記憶装置4に記憶した文構造情報で規定されてお
り、一方、体言、文結合子に関しては日本語文生成装置
6で一般的な生成規則が規定されている。
The Japanese sentence generation device 6 reads the input information (see FIG. 2 (d)) changed by the meaning check device 5 from the data storage device 2 and expresses it in order to make it uniquely recognizable by a computer. Generates an expression-limited sentence that limits The rules for generating the expression-limited sentence are defined by the sentence structure information stored in the term dictionary storage device 4 for the idioms, while the production rules generally used in the Japanese sentence generation device 6 for the nouns and sentence connectors. Is specified.

【0045】用言に関しては、前記構文チェック装置3
において自由に記述された日本語の原文から計算機で認
識可能な表現限定文へ文構造上の正規化が行われている
ため、日本語文生成装置6では、用言の文構造情報にお
ける格毎の「順序」項目の値(図3参照)に従い、各格
に対応する名詞句を並べ替える処理を行う。「順序」項
目の値が「nul 」の場合は順序を問わないことを意味す
る。
Regarding the verbs, the syntax check device 3
Since the sentence structure is normalized from the original sentence of Japanese freely described in S., to the expression-limited sentence that can be recognized by the computer, in the Japanese sentence generation device 6, in the sentence structure information of the noun, The noun phrase corresponding to each case is rearranged according to the value of the "order" item (see FIG. 3). If the value of the "order" item is "nul", it means that the order does not matter.

【0046】体言、文結合子に関しては日本語文生成装
置6で規定する生成規則に基づき、前記意味チェック装
置5において詳細化された文構造から名詞句、文を生成
する。生成規則例を以下に示す。
With respect to the nouns and sentence connectors, a noun phrase and a sentence are generated from the detailed sentence structure in the meaning check device 5 based on the generation rule defined by the Japanese sentence generation device 6. An example of production rules is shown below.

【0047】生成規則例1 文構造:「単語Aには、単語Bの修飾の関係で従属する (単語A,単語Bは体言)」 ↓ 日本語文:単語B+「の」+単語A 生成規則例2 文構造:「文結合子「ならば」には、文Aが条件、文Bが状態の関係で2つ の文が従属する」 ↓ 日本語文:文A+「ならば」+文B また、構文チェック装置3で付加された部分文構造にお
いて、単語が特定不可能なため記号をあてはめている場
合は記号を単語とみなして文生成することが規定されて
いる。
Generation Rule Example 1 Sentence structure: "Word A is subordinate to word B in the relation of modification of word B (word A and word B are synonyms)" ↓ Japanese sentence: word B + "no" + word A Generation rule example 2 Sentence structure: “Sentence A is a condition and sentence B is a condition, and two sentences are subordinate to the sentence connector“ if ”. ↓ Japanese sentence: sentence A +“ if ”+ sentence B In the partial sentence structure added by the syntax check device 3, when a symbol is applied because the word cannot be specified, it is specified that the symbol is regarded as a word and a sentence is generated.

【0048】以下に、図2(d)に示す文構造を入力情
報とした場合について説明する。上記規則により、用語
「等しい」の主格に対応する名詞句は「注文票の商品コ
ードの値」となる。一方、用語「等しい」の文構造情報
において、項目「順序」の値は主格、対象格共に「nul
」であり(図3参照)、主格、対象格に対応する名詞
句間の語順は任意となるため、入力情報の語順に従うこ
ととなり、文結合子「ならば」の条件の関係で従属する
単位文「注文票の商品コードの値が“3”と等しい」が
生成される。
The case where the sentence structure shown in FIG. 2D is used as input information will be described below. According to the above rule, the noun phrase corresponding to the nominative "equal" is "the value of the product code of the order form". On the other hand, in the sentence structure information of the term “equal”, the value of the item “order” is “nul
(See FIG. 3), the word order between the noun phrases corresponding to the nominative case and the subject case is arbitrary, so the word order of the input information is followed, and the subordinate unit in the relation of the condition of the sentence connector “Nara” The sentence "the product code value of the order form is equal to" 3 "" is generated.

【0049】用語「存在する」に関しても同様で、主
格、対象格に対応する名詞句間の語順は任意であり、場
所格に対応する名詞句間の記号「XXX」で表されてい
ることから、文結合子「ならば」に状態の関係で従属す
る単位文「“ファックス”がXXXに存在する」が生成
される。
The same applies to the term "exists". The word order between noun phrases corresponding to the nominative case and the object case is arbitrary, and is represented by the symbol "XXX" between noun phrases corresponding to the place case. , A unit sentence ““ fax ”exists in XXX” that is subordinate to the sentence connector “if” in a state relationship is generated.

【0050】さらに、文結合子「ならば」に対し上記規
則をあてはめることにより、表現限定文「注文票の商品
コードの値が“3”と等しいならば、“ファックス”が
XXXに存在する」が生成されることになる。
Further, by applying the above rule to the sentence connector "if", the expression limitation sentence "if the value of the product code of the order form is equal to" 3 "," fax "exists in XXX". Will be generated.

【0051】生成された表現限定文をデータ記憶装置2
に記憶させて、日本語文修正装置7に処理を移行する。
The generated expression-limited sentence is stored in the data storage device 2.
Then, the processing is transferred to the Japanese sentence correction device 7.

【0052】日本語文修正装置7では、データ記憶装置
2から原文と前記日本語文生成装置6において生成され
た表現限定文、文構造、単語候補情報、エラー情報等を
入力情報として読み出し、原文、表現限定文を提示す
る。表現限定文の提示において、単語候補が箇所、およ
び記号で代用表現している箇所を利用者に明示し、利用
者による適切な単語の特定を促す。単語の特定作業は、
単語候補が存在する場合は候補一覧を利用者に提示し、
記号から単語に置き換える場合は文構造情報中の格の属
性等に関する情報を基に対応する単語を用語辞書記憶装
置4から収集し、単語の候補として利用者に提示するこ
とにより、利用者との会話形式で支援される。さらに、
前記構文チェック装置3、意味チェック装置5、日本語
文生成装置6等の各装置において検出された誤りに関し
ても、エラー情報をエラー箇所、およびエラー内容等を
提示することにより、表現限定文に対する修正作業を支
援する。
In the Japanese sentence correction device 7, the original sentence and the expression-limited sentence, sentence structure, word candidate information, error information, etc. generated in the Japanese sentence generation device 6 are read as input information, and the original sentence, expression Present the limited text. In the presentation of the expression-limited sentence, the place where the word candidate and the place where the word is represented by a symbol are clearly shown to the user, and the user is prompted to identify an appropriate word. The task of identifying words is
If there are word candidates, present the candidate list to the user,
In the case of replacing a symbol with a word, the corresponding word is collected from the term dictionary storage device 4 based on the information about the case attribute in the sentence structure information and presented to the user as a word candidate, thereby Being supported in a conversational manner. further,
With respect to the error detected in each of the syntax check device 3, the semantic check device 5, the Japanese sentence generation device 6 and the like, by presenting the error information, the error location, the error content, etc. To help.

【0053】以下に、前記日本語文生成装置6で生成さ
れた表現限定文「注文票の商品コードの値が“3”と等
しいならば、“ファックス”がXXXに存在する」を入
力情報とした場合について説明する。
Below, the expression-limited sentence "if the product code value of the order form is equal to" 3 "," fax "exists in XXX""generated by the Japanese sentence generation device 6 is used as input information. The case will be described.

【0054】上記入力情報において、単語候補が存在す
る箇所、および記号で代用している箇所を下線で表すと
すると、利用者へは「注文票の商品コードの値が“3”
と等しいならば、“ファックス”がXXXに存在する」
が提示されることになる。
In the above input information, if the place where the word candidate exists and the place where the symbol is substituted are underlined, the user is informed that "the product code value of the order form is" 3 "".
"Fax" exists in XXX if
Will be presented.

【0055】利用者が、単語「注文票」の修正を選択し
たとする。「注文票」に関する他の単語候補が「基本情
報」である場合、日本語文修正装置7は単語「注文票」
に対し「基本情報」という候補が存在することを利用者
に提示し、「注文票」、「基本情報」のいずれが適切か
の選択を促す。利用者が「基本情報」を選択した場合
は、表現限定文中の「注文票」が「基本情報」に置き換
わる。
It is assumed that the user selects the correction of the word "order slip". When the other word candidates related to the “order slip” are “basic information”, the Japanese sentence correction device 7 uses the word “order slip”.
The user is informed that there is a candidate "basic information", and the user is prompted to select which of "order slip" and "basic information" is appropriate. When the user selects "basic information", the "order slip" in the expression-limited sentence is replaced with "basic information".

【0056】また、利用者が、記号「XXX」の修正を
選択したとすると、日本語文修正装置7はまず「XX
X」に換わる単語候補を検索する。文構造上「XXX」
が対応する場所格に要求される属性が「data」であるこ
とから、用語辞書記憶装置4を属性「data」で検索し、
「値」等の単語候補を収集する(図3参照)。日本語文
修正装置7は、収集した単語候補を利用者に提示し、単
語の選択を促す。利用者が「値」を選択したとすると、
表現限定文中の「XXX」が「値」に置き換わる。日本
語文修正装置7が提示する単語候補中に適当な単語が存
在しない場合は、利用者が自由に入力可能とする。
If the user selects the correction of the symbol "XXX", the Japanese sentence correction device 7 first displays "XX".
A word candidate that replaces "X" is searched. Sentence structure "XXX"
Since the attribute required for the location case corresponding to is “data”, the term dictionary storage device 4 is searched for with the attribute “data”,
Collect word candidates such as “value” (see FIG. 3). The Japanese sentence correction device 7 presents the collected word candidates to the user and prompts the user to select a word. If the user selects "value",
"Value" replaces "XXX" in the expression-limited sentence. If there is no suitable word among the word candidates presented by the Japanese sentence correction device 7, the user can freely input the word.

【0057】上記修正作業の結果、表現限定文「注文票
の商品コードの値が“3”と等しいならば、“ファック
ス”がXXXに存在する」は、「基本情報の商品コード
の値が“3”と等しいならば、“ファックス”が値に存
在する」に修正されることになる。
As a result of the above correction work, the expression limitation sentence "If the value of the product code of the order form is equal to" 3 "," Fax "exists in XXX ""is" the product code of the basic information. " If the value of is equal to "3", "fax" is present in the value. "

【0058】利用者が表現限定文を修正した場合は、修
正結果をデータ記憶装置2に記憶させ、処理を入力装置
1に戻す。修正されなかった場合は出力装置8に処理を
移行し、出力装置8は曖昧性を排除した日本語文として
表現限定文を出力する。本例の場合、修正されているた
め、修正結果をデータ記憶装置2に記憶させ、新たな原
文として日本語文の曖昧性除去処理を繰り返す。
When the user corrects the expression limitation sentence, the correction result is stored in the data storage device 2 and the process is returned to the input device 1. If not corrected, the processing shifts to the output device 8, and the output device 8 outputs the expression-limited sentence as a Japanese sentence without ambiguity. In the case of this example, since it has been corrected, the correction result is stored in the data storage device 2, and the disambiguation processing of the Japanese sentence as a new original sentence is repeated.

【0059】[0059]

【発明の効果】以上説明したように本発明は、第1,第
2の構文チェック手段および第1,第2の意味チェック
手段により、曖昧性を含む日本語文を計算機上の表現に
対応づけ可能なレベルまで詳細化する作業が、会話形式
で半自動的に行われることになり、計算機を用いた自然
言語の意味理解を容易化することが容易にできるという
効果がある。
As described above, according to the present invention, a Japanese sentence including ambiguity can be associated with a computer expression by the first and second syntax checking means and the first and second semantic checking means. The work of refining to various levels will be performed semi-automatically in a conversational manner, and there is an effect that it is possible to easily understand the meaning of natural language using a computer.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の曖昧性除去可能な日本語文生成装置の
一実施例を示すブロック図である。
FIG. 1 is a block diagram showing an embodiment of a Japanese sentence generation device capable of disambiguation according to the present invention.

【図2】(a),(b),(c),(d)は、図1の実
施例の入力装置からデータ記憶装置に構文木形式で記憶
された文例、および構文チェック装置、意味チェック装
置での処理結果を示す図である。
2 (a), (b), (c) and (d) are sentence examples stored in a syntax tree format from the input device of the embodiment of FIG. 1 in a data storage device, a syntax check device, and a semantic check. It is a figure which shows the process result in an apparatus.

【図3】図1の実施例の用語辞書記憶装置に記憶された
内容を示す図である。
FIG. 3 is a diagram showing contents stored in a term dictionary storage device of the embodiment of FIG.

【図4】図1の実施例における構文チェック装置のチェ
ック動作を示すフローチャートである。
FIG. 4 is a flowchart showing a checking operation of the syntax checking device in the embodiment of FIG.

【図5】図1の実施例における意味チェック装置のチェ
ック動作を示すフローチャートである。
5 is a flowchart showing a checking operation of the meaning checking device in the embodiment of FIG.

【図6】図1の意味チェック装置のチェック動作のうち
下位概念に関わる詳細化の動作を示すフローチャートで
ある。
6 is a flowchart showing a detailed operation related to a subordinate concept in the checking operation of the meaning checking device in FIG. 1. FIG.

【図7】図1の意味チェック装置のチェック動作のうち
上位概念に関わる詳細化の動作を示すフローチャートで
ある。
7 is a flowchart showing a detailed operation related to a superordinate concept in the checking operation of the meaning checking device in FIG. 1. FIG.

【符号の説明】[Explanation of symbols]

1 入力装置 2 データ記憶装置 3 構文チェック装置 4 用語辞書記憶装置 5 意味チェック装置 6 日本語文生成装置 7 日本語文修正装置 8 出力装置 S1〜S56 ステップ 1 Input Device 2 Data Storage Device 3 Syntax Check Device 4 Term Dictionary Storage Device 5 Semantic Check Device 6 Japanese Sentence Generation Device 7 Japanese Sentence Correction Device 8 Output Device S1 to S56 Steps

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 7315−5L G06F 15/20 550 E 7315−5L 554 M ─────────────────────────────────────────────────── ─── Continuation of the front page (51) Int.Cl. 6 Identification code Internal reference number FI Technical display location 7315-5L G06F 15/20 550 E 7315-5L 554 M

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 入力される日本語原文から曖昧性を除去
し所望の日本語文を会話形式で生成する日本語文生成装
置であって、 各単語をそれぞれ見出し語として記憶し、各見出し語に
は各見出し語がそれぞれ具備する計算機上における属性
と、各見出し語に対する上位概念および下位概念に相当
する他の見出し語に関する概念情報とが与えられ、さら
に各見出し語がそれぞれ用言である場合には、前記用言
が用いられる単位文の文構造を規定する規則である文構
造情報が与えられている用語辞書記憶部と、 入力された日本語原文から前記用言を検出し、前記用言
を含む単位文が前記用言に与えられた文構造情報の規定
に合致している正規単位文であるか否か判定し、合致し
ていない場合には、その旨を表示器に表示して正規単位
文になるように修正を促す第1の構文チェック手段と、 入力された日本語原文から文結合子を検出し、文結合子
によって結合されている2つの単位文が、前記文結合子
毎に予め与えられている文結合規則に基づく正規構造を
しているか否か判断し、正規構造をしていない場合に
は、その旨を表示器に表示して正規構造になるように修
正を促す第2の構文チェック手段と、 第1,第2の構文チェック手段が処理した日本語原文中
で他の語を修飾していない単語について、前記単語を見
出し語として前記用語辞書記憶部より前記見出し語の下
位概念を表す単語を読み出し、読み出した単語から1つ
が選択されると、選択された単語を保持するとともに選
択された単語を見出し語としてさらに下位概念を表す単
語を前記用語辞書記憶部より読み出すことを下位概念を
持たない単語が選択されるまで繰り返す第1の意味チェ
ック手段と、 第1,第2の構文チェック手段が処理した日本語原文中
で他の語から修飾されていない単語について、前記単語
を見出し語として前記用語辞書記憶部より前記見出し語
の上位概念を表す単語を読み出し、読み出した単語から
1つが選択されると、選択された単語を保持するととも
に選択された単語を見出し語としてさらに上位概念を表
す単語を前記用語辞書記憶部より読み出すことを上位概
念を持たない単語が選択されるまで繰り返す第2の意味
チェック手段と、 入力された日本語原文の文構造に対して前記第1,第2
の構文チェック手段により正規化され、さらに入力され
た日本語原文の修飾語、被修飾語を持たない各単語に対
して前記第1および第2の意味チェック手段により抽出
され保持された単語が付加された文から、計算機で認識
可能な日本語文の形式を構成する日本語文構成手段とを
有する日本語文生成装置。
1. A Japanese sentence generator for removing ambiguity from an input Japanese original sentence and generating a desired Japanese sentence in a conversational manner, wherein each word is stored as an entry word, and each entry word is The computer attribute of each headword and the conceptual information about other headwords corresponding to the superordinate concept and the subordinate concept for each headword are given, and when each headword is a noun, , The term dictionary storage unit to which sentence structure information, which is a rule that defines the sentence structure of the unit sentence in which the above-mentioned verb is used, is provided, and the above-mentioned verb is detected from the input Japanese original sentence, It is determined whether or not the included unit sentence is a regular unit sentence that conforms to the rules of sentence structure information given to the above-mentioned defensive word. To be a unit sentence First sentence checking means for urging positiveness, and a sentence connector detected from the input Japanese original sentence, two unit sentences connected by the sentence connector are given in advance for each sentence connector. Second syntax check means for judging whether or not the regular structure is based on the sentence combination rule, and displaying the fact on the display to prompt the correction so that the regular structure is obtained when the regular structure is not formed. And for a word in which the other words are not modified in the Japanese original sentence processed by the first and second syntax check means, the word dictionary is used as a headword to represent a subordinate concept of the headword from the term dictionary storage unit. When a word is read and one of the read words is selected, the selected word is held and a word representing a subordinate concept is read from the term dictionary storage unit using the selected word as a headword. A first meaning checking unit that repeats until a word not having is selected and a word that is not modified from other words in the Japanese original sentence processed by the first and second syntax checking units finds the word. A word representing a superordinate concept of the headword is read from the term dictionary storage unit as a word, and when one of the read words is selected, the selected word is held and the selected word is further superordinate as a headword. Second meaning checking means for repeating the reading of the word representing from the term dictionary storage unit until a word having no superordinate concept is selected; and the first and the first with respect to the sentence structure of the input Japanese original sentence. Two
Are added to the words that are normalized by the syntax check means and have no modifiers or modifiers of the input Japanese original sentence and that are extracted and retained by the first and second meaning check means. A Japanese sentence generation device having a Japanese sentence composing means for composing a form of a Japanese sentence that can be recognized by a computer from the formed sentence.
【請求項2】 第1の構文チェック手段が処理した日本
語原文を、第2の構文チェック手段が入力して、さらに
処理を行なう請求項1記載の日本語文生成装置。
2. The Japanese sentence generation device according to claim 1, wherein the Japanese original sentence processed by the first syntax checking means is input to the second syntax checking means and further processed.
【請求項3】 前記日本語文構成手段は、構成した日本
語文を表示するとともに、日本語文生成の過程に発生し
表示された日本語文から認識できない情報である、単語
の別候補の提示、日本語文の正規化、詳細化、日本語文
の構成において発生した誤りに関する情報の提示を行う
請求項1または2記載の日本語文生成装置。
3. The Japanese sentence composing means displays the composed Japanese sentence, and presents another candidate of the word, which is information that is generated in the process of generating the Japanese sentence and cannot be recognized from the displayed Japanese sentence, and the Japanese sentence. 3. The Japanese sentence generation device according to claim 1 or 2, which performs normalization, detailing, and presentation of information about an error that has occurred in the construction of a Japanese sentence.
JP5202338A 1993-08-16 1993-08-16 Japanese sentence generating device capable of eliminating ambiguity Pending JPH0756923A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5202338A JPH0756923A (en) 1993-08-16 1993-08-16 Japanese sentence generating device capable of eliminating ambiguity

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5202338A JPH0756923A (en) 1993-08-16 1993-08-16 Japanese sentence generating device capable of eliminating ambiguity

Publications (1)

Publication Number Publication Date
JPH0756923A true JPH0756923A (en) 1995-03-03

Family

ID=16455893

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5202338A Pending JPH0756923A (en) 1993-08-16 1993-08-16 Japanese sentence generating device capable of eliminating ambiguity

Country Status (1)

Country Link
JP (1) JPH0756923A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013206253A (en) * 2012-03-29 2013-10-07 Toshiba Corp Machine translation device, method and program
JP2015201215A (en) * 2015-05-25 2015-11-12 株式会社東芝 Machine translation device, method, and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013206253A (en) * 2012-03-29 2013-10-07 Toshiba Corp Machine translation device, method and program
CN103365837A (en) * 2012-03-29 2013-10-23 株式会社东芝 Machine translation apparatus, method and computer readable medium
US9170994B2 (en) 2012-03-29 2015-10-27 Kabushiki Kaisha Toshiba Machine translation apparatus, method and computer readable medium
JP2015201215A (en) * 2015-05-25 2015-11-12 株式会社東芝 Machine translation device, method, and program

Similar Documents

Publication Publication Date Title
US10162885B2 (en) Automated self-service user support based on ontology analysis
CN107209759B (en) Annotation support device and recording medium
US7318021B2 (en) Machine translation system, method and program
US8412514B1 (en) Method and apparatus for compiling and querying a QA database
JP2009519534A (en) Text editing apparatus and method
US20060173682A1 (en) Information retrieval system, method, and program
US8219381B2 (en) Dictionary registration apparatus, dictionary registration method, and computer product
US20110144972A1 (en) Method and System for Generating a Localized Software Product
KR20120009446A (en) System and method for automatic semantic labeling of natural language texts
US11568150B2 (en) Methods and apparatus to improve disambiguation and interpretation in automated text analysis using transducers applied on a structured language space
Glass et al. A naive salience-based method for speaker identification in fiction books
JP2008112363A (en) Document processor and document processing program
JPH0756923A (en) Japanese sentence generating device capable of eliminating ambiguity
JP5185343B2 (en) Machine translation apparatus and machine translation program
JP2020123134A (en) Extraction method, information processing device, and extraction program
JP2007148630A (en) Patent analyzing device, patent analyzing system, patent analyzing method and program
JP5032453B2 (en) Machine translation apparatus and machine translation program
JPH07160714A (en) Japanese sentence proofreading device
JP2693489B2 (en) Japanese sentence error detection method
JPH06243163A (en) Document analyzing device
JP5331964B2 (en) Translation support device, translation support method, and translation support program
JP2000259630A (en) Method and device for machine translation and medium storing machine translation program
CN117406995A (en) Auxiliary method for code writing, online code editor, equipment and medium
CN117609095A (en) Code large model-oriented evaluation set quality detection method and device
JPH02143331A (en) Natural language interaction device