JPS63109573A - Processing system for adjunct interrogative - Google Patents

Processing system for adjunct interrogative

Info

Publication number
JPS63109573A
JPS63109573A JP61255513A JP25551386A JPS63109573A JP S63109573 A JPS63109573 A JP S63109573A JP 61255513 A JP61255513 A JP 61255513A JP 25551386 A JP25551386 A JP 25551386A JP S63109573 A JPS63109573 A JP S63109573A
Authority
JP
Japan
Prior art keywords
adjunct
unit
sentence
dictionary
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61255513A
Other languages
Japanese (ja)
Inventor
Toshihiko Yokogawa
横川 壽彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61255513A priority Critical patent/JPS63109573A/en
Publication of JPS63109573A publication Critical patent/JPS63109573A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To simplify the processing of an anlysis by finding the part of an adjunct interrogative of English as a morphological pattern and separating and processing the part of the adjunct interrogative from an object to be analyzed. CONSTITUTION:When there is the adjunct interrogative in an English text 2, it is understood morphologically as the adjunct interrogative and the part of the adjunct interogative is separated from the part to be analyzed, then the analysis processing is simplified. In the processing of the adjunct interrogative when ',' comes and below mentioned word groups succeed, ',' to '?' is deleted as an unit and a flag is stands as block information. A) As the form of the adjunct interrogative, there are, (auxiliary verb)+(personal pronoun)? or the like. b) As the type of the auxiliary verb, there are am or the like. c) As the type of the personal pronoun, there are I or the like.

Description

【発明の詳細な説明】 弦tしと艷 本発明は、言語解析装置、より詳細には、機械翻訳装置
等における自然言語解析において、付加疑問を処理する
ための方式に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a language analysis device, and more particularly, to a method for processing additional questions in natural language analysis in a machine translation device or the like.

尖象皮度 英語の付加疑問の形は、非常に限定されてはいるが、普
通の解析法では、付加疑問を構成している助動詞類や代
名詞類の用法や品詞細分類等が多岐にわたっているため
、錯綜とした処理になってまう。例えば、付加疑問も構
文解析中で扱うとすれば、 (1)普通の疑問文の場合と部分的には同じ構造を付加
疑問として認識するのは困難である。
Although the forms of additional questions in English are very limited, in ordinary analysis methods, the usage of the auxiliary verbs and pronouns that make up the additional questions, the subdivision of parts of speech, etc. are wide-ranging. This results in complicated processing. For example, if additional questions are also handled during syntactic analysis, (1) It is difficult to recognize partially the same structure as an ordinary question as an additional question.

(2)たとえ認識できるとしても、解析途中の無駄な部
分的解析が非常に多くなる危険性がある。
(2) Even if recognition is possible, there is a risk that a large number of useless partial analyzes will be performed during the analysis.

(3) (a)A+、 can’t you’7 ; 
(b)A′、 can you7(c)A+、 can
 you not’7 ; (d)〜、 don’t 
you7等それぞれ異なる構造として認識されるが、実
は主文に対する疑念等を示しているのだと解するのは、
(構造的に異なるがゆえに)困難である。
(3) (a) A+, can't you'7;
(b) A', can you7 (c) A+, can
you not'7; (d)~, don't
You7 etc. are recognized as different structures, but they are actually interpreted as indicating doubts about the main sentence.
Difficult (because they are structurally different).

等の欠点がある。There are drawbacks such as.

目     的 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、付加疑問であることを形態的にとらえるとともに
、付加疑問の部分を解析する部分から切り離してしまい
、これによって、解析の処理を簡単にできるようにする
ことを目的としてなされたものである。
Purpose The present invention was made in view of the above-mentioned circumstances.
In particular, this was done with the aim of making the analysis process easier by grasping the fact that it is an additional question in terms of form and separating the additional question part from the part to be analyzed.

構   成 本発明は、上記目的を達成するために、英語の付加疑問
の部分を、形態的パターンとして見つけ出し、付加疑問
の部分を解析対象から切り離して処理を行うことを特徴
としたものである。以下、本発明の実施例に基づいて説
明する。
Structure In order to achieve the above object, the present invention is characterized in that the portion of the additional question in English is found as a morphological pattern, and the portion of the additional question is separated from the analysis target and processed. Hereinafter, the present invention will be explained based on examples.

第7図は、本発明による付加疑問の処理方式が適用され
る英日自動翻訳装置の全体構成を説明するための図であ
るが、本発明は、英語を日本語に翻訳する英日自動翻訳
装置のみならず、ある言語を他の言語に翻訳する際、入
力される言語の文を解析する如何なる言語の解析装置に
も効果的に適用されることは言うまでもない。
FIG. 7 is a diagram for explaining the overall configuration of an English-Japanese automatic translation device to which the additional question processing method according to the present invention is applied. Needless to say, the present invention can be effectively applied not only to the device but also to any language analysis device that analyzes sentences in an input language when translating one language into another language.

第7図において、1は入力部、2は英文テキスト、3は
前編集部、4は形態素解析部、5は構文解析1部、6は
構文解析■部、7は操作表示部、8は単語辞書、9は解
析ルールファイル、10は制御部、11は構造変換部、
12は訳文生成部、13は後編集部、14は出力部、1
5は日本語文で、本翻訳装置は、図示のように、入力部
1を有し1日本語に翻訳すべき英文テキスト2がこれに
より入力される。入力部1はたとえば、英数字キーなど
の文字キーや機能キーなどを有するキーボード、紙に記
録された英文テキストを読み取る光学的文字読取装置(
OCR)、および(または)磁気ディスクなどの記憶媒
体に記録された英文テキストを読み込むファイル記憶装
置などを含んでよい。
In Fig. 7, 1 is the input section, 2 is the English text, 3 is the pre-editing section, 4 is the morphological analysis section, 5 is the syntax analysis section 1, 6 is the syntax analysis section, 7 is the operation display section, and 8 is the word Dictionary, 9 is an analysis rule file, 10 is a control section, 11 is a structure conversion section,
12 is a translation generation unit, 13 is a post-editing unit, 14 is an output unit, 1
5 is a Japanese sentence, and as shown in the figure, this translation device has an input section 1 through which an English text 2 to be translated into 1 Japanese is input. The input unit 1 includes, for example, a keyboard having character keys such as alphanumeric keys and function keys, and an optical character reading device (optical character reading device) that reads English text recorded on paper.
(OCR) and/or a file storage device for reading English text recorded on a storage medium such as a magnetic disk.

入力部1により入力された英文テキストは、前編集部3
に読み込まれ、翻訳の前処理が行なわれる。ここでは、
主として文の認定と未知語の処理を行なう。これは形態
素解析の一部として機能する。
The English text input by the input unit 1 is sent to the pre-editing unit 3
, and pre-processing for translation is performed. here,
It mainly processes sentences and unknown words. This functions as part of morphological analysis.

前編集された英文データは、前編集で得られた情報とと
もに形態素解析部4に転送される。形態素解析部4では
、単語辞書8を索引して文に分割し、英文の形態素を解
析し、未知語の処理、固有名詞、時の表2、数の表現な
どの各種のまとめあげを行ない、付加疑問、同格の認定
などの文全体の処理を行なう。その形態素解析ルールは
解析ルールファイル9に格納されている。
The pre-edited English text data is transferred to the morphological analysis unit 4 together with the information obtained in the pre-editing. The morphological analysis unit 4 indexes the word dictionary 8, divides it into sentences, analyzes the morphemes of the English sentence, processes unknown words, performs various summarizations such as proper nouns, time table 2, number expressions, etc., and adds Processes entire sentences such as questions and recognition of apposition. The morphological analysis rules are stored in the analysis rule file 9.

形態素解析された英文データは、形態素解析で得られた
辞書情報とともに構文解析1部5に転送される。構文解
析1部5は、文法ルールを英文データに適用して文につ
いて表層構造の解析を行ない、すべての構文的可能性を
見つけ出す機能部である。
The morphologically analyzed English data is transferred to the syntactic analysis unit 5 together with the dictionary information obtained through the morphological analysis. The syntactic analysis unit 5 is a functional unit that applies grammar rules to English data to analyze the surface structure of a sentence and find all syntactic possibilities.

構文解析1部5で構文解析された英文データは、その解
析情報とともに構文解析■部6に送られる。
The English data parsed by the parsing unit 1 5 is sent to the parsing unit 6 together with the analysis information.

ここでは、構文解析Iによる表層的な構文解析結果から
、構造記述を適用して解を選択する。これによって英語
記述の確からしい解析木を作成し、その構造を作る。こ
れらの構文解析ルールはやはり、解析ルールファイル9
に格納されている。
Here, a structural description is applied to select a solution from the superficial syntactic analysis results obtained by syntactic analysis I. Through this, a reliable parse tree of English description is created and its structure is created. These parsing rules are still stored in parsing rule file 9.
is stored in.

構文解析された英文データは、解析木のデータとして構
造変換部11に転送される。構造変換部11では、英語
文の中間的構造である構文木から対応する日本語文の構
文木を作成し1日本語文を訳出しやすい日本語基底構造
に変換する。
The parsed English data is transferred to the structure conversion unit 11 as parse tree data. The structure conversion unit 11 creates a syntax tree of a corresponding Japanese sentence from a syntax tree that is an intermediate structure of an English sentence, and converts one Japanese sentence into a Japanese basic structure that is easy to translate.

こうして構造変換された日本語の基底構造を示す構文木
データは訳文生成部12に送出され、後者にて訳文の生
成が行なわれる。これは1日本語の構文木の木構造から
日本語の文を生成する機能部である。
The syntax tree data indicating the basic structure of the Japanese language whose structure has been converted in this way is sent to the translation generation unit 12, and the latter generates a translation. This is a functional unit that generates Japanese sentences from the tree structure of a Japanese syntax tree.

訳文生成された日本語文データ、すなわち訳文データは
、後編集部13に送られる。後編集部13では、翻訳処
理に利用した情報を使用し、辞書8を索引して訳文デー
タを修正し、より自然な日本語文を完成する。この日本
語文データは出力部14に転送され、翻訳された日本語
文データは出力部14に転送され、翻訳された日本語文
15として出力部14から出力される。出力部14は、
たとえばプリンタ、ディスプレイ、および(または)磁
気ディスクなどのファイル記憶装置を含む。
The translated Japanese text data, that is, the translated text data, is sent to the post-editing section 13. The post-editing unit 13 uses the information used in the translation process to index the dictionary 8 and correct the translated data to complete a more natural Japanese sentence. This Japanese sentence data is transferred to the output section 14, and the translated Japanese sentence data is transferred to the output section 14, and outputted from the output section 14 as a translated Japanese sentence 15. The output section 14 is
Examples include printers, displays, and/or file storage devices such as magnetic disks.

これらの一連の翻訳処理の流れは、本装置全体の制御を
統括する制御部10によって制御される。
The flow of a series of these translation processes is controlled by a control unit 10 that controls the entire control of this apparatus.

単語辞v8には、図示例の場合、英語および日本語の単
語についての辞書データが格納され、語當だけでなく、
係り関係すなわち共起関係や、意味、単複、品詞などの
様々な情報が記述されている。
In the case of the illustrated example, dictionary data for English and Japanese words is stored in the word dictionary v8, and not only word 當, but also dictionary data for English and Japanese words are stored.
Various information such as dependency relationships, that is, co-occurrence relationships, meanings, singularity, plurality, parts of speech, etc. are described.

また、解析ルールファイル9には、形態素解析および英
文解析のルールデータが格納されている6制御部10に
は、操作表示部7が接続されている。操作表示部7には
、操作者から本装置に様々な指示を与える。たとえば翻
訳指示キー、カーソルキーなどの操作キーや、入力英語
文テキスト。
Further, the analysis rule file 9 stores rule data for morphological analysis and English sentence analysis.6 The control unit 10 is connected to the operation display unit 7. The operation display section 7 is used by an operator to give various instructions to the apparatus. For example, operation keys such as translation instruction keys, cursor keys, and input English text.

翻訳結果の日本語文、辞書情報などの中間データ、操作
者に対する様々な指示などを可視表示するディスプレイ
やインジケータを有する。なお、それらの操作表示機能
の多くは、入力部1にキーボードを備えている場合はそ
のキーボードに、また出力部14にディスプレイを備え
ている場合はそのディスプレイに含まれるように構成し
てよい。また出力部14にディスプレイを備えている場
・合はそのディスプレイに含まれるように構成してよい
It has a display and indicators that visually display the translated Japanese text, intermediate data such as dictionary information, and various instructions for the operator. Note that many of these operation display functions may be configured to be included in the keyboard if the input unit 1 is equipped with a keyboard, or in the display if the output unit 14 is equipped with a display. Further, if the output section 14 is equipped with a display, it may be configured to be included in the display.

本発明は、上述のごとき機械翻訳装置において。The present invention relates to a machine translation device as described above.

英文テキスト2中に付加疑問があった場合に、付加疑問
であることを形態的にとらえるとともに、付加疑問の部
分を解析する部分から切り離してしまうことにより、解
析の処理を簡単にしたものである。
When there is an additional question in English text 2, this method simplifies the analysis process by recognizing the additional question in its form and separating the additional question from the part to be analyzed. .

なお、付加疑問の処理は、「、」がきた時点で、下記の
語群が続いたとき、「、」以下「?」までをユニットと
しては削除し、ブロック情報としてフラグをたてる。
In addition, in the processing of additional questions, when the following word group continues when "," is received, the following words from "," to "?" are deleted as a unit, and a flag is set as block information.

イ)付加疑問文の形態としては1 、(助動詞)+(人称代名詞)? 、(助動詞)n’t+(人称代名詞)?、(助動詞)+
(人称代名詞)+not’7等がある。
b) The form of an additional interrogative sentence is 1. (auxiliary verb) + (personal pronoun)? , (auxiliary verb) n't + (personal pronoun)? , (auxiliary verb) +
(Personal pronoun) + not'7 etc.

口)助動詞の種類としては。口) Types of auxiliary verbs.

an+   is   are   was  wer
edo   doesdid   have  has
   had  will 5hall woulds
hould can  cannot could m
ay  might mustought  won’
t 5han’t can’t need dare 
 used等がある。また、 ハ)人称代名詞の種類としては、 I  you  he  she  it  we  
they等がある。
an+ is are was wer
edo does have has
had will 5halls
could not could
ay might must won'
5han't can't need dare
There are used etc. Also, c) types of personal pronouns are: I you he she it we
They et al.

第1図は、本発明の一実施例を説明するための全体ブロ
ック線図、第2図は、第1図の動作説明をするためのフ
ローチャートで、図中、2oは入力装置、21は文単位
分割部、22は分割辞書。
FIG. 1 is an overall block diagram for explaining one embodiment of the present invention, and FIG. 2 is a flowchart for explaining the operation of FIG. 1. In the figure, 2o is an input device, 21 is a text The unit division section 22 is a division dictionary.

23は単語切り出し部、24はプリミツト(deliI
Ilit)テーブル、25は辞書検索部、26は参照辞
書、27は付加疑問処理部、28は文情報バッファ、2
9は辞書情報保存テーブルで・まず・入力処理部20に
おいて、処理しようとする文情報をとり込み、次に、文
単位分割部21において分割辞書22を参照して分割情
報に基づいて入力文を文単位に分割する。次に、単位切
り出し部23において辞書引き単位の切り出しを行うが
、この辞書引き単位の切り出しはプリミツト(deli
mit)テーブル24から境界情報をとり出して文単位
を辞書引き単位として切り出す。辞書引き単位を切り出
した結果、切り出し単位に付加疑問がない場合は、辞書
検索をして辞書情報保存テーブルへ書き込み、付加疑問
がある場合は、付加疑問の処理を行う。なお、文単位へ
の分割方法は。
23 is a word extraction part, 24 is a primitive (deliI
Ilit) table, 25 is a dictionary search unit, 26 is a reference dictionary, 27 is an additional question processing unit, 28 is a sentence information buffer, 2
Reference numeral 9 denotes a dictionary information storage table. First, the input processing section 20 takes in the sentence information to be processed. Next, the sentence unit division section 21 refers to the division dictionary 22 and divides the input sentence based on the division information. Divide into sentences. Next, the unit extraction unit 23 performs extraction in dictionary lookup units.
mit) Take out boundary information from the table 24 and cut out sentence units as dictionary lookup units. As a result of cutting out the dictionary lookup unit, if there is no additional question in the cutout unit, the dictionary is searched and written to the dictionary information storage table, and if there is an additional question, the additional question is processed. In addition, how to divide into sentence units.

どのようなものでも良いが、例えば、文末デリミツタ文
字列群を設け、直前の文末文字列デリミツタ群の直後あ
るいは入力の先頭から最初に出現する文末デリミツタ文
字列群までを1文と認識するようにする。文末デリミツ
タ群としては1.ピリオド、!(感嘆符)、?(疑問符
)、=(コロン)等があり、これらと引用符を合せて用
いてもよいが、引用符はオプションで、あってもなくて
も良b)。
Any type of string is fine, but for example, a group of sentence-end delimiter strings is provided, and the sequence immediately after the previous sentence-end delimiter group or from the beginning of the input to the first sentence-end delimiter string that appears is recognized as one sentence. do. The sentence-final delimiter group is 1. period,! (Exclamation point),? (question mark), = (colon), etc. These can be used in conjunction with quotation marks, but quotation marks are optional and may or may not be present b).

辞書引き単位の切り出しは、辞書検索デリミツタ文字列
群の直後の文字から始まる文字列であり、辞書検索デリ
ミツタ文字列群としては、句読点。
The dictionary search unit extraction is a character string starting from the character immediately after the dictionary search delimiter character string group, and the dictionary search delimiter character string group includes punctuation marks.

引用符、スペース等がある。また、辞書検索は。There are quotation marks, spaces, etc. Also, dictionary searches.

文字列の先頭からの部分文字列が、辞書中のエントリに
一致し、かつ、部分文字列の直後が、辞書検索文字列群
であったときに、エントリが存在した(検索に成功した
)とする。デリミツタ文字が句読点、引用符の場合は、
辞書情報保存テーブルに独立で登録する。また、辞書情
報テーブルとは別に1文情報バッファを設け、これに付
加疑問情報を書き込みこれを文部に保存する。
An entry exists (the search was successful) when a substring from the beginning of the string matches an entry in the dictionary, and immediately after the substring is a dictionary search string group. do. If the delimiter character is a punctuation mark or quotation mark,
Register independently in the dictionary information storage table. In addition, a one-sentence information buffer is provided separately from the dictionary information table, and additional question information is written in this buffer and saved in the sentence section.

第3図は、本発明による付加疑問処理の詳細を説明する
ためのブロック線図、第4図は、第3図の動作説明をす
るためのフローチャートで、図中、30はポインタ設定
部、31はコンマ判定部、32はコンマの次のα群の語
の判定部、33はコンマの次のβ群の語の判定部、34
はα群の語の次の代名詞の判定部、35はβ群の語の次
の代名詞の判定部、36は代名詞の次の疑問符の判定部
、37は代名詞の次のnotの判定部、38はnotの
次の疑問符の判定部、39は代名詞の次の疑問符の判定
部、40は削除処理部で、まず、単語情報の先頭単語に
ポインタをセットし、ポインタのセットが終了していな
い場合は、それがコンマであるか否かの判断を行う。な
お、本明細書及び図面において、α群の語とは、品詞の
中に助動詞あるいはbe助動詞含むもの(否定形でない
もの)を指し。
FIG. 3 is a block diagram for explaining details of additional question processing according to the present invention, and FIG. 4 is a flowchart for explaining the operation of FIG. 3. In the figure, 30 is a pointer setting section; is a comma determination unit, 32 is a determination unit for the α group word following the comma, 33 is a determination unit for the β group word following the comma, 34
35 is a determination unit for the next pronoun after the word in the α group, 36 is a determination unit for the question mark following the pronoun, 37 is a determination unit for not after the pronoun, 38 is a determination unit for the question mark following not, 39 is a determination unit for the question mark following the pronoun, and 40 is a deletion processing unit. First, a pointer is set to the first word of the word information, and if the pointer has not been set yet, determines whether it is a comma or not. Note that in this specification and drawings, words in the α group refer to words that include an auxiliary verb or a be auxiliary verb in the part of speech (those that are not negative).

β群の語とは、品詞の中に助動詞的な否定形あるいはb
e助動詞否定形を含むものを指す。コンマであった場合
には、ポインタを止めたまま、コンマの次の語がα群の
語であるか否かを判断し、α群の語である時は、α群の
次の語が代名詞であるか否かを判断し、代名詞である時
は5代名詞の次の語がnotであるか否かを判断し、n
otである時は。
Words in the β group are negative forms like auxiliary verbs or b in the part of speech.
e Refers to things that include the negative form of auxiliary verbs. If it is a comma, keep the pointer still and determine whether the word next to the comma is a word in the α group. If it is a word in the α group, the next word in the α group is a pronoun. If it is a pronoun, determine whether the next word after the pronoun is not, and n
When it's ot.

notの次の語が疑問符であるか否かの判断をし。Determine whether the word following not is a question mark or not.

疑問符である時は、文情報バッファに付加疑問であると
いう情報を書き込む。また、代名詞の次の語がnotで
ない場合は、代名詞の次の語が疑問符か否かの判断を行
い、疑問符である時は文情報バッファに付加疑問がある
という情報を書き込む。
If it is a question mark, information indicating that it is an additional question is written into the sentence information buffer. Further, if the word following the pronoun is not "not", it is determined whether the word following the pronoun is a question mark or not, and if it is a question mark, information indicating that there is an additional question is written in the sentence information buffer.

このようにして1文情報バッファに付加疑問であるとい
う情報が書き込まれると、当該の、〜?を単語の情報テ
ーブルから削除してポインタを1つ進める。また、コン
マの次の語がα群の語でない時は、コンマの次の語がβ
群の語であるか否かの判断を行い、β群の語でもない時
は、代名詞の次の語が疑問符でない場合、及び、not
の次の語が疑問符でない場合と同様にポインタを1つ進
める。
When the information that is an additional question is written to the one-sentence information buffer in this way, the ~? is deleted from the word information table and the pointer is advanced by one. Also, if the word following the comma is not a word in the α group, the word following the comma is β
Determine whether it is a group word or not, and if it is not a group word, if the word next to the pronoun is not a question mark, and not
The pointer is advanced by one in the same way as if the next word is not a question mark.

コンマの次の語がβ群の語である時は、β群の次の語が
代名詞であるか否かを判断し、代名詞である時は、代名
詞の次の語が疑問符であるか否かの判断を行い、疑問符
である時は、文情報バッファに付加疑問であるという情
報を書き込む。
When the word following the comma is a word in the β group, determine whether the next word in the β group is a pronoun, and if it is a pronoun, determine whether the word following the pronoun is a question mark or not. If it is a question mark, information indicating that it is an additional question is written to the sentence information buffer.

第5図は、第3図における辞書保存テーブル29と各判
定部31〜39との間の情報をバス制御装置50を介し
て行うようにした場合の実施例を示したものであり、第
6図は、第1図及び第5図に示した回路を組み合わせた
場合の全体詳細ブロック線図であるが、これら第5図及
び第6図の各部の詳細については既に説明したので、同
一の作用をする部分に同一の参照番号を付しである。
FIG. 5 shows an embodiment in which information is exchanged between the dictionary storage table 29 and each determination section 31 to 39 in FIG. 3 via the bus control device 50. The figure is an overall detailed block diagram when the circuits shown in Figures 1 and 5 are combined, but since the details of each part in Figures 5 and 6 have already been explained, they have the same effect. The same reference numerals are used to refer to the same parts.

表1〜表4は、I vent to 5chool、d
idn’t I’7という付加疑問符を処理する場合の
一例を示す表で、表1は参照辞書の内容、表2及び表3
は辞書情報保存テーブルの内容の変化状態、表4は文情
報バッファの内容を表わしており、前述のようにして、
まず、入力文に対して分割辞書を用いて文単位の切り出
しを行う。(以下余白) 表1 表2 表3 表4 次に、プリミツトテーブル境界線データを含むテーブル
のプリミツト(delimit)情報に基いて単語の切
り出しを行う6次に、参照辞書(表1)との照合により
辞書検索を行い、各検索データを辞書情報保存テーブル
(表2)に記録する。文単位分割された単位について全
部の検索が終了したら、次に、付加疑問の処理に移る。
Tables 1 to 4 are I vent to 5chool, d
This table shows an example of processing the additional question mark idn't I'7. Table 1 shows the contents of the reference dictionary, Table 2, and Table 3.
Table 4 represents the changing state of the contents of the dictionary information storage table, and Table 4 represents the contents of the sentence information buffer.
First, an input sentence is extracted into sentence units using a segmentation dictionary. (Leaving space below) Table 1 Table 2 Table 3 Table 4 Next, words are extracted based on the delimit information of the table containing the primitive table boundary line data. A dictionary search is performed by comparison, and each search data is recorded in the dictionary information storage table (Table 2). Once all the searches have been completed for the units divided into sentence units, processing of additional questions is next performed.

切り出された単語の情報の先頭単語から順に付加疑問の
情報を検索して判定してゆく。表2に示すごとき辞書情
報保存テーブルを参照しながらコンマ、α群の8、β群
の語、代名詞、not、これらの機能関係及び存否を判
定し1代名詞の次に疑問符がある場合+ notの次に
疑問符がある場合には付加疑問が存在したという情報を
文情報バッファ(表4)に書き込む6そして、辞書情報
保存テーブル(表2)の内容を上記付加疑問と認識され
たデータを削除するよう書き換えて表3のようにする(
表2のp didn’t I ’7を辞書情報保存テー
ブルから削除する)。これらのデータは文単位毎に出力
され、辞書情報保存テーブル及び文情報バッファに転送
されて記録される。解析処理側は、付加疑問の処理デー
タと他の情報とを区別した形で解析に必要なデータを受
は取る。
Additional question information is searched and determined in order from the first word of the extracted word information. While referring to the dictionary information storage table shown in Table 2, determine the functional relationship and existence of commas, alpha group 8, beta group words, pronouns, not, and if there is a question mark next to one pronoun + not. Next, if there is a question mark, write information that there was an additional question to the sentence information buffer (Table 4).6 Then, delete the data recognized as the additional question from the contents of the dictionary information storage table (Table 2). Rewrite it as shown in Table 3 (
p didn't I '7 in Table 2 is deleted from the dictionary information storage table). These data are output for each sentence, transferred to the dictionary information storage table and the sentence information buffer, and recorded. The analysis processing side receives the data necessary for analysis in a form that distinguishes the processing data of additional questions from other information.

効−−−釆一 以上の説明から明らかなように、本発明によると、付加
疑問であることを形態的にとらえるとともに付加疑問の
部分を解析する部分から切り離してしまうので、解析の
処理を簡単にすることができる。
Effects---As is clear from the above explanation, according to the present invention, the fact that it is an additional question is understood morphologically, and the additional question part is separated from the part to be analyzed, which simplifies the analysis process. It can be done.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は、本発明の一実施例を説明するための全体ブロ
ック線図、第2図は、第1図の動作説明をするためのフ
ローチャート、第3図は、第1図に示した付加疑問処理
部27の詳細ブロック線図、第4図は、第3図の動作説
明をするためのフローチャート、第5図は、第3図に示
した回路における辞書情報保存テーブルと各判定部との
情報のやりとりをバス制御装置を通して行うようにした
場合の一例を示すブロック線図、第6図は、第1図に示
したブロック線図と第5図に示したブロック線図とを組
み合せた全体の詳細ブロック線図、第7図は、本発明が
適用される翻訳装置の一例を説明するためのブロック線
図である。 2o・・・入力装置、21・・・文単位分割部、22・
・・分割辞書、23・・・単語切り出し部、24・・・
プリミツトテーブル、25・・・辞書検索部、26・・
・参照辞書。 27・・・付加疑問処理部、28・・・文情報バッファ
。 29・・・辞書情報保存テーブル、30・・・ポインタ
設定部、31・・・コンマ判定部、32・・・コンマの
次のα群の語の判定部、33・・・コンマの次のβ群の
語の判定部、34・・・α群の語の次の代名詞の判定部
。 35・・・β群の語の次の代名詞の判定部、36・・・
代名詞の次の疑問符の判定部、37・・・代名詞の次の
notの判定部、38・・・notの次の疑問符の判定
部。 39・・・代名詞の次の疑問符の判定部、40・・・削
除処理部、50・・・バス制御装置。
FIG. 1 is an overall block diagram for explaining one embodiment of the present invention, FIG. 2 is a flowchart for explaining the operation of FIG. 1, and FIG. 3 is an additional block diagram for explaining an embodiment of the present invention. 4 is a detailed block diagram of the question processing unit 27, FIG. 4 is a flowchart for explaining the operation of FIG. 3, and FIG. A block diagram illustrating an example of a case where information is exchanged through a bus control device, FIG. 6 is a combination of the block diagram shown in FIG. 1 and the block diagram shown in FIG. 5. FIG. 7 is a block diagram for explaining an example of a translation device to which the present invention is applied. 2o... Input device, 21... Sentence unit division section, 22.
...Divided dictionary, 23...Word extraction section, 24...
Primitive table, 25...Dictionary search section, 26...
・Reference dictionary. 27... Additional question processing unit, 28... Sentence information buffer. 29... Dictionary information storage table, 30... Pointer setting section, 31... Comma judgment section, 32... Judgment section for the word in the alpha group next to the comma, 33... Next β after the comma Group word determination unit, 34 . . . a pronoun determination unit next to the α group word. 35... Judgment unit for the next pronoun after the word in the β group, 36...
A determination unit for the question mark following the pronoun, 37... A determination unit for the not next to the pronoun, 38... A determination unit for the question mark following the not. 39... Judgment unit for the question mark next to the pronoun, 40... Deletion processing unit, 50... Bus control device.

Claims (1)

【特許請求の範囲】[Claims] 英語の付加疑問の部分を、形態的パターンとして見つけ
出し、付加疑問の部分を解析対象から切り離して処理を
行うことを特徴とする付加疑問の処理方式
A method for processing additional questions that is characterized by finding the additional questions in English as a morphological pattern and processing the additional questions separately from the analysis target.
JP61255513A 1986-10-27 1986-10-27 Processing system for adjunct interrogative Pending JPS63109573A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61255513A JPS63109573A (en) 1986-10-27 1986-10-27 Processing system for adjunct interrogative

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61255513A JPS63109573A (en) 1986-10-27 1986-10-27 Processing system for adjunct interrogative

Publications (1)

Publication Number Publication Date
JPS63109573A true JPS63109573A (en) 1988-05-14

Family

ID=17279797

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61255513A Pending JPS63109573A (en) 1986-10-27 1986-10-27 Processing system for adjunct interrogative

Country Status (1)

Country Link
JP (1) JPS63109573A (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61211764A (en) * 1985-03-18 1986-09-19 Canon Inc Natural language processor

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61211764A (en) * 1985-03-18 1986-09-19 Canon Inc Natural language processor

Similar Documents

Publication Publication Date Title
US6760695B1 (en) Automated natural language processing
JP3220560B2 (en) Machine translation equipment
US5528491A (en) Apparatus and method for automated natural language translation
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
Sornlertlamvanich et al. Thai Part-of-Speech Tagged Corpus: ORCHID
WO1997040453A1 (en) Automated natural language processing
JPS63109573A (en) Processing system for adjunct interrogative
JPS61248160A (en) Document information registering system
JP2688020B2 (en) Derivative word processing method
KR100204068B1 (en) Language translation modified method
JP2521435B2 (en) Japanese generator
JPS62267872A (en) Language analyzing device
JPH0816910B2 (en) Language analyzer
KR100282546B1 (en) Conversion method of multilingual translation unit in Korean-Japanese machine translation system
JPH0561902A (en) Mechanical translation system
Tanev et al. LINGUA: a robust architecture for text processing and anaphora resolution in Bulgarian
JPS63106075A (en) Processing system for contracted word
JP3139624B2 (en) Morphological analyzer
JPH11282839A (en) Machine translation system and computer readable recording medium recording machine translation processing program
JPS63108462A (en) Processing system of apostrophe 's'
JP2000029882A (en) Summary preparing device
JPH11232268A (en) Document processor, agate arranging method and storage medium
JPH0797372B2 (en) Language analyzer
JPH10105552A (en) Machine translation system
JPH06301717A (en) Information collection system, natural language processing system, and machine translation system