JPH0658674B2 - Blank generation method when generating translated text - Google Patents

Blank generation method when generating translated text

Info

Publication number
JPH0658674B2
JPH0658674B2 JP63315311A JP31531188A JPH0658674B2 JP H0658674 B2 JPH0658674 B2 JP H0658674B2 JP 63315311 A JP63315311 A JP 63315311A JP 31531188 A JP31531188 A JP 31531188A JP H0658674 B2 JPH0658674 B2 JP H0658674B2
Authority
JP
Japan
Prior art keywords
blank
morpheme
morphemes
adjacent
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63315311A
Other languages
Japanese (ja)
Other versions
JPH02159675A (en
Inventor
誠 塩津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63315311A priority Critical patent/JPH0658674B2/en
Publication of JPH02159675A publication Critical patent/JPH02159675A/en
Publication of JPH0658674B2 publication Critical patent/JPH0658674B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 〔概要〕 翻訳文の生成時にブランクを発生させるブランク発生方
式に関し、 翻訳後の文の隣接する形態素から取り出した隣接番号に
基づいてブランク生成テーブルを参照してブランクを発
生するか否かを判定し、簡単な制御によってブランクの
発生を行うことを目的とし、 形態素に隣接番号を付与して予め作成した辞書と、隣接
する形態素間にブランクを発生させるか否かの情報を予
め格納したブランク生成テーブルとを備え、入力された
文を形態素・構文解析して生成した形態素について、翻
訳しようとする言語の上記辞書を検索して該当する形態
素および隣接番号を取り出し、翻訳後の文の隣接する形
態素から隣接番号をそれぞれ取り出し、これらに基づい
て上記ブランク生成テーブルを参照してブランクを発生
するか否かを判定し、翻訳後の形態素間にブランクを挿
入するように構成する。
DETAILED DESCRIPTION OF THE INVENTION [Outline] A blank generation method for generating a blank when a translated sentence is generated. A blank is generated by referring to a blank generation table based on an adjacent number extracted from an adjacent morpheme of a translated sentence. Information to determine whether or not to generate a blank by simple control, and to create a blank between adjacent morphemes and a dictionary created in advance by assigning adjacent numbers to morphemes. And a blank generation table that stores in advance, for the morphemes generated by morphological / syntactic analysis of the input sentence, the dictionary of the language to be translated is searched, the corresponding morphemes and adjacent numbers are extracted, and after translation, The adjacent numbers are extracted from the adjacent morphemes of the sentence and the blank is generated by referring to the blank generation table based on these numbers. It is configured to insert a blank between the translated morphemes.

〔産業上の利用分野〕[Industrial application field]

本発明は、翻訳文の生成時にブランクを発生させるブラ
ンク発生方式に関するものである。
The present invention relates to a blank generation method that generates a blank when a translated sentence is generated.

〔従来の技術〕[Conventional technology]

機械翻訳や質疑応答システムは、自然な英語文を自動的
に作り出す必要がある。従来は、文を作り出すのに、単
語を構成する形態素(語幹と活用語尾など)と同時に単
語間のブランク(空白)まで考慮して出力する必要があ
った。
Machine translation and Q & A systems need to automatically produce natural English sentences. In the past, in order to create a sentence, it was necessary to consider the morphemes (stems and inflection endings) that compose a word, as well as the blanks between the words, and output the blanks.

〔発明が解決しようとする課題〕[Problems to be Solved by the Invention]

このため、制御が複雑なものとなってしまう問題があっ
た。また、ブランクを単語の前に出したり、単語の後ろ
に出したりの判定を文法規則に基づいて行っていたた
め、ブランクを出し忘れたり、出し過ぎたりしてしまう
とい問題があった。更に、ブランク判定のための文法規
則が必要となり、英語などの翻訳文を生成する部分の文
法規則の数が多くなってしまうという問題があった。
Therefore, there is a problem that the control becomes complicated. In addition, since it is determined whether to put a blank before a word or after a word based on a grammatical rule, there is a problem that a blank is forgotten or overprinted. Further, there is a problem that a grammatical rule for blank judgment is required, and the number of grammatical rules in a portion for generating a translated sentence such as English increases.

本発明は、翻訳後の文の隣接する形態素から取り出した
隣接番号に基づいてブランク生成テーブルを参照してブ
ランクを発生するか否かを判定し、簡単な制御によって
ブランクの発生を行うことを目的としている。
An object of the present invention is to determine whether to generate a blank by referring to a blank generation table based on an adjacent number extracted from an adjacent morpheme of a sentence after translation, and to generate a blank by simple control. I am trying.

〔課題を解決する手段〕[Means for solving the problem]

第1図を参照して課題を解決する手段を説明する。 Means for solving the problems will be described with reference to FIG.

第1図において、形態素生成部3−1は、辞書4を参照
して翻訳した形態素を生成するものである。この際、併
せて形態素に付与された隣接番号を辞書4から取り出
す。
In FIG. 1, a morpheme generation unit 3-1 generates a translated morpheme by referring to the dictionary 4. At this time, the adjacent number also given to the morpheme is taken out from the dictionary 4.

ブランク生成部3−2は、ブランク生成テーブル5を参
照してブランク生成を行うものである。
The blank generation unit 3-2 refers to the blank generation table 5 and performs blank generation.

辞書4は、形態素に隣接番号を付与して予め作成したも
のである。
The dictionary 4 is created in advance by assigning adjacent numbers to morphemes.

〔作用〕[Action]

本発明は、第1図に示すように、形態素生成部3−1が
辞書4を参照して翻訳した形態素を生成すると共に隣接
番号を辞書4から取り出し、ブランク生成部3−2が翻
訳した形態素間の隣接番号に基づいてブランク生成テー
ブル5を参照し、当該形態素間にブランクを発生させる
か否かを判定し、ブランクを挿入するようにしている。
According to the present invention, as shown in FIG. 1, the morpheme generator 3-1 generates a morpheme translated by referring to the dictionary 4, extracts the adjacent number from the dictionary 4, and the blank generator 3-2 translates the morpheme. The blank generation table 5 is referred to on the basis of the adjacent number between them, it is determined whether or not a blank is generated between the morphemes, and the blank is inserted.

従って、翻訳後の隣接する形態素の隣接番号に基づいて
ブランク生成テーブル5を参照してブランクの発生を判
定するという簡単な制御によって、翻訳後の形態素間に
ブランクを挿入することが可能となる。
Therefore, it is possible to insert a blank between post-translational morphemes by a simple control of determining the occurrence of a blank by referring to the blank generation table 5 based on the adjacent number of the post-translational adjacent morpheme.

〔実施例〕〔Example〕

次に、日本語を英語に翻訳する場合のブランクの発生に
ついて、第1図から第3図を用いて順次詳細に説明す
る。
Next, the occurrence of blanks when translating Japanese into English will be sequentially described in detail with reference to FIGS. 1 to 3.

第1図において、入力部1は、日本語などの翻訳しよう
とする文(入力文)を入力するものである。例えば入力
文“彼はリンゴを食べる。”を入力する。
In FIG. 1, an input unit 1 is for inputting a sentence to be translated (input sentence) such as Japanese. For example, the input sentence “He eats an apple.” Is input.

日本語解析部2は、入力部1から入力された日本語を形
態素分割(第2図)、構文解析(第2図、)、更
に概念ネットワーク(第2図)を生成するものであ
る。
The Japanese analysis unit 2 is for morphologically dividing the Japanese input from the input unit 1 (FIG. 2), parsing the Japanese (FIG. 2), and further generating a concept network (FIG. 2).

英文生成部3は、形態素生成部3−1およびブランク生
成部3−2などから構成され、日本語解析部2によって
解析された概念ネットワークに対応した英語の文を生成
するものである。
The English sentence generation unit 3 is composed of a morpheme generation unit 3-1 and a blank generation unit 3-2, and generates an English sentence corresponding to the concept network analyzed by the Japanese analysis unit 2.

形態素生成部3−1は、概念ネットワーク(第2図)
から主語、動詞などを順次取り出し、辞書4を参照して
英語に翻訳した形態素を生成するものである(第2図
)。この際、英語の形態素に付与されている隣接番号
(第2図)を併せて取り出して記憶しておく。
The morpheme generator 3-1 is a conceptual network (Fig. 2).
The subject, the verb, and the like are sequentially taken out, and a morpheme translated into English is generated by referring to the dictionary 4 (FIG. 2). At this time, the adjacent number (FIG. 2) assigned to the English morpheme is also taken out and stored.

ブランク生成部3−2は、形態素生成部3−1によって
生成された翻訳後の形態素列から、隣接する形態素の隣
接番号に基づいて、ブランク生成テーブル5を参照して
当該形態素間にブランクを生成するか否かを判定し、生
成すると判定された場合にブランクを挿入するものであ
る。(第2図、)。
The blank generation unit 3-2 generates a blank between the morphemes by referring to the blank generation table 5 from the post-translational morpheme sequence generated by the morpheme generation unit 3-1 based on the adjacent number of the adjacent morphemes. It is determined whether or not to perform, and a blank is inserted when it is determined to generate. (Fig. 2,).

これら生成された翻訳後の形態素およびブランクからな
る英語文を、プリンタによって用紙に印字したり、ディ
スプレイ上に表示したりする(英文出力する)。
An English sentence composed of these generated morphemes and blanks after translation is printed on paper by a printer or displayed on a display (English output).

次に、第2図に示す順序に従い、第1図構成の動作を具
体的に説明する。
Next, the operation of the configuration shown in FIG. 1 will be specifically described according to the order shown in FIG.

第2図において、は、形態素に分割する。これは、右
側に示すように、入力された日本語 彼はリンゴを食べる。
In FIG. 2, is divided into morphemes. It is typed in Japanese, as shown on the right. He eats an apple.

について、下線を引いたように、形態素(単語)に分割
することを意味している。
Is divided into morphemes (words) as underlined.

は、構文解析で文節にまとめる。これは、で形態素
分割された形態素について、図示のように文節にまとめ
ることを意味している。
Are put together into clauses by parsing. This means that the morphemes that have been morpheme-divided by are grouped into clauses as shown.

は、係り受けから主語、目的語などの関係を解析す
る。
Analyzes the relationship between the subject and the object from the dependency.

は、概念ネットワークを生成する。これは、の係り
受けを解析した結果から、日本語の入力文の概念を図示
のように、動詞“食べる”を中心に、主語“彼”、目的
語“リンゴ”などのようにネットワークを生成すること
を意味している。
Generates a concept network. Based on the result of analyzing the dependency of, a network is created with the concept of a Japanese input sentence as shown in the figure, centering on the verb "eat", subject "he", object "apple", etc. It means to do.

は、英語に翻訳した形態素を生成する。これは、の
日本語の概念ネットワークから例えば主語“彼”を取り
出し、辞書(英語辞書)4を参照して該当する英語の形
態素“He”を取り出すことを意味している。
Generates a morpheme translated into English. This means that, for example, the subject "he" is extracted from the Japanese concept network, and the corresponding English morpheme "He" is extracted by referring to the dictionary (English dictionary) 4.

は、隣接番号を取り出す。これは、で辞書4から例
えば英語の形態素“He”を取り出した際に、併せてこ
の形態素“He”に予め付与されている隣接番号(L、
R)を取り出すことを意味している。
Retrieves the adjacent number. This is because, for example, when an English morpheme “He” is taken out from the dictionary 4, the adjacent number (L,
R) is taken out.

は、ブランク生成テーブル5を参照してブランクの発
生の“あり”あるいは“なし”を図示矢印を用いて示す
ように判定する。これは、、で辞書(英語辞書)4
から取り出した形態素列のうち、隣接する先行する形態
素(単語)の右隣接番号(R)を行インデックス(R
C)とし、かつ後置する形態素(単語)の左隣接番号
(L)を列インデックス(LC)とし、これらRCおよ
びLCによって例えば第3図ブランク生成テーブル5を
参照し、ブランクの“あり”あるいは“なし”を図示矢
印を用いて示すように判定することを意味している。
Refers to the blank generation table 5 and determines "presence" or "absence" of occurrence of blank as indicated by an arrow. This is a dictionary in English (English dictionary) 4
The right adjacent number (R) of the adjacent preceding morpheme (word) in the morpheme string extracted from the row index (R
C) and the left adjacent number (L) of the morpheme (word) to be added later is used as a column index (LC), and the RC and LC are used to refer to the blank generation table 5 in FIG. This means that “none” is determined as indicated by the arrow in the figure.

は、翻訳文を生成する。これは、で生成した形態素
列について、でブランク“あり”と判定した形態素間
にブランクを挿入し、翻訳文を図示のように生成するこ
とを意味している。
Produces a translated sentence. This means that a blank is inserted between the morphemes determined to be “present” in the morpheme sequence generated in (3) to generate a translated sentence as illustrated.

次に、第2図の翻訳文において、ブランクが発生され
る手順を第3図ブランク作成テーブル5を用いて具体的
に説明する。
Next, the procedure for generating a blank in the translated text of FIG. 2 will be specifically described using the blank creation table 5 of FIG.

(1)先頭の“He”は、第2図の形態素“He”をそ
のままコピーしたものである。
(1) "He" at the head is a copy of the morpheme "He" shown in FIG.

(2)形態素“He”の隣接番号R“4”と、次の形態素
“eat”の隣接番号L“6”とを行列のインデックス
とし、第3図に示す“◎”(ブランクありを表す)を
見つけ出す。このの“◎”によって、ブランクありと
なり、翻訳文のHeの次にブランクを挿入する。
(2) The adjacent number R “4” of the morpheme “He” and the adjacent number L “6” of the next morpheme “eat” are used as the matrix index, and “⊚” (indicates that there is a blank) shown in FIG. Find out. This "◎" indicates that there is a blank, and a blank is inserted after He in the translated text.

(3)第2番目の“eat”は、第2図の形態素“ea
t”をそのままコピーしたものである。
(3) The second "eat" is the morpheme "ea" of FIG.
It is a copy of "t" as it is.

(4)形態素“eat”の隣接番号R“26”と、次の形
態素“s”の隣接番号L“23”とを行列のインデック
スとし、第3図に示す“○”(ブランクなしを表す)
を見つけ出す。このの“○”によって、ブランクなし
となり、翻訳文のeatとsとの間にブランクを挿入
しない。
(4) The adjacent number R "26" of the morpheme "eat" and the adjacent number L "23" of the next morpheme "s" are used as matrix indices, and "○" (representing no blank) shown in FIG.
Find out. By this "○", there is no blank, and no blank is inserted between eat and s of the translated sentence.

(5)第3番目の“s”は、第2図の形態素“s”をそ
のままコピーしたものである。これにより、(4)でea
tの次にブランクが挿入されないので、結果として、
“eats”となる。
(5) The third “s” is a copy of the morpheme “s” shown in FIG. By this, ea in (4)
Since no blank is inserted after t, the result is
It becomes "eats".

(6)形態素“s”の隣接番号R“4”と、次の形態素
“apple”の隣接番号L“6”とを行列のインデッ
クスとするが、(2)のと同じであるので、翻訳文の
sとappleとの間にブランクを挿入する。
(6) The adjacent number R “4” of the morpheme “s” and the adjacent number L “6” of the next morpheme “apple” are used as matrix indices, but since they are the same as in (2), Insert a blank between s and apple.

(7)以下同様にして第2図の翻訳文を生成する。(7) Similarly, the translated sentence of FIG. 2 is generated.

第2図はブランク生成テーブル例を示す。図中縦軸のR
Cは行インデックスの番号を表し、横軸のLCは列イン
デックの番号を表す。これらの番号には、図示のように
形態素の種類がそれぞれ割り当ててある。図中の“◎”
および“●”がブランクあり、“○”がブランクなしを
表す。
FIG. 2 shows an example of a blank generation table. R on the vertical axis in the figure
C represents the row index number, and LC on the horizontal axis represents the column index number. Morphological types are assigned to these numbers, respectively, as shown in the figure. "◎" in the figure
And "●" means that there is a blank, and "○" means that there is no blank.

〔発明の効果〕〔The invention's effect〕

以上説明したように、本発明によれば、翻訳後の隣接す
る形態素の隣接番号に基づいてブランク生成テーブル5
を参照してブランクの発生を判定する構成を採用してい
るため、翻訳後の形態素(単語)間にブランクを挿入す
るか否かの判定をテーブル参照という簡単な制御によっ
て高速に実行することができる。これにより、翻訳文生
成部における従来のブランク生成のための文法規則が不
要となり、翻訳文生成のための文法規則の数を削減する
ことができると共に、文法規則を参照してブランク生成
していた場合に発生した、ブランクを出し忘れたり、出
し過ぎたりすることを回避できる。
As described above, according to the present invention, the blank generation table 5 is based on the adjacent numbers of the translated adjacent morphemes.
Since the configuration that determines the occurrence of blanks is adopted by referring to, it is possible to quickly determine whether or not to insert a blank between translated morphemes (words) with a simple control called table lookup. it can. This eliminates the need for the conventional grammar rules for blank generation in the translated sentence generation unit, reduces the number of grammar rules for translated sentence generation, and generates blanks by referring to the grammar rules. In this case, it is possible to prevent the blank from being left out or the blank being put out too much.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の1実施例構成図、第2図は本発明の動
作説明図、第3図はブランク生成テーブル例を示す。 図中、2は日本語解析部、3−1は形態素生成部、3−
2はブランク生成部、4は辞書、5はブランク生成テー
ブルを表す。
FIG. 1 is a configuration diagram of an embodiment of the present invention, FIG. 2 is an operation explanatory diagram of the present invention, and FIG. 3 is an example of a blank generation table. In the figure, 2 is a Japanese analysis unit, 3-1 is a morpheme generation unit, 3-
2 is a blank generation unit, 4 is a dictionary, and 5 is a blank generation table.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】翻訳文の生成時にブランクを発生させるブ
ランク発生方式において、 形態素に隣接番号を付与して予め作成した辞書(4)と、 隣接する形態素間にブランクを発生させるか否かの情報
を予め格納したブランク生成テーブル(5)とを備え、 入力された文を形態素・構文解析して生成した形態素に
ついて、翻訳しようとする言語の上記辞書(4)を検索し
て該当する形態素および隣接番号を取り出し、翻訳後の
文の隣接する形態素から隣接番号をそれぞれ取り出し、
これらに基づいて上記ブランク生成テーブル(5)を参照
してブランクを発生するか否かを判定し、翻訳後の形態
素間にブランクを挿入するように構成したことを特徴と
する翻訳文生成時のブランク発生方式。
1. A blank generation method for generating a blank when a translated sentence is generated, a dictionary (4) created in advance by assigning adjacent numbers to morphemes, and information on whether or not to generate a blank between adjacent morphemes. A blank generation table (5) in which is stored in advance, and for the morphemes generated by morpheme / syntactic analysis of the input sentence, the dictionary (4) of the language to be translated is searched to find the corresponding morphemes and adjacencies. Extract the numbers, extract the adjacent numbers from the adjacent morphemes of the translated sentence,
Based on these, it is determined whether or not a blank is generated by referring to the blank generation table (5), and a blank is inserted between the morphemes after translation. Blank generation method.
JP63315311A 1988-12-13 1988-12-13 Blank generation method when generating translated text Expired - Lifetime JPH0658674B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63315311A JPH0658674B2 (en) 1988-12-13 1988-12-13 Blank generation method when generating translated text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63315311A JPH0658674B2 (en) 1988-12-13 1988-12-13 Blank generation method when generating translated text

Publications (2)

Publication Number Publication Date
JPH02159675A JPH02159675A (en) 1990-06-19
JPH0658674B2 true JPH0658674B2 (en) 1994-08-03

Family

ID=18063869

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63315311A Expired - Lifetime JPH0658674B2 (en) 1988-12-13 1988-12-13 Blank generation method when generating translated text

Country Status (1)

Country Link
JP (1) JPH0658674B2 (en)

Also Published As

Publication number Publication date
JPH02159675A (en) 1990-06-19

Similar Documents

Publication Publication Date Title
US6470306B1 (en) Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
JPH09259127A (en) Translation device
JPS62163173A (en) Mechanical translating device
KR20030094632A (en) Method and Apparatus for developing a transfer dictionary used in transfer-based machine translation system
JP2007518164A (en) Automatic translation apparatus, automatic translation method using the automatic translation apparatus, and recording medium on which the automatic translation apparatus is recorded
Desai et al. A domain-restricted, rule based, english-hindi machine translation system based on dependency parsing
JPH02112068A (en) System for simply displaying text
Aikawa et al. Generation for multilingual MT
WO1997048058A9 (en) Automated translation of annotated text
WO1997048058A1 (en) Automated translation of annotated text
JPH0658674B2 (en) Blank generation method when generating translated text
JPH0330183B2 (en)
JP2626722B2 (en) Japanese generator
US20240160839A1 (en) Language correction system, method therefor, and language correction model learning method of system
JP2521435B2 (en) Japanese generator
Altynbekova Artificial Intelligence and Translation Technology
JP3892227B2 (en) Machine translation system
Chen et al. The Processing of English Compound and Complex Words in an English-Chinese Machine Translation System
JP3233800B2 (en) Machine translation equipment
JP4531325B2 (en) Machine translation apparatus and machine translation method
Skadiņa et al. Comprehension Assistant for Languages of Baltic States
Aikawa et al. Sentence generation for multilingual machine translation
JPH04282764A (en) Non-sentence translating device
JP2004086919A (en) Mechanical translation system
JPH07122876B2 (en) Machine translation device