JPS63168774A - Subject supplementing system for mechanical translation system - Google Patents
Subject supplementing system for mechanical translation systemInfo
- Publication number
- JPS63168774A JPS63168774A JP62000709A JP70987A JPS63168774A JP S63168774 A JPS63168774 A JP S63168774A JP 62000709 A JP62000709 A JP 62000709A JP 70987 A JP70987 A JP 70987A JP S63168774 A JPS63168774 A JP S63168774A
- Authority
- JP
- Japan
- Prior art keywords
- subject
- sentence
- candidate list
- translation
- supplementing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001502 supplementing effect Effects 0.000 title claims abstract description 6
- 239000013589 supplement Substances 0.000 claims abstract 2
- 238000000034 method Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 3
- 238000010187 selection method Methods 0.000 claims description 2
- 238000003169 complementation method Methods 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 6
- 240000005265 Lupinus mutabilis Species 0.000 description 4
- 235000008755 Lupinus mutabilis Nutrition 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 235000019095 Sechium edule Nutrition 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000009469 supplementation Effects 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 230000032696 parturition Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
Description
【発明の詳細な説明】
[概 要]
機械翻訳システム、特に日本語のように主語が存在しな
い場合が多い原言語から行う機械翻訳システムにおいて
、主語を省略された日本語文の主語を補足するため、主
語候補リストを備え、この中から最も確からしいものを
選択し、主語とじて補足して翻訳するようにしたもので
あり、これによってより自然な訳文が得られる。[Detailed Description of the Invention] [Summary] A method for supplementing the subject of a Japanese sentence where the subject has been omitted in a machine translation system, especially a machine translation system that performs translation from a source language such as Japanese, which often does not have a subject. , a subject candidate list is provided, from which the most probable one is selected and translated as a supplementary subject, thereby providing a more natural translation.
[産業上の利用分野]
本発明は、日本語からの機械翻訳に係わり、原文で省略
された主語を補う方式に関する。[Industrial Field of Application] The present invention relates to machine translation from Japanese, and relates to a method for supplementing subjects omitted in the original text.
日本語においては、主語が省略されることが多い。一方
、欧米の言語では主語は必須であるから、何等かの操作
が必要とされる。In Japanese, the subject is often omitted. On the other hand, in Western languages, the subject is essential, so some kind of manipulation is required.
[従来の技術]
従来、日本語からの機械翻訳において、主語なし文に対
しては、目的語を主語とする文(受動体)を生成するこ
とにより、翻訳を成功させていた。[Prior Art] Conventionally, in machine translation from Japanese, successful translation has been achieved by generating a sentence (passive) in which the object is the subject for a sentence without a subject.
第4図は、従来技術による機械翻訳の例を示す図である
。FIG. 4 is a diagram showing an example of machine translation according to the prior art.
日本語例文に示すように、最初の文aには主語があるが
、これに続く文す、c、dには主語が省略されている。As shown in the Japanese example sentences, the first sentence a has a subject, but the following sentences c and d omit the subject.
これらに対する従来技術による翻訳は、眼側1に示すよ
うになる。即ち、主語なし文す、c、dは、目的語を主
語として受動体として生成されている。The translation of these according to the prior art is as shown on the eye side 1. That is, the subject-less sentences S, C, and D are generated as passive sentences with the object as the subject.
このように、従来方法による機械翻訳では、翻訳として
は誤っていないけれども、不自然な、ぎごちない文が生
成されてしまう。In this way, machine translation using conventional methods produces sentences that are unnatural and awkward, although the translation is correct.
[発明が解決しようとする問題点]
上記に説明のように、従来の方式によれば、主語無し文
の翻訳が不自然なぎごちない文になってしまうものであ
った。[Problems to be Solved by the Invention] As explained above, according to the conventional method, the translation of a sentence without a subject results in an unnatural and awkward sentence.
そこで、省略された主語を補うことが要求されるが、誤
った主語を補ってしまうと、翻訳の精度を落すことにな
る。Therefore, it is necessary to fill in the omitted subject, but if you fill in the wrong subject, the accuracy of the translation will decrease.
本発明は、このような従来の問題点を解消した新規な主
語の補足方式を提供しようとするものである。The present invention aims to provide a novel subject supplementation method that solves these conventional problems.
[問題点を解決するための手段]
第1図は本発明の日本語を原言語とする機械翻訳システ
ムにおける主語の補足方式の原理ブロック図を示す。[Means for Solving the Problems] FIG. 1 shows a principle block diagram of the subject supplementation method in the machine translation system using Japanese as the source language of the present invention.
図において、1は主語候補リスト作成手段であり、入力
文を解析し、名詞を抽出し、主語候補として主語候補リ
スト2に格納する。主語候補リスト2は、次々と新しく
現れた主語候補をつないで格納する。In the figure, reference numeral 1 denotes a subject candidate list creation means, which analyzes an input sentence, extracts nouns, and stores them as subject candidates in a subject candidate list 2. The subject candidate list 2 stores newly appearing subject candidates in a connected manner.
3は主語選択手段であり、主語の省略された文に到達し
たとき、主語候補リスト2の要素をリストの後の方から
それが主語となり得るかを調べ、選択する。Reference numeral 3 denotes a subject selection means, which when a sentence in which the subject is omitted is reached, selects an element of the subject candidate list 2 from the later part of the list to see if it can be the subject.
4は主語補足手段であり、主語選択手段3の選択した名
詞の代名詞を主語なし文の主語として補足する。Reference numeral 4 denotes a subject complementing means, which complements the pronoun of the noun selected by the subject selecting means 3 as the subject of a sentence without a subject.
[作用]
主語候補リスト作成手段は、入力された日本語文を解析
して名詞を抽出し、以後の文の主語になる可能性のある
ものとして、主語候補リストの後に次々とつないでいく
。[Operation] The subject candidate list creation means analyzes the input Japanese sentence, extracts nouns, and connects them one after another in the subject candidate list as possible subjects of subsequent sentences.
主語の省略された文に到達したとき、主語選択手段は、
主語候補リストを最後の方から順に見ていって、文法的
に、意味的に主語になり得るものを選択する。そのため
、主語候補リストには、語のほかに選択の参考となる属
性を記載する。When a sentence with an omitted subject is reached, the subject selection means:
Go through the list of subject candidates in order from the end and select those that can be grammatically and semantically the subject. Therefore, in addition to words, the subject candidate list includes attributes that serve as reference for selection.
通常、主語省略の文の主語は、最近出てきた名詞である
から、文法的に正しくつながる名詞のうち、最も最近現
れた名詞を主語無し文の主語として採用すれば、正しい
訳文ができると考えられる。Usually, the subject of a sentence with a subject omitted is a noun that has appeared recently, so if you use the noun that appears most recently among nouns that are grammatically correctly connected as the subject of a sentence without a subject, you can get a correct translation. It will be done.
適当な主語候補が見つからないとき、または二つ以上の
候補があり、どれが適当か判断ができないときは、受動
体として翻訳を行う。When a suitable subject candidate cannot be found, or when there are two or more candidates and it is not possible to decide which one is suitable, the translation is performed using the passive voice.
文書の種類によっては、特に主語になり易い語がある。Depending on the type of document, some words are particularly likely to become subjects.
例えば、物語文では、その主人公など、また論文では、
それに関する専門用語(物質名、実験装置等)を優先す
るのが適当である。For example, in a story, the main character, etc., and in an essay,
It is appropriate to give priority to related technical terms (substance names, experimental equipment, etc.).
従って、文書の種類に応じて、選択方法を切り換える手
段を備えて、これに対応することができる。Therefore, it is possible to cope with this by providing means for switching the selection method depending on the type of document.
[実施例1
以下第2図および第3図に示す実施例により、本発明を
さらに具体的に説明する。[Example 1] The present invention will be explained in more detail below with reference to examples shown in FIGS. 2 and 3.
第2図は、本発明の一実施例における主語候補リストの
記述例を示す図である。FIG. 2 is a diagram showing a description example of a subject candidate list in an embodiment of the present invention.
図に示すように、この主語候補リストには、■主語候補
の語に加えて、■その語の属性、■その代名詞、および
■参照回数カウンタを付随させて格納する。As shown in the figure, in addition to (1) the subject candidate word, (2) the attribute of the word, (2) the pronoun, and (3) the reference count counter are stored in this subject candidate list.
属性は、文法的に正しい主語になり得るかを調べる際に
使用する。Attributes are used to check whether a sentence can be a grammatically correct subject.
代名詞は、この語が主語なし文の主語として選択された
とき、この代名詞を主語として文を生成する。When this word is selected as the subject of a sentence without a subject, a sentence is generated using this pronoun as the subject.
参照回数カウンタは、主語なし文の主語として採用され
た回数を計数し、主語候補リストの容量制限により古い
ものから捨てる際に、残すための条件とする。The reference count counter counts the number of times the subject is used as the subject of a sentence without a subject, and is used as a condition for keeping the subject candidate list when discarding the oldest one due to the capacity limit of the subject candidate list.
図において、上側の矢印→は、新しい語がつながれてい
くことを示し、下側の矢印←は、このリストで次に参照
する語のポインタを示し、新しいものから順次参照し、
nilはこれ以上参照する語はないことを示す。In the figure, the arrow → at the top indicates that new words are connected, and the arrow ← at the bottom indicates the pointer to the next word to be referenced in this list.
nil indicates that there are no more words to refer to.
以下、第4図に示した日本語例文について、本実施例に
よる動作を説明する。The operation according to this embodiment will be described below with respect to the Japanese example sentence shown in FIG.
(1)まず、最初の文aの翻訳時に、主語の「チョウチ
ョウ」と目的語の「(みかんの)木1が主語候補リスト
に追加される。「チョウチョウ」(butterfly
)には属性として動物(animal)が、代名詞とし
てitが記載され、「木J (tree)には属性とし
て植物(plant)が、代名詞としてitが記載され
、「チョウチョウ」は主語であった 。(1) First, when translating the first sentence a, the subject "chocho" and the object "(mandarin orange) tree 1" are added to the subject candidate list.
) has animal as an attribute and it as a pronoun, and ``tree has plant as an attribute and it as a pronoun, and ``butterfly'' is the subject. .
から参照回数カウンタは1とする。From then on, the reference count counter is set to 1.
(2)次に、文すの翻訳においては、「(何か)つけて
・・」の主語が省略されているのが検出される。主語選
択手段は、「つける」は有意思動詞であるから、主語は
有意思体であると推定し、主語候補リストを後から、動
物か人間乃至擬人化され易いものという条件で検索する
。r木」は不適であるが、rチョウチョウJは残り、主
語候補リストに登録された語が他に無いので、「チョウ
チョウ」が文すの主語として選択される。主語候補リス
ト内の語rチョウチョウJが主語として使用されたこと
を示す参照回数カウンタを1だけ増す。(2) Next, in the translation of the sentence, it is detected that the subject of "add (something)..." is omitted. The subject selection means presumes that the subject is a volitional verb since "tsuke" is a volitional verb, and later searches the subject candidate list on the condition that it is an animal, a human, or something that is likely to be anthropomorphized. ``r 木'' is inappropriate, but r chocho J remains and there are no other words registered in the subject candidate list, so ``chocho'' is selected as the subject of the sentence. A reference count counter indicating that the word r Chocho J in the subject candidate list is used as a subject is incremented by one.
(3)文すの名詞が抽出され、「おなかJ (s to
mach)および「葉J (leaf)がそれぞれの属
性:肉体(bodい、植物(plant)ならびに代名
詞itと共に、主語候補リストに追加される。(3) The noun ``bunsu'' is extracted, and ``s to
mach) and 'leaf' are added to the subject candidate list with their respective attributes: body, plant, and the pronoun it.
(4)次に、文Cの翻訳では、「(何を)している。(4) Next, in the translation of sentence C, “(what are you doing)?
の主語が省略されているのが検出される。主語選択手段
は、「している」は有意思動詞であるから、主語は有意
思体であると推定し、主語候補リストを後から、動物か
人間乃至原人化され易いものという条件で検索する。1
葉」、「おなかj、「木」は不適であるが、「チョウチ
ョウJは残り、主語候補リストに登録された語が他に無
いので「チョウチョウ」が文Cの主語として選択される
。主語候補リスト内の語「チョウチョウ」の参照回数カ
ウンタを1だけ増す。It is detected that the subject of is omitted. The subject selection means presumes that the subject is a volitional verb since ``shiru'' is a volitional verb, and later searches the subject candidate list on the condition that it is an animal, a human, or something that is likely to be transformed into an hominin. 1
``leaf'', ``tummy j'', and ``tree'' are inappropriate, but ``chocho J'' remains and there are no other words registered in the subject candidate list, so ``chocho'' is selected as the subject of sentence C. The reference count counter for the word "chocho" in the subject candidate list is incremented by 1.
(5)次に、文dの翻訳において、「生んでいるjの主
語省略されているのが検出される。主語選択手段は、「
生んでいる」は有意思動詞であるから、主語は有意思体
であると推定し、主語候補リストを後から、動物か人間
乃至擬人化され易いものという条件で検索する。1葉」
、「おなか」、r木」は不適であるが、「チョウチョウ
」は残り、主語候補リストに登録された語が他に無いの
で「チョウチョウ」が文dの主語として選択される。主
語候補リスト内のrチョウチョウ」の参照回数カウンタ
を1だけ増す。(5) Next, in the translation of sentence d, it is detected that the subject of ``j'' is omitted.
Since "I'm giving birth" is a verb with intention, it is assumed that the subject is a verb with intention, and the subject candidate list is later searched under the condition that it is an animal, a human, or something that is likely to be anthropomorphized. 1 leaf”
, ``taka'', and ``r tree'' are inappropriate, but ``chocho'' remains and there are no other words registered in the subject candidate list, so ``chocho'' is selected as the subject of sentence d. Increment the reference count counter of "rchocho" in the subject candidate list by 1.
(6)文dにおける名詞r卵J (egg)が抽出され
、その属性、代名詞と共に、主語候補リストに追加され
る。このとき、候補リストの長さが“4”に設定されて
いるならば、候補リストの古い方(より前に現れた語)
で、一度も参照されていないもの、「木J (tree
)を捨てる。一度も参照されていないものが無いならば
、最も古いものを捨てる。(6) The noun r egg J (egg) in sentence d is extracted and added to the subject candidate list along with its attributes and pronouns. At this time, if the length of the candidate list is set to "4", the oldest candidate list (the word that appeared earlier)
``tree J'', which has never been referenced.
) is discarded. If there is nothing that has never been referenced, discard the oldest one.
(7)主語選択手段において、主語候補リストから適当
な候補が見つからないとき、または二つ以上の候補があ
り、どれが適当か判断できないときは、選択不能を出力
し、受動体として翻訳を行う。(7) When the subject selection means cannot find a suitable candidate from the subject candidate list, or when there are two or more candidates and it cannot be determined which one is suitable, it outputs "unselectable" and translates as a passive. .
第3図は、このようにして主語を補足し、英語に翻訳し
た文を眼側2として示す。In FIG. 3, a sentence with the subject supplemented in this way and translated into English is shown as eye side 2.
第4図に示した従来技術による眼側1に比較して、極め
て自然な訳文となっていることが判る。It can be seen that the translation is extremely natural compared to the eye side 1 according to the prior art shown in FIG.
[発明の効果]
以上説明のように本発明によれば、日本語からの機械翻
訳システムにおいて、省略された主語として最も確から
しいものを選択し、補足することにより翻訳精度を向上
することができ、その実用上の効果は極めて大である。[Effects of the Invention] As explained above, according to the present invention, in a machine translation system from Japanese, translation accuracy can be improved by selecting the most likely omitted subject and supplementing it. , its practical effects are extremely large.
第1図は本発明の原理ブロック図、
第2図は本発明の一実施例による主語候補リストを示す
図、
第3図は本発明の一実施例による翻訳例を示す図、
第4図は従来技術による翻訳例を示す図である。
図面において、
1は主語候補リスト作成手段、
2は主語候補リスト、
3は主語選択手段、
4は主語補足手段、
をそれぞれ示す。FIG. 1 is a block diagram of the principle of the present invention. FIG. 2 is a diagram showing a subject candidate list according to an embodiment of the present invention. FIG. 3 is a diagram illustrating an example of translation according to an embodiment of the present invention. It is a figure which shows the translation example by a prior art. In the drawings, 1 indicates a subject candidate list creation means, 2 indicates a subject candidate list, 3 indicates a subject selection means, and 4 indicates a subject complementation means.
Claims (3)
、 入力文を解析して名詞を抽出し、主語候補として格納し
、リストとして管理する主語候補リスト作成手段(1)
と、 主語候補リスト作成手段(1)の抽出した新しい主語候
補を次々とつないで格納した主語候補リスト(2)と、 主語の省略された文に到達したとき主語候補リスト(2
)の後の方から主語となり得るものを選択する主語選択
手段(3)と、 主語選択手段(3)の選択した名詞の代名詞を、前記主
語なし文の主語として補足する主語補足手段(4)を備
え、 主語を補足された文により翻訳を実行するよう構成した
ことを特徴とする機械翻訳システムにおける主語の補足
方式。(1) In a machine translation system with Japanese as the source language, subject candidate list creation means (1) that analyzes an input sentence, extracts nouns, stores them as subject candidates, and manages them as a list.
, a subject candidate list (2) in which new subject candidates extracted by the subject candidate list creation means (1) are connected and stored one after another, and a subject candidate list (2) when a sentence in which the subject is omitted is reached.
), and a subject supplementary means (4) that supplements the pronoun of the noun selected by the subject selection means (3) as the subject of the subject-less sentence. What is claimed is: 1. A method for supplementing a subject in a machine translation system, characterized in that the method is configured to execute translation using a sentence supplemented with a subject.
能なとき、目的語を主語とする受動体として翻訳を行う
よう構成したことを特徴とする特許請求の範囲第1項記
載の機械翻訳システムにおける主語の補足方式。(2) The machine according to claim 1, characterized in that when the subject selection means (3) is unable to select a subject, the machine is configured to translate the object as a passive subject. Subject complementation method in translation systems.
文書の種類に応じて切り換える手段を備えるよう構成し
たことを特徴とする特許請求の範囲第1項記載の機械翻
訳システムにおける主語の補足方式。(3) The subject selection method using the subject selection means (3) above,
2. A subject complementation method in a machine translation system according to claim 1, further comprising means for switching according to the type of document.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62000709A JPS63168774A (en) | 1987-01-06 | 1987-01-06 | Subject supplementing system for mechanical translation system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62000709A JPS63168774A (en) | 1987-01-06 | 1987-01-06 | Subject supplementing system for mechanical translation system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63168774A true JPS63168774A (en) | 1988-07-12 |
Family
ID=11481293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62000709A Pending JPS63168774A (en) | 1987-01-06 | 1987-01-06 | Subject supplementing system for mechanical translation system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63168774A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07306859A (en) * | 1994-05-12 | 1995-11-21 | Nec Corp | Machine translation system |
KR100906136B1 (en) * | 2003-12-12 | 2009-07-07 | 닛본 덴끼 가부시끼가이샤 | Information processing robot |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61163467A (en) * | 1985-01-14 | 1986-07-24 | Hitachi Ltd | Translation method |
JPS62133568A (en) * | 1985-12-04 | 1987-06-16 | Nec Corp | Omission word supplementing device |
JPS62191967A (en) * | 1986-02-19 | 1987-08-22 | Ricoh Co Ltd | Context processor |
-
1987
- 1987-01-06 JP JP62000709A patent/JPS63168774A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61163467A (en) * | 1985-01-14 | 1986-07-24 | Hitachi Ltd | Translation method |
JPS62133568A (en) * | 1985-12-04 | 1987-06-16 | Nec Corp | Omission word supplementing device |
JPS62191967A (en) * | 1986-02-19 | 1987-08-22 | Ricoh Co Ltd | Context processor |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07306859A (en) * | 1994-05-12 | 1995-11-21 | Nec Corp | Machine translation system |
KR100906136B1 (en) * | 2003-12-12 | 2009-07-07 | 닛본 덴끼 가부시끼가이샤 | Information processing robot |
KR100953902B1 (en) | 2003-12-12 | 2010-04-22 | 닛본 덴끼 가부시끼가이샤 | Information processing system, information processing method, computer readable medium for storing information processing program, terminal and server |
US8433580B2 (en) | 2003-12-12 | 2013-04-30 | Nec Corporation | Information processing system, which adds information to translation and converts it to voice signal, and method of processing information for the same |
US8473099B2 (en) | 2003-12-12 | 2013-06-25 | Nec Corporation | Information processing system, method of processing information, and program for processing information |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0399533B1 (en) | Machine translation system and method of machine translation | |
JPH03278174A (en) | Translation method and system for communication between different language | |
JPS62163173A (en) | Mechanical translating device | |
JPS63223962A (en) | Translating device | |
JPH0335354A (en) | Proper noun processing method with abbreviation for mechanical translation device | |
CN110678868B (en) | Translation support system, translation support apparatus, translation support method, and computer-readable medium | |
EP0357344B1 (en) | Computer assisted language translating machine | |
US5075851A (en) | System for translating a source language word with a prefix into a target language word with multiple forms | |
JPS58192173A (en) | System for selecting word used in translation in machine translation | |
JPS63168774A (en) | Subject supplementing system for mechanical translation system | |
JPS62184572A (en) | Retrieving system for dictionary of cooperative compound word in word division device | |
JPS6329881A (en) | Machine translation device | |
JPH0410665B2 (en) | ||
JPS63221475A (en) | Analyzing method for syntax | |
JPS62256080A (en) | Translation processing system | |
Kulkarni et al. | Urdu-hindi-urdu machine translation: Some problems | |
JP2994080B2 (en) | Translation selection method | |
JPH0421167A (en) | Machine translation device | |
JP3253311B2 (en) | Language processing apparatus and language processing method | |
JPH04313158A (en) | Machine translation device | |
JPH02208775A (en) | Machine translation system | |
JPH0816910B2 (en) | Language analyzer | |
JP2003141110A (en) | Language processing method and language processing unit by inputting a plurality of languages | |
JPH01152573A (en) | Translating processing system | |
JPS6151270A (en) | Inter-language relation extracting system |