JPS62256080A - 翻訳処理方式 - Google Patents

翻訳処理方式

Info

Publication number
JPS62256080A
JPS62256080A JP61097926A JP9792686A JPS62256080A JP S62256080 A JPS62256080 A JP S62256080A JP 61097926 A JP61097926 A JP 61097926A JP 9792686 A JP9792686 A JP 9792686A JP S62256080 A JPS62256080 A JP S62256080A
Authority
JP
Japan
Prior art keywords
translation
sentence
translated
limited
translation processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61097926A
Other languages
English (en)
Inventor
Fumiyuki Yamano
山野 文行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP61097926A priority Critical patent/JPS62256080A/ja
Publication of JPS62256080A publication Critical patent/JPS62256080A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、第1言語で記述されたテキストを第2言語で
記述されたテキストに変換する言語間の翻訳処理装置に
おいて、限られた計算機資源と基本的な少量の翻訳規則
という制限下のもとで、翻訳処理を効果的に実行する方
式に関するものでろる。
〔従来の技術〕
従来より、第1言語から第2言語への翻訳処理装置にお
いては、第1言語の持つ多義性を主とする曖昧さの解消
が困難なため、自動完全翻訳処理は不可能とされている
。例えば、英語から日本語へ機械的に翻訳する場合を考
えてみても、#品と   。
して数種のシステムが発表されているが、未だ完全翻訳
を可能としたものはない。なお、この糧の翻訳処理に関
連するものとしては、特開昭56−138586号(自
然言語間の自動翻訳方式)、特開昭59−121574
号(翻訳処理方式)等が挙げられる。さらに、入力する
ドキュメントは長い文もあれば短い文もあシ、さらには
出現する文の構造の複雑さも不均一であるため、翻訳結
果の質を均一に保つことは極めて困難である。
〔発明が解決しようとする問題点〕
翻訳結果の質を均一に保つためには、先ず、第1言語の
持つ多義性を主とする曖昧さの解消が必要となる。この
曖昧さをもたらす要因としては種種の要因が挙げられる
が、扱う第1言語のテキストの長さと翻訳の質にはある
程度の相関関係が表れている。つまシ、短いテキストを
翻訳する場合は正しい翻訳結果を得られる度合いが高い
が、テキストが長くなればなる程、誤った翻訳結果を得
る度合いが高くなるという傾向がある。
一般に、自然言語のテキストが長くなる一因としては、
自然言語の再帰性が主な理由として考えられる。例えば
、英語でS(主語) −V (動詞)−〇(目的語)の
構文においてO(目的語)として再びthatに導かれ
た文が現れ得る場合もある。
このような再帰性を扱おうとすると文法規則も複雑にな
るが、文法規則の複雑さに比例して翻訳結果の質が向上
するわけではない。その理由は1文法規則が複雑になる
に従って文法規則間の制御が複雑となシ文法規則の適用
を誤る率も高くなるからである。つまり1文法規則の複
雑さを単純に文法規則数と置き換えて考えれば、文法規
則数の量をある程度以上増やしていっても、その効果は
あまり望めないことにもなる。
上記の議論は、計算機の資源の最適配置という観点から
すれば1文法規則用のメモリ容量をある程度以上増やし
ていっても、翻訳の質には影響しないことになる。従っ
て、必須文法規則を設定して、それに必要なメモリ容量
を確保すれば資源の最適配置が可能になる。
しかし、資源の最適配置によって、メモリ容量を制約し
た場合、翻訳の対象とする文の長さにも制約が必要とな
る。というのは、入力文に対して文法規則を適用した結
果は翻訳処理装置内のメモリに解析木として木構造の形
式で格納されることが一般的でおるが、この本構造をテ
ーブルデータとして保持する場合、入力文が長さnの単
語から構成されると仮定すれば、木構造を表現するため
あテーブルデータはnの二乗のオーダに比例した容量を
必要とするからである。
以上のごとく、従来技術を適用して計算機の資源配置を
重視したコンパクトな翻訳処理装置を設計しようとする
と、扱える入力データを制約しなければならないという
トレード・オフの問題が発生する。
本発明の目的は、上記のトレード・オフを解消し、計算
機資源をコンパクトに納めた翻訳処理方式を提供するこ
とにある。
〔問題点を解決するための手段〕
上記目的は、入力文を翻訳する際に、入力文の部分果合
として構文的にみて基本要素と成シうる部分の範囲とそ
の構文要素を指定する手段と1文法規則適用部において
は、指定された範囲の入力文に対してのみ翻訳処理を施
して翻訳結果の訳語を得ると共に、入力文の指定された
部分を構文要素に置き換える手段と、訳文生成時に前記
構文要素が入力文中に存在すれば、当該構文要素に該当
する訳語を付与する手段、さらに上記の各手段を入力文
に対して有限回適用可能とする手段を備えることにより
達成できる。
〔作用〕
上記の手段によシ、先ず、入力文の部分集合として構文
的に基本要素となシうる部分の範囲と構文要素を指定し
て翻訳することにより、限られた長さの文を扱えばよい
ことと、翻訳対象文の構文要素が明示されているため適
用文法現前を制限することが可能となり、複雑な文法規
則を設定する必要がなくなる。従って、翻訳処理に必要
となるメモリ容量を少なくすることか可能になると共に
限られた長さ以下の単語列の翻訳を行なうため翻訳の質
を均一に保ち易いという利点が得られる。
さらに1部分的な翻訳処理を有限回適用する手段により
、任意の長さの入力文に対しても、有限回の翻訳処理を
施すことにより訳文を得ることが可能となる。
〔実施例〕
以下1本発明を実施例を参照して詳細く説明する。
一実施例として、英語から日本語への翻訳処理を行なう
翻訳処理装置について述べる。
第2図は、本発明の一実施例を示すブロック図を表す。
図中、10はディスプレイ装ffi、20はキーボード
等の入力装置、30はプロセッサ。
40は英和辞書ファイル、50は翻訳用メモリ。
60は部分翻訳用メモリをそれぞれ表している。
特に、翻訳用メモI750と部分翻訳用メモリ60は、
さらに、51の単語テーブル、52の解析・生成用テー
ブル、53の翻訳規則用テーブル。
54の入力文用テーブル、55の訳文用テーブル。
61の入力文更新テーブル、62の構文要素テーブル、
630部分翻訳対象文用テーブル、および。
64の部分翻訳結実用テーブルから構成される。
単語テーブル51には、入力英文中の単語について英和
辞書ファイル40゛から検索したデータが格納される。
解析・生成用テーブル52には、翻訳対象英文に対して
翻訳規則用テーブル53中の翻訳規則を適用して得られ
る解析木データや解析木データを変換して得られる訳文
生成用データが格納される。
次に1本発明による翻訳処理の流れを第1図に示される
フローに従って、第4図に示される具体的なテキストの
翻訳例を用いて説明する。
ディスプレイ装置10とキーボード20よシ翻訳したい
英文が入力される。この段階で入力英文は、入力文用テ
ーブル54に格納される。(第4因(a)) さらに、入力英文に対して、部分翻訳の範囲指定と当該
範囲に対する構文要素指定を行なうことが可能である。
指定方法としては、第4図(b)に示されるような特殊
記号すφで部分翻訳したい範囲を囲むことによシ実現で
き、範囲指定した場合、プロセッサ30が、当該部分に
対応する構文要素の入力を促すようにすればよい。第4
図(b)では。
部分翻訳の範囲指定を” by a thin 1ay
er ofinsulating materia1″
とし、  ” specifiedelement =
 ?”の入力要求に対して構文要素としでPNAL (
前置詞句)が入力された場合を示している。
指定可能な構文要素は、翻訳規則用テーブル53内の文
法規則で用いられる構文要素のサブセットであり、第3
図にその一例を示す。
入力された英文中に部分翻訳の範囲指定があるかどうか
チェックする。この処理は4.翻訳処理の対象文を抽出
するための処理であり、範囲指定があれば、(1041
の処理へ移る。一方、範囲指定がなければ、入力英文全
体が翻訳処理の対象となるため、(102)へ移って、
入力文全体を特殊記号ナナで囲み、さらに構文要素を8
ENTとして、(104)の処理へ移る。
範囲指定された部分の単語数をチェックし、その数がN
個以上あれば、(105)へ移り、ディスプレイ装[1
110に部分翻訳の範囲指定の再要求を促すメツセージ
を表示して、(101)の処理へ移る。N個より少なけ
れば(106)の処理へ移る。
ここで、el値Nの決定方法について説明する。
ツ一般に、単語テーブル51と解析・生成用テーブルに
割り当てられるメモリ領域は限られておシ。
格納可能な単語データ数Nwaおよび解析時に作成する
解析木の木構造データ用の配列数Ntは使用可能な個数
が限定される。さらにtNtとN。
は相関関係にある。従って、システム構築時に。
使用可能なメモリ容量からN、とN=を求めることがで
きるのでINwに1を加えたものを数値Nとすればよい
部分翻訳の範囲指定された部分を部分翻訳対象文用テー
ブル63にセットすると共に、対応する構文要素を構文
要素テーブル62にセットする。
さらに、入力文中の部分翻訳範囲指定された部分を対応
する構文要素記号で置換した後、入力文更新テーブル6
1・に格納する。その際、構文要素記号を他の単語と識
別可能とするために、先頭に特殊記号@を付与しておく
。具体例として、第4図(b)のごとく部分翻訳範囲と
構文要素の指定をした場合、第3図に示すように、入力
文更新テーブル61、構文要素テーブル621部分翻訳
対象文用テーブル63に各データがセットされる。
+107) 部分翻訳対象文用テーブル63のデータと構文要素テー
ブル62のデータに対して翻訳規則用テーブル53中の
文法規則を適用して翻訳処理を行なう。
ここで注意すべきことは1文法規則を適用する際に、翻
訳規則用テーブル53中に格納されている文法規則を必
ずしもすべて適用する必要はないことである。例えば、
構文要素によっては、NPやPNAL等に対応する文法
規則はかなシ限定される。従って、翻訳処理する際に、
入力文解析の最終目標となる構文要素を明確にすること
により。
適用文法規則を限定できると共に誤解析の少ない翻訳結
果を得やすくできる。この点は、常に構文要素が5EN
T (文)になることを最終目標とする従来の翻訳処理
方式とは大きく異なる。
なお、与えられた文を翻訳するという翻訳処理方式につ
いては、例えば、特開昭56−138586号(自然言
語間の自動翻訳方式)に開示された方式を用いることが
可能であり詳細説明は省略する。
上述の翻訳処理によって得られた翻訳結果は、部分翻訳
結実用テーブル64に格納される。(第3図参照) 入力文更新テーブル61中の英文と部分翻訳結実用テー
ブル64中の訳文をディスプレイ装置10に表示すると
共に、訳語の校正処理を可能とする。訳語の校正結果は
1部分翻訳結実用テーブル64中に格納される。
<1091 入力文更新テーブル61の内容が構文要素記号のみとな
れば、入力英文の翻訳が終了したことと等価なので1部
分翻訳結実用テーブル64のデータを訳文用テーブル5
5へ格納して、翻訳処理を終Tする。上記以外であれば
、構文要素テーブル62中の構文要素を単語と同一の扱
いとすべく。
単語テーブル51中に構文要素記号と対応する部分翻訳
結実用テーブル64中のデータをセットした後、(10
11へ移って、さらに翻訳処理を続行する。
以上が、−回の部分翻訳範囲指定した場合の翻訳処理の
流れであり、第4図の(a)→(b)→(C)に示され
るようにデータは推移していく。さらに1部分翻訳処理
を続行することによシ、第4図の(d)→(e)→げ)
→(g)→(h)→(i)K示されるように処理が推移
し、最終的には5ENT(文)に対応する翻訳結果が得
られる。
〔発明の効果〕
以上説明したごとく本発明によれば、a訳対象文に対し
て部分的に翻訳可能な部分を当該部分の構文要素と共に
明示して1部分翻訳を有限回縁シ返し適用して、最終的
に全文の訳を得る手段を具備することによシ、限られた
計算機資源のもとて任意の入力文を翻訳することが可能
となる。さらに、適用する翻訳文法規則を簡素化し、適
用文法規則を絞り込むことが可能となるため、結果的に
翻訳の質を高めることができるという利点が得られる。
このように、計算機資源の制約と翻訳の質向上というト
レード・オフを本発明により解消することが可能となる
本発明においては、英語から日本語への翻訳処理を一例
としてその実施例の説明をしたが他の言語間への翻訳処
理への適用も容易に類推できる。
【図面の簡単な説明】
第1図は本発明による一実施例を説明するだめの処理フ
ロー図、第2図は本発明の一実施例を示すブロック図、
第3図は本発明による一実施例を説明するだめの説明図
、第4図は本発明の一実施例による翻訳処理の適用例を
示す。 図中、10はディスプレイ装置、20はキーボード等の
人力装置、3Qはプロセッサ、40は英和辞書ファイル
、50は翻訳用メモリ、60は部分翻訳用メモリをそれ
ぞれ表している。特に、翻訳用メモIJ 50と部分翻
訳用メモIJ 60は、さらに、51の単語テーブル、
52の解析・生成用テーブル、53の翻訳規則用テーブ
ル、54の入力文用テーブル、55の訳文用テーブル、
61の入力文更新テーブル、62の構文要素テーブル、
63の部分翻訳対象文用テーブル、および、64YI 
l 図 fI 3 図 第4 図

Claims (1)

  1. 【特許請求の範囲】 1、第1言語から第2言語への翻訳処理装置において、
    第1言語で表わされるテキスト中に、テキストの部分集
    合として構文要素となる部分を範囲指定し、かつ当該部
    分の構文要素を指定する手段と、該範囲指定された部分
    に対して文法規則の適用目標を当該部分の構文要素とみ
    なし翻訳処理を施して第2言語の訳文を得る手段と、該
    構文要素の訳を前記手段で得た訳文とする手段とを有す
    ることを特徴とする翻訳処理方式。 2、前記テキスト中の範囲指定された部分を対応する構
    文要素の識別記号に置換し、上記の各手段を入力された
    テキストに対して有限回適用制御する手段を有する第1
    項記載の翻訳処理方式。
JP61097926A 1986-04-30 1986-04-30 翻訳処理方式 Pending JPS62256080A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61097926A JPS62256080A (ja) 1986-04-30 1986-04-30 翻訳処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61097926A JPS62256080A (ja) 1986-04-30 1986-04-30 翻訳処理方式

Publications (1)

Publication Number Publication Date
JPS62256080A true JPS62256080A (ja) 1987-11-07

Family

ID=14205284

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61097926A Pending JPS62256080A (ja) 1986-04-30 1986-04-30 翻訳処理方式

Country Status (1)

Country Link
JP (1) JPS62256080A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62272360A (ja) * 1986-05-20 1987-11-26 Sharp Corp 機械翻訳装置
JPH01194071A (ja) * 1988-01-29 1989-08-04 Ricoh Co Ltd 機械翻訳方法
JPH08161337A (ja) * 1994-12-02 1996-06-21 Nec Corp 文章変換装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62272360A (ja) * 1986-05-20 1987-11-26 Sharp Corp 機械翻訳装置
JPH01194071A (ja) * 1988-01-29 1989-08-04 Ricoh Co Ltd 機械翻訳方法
JPH08161337A (ja) * 1994-12-02 1996-06-21 Nec Corp 文章変換装置

Similar Documents

Publication Publication Date Title
US5895446A (en) Pattern-based translation method and system
US6778949B2 (en) Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures
JP3189186B2 (ja) パターンに基づく翻訳装置
EP0176858B1 (en) Translation system
US20080306727A1 (en) Hybrid Machine Translation System
US4833611A (en) Machine translation system
JPH0335354A (ja) 機械翻訳装置における略称付き固有名詞処理方法
JP2017199363A (ja) 機械翻訳装置及び機械翻訳のためのコンピュータプログラム
EP0357344B1 (en) Computer assisted language translating machine
JPH0351022B2 (ja)
JPS62256080A (ja) 翻訳処理方式
JPH03222065A (ja) 機械翻訳装置
JP2715419B2 (ja) 翻訳装置
KR100204068B1 (ko) 개념기반 다국어 번역시스템의 문법 자동수정 방법
JPH0715691B2 (ja) 自動翻訳装置
JPH0561902A (ja) 機械翻訳システム
Bansal et al. Context-based Machine Translation of English-Hindi using CE-Encoder
JPS63168774A (ja) 機械翻訳システムにおける主語の補足方式
JP2744430B2 (ja) 自然言語処理装置
JPS61260367A (ja) 機械翻訳システム
JPH0421167A (ja) 機械翻訳装置
JPH0652219A (ja) 機械翻訳方法および例文検索方法
RU2021138713A (ru) Способ и сервер для выполнения контекстно-зависимого перевода
CN111443979A (zh) 文档处理方法、装置、计算机设备及存储介质
JPH10198676A (ja) 日本語形態素解析装置及び日本語形態素解析方法