JP2875927B2 - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JP2875927B2
JP2875927B2 JP4179883A JP17988392A JP2875927B2 JP 2875927 B2 JP2875927 B2 JP 2875927B2 JP 4179883 A JP4179883 A JP 4179883A JP 17988392 A JP17988392 A JP 17988392A JP 2875927 B2 JP2875927 B2 JP 2875927B2
Authority
JP
Japan
Prior art keywords
buffer
symbol
character
sentence
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4179883A
Other languages
English (en)
Other versions
JPH0628397A (ja
Inventor
毅 九津見
徳行 平井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP4179883A priority Critical patent/JP2875927B2/ja
Publication of JPH0628397A publication Critical patent/JPH0628397A/ja
Application granted granted Critical
Publication of JP2875927B2 publication Critical patent/JP2875927B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、翻訳の際にユーザが予
め原文に前編集処理を施すことによって翻訳の効率や精
度を高めることができる機械翻訳装置に関し、特に、そ
の翻訳後の処理の改良に関する。
【0002】
【従来の技術】従来の一般的機械翻訳装置は、ソース言
語のテキストを入力するためのキーボードと、入力され
たソース言語のテキストをターゲット言語に翻訳するた
めの翻訳モジュールと、翻訳モジュールによる翻訳の際
に用いられるメイン辞書やユーザ辞書からなる辞書、文
法規則および木構造変換規則などを格納するためのメモ
リと、これら各部分の動作の制御を行なうためのメイン
CPU(中央演算処理装置)とを含む。
【0003】キーボードから入力されたソース言語のテ
キストは、メインCPUの制御により翻訳モジュールに
入力される。入力されたソース言語のテキストは、メイ
ン辞書やユーザ辞書からなる辞書、文法規則および木構
造変換規則を利用することにより、翻訳モジュールによ
ってターゲット言語に翻訳される。
【0004】このような機械翻訳装置では、形態素解析
の結果得られた品詞から、辞書と文法規則とを用いて構
文解析を行なう場合、あらゆる可能な構文構造を組立て
るようになっている。したがって複数の構文構造に応じ
て複数の翻訳結果が出力される。そのため、この複数の
翻訳結果のうちどれが正しい翻訳結果であるかをユーザ
が選択する必要があった、また、考えられるあらゆる構
文構造を組立てるために、構文解析に長時間を要すると
いう問題点があった。これらの問題点は、原文の構造が
単純なものではなく、複雑で解釈に曖昧性があるために
生ずる。
【0005】このような問題を減少させるために、翻訳
に先立って入力原文に前編集処理を施すことが提案され
ている。前編集処理には、「前編集記号」が利用され
る。前編集記号とは、通常の文章には用いられないよう
な特殊な文字・記号列である。何種類か用意されている
前編集記号を原文の文中に挿入することにより、挿入さ
れた位置および前編集記号の種類に従って、特定の単語
の品詞を指定したり、何種類かの構文解析が可能な構文
構造を特定の構造に指定したりすることができる。
【0006】このように前編集処理を施し、機械翻訳装
置ではこの前編集処理によって与えられる情報に基づき
翻訳を行なう。その結果、構文構造の候補が限定された
り、単語の品詞が明確に特定されたりするために、構文
解析の速度を速めることができる。また、翻訳結果の精
度も向上する。
【0007】
【発明が解決しようとする課題】前編集記号は、機械翻
訳のみに用いられる記号である。したがって翻訳が終れ
ば、原文に挿入された前編集記号は不要である。しか
し、原文中にはこの前編集記号が翻訳後にも残ってい
る。したがってたとえば翻訳後の原文を文として利用し
たい場合には、この前編集記号を文書編集機能(たとえ
ばエディタ)などを用いて1つ1つ見つけて手作業で削
除しなければならない。
【0008】それゆえにこの発明の目的は、機械翻訳に
先立って行なわれた前編集処理の前編集記号を含む文章
を、容易に文として利用することを可能にできる機械翻
訳装置を提供することである。
【0009】
【課題を解決するための手段】本発明に係る機械翻訳装
置は、自動翻訳の補助のための所定の記号を前処理とし
て挿入された前処理後入力原文を格納するための前処理
後入力原文格納手段と、前処理後入力原文を所定の記号
を翻訳の補助として用いながら他の言語に翻訳するため
の自動翻訳手段と、前処理後入力原文格納手段に格納さ
れた前処理後入力原文から所定の記号を除去した文を生
成するための前処理記号除去手段とを含む。
【0010】
【作用】本発明に係る機械翻訳装置では、前処理のため
の所定の記号を含む入力原文が自動翻訳手段によって他
の言語に翻訳される。そして翻訳処理後の前処理後入力
原文からは、前処理記号除去手段により、前処理のため
の所定の記号が除去された文が生成される。前処理後の
入力原文を、従来のように文書編集機能を用いて手作業
で訂正して前処理のための記号を除去する必要はない。
【0011】
【実施例】図1は、本発明の機械翻訳装置の一実施例の
ブロック図である。図1を参照して機械翻訳装置は、メ
インCPU1と、メインCPU1が接続されたバス8と
を含む。さらに、以下の各装置もバス8に接続されてい
る。すなわち、この機械翻訳装置はさらに、メインメモ
リ2と、CRT(カソード・レイ・チューブ)などから
なる表示装置3と、キーボード4と、翻訳処理を行なう
ための翻訳モジュール5と、翻訳結果などを必要であれ
ば出力するためのプリント7とを含む。翻訳モジュール
5には、翻訳の際に用いられる辞書、文法規則、木構造
変換規則などを格納したメモリ6が接続されている。
【0012】以下で説明する前編集記号の一括削除の処
理は、メインCPU1で実行されるプログラムにより行
なわれる。メインメモリ2には、このプログラムの実行
のために必要なバッファが割当てられる。
【0013】キーボード4から入力されたソース言語の
テキストはメインCPU1の制御により翻訳モジュール
5に送られる。翻訳モジュール5は、メモリ6に記憶さ
れている辞書、文法規則および木構造変換規則などを用
いて、入力されたソース言語のテキストをターゲット言
語に翻訳する。その結果はメインメモリ2に一旦記憶さ
れる。翻訳結果はまた表示装置3にも表示される。必要
であれば翻訳結果はプリンタ7によって紙片に印字され
る。メインメモリ2は、各種プログラム実行中のレジス
タメモリおよび表示バッファなどにも利用される。
【0014】この場合、前編集処理を行なうために、入
力されたソース言語のテキストはメインメモリ2に一旦
記憶される。そしてメインCPU1によって制御される
エディタプログラムなどの編集処理機能を用い、テキス
ト中に前編集記号が挿入される。この挿入はキーボード
4および表示装置3を用いて行なわれる。このように前
編集処理を行なったテキストを翻訳モジュール5で翻訳
する場合、前述したように翻訳の効率が向上し、その精
度も向上する。
【0015】以下、説明のためにテキスト原文を英語の
文章とし、これを日本語に翻訳する際を想定して、この
発明による前編集後の入力原文からの前編集記号の一括
削除の動作を説明する。なおこの処理は、メインCPU
1で実行されるプログラムにより行なわれる。
【0016】図2〜図4は、前編集記号一括削除処理の
フローチャートである。このフローチャートについて詳
細に説明する前に、図1に示される機械翻訳装置で用い
られる前編集記号の例について説明する。前編集記号
は、その形態上2種に大別される。第1の種類の前編集
記号は図5に示される。第2の種類の前編集記号は図6
に示される。
【0017】図5に示される前編集記号は、単語の先頭
に付けることにより、その単語を何らかの意味で修飾す
るためのものである。修飾の種別としては、図5に示さ
れるように品詞指定記号と、文型指定記号と、辞書指定
記号などがある。品詞指定記号とは、この記号に続く単
語の品詞を指定するためのものである。文型指定記号と
は、この記号の後に続く文の文型を指定するためのもの
である。辞書指定記号とは、この記号の後に続く単語の
辞書引き処理を行なう際の辞書を指定するためのもので
ある。
【0018】図5に示される記号は、いずれも末尾が
”であるという特徴を持つ。またこの記号の直後に
は単語が続く。すなわち、これらの記号の直後は空白で
はない。一方、これらの記号の直前は必ず空白である。
【0019】図6を参照して、第2の種類の前編集記号
は、その記号の前後を何らかの意味で区切るために用い
られるものである。すなわちこれらの記号は単語と単語
との間に挿入される。本実施例の場合にはこの第2番目
の種類の前編集記号は、括弧類を表わす同一の記号を2
個重ねたものとなっている。なお、図6に示される例で
は“//”も含まれているが、これも一括して括弧類と
呼ぶものとする。
【0020】この第2の種類の前編集記号の場合、テキ
スト中に挿入されたこれらの記号の直前および直後は原
則として空白である。しかし場合によってはそれらの空
白が設けられない場合もある。すなわち、前編集記号の
直前・直後に単語を構成する文字が存在する場合もあり
得る。
【0021】以上ような前編集記号を用いて前編集処理
を行なった入力原文を翻訳する処理につき、その概略を
説明する。最初に、翻訳すべき原文が読込まれる。読込
まれた英語の文章は、図7に示されるようにバッファS
1に格納される。このバッファS1には、図1に示され
るメインメモリ2の一部が割当てられる。
【0022】バッファS1に格納された英語の文には、
前編集処理が施される。前編集処理はユーザにより行な
われる。もちろんこの前編集処理は、必要な場合のみ行
なわれる。
【0023】前編集処理が施された英文の例が図7に示
される。図7を参照して、第1文に用いられた前編集記
号“v3 ”は、図5の文型指定記号の第3番目に相当
する。すなわちこの記号は、図7に示される第1文の動
詞“called”によって統括されるこの第1文全体
が第3文型であることを指定している。
【0024】また第2文に用いられた前編集記号“<
<”および“>>”は、それぞれ図6に示されるように
フレーズ指定開始記号、フレーズ指定終了記号である。
この2種類の記号よって挟まれた部分は、翻訳の際の構
文解析において一まとまりのものとして取扱われる。
【0025】このように入力原文に前編集記号を挿入す
ることにより翻訳処理の効率が向上し精度も向上するこ
とについては前に述べたとおりである。本発明は、翻訳
後の、前編集処理された入力テキストから前編集記号を
簡単に削除できる点に特徴がある。以下、前編集記号の
削除処理について説明する。
【0026】図2を参照して、まずステップS001
で、前編集記号の挿入された文がバッファS1に格納さ
れる。格納した結果は図7に示されるとおりである。な
お、バッファS1に格納された入力テキストは、現在の
説明では翻訳直後のものと想定されている。しかし、翻
訳直後である必要はなく、過去に翻訳した文章の原文が
別途保存されていた場合に、その保存されていた文章を
バッファS1に格納して以後の前編集記号の削除処理を
行なうことも可能である。また翻訳が行なわれていない
文章を一旦バッファS1に格納し、前編集処理後に翻訳
文を生成し、残っている原文に対して翻訳処理直後に前
編集記号の削除を行なうことも可能である。
【0027】続いてステップS002で、バッファS1
の、現在の処理対象の文字位置を示すポインタが0にセ
ットされる。これによりポインタの指す文字はバッファ
S1に格納された文章の先頭の文字「H」となる。
【0028】さらにステップS003では、バッファS
2の内容がクリアされる。バッファS2は、バッファS
1に格納された入力原文から前編集記号を除去した文を
一旦格納するのに用いられるものである。このバッファ
S2にも、図1に示されるメインメモリ2が割当てられ
る。
【0029】ステップS004では、バッファS2の、
文字書込位置を示すポインタがバッファS2の先頭を指
すように0にセットされる。
【0030】ステップS005では、バッファWがクリ
アされる。バッファWは、原文から切出した文字列を単
語単位で一時的に格納するのにあてられる作業バッファ
である。バッファWにも、図1に示されるメインメモリ
2が割当てられる。
【0031】ステップS006では、バッファWの文字
位置ポインタが0にセットされる。これによりバッファ
Wへの文字の書込位置はその先頭となる。
【0032】以上で、原文の文字列を検査するための準
備が完了する。
【0033】ステップS007から実際の文字列検査が
開始される。まずステップS007で、バッファS1の
文字位置ポインタが指している文字が検査される。その
文字が空白か括弧類であれば処理はステップS021に
進む。さもなければ処理はステップS008に進む。
【0034】図7に示される文章を処理する場合には、
文字位置ポインタが当初指している位置0の文字は
「H」である。したがって、この場合処理はステップS
008に進むことになる。
【0035】なお、本実施例では前述したように「括弧
類」という語は、図8に示される9種類の記号文字を指
すものとする。この場合記号「/」も含まれていること
に注意すべきである。
【0036】ステップS021〜S024の処理につい
ては後述する。
【0037】ステップS008では、バッファS1の文
字位置ポインタが指す位置の文字が、バッファWの、文
字位置ポインタの指している位置にコピーされる。
【0038】図7に示される例の場合では、バッファS
1の文字「H」が、バッファWの先頭位置にコピーされ
る。
【0039】続いてステップS009で、バッファWの
文字位置ポインタが1加算される。
【0040】図3を参照して、ステップS010で、バ
ッファS1の文字位置ポインタが指している文字が「
」であるか否かが判定される。すなわちこの場合、ス
テップS008でバッファS1からバッファWにコピー
した文字が「 」であるか否かが判定される。判定の結
果がYESであれば処理はステップS020に、さもな
ければ処理はステップS011に進む。ステップS02
0以下の処理については後述する。文字「 」は、図5
に示される第1の種類の前編集記号の末尾に必ず用いら
れている文字である。したがってバッファS1の文字列
中にこの文字が検出された場合には、その位置に前編集
記号が存在する可能性が高いと考えられる。
【0041】図7に示される例の場合にはバッファS1
の現在の文字位置ポインタが指している文字は「H」で
あるので、処理はステップS011に進む。
【0042】ステップS011では、バッファS1の文
字位置ポインタが1進められる。その結果、バッファS
1の文字位置ポインタが指している文字は「e」とな
る。
【0043】ステップS012では、バッファS1の文
字位置ポインタ以降に文字が存在するかどうかについて
の判断が行なわれる。文字が存在しないと判断されれば
前編集記号削除機能はこれで終了する。すなわち処理は
ステップS027に進み、バッファW内の文字列を、バ
ッファS2内の、現在のポインタ1以降にコピーする処
理が行なわれ、全体の処理が終了する。バッファS1に
次の文字がある場合には処理はステップS013に進
む。
【0044】図7に示される英文の場合、バッファS1
の文字位置ポインタが指している位置には文字「e」が
存在する。したがって、ステップS012における判断
の結果はYESとなり、処理はステップS013に進
む。
【0045】ステップS013では、バッファS1の文
字位置ポインタが指している文字が空白か括弧類である
かどうかについての判断が行なわれる。空白または括弧
類である場合には処理はステップS014に、さもなけ
れば処理は図2のステップS008に戻る。
【0046】バッファS1の文字位置ポインタが指して
いる文字がもし空白であればその箇所は単語の切目であ
ると考えられる。文字が括弧類であれば図6に示される
前編集記号がその箇所に存在する可能性がある。もしそ
うであればその箇所は単語の切目でもある。
【0047】図7に示される例文の場合には、文字位置
ポインタが指している文字は「e」である。したがって
ステップS013における判断の答えはNOとなり処理
は図2のステップS008に戻る。
【0048】以下同様に、バッファS1の文字位置ポイ
ンタが指している文字「e」につき、図2のステップS
008、S009、図3のステップS010、S01
1、S012が順に実行される。その結果文字「e」が
バッファWに追加される。
【0049】処理がステップS013に進んだ場合を考
える。この時点ではバッファWの内部には図9に示され
るように文字列「He」が格納されている。バッファS
1の文字位置ポインタが指している文字は、図7を参照
して、「e」の次の空白位置である。したがって、ステ
ップS013での判定の結果、処理はステップS014
に進む。
【0050】ステップS014では、バッファS1の文
字位置ポインタが指している文字が空白であるかどうか
についての判断が行なわれる。空白であれば処理は図4
のステップS015に進み、それ以外の場合(すなわち
括弧類である場合)には処理はステップS025に進
む。
【0051】図7に示される例文の場合にはバッファS
1の文字位置ポインタによって指し示される文字は空白
である。したがって処理はステップS015(図4参
照)に進む。
【0052】ステップS015まで処理が進んだ場合、
バッファS1の文字位置ポインタが1つの単語を完全に
通過したことになる。この間単語の各文字はバッファW
に順次コピーされている。したがってバッファWに格納
されている文字列は1つの完全な単語である。ステップ
S015では、このバッファWに格納されている文字列
をバッファS2の文字位置ポインタの指す位置以降にコ
ピーする処理が行なわれる。この結果、バッファS2の
内部の先頭には図10に示されるように単語「He」が
コピーされる。
【0053】次のステップS016では、バッファS2
の文字位置ポインタをバッファWの文字数分だけ進める
処理が行なわれる。これにより文字位置ポインタはコピ
ーされた文字の次の位置を指し示すことになる。
【0054】図7に示される例文の処理の場合、現在処
理対象となっている単語「He」は2文字の単語であ
る。したがってS016の処理によりバッファS2の文
字位置ポインタが2進められる。この結果、図10に示
されるバッファS2の文字位置ポインタは文字「e」の
次の位置を指し示す。
【0055】次のステップS017では、バッファS2
の文字位置ポインタが指している位置に空白をセットす
る処理が行なわれる。これは、バッファS2のおいて単
語の切目を生成するための処理である。
【0056】ステップS018では、挿入された空白の
分だけバッファS2のポインタを進める処理が行なわれ
る。すなわちバッファS2の文字位置ポインタが1加算
される。同様にしてステップS019ではバッファS1
の文字位置ポインタも1加算される。ステップS019
の後処理は図2のステップS005に戻る。
【0057】ステップS005では、バッファWがクリ
アされ、ステップS006ではバッファWの文字位置ポ
インタが0にセットされる。このようにバッファWをク
リアするのは、処理中の単語「He」をバッファS2に
コピーする処理が完了し、バッファWに格納されている
単語はもはや不要となったためである。
【0058】以上、バッファS1に格納されている文中
の単語「He」を例にとり、前編集記号の付いていない
単語についてバッファS1からバッファS2にコピーを
行なう手順を示した。上述の説明から明らかなように、
前編集記号の付いていない単語は、図10に示されるよ
うにバッファS1からバッファS2にそのままの形でコ
ピーされる。
【0059】図5に示される第1の種類の前編集記号の
ある箇所は、次のようにして処理される。図7に示され
る例文の「He」の次の単語「v3 called」に
は、図5に示される第1の種類の前編集記号「v3
が付いている。以下、「v3 called」に対する処
理を例にとり、図5に示される第1の種類の前編集記号
が付加された単語についての処理を説明する。
【0060】「He」のコピーが終了した時点で、処理
はステップS007にある。バッファS1の文字位置ポ
インタは「v3 called」の「v」を指してい
る。バッファWの内部には文字は存在しない。バッファ
Wの文字位置ポインタはバッファWの先頭を指してい
る。バッファS2の内容は図10に示されるとおりであ
る。なお、単語「He」の次には空白文字が1個存在す
る。そしてバッファS2の文字位置ポインタは、その空
白の次の位置を指している。
【0061】図2を参照して、ステップS007で、バ
ッファS1の現在の文字位置ポインタが指している文字
は空白ではない。したがって処理はステップS008に
進む。以下、ステップS008、S009、図3のステ
ップS010、S011、S012、S013、図2の
ステップS008のループを2回回ることにより、文字
列「v3」がバッファWにコピーされる。バッファS1
の文字位置ポインタは「v3」の次の「 」を指してい
る。
【0062】そしてステップS008、S009の処理
により、文字「 」がバッファWに追加される。この結
果、バッファWの格納内容は図11に示されるとおりと
なる。図3を参照して、ステップS010では、バッフ
ァS1の文字位置ポインタが指している文字が「 」で
あるので判断の答えはYESとなり処理はS020に進
む。
【0063】S020ではバッファWの内容が図5に示
される前編集記号のいずれかと一致しているか否かにつ
いての判断が行なわれる。いずれとも一致していない場
合には処理はステップS011に進む。この場合の文字
」は前編集記号とは関係ない単語の一部であると判
断されるためである。またバッファW内の文字列が前編
集記号のいずれかと一致する場合には処理はステップS
028に進む。
【0064】図7に示される例文の場合には、バッファ
Wの内容は図11に示されるように文字列「v3 」で
ある。図5からわかるようにこれは前編集記号の一種で
ある。したがって、ステップS020における判断の結
果はYESとなり処理はステップS028に進む。
【0065】ステップS028では、バッファS1の文
字位置ポインタが1進められる。これによりバッファS
1の文字位置ポインタによって示される文字は「c」と
なる。ステップS028の後処理はステップS005に
戻る。
【0066】再びステップS005、S006によって
バッファWがクリアされる。バッファWに格納されてい
た単語は前編集記号であるために、バッファS2にコピ
ーする必要はなく、さらに処理をこの前編集記号の次の
単語に進める必要があるからである。
【0067】以下、再び図7を参照して、バッファS1
の現在の文字位置ポインタが指している文字は「c」で
ある。したがって図2を参照して、処理はステップS0
07からS008に進む。さらにステップS008〜S
013→S008のループを6回繰り返して実行するこ
とにより、バッファS1内の文字列「called」が
バッファWにコピーされる。このときバッファS1の文
字位置ポインタは「called」の次の空白を指す。
【0068】さらに、ステップS008〜S015と処
理が進む。これにより、図12に示されるようにバッフ
ァWに格納されている単語「called」がバッファ
S2に追加される。
【0069】さらにステップS016〜S018の処理
によりバッファS2にさらに空白文字が追加される。こ
れによりバッファS2の内容は図13に示されるように
なる。
【0070】さらに図4に示されるステップS019の
処理によって、バッファS1の文字位置ポインタは「c
alled」の次の空白の次の文字「h」を指するよう
になる。さらに図2に示されるステップS005、S0
06に処理が戻り、バッファWがクリアされる。
【0071】以上の処理によりバッファSに格納されて
いる前編集記号付きの単語「v3 called」は、前
編集記号の除去された単語「called」となってバ
ッファS2にコピーされる。バッファS2の内容は図1
3に示されている。
【0072】図7に示される例文の場合、「bough
t」までの部分には前編集記号が存在しない。したがっ
て、この間のそれぞれの単語の処理は前述した「He」
の単語の処理と同様に行なわれる。単語「bough
t」までの処理が終了した段階では、バッファS2の格
納内容は図14に示されるようになっている。
【0073】図7を参照して、単語「bought」と
その次の単語「necklaces」との間には前編集
記号「<<」が存在する。以下、この前編集記号「<
<」の処理を例にとり、図6に示される第2の種類の前
編集記号に対する処理を説明する。
【0074】図7に示される例文の単語「bough
t」までの処理が終了した段階で、処理ステップは図2
のステップS007となっている。バッファS1の文字
位置ポインタは前編集記号「<<」のうちの左側の
「<」を指す。バッファWの内容はクリアされており、
その文字位置ポインタはバッファWの先頭を指してい
る。バッファS2の内容は図14に示されるとおりであ
る。図14において、単語「bought」の次には空
白文字が1個存在する。文字位置ポインタはその空白の
次の位置を指している。
【0075】前編集記号「<<」の処理において、ステ
ップS007(図2参照)で、判断の結果はYESとな
る。したがって処理はステップS021に進む。
【0076】ステップS021では、バッファS1のポ
インタが指している文字が空白であるか否かについての
判断が行なわれる。空白である場合には処理はステップ
S022に進む。空白でない場合、すなわち括弧類であ
る場合には処理はステップS023に進む。
【0077】現在の状態ではポインタの指す文字は
「<」であるため処理はステップS023に進む。
【0078】ステップS023では、次の文字が同じ文
字、すなわち現在の場合「<」であるかどうかについて
の判断が行なわれる。同じでない場合には処理はステッ
プS008に、同じ場合には処理はステップS024に
進むるステップS023の処理は次の理由により行なわ
れる。同じ括弧類であっても前編集記号として使われる
場合には同じ括弧類が2個使用される。もし括弧類が単
独で存在するならばそれは文章中の記号としての単なる
括弧であると考えられる。ステップS023では、した
がって同じ括弧類が2つ続いて発生する場合のみ処理を
ステップS024に進ませ、それ以外の場合には通常の
場合と同様にステップS008に進ませる。
【0079】ステップS024では、バッファS1の文
字位置ポインタが2進められる。これは、括弧類を用い
た前編集記号の場合には、2つの括弧類で1組として使
用されているからである。ステップS024の処理の結
果、バッファS1の文字位置ポインタは「<」の次の空
白を指すことになる。ステップS024の後処理はステ
ップS007に戻る。
【0080】ステップS007では、バッファS1の1
ポインタが指す文字が再び検査される。そして空白、括
弧類であれば処理はステップS021、それ以外の場合
には処理はステップS008に進む。
【0081】図7に示される例文の場合にはポインタの
指す文字は空白である。したがって、この場合処理はス
テップS021に、さらにステップS022に進む。そ
してステップS022ではバッファS1のポインタが1
進められる。その結果、バッファS1の文字位置ポイン
タは単語「necklaces」の先頭文字「n」を指
す。
【0082】以上の処理により、バッファS1に存在す
る前編集記号「<<」をバッファWはバッファS2にコ
ピーすることなく、バッファS1の文字位置ポインタが
この前編集記号「<<」を通過する。前編集記号「<
<」がバッファS2にコピーされることはない。
【0083】図7に示される例文の場合、次の単語「n
ecklaces」の処理は単語「He」の処理と同様
に行なわれる。この結果、バッファS2の格納内容は図
15に示されるとおりとなる。バッファS1の単語「b
ought」と「necklaces」との間に存在す
る前編集記号「<<」は、バッファS2の文中には存在
しない。
【0084】以下、図7に示される単語「of」以後の
処理は、以上の方法を順次適用することによって可能で
ある。
【0085】最後の単語「silver.」の処理が終
了した時点を考える。バッファS1の文字位置ポインタ
は「silver.」の末尾の「.」を指している。バ
ッファWに文字列「silver.」が格納されてい
る。この時点では、処理は図2のステップS009であ
る。ステップS009から図3のステップS010、S
011、S012と処理が進む。ステップS012にお
ける判断では、「.」の次の文字はもはや存在しないた
めに、処理はステップS027に進むことになる。
【0086】ステップS027では、既に説明したよう
にバッファWの内容「silver.」をバッファS2
に追加する。これによりバッファS2の内容が完成し、
全体の処理は終了する。
【0087】以上の処理が終了した時点でバッファS2
の格納内容は図16に示されるとおりとなる。図7に示
される例文のうち、図5、図6に示される前編集記号は
完全に除去されている。
【0088】なお、図3に示されるフローチャートのう
ち、ステップS014、S025、S026の処理は、
図2に示されるステップS021、S023、S024
の処理と全く同じである。このようにステップS014
以下の処理を設けているのは次のような理由による。既
に説明したように図6に示される第1の種類の前編集記
号の場合、その前後に空白が存在しない場合があり得
る。そのような場合、ステップS021、S023、S
024の処理では対応することができない。そのため
に、ステップS013の時点から、図6に示される第2
の種類の前編集記号に対する処理をする手順としてこの
ステップS014、S025、S026のルーチンが設
けられている。
【0089】以上のように本発明の機械翻訳装置では、
前編集処理がされた入力テキストのうち、前編集記号の
みを取除いた原文が自動的に生成される。従来のように
ユーザが文書編集機能を用いて前編集記号を1つずつ探
索して手作業で削除していく必要はない。そのため、翻
訳後の文書を効率よく利用することができる。
【0090】
【発明の効果】以上のように本発明の機械翻訳装置で
は、前処理後入力原文から、前編集のための所定の記号
を除去した分が前編集記号除去手段によって生成され
る。前編集記号を手作業によって1つずつ探索し、除去
していく必要はない。
【0091】その結果、翻訳のための前処理がされた入
力原文の文章を、容易に文として利用することができ
る。
【図面の簡単な説明】
【図1】本発明の一実施例の機械翻訳装置のブロック図
である。
【図2】前編集記号除去処理の前半のフローチャートで
ある。
【図3】前編集記号除去処理の中間のフローチャートで
ある。
【図4】前編集記号除去処理の後半のフローチャートで
ある。
【図5】第1の種類の前編集記号を表形式で示す図であ
る。
【図6】第2の種類の前編集記号を表形式で示す図であ
る。
【図7】バッファS1の格納内容を示す模式図である。
【図8】括弧類を示す模式図である。
【図9】バッファWの内容を示す模式図である。
【図10】バッファS2の模式図である。
【図11】バッファWの模式図である。
【図12】バッファWの模式図である。
【図13】バッファS2の模式図である。
【図14】バッファS2の模式図である。
【図15】バッファS2の模式図である。
【図16】バッファS2の模式図である。
【符号の説明】
1 メインCPU 2 メインメモリ 3 表示装置 4 キーボード 5 翻訳モジュール 6 メモリ 7 プリンタ

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 自動翻訳の補助のための所定の記号を前
    処理として挿入された前処理後入力原文を格納するため
    の前処理後入力原文格納手段と、 前記前処理後入力原文を、前記所定の記号を翻訳の補助
    として用いながら他の言語に翻訳するための自動翻訳手
    段と、 前記前処理後入力原文格納手段に格納された前記前処理
    後入力原文から前記所定の記号を除去した文を生成する
    ための前処理記号除去手段とを含む、機械翻訳装置。
JP4179883A 1992-07-07 1992-07-07 機械翻訳装置 Expired - Lifetime JP2875927B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4179883A JP2875927B2 (ja) 1992-07-07 1992-07-07 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4179883A JP2875927B2 (ja) 1992-07-07 1992-07-07 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH0628397A JPH0628397A (ja) 1994-02-04
JP2875927B2 true JP2875927B2 (ja) 1999-03-31

Family

ID=16073570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4179883A Expired - Lifetime JP2875927B2 (ja) 1992-07-07 1992-07-07 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP2875927B2 (ja)

Also Published As

Publication number Publication date
JPH0628397A (ja) 1994-02-04

Similar Documents

Publication Publication Date Title
US5373441A (en) Automatic translating apparatus and a method thereof
JPH07210555A (ja) 言語解析方法及びその装置
JP2765665B2 (ja) タイポグラフィカル情報付き文書の翻訳装置
JPH0567144A (ja) 前編集支援方法およびその装置
JP2773652B2 (ja) 機械翻訳装置
JPH0658676B2 (ja) 多品詞訳語の校正方法
JPH0351022B2 (ja)
JP2875927B2 (ja) 機械翻訳装置
JP3387437B2 (ja) 機械翻訳校正装置
KR100204068B1 (ko) 개념기반 다국어 번역시스템의 문법 자동수정 방법
JPS62163174A (ja) 機械翻訳装置
JPH08190561A (ja) 文書修正装置
JPH07319879A (ja) 翻訳処理装置
JP2880600B2 (ja) 単語列翻訳装置
JPH07122876B2 (ja) 機械翻訳装置
JPH03127264A (ja) 括弧付き文の機械翻訳方式
JP2744430B2 (ja) 自然言語処理装置
JPH0550778B2 (ja)
Carter et al. Simplifying deterministic parsing
JPH06348465A (ja) プログラム作成支援装置
JP2001125907A (ja) 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体
JP2007080117A (ja) 依存構造情報処理装置、依存構造情報処理方法、そのプログラム及び記録媒体
JPS6244872A (ja) 機械翻訳装置
JPS6244876A (ja) 機械翻訳装置
JPS58217081A (ja) 日英機械翻訳処理方式

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990105