JP2875927B2

JP2875927B2 - 機械翻訳装置

Info

Publication number: JP2875927B2
Application number: JP4179883A
Authority: JP
Inventors: 毅九津見; 徳行平井
Original assignee: Consejo Superior de Investigaciones Cientificas CSIC
Current assignee: Consejo Superior de Investigaciones Cientificas CSIC
Priority date: 1992-07-07
Filing date: 1992-07-07
Publication date: 1999-03-31
Anticipated expiration: 2014-03-31
Also published as: JPH0628397A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、翻訳の際にユーザが予
め原文に前編集処理を施すことによって翻訳の効率や精
度を高めることができる機械翻訳装置に関し、特に、そ
の翻訳後の処理の改良に関する。

【０００２】

【従来の技術】従来の一般的機械翻訳装置は、ソース言
語のテキストを入力するためのキーボードと、入力され
たソース言語のテキストをターゲット言語に翻訳するた
めの翻訳モジュールと、翻訳モジュールによる翻訳の際
に用いられるメイン辞書やユーザ辞書からなる辞書、文
法規則および木構造変換規則などを格納するためのメモ
リと、これら各部分の動作の制御を行なうためのメイン
ＣＰＵ（中央演算処理装置）とを含む。

【０００３】キーボードから入力されたソース言語のテ
キストは、メインＣＰＵの制御により翻訳モジュールに
入力される。入力されたソース言語のテキストは、メイ
ン辞書やユーザ辞書からなる辞書、文法規則および木構
造変換規則を利用することにより、翻訳モジュールによ
ってターゲット言語に翻訳される。

【０００４】このような機械翻訳装置では、形態素解析
の結果得られた品詞から、辞書と文法規則とを用いて構
文解析を行なう場合、あらゆる可能な構文構造を組立て
るようになっている。したがって複数の構文構造に応じ
て複数の翻訳結果が出力される。そのため、この複数の
翻訳結果のうちどれが正しい翻訳結果であるかをユーザ
が選択する必要があった、また、考えられるあらゆる構
文構造を組立てるために、構文解析に長時間を要すると
いう問題点があった。これらの問題点は、原文の構造が
単純なものではなく、複雑で解釈に曖昧性があるために
生ずる。

【０００５】このような問題を減少させるために、翻訳
に先立って入力原文に前編集処理を施すことが提案され
ている。前編集処理には、「前編集記号」が利用され
る。前編集記号とは、通常の文章には用いられないよう
な特殊な文字・記号列である。何種類か用意されている
前編集記号を原文の文中に挿入することにより、挿入さ
れた位置および前編集記号の種類に従って、特定の単語
の品詞を指定したり、何種類かの構文解析が可能な構文
構造を特定の構造に指定したりすることができる。

【０００６】このように前編集処理を施し、機械翻訳装
置ではこの前編集処理によって与えられる情報に基づき
翻訳を行なう。その結果、構文構造の候補が限定された
り、単語の品詞が明確に特定されたりするために、構文
解析の速度を速めることができる。また、翻訳結果の精
度も向上する。

【０００７】

【発明が解決しようとする課題】前編集記号は、機械翻
訳のみに用いられる記号である。したがって翻訳が終れ
ば、原文に挿入された前編集記号は不要である。しか
し、原文中にはこの前編集記号が翻訳後にも残ってい
る。したがってたとえば翻訳後の原文を文として利用し
たい場合には、この前編集記号を文書編集機能（たとえ
ばエディタ）などを用いて１つ１つ見つけて手作業で削
除しなければならない。

【０００８】それゆえにこの発明の目的は、機械翻訳に
先立って行なわれた前編集処理の前編集記号を含む文章
を、容易に文として利用することを可能にできる機械翻
訳装置を提供することである。

【０００９】

【課題を解決するための手段】本発明に係る機械翻訳装
置は、自動翻訳の補助のための所定の記号を前処理とし
て挿入された前処理後入力原文を格納するための前処理
後入力原文格納手段と、前処理後入力原文を所定の記号
を翻訳の補助として用いながら他の言語に翻訳するため
の自動翻訳手段と、前処理後入力原文格納手段に格納さ
れた前処理後入力原文から所定の記号を除去した文を生
成するための前処理記号除去手段とを含む。

【００１０】

【作用】本発明に係る機械翻訳装置では、前処理のため
の所定の記号を含む入力原文が自動翻訳手段によって他
の言語に翻訳される。そして翻訳処理後の前処理後入力
原文からは、前処理記号除去手段により、前処理のため
の所定の記号が除去された文が生成される。前処理後の
入力原文を、従来のように文書編集機能を用いて手作業
で訂正して前処理のための記号を除去する必要はない。

【００１１】

【実施例】図１は、本発明の機械翻訳装置の一実施例の
ブロック図である。図１を参照して機械翻訳装置は、メ
インＣＰＵ１と、メインＣＰＵ１が接続されたバス８と
を含む。さらに、以下の各装置もバス８に接続されてい
る。すなわち、この機械翻訳装置はさらに、メインメモ
リ２と、ＣＲＴ（カソード・レイ・チューブ）などから
なる表示装置３と、キーボード４と、翻訳処理を行なう
ための翻訳モジュール５と、翻訳結果などを必要であれ
ば出力するためのプリント７とを含む。翻訳モジュール
５には、翻訳の際に用いられる辞書、文法規則、木構造
変換規則などを格納したメモリ６が接続されている。

【００１２】以下で説明する前編集記号の一括削除の処
理は、メインＣＰＵ１で実行されるプログラムにより行
なわれる。メインメモリ２には、このプログラムの実行
のために必要なバッファが割当てられる。

【００１３】キーボード４から入力されたソース言語の
テキストはメインＣＰＵ１の制御により翻訳モジュール
５に送られる。翻訳モジュール５は、メモリ６に記憶さ
れている辞書、文法規則および木構造変換規則などを用
いて、入力されたソース言語のテキストをターゲット言
語に翻訳する。その結果はメインメモリ２に一旦記憶さ
れる。翻訳結果はまた表示装置３にも表示される。必要
であれば翻訳結果はプリンタ７によって紙片に印字され
る。メインメモリ２は、各種プログラム実行中のレジス
タメモリおよび表示バッファなどにも利用される。

【００１４】この場合、前編集処理を行なうために、入
力されたソース言語のテキストはメインメモリ２に一旦
記憶される。そしてメインＣＰＵ１によって制御される
エディタプログラムなどの編集処理機能を用い、テキス
ト中に前編集記号が挿入される。この挿入はキーボード
４および表示装置３を用いて行なわれる。このように前
編集処理を行なったテキストを翻訳モジュール５で翻訳
する場合、前述したように翻訳の効率が向上し、その精
度も向上する。

【００１５】以下、説明のためにテキスト原文を英語の
文章とし、これを日本語に翻訳する際を想定して、この
発明による前編集後の入力原文からの前編集記号の一括
削除の動作を説明する。なおこの処理は、メインＣＰＵ
１で実行されるプログラムにより行なわれる。

【００１６】図２〜図４は、前編集記号一括削除処理の
フローチャートである。このフローチャートについて詳
細に説明する前に、図１に示される機械翻訳装置で用い
られる前編集記号の例について説明する。前編集記号
は、その形態上２種に大別される。第１の種類の前編集
記号は図５に示される。第２の種類の前編集記号は図６
に示される。

【００１７】図５に示される前編集記号は、単語の先頭
に付けることにより、その単語を何らかの意味で修飾す
るためのものである。修飾の種別としては、図５に示さ
れるように品詞指定記号と、文型指定記号と、辞書指定
記号などがある。品詞指定記号とは、この記号に続く単
語の品詞を指定するためのものである。文型指定記号と
は、この記号の後に続く文の文型を指定するためのもの
である。辞書指定記号とは、この記号の後に続く単語の
辞書引き処理を行なう際の辞書を指定するためのもので
ある。

【００１８】図５に示される記号は、いずれも末尾が
“ ”であるという特徴を持つ。またこの記号の直後に
は単語が続く。すなわち、これらの記号の直後は空白で
はない。一方、これらの記号の直前は必ず空白である。

【００１９】図６を参照して、第２の種類の前編集記号
は、その記号の前後を何らかの意味で区切るために用い
られるものである。すなわちこれらの記号は単語と単語
との間に挿入される。本実施例の場合にはこの第２番目
の種類の前編集記号は、括弧類を表わす同一の記号を２
個重ねたものとなっている。なお、図６に示される例で
は“／／”も含まれているが、これも一括して括弧類と
呼ぶものとする。

【００２０】この第２の種類の前編集記号の場合、テキ
スト中に挿入されたこれらの記号の直前および直後は原
則として空白である。しかし場合によってはそれらの空
白が設けられない場合もある。すなわち、前編集記号の
直前・直後に単語を構成する文字が存在する場合もあり
得る。

【００２１】以上ような前編集記号を用いて前編集処理
を行なった入力原文を翻訳する処理につき、その概略を
説明する。最初に、翻訳すべき原文が読込まれる。読込
まれた英語の文章は、図７に示されるようにバッファＳ
１に格納される。このバッファＳ１には、図１に示され
るメインメモリ２の一部が割当てられる。

【００２２】バッファＳ１に格納された英語の文には、
前編集処理が施される。前編集処理はユーザにより行な
われる。もちろんこの前編集処理は、必要な場合のみ行
なわれる。

【００２３】前編集処理が施された英文の例が図７に示
される。図７を参照して、第１文に用いられた前編集記
号“ｖ３ ”は、図５の文型指定記号の第３番目に相当
する。すなわちこの記号は、図７に示される第１文の動
詞“ｃａｌｌｅｄ”によって統括されるこの第１文全体
が第３文型であることを指定している。

【００２４】また第２文に用いられた前編集記号“＜
＜”および“＞＞”は、それぞれ図６に示されるように
フレーズ指定開始記号、フレーズ指定終了記号である。
この２種類の記号よって挟まれた部分は、翻訳の際の構
文解析において一まとまりのものとして取扱われる。

【００２５】このように入力原文に前編集記号を挿入す
ることにより翻訳処理の効率が向上し精度も向上するこ
とについては前に述べたとおりである。本発明は、翻訳
後の、前編集処理された入力テキストから前編集記号を
簡単に削除できる点に特徴がある。以下、前編集記号の
削除処理について説明する。

【００２６】図２を参照して、まずステップＳ００１
で、前編集記号の挿入された文がバッファＳ１に格納さ
れる。格納した結果は図７に示されるとおりである。な
お、バッファＳ１に格納された入力テキストは、現在の
説明では翻訳直後のものと想定されている。しかし、翻
訳直後である必要はなく、過去に翻訳した文章の原文が
別途保存されていた場合に、その保存されていた文章を
バッファＳ１に格納して以後の前編集記号の削除処理を
行なうことも可能である。また翻訳が行なわれていない
文章を一旦バッファＳ１に格納し、前編集処理後に翻訳
文を生成し、残っている原文に対して翻訳処理直後に前
編集記号の削除を行なうことも可能である。

【００２７】続いてステップＳ００２で、バッファＳ１
の、現在の処理対象の文字位置を示すポインタが０にセ
ットされる。これによりポインタの指す文字はバッファ
Ｓ１に格納された文章の先頭の文字「Ｈ」となる。

【００２８】さらにステップＳ００３では、バッファＳ
２の内容がクリアされる。バッファＳ２は、バッファＳ
１に格納された入力原文から前編集記号を除去した文を
一旦格納するのに用いられるものである。このバッファ
Ｓ２にも、図１に示されるメインメモリ２が割当てられ
る。

【００２９】ステップＳ００４では、バッファＳ２の、
文字書込位置を示すポインタがバッファＳ２の先頭を指
すように０にセットされる。

【００３０】ステップＳ００５では、バッファＷがクリ
アされる。バッファＷは、原文から切出した文字列を単
語単位で一時的に格納するのにあてられる作業バッファ
である。バッファＷにも、図１に示されるメインメモリ
２が割当てられる。

【００３１】ステップＳ００６では、バッファＷの文字
位置ポインタが０にセットされる。これによりバッファ
Ｗへの文字の書込位置はその先頭となる。

【００３２】以上で、原文の文字列を検査するための準
備が完了する。

【００３３】ステップＳ００７から実際の文字列検査が
開始される。まずステップＳ００７で、バッファＳ１の
文字位置ポインタが指している文字が検査される。その
文字が空白か括弧類であれば処理はステップＳ０２１に
進む。さもなければ処理はステップＳ００８に進む。

【００３４】図７に示される文章を処理する場合には、
文字位置ポインタが当初指している位置０の文字は
「Ｈ」である。したがって、この場合処理はステップＳ
００８に進むことになる。

【００３５】なお、本実施例では前述したように「括弧
類」という語は、図８に示される９種類の記号文字を指
すものとする。この場合記号「／」も含まれていること
に注意すべきである。

【００３６】ステップＳ０２１〜Ｓ０２４の処理につい
ては後述する。

【００３７】ステップＳ００８では、バッファＳ１の文
字位置ポインタが指す位置の文字が、バッファＷの、文
字位置ポインタの指している位置にコピーされる。

【００３８】図７に示される例の場合では、バッファＳ
１の文字「Ｈ」が、バッファＷの先頭位置にコピーされ
る。

【００３９】続いてステップＳ００９で、バッファＷの
文字位置ポインタが１加算される。

【００４０】図３を参照して、ステップＳ０１０で、バ
ッファＳ１の文字位置ポインタが指している文字が「
」であるか否かが判定される。すなわちこの場合、ス
テップＳ００８でバッファＳ１からバッファＷにコピー
した文字が「」であるか否かが判定される。判定の結
果がＹＥＳであれば処理はステップＳ０２０に、さもな
ければ処理はステップＳ０１１に進む。ステップＳ０２
０以下の処理については後述する。文字「」は、図５
に示される第１の種類の前編集記号の末尾に必ず用いら
れている文字である。したがってバッファＳ１の文字列
中にこの文字が検出された場合には、その位置に前編集
記号が存在する可能性が高いと考えられる。

【００４１】図７に示される例の場合にはバッファＳ１
の現在の文字位置ポインタが指している文字は「Ｈ」で
あるので、処理はステップＳ０１１に進む。

【００４２】ステップＳ０１１では、バッファＳ１の文
字位置ポインタが１進められる。その結果、バッファＳ
１の文字位置ポインタが指している文字は「ｅ」とな
る。

【００４３】ステップＳ０１２では、バッファＳ１の文
字位置ポインタ以降に文字が存在するかどうかについて
の判断が行なわれる。文字が存在しないと判断されれば
前編集記号削除機能はこれで終了する。すなわち処理は
ステップＳ０２７に進み、バッファＷ内の文字列を、バ
ッファＳ２内の、現在のポインタ１以降にコピーする処
理が行なわれ、全体の処理が終了する。バッファＳ１に
次の文字がある場合には処理はステップＳ０１３に進
む。

【００４４】図７に示される英文の場合、バッファＳ１
の文字位置ポインタが指している位置には文字「ｅ」が
存在する。したがって、ステップＳ０１２における判断
の結果はＹＥＳとなり、処理はステップＳ０１３に進
む。

【００４５】ステップＳ０１３では、バッファＳ１の文
字位置ポインタが指している文字が空白か括弧類である
かどうかについての判断が行なわれる。空白または括弧
類である場合には処理はステップＳ０１４に、さもなけ
れば処理は図２のステップＳ００８に戻る。

【００４６】バッファＳ１の文字位置ポインタが指して
いる文字がもし空白であればその箇所は単語の切目であ
ると考えられる。文字が括弧類であれば図６に示される
前編集記号がその箇所に存在する可能性がある。もしそ
うであればその箇所は単語の切目でもある。

【００４７】図７に示される例文の場合には、文字位置
ポインタが指している文字は「ｅ」である。したがって
ステップＳ０１３における判断の答えはＮＯとなり処理
は図２のステップＳ００８に戻る。

【００４８】以下同様に、バッファＳ１の文字位置ポイ
ンタが指している文字「ｅ」につき、図２のステップＳ
００８、Ｓ００９、図３のステップＳ０１０、Ｓ０１
１、Ｓ０１２が順に実行される。その結果文字「ｅ」が
バッファＷに追加される。

【００４９】処理がステップＳ０１３に進んだ場合を考
える。この時点ではバッファＷの内部には図９に示され
るように文字列「Ｈｅ」が格納されている。バッファＳ
１の文字位置ポインタが指している文字は、図７を参照
して、「ｅ」の次の空白位置である。したがって、ステ
ップＳ０１３での判定の結果、処理はステップＳ０１４
に進む。

【００５０】ステップＳ０１４では、バッファＳ１の文
字位置ポインタが指している文字が空白であるかどうか
についての判断が行なわれる。空白であれば処理は図４
のステップＳ０１５に進み、それ以外の場合（すなわち
括弧類である場合）には処理はステップＳ０２５に進
む。

【００５１】図７に示される例文の場合にはバッファＳ
１の文字位置ポインタによって指し示される文字は空白
である。したがって処理はステップＳ０１５（図４参
照）に進む。

【００５２】ステップＳ０１５まで処理が進んだ場合、
バッファＳ１の文字位置ポインタが１つの単語を完全に
通過したことになる。この間単語の各文字はバッファＷ
に順次コピーされている。したがってバッファＷに格納
されている文字列は１つの完全な単語である。ステップ
Ｓ０１５では、このバッファＷに格納されている文字列
をバッファＳ２の文字位置ポインタの指す位置以降にコ
ピーする処理が行なわれる。この結果、バッファＳ２の
内部の先頭には図１０に示されるように単語「Ｈｅ」が
コピーされる。

【００５３】次のステップＳ０１６では、バッファＳ２
の文字位置ポインタをバッファＷの文字数分だけ進める
処理が行なわれる。これにより文字位置ポインタはコピ
ーされた文字の次の位置を指し示すことになる。

【００５４】図７に示される例文の処理の場合、現在処
理対象となっている単語「Ｈｅ」は２文字の単語であ
る。したがってＳ０１６の処理によりバッファＳ２の文
字位置ポインタが２進められる。この結果、図１０に示
されるバッファＳ２の文字位置ポインタは文字「ｅ」の
次の位置を指し示す。

【００５５】次のステップＳ０１７では、バッファＳ２
の文字位置ポインタが指している位置に空白をセットす
る処理が行なわれる。これは、バッファＳ２のおいて単
語の切目を生成するための処理である。

【００５６】ステップＳ０１８では、挿入された空白の
分だけバッファＳ２のポインタを進める処理が行なわれ
る。すなわちバッファＳ２の文字位置ポインタが１加算
される。同様にしてステップＳ０１９ではバッファＳ１
の文字位置ポインタも１加算される。ステップＳ０１９
の後処理は図２のステップＳ００５に戻る。

【００５７】ステップＳ００５では、バッファＷがクリ
アされ、ステップＳ００６ではバッファＷの文字位置ポ
インタが０にセットされる。このようにバッファＷをク
リアするのは、処理中の単語「Ｈｅ」をバッファＳ２に
コピーする処理が完了し、バッファＷに格納されている
単語はもはや不要となったためである。

【００５８】以上、バッファＳ１に格納されている文中
の単語「Ｈｅ」を例にとり、前編集記号の付いていない
単語についてバッファＳ１からバッファＳ２にコピーを
行なう手順を示した。上述の説明から明らかなように、
前編集記号の付いていない単語は、図１０に示されるよ
うにバッファＳ１からバッファＳ２にそのままの形でコ
ピーされる。

【００５９】図５に示される第１の種類の前編集記号の
ある箇所は、次のようにして処理される。図７に示され
る例文の「Ｈｅ」の次の単語「ｖ３ｃａｌｌｅｄ」に
は、図５に示される第１の種類の前編集記号「ｖ３」
が付いている。以下、「ｖ３ｃａｌｌｅｄ」に対する処
理を例にとり、図５に示される第１の種類の前編集記号
が付加された単語についての処理を説明する。

【００６０】「Ｈｅ」のコピーが終了した時点で、処理
はステップＳ００７にある。バッファＳ１の文字位置ポ
インタは「ｖ３ｃａｌｌｅｄ」の「ｖ」を指してい
る。バッファＷの内部には文字は存在しない。バッファ
Ｗの文字位置ポインタはバッファＷの先頭を指してい
る。バッファＳ２の内容は図１０に示されるとおりであ
る。なお、単語「Ｈｅ」の次には空白文字が１個存在す
る。そしてバッファＳ２の文字位置ポインタは、その空
白の次の位置を指している。

【００６１】図２を参照して、ステップＳ００７で、バ
ッファＳ１の現在の文字位置ポインタが指している文字
は空白ではない。したがって処理はステップＳ００８に
進む。以下、ステップＳ００８、Ｓ００９、図３のステ
ップＳ０１０、Ｓ０１１、Ｓ０１２、Ｓ０１３、図２の
ステップＳ００８のループを２回回ることにより、文字
列「ｖ３」がバッファＷにコピーされる。バッファＳ１
の文字位置ポインタは「ｖ３」の次の「」を指してい
る。

【００６２】そしてステップＳ００８、Ｓ００９の処理
により、文字「」がバッファＷに追加される。この結
果、バッファＷの格納内容は図１１に示されるとおりと
なる。図３を参照して、ステップＳ０１０では、バッフ
ァＳ１の文字位置ポインタが指している文字が「」で
あるので判断の答えはＹＥＳとなり処理はＳ０２０に進
む。

【００６３】Ｓ０２０ではバッファＷの内容が図５に示
される前編集記号のいずれかと一致しているか否かにつ
いての判断が行なわれる。いずれとも一致していない場
合には処理はステップＳ０１１に進む。この場合の文字
「」は前編集記号とは関係ない単語の一部であると判
断されるためである。またバッファＷ内の文字列が前編
集記号のいずれかと一致する場合には処理はステップＳ
０２８に進む。

【００６４】図７に示される例文の場合には、バッファ
Ｗの内容は図１１に示されるように文字列「ｖ３」で
ある。図５からわかるようにこれは前編集記号の一種で
ある。したがって、ステップＳ０２０における判断の結
果はＹＥＳとなり処理はステップＳ０２８に進む。

【００６５】ステップＳ０２８では、バッファＳ１の文
字位置ポインタが１進められる。これによりバッファＳ
１の文字位置ポインタによって示される文字は「ｃ」と
なる。ステップＳ０２８の後処理はステップＳ００５に
戻る。

【００６６】再びステップＳ００５、Ｓ００６によって
バッファＷがクリアされる。バッファＷに格納されてい
た単語は前編集記号であるために、バッファＳ２にコピ
ーする必要はなく、さらに処理をこの前編集記号の次の
単語に進める必要があるからである。

【００６７】以下、再び図７を参照して、バッファＳ１
の現在の文字位置ポインタが指している文字は「ｃ」で
ある。したがって図２を参照して、処理はステップＳ０
０７からＳ００８に進む。さらにステップＳ００８〜Ｓ
０１３→Ｓ００８のループを６回繰り返して実行するこ
とにより、バッファＳ１内の文字列「ｃａｌｌｅｄ」が
バッファＷにコピーされる。このときバッファＳ１の文
字位置ポインタは「ｃａｌｌｅｄ」の次の空白を指す。

【００６８】さらに、ステップＳ００８〜Ｓ０１５と処
理が進む。これにより、図１２に示されるようにバッフ
ァＷに格納されている単語「ｃａｌｌｅｄ」がバッファ
Ｓ２に追加される。

【００６９】さらにステップＳ０１６〜Ｓ０１８の処理
によりバッファＳ２にさらに空白文字が追加される。こ
れによりバッファＳ２の内容は図１３に示されるように
なる。

【００７０】さらに図４に示されるステップＳ０１９の
処理によって、バッファＳ１の文字位置ポインタは「ｃ
ａｌｌｅｄ」の次の空白の次の文字「ｈ」を指するよう
になる。さらに図２に示されるステップＳ００５、Ｓ０
０６に処理が戻り、バッファＷがクリアされる。

【００７１】以上の処理によりバッファＳに格納されて
いる前編集記号付きの単語「ｖ３ｃａｌｌｅｄ」は、前
編集記号の除去された単語「ｃａｌｌｅｄ」となってバ
ッファＳ２にコピーされる。バッファＳ２の内容は図１
３に示されている。

【００７２】図７に示される例文の場合、「ｂｏｕｇｈ
ｔ」までの部分には前編集記号が存在しない。したがっ
て、この間のそれぞれの単語の処理は前述した「Ｈｅ」
の単語の処理と同様に行なわれる。単語「ｂｏｕｇｈ
ｔ」までの処理が終了した段階では、バッファＳ２の格
納内容は図１４に示されるようになっている。

【００７３】図７を参照して、単語「ｂｏｕｇｈｔ」と
その次の単語「ｎｅｃｋｌａｃｅｓ」との間には前編集
記号「＜＜」が存在する。以下、この前編集記号「＜
＜」の処理を例にとり、図６に示される第２の種類の前
編集記号に対する処理を説明する。

【００７４】図７に示される例文の単語「ｂｏｕｇｈ
ｔ」までの処理が終了した段階で、処理ステップは図２
のステップＳ００７となっている。バッファＳ１の文字
位置ポインタは前編集記号「＜＜」のうちの左側の
「＜」を指す。バッファＷの内容はクリアされており、
その文字位置ポインタはバッファＷの先頭を指してい
る。バッファＳ２の内容は図１４に示されるとおりであ
る。図１４において、単語「ｂｏｕｇｈｔ」の次には空
白文字が１個存在する。文字位置ポインタはその空白の
次の位置を指している。

【００７５】前編集記号「＜＜」の処理において、ステ
ップＳ００７（図２参照）で、判断の結果はＹＥＳとな
る。したがって処理はステップＳ０２１に進む。

【００７６】ステップＳ０２１では、バッファＳ１のポ
インタが指している文字が空白であるか否かについての
判断が行なわれる。空白である場合には処理はステップ
Ｓ０２２に進む。空白でない場合、すなわち括弧類であ
る場合には処理はステップＳ０２３に進む。

【００７７】現在の状態ではポインタの指す文字は
「＜」であるため処理はステップＳ０２３に進む。

【００７８】ステップＳ０２３では、次の文字が同じ文
字、すなわち現在の場合「＜」であるかどうかについて
の判断が行なわれる。同じでない場合には処理はステッ
プＳ００８に、同じ場合には処理はステップＳ０２４に
進むるステップＳ０２３の処理は次の理由により行なわ
れる。同じ括弧類であっても前編集記号として使われる
場合には同じ括弧類が２個使用される。もし括弧類が単
独で存在するならばそれは文章中の記号としての単なる
括弧であると考えられる。ステップＳ０２３では、した
がって同じ括弧類が２つ続いて発生する場合のみ処理を
ステップＳ０２４に進ませ、それ以外の場合には通常の
場合と同様にステップＳ００８に進ませる。

【００７９】ステップＳ０２４では、バッファＳ１の文
字位置ポインタが２進められる。これは、括弧類を用い
た前編集記号の場合には、２つの括弧類で１組として使
用されているからである。ステップＳ０２４の処理の結
果、バッファＳ１の文字位置ポインタは「＜」の次の空
白を指すことになる。ステップＳ０２４の後処理はステ
ップＳ００７に戻る。

【００８０】ステップＳ００７では、バッファＳ１の１
ポインタが指す文字が再び検査される。そして空白、括
弧類であれば処理はステップＳ０２１、それ以外の場合
には処理はステップＳ００８に進む。

【００８１】図７に示される例文の場合にはポインタの
指す文字は空白である。したがって、この場合処理はス
テップＳ０２１に、さらにステップＳ０２２に進む。そ
してステップＳ０２２ではバッファＳ１のポインタが１
進められる。その結果、バッファＳ１の文字位置ポイン
タは単語「ｎｅｃｋｌａｃｅｓ」の先頭文字「ｎ」を指
す。

【００８２】以上の処理により、バッファＳ１に存在す
る前編集記号「＜＜」をバッファＷはバッファＳ２にコ
ピーすることなく、バッファＳ１の文字位置ポインタが
この前編集記号「＜＜」を通過する。前編集記号「＜
＜」がバッファＳ２にコピーされることはない。

【００８３】図７に示される例文の場合、次の単語「ｎ
ｅｃｋｌａｃｅｓ」の処理は単語「Ｈｅ」の処理と同様
に行なわれる。この結果、バッファＳ２の格納内容は図
１５に示されるとおりとなる。バッファＳ１の単語「ｂ
ｏｕｇｈｔ」と「ｎｅｃｋｌａｃｅｓ」との間に存在す
る前編集記号「＜＜」は、バッファＳ２の文中には存在
しない。

【００８４】以下、図７に示される単語「ｏｆ」以後の
処理は、以上の方法を順次適用することによって可能で
ある。

【００８５】最後の単語「ｓｉｌｖｅｒ．」の処理が終
了した時点を考える。バッファＳ１の文字位置ポインタ
は「ｓｉｌｖｅｒ．」の末尾の「．」を指している。バ
ッファＷに文字列「ｓｉｌｖｅｒ．」が格納されてい
る。この時点では、処理は図２のステップＳ００９であ
る。ステップＳ００９から図３のステップＳ０１０、Ｓ
０１１、Ｓ０１２と処理が進む。ステップＳ０１２にお
ける判断では、「．」の次の文字はもはや存在しないた
めに、処理はステップＳ０２７に進むことになる。

【００８６】ステップＳ０２７では、既に説明したよう
にバッファＷの内容「ｓｉｌｖｅｒ．」をバッファＳ２
に追加する。これによりバッファＳ２の内容が完成し、
全体の処理は終了する。

【００８７】以上の処理が終了した時点でバッファＳ２
の格納内容は図１６に示されるとおりとなる。図７に示
される例文のうち、図５、図６に示される前編集記号は
完全に除去されている。

【００８８】なお、図３に示されるフローチャートのう
ち、ステップＳ０１４、Ｓ０２５、Ｓ０２６の処理は、
図２に示されるステップＳ０２１、Ｓ０２３、Ｓ０２４
の処理と全く同じである。このようにステップＳ０１４
以下の処理を設けているのは次のような理由による。既
に説明したように図６に示される第１の種類の前編集記
号の場合、その前後に空白が存在しない場合があり得
る。そのような場合、ステップＳ０２１、Ｓ０２３、Ｓ
０２４の処理では対応することができない。そのため
に、ステップＳ０１３の時点から、図６に示される第２
の種類の前編集記号に対する処理をする手順としてこの
ステップＳ０１４、Ｓ０２５、Ｓ０２６のルーチンが設
けられている。

【００８９】以上のように本発明の機械翻訳装置では、
前編集処理がされた入力テキストのうち、前編集記号の
みを取除いた原文が自動的に生成される。従来のように
ユーザが文書編集機能を用いて前編集記号を１つずつ探
索して手作業で削除していく必要はない。そのため、翻
訳後の文書を効率よく利用することができる。

【００９０】

【発明の効果】以上のように本発明の機械翻訳装置で
は、前処理後入力原文から、前編集のための所定の記号
を除去した分が前編集記号除去手段によって生成され
る。前編集記号を手作業によって１つずつ探索し、除去
していく必要はない。

【００９１】その結果、翻訳のための前処理がされた入
力原文の文章を、容易に文として利用することができ
る。

【図面の簡単な説明】

【図１】本発明の一実施例の機械翻訳装置のブロック図
である。

【図２】前編集記号除去処理の前半のフローチャートで
ある。

【図３】前編集記号除去処理の中間のフローチャートで
ある。

【図４】前編集記号除去処理の後半のフローチャートで
ある。

【図５】第１の種類の前編集記号を表形式で示す図であ
る。

【図６】第２の種類の前編集記号を表形式で示す図であ
る。

【図７】バッファＳ１の格納内容を示す模式図である。

【図８】括弧類を示す模式図である。

【図９】バッファＷの内容を示す模式図である。

【図１０】バッファＳ２の模式図である。

【図１１】バッファＷの模式図である。

【図１２】バッファＷの模式図である。

【図１３】バッファＳ２の模式図である。

【図１４】バッファＳ２の模式図である。

【図１５】バッファＳ２の模式図である。

【図１６】バッファＳ２の模式図である。

【符号の説明】

１メインＣＰＵ２メインメモリ３表示装置４キーボード５翻訳モジュール６メモリ７プリンタ

Claims

(57)【特許請求の範囲】

【請求項１】自動翻訳の補助のための所定の記号を前
処理として挿入された前処理後入力原文を格納するため
の前処理後入力原文格納手段と、前記前処理後入力原文を、前記所定の記号を翻訳の補助
として用いながら他の言語に翻訳するための自動翻訳手
段と、前記前処理後入力原文格納手段に格納された前記前処理
後入力原文から前記所定の記号を除去した文を生成する
ための前処理記号除去手段とを含む、機械翻訳装置。