JPH0452763A

JPH0452763A - 機械翻訳装置

Info

Publication number: JPH0452763A
Application number: JP2155718A
Authority: JP
Inventors: Yoshihisa Oguro; 慶久大黒; Yoshitoku Arai; 荒井　良徳
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1990-06-14
Filing date: 1990-06-14
Publication date: 1992-02-20

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】肢生分互本発明は、機械翻訳装置に関し、より詳細には、音声認
識による翻訳結果の編集機能を有する機械翻訳装置に関
する。

従来技術現在の自然言語処理技術では、全ての原文を正しく機械
翻訳することは不可能であり、正確な訳文を得るために
は翻訳処理の過程で何らかの校正が必要である。従来、
翻訳処理に関する校正としては、原文に対して行う前編
集と、生成された訳文に対して行う後編集がよく知られ
ている。しかしながら、前編集を行うには当該原文を理
解・解釈しなければならず、機械翻訳をするまでもなく
、前編集実行者は訳文を得ることになり、人手による翻
訳と比較して必ずしも効率的ではなかった。

また、機械翻訳の結果に対して後編集をする場合におい
でも、後編集実行者は原文を理解・解釈し、かつ訳文を
校正する能力（例えば、訳文を理解して校正結果を入力
する能力）が要求され、後編集に適した操作者は非常に
限られている。

一方、音声認識技術においても、不特定話者の制限のな
い自然言語の認識は不可能な状態であり、話者・諸費・
発声内容・環境などに対する制限の下で研究が進められ
ているが、ある特定の制限の中では実用に耐え得る性能
をもつシステムも現れ始めている。

ｌ−一的本発明は、上述のごとき実情に鑑みてなされたもので、
音声認識技術を利用し２５機機械翻訳装置後編集におい
て操作者が校正結果を読み」−げることによって容易か
つ迅速に訳文の修正・入力を行える機能を有する機械翻
訳装置を提供することを目的としてなされたものである
。

構−一−−戊− 本発明は、上記目的登達成するために、（］）少なくと
も対象言語の原文を入力するための入力手段と、該入力
手段りこより入力された原文を記憶する記憶手段と、言
語解析に必要な知識を記憶している解析辞書と、前記記
憶手段に記憶された対象言語の原文を、前記解析辞書を
用いて目的言語に翻訳する翻訳手段と、前記入力手段に
より入力さ九た原文と前記翻訳手段により翻訳された翻
訳結果登表示するための表示手段と、原文からの翻訳結
果に規定される諸費を認識対象として音声認識する音声
認識手段とを有すること、更には、（２）前記音声認識
手段が、原文からの翻訳結果に規定される格構造を有す
る文を音声認識するものであること、更には、（３）前
記音声認識手段が、原文からの翻訳結果に規定される統
語構造を有する文を音声認識するものであることを特徴
としたものである。すなわち、本発明では後編集におい
で利用する音声認識系の対象とする諸費・発声内容を、
機械翻訳系での原文で規定される翻訳結果に限定するこ
とによって、認識性能の向上を図ることを特徴としたも
のである。以下５本発明の実施例に基づいて説明する。

まず第２図に基づき、英日機械翻訳装置の一実施例につ
いて説明する。図中、］１は形態素解析部、］２は辞書
、１３は屈折語形ファイル、１４は情報ファイル１．１
５は構文解析部、１６は文法規則、コアは解析ルール１
．１８は英語構造同定部、コ−９は情報ファイル２．２
０は解析ルール２．２１は情報ファイル３．２２は変換
部、２３は情報ファイル４．２４は構文生成部、２５は
形態素生成部である。機械翻訳システム装置中の辞書１
２には、語形、活用形、品詞、訳語などが記述さａｔて
いる。

入力された英文は、まず形態素解析部１１で一つ〜つの
単語として認定され、称号十姓や数字千単位などの特別
な文字列は句としてまとめられる。

構文解析部］５で人力英文の構造が解析される。

入力文に対して辞書記述内容と文法ルールを適用するこ
とによｊＪ文構造を決定していく。例えば、前置詞十冠
詞十名詞が副詞句と解析される。

英語構造同定部１８では、係り受は関係等を明らかにす
るために動詞ノードを親とする木構造が作られ、副詞句
の係り先等が決まる。次に、共起条件の成立が調べら、
ｔｌｌ、妥当な訳語が取られる。

前記本構造は変換部２２で日本語の言い回しを表わし易
い中間構造に変換される。構文生成部２４では文節単位
で日本語を生成した後、形態素生成部２５で助詞の並び
を決定し、たり、用言の活用形を整える。

第３図は、第２図に示した英日機械翻訳の動作を説明す
るためのフローチャー１−である。以下、各ステップに
従って順に説明する。

ｓｔｅ、ｐｌ−；対象言語の原文を入力手段、例えばタ
イプ入力やＯＣＲ（光学式文字認識装置）などの入力手
段により入力する。

且（吐、２−；原文に対して翻訳するための前編隻浸行
う。

共町−褐；対象言語の原文（ここでは英語）を目的言語
（ここでは日本語）に翻訳する。

５ｔｅｐ４　；生成された訳文に対して後編集を行う。

社ｔ９■−可；訳文を出力する。

次に具体例を示す。

Ｉ　　ｓａｗ　　ａ　　ｇｉｒｌ　　ｉｎ　　ｔｈｅ　
　ｐａｒｋ＋文末から一語ずつ取り出して辞書引きをす
る。

構文解析部１５で文末から始めて右から左に、辞書記述
内容と文法ルールを適用することにより文構造が次のよ
うに決定される。

ＳＮＴ　（文）−＞　Ｓ（主語）＋Ｖ（他動詞）＋Ｏ（
直接目的語）＋前置詞句＋ピリオドこの文構造をもとに英語構造同定部１８では、係り受は
関係を表わす本構造が次のＴｒｅｅ　１とＴｒｅｅ　２
のように複数個作られる。なお、Ｓ：主語、ｖ：動詞、
Ａ：冠詞、Ｐ：前置詞、○：目的語であり、／　　／内
は注である。

Ｔｒｅｅ　　１十−（Ｖ）　ｓａｗ／他動詞／十−（Ｓ）Ｉ／代名詞／十−（０）　ｇｉｒｌ／名詞／十−（Ａ）ａ／冠詞／十−（Ｐ）ｉｎ／前置詞／十−（０）　ｐａｒｋ／名詞／＋−−（Ａ）　ｔｈｅ／冠詞／Ｔｒｅｅ　　２＋−−（Ｖ）　ｓａｗ＋−（Ｓ）Ｉ＋−−（○）　ｇｉｒｌ＋−−（Ａ）　ａ＋−−（Ｐ）　ｉｎ／Ｔｒｅｅｌの場合と係り先が異なる／＋−（○）　ｐ
ａｒｋ＋−−（Ａ）　ｔｈｅＴｒｅｅ　１．とＴｒｅｅ　２．の木構造の情報と辞書
記述を参照して共起条件の検査を行い、訳語、助詞類を
選ぶことによって訳文への変換が行われる。

変換１−　Ａ　／　Ｔｒｅｅ　１より／Ｖ　＞ｓｅｅ会
う＋Ｓ＞　　Ｉ　　私［がコ（以下余白）変換１−Ｂ　　／　Ｔｒｅｅ　２より　／Ｖ　＞ｓｅｅ
見る＋変換Ｉ　　Ｃ／　Ｔｒｅｅ　１より　／−Ｖｉｓａ％ｌ
のこぎりで切る＋変換２　／　Ｔｒｅｅ　２より　／Ｖ　＞ｓｅｐ会う十＋ −Ｐ）ｐａｒｋ公園［のコ上記のような解析の結果を形態素生成部２５に送り、該
形態素生成部２５で次のような日本語文を完成させる。

変換１−Ａより「私は公園で少女に会った。」変換１−Ｂより「私は公園で少女を見た。」変換１−Ｃより「私は公園で少女をのこぎりで切る。」変換２より「私は公園の少女に会った。」最終的に以下の訳文が得られる。

〈〈後編集〉〉Ｉ　ｓａｗ　ａ　ｇｉｒｌ　ｉｎ　ｔｈｅ　ｐａｒｋ。

１、私は公園で少女を見た。

２、私は公園で少女に会った。

３、私は公園で少女をのこぎりで切る。

４、私は公園の少女に会った。

後編集実行者は所望の訳文が得られたならば訳文を確定
する。所望の訳文が得られなかった場合（解析が不可能
、誤った解析、不適当な訳語・語順など）には、原文に
対する正しい訳文を読み上げる。この発声を音声認識系
に入力して発声内容を認識する。この時発声される訳文
の構造及び含まれる語常は、機械翻訳系における訳文変
換時で求めた構造及び諸費であることが予想される。す
なわち変換１−Ａ、変換１−Ｂ、変換］２−Ｃ５変換２
における訳文の構造及び諸費である。

現在の連続音声認識技術では、なめらかに発声された制
限のない自然Ｓ語文を正しく認識することは非常に困離
である。したがって認識対象を機械翻訳の過程で求めた
訳文変換時の構造または諸費に限定することは、連続音
声認識の性能を著しく向ゴニさせる。

さらに日本語の場合、語順は比較的自由であるが、格構
造によりある程度助詞を決定することが可能なため、日
本語の連続音声認識の内でも特に認識が難しい格助詞の
問題を回避することができて都合がよい。

第１図は、本発明による機械翻訳装置の一実施例を説明
するための構成図で、図中、］−は原文人力部、２は前
編集部、３は形態素解析部、４は構文解析部、５は変換
生成部、６は音声認識対象の規定部、７は音声認識部、
８は辞書／文法規則、９ａは機械翻訳系、９ｂは音声認
識系、１０は訳文出力部である。

機械翻訳系９ａは前編集部２、形態素解析部３゜構文解
析部４、変換生成部５から成り、前記形態素解析部３は
入力された原文から形態素を抽出し、該抽出された形態
素がどのように結合して語を形成しているかを解析し認
定する。前記構文解析部４は、前記形態素解析部３によ
り形態素解析されて得られた品詞情報などをもとに原文
の結語構造を求める。前記変換生成部５は対象言語の原
文を目的言語の訳文に変換し、訳文を生成する。

次に、音声認識系９ｂは、音声認識対象の規定部６と音
声認識部７から成り、該音声認識対象の規定部６は、原
文からの翻訳結果による訳文に対し、格構造や統語構造
の言語的制約を適用する。

前記音声認識部７は言語的制約を利用し、単語や文の認
識を行う。

以下、上述した原文”Ｉ　ｓａｗ　ａ　ｇｉｒｌ　ｊ、
ｎ　ｔｈｅｐａｒｋ、　”に対する訳文を、［公園にお
いて私が女の子を見ました。」に訂正する場合における
認識過程を説明する。

■　換結果に基づく！！識対象の規定前記変換１−Ａより認識対象語常は１１　Ｉ　ＩＪ　　　　「私／　ｗａｔａｓｉ／　Ｊ　
　ｒは／ｗａ／」１１ｐａｒｋ”　「公園／　ｋｏｏｅ
Ｎ　／　Ｊ　　ｒで／ｄｅ／」１１ｇ１ｒｌＰｌ　　「
少女／　５ｙｏｏｚｙｏ　／　Ｊ　　ｒに／ｎｉ／Ｊ”
５ａｉｉ”　　　ｒ会った／　ａＱｔａ　／　Ｊである
。ここで／／内は発声内容を記述したもので、／Ｎ／は
撥音「んＪを／Ｑ／は促音「っＪを表す。

さらに以上に加え、原文中の単語を辞書引きすることに
よって、これらの語句の言い替えを求める。なお実際は
、変換後には既にこの結果は求められている場合が多い
。

次の言い替え語句が得られたとする。

“１″「私／　ｗａｔａｋ＋ｒｓｉ　／　Ｊ　　「が／
ｇａ／Ｊ１１ｐａｒｋ＋＋　　（「公園」）「において
／ｎ１ｏｉｔｅ／Ｊ「の中で／　ｎｏｎａｋａｄｅ／　
Ｊ ″ｇｊｒ１″「女の子／　ｏＮｎａｎｏｋｏ　／　Ｊ　
　（ｒに」）ＳａＷ　　　ｒ会いました／　ａｉｍａｓ
ｉｔａ　／　Ｊ同様に変換１−Ｂより「私」　「は」　「公園」　「で」　「少女」　「を」
「見た」変換１−Ｃより「私」　「は」　「公園」　「で」　「少女」　「を」
「のこぎり」　「で」　「切る」変換２より「私」　「はＪ　「公園」　「の」　「少女」　「に」
「会った」などの語句が得られ、変換１−Ａと同じく言い替え語句
も求められる。

■認識用標準パターンの作成前記■で求めた認識対象語夕の標準パターンを作成する
。連続音声認識システムにおいては、認識する最小単位
は音韻・音節などである場合が多く、対象語句の発音表
記から単語単位の標準パターンを作成することは容易で
ある。

■単語・文の認識入力音声と前記■で求めた標準パターンを照合すること
により単語の認識を行う。この時、訳文変換時に求めら
れた訳文の言語的制約を適用することも可能である。言
語的制約とは格構造や統語構造（係り受は関係含む）な
どである。

例えば主格である「私」に関して、 ○「私は」　「私が」は許されるが、 ×「私で」　「私に」は許されない（格構造的制約）。

また日本語においては普通述語は文末にくるため。

○「〜会いました。」　「〜見た。」は許されるが ×「会いました、私は〜」　「公園で見た、少女を〜」は許されない（統語構造的制約）。

また原文の係り受は関係により ○［私は公園の少女を見た。」 ○「公園の少女を私は見た。ｊは許されるが、 ×「公園の私は少女を見た。」は許されない（統語構造的制約）。

さらに原文“Ｉ　ｓａｗ　ａ　ｇｉｒｌ　ｉｎ　ｔｈｅ
　ｐａｒｋｙｅｓｔｅｒｄａｙ、−訳文「私は昨日公園
の少女を見た。」の場合には、係り受は規則における非
交差条件が適用でき、 ○「昨日私は公園の少女を見た。」 ○「私は公園の少女を昨日見た。」は許されるがＯ「私は公園の昨日少女を見た。」は許されない（統語構造的制約）。

結果の確定所望の訳文「公園において私が女の子を見ました。」は
、前記■■■の諸費や言語的制約を満たしているため認
識される。

以上示したように、機械翻訳系の訳文変換時に得られる
諸費や言語的制約を利用すれば、音声認識対象を限定す
ることができるため、現在の不十分な音声認識技術を用
いたとしても、所望の訳文を認識することは十分可能で
ある。

本発明は以上の実施例に限定されるものではなく、原文
における言語的制約を訳文に適するよう変換し、この制
限に基づき音声認識対象を規定し、音声による翻訳結果
の編集機能を有する機械翻訳システムを提供することに
本質がある。

然−一來以上の説明から明らかなように、本発明によると、以下
のような効果がある。

（１）請求項１に対応する効果；音声認識技術を利用し
、機械翻訳結果の後編集において操作者が校正結果を読
み上げることによって容易かつ迅速な訳文の修正や入力
を行える機能を有するので、言語的制約のないある程度
自由な訳文編集が可能である。

（２）請求項２，３に対応する効果；対象言語の原文か
らの翻訳結果に規定され、格構造や統語構造を有する文
を音声認識するようにしたので、音声認識対象を限定す
ることができ、高精度の認識が期待できる。

【図面の簡単な説明】

第１図は、本発明による機械翻訳装置の一実施例を説明
するための構成図、第２図は、英日機械翻訳装置の一実
施例を説明するための構成図、第３図は、英日機械翻訳
装置の動作を説明するためのフローチャートである。１・・・原文人力部、２・・・前編集部、３・・・形態
素解析部、４・・構文解析部、５・・・変換生成部、６
・・・音声認識対象の規定部、７・・・音声認識部、８
・・・辞書／文法規則、９ａ・・・機械翻訳系、９ｂ・
・・音声認識系、１ｏ・・・訳文出力部。第］図第区入力テキスト（英文） ■ 出力テキスト（日本文）

Claims

【特許請求の範囲】１、少なくとも対象言語の原文を入力するための入力手
段と、該入力手段により入力された原文を記憶する記憶
手段と、言語解析に必要な知識を記憶している解析辞書
と、前記記憶手段に記憶された対象言語の原文を、前記
解析辞書を用いて目的言語に翻訳する翻訳手段と、前記
入力手段により入力された原文と前記翻訳手段により翻
訳された翻訳結果を表示するための表示手段と、原文か
らの翻訳結果に規定される語彙を認識対象として音声認
識する音声認識手段とを有することを特徴とする機械翻
訳装置。２、前記音声認識手段が、原文からの翻訳結果に規定さ
れる格構造を有する文を音声認識するものであることを
特徴とする請求項１記載の機械翻訳装置。３、前記音声認識手段が、原文からの翻訳結果に規定さ
れる統語構造を有する文を音声認識するものであること
を特徴とする請求項１記載の機械翻訳装置。