JP3430007B2 - 機械翻訳装置及び記録媒体 - Google Patents

機械翻訳装置及び記録媒体

Info

Publication number
JP3430007B2
JP3430007B2 JP07210698A JP7210698A JP3430007B2 JP 3430007 B2 JP3430007 B2 JP 3430007B2 JP 07210698 A JP07210698 A JP 07210698A JP 7210698 A JP7210698 A JP 7210698A JP 3430007 B2 JP3430007 B2 JP 3430007B2
Authority
JP
Japan
Prior art keywords
pattern
rule
sentence
translation
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07210698A
Other languages
English (en)
Other versions
JPH11272672A (ja
Inventor
友樹 長瀬
修司 小玉
剛一 小屋岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP07210698A priority Critical patent/JP3430007B2/ja
Publication of JPH11272672A publication Critical patent/JPH11272672A/ja
Application granted granted Critical
Publication of JP3430007B2 publication Critical patent/JP3430007B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、訳例パターン(対
訳例から名詞句などの置き換え可能な部分を抜き取った
文型のテンプレート)を用いて自動で翻訳処理を行う機
械翻訳装置及び記録媒体に関し、特に原言語入力文字列
と予め蓄積された訳例パターン(対訳パターン)の原言
語側との照合を行って、マッチしたパターンが見つかっ
た場合は、訳例パターンの目的言語側を用いて訳文を生
成するようにした機械翻訳装置及び記録媒体に関するも
のである。
【0002】
【従来の技術】従来、パターン翻訳は、入力文全体のパ
ターンが過不足なくパターンに一致した場合はパターン
に基づいて翻訳を行うが、それ以外(文全体でパターン
が一致しない場合)は、従来どおり文法規則(ルール)
によって翻訳を行うものであった。
【0003】パターンを利用した翻訳は、例えば、英語
から日本語への翻訳の場合、次のように行われる。ま
ず、「X bought Y⇔XはYを買った」というような対
訳形式のパターンをシステムに予め登録しておく。ここ
でXおよびYは、任意の文字列とマッチする「可変部
(変数部)」である。パターンは、このように「可変
部」と「固定部」との連接からなる。
【0004】そして、原言語入力文字列が「He bought
a book. 」というようなものであれば、このパターンを
適用できると見なす。固定部は、パターンの目的言語側
を直接適用し、可変部は、XとYとをそれぞれ個別に訳
し、それらをつなぎ合わせることによって「彼は本を買
った。」というような訳文を得るものであった。この
際、パターンを適用するかどうかを決定するのは、単純
な文字列のパターンマッチングによっていた。
【0005】
【発明が解決しようとする課題】前記従来のものにおい
ては、次のような課題があった。従来のパターンマッチ
ングは、文字列ベースで行うものが多いため、パターン
適用の際に文法規則を適用するときのような細かい文法
的・意味的整合性をチェックしていなかった。
【0006】即ち、パターンを利用した翻訳では、原言
語入力文字列に対して通常の構文解析等を行わず、「可
変部」の中身を任意とする文字列のパターンマッチング
を行っているため、例えば「He bought a book,and he
read it.」というような文全体に対して「X bought Y
⇔XはYを買った」というパターンを適用してしまう。
その結果「Y=a book,and he read it.」ということに
なって、「彼は1冊の本、そして彼はそれを読んだを買
った」というような不適切な訳文を生成してしまうこと
があった。
【0007】本発明は、このような従来の課題を解決
し、従来の文法による翻訳とパターンによる翻訳が、相
互に補完しながら高品質の翻訳を行うことを目的とす
る。
【0008】
【課題を解決するための手段】図1は本発明の原理説明
図である。図1中、1aは入力手段、2aは解析手段、
3aはパターンマッチ手段、4aは構造変形手段、5a
は訳文生成手段、6は文法規則部、7は辞書部、8はパ
ターン規則部である。
【0009】本発明は前記従来の課題を解決するため次
のように構成した。 (1):原文を入力する入力手段1aと、該入力された
原文の形態素解析と構文解析を行う解析手段2aと、該
解析する文法規則を格納する文法規則部6と、原文と訳
文との翻訳事例のパターン規則を格納するパターン規則
部8と、前記パターン規則と前記入力された原文とのマ
ッチング処理を行うパターンマッチ手段3aと、訳文の
生成を行う訳文生成手段5aとを備え、前記パターンマ
ッチ手段3aは、前記パターン規則を前記入力された原
文の構文解析結果へのマッチングを行い、前記訳文生成
手段5aは、前記入力された原文の中でパターンマッチ
した部分はパターンに基づいて翻訳し、パターンマッチ
しなかった部分は前記文法規則に基づいて翻訳する。
【0010】(2):前記(1)の機械翻訳装置におい
て、前記パターン規則が文脈自由文法の形式で記述さ
れ、前記文法規則の一部として前記解析手段2aでパタ
ーンマッチが実現される。
【0011】(3):前記(1)の機械翻訳装置におい
て、前記パターン規則部8のパターン規則に固定部と任
意の文字列にマッチする可変部とを備え、前記パターン
規則部8にパターン規則を登録する際に、パターン全体
と可変部の統語範疇(カテゴリ)を各々指定できるよう
にする。
【0012】
【0013】():前記(1)の機械翻訳装置におい
て、前記パターン規則に、パターン適用の条件を指定可
能とする。 ():前記(1)の機械翻訳装置において、前記パタ
ーン規則に固定部と任意の文字列にマッチする可変部
と、前記構文解析の出力にパターン規則が反映された形
に変換する構造変形手段4aと、前記構造変形手段4a
にマッチングしたパターンの可変部と翻訳に用いる中間
言語とを対応づける機能とを備え、前記構造変形手段4
aは、前記パターンの可変部に対応する前記中間言語を
利用して、パターンに基づいた翻訳が可能な中間言語に
変換する。
【0014】():前記()の機械翻訳装置におい
て、前記中間言語として意味ネットを使用し、前記構造
変形手段4aは、前記意味ネットのリンクをつなぎかえ
ることによりパターンに基づく翻訳を行う。
【0015】():前記()の機械翻訳装置におい
て、前記中間言語として階層的な素性構造を使用し、前
記構造変形手段4aは、前記素性構造を組み替えること
によりパターンに基づく翻訳を行う。
【0016】():コンピュータを、原文を入力する
入力手段1aと、該入力された原文の形態素解析と構文
解析を行う解析手段2aと、原文と訳文との翻訳事例の
パターン規則と前記入力された原文の構文解析結果との
マッチング処理を行うパターンマッチ手段3aと、前記
入力された原文の中でパターンマッチした部分はパター
ンに基づいて訳文を生成し、パターンマッチしなかった
部分は前記文法規則に基づいて訳文を生成する訳文生成
手段5aとして機能させるためのプログラムを記録した
コンピュータ読取可能な記録媒体とする。
【0017】(作用) 前記構成に基づく作用を説明する。入力手段1aで原文
を入力し、解析手段2aで該入力された原文の形態素解
析と構文解析を行い、文法規則部6に該解析する文法規
則を格納し、パターン規則部8に原文と訳文との翻訳事
例のパターン規則を格納し、パターンマッチ手段3aで
前記パターン規則と前記入力された原文とのマッチング
処理を行い、訳文生成手段5aで訳文の生成を行い、
記パターンマッチ手段3aで、前記パターン規則部8に
登録したパターン規則を前記入力された原文の構文解析
結果へのマッチングを行い、前記訳文生成手段5aで前
記入力された原文の中でパターンマッチした部分はパタ
ーンに基づいて翻訳し、パターンマッチしなかった部分
は前記文法規則に基づいて翻訳する。このため、文法規
則による翻訳とパターンによる翻訳が相互に補完しなが
ら高品質の翻訳を行うことができる。
【0018】また、前記パターン規則が文脈自由文法の
形式で記述され、前記文法規則の一部として前記解析手
段2aでパターンマッチが実現される。このため、文法
規則部に格納されたパターン規則を使用でき、解析手段
2aで構文解析とパターンマッチを同時に行うことがで
きる。
【0019】さらに、前記パターン規則部8にパターン
規則を登録する際に、パターン全体と可変部の統語範疇
を各々指定できるようにする。このため、適用すべきで
ない間違ったパターンの適用を減らすことができる。
【0020】
【0021】さらに、前記パターン規則に、パターン適
用の条件を指定可能とする。このため、パターン規則に
文法属性、意味素性などの制約を与え、パターン適用の
条件を細かく制御し、より高品質の翻訳を行うことがで
きる。
【0022】また、前記パターン規則に固定部と任意の
文字列にマッチする可変部と、構造変形手段4aにマッ
チングしたパターンの可変部と翻訳に用いる中間言語と
を対応づける機能を備え、前記構造変形手段4aで、前
記パターンの可変部に対応する前記中間言語を利用し
て、パターンに基づいた翻訳が可能な中間言語に変換す
る。このため、中間言語を利用して高品質の翻訳を行う
ことができる。
【0023】さらに、前記中間言語として意味ネットを
使用し、前記構造変形手段4aで、前記意味ネットのリ
ンクをつなぎかえることによりパターンに基づく翻訳を
行う。このため、意味ネットを利用して高品質の翻訳を
行うことができる。
【0024】また、前記中間言語として階層的な素性構
造を使用し、前記構造変形手段4aで、前記素性構造を
組み替えることによりパターンに基づく翻訳を行う。こ
のため、素性構造を利用して高品質の翻訳を行うことが
できる。
【0025】さらに、コンピュータを、原文を入力する
入力手段1aと、該入力された原文の形態素解析と構文
解析を行う解析手段2aと、原文と訳文との翻訳事例の
パターン規則と前記入力された原文の構文解析結果との
マッチング処理を行うパターンマッチ手段3aと、前記
入力された原文の中でパターンマッチした部分はパター
ンに基づいて訳文を生成し、パターンマッチしなかった
部分は前記文法規則に基づいて訳文を生成する訳文生成
手段5aとして機能させるためのプログラムを記録した
コンピュータ読取可能な記録媒体とする。このため、こ
の記録媒体のプログラムをコンピュータにインストール
することで、高品質の翻訳を行うことができる機械翻訳
装置を容易に提供することができる。
【0026】
【発明の実施の形態】本発明は、従来の文法による翻訳
とパターンによる翻訳が、相互に補完しながら高品質の
翻訳を行う機械翻訳装置を提案するものである。具体的
には、以下の2つを同時に解決するものである。
【0027】:入力文の一部にパターンがマッチした
場合、マッチした部分はパターン(訳例)による翻訳を
行い、それ以外の部分は従来の文法による翻訳を行う。 :パターンによる翻訳の際にも、その可変部(変数
部)に対応する部分は従来の文法による翻訳を行う。
【0028】(1):機械翻訳装置の説明 図2は翻訳装置の説明図である。図2において、機械翻
訳装置には、原文入力部1、原文解析部2、パターンマ
ッチ部3、構造変形部4、訳文生成部5、文法規則部
6、辞書部7、パターン規則部8、生成文法規則部9が
設けてある。
【0029】原文入力部1は、処理対象となる自然言語
の原文の入力を行うものである。原文解析部2は、原文
の辞書引きを行って単語の切れ目を認識する形態素解析
手段と文法(構文)規則部を参照し原文の構文(統語)
解析を行う構文解析手段を有するものである。パターン
マッチ部3は、パターン規則を原文全体へ、または、原
文の一部へのマッチング処理を行うものである。構造変
形部4は、構文解析手段の出力である構文木(解析
木)、あるいは、中間構造である中間言語(後述する意
味ネット、素性構造など)の一部をパターン翻訳が反映
された型に変換するものである。訳文生成部5は、構文
木または中間言語から生成文法規則を参照しながら訳文
を生成するものであり、該生成した訳文を保持する訳文
バッファを有するものである。
【0030】文法規則部6は、原文の属する言語に関す
る統語解析のための文脈自由文法(CFG)に基づく文
法規則(解析文法規則)を保持するものである。辞書部
7は、原文の属する言語に関する辞書引きのためのデー
タを保持するものである。パターン規則部8は、原文と
訳文が属する言語に関する翻訳事例を記述したデータで
ある。生成文法規則部9は、構文木または中間言語等か
ら訳文を生成するための生成文法規則を保持するもので
ある。
【0031】この機械翻訳装置の動作は、原文入力部1
に入力された処理対象となる原文を、原文解析部2の形
態素解析手段で原文の辞書引きを行って単語の切れ目を
認識し、構文解析手段で文法規則部6を参照し原文の構
文解析を実行する。次に、パターンマッチ部3でパター
ン規則部8を参照し、パターン規則を原文全体へ、また
は原文の一部へのマッチング処理を行う。更に、構造変
形部4で構文解析手段の出力である構文木、あるいは中
間言語の一部をパターン翻訳が反映された型に変換す
る。その後、訳文生成部5で構文木または中間言語から
生成文法規則部9を参照しながら訳文を生成するもので
ある。
【0032】なお、上記説明は、文法規則部6と生成文
法規則部9を別に設ける場合であるが、文法規則部6に
生成文法規則部9を合わせて保持するようにし、訳文生
成部5が訳文を生成時に文法規則部6の生成文法規則を
参照するようにすることもできる。
【0033】(2):パターンベース翻訳とルールベー
ス翻訳が協調する具体例の説明 以下、訳例パターンを用いるパターンベース翻訳と文法
規則を用いるルールベース翻訳が協調する具体例を説明
する。例えば、原文入力部1に入力された原文が次のも
のであったとする。
【0034】原文 I wonder if we turned off from t
he main road into a side road. この入力された英文は、形態素解析手段と構文解析手段
(原文解析部2)によって図3の解析木が作られる。図
3は構文解析結果の説明図である。
【0035】図3において、形態素解析された各単語に
は、図示しないが品詞の候補が付けられている。例え
ば、「a /side/ road 」のa は冠詞、sideは形容詞、
roadは名詞等。そして、sideと road は部分木を構成
し、更にa とsideと road も一つの部分木を構成する。
sideと road の共通の親となるカテゴリ(統語範疇)は
名詞句であり、a とsideと road の共通の親カテゴリも
名詞句である。
【0036】〔パターンの適用の説明〕上記解析結果
(図3)に対してパターンマッチ部3でパターンを適用
する。 〈パターン〉 ・ ・ S:I wonder if 〈S1〉⇔S:〈S1〉かしら ・・・・・・・・・・ S:〈N1〉 turned off from〈N2〉 into 〈N3〉⇔S:〈N1〉は〈N 2〉からそれて〈N3〉に入った ・・・・・・・・・・・・・・・・・・ ・ ・ このパターンの例で、Sは文(センテンス)を示し、
〈 〉は可変部を示している。なお、可変部のSは文
が、Nは名詞がくることを示している。この原文例で
は、上記のパターンに全体がマッチし、更に、の可
変部〈S1〉(we turned off from the main road int
o a side road )がとマッチする。
【0037】図4は解析木へのパターン適用の説明図で
ある。図4において、では横線のI wonder if が固定
部であり、〈 〉のwe turned off from the main road
into a side road が可変部である。では〈 〉のwe
が可変部であり、横線の turned off fromが固定部であ
り、〈 〉の the main roadが可変部であり、横線のin
to が固定部であり、〈 〉のa side road が可変部で
ある。
【0038】〔解析木の変形の説明〕構造変形部4で
は、マッチしたパターンにあわせて解析木を次のように
して変形する。
【0039】・パターンの可変部に対応する部分木はそ
のまま残す。 ・パターンの固定部に対応する部分木は全てクリアす
る。 ・適用パターンの単位で固定部、可変部が同列になるよ
うに部分木を再構成する。
【0040】図5は適用パターンによる解析木の変形の
説明図である。図5において、のパターンは、we、 t
he main road、a side road の3個所が可変部であるの
で、この部分に対応する部分木のみ残し(実線で示して
いる)、その他の木は一旦クリア(点線で示している)
する。そして、固定部( turned off from、 into )に
対応する部分木をひとまとめにし(矢印P2の部分)、
固定部と可変部に共通の親カテゴリを設定する(T1の
部分)。このように、部分木を構成する矢印P1、P
2、P3、P4、P5が同列(T1から見て)になるよ
うにする。
【0041】同様にのパターンについても可変部を残
し固定部分をクリアし、共通の親カテゴリを設定する
(T2の部分)。パターンを適用した結果、図4の
部分木は図5のようになる。
【0042】図5から訳文の生成までのプロセスは、翻
訳システムの方式によって異なるが、以下に意味ネット
を概念表示(中間言語)に用いる意味トランスファー方
式のシステムを例にとって説明する。
【0043】〔意味ネットの作成の説明〕まず、解析木
(図5)から意味ネットを生成する。パターンが適用さ
れなかった部分は、従来どおりの手順で意味ネットを生
成する。パターン適用部分は、パターンノードが支配す
る子ノード(例えばのパターンの可変部、固定部)を
訳文パターンの順につないでいく(のパターンの例で
はN1→N2→N3の順)。このとき、固定部は新たな
ノードを生成(この例では「は」、「からそれて」、
「に入った」)し、パターン特有の訳出ができるように
する。一方、可変部は、対応する解析木から従来どおり
の手順(例えば「 main 」が「road」に掛かるようにす
る)で意味ネットを生成する。
【0044】図6は意味ネットの説明図である。図6は
図5の解析木から作成した意味ネットである。図中、影
付きのノード(例えば「は」、「からそれて」)および
曲線のリンクはパターン適用によって新たに生成された
構造を示し、角なしのノード(例えば「We」)および直
線のリンクは従来の手順に従って生成された構造をその
まま利用した部分を示している。
【0045】この意味ネット(概念構造)から日本語を
生成するには、曲線リンクの先から元の方向に向かって
順に概念ノードに対応する日本語を訳文バッファにコピ
ーすればよい。但し、パターン適用によって生成された
ノード(影付き)は、そのノードに記された表記をその
まま訳文バッファにコピーする(辞書引きを必要としな
い)。
【0046】この例では、曲線リンクの先端は「We」か
ら始め、訳語を訳文バッファにコピーしながらリンクを
戻ってくると最後に「かしら」をコピーしたところで、
「私たちは本道からそれて横道に入ったかしら」という
訳文ができあがる。
【0047】(3):パターン規則を構文解析のための
文法規則の形式に変換する場合の説明 前記(2)では、パターンを原文解析結果に適用し、マ
ッチングしたパターンを訳文に反映させるように解析結
果である解析木(構文木)を変形している。
【0048】解析木の変形は、変形される前も変形した
後も木構造(句構造)の形をしているので(図5参
照)、パターン規則を構文解析のための文法規則と同じ
形式に変換し、構文解析と同時にパターンマッチングを
試みることによって、変形後の構造をダイレクトに作る
ことができる。この方法によれば、構文解析結果に対し
てパターンマッチをする処理とマッチした解析木を変形
する操作が必要なくなり、実行時の効率化を図ることが
できる。
【0049】図7は初期化時にパターンを文法に変換す
る説明図である。図7において、パターン規則B1を予
め構文解析規則の形式B2に変換しておき、システム初
期化の際に構文解析規則Aとパターン規則B1を同時に
共通のフォーマットで文法規則内部形式(文法規則部)
としてメモリ展開する(ローダ)ものである。
【0050】この構文解析規則Aにおいて、例えば「S
→np+vp」は、文Sには名詞句npと動詞句vpがあること
を示している。ここで、det は冠詞、n は名詞である。
パターン規則B1において、例えば「S:I wonder if
〈S1〉⇔S:〈S1〉かしら」をパターンコンバータ
で変換すると「S→ptn[I wonder if]+S=tr(#2 かし
ら) 」となる。ここで、ptn は固定部のパターン、trは
訳、#2は=の左のノード番号(S(文)に対応する)で
ある。
【0051】なお、図7のようにパターン規則B1を一
旦文法規則のシンタクスにコンバートせずに、文法規則
内部形式(メモリ上)に直接変換することも可能であ
る。このように、原文解析部2で構文解析とパターンマ
ッチを同時に行うことにより、パターンマッチングの条
件をきめ細かく指定することが可能となり、パターンを
誤って適用したことによるレベルダウン(パターンを適
用したことによる訳の質が悪くなること)を避けること
ができる。
【0052】例えば、句動詞(イディオム)を記述した
パターンがマッチしたとき、目的語の位置の名詞句の意
味素性によって動詞の訳し分けをすることができる。目
的語の名詞句に意味素性の制約(「人」又は「動物」が
くる等)を与え、目的語が指定した素性を持たないとき
は、パターン適用を回避するようにすればよい。
【0053】更に、プリファレンス(優先順位)を扱う
構文解釈を採用している場合には、パターンを使ったと
きと使わなかったときの結果を同時に保持することもで
き、複数の解の評価を行い、優先順位の最上位の解析結
果を正解とすることも可能である。
【0054】(4):中間言語を変形対象とする場合の
説明 前記(2)(図3〜図6参照)では、構文解析結果にパ
ターンを適用し、マッチしたパターンがあった場合に解
析木を変形していたが、中間構造、即ち中間言語を採用
しているシステムではパターンの翻訳が反映されるよう
に中間言語(概念構造)を変形対象とすることもでき
る。
【0055】a)中間言語に意味ネットを採用している
場合の説明 図8は意味ネットを変形対象とする場合の説明図であ
る。意味ネットの各ノードは、自分が対応する原文単語
の情報を持っており、これを基にすればマッチしたパタ
ーンのどの部分にノードが対応するかを知ることができ
る。図8において、上部に前記(2)の例の解析木が示
されており、下部の意味ネットの各ノードがマッチした
パターンのどの部分に対応しているかを点線の矢印
で示してある。ここで、agent は動作の主体、sourceは
起点、goalは目標を示している。
【0056】この意味ネットを構造変形部4は、次の方
針で中間表現(意味ネット)に変形する。 ・パターンの可変部に対応するノードは残す。
【0057】・パターンの固定部に対応するノードは消
し、固定部に対応するノードを新たに作る。 という処理を図8の意味ネットに対し施すと前記図6の
ような中間表現に変形される。図6において、影付きの
ノードがパターンマッチングによって生成されたノード
であり、角が丸いノードが従来処理で生成されたノード
である。
【0058】b)中間言語に素性構造を採用している場
合の説明 図9は素性構造を変形対象とする場合の説明図である。
意味ネットの場合と同様に中間言語が階層的に意味をと
らえる素性構造の場合も、マッチしたパターンに合わせ
て素性構造を変形することによりパターンの情報を訳文
に反映することができる。図9において、上部に前記
(2)の例の解析木が示されており、下部の素性構造の
各部分がマッチしたパターンのどの部分に対応して
いるかを点線の矢印で示してある。ここで、Subjは主
部、predは述部、mod は修飾部である。
【0059】図9の素性構造に対し、パターンの可変部
と対応する部分はそのままにし、固定部と対応する部分
は削除する。そして、パターンの固定部に対応する表記
を構造の中に新たに設定する。順序は訳文の生成順序に
合わせて上から下へ訳文を出力すればよいように図10
のように変形する。
【0060】図10は変形後の素性構造の説明図であ
る。図10において、「変」は可変部、「固」は固定部
を表している。例えば、右側のくくり括弧内の「変1:
we」はパターンの可変部N1のweを示し、「固:
「は」」は固定部の「は」を示している。このように、
上から順に可変部→固定部→可変部→・・・と出力され
る。
【0061】(5):パターン全体と可変部のカテゴリ
を指定する場合の説明 パターンをシステムに登録する際、「パターン全体」及
び「各可変部」について、それぞれが果たす統語的役割
(カテゴリ:統語範疇)を指定する。統語的役割を指定
とは、例えば、文、動詞句、名詞句がくる等の指定をす
ることである。そして、パターンの検索と同時に原言語
(原文)入力文字列の構文解析を行い、パターン照合の
結果を構文解析木と突き合わせる。具体的には「可変
部」に入る原言語部分文字列が、対訳パターンの要求す
る統語範疇を根ノードとする部分木を成すかどうかを調
べるものである。
【0062】a)パターンの登録の説明 図11はパターン登録画面の説明図である。図11にお
いて、パターン登録用エディタ(パターン登録手段)に
よって、パターンをシステム(パターン規則部)に登録
する様子を示したものである。「原語パターン」「訳語
パターン」のテキストボックス中に見られる〈N1〉
〈N2〉は可変部を表している。Nはこの可変部に入る
語又は句の統語範疇が「名詞」相当でなければならない
ことを示している。添えられた数字は可変部を一意に識
別するためのものである。また、「品詞」欄に入ってい
る「文」は、パターンが全体として満たさなければなら
ない統語範疇を示している。
【0063】b)パターン適用の説明 図12は構文解析木の説明図である。図12において、
例文である原言語文字列「He bought a book,and he re
ad it.」を構文解析した解析木を示している。一方、こ
の文字列に「X bought Y⇔XはYを買った」というパ
ターンをマッチさせることによって、「X=He」「Y=
a book,and he read it.」という対応を得る。ここで、
Heは代名詞であるから「名詞」相当の統語範疇という可
変部の条件を満たしている。
【0064】しかし、「a book,and he read it.」とい
う文字列は、「名詞句」を根ノードとする部分木を作っ
ていない。すなわち、この文字列は、「名詞」相当の統
語範疇という可変部の条件を満たしていない。このよう
な場合は、文字列を端から1語ずつ短くして行って「名
詞句」を根ノードとする部分木ができているかどうかを
チェックする、ということを繰り返す。この例文の場合
では、「a book」で「名詞句」を根ノードとする部分木
ができているので、「Y=a book」ということになる。
【0065】そして、部分文字列「He bought a book」
が「文」を根ノードとする部分木を成すかどうかのチェ
ックを行う。このチェックがOKなら、この部分文字列
に対してパターン適用可と見なし、文字列の残りの部分
は、従来の手法で翻訳して、両者を合成することによっ
て、より質の高い訳文を得ることができる。
【0066】また、このようにパターンの適否に関して
統語的観点から吟味を行って、適用範囲を明確にするこ
とにより、例えば「a book on 〈N1〉⇔〈N1〉に関
する本」というパターンを全体の統語範疇を「名詞句」
として登録しておくことにより、「He bought a book o
n economics.」という原言語文字列に対し、「〈N1〉
bought 〈N2〉⇔〈N1〉は〈N2〉を買った」と
「「a book on 〈N1〉⇔〈N1〉に関する本」という
2つのパターンを組み合わせて適用することによって、
「彼は経済学に関する本を買った」という訳文を得るこ
とができるようになる。
【0067】(6):プログラムのインストールの説明 原文入力部1、原文解析部2、パターンマッチ部3、構
造変形部4、訳文生成部5等は、プログラムで構成で
き、主制御部(CPU)が実行するものであり、主記憶
に格納されているものである。これらのプログラムは、
一般的な、パーソナルコンピュータ、ワークステーショ
ン等のデータ処理装置(コンピュータ)で処理されるも
のである。このコンピュータは、主制御部、主記憶、ハ
ードディスク等のファイル装置、表示装置、キーボード
等の入力手段である入力装置などのハードウェアで構成
されている。
【0068】このコンピュータに、本発明のプログラム
をインストールする。このインストールは、フロッピ
ィ、光磁気ディスク等の可搬型の記録(記憶)媒体に、
これらのプログラムを記憶させておき、コンピュータが
備えている記録媒体に対して、アクセスするためのドラ
イブ装置を介して、或いは、LAN等のネットワークを
介して、コンピュータに設けられたファイル装置にイン
ストールされる。そして、このファイル装置から処理に
必要なプログラムステップを主記憶に読み出し、主制御
部が実行するものである。
【0069】以上の実施の形態のように、一般的な言語
事象を従来のルールベースで記述し、語彙に依存した例
外的な事象をパターンの記述とすることで、高品質の翻
訳を効率よく行うことができる。
【0070】従来のルールベース翻訳の開発で培った文
法規則を無駄にすることなく、パターン規則を補完的に
扱うことができる点も大きなメリットとなっている。パ
ターンの規則をCFG形式で書くことにし、一般の文法
規則に変換すれば、パターンマッチの過程をそのまま従
来の構文解析に含めることもできる。
【0071】
【発明の効果】以上説明したように、本発明によれば次
のような効果がある。 (1):訳文生成手段で、入力された原文の中でパター
ンマッチした部分はパターンに基づいて翻訳し、パター
ンマッチしなかった部分は前記文法規則に基づいて翻訳
するため、文法規則による翻訳とパターンによる翻訳が
相互に補完しながら高品質の翻訳を行うことができる。
【0072】(2):パターン規則が文脈自由文法の形
式で記述され、文法規則の一部として解析手段でパター
ンマッチが実現されるため、文法規則部に格納されたパ
ターン規則を使用でき、解析手段で構文解析とパターン
マッチを同時に行うことができる。
【0073】(3):パターン規則部にパターン規則を
登録する際に、パターン全体と可変部の統語範疇を各々
指定できるようにするため、適用すべきでない間違った
パターンの適用を減らすことができる。
【0074】(4):パターンマッチ手段で、パターン
規則部に登録したパターン規則を前記入力された原文の
構文解析結果へのマッチングを行うため、適用すべきで
ない不当な部分へのパターンマッチングを防止すること
ができる。
【0075】(5):パターン規則に、パターン適用の
条件を指定可能とするため、パターン規則に文法属性、
意味素性などの制約を与え、パターン適用の条件を細か
く制御し、より高品質の翻訳を行うことができる。
【0076】(6):パターン規則に固定部と任意の文
字列にマッチする可変部と、構造変形手段にマッチング
したパターンの可変部と翻訳に用いる中間言語とを対応
づける機能を備え、前記構造変形手段で、前記パターン
の可変部に対応する中間言語を利用して、パターンに基
づいた翻訳が可能な中間言語に変換するため、中間言語
を利用して高品質の翻訳を行うことができる。
【0077】(7):中間言語として意味ネットを使用
し、構造変形手段で、前記意味ネットのリンクをつなぎ
かえることによりパターンに基づく翻訳を行うため、意
味ネットを利用して高品質の翻訳を行うことができる。
【0078】(8):中間言語として階層的な素性構造
を使用し、構造変形手段で、前記素性構造を組み替える
ことによりパターンに基づく翻訳を行うため、素性構造
を利用して高品質の翻訳を行うことができる。
【0079】(9):コンピュータを、原文を入力する
入力手段と、該入力された原文の形態素解析と構文解析
を行う解析手段と、原文と訳文との翻訳事例のパターン
規則と前記入力された原文の構文解析結果とのマッチン
グ処理を行うパターンマッチ手段と、前記入力された原
文の中でパターンマッチした部分はパターンに基づいて
訳文を生成し、パターンマッチしなかった部分は前記文
法規則に基づいて訳文を生成する訳文生成手段として機
能させるためのプログラムを記録したコンピュータ読取
可能な記録媒体とするため、この記録媒体のプログラム
をコンピュータにインストールすることで、高品質の翻
訳を行うことができる機械翻訳装置を容易に提供するこ
とができる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】実施の形態における翻訳装置の説明図である。
【図3】実施の形態における構文解析結果の説明図であ
る。
【図4】実施の形態における解析木へのパターン適用の
説明図である。
【図5】実施の形態における適用パターンによる解析木
の変形の説明図である。
【図6】実施の形態における意味ネットの説明図であ
る。
【図7】実施の形態における初期化時にパターンを文法
に変換する説明図である。
【図8】実施の形態における意味ネットを変形対象とす
る場合の説明図である。
【図9】実施の形態における素性構造を変形対象とする
場合の説明図である。
【図10】実施の形態における変形後の素性構造の説明
図である。
【図11】実施の形態におけるパターン登録画面の説明
図である。
【図12】実施の形態における構文解析木の説明図であ
る。
【符号の説明】
1a 入力手段 2a 解析手段 3a パターンマッチ手段 4a 構造変形手段 5a 訳文生成手段 6 文法規則部 7 辞書部 8 パターン規則部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−160473(JP,A) 特開 平9−179864(JP,A) 特開 平4−372061(JP,A) 加藤直人,定型パターンを含む文の機 械翻訳方法,情報処理学会論文誌,日 本,1995年 9月15日,Vol.36,N o.9,p.2081−p.2090 (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/28

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】原文を入力する入力手段と、 該入力された原文の形態素解析と構文解析を行う解析手
    段と、 該解析する文法規則を格納する文法規則部と、 原文と訳文との翻訳事例のパターン規則を格納するパタ
    ーン規則部と、 前記パターン規則と前記入力された原文とのマッチング
    処理を行うパターンマッチ手段と、 訳文の生成を行う訳文生成手段とを備え、前記パターンマッチ手段は、前記パターン規則を前記入
    力された原文の構文解析結果へのマッチングを行い、 前記訳文生成手段は、前記入力された原文の中でパター
    ンマッチした部分はパターンに基づいて翻訳し、パター
    ンマッチしなかった部分は前記文法規則に基づいて翻訳
    することを特徴とした機械翻訳装置。
  2. 【請求項2】前記パターン規則が文脈自由文法の形式で
    記述され、前記文法規則の一部として前記解析手段でパ
    ターンマッチが実現されることを特徴とした請求項1記
    載の機械翻訳装置。
  3. 【請求項3】前記パターン規則部のパターン規則に固定
    部と任意の文字列にマッチする可変部とを備え、 前記パターン規則部にパターン規則を登録する際に、パ
    ターン全体と可変部の統語範疇を各々指定できるように
    することを特徴とした請求項1記載の機械翻訳装置。
  4. 【請求項4】前記パターン規則に、パターン適用の条件
    を指定可能とすることを特徴とした請求項1記載の機械
    翻訳装置。
  5. 【請求項5】前記パターン規則に固定部と任意の文字列
    にマッチする可変部と、 前記構文解析の出力にパターン規則が反映された形に変
    換する構造変形手段と、 前記構造変形手段にマッチングしたパターンの可変部と
    翻訳に用いる中間言語とを対応づける機能とを備え、 前記構造変形手段は、前記パターンの可変部に対応する
    前記中間言語を利用して、パターンに基づいた翻訳が可
    能な中間言語に変換することを特徴とした請求項1記載
    の機械翻訳装置。
  6. 【請求項6】前記中間言語として意味ネットを使用し、
    前記構造変形手段は、前記意味ネットのリンクをつなぎ
    かえることによりパターンに基づく翻訳を行うことを特
    徴とした請求項記載の機械翻訳装置。
  7. 【請求項7】前記中間言語として階層的な素性構造を使
    用し、前記構造変形手段は、前記素性構造を組み替える
    ことによりパターンに基づく翻訳を行うことを特徴とし
    た請求項記載の機械翻訳装置。
  8. 【請求項8】コンピュータを、 原文を入力する入力手段と、 該入力された原文の形態素解析と構文解析を行う解析手
    段と、 原文と訳文との翻訳事例のパターン規則と前記入力され
    た原文の構文解析結果とのマッチング処理を行うパター
    ンマッチ手段と、 前記入力された原文の中でパターンマッチした部分はパ
    ターンに基づいて訳文を生成し、パターンマッチしなか
    った部分は前記文法規則に基づいて訳文を生成する訳文
    生成手段として機能させるためのプログラムを記録した
    コンピュータ読取可能な記録媒体。
JP07210698A 1998-03-20 1998-03-20 機械翻訳装置及び記録媒体 Expired - Fee Related JP3430007B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07210698A JP3430007B2 (ja) 1998-03-20 1998-03-20 機械翻訳装置及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07210698A JP3430007B2 (ja) 1998-03-20 1998-03-20 機械翻訳装置及び記録媒体

Publications (2)

Publication Number Publication Date
JPH11272672A JPH11272672A (ja) 1999-10-08
JP3430007B2 true JP3430007B2 (ja) 2003-07-28

Family

ID=13479823

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07210698A Expired - Fee Related JP3430007B2 (ja) 1998-03-20 1998-03-20 機械翻訳装置及び記録媒体

Country Status (1)

Country Link
JP (1) JP3430007B2 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005527894A (ja) 2002-03-28 2005-09-15 ユニバーシティ・オブ・サザン・カリフォルニア 統計的機械翻訳
US7711545B2 (en) 2003-07-02 2010-05-04 Language Weaver, Inc. Empirical methods for splitting compound words with application to machine translation
US7698125B2 (en) 2004-03-15 2010-04-13 Language Weaver, Inc. Training tree transducers for probabilistic operations
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US7974833B2 (en) 2005-06-21 2011-07-05 Language Weaver, Inc. Weighted system of expressing language information using a compact notation
US7389222B1 (en) 2005-08-02 2008-06-17 Language Weaver, Inc. Task parallelization in a text-to-text system
US7813918B2 (en) 2005-08-03 2010-10-12 Language Weaver, Inc. Identifying documents which form translated pairs, within a document collection
US7624020B2 (en) 2005-09-09 2009-11-24 Language Weaver, Inc. Adapter for allowing both online and offline training of a text to text system
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
KR100834549B1 (ko) 2006-10-19 2008-06-02 한국전자통신연구원 번역 시스템 및 번역 서비스 제공방법
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
加藤直人,定型パターンを含む文の機械翻訳方法,情報処理学会論文誌,日本,1995年 9月15日,Vol.36,No.9,p.2081−p.2090

Also Published As

Publication number Publication date
JPH11272672A (ja) 1999-10-08

Similar Documents

Publication Publication Date Title
JP3430007B2 (ja) 機械翻訳装置及び記録媒体
EP1489523B1 (en) Adaptive machine translation
US7383542B2 (en) Adaptive machine translation service
JP4554273B2 (ja) 機械トランスレータをトレーニングする方法およびそのシステム
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
US7752034B2 (en) Writing assistance using machine translation techniques
JP2005507525A (ja) 機械翻訳
JPH03260766A (ja) 括弧生成判定機能付翻訳装置
Cyre Extracting design models from natural language descriptions
Cyre Toward synthesis from English descriptions
JPH08190562A (ja) 機械翻訳装置
JPS63136265A (ja) 機械翻訳装置
JPH11265381A (ja) 言語変換方法ならびに装置及び同方法がプログラムされ記録される記録媒体
US20030088858A1 (en) Closed-loop design methodology for matching customer requirements to software design
JP3339006B2 (ja) 機械翻訳装置における並列名詞句処理装置
JP2003114890A (ja) 翻訳装置、翻訳方法、翻訳サーバおよびプログラム
JPH11143876A (ja) 双方向機械翻訳装置
Brøndsted The natural language processing modules in REWARD and intellimedia 2000+
JPH041852A (ja) 機械翻訳装置
JP4092861B2 (ja) 自然言語パターン作成装置及び方法
JPH0668143A (ja) 対訳辞書作成支援システム
JPH10340264A (ja) 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05290085A (ja) 機械翻訳装置
JPH06348465A (ja) プログラム作成支援装置
JPH0410056A (ja) 機械翻訳システム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030430

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080516

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090516

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090516

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100516

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100516

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140516

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees