JP2001222529A - 機械翻訳システム及びプログラムを記録した機械読み取り可能な記録媒体 - Google Patents
機械翻訳システム及びプログラムを記録した機械読み取り可能な記録媒体Info
- Publication number
- JP2001222529A JP2001222529A JP2000038052A JP2000038052A JP2001222529A JP 2001222529 A JP2001222529 A JP 2001222529A JP 2000038052 A JP2000038052 A JP 2000038052A JP 2000038052 A JP2000038052 A JP 2000038052A JP 2001222529 A JP2001222529 A JP 2001222529A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- character string
- sentence
- editing
- machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】
【課題】 複数の機械翻訳手段の中に入力文全体を正し
く翻訳できるものが1つも存在しない場合であっても、
正しい翻訳結果を導出する。 【解決手段】 翻訳範囲切り出し手段21は、キーボード
等の入力装置11から入力される原言語による文章を1文
毎に、句や節等の文単位より小さな単位の翻訳範囲に切
り出し、各翻訳範囲をその翻訳範囲の翻訳が得意な機械
翻訳関数31−1が存在するときはその機械翻訳関数31−
1に翻訳させ、存在しないときは翻訳元の言語文字列を
翻訳先の言語文字列へ直接変換する文字列置き換え手段
24で変換させる。翻訳結果組み合わせ手段25は、機械翻
訳関数31−1による翻訳結果、文字列置き換え手段24に
よる変換結果を組み合わせ、入力文全体の翻訳結果を生
成し、ディスプレイ装置等の出力装置13から出力する。
く翻訳できるものが1つも存在しない場合であっても、
正しい翻訳結果を導出する。 【解決手段】 翻訳範囲切り出し手段21は、キーボード
等の入力装置11から入力される原言語による文章を1文
毎に、句や節等の文単位より小さな単位の翻訳範囲に切
り出し、各翻訳範囲をその翻訳範囲の翻訳が得意な機械
翻訳関数31−1が存在するときはその機械翻訳関数31−
1に翻訳させ、存在しないときは翻訳元の言語文字列を
翻訳先の言語文字列へ直接変換する文字列置き換え手段
24で変換させる。翻訳結果組み合わせ手段25は、機械翻
訳関数31−1による翻訳結果、文字列置き換え手段24に
よる変換結果を組み合わせ、入力文全体の翻訳結果を生
成し、ディスプレイ装置等の出力装置13から出力する。
Description
【0001】
【発明の属する技術分野】本発明は機械翻訳システムに
関し、特に複数の機械翻訳手段が利用可能であるような
環境において最適な機械翻訳結果を得ることができる機
械翻訳システムに関する。
関し、特に複数の機械翻訳手段が利用可能であるような
環境において最適な機械翻訳結果を得ることができる機
械翻訳システムに関する。
【0002】
【従来の技術】機械翻訳システムの性能は年々向上して
いるが、1システムで全ての翻訳を正しく行えるような
機械翻訳システムは未だ実現されていないのが実情であ
る。このような実情に鑑み、例えば特開平7−2882
6号公報では、複数の機械翻訳システムを用意し、原言
語の文章を複数の機械翻訳システムに同時に翻訳させ、
その結果の文章の中から適切なものを選ぶことで、より
翻訳精度の高い翻訳結果を得る方法が提案されている。
いるが、1システムで全ての翻訳を正しく行えるような
機械翻訳システムは未だ実現されていないのが実情であ
る。このような実情に鑑み、例えば特開平7−2882
6号公報では、複数の機械翻訳システムを用意し、原言
語の文章を複数の機械翻訳システムに同時に翻訳させ、
その結果の文章の中から適切なものを選ぶことで、より
翻訳精度の高い翻訳結果を得る方法が提案されている。
【0003】
【発明が解決しようとする課題】しかしながら上述した
従来技術では、複数の機械翻訳システムの中に、入力文
を正しく翻訳できるシステムが1つも存在しない場合、
正しい翻訳結果を得ることはできない。その理由は、個
々の機械翻訳システムの翻訳結果の選択は文単位でしか
行えないため、たとえ文の前半を正しく翻訳できた機械
翻訳システムと、文の後半を正しく翻訳できた機械翻訳
システムがあったとしても、その何れか一方しか選択で
きず、前者を選択した場合には文の後半が、後者を選択
した場合には文の前半がそれぞれ正しい訳にならないか
らである。この場合、各機械翻訳システムのカスタマイ
ズを入念に行って、あらゆる文に対し少なくとも1つの
機械翻訳システムで正しい翻訳結果が得られるようにす
れば良いが、そのようなカスタマイズは非常にコストが
かかり、かつ限界がある。
従来技術では、複数の機械翻訳システムの中に、入力文
を正しく翻訳できるシステムが1つも存在しない場合、
正しい翻訳結果を得ることはできない。その理由は、個
々の機械翻訳システムの翻訳結果の選択は文単位でしか
行えないため、たとえ文の前半を正しく翻訳できた機械
翻訳システムと、文の後半を正しく翻訳できた機械翻訳
システムがあったとしても、その何れか一方しか選択で
きず、前者を選択した場合には文の後半が、後者を選択
した場合には文の前半がそれぞれ正しい訳にならないか
らである。この場合、各機械翻訳システムのカスタマイ
ズを入念に行って、あらゆる文に対し少なくとも1つの
機械翻訳システムで正しい翻訳結果が得られるようにす
れば良いが、そのようなカスタマイズは非常にコストが
かかり、かつ限界がある。
【0004】そこで本発明の目的は、複数の機械翻訳手
段の中に入力文を正しく翻訳できるものが1つも存在し
ない場合であっても、入力文全体の正しい翻訳結果を導
出することが可能な機械翻訳システムを提供することに
ある。
段の中に入力文を正しく翻訳できるものが1つも存在し
ない場合であっても、入力文全体の正しい翻訳結果を導
出することが可能な機械翻訳システムを提供することに
ある。
【0005】
【課題を解決するための手段】本発明の第1の発明にか
かる機械翻訳システムは、原言語表現を目的言語表現に
変換する複数の機械翻訳手段と、入力の原言語による文
から文単位より小さな句、節等の単位の複数の翻訳範囲
を切り出し、各翻訳範囲をその翻訳範囲の翻訳が得意な
前記機械翻訳手段に翻訳させる翻訳範囲切り出し手段
と、前記複数の機械翻訳手段による翻訳結果を組み合わ
せて前記文の翻訳結果を生成する翻訳結果組み合わせ手
段とを有する。
かる機械翻訳システムは、原言語表現を目的言語表現に
変換する複数の機械翻訳手段と、入力の原言語による文
から文単位より小さな句、節等の単位の複数の翻訳範囲
を切り出し、各翻訳範囲をその翻訳範囲の翻訳が得意な
前記機械翻訳手段に翻訳させる翻訳範囲切り出し手段
と、前記複数の機械翻訳手段による翻訳結果を組み合わ
せて前記文の翻訳結果を生成する翻訳結果組み合わせ手
段とを有する。
【0006】また本発明の第2の発明にかかる機械翻訳
システムは、第1の発明の構成に加えて更に、前記切り
出された翻訳範囲に対して前編集を行う文字列前編集手
段と、前記機械翻訳手段による翻訳結果に対して後編集
を行う文字列後編集手段とを有する。
システムは、第1の発明の構成に加えて更に、前記切り
出された翻訳範囲に対して前編集を行う文字列前編集手
段と、前記機械翻訳手段による翻訳結果に対して後編集
を行う文字列後編集手段とを有する。
【0007】また本発明の第3の発明にかかる機械翻訳
システムは、第1または第2の発明の構成において、前
記複数の機械翻訳手段の1つに、翻訳元の言語文字列を
翻訳先の言語文字列へ直接変換する文字列変換手段を使
用する。
システムは、第1または第2の発明の構成において、前
記複数の機械翻訳手段の1つに、翻訳元の言語文字列を
翻訳先の言語文字列へ直接変換する文字列変換手段を使
用する。
【0008】第1の発明にかかる機械翻訳システムにお
いては、翻訳範囲切り出し手段が、キーボード等の入力
装置から入力される原言語による文章を1文毎に、句や
節等の文単位より小さな単位の翻訳範囲に切り出し、各
翻訳範囲をその翻訳範囲の翻訳が得意な機械翻訳手段に
翻訳させる。そして、翻訳結果組み合わせ手段が、複数
の機械翻訳手段による翻訳結果を組み合わせ、入力文の
翻訳結果を生成してディスプレイ装置等の出力装置から
出力する。
いては、翻訳範囲切り出し手段が、キーボード等の入力
装置から入力される原言語による文章を1文毎に、句や
節等の文単位より小さな単位の翻訳範囲に切り出し、各
翻訳範囲をその翻訳範囲の翻訳が得意な機械翻訳手段に
翻訳させる。そして、翻訳結果組み合わせ手段が、複数
の機械翻訳手段による翻訳結果を組み合わせ、入力文の
翻訳結果を生成してディスプレイ装置等の出力装置から
出力する。
【0009】また第2の発明にかかる機械翻訳システム
においては、文字列前編集手段が、機械翻訳手段で正し
い翻訳が行われるようにするために機械翻訳手段による
翻訳前に翻訳範囲に対して前編集を行い、他方、文字列
後編集手段が、翻訳結果を組み上げる前に目的言語で正
しい意味を持つ文字列となるように変換する。
においては、文字列前編集手段が、機械翻訳手段で正し
い翻訳が行われるようにするために機械翻訳手段による
翻訳前に翻訳範囲に対して前編集を行い、他方、文字列
後編集手段が、翻訳結果を組み上げる前に目的言語で正
しい意味を持つ文字列となるように変換する。
【0010】また第3の発明にかかる機械翻訳システム
においては、文字列変換手段が、翻訳元の言語文字列を
翻訳先の言語文字列へ直接変換することで、他の機械翻
訳手段で翻訳できない文字列の直接的な変換を実現す
る。
においては、文字列変換手段が、翻訳元の言語文字列を
翻訳先の言語文字列へ直接変換することで、他の機械翻
訳手段で翻訳できない文字列の直接的な変換を実現す
る。
【0011】
【発明の実施の形態】次に本発明の実施の形態の例につ
いて図面を参照して詳細に説明する。
いて図面を参照して詳細に説明する。
【0012】図1を参照すると、本実施の形態にかかる
機械翻訳システム10は、原言語による文章または文書
を入力するキーボード等の入力装置11と、入力装置1
1から入力された原言語による文章または文書を目的言
語による文章または文書に翻訳する翻訳装置12と、翻
訳装置12で得られた翻訳結果などを表示するディスプ
レイ装置等の出力装置13とから構成される。
機械翻訳システム10は、原言語による文章または文書
を入力するキーボード等の入力装置11と、入力装置1
1から入力された原言語による文章または文書を目的言
語による文章または文書に翻訳する翻訳装置12と、翻
訳装置12で得られた翻訳結果などを表示するディスプ
レイ装置等の出力装置13とから構成される。
【0013】また、翻訳装置12は、翻訳範囲切り出し
手段21、文字列前編集手段22、翻訳関数呼び出し手
段23、文字列置き換え手段24、翻訳結果組み合わせ
手段25および文字列後編集手段26といった機能部
と、翻訳関数格納手段31、文分割ルール格納手段3
2、前編集要否判定テーブル格納手段33、前編集変換
パタン格納手段34、適用関数決定テーブル格納手段3
5、文字列置き換えパタン格納手段36、文組み上げル
ール格納手段37、後編集要否判定テーブル格納手段3
8、後編集変換パタン格納手段39といった記憶部とを
備えている。
手段21、文字列前編集手段22、翻訳関数呼び出し手
段23、文字列置き換え手段24、翻訳結果組み合わせ
手段25および文字列後編集手段26といった機能部
と、翻訳関数格納手段31、文分割ルール格納手段3
2、前編集要否判定テーブル格納手段33、前編集変換
パタン格納手段34、適用関数決定テーブル格納手段3
5、文字列置き換えパタン格納手段36、文組み上げル
ール格納手段37、後編集要否判定テーブル格納手段3
8、後編集変換パタン格納手段39といった記憶部とを
備えている。
【0014】さらに翻訳関数格納手段31には、複数の
種類の機械翻訳関数31−1〜31−nが記憶されてい
る。各々の機械翻訳関数31−1〜31−nは、入力と
して原文の句や節などの文の一部或いは文全体を受け取
り、それを翻訳して結果を出力する関数であり、それぞ
れ1つの機械翻訳手段を構成する。機械翻訳関数31−
1〜31−nとしては、その内部でどのような方式で機
械翻訳しているか否かを問わず、既存の機械翻訳システ
ムの任意のものを使用することが可能である。なお、文
字列置き換え手段24も機械翻訳手段の一種であるが、
文字列置き換え手段24は翻訳元の言語文字列を翻訳先
の言語文字列へパタン変換により直接変換する意味で、
既存の機械翻訳システムとは相違する。
種類の機械翻訳関数31−1〜31−nが記憶されてい
る。各々の機械翻訳関数31−1〜31−nは、入力と
して原文の句や節などの文の一部或いは文全体を受け取
り、それを翻訳して結果を出力する関数であり、それぞ
れ1つの機械翻訳手段を構成する。機械翻訳関数31−
1〜31−nとしては、その内部でどのような方式で機
械翻訳しているか否かを問わず、既存の機械翻訳システ
ムの任意のものを使用することが可能である。なお、文
字列置き換え手段24も機械翻訳手段の一種であるが、
文字列置き換え手段24は翻訳元の言語文字列を翻訳先
の言語文字列へパタン変換により直接変換する意味で、
既存の機械翻訳システムとは相違する。
【0015】図2および図3は本実施の形態にかかる機
械翻訳システム10の処理例を示すフローチャートであ
る。図1乃至図3を参照すると、本例の機械翻訳システ
ム10は概ね以下のように機能する。
械翻訳システム10の処理例を示すフローチャートであ
る。図1乃至図3を参照すると、本例の機械翻訳システ
ム10は概ね以下のように機能する。
【0016】入力装置11より入力された原言語による
文章または文書は、一文単位で翻訳範囲切り出し手段2
1へ渡される(図2のステップA1)。翻訳範囲切り出
し手段21は先ず、文分割ルール格納手段32に事前に
格納された文分割ルールを参照して、入力文を文単位よ
り小さな単位である句や節等に分割し、その各々の分割
部分を1つの翻訳範囲として切り出す(ステップA
2)。次に、前編集要否判定テーブル格納手段33に事
前に格納された前編集要否判定テーブルを参照し、切り
出した各々の翻訳範囲に対する前編集の必要性の有無を
判別する(ステップA3、A4)。前編集が必要と判断
された翻訳範囲は文字列前編集手段22に送られ、前編
集変換パタン格納手段34に事前に格納された前編集変
換パタンに基づいて前編集が施された後、翻訳範囲切り
出し手段21に戻される(ステップA5)。
文章または文書は、一文単位で翻訳範囲切り出し手段2
1へ渡される(図2のステップA1)。翻訳範囲切り出
し手段21は先ず、文分割ルール格納手段32に事前に
格納された文分割ルールを参照して、入力文を文単位よ
り小さな単位である句や節等に分割し、その各々の分割
部分を1つの翻訳範囲として切り出す(ステップA
2)。次に、前編集要否判定テーブル格納手段33に事
前に格納された前編集要否判定テーブルを参照し、切り
出した各々の翻訳範囲に対する前編集の必要性の有無を
判別する(ステップA3、A4)。前編集が必要と判断
された翻訳範囲は文字列前編集手段22に送られ、前編
集変換パタン格納手段34に事前に格納された前編集変
換パタンに基づいて前編集が施された後、翻訳範囲切り
出し手段21に戻される(ステップA5)。
【0017】次に翻訳範囲切り出し手段21は、切り出
した各々の翻訳範囲(前編集が必要であった翻訳範囲は
前編集後のもの)毎に(ステップA3、A11)、文分
割ルールを参照してその処理方法を判別し(ステップA
6、A7)、機械翻訳関数による翻訳および文字列変換
による翻訳が共に必要のない翻訳範囲はそのまま翻訳結
果組み合わせ手段25に送り(ステップA8)、文字列
変換による翻訳が必要な翻訳範囲は文字列置き換え手段
24に送り(ステップA10)、機械翻訳関数による翻
訳が必要な翻訳範囲は翻訳関数呼び出し手段23に送る
(ステップA9)。
した各々の翻訳範囲(前編集が必要であった翻訳範囲は
前編集後のもの)毎に(ステップA3、A11)、文分
割ルールを参照してその処理方法を判別し(ステップA
6、A7)、機械翻訳関数による翻訳および文字列変換
による翻訳が共に必要のない翻訳範囲はそのまま翻訳結
果組み合わせ手段25に送り(ステップA8)、文字列
変換による翻訳が必要な翻訳範囲は文字列置き換え手段
24に送り(ステップA10)、機械翻訳関数による翻
訳が必要な翻訳範囲は翻訳関数呼び出し手段23に送る
(ステップA9)。
【0018】文字列置き換え手段24は、文字列置き換
えパタン格納手段36に事前に格納された文字列置き換
えパタンを参照して、翻訳範囲切り出し手段21から送
られてきた翻訳範囲を目的言語の文字列表現に直接変換
し、翻訳結果組み合わせ手段25に送る。
えパタン格納手段36に事前に格納された文字列置き換
えパタンを参照して、翻訳範囲切り出し手段21から送
られてきた翻訳範囲を目的言語の文字列表現に直接変換
し、翻訳結果組み合わせ手段25に送る。
【0019】他方、翻訳関数呼び出し手段23は、適用
関数決定テーブル格納手段35に事前に格納された適用
関数決定テーブルを参照して、翻訳範囲切り出し手段2
1から送られてきた翻訳範囲を翻訳させる機械翻訳関数
を決定し、この決定した機械翻訳関数を呼び出して当該
翻訳範囲を翻訳させる。そして、その翻訳結果を翻訳結
果組み合わせ手段25に送る。
関数決定テーブル格納手段35に事前に格納された適用
関数決定テーブルを参照して、翻訳範囲切り出し手段2
1から送られてきた翻訳範囲を翻訳させる機械翻訳関数
を決定し、この決定した機械翻訳関数を呼び出して当該
翻訳範囲を翻訳させる。そして、その翻訳結果を翻訳結
果組み合わせ手段25に送る。
【0020】翻訳結果組み合わせ手段25は、翻訳範囲
切り出し手段21、文字列置き換え手段24および翻訳
関数呼び出し手段23から翻訳または変換等された句や
節等の翻訳範囲を受け取ると(図3のステップB1)、
後編集要否判定テーブル格納手段38に事前に格納され
た後編集要否判定テーブルを参照し、当該翻訳範囲に対
する後編集の必要性の有無を判別する(ステップB
2)。後編集が必要と判断された翻訳範囲は文字列後編
集手段26に送られ、後編集変換パタン格納手段39に
事前に格納された後編集変換パタンに基づいて後編集が
施された後、翻訳結果組み合わせ手段25に戻される
(ステップB3)。
切り出し手段21、文字列置き換え手段24および翻訳
関数呼び出し手段23から翻訳または変換等された句や
節等の翻訳範囲を受け取ると(図3のステップB1)、
後編集要否判定テーブル格納手段38に事前に格納され
た後編集要否判定テーブルを参照し、当該翻訳範囲に対
する後編集の必要性の有無を判別する(ステップB
2)。後編集が必要と判断された翻訳範囲は文字列後編
集手段26に送られ、後編集変換パタン格納手段39に
事前に格納された後編集変換パタンに基づいて後編集が
施された後、翻訳結果組み合わせ手段25に戻される
(ステップB3)。
【0021】翻訳結果組み合わせ手段25は、翻訳範囲
切り出し手段21で生成された全ての翻訳範囲の受け取
りと必要な後編集とが終了すると(ステップB4でノ
ー)、文組み上げルール格納手段37に事前に格納され
た文組み上げルールを参照して、それらの翻訳範囲を目
的言語の文法に沿った正しい順に組み上げ、入力文に対
する翻訳結果を生成する(ステップB5)。そして、そ
の翻訳結果を出力装置13に出力する。
切り出し手段21で生成された全ての翻訳範囲の受け取
りと必要な後編集とが終了すると(ステップB4でノ
ー)、文組み上げルール格納手段37に事前に格納され
た文組み上げルールを参照して、それらの翻訳範囲を目
的言語の文法に沿った正しい順に組み上げ、入力文に対
する翻訳結果を生成する(ステップB5)。そして、そ
の翻訳結果を出力装置13に出力する。
【0022】次に、本実施の形態にかかる機械翻訳シス
テム10のより詳しい構成と動作を説明する。なお、以
下の説明では、原言語と目的言語の対として、英語をフ
ランス語に翻訳する場合を例にしているが、本発明は他
のどんな言語対の翻訳に対しても適用可能である。
テム10のより詳しい構成と動作を説明する。なお、以
下の説明では、原言語と目的言語の対として、英語をフ
ランス語に翻訳する場合を例にしているが、本発明は他
のどんな言語対の翻訳に対しても適用可能である。
【0023】先ず、図1の各記憶部の詳細を説明する。
【0024】(1)文分割ルール格納手段32 文分割ルール格納手段32は、入力文の分割方法および
分割された各部分の処理方法を記述した文分割ルールを
複数格納している。個々の文分割ルールは、具体的に
は、入力された文を、 ・翻訳結果組み合わせ手段25にそのまま送る部分 ・文字列置き換え手段24による文字列置き換え処理を
行った後、翻訳結果組み合わせ手段25にその結果を送
る部分 ・翻訳関数呼び出し手段23による翻訳関数を使った翻
訳処理を行った後、翻訳結果組み合わせ手段25にその
結果を送る部分 に分けるルールを記述している。1つのルールは、 (a)入力文の条件を表すパタンと、そのパタンでの各
部分の指定 (b)各部分に対する処理方法の指定 から構成される。このとき、(a)のパタンに当てはま
る入力文を指定されたように部分に分割し、その各部分
について、それぞれ(b)の処理を行うことが指定され
ることになる。
分割された各部分の処理方法を記述した文分割ルールを
複数格納している。個々の文分割ルールは、具体的に
は、入力された文を、 ・翻訳結果組み合わせ手段25にそのまま送る部分 ・文字列置き換え手段24による文字列置き換え処理を
行った後、翻訳結果組み合わせ手段25にその結果を送
る部分 ・翻訳関数呼び出し手段23による翻訳関数を使った翻
訳処理を行った後、翻訳結果組み合わせ手段25にその
結果を送る部分 に分けるルールを記述している。1つのルールは、 (a)入力文の条件を表すパタンと、そのパタンでの各
部分の指定 (b)各部分に対する処理方法の指定 から構成される。このとき、(a)のパタンに当てはま
る入力文を指定されたように部分に分割し、その各部分
について、それぞれ(b)の処理を行うことが指定され
ることになる。
【0025】例えば、パタンを正規表現によって記述
し、括弧記号()によって部分を指定し、各部分に対し
て先頭から順に1から番号(部分番号)を振るものとす
ると、文分割ルールは例えば図4のように記述される。
例えばルール番号Aのルールでは、入力文が、”Wha
t time.* \?”という正規表現にマッチする場
合、部分1=”What time”にマッチする部
分、部分2=”.* ”にマッチする部分、部分3=”\
?”にマッチする部分に分割し、部分1に対しては文字
列置き換え処理を行い、部分2に対しては翻訳関数を呼
び出して翻訳を行い、部分3に対しては処理を行わずに
そのまま翻訳結果組み合わせ手段25に送ることを記述
している。
し、括弧記号()によって部分を指定し、各部分に対し
て先頭から順に1から番号(部分番号)を振るものとす
ると、文分割ルールは例えば図4のように記述される。
例えばルール番号Aのルールでは、入力文が、”Wha
t time.* \?”という正規表現にマッチする場
合、部分1=”What time”にマッチする部
分、部分2=”.* ”にマッチする部分、部分3=”\
?”にマッチする部分に分割し、部分1に対しては文字
列置き換え処理を行い、部分2に対しては翻訳関数を呼
び出して翻訳を行い、部分3に対しては処理を行わずに
そのまま翻訳結果組み合わせ手段25に送ることを記述
している。
【0026】なお、文分割ルールの中には、分割数が1
となるルールも含まれる。即ち、1文を分割しなくても
或る機械翻訳関数で正しく訳せる文は1文全体が1つの
翻訳範囲とされる。
となるルールも含まれる。即ち、1文を分割しなくても
或る機械翻訳関数で正しく訳せる文は1文全体が1つの
翻訳範囲とされる。
【0027】(2)文組み上げルール格納手段37 文組み上げルール格納手段37は、文分割ルールに従っ
て分割され、対応する処理が行われた各部分をどのよう
な順序で結合するかを記述した文組み上げルールを複数
格納している。つまり、文分割ルールと文組み上げルー
ルはセットになっており、1つの文分割ルールに対し
て、それによって分割された各部分を結合するための文
組み上げルール1つが対応する。例えば、図4のルール
番号A、Bの文分割ルールに対応する文組み上げルール
は、図5のように記述される。例えば、ルール番号Aの
文組み上げルールの場合、対応する文分割ルールAで分
割されて処理された各部分を、部分番号1、2、3の順
につなげて、訳文を作るというルールになっている。こ
のように、同じセットの文分割ルールと文組み上げルー
ルには同じルール番号が付けられる。なお、分割数1の
文分割ルールに対応する文組み上げルールには部分番号
が1つだけ記述されている。
て分割され、対応する処理が行われた各部分をどのよう
な順序で結合するかを記述した文組み上げルールを複数
格納している。つまり、文分割ルールと文組み上げルー
ルはセットになっており、1つの文分割ルールに対し
て、それによって分割された各部分を結合するための文
組み上げルール1つが対応する。例えば、図4のルール
番号A、Bの文分割ルールに対応する文組み上げルール
は、図5のように記述される。例えば、ルール番号Aの
文組み上げルールの場合、対応する文分割ルールAで分
割されて処理された各部分を、部分番号1、2、3の順
につなげて、訳文を作るというルールになっている。こ
のように、同じセットの文分割ルールと文組み上げルー
ルには同じルール番号が付けられる。なお、分割数1の
文分割ルールに対応する文組み上げルールには部分番号
が1つだけ記述されている。
【0028】(3)前編集変換パタン格納手段34 前編集変換パタン格納手段34は、編集前の文字列パタ
ンと編集後の文字列パタンの組である前編集変換パタン
を複数格納している。例えば、パタンを正規表現で記述
するものとし、編集前パタンにおいて括弧()でくくら
れた部分を、編集後パタンにおいて順に$1、…として
参照できるものとすると、例えば図6に示すように記述
される。例えば、パタン番号Xの前編集変換パタンで
は、”Itis believed”を、”Peopl
e believe”に変換することが指定され、パタ
ン番号Yの前編集変換パタンでは、”I can sp
eak”を、”I speak”に変換することが指定
されている。
ンと編集後の文字列パタンの組である前編集変換パタン
を複数格納している。例えば、パタンを正規表現で記述
するものとし、編集前パタンにおいて括弧()でくくら
れた部分を、編集後パタンにおいて順に$1、…として
参照できるものとすると、例えば図6に示すように記述
される。例えば、パタン番号Xの前編集変換パタンで
は、”Itis believed”を、”Peopl
e believe”に変換することが指定され、パタ
ン番号Yの前編集変換パタンでは、”I can sp
eak”を、”I speak”に変換することが指定
されている。
【0029】(4)前編集要否判定テーブル格納手段3
3 前編集要否判定テーブル格納手段33は、翻訳範囲切り
出し手段21が切り出した翻訳範囲の前編集の必要性の
有無を判定するための前編集要否判定テーブルを格納し
ている。図7に前編集要否判定テーブルの一例を示す。
この例では、文分割ルール番号、部分の番号、前編集変
換パタン番号の組を登録することで、各文分割ルールに
よって分割されてできる各部分毎に、適用する前編集パ
タンを指定している。例えば、1行目の記述は、文分割
ルールNによって分割されて出来た1番目の部分は、前
編集変換パタンXによる前編集が必要であることを示し
ている。なお、対応するものがテーブル中にない場合、
前編集の必要性がないことを意味する。
3 前編集要否判定テーブル格納手段33は、翻訳範囲切り
出し手段21が切り出した翻訳範囲の前編集の必要性の
有無を判定するための前編集要否判定テーブルを格納し
ている。図7に前編集要否判定テーブルの一例を示す。
この例では、文分割ルール番号、部分の番号、前編集変
換パタン番号の組を登録することで、各文分割ルールに
よって分割されてできる各部分毎に、適用する前編集パ
タンを指定している。例えば、1行目の記述は、文分割
ルールNによって分割されて出来た1番目の部分は、前
編集変換パタンXによる前編集が必要であることを示し
ている。なお、対応するものがテーブル中にない場合、
前編集の必要性がないことを意味する。
【0030】(5)後編集変換パタン格納手段39 後編集変換パタン格納手段39は、編集前の文字列パタ
ンと編集後の文字列パタンの組である後編集変換パタン
を複数格納している。後編集変換パタンは、図6に示し
た前編集変換パタンと同様に構成される。但し、何れの
パタンも目的言語による表現になっている点が、原言語
表現になっている前編集変換パタンと相違する。
ンと編集後の文字列パタンの組である後編集変換パタン
を複数格納している。後編集変換パタンは、図6に示し
た前編集変換パタンと同様に構成される。但し、何れの
パタンも目的言語による表現になっている点が、原言語
表現になっている前編集変換パタンと相違する。
【0031】(6)後編集要否判定テーブル格納手段3
8 後編集要否判定テーブル格納手段38は、翻訳結果組み
合わせ手段25が受け取った翻訳範囲の後編集の必要性
の有無を判定するための後編集要否判定テーブルを格納
している。後編集要否判定テーブルは、図7に示した前
編集要否判定テーブルと同様に構成される。但し、前編
集変換パタン番号には後編集変換パタン番号が記述され
る。
8 後編集要否判定テーブル格納手段38は、翻訳結果組み
合わせ手段25が受け取った翻訳範囲の後編集の必要性
の有無を判定するための後編集要否判定テーブルを格納
している。後編集要否判定テーブルは、図7に示した前
編集要否判定テーブルと同様に構成される。但し、前編
集変換パタン番号には後編集変換パタン番号が記述され
る。
【0032】(7)文字列置き換えパタン格納手段36 文字列置き換えパタン格納手段36は、置き換え前の文
字列パタンと置き換え後の文字列パタンの組を複数格納
している。置き換え前の文字列パタンを置き換え後の文
字列パタンに置換することで、文字列置き換え処理が行
われる。例えば、パタンとして文字列を記述するものと
すると、図8のような形式で記述される。パタン番号O
の置き換えパタンは、”what time”を、”a
quelle heure”に、パタン番号Pの置き
換えパタンは、”let meknow”を、”dit
es−moi”にそれぞれ変換することを示している。
前編集変換パタンの例で示したように、パタンを正規表
現で記述するようにしても構わない。
字列パタンと置き換え後の文字列パタンの組を複数格納
している。置き換え前の文字列パタンを置き換え後の文
字列パタンに置換することで、文字列置き換え処理が行
われる。例えば、パタンとして文字列を記述するものと
すると、図8のような形式で記述される。パタン番号O
の置き換えパタンは、”what time”を、”a
quelle heure”に、パタン番号Pの置き
換えパタンは、”let meknow”を、”dit
es−moi”にそれぞれ変換することを示している。
前編集変換パタンの例で示したように、パタンを正規表
現で記述するようにしても構わない。
【0033】(8)適用関数決定テーブル格納手段35 適用関数決定テーブル格納手段35は、翻訳関数呼び出
し手段23が翻訳範囲切り出し手段21から渡された翻
訳範囲をどの機械翻訳関数で翻訳させるべきかを判定す
るための適用関数決定テーブルを格納している。図9に
適用関数決定テーブルの一例を示す。この例では、文分
割ルール番号、部分の番号、呼び出すべき機械翻訳関数
の番号の組を登録することで、各文分割ルールによって
分割されてできる各部分毎に、機械翻訳関数を指定して
いる。例えば、1行目の記述は、文分割ルールTによっ
て分割されて出来た1番目の部分は、機械翻訳関数31
−1で翻訳すべきことを示している。
し手段23が翻訳範囲切り出し手段21から渡された翻
訳範囲をどの機械翻訳関数で翻訳させるべきかを判定す
るための適用関数決定テーブルを格納している。図9に
適用関数決定テーブルの一例を示す。この例では、文分
割ルール番号、部分の番号、呼び出すべき機械翻訳関数
の番号の組を登録することで、各文分割ルールによって
分割されてできる各部分毎に、機械翻訳関数を指定して
いる。例えば、1行目の記述は、文分割ルールTによっ
て分割されて出来た1番目の部分は、機械翻訳関数31
−1で翻訳すべきことを示している。
【0034】ここで、上述のような各格納手段に事前に
格納しておくべきルールやパタンについて説明する。
格納しておくべきルールやパタンについて説明する。
【0035】一般に各機械翻訳関数31−1〜31−n
は、正しく翻訳できる目的語表現に得意、不得意があ
り、正しく解析できない文型の文は正しく翻訳できな
い。正しく解析できるかどうかは、句や節ごとに変わっ
てくる。例えば、或る機械翻訳関数では、to不定詞を
うまく訳すことができないとか、別の機械翻訳関数で
は、It…that…の構文の解析に失敗するといった
ことがある。また、そのままでは正しく翻訳できない
が、所定の前編集を行っておけば正しく訳せる場合もあ
る。更に、どのように前編集しても正しく訳せる機械翻
訳関数が存在しない句や節もあり得る。文分割ルール
は、このような複数の機械翻訳関数の特性を考慮して作
成される。具体的には、例えば、 (a)前編集なしで何れかの機械翻訳関数で正しく訳せ
る句や節等 (b)前編集すれば何れかの機械翻訳関数で正しく訳せ
る句や節等 (c)前編集しても正しく訳せる機械翻訳関数が存在し
ない句や節等 (d)原言語と目的言語で全く同じ文字列で良い句や節
等 に入力文を分割する「パタンと部分の指定」を持つ文分
割ルールを必要な数だけ用意する。
は、正しく翻訳できる目的語表現に得意、不得意があ
り、正しく解析できない文型の文は正しく翻訳できな
い。正しく解析できるかどうかは、句や節ごとに変わっ
てくる。例えば、或る機械翻訳関数では、to不定詞を
うまく訳すことができないとか、別の機械翻訳関数で
は、It…that…の構文の解析に失敗するといった
ことがある。また、そのままでは正しく翻訳できない
が、所定の前編集を行っておけば正しく訳せる場合もあ
る。更に、どのように前編集しても正しく訳せる機械翻
訳関数が存在しない句や節もあり得る。文分割ルール
は、このような複数の機械翻訳関数の特性を考慮して作
成される。具体的には、例えば、 (a)前編集なしで何れかの機械翻訳関数で正しく訳せ
る句や節等 (b)前編集すれば何れかの機械翻訳関数で正しく訳せ
る句や節等 (c)前編集しても正しく訳せる機械翻訳関数が存在し
ない句や節等 (d)原言語と目的言語で全く同じ文字列で良い句や節
等 に入力文を分割する「パタンと部分の指定」を持つ文分
割ルールを必要な数だけ用意する。
【0036】そして、各文分割ルール毎に、そのルール
で分割される各部分毎に、前記(a)及び(b)に相当
する部分の処理として翻訳関数による翻訳を指定し、前
記(c)に相当する部分の処理として文字列変換を指定
し、前記(d)に相当する部分の処理としてそのまま翻
訳結果組み合わせ手段25に送ることを指定する。こう
して作成した図4に示したような文分割ルールを文分割
ルール格納手段32に格納する。また、各分割ルールと
セットになる図5に示したような文組み上げルールを作
成し、文組み上げルール格納手段37に格納しておく。
で分割される各部分毎に、前記(a)及び(b)に相当
する部分の処理として翻訳関数による翻訳を指定し、前
記(c)に相当する部分の処理として文字列変換を指定
し、前記(d)に相当する部分の処理としてそのまま翻
訳結果組み合わせ手段25に送ることを指定する。こう
して作成した図4に示したような文分割ルールを文分割
ルール格納手段32に格納する。また、各分割ルールと
セットになる図5に示したような文組み上げルールを作
成し、文組み上げルール格納手段37に格納しておく。
【0037】文字列置き換えパタンとしては、前記
(c)に相当する句や節等毎に必要な文字列置き換えパ
タンを図8に示したように作成し、文字列置き換えパタ
ン格納手段36に格納しておく。
(c)に相当する句や節等毎に必要な文字列置き換えパ
タンを図8に示したように作成し、文字列置き換えパタ
ン格納手段36に格納しておく。
【0038】前編集変換パタンとしては、前記(b)に
相当する句や節毎に必要な前編集変換パタンを図6に示
したように作成し、前編集変換パタン格納手段34に格
納しておく。そして、図6の前編集変換パタンと図4の
文分割ルールとに基づき図7に示したような前編集要否
判定テーブルを作成して前編集要否判定テーブル格納手
段33に格納する。
相当する句や節毎に必要な前編集変換パタンを図6に示
したように作成し、前編集変換パタン格納手段34に格
納しておく。そして、図6の前編集変換パタンと図4の
文分割ルールとに基づき図7に示したような前編集要否
判定テーブルを作成して前編集要否判定テーブル格納手
段33に格納する。
【0039】また、前記(a)および(b)に相当する
句や節毎に、それを正しく翻訳できる機械翻訳関数を決
定し、この決定内容と文分割ルールとに基づいて図9に
示したような適用関数決定テーブルを作成し、適用関数
決定テーブル格納手段35に格納する。
句や節毎に、それを正しく翻訳できる機械翻訳関数を決
定し、この決定内容と文分割ルールとに基づいて図9に
示したような適用関数決定テーブルを作成し、適用関数
決定テーブル格納手段35に格納する。
【0040】他方、機械翻訳関数による翻訳結果のなか
には目的言語の言語表現上、後編集が必要になるものが
あるため、必要な後編集変換パタンを作成して後編集変
換パタン格納手段39に登録し、後編集変換パタンと文
分割ルールとに基づいて後編集要否判定テーブルを作成
して後編集要否判定テーブル格納手段38に登録してお
く。
には目的言語の言語表現上、後編集が必要になるものが
あるため、必要な後編集変換パタンを作成して後編集変
換パタン格納手段39に登録し、後編集変換パタンと文
分割ルールとに基づいて後編集要否判定テーブルを作成
して後編集要否判定テーブル格納手段38に登録してお
く。
【0041】次に、上述のように各格納手段に事前に格
納されたルールやパタンを参照して動作する図1の各機
能部について説明する。
納されたルールやパタンを参照して動作する図1の各機
能部について説明する。
【0042】翻訳範囲切り出し手段21は、入力装置1
1から入力した文を正規表現に変換し、図4の文分割ル
ールから入力文に適用する文分割ルールを取り出す。つ
まり、「パタンと部分の指定」におけるパタンが入力文
のパタンにマッチする文分割ルールを取り出す。次に、
その文分割ルールの「パタンと部分の指定」に従って、
入力文を分割する。次に、各部分毎に、当該文分割ルー
ルの番号と当該部分の番号とをキーに図7の前編集要否
判定テーブルから前編集変換パタン番号を検索する。検
索に失敗したときは前編集の必要無しと判断し、検索に
成功したときは、検索した前編集変換パタン番号と当該
部分の翻訳範囲を文字列前編集手段22に送って前編集
を行わせる。文字列前編集手段22は、図6の前編集変
換パタンのうち送られてきた前編集変換パタン番号の変
換パタンを使用し、当該部分の翻訳範囲を編集後パタン
に置き換えて翻訳範囲切り出し手段21に戻す。
1から入力した文を正規表現に変換し、図4の文分割ル
ールから入力文に適用する文分割ルールを取り出す。つ
まり、「パタンと部分の指定」におけるパタンが入力文
のパタンにマッチする文分割ルールを取り出す。次に、
その文分割ルールの「パタンと部分の指定」に従って、
入力文を分割する。次に、各部分毎に、当該文分割ルー
ルの番号と当該部分の番号とをキーに図7の前編集要否
判定テーブルから前編集変換パタン番号を検索する。検
索に失敗したときは前編集の必要無しと判断し、検索に
成功したときは、検索した前編集変換パタン番号と当該
部分の翻訳範囲を文字列前編集手段22に送って前編集
を行わせる。文字列前編集手段22は、図6の前編集変
換パタンのうち送られてきた前編集変換パタン番号の変
換パタンを使用し、当該部分の翻訳範囲を編集後パタン
に置き換えて翻訳範囲切り出し手段21に戻す。
【0043】次に翻訳範囲切り出し手段21は、文分割
ルールの当該部分に対応する処理方法を参照し、各部分
毎の翻訳範囲を翻訳関数呼び出し手段23、文字列置き
換え手段24、翻訳結果組み合わせ手段25のうち該当
する手段に送り出す。このとき、使用した文分割ルール
の番号、当該部分の番号を付加して送出する。また、翻
訳範囲切り出し手段21は、翻訳結果組み合わせ手段2
5に対しては、使用した文分割ルールの番号を別途通知
する。
ルールの当該部分に対応する処理方法を参照し、各部分
毎の翻訳範囲を翻訳関数呼び出し手段23、文字列置き
換え手段24、翻訳結果組み合わせ手段25のうち該当
する手段に送り出す。このとき、使用した文分割ルール
の番号、当該部分の番号を付加して送出する。また、翻
訳範囲切り出し手段21は、翻訳結果組み合わせ手段2
5に対しては、使用した文分割ルールの番号を別途通知
する。
【0044】文字列置き換え手段24は、文字列置き換
えパタン格納手段36に格納された文字列置き換えパタ
ンのうち、翻訳範囲切り出し手段21から送出された文
分割ルールの番号および部分の番号に対応する置き換え
パタンを使用して、翻訳範囲切り出し手段21から送ら
れてきた翻訳範囲を目的言語の文字列表現に直接変換
し、翻訳結果組み合わせ手段25に送る。
えパタン格納手段36に格納された文字列置き換えパタ
ンのうち、翻訳範囲切り出し手段21から送出された文
分割ルールの番号および部分の番号に対応する置き換え
パタンを使用して、翻訳範囲切り出し手段21から送ら
れてきた翻訳範囲を目的言語の文字列表現に直接変換
し、翻訳結果組み合わせ手段25に送る。
【0045】翻訳関数呼び出し手段23は、翻訳範囲切
り出し手段21から送出された文分割ルールの番号およ
び部分の番号で適用関数決定テーブル格納手段35を検
索して呼び出すべき機械翻訳関数を決定し、この決定し
た機械翻訳関数を呼び出して当該翻訳範囲を翻訳させ
る。そして、その翻訳結果を翻訳結果組み合わせ手段2
5に送る。
り出し手段21から送出された文分割ルールの番号およ
び部分の番号で適用関数決定テーブル格納手段35を検
索して呼び出すべき機械翻訳関数を決定し、この決定し
た機械翻訳関数を呼び出して当該翻訳範囲を翻訳させ
る。そして、その翻訳結果を翻訳結果組み合わせ手段2
5に送る。
【0046】翻訳結果組み合わせ手段25は、翻訳範囲
切り出し手段21、文字列置き換え手段24および翻訳
関数呼び出し手段23から翻訳または変換等された句や
節等の翻訳範囲を受け取ると、付加された文分割ルール
の番号と部分の番号で後編集要否判定テーブル格納手段
38を検索して当該翻訳範囲に対する後編集の必要性の
有無を判別し、後編集が必要と判断された翻訳範囲は変
換パタン番号と共に文字列後編集手段26に送られる。
文字列後編集手段26は、その変換パタン番号の変換パ
タンを後編集変換パタン格納手段39から参照し、その
翻訳範囲を後編集パタンで置き換えて、翻訳結果組み合
わせ手段25に戻す。
切り出し手段21、文字列置き換え手段24および翻訳
関数呼び出し手段23から翻訳または変換等された句や
節等の翻訳範囲を受け取ると、付加された文分割ルール
の番号と部分の番号で後編集要否判定テーブル格納手段
38を検索して当該翻訳範囲に対する後編集の必要性の
有無を判別し、後編集が必要と判断された翻訳範囲は変
換パタン番号と共に文字列後編集手段26に送られる。
文字列後編集手段26は、その変換パタン番号の変換パ
タンを後編集変換パタン格納手段39から参照し、その
翻訳範囲を後編集パタンで置き換えて、翻訳結果組み合
わせ手段25に戻す。
【0047】翻訳結果組み合わせ手段25は、翻訳範囲
切り出し手段21で生成された全ての翻訳範囲の受け取
りと必要な後編集とが終了すると、文組み上げルール格
納手段37に事前に格納された文組み上げルールのう
ち、翻訳範囲切り出し手段21から通知された文分割ル
ールの番号と同じ番号の文組み上げルールを参照して、
それらの翻訳範囲を目的言語の文法に沿った正しい順に
組み上げ、入力文に対する翻訳結果を生成する。そし
て、その翻訳結果を出力装置13に出力する。
切り出し手段21で生成された全ての翻訳範囲の受け取
りと必要な後編集とが終了すると、文組み上げルール格
納手段37に事前に格納された文組み上げルールのう
ち、翻訳範囲切り出し手段21から通知された文分割ル
ールの番号と同じ番号の文組み上げルールを参照して、
それらの翻訳範囲を目的言語の文法に沿った正しい順に
組み上げ、入力文に対する翻訳結果を生成する。そし
て、その翻訳結果を出力装置13に出力する。
【0048】次に、具体的な実施例を用いて本実施の形
態の動作を更に詳しく説明する。
態の動作を更に詳しく説明する。
【0049】今、「What time do we
leave tomorrow?」という文が入力され
たとする。この文全体の正しい訳は、「A quell
eheure est−ce que nous pa
rtons demain?」である。この文全体を機
械翻訳関数で正しく訳すには、通常のWhatに対する
処理の例外としてWhat timeを処理しなければ
ならず、実際に市販されている機械翻訳ソフトウェアで
はこれらを正しく訳せるものは少ないか又は存在しな
い。
leave tomorrow?」という文が入力され
たとする。この文全体の正しい訳は、「A quell
eheure est−ce que nous pa
rtons demain?」である。この文全体を機
械翻訳関数で正しく訳すには、通常のWhatに対する
処理の例外としてWhat timeを処理しなければ
ならず、実際に市販されている機械翻訳ソフトウェアで
はこれらを正しく訳せるものは少ないか又は存在しな
い。
【0050】しかしながら、「What time」の
後ろだけを見ると「Do we leave tomo
rrow?」は通常の疑問文であり、特に翻訳の難しい
構文ではない。一般的には「What time〜」と
いう構文では、この後ろに疑問文が来ることが多い。こ
のため、本実施例では、何れかの機械翻訳関数に「Do
we leave tomorrow?」を翻訳さ
せ、その結果の「Est−ce que nous p
artons demain?」という文を得た後、
「What time」を文字列置き換え手段24によ
る直接文字列変換で「A quelle heure」
と変換し、これらを組み合わせることで「Aquell
e heure est−ce que nous p
artons demain?」という正しい結果を得
る。
後ろだけを見ると「Do we leave tomo
rrow?」は通常の疑問文であり、特に翻訳の難しい
構文ではない。一般的には「What time〜」と
いう構文では、この後ろに疑問文が来ることが多い。こ
のため、本実施例では、何れかの機械翻訳関数に「Do
we leave tomorrow?」を翻訳さ
せ、その結果の「Est−ce que nous p
artons demain?」という文を得た後、
「What time」を文字列置き換え手段24によ
る直接文字列変換で「A quelle heure」
と変換し、これらを組み合わせることで「Aquell
e heure est−ce que nous p
artons demain?」という正しい結果を得
る。
【0051】図1に沿って処理の流れを説明すると、翻
訳範囲切り出し手段21において、文分割ルールとして
入力文の形式が「What time」で始まるルール
が存在し、そのルールに従って文を「What tim
e」と後半とに分割する。その後、分割した後半の範囲
を翻訳関数呼び出し手段23へ送り、前半の「What
time」を文字列置き換え手段24へと送る。翻訳
関数呼び出し手段23では送られてきた文字列を翻訳可
能な機械翻訳関数を利用して翻訳し、翻訳結果組み合わ
せ手段25へ送る。文字列置き換え手段24では文字列
置き換えパタンに従って「What time」という
文字列を「A quelle heure」へと置き換
え、翻訳結果組み合わせ手段25へと送る。翻訳結果組
み合わせ手段25では、これら2つの文字列を受け取
り、翻訳範囲切り出し手段21での文分割ルールと連動
した文組み上げルールに従って、「A quelle
heure」に続いて機械翻訳関数の翻訳結果を結合し
出力とする。
訳範囲切り出し手段21において、文分割ルールとして
入力文の形式が「What time」で始まるルール
が存在し、そのルールに従って文を「What tim
e」と後半とに分割する。その後、分割した後半の範囲
を翻訳関数呼び出し手段23へ送り、前半の「What
time」を文字列置き換え手段24へと送る。翻訳
関数呼び出し手段23では送られてきた文字列を翻訳可
能な機械翻訳関数を利用して翻訳し、翻訳結果組み合わ
せ手段25へ送る。文字列置き換え手段24では文字列
置き換えパタンに従って「What time」という
文字列を「A quelle heure」へと置き換
え、翻訳結果組み合わせ手段25へと送る。翻訳結果組
み合わせ手段25では、これら2つの文字列を受け取
り、翻訳範囲切り出し手段21での文分割ルールと連動
した文組み上げルールに従って、「A quelle
heure」に続いて機械翻訳関数の翻訳結果を結合し
出力とする。
【0052】以上のようなルールとパタンを使えば、
「What time do weleave tom
orrow?」という文以外にも、「What tim
edoes he usually arrive?」
といった文も正しい翻訳結果が得られるようになる。
「What time do weleave tom
orrow?」という文以外にも、「What tim
edoes he usually arrive?」
といった文も正しい翻訳結果が得られるようになる。
【0053】他の文例を元に、前編集が有効となる変換
パタンについて説明する。英語で「It is bel
ieved〜」という文は、「(人々に)〜が信じられ
ている(〜だと思われている)」と言う意味で良く用い
られるが、このままフランス語に直訳すると正しくない
文となる。これを正しい文として翻訳するには、「人々
に」と言う意味を表に出して、「People bel
ieve〜」とした文を直訳すると正しい文となる。こ
の為、翻訳範囲切り出し手段21では、「Itis b
elieved〜」で始まる文があればそこで分割し、
且つ「Itis believed」を文字列前編集手
段22で「People believe」に置き換え
る。そして、前半と後半とを機械翻訳関数で翻訳させ
る。
パタンについて説明する。英語で「It is bel
ieved〜」という文は、「(人々に)〜が信じられ
ている(〜だと思われている)」と言う意味で良く用い
られるが、このままフランス語に直訳すると正しくない
文となる。これを正しい文として翻訳するには、「人々
に」と言う意味を表に出して、「People bel
ieve〜」とした文を直訳すると正しい文となる。こ
の為、翻訳範囲切り出し手段21では、「Itis b
elieved〜」で始まる文があればそこで分割し、
且つ「Itis believed」を文字列前編集手
段22で「People believe」に置き換え
る。そして、前半と後半とを機械翻訳関数で翻訳させ
る。
【0054】次に、他の文例を元に、後編集が有効とな
る変換パタンについて説明する。英語で「I am a
fraid that he is late.」をフ
ランス語に直訳すると「J’ai peur qu’i
l est en retard.」となり時制が間違
ってしまう。そこで上記のような例文は翻訳範囲切り出
し手段21において「I am afraid」と残り
の部分に分け、更に後半の範囲に対して文字列前編集手
段22において特定の未知語文字列を先頭単語として与
え、各々を機械翻訳関数で翻訳する。これにより、「I
am afraid」からは「J’ai peur」
が得られ、さらに未知語文字列を使うことで「###
that he is late.」からは「###q
u’ilsoit en retard.」が得られ
る。そこで、未知語文字列を文字列後編集手段26で削
った後に翻訳結果組み合わせ手段25で組み合わせるこ
とにより、「J’ai peur qu’il soi
t en retard.」という正しい翻訳結果を得
ることが可能である。
る変換パタンについて説明する。英語で「I am a
fraid that he is late.」をフ
ランス語に直訳すると「J’ai peur qu’i
l est en retard.」となり時制が間違
ってしまう。そこで上記のような例文は翻訳範囲切り出
し手段21において「I am afraid」と残り
の部分に分け、更に後半の範囲に対して文字列前編集手
段22において特定の未知語文字列を先頭単語として与
え、各々を機械翻訳関数で翻訳する。これにより、「I
am afraid」からは「J’ai peur」
が得られ、さらに未知語文字列を使うことで「###
that he is late.」からは「###q
u’ilsoit en retard.」が得られ
る。そこで、未知語文字列を文字列後編集手段26で削
った後に翻訳結果組み合わせ手段25で組み合わせるこ
とにより、「J’ai peur qu’il soi
t en retard.」という正しい翻訳結果を得
ることが可能である。
【0055】図10は本発明を適用したコンピュータの
構成例を示す構成図である。コンピュータ1は、中央処
理装置、主記憶、ハードディスク装置、フロッピィディ
スク装置、CD−ROMユニットなどを備えるコンピュ
ータ本体2と、表示装置3と、キーボード4と、マウス
5とで構成される。6はフロッピィディスク、CD−R
OM等の機械読み取り可能な記録媒体であり、機械翻訳
プログラムが記録されている。記録媒体6に記録された
機械翻訳プログラムは、コンピュータ本体2によって読
み取られ、コンピュータ本体2の動作を制御することに
より、コンピュータ本体2上に、図1に示した翻訳範囲
切り出し手段21、文字列前編集手段22、翻訳関数呼
び出し手段23、文字列置き換え手段24、翻訳結果組
み合わせ手段25および文字列後編集手段26といった
機能部と、翻訳関数格納手段31、文分割ルール格納手
段32、前編集要否判定テーブル格納手段33、前編集
変換パタン格納手段34、適用関数決定テーブル格納手
段35、文字列置き換えパタン格納手段36、文組み上
げルール格納手段37、後編集要否判定テーブル格納手
段38、後編集変換パタン格納手段39といった記憶部
とを生成する。
構成例を示す構成図である。コンピュータ1は、中央処
理装置、主記憶、ハードディスク装置、フロッピィディ
スク装置、CD−ROMユニットなどを備えるコンピュ
ータ本体2と、表示装置3と、キーボード4と、マウス
5とで構成される。6はフロッピィディスク、CD−R
OM等の機械読み取り可能な記録媒体であり、機械翻訳
プログラムが記録されている。記録媒体6に記録された
機械翻訳プログラムは、コンピュータ本体2によって読
み取られ、コンピュータ本体2の動作を制御することに
より、コンピュータ本体2上に、図1に示した翻訳範囲
切り出し手段21、文字列前編集手段22、翻訳関数呼
び出し手段23、文字列置き換え手段24、翻訳結果組
み合わせ手段25および文字列後編集手段26といった
機能部と、翻訳関数格納手段31、文分割ルール格納手
段32、前編集要否判定テーブル格納手段33、前編集
変換パタン格納手段34、適用関数決定テーブル格納手
段35、文字列置き換えパタン格納手段36、文組み上
げルール格納手段37、後編集要否判定テーブル格納手
段38、後編集変換パタン格納手段39といった記憶部
とを生成する。
【0056】以上本発明の実施の形態について説明した
が、本発明は以上の実施形態にのみ限定されず、その他
各種の付加変更が可能である。例えば、以下のように構
成することもできる。
が、本発明は以上の実施形態にのみ限定されず、その他
各種の付加変更が可能である。例えば、以下のように構
成することもできる。
【0057】翻訳範囲切り出し手段21では各部分の翻
訳範囲の前編集の要否を判定せずに各部分を文字列前編
集手段22に送り、文字列前編集手段22は、翻訳範囲
と一致する置き換え前パタンがあれば、それを対応する
置き換え後パタンに変換して戻す。この場合、前編集要
否判定テーブルは省略される。同様に、翻訳結果組み合
わせ手段25では各部分の翻訳範囲の後編集の要否を判
定せずに各部分を文字列後編集手段26に送り、文字列
後編集手段26は、翻訳範囲と一致する置き換え前パタ
ンがあれば、それを対応する置き換え後パタンに変換し
て戻す。この場合、後編集要否判定テーブルは省略され
る。
訳範囲の前編集の要否を判定せずに各部分を文字列前編
集手段22に送り、文字列前編集手段22は、翻訳範囲
と一致する置き換え前パタンがあれば、それを対応する
置き換え後パタンに変換して戻す。この場合、前編集要
否判定テーブルは省略される。同様に、翻訳結果組み合
わせ手段25では各部分の翻訳範囲の後編集の要否を判
定せずに各部分を文字列後編集手段26に送り、文字列
後編集手段26は、翻訳範囲と一致する置き換え前パタ
ンがあれば、それを対応する置き換え後パタンに変換し
て戻す。この場合、後編集要否判定テーブルは省略され
る。
【0058】適用関数決定テーブル格納手段35に、各
部分の条件を表すパタンとその場合に呼び出す機械翻訳
関数の番号とを記述したテーブルを格納しておき、翻訳
関数呼び出し手段23は、翻訳範囲切り出し手段21か
ら送られてきた翻訳範囲がテーブル中の条件のパタンに
マッチするときに、対応する番号の機械翻訳関数を呼び
出す。
部分の条件を表すパタンとその場合に呼び出す機械翻訳
関数の番号とを記述したテーブルを格納しておき、翻訳
関数呼び出し手段23は、翻訳範囲切り出し手段21か
ら送られてきた翻訳範囲がテーブル中の条件のパタンに
マッチするときに、対応する番号の機械翻訳関数を呼び
出す。
【0059】文字列置き換えパタン格納手段36に、文
字列置き換え処理を行う文分割ルールの番号、部分の番
号のそれぞれに対して、置き換え前パタンと置き換え後
パタンを記述し、各々の部分ごとに固有の文字列置き換
え処理を行う。
字列置き換え処理を行う文分割ルールの番号、部分の番
号のそれぞれに対して、置き換え前パタンと置き換え後
パタンを記述し、各々の部分ごとに固有の文字列置き換
え処理を行う。
【0060】翻訳関数呼び出し手段23は、或る翻訳範
囲についてはその翻訳が得意な唯一の機械翻訳関数を呼
び出して翻訳させるようにしたが、その翻訳範囲を全て
の機械翻訳関数で翻訳させ、各機械翻訳関数による翻訳
結果の文法チェックを行い、最も文法的に正しかったも
のを選択する等により、複数の翻訳結果から一番良いも
のを選択するようにしても良い。
囲についてはその翻訳が得意な唯一の機械翻訳関数を呼
び出して翻訳させるようにしたが、その翻訳範囲を全て
の機械翻訳関数で翻訳させ、各機械翻訳関数による翻訳
結果の文法チェックを行い、最も文法的に正しかったも
のを選択する等により、複数の翻訳結果から一番良いも
のを選択するようにしても良い。
【0061】
【発明の効果】以上説明したように本発明によれば、文
全体を翻訳した際に複数の機械翻訳手段のどれもが正し
く翻訳できないような場合でも、正しい翻訳結果を得る
ことができる可能性があることである。その理由は、個
々の機械翻訳手段の得意な句や節等の文単位より小さな
単位での翻訳結果を組み合わせて文全体の翻訳結果を導
出するからである。
全体を翻訳した際に複数の機械翻訳手段のどれもが正し
く翻訳できないような場合でも、正しい翻訳結果を得る
ことができる可能性があることである。その理由は、個
々の機械翻訳手段の得意な句や節等の文単位より小さな
単位での翻訳結果を組み合わせて文全体の翻訳結果を導
出するからである。
【0062】また、機械翻訳手段の1つに文字列置き換
え手段を備える構成にあっては、翻訳元の言語文字列を
翻訳先の言語文字列へ直接変換することで、他の機械翻
訳手段で翻訳できない文字列の直接的な変換が可能とな
る。
え手段を備える構成にあっては、翻訳元の言語文字列を
翻訳先の言語文字列へ直接変換することで、他の機械翻
訳手段で翻訳できない文字列の直接的な変換が可能とな
る。
【図1】本実施の形態にかかる機械翻訳システムのブロ
ック図である。
ック図である。
【図2】本実施の形態にかかる機械翻訳システムの処理
例を示すフローチャートである。
例を示すフローチャートである。
【図3】本実施の形態にかかる機械翻訳システムの処理
例を示すフローチャートである。
例を示すフローチャートである。
【図4】文分割ルールの一例を示す図である。
【図5】文組み上げルールの一例を示す図である。
【図6】前編集変換パタンの一例を示す図である。
【図7】前編集要否判定テーブルの一例を示す図であ
る。
る。
【図8】文字列置き換えパタンの一例を示す図である。
【図9】適用関数決定テーブルの一例を示す図である。
【図10】本発明を適用したコンピュータの構成例を示
す構成図である。
す構成図である。
10…機械翻訳システム 11…入力装置 12…翻訳装置 13…出力装置 21…翻訳範囲切り出し手段 22…文字列前編集手段 23…翻訳関数呼び出し手段 24…文字列置き換え手段 25…翻訳結果組み合わせ手段 26…文字列後編集手段 31…翻訳関数格納手段 31−1〜31−n…機械翻訳関数 32…文分割ルール格納手段 33…前編集要否判定テーブル格納手段 34…前編集変換パタン格納手段 35…適用関数決定テーブル格納手段 36…文字列置き換えパタン格納手段 37…文組み上げルール格納手段 38…後編集要否判定テーブル格納手段 39…後編集変換パタン格納手段
フロントページの続き (72)発明者 奥村 明俊 東京都港区芝五丁目7番1号 日本電気株 式会社内 Fターム(参考) 5B091 AA07 BA03 BA11 BA12 BA13 CC01 CD03 DA02 DA04 EA08 EA09 EA11 EA25
Claims (6)
- 【請求項1】 原言語表現を目的言語表現に変換する複
数の機械翻訳手段と、入力の原言語による文から文単位
より小さな単位の複数の翻訳範囲を切り出し、各翻訳範
囲をその翻訳範囲の翻訳が得意な前記機械翻訳手段に翻
訳させる翻訳範囲切り出し手段と、前記複数の機械翻訳
手段による翻訳結果を組み合わせて前記文の翻訳結果を
生成する翻訳結果組み合わせ手段とを有する機械翻訳シ
ステム。 - 【請求項2】 前記切り出された翻訳範囲に対して前編
集を行う文字列前編集手段と、前記機械翻訳手段による
翻訳結果に対して後編集を行う文字列後編集手段とを有
する請求項1記載の機械翻訳システム。 - 【請求項3】 前記複数の機械翻訳手段の1つが、翻訳
元の言語文字列を翻訳先の言語文字列へ直接変換する文
字列変換手段である請求項1または2記載の機械翻訳シ
ステム。 - 【請求項4】 コンピュータを、原言語表現を目的言語
表現に変換する複数の機械翻訳手段、入力の原言語によ
る文から文単位より小さな単位の複数の翻訳範囲を切り
出し、各翻訳範囲をその翻訳範囲の翻訳が得意な前記機
械翻訳手段に翻訳させる翻訳範囲切り出し手段、前記複
数の機械翻訳手段による翻訳結果を組み合わせて前記文
の翻訳結果を生成する翻訳結果組み合わせ手段、として
機能させるプログラムを記録した機械読み取り可能な記
録媒体。 - 【請求項5】 前記コンピュータを、更に、前記切り出
された翻訳範囲に対して前編集を行う文字列前編集手
段、前記機械翻訳手段による翻訳結果に対して後編集を
行う文字列後編集手段、として機能させる請求項4記載
のプログラムを記録した機械読み取り可能な記録媒体。 - 【請求項6】 前記複数の機械翻訳手段の1つが、翻訳
元の言語文字列を翻訳先の言語文字列へ直接変換する文
字列変換手段である請求項4または5記載のプログラム
を記録した機械読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000038052A JP2001222529A (ja) | 2000-02-09 | 2000-02-09 | 機械翻訳システム及びプログラムを記録した機械読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000038052A JP2001222529A (ja) | 2000-02-09 | 2000-02-09 | 機械翻訳システム及びプログラムを記録した機械読み取り可能な記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001222529A true JP2001222529A (ja) | 2001-08-17 |
Family
ID=18561855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000038052A Pending JP2001222529A (ja) | 2000-02-09 | 2000-02-09 | 機械翻訳システム及びプログラムを記録した機械読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001222529A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8204735B2 (en) | 2008-03-07 | 2012-06-19 | Kabushiki Kaisha Toshiba | Machine translating apparatus, method, and computer program product |
JP2016507828A (ja) * | 2013-01-11 | 2016-03-10 | カタール・ファンデーション | 機械翻訳システム及び方法 |
CN111680525A (zh) * | 2020-06-09 | 2020-09-18 | 语联网(武汉)信息技术有限公司 | 基于逆向差异识别的人机共译方法与系统 |
-
2000
- 2000-02-09 JP JP2000038052A patent/JP2001222529A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8204735B2 (en) | 2008-03-07 | 2012-06-19 | Kabushiki Kaisha Toshiba | Machine translating apparatus, method, and computer program product |
JP2016507828A (ja) * | 2013-01-11 | 2016-03-10 | カタール・ファンデーション | 機械翻訳システム及び方法 |
CN111680525A (zh) * | 2020-06-09 | 2020-09-18 | 语联网(武汉)信息技术有限公司 | 基于逆向差异识别的人机共译方法与系统 |
CN111680525B (zh) * | 2020-06-09 | 2024-03-26 | 语联网(武汉)信息技术有限公司 | 基于逆向差异识别的人机共译方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6401061B1 (en) | Combinatorial computational technique for transformation phrase text-phrase meaning | |
US8234108B2 (en) | Building and contracting a linguistic dictionary | |
US20040260533A1 (en) | Method and apparatus for converting an expression using key words | |
JP2004199427A (ja) | 対訳依存構造対応付け装置、方法及びプログラム、並びに、対訳依存構造対応付けプログラムを記録した記録媒体 | |
JPH02165378A (ja) | 機械翻訳システム | |
US20070179779A1 (en) | Language information translating device and method | |
JPH10312382A (ja) | 類似用例翻訳システム | |
JP4018668B2 (ja) | 日中機械翻訳装置、日中機械翻訳方法および日中機械翻訳プログラム | |
JP2001222529A (ja) | 機械翻訳システム及びプログラムを記録した機械読み取り可能な記録媒体 | |
JP2828692B2 (ja) | 情報検索装置 | |
JP2688020B2 (ja) | 派生語処理方式 | |
JP2715875B2 (ja) | 多言語要約生成装置 | |
JPH03260764A (ja) | 翻訳用辞書登録方式 | |
JP3692711B2 (ja) | 機械翻訳装置 | |
JP3244286B2 (ja) | 翻訳処理装置 | |
JPH11282839A (ja) | 機械翻訳システム及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH0668070A (ja) | 複合語辞書登録装置 | |
JP3313810B2 (ja) | アスペクト処理装置 | |
JP2004102942A (ja) | 翻訳の信頼度を算出するようにコンピュータシステムを動作させる方法およびプログラム、複数個の翻訳の中から一つの翻訳を選択するようにコンピュータを動作させる方法およびプログラム、ならびに意味対応表を記憶した記憶媒体 | |
JP2004199519A (ja) | 機械翻訳方法、機械翻訳装置、および機械翻訳プログラム | |
JP2004294639A (ja) | 音声合成用テキスト解析装置および音声合成装置 | |
JP2000029878A (ja) | 翻訳知識学習方法および装置、機械翻訳方法および装置 | |
JPH10320395A (ja) | 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2001202365A (ja) | 機械翻訳装置とその翻訳方法、及びその機械翻訳プログラムを記録した記憶媒体 | |
JPH1115825A (ja) | 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |