JP2005108184A - 機械翻訳システム、その制御装置、及びコンピュータプログラム - Google Patents

機械翻訳システム、その制御装置、及びコンピュータプログラム Download PDF

Info

Publication number
JP2005108184A
JP2005108184A JP2004151966A JP2004151966A JP2005108184A JP 2005108184 A JP2005108184 A JP 2005108184A JP 2004151966 A JP2004151966 A JP 2004151966A JP 2004151966 A JP2004151966 A JP 2004151966A JP 2005108184 A JP2005108184 A JP 2005108184A
Authority
JP
Japan
Prior art keywords
translation
evaluation
language
sentence
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004151966A
Other languages
English (en)
Other versions
JP2005108184A6 (ja
JP3919771B2 (ja
Inventor
Eiichiro Sumida
英一郎 隅田
Taro Watanabe
太郎 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR Advanced Telecommunications Research Institute International
Original Assignee
ATR Advanced Telecommunications Research Institute International
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR Advanced Telecommunications Research Institute International filed Critical ATR Advanced Telecommunications Research Institute International
Priority to JP2004151966A priority Critical patent/JP3919771B2/ja
Priority to US10/917,506 priority patent/US20050055217A1/en
Priority to CN2004100770385A priority patent/CN1595398B/zh
Publication of JP2005108184A publication Critical patent/JP2005108184A/ja
Publication of JP2005108184A6 publication Critical patent/JP2005108184A6/ja
Application granted granted Critical
Publication of JP3919771B2 publication Critical patent/JP3919771B2/ja
Anticipated expiration legal-status Critical
Active legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

【課題】言語の組合せにかかわらず高品質な訳文が得られる機械翻訳システムを提供する。
【解決手段】機械翻訳システム20は、第1の言語の入力文30に対しそれぞれ第2の言語の訳文を生成するための、複数個の機械翻訳装置を含む訳文候補生成部32と、得られた複数の第2の言語の訳文をそれぞれ起点として、訳文を変形し改良する訳文改良部36と、改良された訳文のうちで所定の条件を充足するものを入力文に対する出力文42として選択する終了判定部38とを含む。
【選択図】 図1

Description

この発明は機械翻訳システムに関し、特に、任意の2言語間の翻訳において、利用可能な言語リソースを生かしながら精度の高い翻訳を行なうことが可能な機械翻訳システムに関する。
社会経済活動のグローバル化の急速な進展に伴い、新たな言語対又は分野を対象とした機械翻訳システムを効率的に構築することが求められている。また、既に商用化され広く利用されている文字言語の翻訳においても、活発に研究され実用化が視野に入った音声言語の翻訳においても、現在の水準を越える高い翻訳品質が求められている。
従来、機械翻訳システムの作成には、翻訳対象である2言語に堪能な専門家と年単位の時間と莫大な費用とを必要としている。そのような機械翻訳システムでは、現在求められている高い移植性又は品質を実現できない。これからは機械翻訳システムの作成にできるだけ人の関与をなくすようにし、機械化・工業化する必要がある。
現在、世界の機械翻訳の研究においては、コーパスを利用する手法が従来手法の壁を破る成果を挙げつつある。コーパスを利用する機械翻訳の手法として、二つの代表的なアプローチがある。それらは、(1)用例翻訳と(2)統計翻訳とである。これらはいずれもコーパスを用いた半ば自動的な学習処理によって機械翻訳のためのシステムを構築できるという特徴をもつ。
用例翻訳は、2言語の対訳を多数含む用例コーパスから翻訳パターンを抽出し、入力文に最も類似したパターンを利用して翻訳を行なう。第1の言語の入力文が与えられると、入力文に類似した第1の言語の文を対訳コーパスの中から探し出し、探し出された第1の言語の文の訳文(第2の言語)に基づいて出力文を作成する。
一方、統計翻訳は、同様の用例コーパスから翻訳と言語との統計モデルを学習し、実行時にこれら二つの統計モデルに従って、確率を最大化するような訳文をサーチする。
以下、従来技術の代表的な翻訳手法のうち、統計翻訳について説明し、さらに統計翻訳の精度をより高めようとする従来の試みを説明する。
統計翻訳では、ある言語の文(今、この文を「J」と表す。)を他の言語の文(この文を「E」と表す。)に翻訳するという問題を、次の条件付確率を最大化する問題として定式化する。
Figure 2005108184
この式に対してベイズの定理を適用することにより次の式が得られる。
Figure 2005108184
このうち、P(J)は^Eの算出とは無関係である(「^E」は、上の式の左辺を表す)。従って次の式が得られる。
Figure 2005108184
右辺のうち第1項P(E)は言語モデルと呼ばれ、文Eの尤度を表す。第2項のP(J|E)は翻訳モデルと呼ばれ、文Eから文Jが生成される確率を表す。統計翻訳では、この確率が最大となるような訳文^Eをサーチしてそれを入力文に対する訳文とする。
一方、こうした手法の限界を打破する方法として、チャンネルソース文の各単語に翻訳したものをチャンネルターゲット文の順番で並べたものを最初に生成し、この文に対し種々のオペレータを適用して多数の文を生成していく方法が提案されている(非特許文献1)。提案された手法では、その様に生成された文のうち、最も尤度の高いものを求めて訳文として選択する。
ウルリヒ ゲルマン、ミハエル ヤール、ケビン ナイト、ダニエル マルキュ、ケンジ ヤマダ、「機械翻訳のための高速デコーディング及び最適デコーディング」、2001、ACL2001予稿集、ツールーズ、フランス(Ulrich Germann,Michael Jahr,Kevin Knight,Daniel Marcu,and Kenji Yamada,"Fast decoding and optimal decoding for machine translation,"(2001)in Proc.of ACL2001,Toulouse,France.)
従来の用例翻訳と統計翻訳とのいずれの手法を用いたとしても、ある原理と言語データとにおいて妥当な訳文を生成する枠組みを出るものではない。そのため、訳質をより高めようとすれば機械翻訳システムの内部そのものを変更しなければならず、期間、人手、費用のいずれの点でも改良に困難を伴う。
また非特許文献1に記載の方法では、探索において局所的最適解に到達してしまうことが多いという問題があり、高精度の解が安定して得られる訳ではない。
それに加えて、今後新たな翻訳手法が登場してきたとしても、各手法はその手法で完結したものとなり、それら新たな手法の限界を破った高い訳質の訳文を生成可能とするような枠組みは存在していない。
それゆえに本発明の目的は、言語の組合せにかかわらず高品質の翻訳を得ることができる機械翻訳システムを提供することである。
この発明の他の目的は、言語の組合せにかかわらず、ある程度の時間内に高品質の翻訳を得ることができる機械翻訳システムを提供することである。
この発明のさらに他の目的は、利用可能な翻訳リソースを有効に活用可能で、言語の組合せにかかわらず、高品質の翻訳を安定して得ることができる機械翻訳システムを提供することである。
本発明の第1の局面に係る機械翻訳システムは、第1の言語の入力文に対しそれぞれ第2の言語の訳文を生成するための、複数個の機械翻訳手段と、第2の言語の訳文をそれぞれ起点として、所定の評価方式に従った評価が改善するように訳文を改良するための訳文改良手段と、訳文改良手段により改良された訳文のうちで所定の条件を充足するものを入力文に対する訳文として選択するための訳文選択手段とを含む。
複数個の機械翻訳手段によって生成された訳文を改良し、改良された訳文の中で所定の条件を充足するものを入力文に対する訳文として選択する。単に機械翻訳手段の出力から訳文を選択するのではなく、それを改良するので、よりよい訳文が得られる。また複数の機械翻訳手段の出力結果を起点として訳文改良を行なうので、一つの機械翻訳手段の出力を使用する場合と比較して局所的最適解しか得られないというおそれが少なく、最適な訳文が得られる可能性が高い。また、既存の機械翻訳手段を使用することができる上、言語の組合せにも影響されずに訳質の高い訳文を得ることができる。
好ましくは、複数個の機械翻訳手段は、互いに異なる方式のものである。
互いに異なる方式の機械翻訳手段を使用することで、最初に得られる訳文が互いに異なるものとなり、改良の過程で局所的最適解に陥る危険性が少なくなる。
より好ましくは、訳文改良手段は、入力される訳文に対し、所定の変形を行なうための訳文変形手段と、訳文変形手段により変形された訳文に対して評価を行なうための訳文評価手段と、訳文評価手段により変形された訳文に対して得られた評価が、変形前の訳文に対して得られた評価に対し改善されているか否かを判定し、改善が認められなくなるまで、訳文変形手段により変形された訳文に対し、変形及び評価を繰返し実行するように訳文変形手段及び評価手段を制御するための繰返し制御手段とを含む。
変形した訳文が、変形前の訳文に対して改善されているか否かを判定し、改善が認められなくなるまで変形と評価とを繰返す。複数個の機械翻訳手段を使用することと併せ、局所的最適解に陥らずに大域的に見て最適な訳文が得られる可能性が高い。
さらに好ましくは、訳文変形手段は、一つの訳文に対して複数通りの変形を行なって複数個の変形後の訳文を生成するための手段を含み、評価手段は、複数個の変形後の訳文の各々に対し評価を行なうための手段を含む。
各訳文に対し複数通りの変形をして得られた訳文の各々が評価の対象となる。多くの訳文変形が評価及び変形の対象となるので、大域的に見て最適な訳文が得られる可能性が高い。
繰返し制御手段は、訳文変形手段により変形された複数通りの訳文の各々に対し、評価手段による評価の改善が見られなくなるまで変形及び評価を繰返し実行するように訳文変形手段及び評価手段を制御するための手段を含んでもよい。
評価の改善が見られなくなるまで繰返し変形及び評価が実行されるので、最終的には最も評価の高い訳文が得られる。
好ましくは、繰返し制御手段は、訳文変形手段により変形された複数通りの訳文のうち、評価が上位の所定個数内の各々に対し、評価手段による評価の改善が見られなくなるまで変形及び評価を繰返し実行するように訳文変形手段及び評価手段を制御するための手段を含む。
複数個の訳文のうち、評価が上位の所定個数を選択し、変形及び評価を行なうことを評価の改善が見られなくなるまで繰返し実行する。評価が上位のもののみ選択するので、少ない計算量で大域的に見て最適な訳文が得られる可能性が高くなる。
より好ましくは、訳文改良手段は、入力される訳文に対し、所定の変形を行なうための訳文変形手段と、訳文変形手段により変形された訳文に対して評価を行なうための訳文評価手段と、訳文変形手段により変形された訳文に対し、予め定められた回数だけ変形及び評価を繰返し実行するように訳文変形手段及び評価手段を制御するための繰返し制御手段とを含む。
繰返しを、予め定められた回数だけ行なうので、所定時間内に確実に最終的な訳文が得られる。
さらに好ましくは、訳文選択手段は、繰返し制御手段による繰返しの中で得られた複数個の訳文のうち、評価手段による評価が最も高かったものを選択するための手段を含む。
最終的に評価が最も高い訳文を出力するので、評価基準に従った最も好ましい訳文を選択できる。
訳文評価手段は、第2の言語の言語モデルと第2の言語から第1の言語への翻訳モデルとに基づいて訳文の尤度を算出するための手段を含んでもよい。
最終的に言語モデルと翻訳モデルとに基づいて計算される尤度を評価値とし、尤度が最も高い訳文が得られる。そのため、得られる訳文は、自然な、訳質の高いものとなる。
本発明の第2の局面に係るコンピュータプログラムは、コンピュータにより実行されると、当該コンピュータを上記したいずれかの機械翻訳システムとして動作させる。
本発明の第3の局面に係る機械翻訳システムの制御装置は、複数個の機械翻訳装置に第1の言語の入力文を与え、それぞれ対応する第2の言語の訳文を得るための訳文取得手段と、訳文取得手段により得られた第2の言語の訳文を、各々が第2の言語の訳文をそれぞれ起点として、所定の評価方式に従った評価が改善するように訳文を変形するための複数個の訳文変形手段にそれぞれ与え、変形された複数個の訳文とそれぞれに付随する評価値とを受取るための変形訳文取得手段と、変形訳文取得手段が受取った訳文のうちで所定の条件を充足するものを入力文に対する訳文として選択し出力するための訳文選択手段とを含む。
好ましくは、訳文選択手段は、変形訳文取得手段が受取った訳文のうちで最も高いスコアを持つものを選択するための手段を含む。
本発明の第4の局面に係るコンピュータプログラムは、コンピュータにより実行されると、当該コンピュータを、機械翻訳システムの制御装置として動作させるためのコンピュータプログラムであって、機械翻訳システムは、第1の言語の文に対しそれぞれ第2の言語の訳文を生成するための、互いに異なる複数個の機械翻訳装置と、第2の言語の訳文をそれぞれ起点として、所定の評価方式に従った評価が改善するように訳文を変形するための複数個の訳文変形装置とを含み、制御装置は、第1の言語の入力文を複数個の機械翻訳装置に与え、対応する第2の言語の訳文を得るための訳文取得手段と、訳文取得手段により得られた第2の言語の訳文を、複数個の訳文変形装置にそれぞれ与え、変形された訳文とそれぞれに付随する評価値とを受取るための変形訳文取得手段と、変形訳文取得手段が受取った訳文のうちで所定の条件を充足するものを入力文に対する訳文として選択し出力するための訳文選択手段とを含む。
[第1の実施の形態]
本実施の形態の機械翻訳システムは、既存の翻訳リソースと、訳文の改良手法とを組合せた新たな枠組みに基づくものである。
−構成−
図1に、本実施の形態に係る機械翻訳システム20のブロック図を示す。図1を参照して、この機械翻訳システム20は、第1の言語(これを言語Jとする。)の入力文30を第2の言語(これを言語Eとする。)の訳文である出力文42に翻訳するシステムである。機械翻訳システム20は、第1の言語の入力文30を受け、後述するように種々の機械翻訳手法による訳文を訳文候補として生成するための訳文候補生成部32と、訳文候補生成部32により生成された訳文候補を、後述する方法に従って改良していき、所定の終了条件が充足された時点で最良の訳文候補を出力するための訳文改良部36と、訳文改良部36から改良された後の訳文候補が出力されたことに応答して、所定の終了条件が充足されているか否かを判定し、終了条件が充足されているときにはそのときまでに得られた改良後の訳文候補のうち、所定の評価基準に従って評価したスコアが最良のものを出力文42として選択し出力するための終了判定部38とを含む。
終了判定部38は、まだ終了条件が充足されていないと判定されると、訳文候補生成部32に対して再度初期候補を生成することを指示する制御信号41を送出する機能を持つ。訳文候補生成部32は、この制御信号41に応答して、先に初期候補を生成したときとは異なる初期候補を生成し、訳文改良部36に与える機能を持つ。
図2に、訳文候補生成部32のより詳細な機能ブロック図を示す。図2を参照して、訳文候補生成部32は、与えられる文を翻訳し、それぞれ訳文39A〜39Eを出力するための第1〜第5の翻訳装置35A〜35Eと、入力文30を終了判定部38からの制御信号41に従ってこれら第1〜第5の翻訳装置35A〜35Eのうちのいずれか一つに分配するための分配部33と、第1〜第5の翻訳装置35A〜35Eのいずれかから出力される訳文を終了判定部38からの制御信号41に従って選択し、初期候補訳文39として出力するための選択部37とを含む。
第1〜第5の翻訳装置35A〜35Eは、本実施の形態では、互いに異なる方式により翻訳を行なう。従って、同一の入力文30が与えられたとしても、第1〜第5の翻訳装置35A〜35Eから得られる訳文39A〜39Eは互いに異なったものとなる可能性が高い。なお、この例では翻訳装置として5つを用いたものを示すが、この数は複数であればよく、5に限定されるわけではない。また、同一の方式の翻訳装置であって、異なる翻訳知識を使用するものを用いても良い。
図3に、本実施の形態における第1の翻訳装置35Aの詳細なブロック図を示す。図3を参照して、第1の翻訳装置35Aは、第1の言語の文と第2の言語の訳文とからなる対訳文を多数含む対訳コーパス34と、対訳コーパス34を参照して、入力文30と対訳コーパス34の第1の言語の文の各々との類似の程度を示す類似尺度としてtf/idf基準Ptf/idfを算出するためのtf/idf算出部50Aとを含む。tf/idf基準Ptf/idfは、対訳コーパス34の第1の言語の各文を一つの文書とみなして、情報検索アルゴリズムで一般的に用いられる文書頻度と呼ばれる概念を用いて下の式により定義された尺度である。
Figure 2005108184
ただしJ0は入力文、J0,iは入力文J0のi番目の単語、df(J0,i)は入力文J0のi番目の単語J0,iに対する文書頻度、Nは対訳コーパス34内の全ての訳文の数を、それぞれ示す。文書頻度df(J0,i)とは、入力文J0中のi番目の単語J0,iが出現する文書(本実施の形態では訳文)の数のことをいう。
第1の翻訳装置35Aはさらに、対訳コーパス34に含まれている各対訳文(Jk,Ek)の第1の言語の文Jkについて、入力文J0との間のDP(Dynamic Programming)マッチングを行なって編集距離dis(Jk,J0)を算出するための編集距離算出部52Aと、tf/idf算出部50Aにより算出されたtf/idf基準Ptf/idf及び編集距離算出部52Aにより算出された編集距離に基づいて、後述する式に従って各対訳文のスコアを算出するためのスコア算出部54Aとを含む。
編集距離算出部52Aにより算出される編集距離dis(Jk,J0)は以下の式で表される。
Figure 2005108184
ただしkは1≦k≦Nなる整数、I(Jk,J0)、D(Jk,J0)、及びS(Jk,J0)はそれぞれ文J0から文Jkに至るまでの挿入/削除/置換の数(編集距離)である。なお編集距離は、容易に入手可能なソフトウェアツールを利用して算出できる。
スコア算出部54Aにより算出されるスコアは以下の式により表される。
Figure 2005108184
ただしαは調整パラメータであり、本実施の形態ではα=0.2としている。
図3を参照して、第1の翻訳装置35Aはさらに、スコア算出部54Aにより算出されたスコアに基づき、最も大きなスコアを持つ対訳文を選択し、その対訳文に含まれる第2の言語の文を第1の初期候補訳文39Aとして出力し図1に示す訳文改良部36に与えるための対訳文選択部56Aを含む。
図4に第2の翻訳装置35Bの構成をブロック図形式で示す。図4を参照して、第2の翻訳装置35Bは、第1の言語である入力文30を、第3の言語の文に翻訳するための既存の翻訳システムからなる第1の中間翻訳装置50Bと、第1の中間翻訳装置50Bの出力する第3の言語の文を前述の第2の言語の文に翻訳するための第2の中間翻訳装置52Bとを含む。
第1の中間翻訳装置50B及び第2の中間翻訳装置52Bとして性能のよいものが存在している場合、このように第3の言語を介在させて第1の言語から第2の言語に翻訳を行なった結果、よい翻訳結果が得られる場合がある。本実施の形態のシステムでは、このような中間の言語を用いて得られた翻訳結果も、訳文の初期候補として利用できる。
なお、第1及び第3の言語は互いに別の言語でもよいし、互いに同じ言語であってもよい。この場合、第1の中間翻訳装置50Bは第1の言語内での言換えを行なう装置ということになる。また、第2の言語と第3の言語とが同じ言語であってもよい。この場合、第2の中間翻訳装置52Bは、第2の言語内での言換えを行なう装置ということになる。
図5に、第3の翻訳装置35Cの詳細なブロック図を示す。図5を参照して、第3の翻訳装置35Cは、入力文30をそれぞれ第2の言語に翻訳するための、互いに異なる翻訳方式の第1〜第3の翻訳部50C−1〜50C−3と、これら第1〜第3の翻訳部50C−1〜50C−3の出力の訳質を所定の基準に従って評価し、その基準に従って最も優れていると思われるものを選択して第3の初期候補訳文39Cとして出力するための訳文選択部52Cとを含む。
第1〜第3の翻訳部50C−1〜50C−3の翻訳方式は、互いに異なったものであればどのようなものであってもよい。
訳文選択部52Cでの訳文の評価の基準としては、種々考えられるが、それらについては訳文改良部36での訳質評価の基準と共通していると考えられるので、ここではそれらの詳細な説明は行なわない。
図6に、第4の翻訳装置35Dの詳細なブロック図を示す。図6を参照して、第4の翻訳装置35Dは、入力文30をそれぞれ第2の言語に翻訳するための、互いに異なる翻訳方式の第4〜第6の翻訳部50D−1〜50D−3と、これら第4〜第6の翻訳部50D−1〜50D−3の出力をマージして第4の初期候補訳文39Dとして出力するための訳文マージ部52Dとを含む。
第4〜第6の翻訳部50D−1〜50D−3は、第1〜第3の翻訳部50C−1〜50C−3と同様、互いに異なる翻訳方式を用いるものであればどのようなものでもよい。
訳文マージ部52Dによる訳文のマージとは以下のような処理である。簡単のために、入力文が「This is a pen.」という英語である場合を例として説明する。図7を参照して、この第4〜第6の翻訳部50D−1〜50D−3から、この入力文に対してそれぞれ「これはペンです」「これはペンだ」及び「これは筆です」という訳文が得られたものとする。訳文のマージでは、これら文を構成する単語又は単語列ごとに各訳文を比較し、最も多くの訳文に見出される単語又は単語列をマージ後の訳文の単語又は単語列として選択する。
例えば、上記した図7に示す例では、枠60Dで示す部分は3つの訳文に共通している。従ってこの部分からは「これは」が訳文の要素として選択される。次に、枠61D及び62Dで示されるように、「ペン」という語が二つの訳文に見出され、「筆」という語は一つの訳文にしか見出されない。従ってこの部分からは「ペン」が訳文の要素として選択される。同様に枠63D〜65Dからは、「です」が選択される。その結果、マージした後の訳文として枠69Dにより示す「これはペンです」が得られる。
一般的にいって、複数の機械翻訳システムにおいて共通して使用されている単語又は単語列があれば、その単語又は単語列が訳語として妥当なものである可能性が高い。従って、上記したようなマージ処理によって、正しい訳文に近いものが得られる可能性が大きい。そのため、こうしたマージ処理の結果を初期候補訳文として利用する。
図8に、第5の翻訳装置35Eの詳細なブロック図を示す。第5の翻訳装置35Eは、それぞれ入力文を第2の言語に翻訳するための第7〜第9の翻訳部50E−1〜50E−3と、第7〜第9の翻訳部50E−1〜50E−3の出力する訳文に対し、共有構造を持つ訳文を第5の初期候補訳文39Eとして生成するための訳文共有構造化部52Eとを含む。
訳文の共有構造を生成する処理とは、次のような処理をいう。図9を参照して、図7に示すものと同様、入力文が「This is a pen.」という英語の文である場合を例として説明する。図7を参照して、この第7〜第9の翻訳部50E−1〜50E−3から、この入力文に対してそれぞれ「これはペンです」「これはペンだ」及び「これは筆です」という訳文が得られたものとする。
訳文の共有構造の生成は、基本的に訳文の単語列をグラフで表現する。例えば、図9の枠60Eで示すように互いに共通する部分(「これは」)はグラフでは一つのアークにまとめる。そして、枠61Eと枠62E、及び枠63E〜65Eによりそれぞれ表されるように、互いに対応する部分であってかつ互いに異なる単語又は単語列が生成された部分では、それらの相違を別々のアーク(「ペン」と「筆」、及び「です」と「だ」)で表現する。第5の初期候補訳文39Eはこのようなグラフ構造69Eを持った訳文候補である。
本実施の形態では、以上の5つの翻訳装置を用いている。しかし、これ以外の翻訳システムであっても、第1の言語から第2の言語への翻訳を行なうことが可能なものであれば、どのようなものでも第1〜第5の翻訳装置35A〜35Eのいずれかに替えて、又はこれらに加えて、用いることができる。また第1〜第5の翻訳装置35A〜35Eも含め、利用可能な翻訳システムのどのような組合せでも訳文候補生成部32の要素として使用することが可能である。
図10に、図1に示す訳文改良部36の詳細なブロック図を示す。図10を参照して、訳文改良部36は、訳文候補生成部32が出力した初期候補訳文39と、後述する訳文記憶部73から読出された訳文とのいずれか一方を選択するための訳文選択部70と、訳文選択部70の選択した訳文を、後述するように何らかの方式に従って変形するための訳文変形部71と、訳文変形部71により変形された後の訳文の訳質を所定の評価基準に従って評価しそのスコアを出力するための変形後訳文評価部72とを含む。
訳文改良部36はさらに、変形後訳文評価部72の出力するスコアとともに変形後訳文を記憶するための訳文記憶部73と、変形後訳文評価部72の出力するスコアに従って、訳文の改良を終了させるための終了条件が充足されているか否かを判定し、判定結果に従って繰返しを制御するための繰返し制御部74とを含む。
繰返し制御部74は、訳文記憶部73又は初期候補訳文39のいずれか一方を選択するように訳文選択部70に対する選択制御信号を送出する機能を持つ。ただし、処理の最初では訳文選択部70は必ず訳文39A〜39Eを選択する。その後の処理で訳文39A〜39Eを選択するか、訳文記憶部73の出力を選択するかは、どのようなスキームで訳文を変形させていくかにより異なってくる。
繰返し制御部74はまた、変形後訳文評価部72によるスコアによっては終了条件が充足されていないと判定されたときには、訳文記憶部73に記憶された訳文のうちのいずれか一つを所定の方式で選択して訳文選択部70に与えるよう訳文記憶部73を制御する機能、それと同時に訳文変形部71による訳文の変形を制御する機能、及び終了条件が充足されたと判定されたときには、後続の終了判定部38に対して訳文改良部36による訳文改良処理が完了したことを示す完了信号77を送出する機能も持つ。
繰返し制御部74による訳文記憶部73からの訳文選択の順序は、訳文変形部71で行なう訳文変形の方式と関係して決定される。訳文変形部71で行なわれる訳文変形には、任意のテキスト変形アルゴリズムを利用することができる。本実施の形態では、訳文を統計翻訳で用いられる言語モデル及び翻訳モデルを用いてより尤度の高いものに変形する方式を使用する。
テキスト変形アルゴリズムとしては、これ以外にも種々のものを用いることができる。以下にそれらを例示的に列挙する。
(1)言語モデルのみを用いて変形する。
(2)翻訳モデルのみを用いて変形する。
(3)予め人手で作成された文の書換えパターンに基づいて変形する。
(4)機械的に学習した書換えパターンに基づいて変形する。この際の学習としては、例えば機械翻訳の結果と用例コーパス中の正解とを比較し、その差分を変換パターンとして学習する方式が考えられる。
(5)単語の置換、挿入、削除等をランダムに、又は何らかのモデルに従って行なう。
変形後訳文評価部72による訳質評価の手法としても、将来利用可能となるものも含めて種々の手法を利用することができる。本実施の形態では、統計的翻訳で用いられる言語モデル及び翻訳モデルによって訳文の尤度を計算し、変換後の訳文の尤度に改善が見られなくなったとき、又は所定の繰返し回数が完了したときに終了条件が充足されたと判定する。
これ以外にも、訳質評価の尺度として考えられるものとを以下に例示的に列挙する。
(1)言語モデルのみにより得られる尤度
(2)翻訳モデルのみにより得られる尤度
(3)直訳度と呼ばれる尺度。直訳度としては、たとえば次の式で定義されるTanimoto係数を使用できる。
Figure 2005108184
ただし|・|は集合の要素の数を表し、内容語とは、文の意味内容を判断する上で重要な語のことをいう。単語辞書にその単語が含まれているか否かによりその単語が内容語か否かを決定する手法が考えられる。
(4)多重逆翻訳類似度。多重逆翻訳類似度とは、一旦得られた訳文を第1の言語への複数の翻訳システムで逆翻訳した結果が入力文とどの程度類似しているかを示す尺度である。この尺度が高ければ、訳文は入力文の正しい訳に近いと考えることができる。
(5)参考訳を生成した上でこの参考訳を使用して訳文を評価する手法。この手法としては、BLEUスコア,WER(Word Error Rate),NISTスコア,PER(Position Independent WER)等、よく知られているものがある。以下に主なものについて説明する。
<WER> Word−error−rate(単語誤り率)を表す。これは、基準となる模範的翻訳と比較した際の編集距離(挿入/削除/置換)を反映したものである。
<PER> 位置独立な(Position−independent)WERを表す。これは、位置的な問題を除き、挿入と削除とのみに関する編集距離を反映したものである。
<BLEU> BLEUスコアを表す。これは翻訳結果のN−グラムのうち、基準となる模範訳の中に見出されるものの率を表す。上記したWER及びPERと異なり、BLEUスコアの値が高いほど翻訳の質は高い。
なお、評価はこれ以外にもどのような手法を用いて行なってもよい。また、分野により特定の評価手法を採用するようにしてもよい。将来出現する有効な評価手法があれば、それを採用することも可能である。
なお、繰返し制御部74は変形後の訳文の訳質に改善が見られない場合に繰返しを終了するが、訳質に改善が見られないときにもさらに変形を続けていくこともできる。ただし、本実施の形態では繰返し制御に山登り法を用いているので、訳質が劣化するようであれば繰返しは終了させる。
この様にして訳文改良部36は訳文を変形していき、最も高い評価を持つ訳文を定めて出力文76としてスコアとともに終了判定部38に対して出力する。
終了判定部38は、訳文改良部36からの出力文76とそのスコアとに基づいて、処理を終了させるか否かを判定する。本実施の形態では、単純に訳文候補生成部32に含まれる第1〜第5の翻訳装置35A〜35Eの出力の全てについて、訳文改良部36での処理が完了したか否かを判定する。全てについて完了したときにそれまでで最高のスコアを示した訳文を出力文42として出力する。全ての処理が完了していないときは、次の翻訳装置の訳文について上記した処理を実行するように制御信号を訳文候補生成部32に出力し、処理を続行させる。
処理の終了条件としては、これに限らず以下に例示的に列挙する条件のうちの任意のものを採用することができる。ただし、この終了条件は訳質の改良の際の繰返し方法と関係があり、特定の繰返し方法には特定の終了判定しかできない場合、又は特定の繰返し方法には特定の終了判定が適用できないような場合等もあり得る。しかしそれらはいずれも設計事項に属する問題であり、当業者であれば適切な終了条件を選択できるであろう。
(1)予め定められた繰返し回数又は計算時間を超えれば終了。
(2)予め定められた繰返し回数又は計算時間内に訳質の改善が得られなくなれば終了。
(3)訳質の改善が得られなくなれば終了。
(4)予め定められた目標のスコアを得た訳文が得られれば終了。
−動作−
機械翻訳システム20は以下の様に動作する。図3に示す対訳コーパス34には予め第1の言語の文と第2の言語の訳文とからなる多数の対訳文が含まれている。また言語モデル及び翻訳モデルも何らかの手段により予め準備されているものとする。
図1を参照して、入力文30が訳文候補生成部32に与えられる。
図2を参照して、分配部33が入力文30を第1の翻訳装置35Aに与える。
図3を参照して、第1の翻訳装置35Aのtf/idf算出部50Aは、入力文30と対訳コーパス34中の全ての対訳文のうちの第1の言語の文との間でtf/idf基準Ptf/idfを算出する。編集距離算出部52Aは、同様に入力文30と全ての対訳コーパス34中の第1の言語の文Jkとの間で編集距離dis(Jk,J0)を算出する。
スコア算出部54Aは、tf/idf算出部50Aにより算出されたtf/idf基準Ptf/idf及び編集距離算出部52Aにより算出された編集距離dis(Jk,J0)を用いて前述したスコアscoreを次の式に従い算出する。
Figure 2005108184
対訳文選択部56Aは、対訳コーパス34に含まれる対訳文のうち、スコアscoreの高いものを選択し、訳文39Aとして図2に示す選択部37に与える。
選択部37は、終了判定部38からの制御信号に従って訳文39Aを選択し、訳文39として訳文改良部36に与える。
図10を参照して、訳文改良部36の訳文選択部70は、与えられた初期候補訳文39を選択して訳文変形部71に与える。訳文変形部71はこの訳文に対し所定のいく通りかの変形を行なって、変形後訳文評価部72に与える。変形後訳文評価部72はこの変形後の訳文の各々について前記したように所定の評価方式によって評価し、そのスコアとともに訳文記憶部73に与える。変形後訳文評価部72はまた、それらスコアを繰返し制御部74にも与える。
繰返し制御部74は、これらのスコアが所定の条件を充足しているか否かを判定する。本実施の形態では、繰返し制御部74はいずれのスコアにも改善が認められなくなれば、又は所定回数だけ処理を繰返したときに、処理を終了する。最初の処理では通常はいずれかの変形により得られた訳文のスコアには改善が認められるので、繰返し制御部74は訳文選択部70、訳文変形部71、及び訳文記憶部73に対して処理の繰返しを指示するとともに、訳文記憶部73に対しては、先ほど記憶した訳文のうちでスコアの改善が見られた訳文のうちの一つを訳文選択部70に対し出力するように指示する。
訳文選択部70は、今度は繰返し制御部74からの指示に従い、訳文記憶部73から与えられた変形後の訳文の一つを選択し、訳文変形部71に与える。訳文変形部71は、与えられた訳文に対し上記したのと同様のいく通りかの変形を行なう。この変形により得られた訳文の各々に対し変形後訳文評価部72が再度評価を行なってスコアを計算し、繰返し制御部74がスコアに改善が見られたか否かを判定する。訳文変形部71、変形後訳文評価部72、訳文記憶部73、及び繰返し制御部74は、この処理を、いずれの訳文のスコアにも改善が見られなくなるまで、変形する対象の訳文を変えながら繰返し実行する。
以上のように、一つの訳文候補に対し複数通りの変形を行なってそれらのスコアを評価し、スコアに改善が見られた訳文に対してさらに同様の変形及び評価を行なうことを、いずれの変形後訳文に対してもスコアの改善が見られなくなるまで(又は所定回数の繰返しが終了するまで)繰返し実行することにより、初期候補訳文39に比してスコアが大きく改善された訳文が得られる可能性が高くなる。
どの訳文のスコアにも改善が見られなくなると(又は所定回数の繰返しが完了すると)、繰返し制御部74は以上の繰返し処理のうちで最もスコアが高かった訳文を出力文76として出力するように訳文記憶部73を制御し、あわせて完了信号を図1に示す終了判定部38に与える。
終了判定部38は、この完了信号に応答して処理を終了させるべきか否かについて判定する。本実施の形態では、図2に示す第1〜第5の翻訳装置35A〜35Eの全てについて、その生成した訳文に対する改良処理が終了して初めて全体の処理を終了する。従って終了判定部38は第2の翻訳装置35Bにより生成された訳文に基づいて、上記した訳文の改良処理を繰返すべく、訳文候補生成部32に対し制御信号41を与える。
図2を参照して、分配部33はこの信号に応答して、入力文30を第2の翻訳装置35Bに与える。第2の翻訳装置35Bは、図4に示すように第1の中間翻訳装置50Bと第2の中間翻訳装置52Bとによる翻訳処理を行なって、訳文39Bを生成し、選択部37に与える。
選択部37は、終了判定部38からの制御信号に従って、第2の翻訳装置35Bの出力する訳文39Bを選択し、初期候補訳文39として訳文改良部36に与える。以下、訳文改良部36及び選択部37は第1の翻訳装置35Aによる訳文の処理と同様の処理を繰返す。
このようにして、第1〜第5の翻訳装置35A〜35Eが生成する訳文39A〜39Eの全てに対して前述した訳文改良処理が終了すると、図10に示す繰返し制御部74は、図1に示す終了判定部38に完了信号77を与える。終了判定部38はこの完了信号77を受けると、処理を終了すべき条件が充足されたと判定し、これまでの処理により得られた訳文のうち、最もスコアの高いものを出力文42として出力する。
訳文候補生成部32で用いられる翻訳装置としては、既存のもの、今後利用可能となるものも含め、どのようなものでも利用できる。
本実施の形態によれば、同一の入力文に対して互いに異なる複数の機械翻訳システムによって得られた訳文をそれぞれ始点として、訳文の改良を行ない、最良のスコアを持つ訳文をそれぞれ選択し、さらにその中で最も高いスコアのものを最終的な訳文として選択する。複数の訳文からスタートするので、局所解だけでなく、大局的な最適解が得られる可能性が高い。また、最初の訳文を得るための機械翻訳システムとしては、どのようなものでもよく、既存の機械翻訳システムを有効に利用することができる。さらに、今後開発される機械翻訳システム又は訳質評価の手法までも有効に利用することが可能で、この枠組みを使用してさらに訳文の品質を高くすることが可能である。
訳質評価のための基準とその手法、及び基本的な複数の機械翻訳システムさえ確立されていれば、言語の組合せを問わず、任意の言語の間での訳文の質を改善することができる
さらに、上記した機械翻訳システムでは、訳文の品質の改善のために基本的には人手を必要とせず、システムの枠組みの開発も比較的簡単で短期で実現できるという特徴がある。
なお、上記した実施の形態では、変形後の訳文のうち、スコアに改善が見られたものの全てに対して再度、訳文の改良を行なう。しかし本発明はそのような実施の形態には限定されない。例えば、変形後の訳文でスコアに改善が見られたもののうち、上位の所定個数(例えば1個)の訳文に対してのみ、その後の変形と評価とを行なうようにしてもよい。
また、変形は複数通り行なうことが望ましいが、一通りの変形のみ使用するようにしてもよい。
[第2の実施の形態]
上記した様に、第1の実施の形態の装置はコンピュータにより実現することができる。また、図2等からも明らかなように、第1の実施の形態の装置は、その内部に互いに独立に動作可能な構成要素(例えば第1〜第5の翻訳装置35A〜35E、第1〜第3の翻訳部50C−1〜50C−3、第4〜第6の翻訳部50D−1〜50D−3、第7〜第9の翻訳部50E−1〜50E−3等)を含む。従って、コンピュータの通信機能とタスクの分配機能とを用いることにより、第1の実施の形態のシステムをネットワーク接続された複数のコンピュータにより実現することができる。第2の実施の形態のシステムは、そのように複数のコンピュータを互いにネットワーク接続して、上記した処理のうち並列に実行可能なものを個々のコンピュータで互いに並列に実行させるものである。
図11に、この機械翻訳システム100の概略の機能的構成を示す。図11を参照して、機械翻訳システム100は、それぞれ入力文30に基づいて、それぞれ別個の翻訳システムを用いて翻訳したものに基づき、前記した訳文改良処理を行なって最良の訳文を生成するための複数個の最良訳生成部102A〜102Nと、これら最良訳生成部102A〜102Nにより別個に生成された最良の翻訳の中でも最も高いスコアを有するものを選択して出力文42として出力するための訳文選択部104とを含む。
最良訳生成部102A〜102Nは、互いに別個のコンピュータと、その上で動作するプログラムにより実現できる。これらコンピュータとネットワーク接続されたホストコンピュータを設け、このホストコンピュータで各コンピュータに対する入力文30の分配、及び各コンピュータからの訳文の受信とその中での最良訳の選択とを行なうようにすればよい。
図12に、例として第1の最良訳生成部102Aの機能的構成を示す。この最良訳生成部102Aは、前述したようにホストコンピュータにネットワーク接続されたコンピュータと、その上で動作するプログラムとにより実現される。他の最良訳生成部も、初期候補の翻訳部が異なることを除き同様の構成を有する。
最良訳生成部102Aは、図2に示す訳文候補生成部32と同様であるが、ただ一つの翻訳装置を持つ初期候補生成部106Aと、初期候補生成部106Aにより生成された訳文を初期候補訳文として、図10に示す訳文改良部36と同様の処理を実行してこの最良訳生成部102Aの出力文108Aを生成しホストコンピュータに送信するための訳文改良部107Aとを含む。
訳文改良部107Aの機能的構成は、図10に示す訳文改良部36の構成と同様である。ただし、図10に示す訳文変形部71及び変形後訳文評価部72からなる処理は、同時並列的に行なうように構成することが可能である。そこで、これらの処理をネットワーク接続した他のコンピュータに同時並列的に行なわせる。
図13に、上記したコンピュータネットワークによる機械翻訳システムのネットワーク構成を概略的に示す。図13を参照して、この機械翻訳システムは、上記したシステムの動作全体を制御し、入力文を分配する処理及び訳文の中から最高スコアのものを選択する処理を行なうホストコンピュータ200と、入力文をホストコンピュータ200から受取り、互いに同時並列的に機械翻訳を行なって結果を初期候補訳文としてホストコンピュータ200に返信するための初期候補生成コンピュータ210A〜210Nと、ホストコンピュータ200からそれぞれ別の初期候補生成コンピュータにより生成された訳文を受取り、それを初期候補として訳文改良処理を実行するための訳文改良コンピュータ220A〜220Mとを含む。
このような構成の機械翻訳システムによれば、大量の計算を同時並列的に実行できるため、最終的な出力文が得られるまでの時間を大幅に短くすることができる。しかも得られる出力文の訳質及び応用の範囲は、第1の実施の形態のものと同様である。さらに訳文改良処理の中身を細かく分けることにより、さらに多くのコンピュータを用いて階層的に同時並列処理で実現することが可能になり、さらに処理の高速化を図ることが可能である。
[実施の形態の拡張]
上記した第1及び第2の実施の形態の構成に、さらに次に挙げるような機能を追加することができる。
(1)上記した実施の形態の機械翻訳システムで得られた入力文30と出力文42との対を記憶しておき、同じ入力文30に対しては同じ出力文42を返すようにする。この構成により、繰返し処理が不要になり、次回以降の処理において大幅な高速化が実現できる。
(2)上記した実施の形態の機械翻訳システムで得られた入力文30と出力文42との対を集め、対訳コーパスを拡張する。この拡張後の対訳コーパスを用いて、用例翻訳又は統計翻訳を再構築する。この拡張により、用例翻訳又は統計翻訳のカバーリッジ及び訳質を改善できる可能性が高い。
−コンピュータによる実現−
なお、本実施の形態に係る機械翻訳システムは、コンピュータハードウェアと、当該コンピュータハードウェア上で動作するプログラム、及び当該コンピュータの記憶装置に記憶される対訳コーパス、翻訳モデル、及び言語モデルにより実現することもできる。
そうしたプログラムは、上記した実施の形態の説明により、当業者であれば容易に実現できるであろう。
図14は上記した機械翻訳システムを実現するコンピュータシステム330の外観を示し、図15はコンピュータシステム330の内部構成を示す。
図14を参照して、このコンピュータシステム330は、FD(フレキシブルディスク)ドライブ352及びCD−ROM(コンパクトディスク読出専用メモリ)ドライブ350を有するコンピュータ340と、キーボード346と、マウス348と、モニタ342とを含む。
図15を参照して、コンピュータ340は、FDドライブ352及びCD−ROMドライブ350に加えて、CPU(中央処理装置)356と、CPU356、FDドライブ352及びCD−ROMドライブ350に接続されたバス366と、ブートアッププログラム等を記憶する読出専用メモリ(ROM)358と、バス366に接続され、プログラム命令、システムプログラム、及び作業データ等を記憶するランダムアクセスメモリ(RAM)360とを含む。コンピュータシステム330はさらに、プリンタ344を含んでいる。
ここでは示さないが、コンピュータ340はさらにローカルエリアネットワーク(LAN)への接続を提供するネットワークアダプタボードを含んでもよい。
コンピュータシステム330に上記した機械翻訳システムとしての動作を行なわせるためのコンピュータプログラムは、CD−ROMドライブ350又はFDドライブ352に挿入されるCD−ROM362又はFD364に記憶され、さらにハードディスク354に転送される。又は、プログラムは図示しないネットワークを通じてコンピュータ340に送信されハードディスク354に記憶されてもよい。プログラムは実行の際にRAM360にロードされる。CD−ROM362から、FD364から、又はネットワークを介して、直接にRAM360にプログラムをロードしてもよい。
このプログラムは、コンピュータ340に上記した各実施の形態の機械翻訳システムとしての動作を行なわせる複数の命令を含む。この方法を行なわせるのに必要な基本的機能のいくつかはコンピュータ340上で動作するオペレーティングシステム(OS)又はサードパーティのプログラム、もしくはコンピュータ340にインストールされる各種ツールキットのモジュールにより提供される。従って、このプログラムはこの実施の形態のシステム及び方法を実現するのに必要な機能全てを必ずしも含まなくてよい。このプログラムは、命令のうち、所望の結果が得られるように制御されたやり方で適切な機能又は「ツール」を呼出すことにより、上記した機械翻訳システムを実現する命令のみを含んでいればよい。コンピュータシステム330の動作は周知であるので、ここでは繰返さない。
今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味及び範囲内でのすべての変更を含む。
本発明の第1の実施の形態に係る機械翻訳システムの機能ブロック図である。 図1に示す訳文候補生成部32のより詳細な機能ブロック図である。 図2に示す第1の翻訳装置35Aの詳細な機能ブロック図である。 図2に示す第2の翻訳装置35Bの詳細な機能ブロック図である。 図2に示す第3の翻訳装置35Cの詳細な機能ブロック図である。 図2に示す第4の翻訳装置35Dの詳細な機能ブロック図である。 訳文のマージ処理を模式的に説明するための図である。 図2に示す第5の翻訳装置35Eの詳細な機能ブロック図である。 訳文の構造共有化処理を説明するための図である。 図1に示す訳文改良部36の機能ブロック図である。 本発明の第2の実施の形態に係る機械翻訳システムの機能ブロック図である。 図11に示す第1の最良訳生成部102Aの詳細な機能ブロック図である。 第2の実施の形態に係る機械翻訳システムのネットワーク構成を示す図である。 本発明の一実施の形態に係る機械翻訳システムを実現するコンピュータの外観を示す図である。 図14に示すコンピュータのブロック図である。
符号の説明
20,100 機械翻訳システム、30 入力文、32 訳文候補生成部、33 分配部、34 対訳コーパス、36 訳文改良部、37 選択部、38 終了判定部、39 初期候補訳文、39A〜39E 訳文、42 出力文、70 訳文選択部、71 訳文変形部、72 変形後訳文評価部、73 訳文記憶部、74 繰返し制御部、102A〜102N 最良訳生成部、104 訳文選択部、106A 初期候補生成部、107A 訳文改良部

Claims (13)

  1. 第1の言語の入力文に対しそれぞれ第2の言語の訳文を生成するための、複数個の機械翻訳手段と、
    前記第2の言語の訳文をそれぞれ起点として、所定の評価方式に従った評価が改善するように訳文を改良するための訳文改良手段と、
    前記訳文改良手段により改良された訳文のうちで所定の条件を充足するものを前記入力文に対する訳文として選択するための訳文選択手段とを含む、機械翻訳システム。
  2. 前記複数個の機械翻訳手段は、互いに異なる方式のものである、請求項1に記載の機械翻訳システム。
  3. 前記訳文改良手段は、
    入力される訳文に対し、所定の変形を行なうための訳文変形手段と、
    前記訳文変形手段により変形された訳文に対して前記評価を行なうための訳文評価手段と、
    前記訳文評価手段により変形された訳文に対して得られた評価が、前記入力される訳文に対して得られた評価に対し改善されているか否かを判定し、改善が認められなくなるまで、前記訳文変形手段により変形された訳文に対し、前記変形及び前記評価を繰返し実行するように前記訳文変形手段及び前記評価手段を制御するための繰返し制御手段とを含む、請求項1又は請求項2に記載の機械翻訳システム。
  4. 前記訳文変形手段は、一つの訳文に対して複数通りの変形を行なって複数個の変形後の訳文を生成するための手段を含み、
    前記評価手段は、前記複数個の変形後の訳文の各々に対し前記評価を行なうための手段を含む、請求項3に記載の機械翻訳システム。
  5. 前記繰返し制御手段は、前記訳文変形手段により変形された複数通りの訳文の各々に対し、前記評価手段による評価の改善が見られなくなるまで前記変形及び前記評価を繰返し実行するように前記訳文変形手段及び前記評価手段を制御するための手段を含む、請求項4に記載の機械翻訳システム。
  6. 前記繰返し制御手段は、前記訳文変形手段により変形された複数通りの訳文のうち、評価が上位の所定個数内の各々に対し、前記評価手段による評価の改善が見られなくなるまで前記変形及び前記評価を繰返し実行するように前記訳文変形手段及び前記評価手段を制御するための手段を含む、請求項4に記載の機械翻訳システム。
  7. 前記訳文改良手段は、
    入力される訳文に対し、所定の変形を行なうための訳文変形手段と、
    前記訳文変形手段により変形された訳文に対して前記評価を行なうための訳文評価手段と、
    前記訳文変形手段により変形された訳文に対し、予め定められた回数だけ前記変形及び前記評価を繰返し実行するように前記訳文変形手段及び前記評価手段を制御するための繰返し制御手段とを含む、請求項1又は請求項2に記載の機械翻訳システム。
  8. 前記訳文選択手段は、前記繰返し制御手段による繰返しの中で得られた複数個の訳文のうち、前記評価手段による評価が最も高かったものを選択するための手段を含む、請求項7に記載の機械翻訳システム。
  9. 前記訳文評価手段は、前記第2の言語の言語モデルと前記第2の言語から前記第1の言語への翻訳モデルとに基づいて訳文の尤度を算出するための手段を含む、請求項1〜請求項8のいずれかに記載の機械翻訳システム。
  10. コンピュータにより実行されると、当該コンピュータを請求項1〜請求項9のいずれかに記載の機械翻訳システムとして動作させる、コンピュータプログラム。
  11. 複数個の機械翻訳装置に第1の言語の入力文を与え、それぞれ対応する第2の言語の訳文を得るための訳文取得手段と、
    前記訳文取得手段により得られた前記第2の言語の訳文を、各々が前記第2の言語の訳文をそれぞれ起点として、所定の評価方式に従った評価が改善するように訳文を変形するための複数個の訳文変形手段にそれぞれ与え、変形された複数個の訳文とそれぞれに付随する評価値とを受取るための変形訳文取得手段と、
    前記変形訳文取得手段が受取った訳文のうちで所定の条件を充足するものを前記入力文に対する訳文として選択し出力するための訳文選択手段とを含む、機械翻訳システムの制御装置。
  12. 前記訳文選択手段は、前記変形訳文取得手段が受取った訳文のうちで最も高いスコアを持つものを選択するための手段を含む、請求項11に記載の機械翻訳システムの制御装置。
  13. コンピュータにより実行されると、当該コンピュータを、機械翻訳システムの制御装置として動作させるためのコンピュータプログラムであって、
    前記機械翻訳システムは、
    第1の言語の文に対しそれぞれ第2の言語の訳文を生成するための、互いに異なる複数個の機械翻訳装置と、
    前記第2の言語の訳文をそれぞれ起点として、所定の評価方式に従った評価が改善するように訳文を変形するための複数個の訳文変形装置とを含み、
    前記制御装置は、
    前記第1の言語の入力文を前記複数個の機械翻訳装置に与え、対応する第2の言語の訳文を得るための訳文取得手段と、
    前記訳文取得手段により得られた前記第2の言語の訳文を、前記複数個の訳文変形装置にそれぞれ与え、変形された訳文とそれぞれに付随する評価値とを受取るための変形訳文取得手段と、
    前記変形訳文取得手段が受取った訳文のうちで所定の条件を充足するものを前記入力文に対する訳文として選択し出力するための訳文選択手段とを含む、コンピュータプログラム。
JP2004151966A 2003-09-09 2004-05-21 機械翻訳システム、その制御装置、及びコンピュータプログラム Active JP3919771B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004151966A JP3919771B2 (ja) 2003-09-09 2004-05-21 機械翻訳システム、その制御装置、及びコンピュータプログラム
US10/917,506 US20050055217A1 (en) 2003-09-09 2004-08-13 System that translates by improving a plurality of candidate translations and selecting best translation
CN2004100770385A CN1595398B (zh) 2003-09-09 2004-09-09 机器翻译系统、机器翻译方法以及机器翻译系统的控制装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2003316236 2003-09-09
JP2003316236 2003-09-09
JP2004151966A JP3919771B2 (ja) 2003-09-09 2004-05-21 機械翻訳システム、その制御装置、及びコンピュータプログラム

Publications (3)

Publication Number Publication Date
JP2005108184A true JP2005108184A (ja) 2005-04-21
JP2005108184A6 JP2005108184A6 (ja) 2006-04-06
JP3919771B2 JP3919771B2 (ja) 2007-05-30

Family

ID=34228033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004151966A Active JP3919771B2 (ja) 2003-09-09 2004-05-21 機械翻訳システム、その制御装置、及びコンピュータプログラム

Country Status (3)

Country Link
US (1) US20050055217A1 (ja)
JP (1) JP3919771B2 (ja)
CN (1) CN1595398B (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007323476A (ja) * 2006-06-02 2007-12-13 National Institute Of Information & Communication Technology 機械翻訳装置及びコンピュータプログラム
JP2009527818A (ja) * 2006-02-17 2009-07-30 グーグル・インコーポレーテッド 分散型モデルの符号化及び適応可能なスケーラブルアクセス処理
JP2009217360A (ja) * 2008-03-07 2009-09-24 Toshiba Corp 機械翻訳する装置、方法およびプログラム
JP2011118496A (ja) * 2009-12-01 2011-06-16 National Institute Of Information & Communication Technology 統計的機械翻訳のための言語独立な単語セグメント化
JP2011180941A (ja) * 2010-03-03 2011-09-15 National Institute Of Information & Communication Technology 句テーブル生成器及びそのためのコンピュータプログラム
JP2013206397A (ja) * 2012-03-29 2013-10-07 Fujitsu Ltd 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム
JP2014137654A (ja) * 2013-01-16 2014-07-28 ▲うぇい▼強科技股▲ふん▼有限公司 翻訳システム及びその翻訳方法
JP2017068631A (ja) * 2015-09-30 2017-04-06 株式会社東芝 機械翻訳装置、方法及びプログラム
CN107038158A (zh) * 2016-02-01 2017-08-11 松下知识产权经营株式会社 对译语料库制作方法、装置、程序以及机器翻译系统
KR20190091103A (ko) * 2018-01-26 2019-08-05 삼성전자주식회사 기계 번역 방법 및 장치
WO2020255553A1 (ja) * 2019-06-17 2020-12-24 株式会社Nttドコモ 生成装置、及び正規化モデル

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4410486B2 (ja) * 2003-05-12 2010-02-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳装置及びプログラム
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
US7509318B2 (en) * 2005-01-28 2009-03-24 Microsoft Corporation Automatic resource translation
US20060206797A1 (en) * 2005-03-08 2006-09-14 Microsoft Corporation Authorizing implementing application localization rules
US7698126B2 (en) * 2005-03-08 2010-04-13 Microsoft Corporation Localization matching component
US8219907B2 (en) * 2005-03-08 2012-07-10 Microsoft Corporation Resource authoring with re-usability score and suggested re-usable data
US7774195B2 (en) * 2005-03-08 2010-08-10 Microsoft Corporation Method and system for creating, storing, managing and consuming culture specific data
US7653528B2 (en) * 2005-03-08 2010-01-26 Microsoft Corporation Resource authoring incorporating ontology
US10319252B2 (en) * 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US8943080B2 (en) * 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US20080004858A1 (en) * 2006-06-29 2008-01-03 International Business Machines Corporation Apparatus and method for integrated phrase-based and free-form speech-to-speech translation
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US7848915B2 (en) * 2006-08-09 2010-12-07 International Business Machines Corporation Apparatus for providing feedback of translation quality using concept-based back translation
US7881928B2 (en) * 2006-09-01 2011-02-01 International Business Machines Corporation Enhanced linguistic transformation
US7774197B1 (en) 2006-09-27 2010-08-10 Raytheon Bbn Technologies Corp. Modular approach to building large language models
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US20080154605A1 (en) * 2006-12-21 2008-06-26 International Business Machines Corporation Adaptive quality adjustments for speech synthesis in a real-time speech processing system based upon load
US20080172219A1 (en) * 2007-01-17 2008-07-17 Novell, Inc. Foreign language translator in a document editor
US7895030B2 (en) * 2007-03-16 2011-02-22 International Business Machines Corporation Visualization method for machine translation
US8326598B1 (en) 2007-03-26 2012-12-04 Google Inc. Consensus translations from multiple machine translation systems
US8831928B2 (en) * 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US8209164B2 (en) * 2007-11-21 2012-06-26 University Of Washington Use of lexical translations for facilitating searches
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US10417646B2 (en) * 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
WO2012079257A1 (zh) * 2010-12-17 2012-06-21 北京交通大学 机器翻译装置和方法
US9063931B2 (en) * 2011-02-16 2015-06-23 Ming-Yuan Wu Multiple language translation system
US10140320B2 (en) 2011-02-28 2018-11-27 Sdl Inc. Systems, methods, and media for generating analytical data
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
KR20130014106A (ko) * 2011-07-29 2013-02-07 한국전자통신연구원 다중 번역 엔진을 사용한 번역 장치 및 방법
US9984054B2 (en) 2011-08-24 2018-05-29 Sdl Inc. Web interface including the review and manipulation of a web document and utilizing permission based control
JP2013069157A (ja) * 2011-09-22 2013-04-18 Toshiba Corp 自然言語処理装置、自然言語処理方法および自然言語処理プログラム
FI125823B (en) * 2011-11-03 2016-02-29 Rex Partners Oy A measure of the quality of machine translation
US8935151B1 (en) * 2011-12-07 2015-01-13 Google Inc. Multi-source transfer of delexicalized dependency parsers
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9817821B2 (en) * 2012-12-19 2017-11-14 Abbyy Development Llc Translation and dictionary selection by context
US20160132491A1 (en) * 2013-06-17 2016-05-12 National Institute Of Information And Communications Technology Bilingual phrase learning apparatus, statistical machine translation apparatus, bilingual phrase learning method, and storage medium
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
US9805028B1 (en) * 2014-09-17 2017-10-31 Google Inc. Translating terms using numeric representations
US10672390B2 (en) * 2014-12-22 2020-06-02 Rovi Guides, Inc. Systems and methods for improving speech recognition performance by generating combined interpretations
US10114817B2 (en) 2015-06-01 2018-10-30 Microsoft Technology Licensing, Llc Data mining multilingual and contextual cognates from user profiles
CN105068998B (zh) * 2015-07-29 2017-12-15 百度在线网络技术(北京)有限公司 基于神经网络模型的翻译方法及装置
US9747281B2 (en) * 2015-12-07 2017-08-29 Linkedin Corporation Generating multi-language social network user profiles by translation
US10467114B2 (en) 2016-07-14 2019-11-05 International Business Machines Corporation Hierarchical data processor tester
US10108610B1 (en) * 2016-09-23 2018-10-23 Amazon Technologies, Inc. Incremental and preemptive machine translation
US10108611B1 (en) * 2016-09-23 2018-10-23 Amazon Technologies, Inc. Preemptive machine translation
US10235362B1 (en) * 2016-09-28 2019-03-19 Amazon Technologies, Inc. Continuous translation refinement with automated delivery of re-translated content
US10261995B1 (en) 2016-09-28 2019-04-16 Amazon Technologies, Inc. Semantic and natural language processing for content categorization and routing
US10275459B1 (en) 2016-09-28 2019-04-30 Amazon Technologies, Inc. Source language content scoring for localizability
CN106649293A (zh) * 2016-12-28 2017-05-10 语联网(武汉)信息技术有限公司 一种翻译方法及系统
CN107861954B (zh) * 2017-11-06 2020-11-10 北京百度网讯科技有限公司 基于人工智能的信息输出方法和装置
RU2692049C1 (ru) * 2017-12-29 2019-06-19 Общество С Ограниченной Ответственностью "Яндекс" Способ и система перевода исходного предложения на первом языке целевым предложением на втором языке
JP2019121241A (ja) * 2018-01-09 2019-07-22 パナソニックIpマネジメント株式会社 翻訳装置、翻訳方法、及びプログラム
CN109979461B (zh) * 2019-03-15 2022-02-25 科大讯飞股份有限公司 一种语音翻译方法及装置
US11328132B2 (en) * 2019-09-09 2022-05-10 International Business Machines Corporation Translation engine suggestion via targeted probes
CN111626066B (zh) * 2020-05-27 2021-04-13 重庆六花网络科技有限公司 一种基于大数据的段落翻译系统及其方法
CN111680525B (zh) * 2020-06-09 2024-03-26 语联网(武汉)信息技术有限公司 基于逆向差异识别的人机共译方法与系统

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US917420A (en) * 1907-08-19 1909-04-06 Johannes Diem-Beutler Method of producing a chain-stitch.
US5369574A (en) * 1990-08-01 1994-11-29 Canon Kabushiki Kaisha Sentence generating system
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
DE69837979T2 (de) * 1997-06-27 2008-03-06 International Business Machines Corp. System zum Extrahieren einer mehrsprachigen Terminologie
JP2000250914A (ja) * 1999-03-01 2000-09-14 Nippon Telegr & Teleph Corp <Ntt> 機械翻訳方法、装置、および機械翻訳プログラムを記録した記録媒体
AU2001261506A1 (en) * 2000-05-11 2001-11-20 University Of Southern California Discourse parsing and summarization
US7295962B2 (en) * 2001-05-11 2007-11-13 University Of Southern California Statistical memory-based translation system
WO2002093417A1 (en) * 2001-05-17 2002-11-21 University Of Southern California Statistical method for building a translation memory
US20030110023A1 (en) * 2001-12-07 2003-06-12 Srinivas Bangalore Systems and methods for translating languages
WO2003077152A2 (en) * 2002-03-04 2003-09-18 University Of Southern California Sentence generator
JP2005527894A (ja) * 2002-03-28 2005-09-15 ユニバーシティ・オブ・サザン・カリフォルニア 統計的機械翻訳
US7353165B2 (en) * 2002-06-28 2008-04-01 Microsoft Corporation Example based machine translation system
US7349839B2 (en) * 2002-08-27 2008-03-25 Microsoft Corporation Method and apparatus for aligning bilingual corpora
US7249012B2 (en) * 2002-11-20 2007-07-24 Microsoft Corporation Statistical method and apparatus for learning translation relationships among phrases
US7139949B1 (en) * 2003-01-17 2006-11-21 Unisys Corporation Test apparatus to facilitate building and testing complex computer products with contract manufacturers without proprietary information

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009527818A (ja) * 2006-02-17 2009-07-30 グーグル・インコーポレーテッド 分散型モデルの符号化及び適応可能なスケーラブルアクセス処理
JP2007323476A (ja) * 2006-06-02 2007-12-13 National Institute Of Information & Communication Technology 機械翻訳装置及びコンピュータプログラム
JP2009217360A (ja) * 2008-03-07 2009-09-24 Toshiba Corp 機械翻訳する装置、方法およびプログラム
JP2011118496A (ja) * 2009-12-01 2011-06-16 National Institute Of Information & Communication Technology 統計的機械翻訳のための言語独立な単語セグメント化
JP2011180941A (ja) * 2010-03-03 2011-09-15 National Institute Of Information & Communication Technology 句テーブル生成器及びそのためのコンピュータプログラム
JP2013206397A (ja) * 2012-03-29 2013-10-07 Fujitsu Ltd 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム
JP2014137654A (ja) * 2013-01-16 2014-07-28 ▲うぇい▼強科技股▲ふん▼有限公司 翻訳システム及びその翻訳方法
JP2017068631A (ja) * 2015-09-30 2017-04-06 株式会社東芝 機械翻訳装置、方法及びプログラム
CN107038158A (zh) * 2016-02-01 2017-08-11 松下知识产权经营株式会社 对译语料库制作方法、装置、程序以及机器翻译系统
CN107038158B (zh) * 2016-02-01 2021-12-03 松下知识产权经营株式会社 对译语料库制作方法、装置、记录介质以及机器翻译系统
KR20190091103A (ko) * 2018-01-26 2019-08-05 삼성전자주식회사 기계 번역 방법 및 장치
KR102516363B1 (ko) * 2018-01-26 2023-03-31 삼성전자주식회사 기계 번역 방법 및 장치
WO2020255553A1 (ja) * 2019-06-17 2020-12-24 株式会社Nttドコモ 生成装置、及び正規化モデル
JP7447114B2 (ja) 2019-06-17 2024-03-11 株式会社Nttドコモ 生成装置、及び正規化モデル

Also Published As

Publication number Publication date
CN1595398B (zh) 2010-04-28
JP3919771B2 (ja) 2007-05-30
US20050055217A1 (en) 2005-03-10
CN1595398A (zh) 2005-03-16

Similar Documents

Publication Publication Date Title
JP3919771B2 (ja) 機械翻訳システム、その制御装置、及びコンピュータプログラム
JP2005108184A6 (ja) 機械翻訳システム、その制御装置、及びコンピュータプログラム
JP2020123372A (ja) 画像キャプション生成のための空間的注目モデル
May et al. Tiburon: A weighted tree automata toolkit
US8775155B2 (en) Machine translation using overlapping biphrase alignments and sampling
US11593571B2 (en) Machine translation method, device, and computer-readable storage medium
US8838433B2 (en) Selection of domain-adapted translation subcorpora
US7983898B2 (en) Generating a phrase translation model by iteratively estimating phrase translation probabilities
US20120262461A1 (en) System and Method for the Normalization of Text
Sagae et al. Shift-reduce dependency DAG parsing
RU2638634C2 (ru) Автоматическое обучение программы синтаксического и семантического анализа с использованием генетического алгоритма
JP6312467B2 (ja) 情報処理装置、情報処理方法、およびプログラム
KR20140049150A (ko) 사용자 참여 기반의 자동 번역 생성 후처리 시스템
CN113407709A (zh) 生成式文本摘要系统和方法
JPWO2014073206A1 (ja) 情報処理装置、及び、情報処理方法
CN111046659B (zh) 上下文信息生成方法、上下文信息生成装置及计算机可读记录介质
JP2014010634A (ja) 対訳表現抽出装置、対訳表現抽出方法及び対訳表現抽出のためのコンピュータプログラム
Tambouratzis Applying PSO to natural language processing tasks: Optimizing the identification of syntactic phrases
CN111832699A (zh) 用于神经网络的计算高效富于表达的输出层
Vashistha et al. Active learning for neural machine translation
JP5199901B2 (ja) 言語モデル作成方法、言語モデル作成装置および言語モデル作成プログラム
Esplà-Gomis et al. Predicting insertion positions in word-level machine translation quality estimation
JP2020140674A (ja) 回答選択装置及びプログラム
US20240037329A1 (en) Computer-readable recording medium storing generation program, computer-readable recording medium storing prediction program, and information processing apparatus
JP2006126886A (ja) 文短縮用知識の学習装置、文短縮装置、機械翻訳装置および文短縮のためのコンピュータプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070213

R150 Certificate of patent or registration of utility model

Ref document number: 3919771

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100223

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110223

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120223

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130223

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130223

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130223

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140223

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250