JP4410486B2 - 機械翻訳装置及びプログラム - Google Patents
機械翻訳装置及びプログラム Download PDFInfo
- Publication number
- JP4410486B2 JP4410486B2 JP2003133537A JP2003133537A JP4410486B2 JP 4410486 B2 JP4410486 B2 JP 4410486B2 JP 2003133537 A JP2003133537 A JP 2003133537A JP 2003133537 A JP2003133537 A JP 2003133537A JP 4410486 B2 JP4410486 B2 JP 4410486B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- translation
- sentence
- translated
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Description
【発明の属する技術分野】
本発明は、機械翻訳に関し、特に所定の言語から一旦中間言語に翻訳した後に目的とする言語への翻訳する機械翻訳システムに関する。
【0002】
【従来の技術】
コンピュータを用いて所定の自然言語文の構文や意味を解析し、他の自然言語の文に置き換える機械翻訳が、翻訳エンジンの性能の向上に伴って、今日広く利用されてきている。機械翻訳の対象となる言語も多岐にわたっている。そこで、1対1の言語(言語ペア)間の翻訳のみならず、任意の言語から任意の言語へ翻訳可能な多言語翻訳を実現するシステムが提案されている。
【0003】
多言語翻訳を行う場合、全ての言語ペアに対して独立に翻訳エンジンを構築することは、多大な開発負荷を要し、効率的でない。そこで、原文テキストを一旦所定の中間言語に翻訳し、その後に中間言語から所望の言語に翻訳する手法が考えられる。
従来、この種の多言語翻訳システムとして、次の2方式がある。
方式1 純粋な自然言語(例えば英語)をそのまま中間言語とする方式(例えば、特許文献1参照)。
方式2 ピボット方式−言語に依存しない意味・概念レベルのデータ構造を介して翻訳する方式(例えば、非特許文献1、2参照)。
【0004】
方式1では、言語Xから中間言語である自然言語(以下、言語Cとする)への翻訳エンジン(X−C翻訳エンジン)と言語Cから言語Yへの翻訳エンジン(C−Y翻訳エンジン)とを結合することにより、任意の言語間(言語Xから言語Y)の自動翻訳を実現する。
方式2では、方式1の中間言語として自然言語の代わりに、特定の言語に依存しないデータ構造を用いる。すなわち、言語Xの文の意味・概念を抽出して当該データ構造で表現し、このデータ構造から言語Yの文を組み立てる。
【0005】
【特許文献1】
特許公開2003−58481号公報(第5頁)
【非特許文献1】
Masaru Tomita、Jaime G. Carbonell著、“Another Stride Towards Knowledge-Based Machine Translation.”、COLING 1986: p.633−638
【非特許文献2】
Deryle W. Lonsdale、Alexander M. Franz、John R. R. Leavitt著、“Large-scale Machine Translation: An Interlingua Approach.”、Seventh International Conference on Industrial and Engineering Applications of Artificial Intelligence and Expert Systems、p.525−530、Austin、Texas: 1994
【非特許文献3】
Hideo Watanabe、Katashi Nagao、Michael C. McCord、Arendse Bernth著、“Improving Natural Language Processing by Linguistic Document Annotation.”、In Proceedings of Workshop of the 18th International Conference on Computational Linguistics、COLING 2000
【0006】
【発明が解決しようとする課題】
上記のように、従来から多言語間の翻訳システムが提案されているが、上述した中間言語を介した翻訳システムにおいて、中間言語として自然言語を用いる方式1では、次のような情報欠落の問題がある。
(1)ソース(翻訳元)言語Xでは異なる表現であっても、中間言語Cに翻訳すると同一の表現になることがある。この場合、その中間言語Cをターゲット(翻訳先)言語Yに翻訳すると、出力される言語Yも言語Cと同一の表現となってしまい、言語Xにおける違いを反映することができない。
(2)ソース言語Xのある表現の中間言語Cでの訳を一意に決められない場合に、無理に訳を1つに決定してしまうと、ターゲット言語への翻訳で正解を生成できないことがある。
これらの現象(1)(2)は、中間言語として選択した言語にターゲット言語への翻訳の観点から必要な情報を不足なく保持することができないことから起こる問題である。
【0007】
一方、中間言語に自然言語を用いない方式2では、方式1で欠落してしまう情報を保持するようなデータ構造を構築することもできるが、多様な言語の特性に幅広く適切に対応する中間言語のデータ構造をデザインし実装することは、現実には極めて困難である。そのため実際には、翻訳システムのカバレージが非常に狭くなってしまう。
【0008】
そこで本発明は、上記の問題に鑑み、翻訳時の情報の欠落を防止して精度の高い多言語間の機械翻訳を実現することを目的とする。
また本発明は、所定の自然言語を中間言語として用いて、かかる精度の高い機械翻訳を実現する翻訳システム及びその方法を提供することを他の目的とする。
【0009】
【課題を解決するための手段】
上記の目的を達成する本発明は、次のように構成された機械翻訳装置として実現される。すなわち、この機械翻訳装置は、2種類の翻訳エンジンを備え、第1の翻訳エンジンは、ソース言語で記述された原文を所定の中間言語の文に翻訳すると共に、この翻訳によって得られる注釈情報を取得して訳出された中間言語の文に付加する。また、第2の翻訳エンジンは、第1の翻訳エンジンにより得られた中間言語の文に付加された注釈情報を参照し、この中間言語の文をターゲット言語の文に翻訳する。
ここで、第1の翻訳エンジンを複数のソース言語に対応して複数設け、第2の翻訳エンジンを複数のターゲット言語に対応して複数設けることができる。これにより、第1の翻訳エンジン及び第2の翻訳エンジンが対応する任意の多言語間の翻訳が可能となる。
【0010】
さらに好ましくは、第2の翻訳エンジンは、この注釈情報に基づいて、中間言語とターゲット言語との間の辞書に加えてソース言語とターゲット言語との間の辞書を用いて翻訳を行う。また、第2の翻訳エンジンは、注釈情報に基づいて翻訳した翻訳文と注釈情報に基づかずに翻訳した翻訳文とを、翻訳結果としていずれも出力する。また、第1の翻訳エンジンは、中間言語の文を所定のマークアップ言語の文書ファイルに記述し、注釈情報を当該マークアップ言語のコマンドとして文書ファイル中に記述する。
さらにまた、本発明の機械翻訳装置は、第2の翻訳エンジンによる翻訳結果を出力し、出力された翻訳結果に対するユーザによる処理を受け付けて、この翻訳結果に反映させる翻訳結果修正部をさらに備える構成とすることができる。
【0011】
また、本発明の他の機械翻訳装置は、第1の言語で記述された文を第2の言語の文に翻訳するため、第1の言語で記述された文に対する構文解析を行う構文解析部と、第1の言語と第2の言語との間の辞書に加えて、第1の言語で記述された文に付加された注釈情報に基づき第3の言語と前記第2の言語との間の辞書を用いて、第1の言語で記述された文の構文を第2の言語の構文に変換する構文変換部と、構文変換部の処理結果に基づいて第2の言語の文を生成する文生成部とを備えることを特徴とする。
【0012】
上記の目的を達成する他の本発明は、コンピュータを用いてソース言語で記述された原文をターゲット言語の文に翻訳する、次のようなデータ処理方法として実現される。すなわち、このデータ処理方法は、原文を所定の中間言語の文に翻訳すると共に、この翻訳によって得られる注釈情報を取得して訳出された中間言語の文に付加し、所定の記憶手段に格納する第1のステップと、この記憶手段に格納された中間言語の文を、この中間言語の文に付加されている注釈情報を参照してターゲット言語の文に翻訳し、出力する第2のステップとを含むことを特徴とする。
【0013】
さらに本発明は、コンピュータを制御して上述した機械翻訳装置として機能させるプログラム、またはコンピュータに上記のデータ処理方法の各ステップに対応する処理を実行させるプログラムとしても実現される。このプログラムは、磁気ディスクや光ディスク、半導体メモリ、その他の記録媒体に格納して配布したり、ネットワークを介して配信したりすることにより提供することができる。
【0014】
【発明の実施の形態】
以下、添付図面に示す実施の形態に基づいて、この発明を詳細に説明する。
図1は、本実施の形態によって実現される多言語翻訳システムの全体構成を示す図である。
図1に示す多言語翻訳システムは、中間言語を介して所望の言語から所望の言語への翻訳を行う。中間言語としては所定の自然言語を用いる。本実施の形態では、多くの言語との間で翻訳エンジンが既に存在する英語を中間言語として用いることにする。すなわち、図1の多言語翻訳システムでは、日本語からイタリア語へ翻訳する場合、一旦、日−英翻訳エンジンにより日本語から英語へ翻訳された後に、英−伊翻訳エンジンにより英語からイタリア語へ翻訳されることとなる(図1の太い矢印参照)。これは、本実施の形態の多言語翻訳システムがサポートする全ての言語(図示の例では、日本語、イタリア語、中国語、フランス語、スペイン語、ドイツ語)間の翻訳で同様である。なお、本実施の形態では、上記のように中間言語として英語を用いたが、他の言語を中間言語として使用可能であることは言うまでもない。
【0015】
さて、図1に示したシステムのように中間言語を介して任意の言語間の翻訳を行う場合、単純に中間言語Cを介在させて翻訳を重ねると、ソース言語Xから中間言語Cへ翻訳した際に、この翻訳処理によって得られる情報(ソース言語Xの文に基づく情報を含む)が欠落するため、最終的に生成されるターゲット言語Yの翻訳文の精度が低下してしまう。具体例を挙げて説明する。
【0016】
英語を中間言語Cとして、日本語からフランス語へ翻訳する場合を考える。例えば、日本語文
「私は銀行へ行きました。」(J11)
と
「私は堤防へ行きました。」(J12)
を英訳すると、いずれも
「I went to a bank.」(E11)
という英語文になる。これは、日本語の「銀行」、「堤防」に対する英語の訳語がいずれも「bank」であるためである。そして、この英語文をさらにフランス語に翻訳すると、例えば
「Je suis alle a une banque.」(F11)
(アクセント符号は省略)
というフランス語文になる。フランス語の「banque」には、「銀行」の意味はあるが「堤防」の意味はない。したがって、フランス語文(F11)が、日本語文(J12)を原文(ソース)として翻訳した結果である場合、明らかな誤訳である(翻訳エンジンによっては、「bank」の訳語として堤防を意味する「digue」が選択される可能性もあり、この場合、反対に日本語文(J11)を翻訳すると誤訳となる)。
【0017】
図2は、上記の「bank」、「銀行」、「堤防」、「banque」、「digue」と同様に、日本語及びフランス語で区別される語が英語では同一の語になる例を示す図である。
図2に示すような語が含まれる文を翻訳する場合、中間言語Cである英語に翻訳した時点で、ソース言語Xでどちらの語が使われていたかという情報が失われてしまうため、誤訳の可能性が生じてしまう。
【0018】
中間言語Cを介することによる情報欠落の他の例として、丁寧さなどのニュアンスの喪失がある。例としてドイツ語文
「Wie geht es dir?」(D21)
と
「Wie geht es Ihnen?」(D22)
とを考える。この2つの文は、文意は同じであるが、(D22)の方が丁寧な言い方であり、日本語における
「元気かい?」(J21)
と
「お元気ですか?」(J22)
のようなニュアンスの違いがある。しかし、英語ではこれらの文と同じ文意で丁寧さの異なる言い方はなく、英訳するといずれも
「How are you?」(E21)
となってしまい、区別することができない。したがって、英訳した時点でこのようなニュアンスの情報が失われてしまうため、ドイツ語文(D21)から日本語文(J21)を、ドイツ語文(D22)から日本語文(J22)を的確に訳出することができない。
【0019】
以上の例は、いずれも英語を中間言語Cとして用いる場合の弊害となっているが、反対に、英語に訳した場合に複数の意味を持つ日本語やフランス語の単語もあり、英語で文意が同じながらニュアンスの異なる言い方があるのに対して日本語やドイツ語では1つの言い方しかないという場合もあり得る。したがって、これらの不都合は、中間言語Cを介して多言語間の翻訳を行う場合に一般的に生じるのであり、英語以外の他の言語を中間言語Cとして用いても同様である。
【0020】
以上のように、「中間言語Cに翻訳した際に、ソース言語X及びターゲット言語Yで共に区別される事象が同一の表現になってしまう」ことの他に、単純に中間言語Cを介在させた場合の不都合として、次のようなものがある。
X−C翻訳の際にソース言語Xの構文解析が成功し、正しい中間言語Cを出力しているにも関わらず、中間言語Cを構文解析する際に誤りを生じてしまう場合がある。特に、ソース言語Xでは既知語だが、中間言語Cでは未知語になるような固有名詞等が含まれる場合、C−Y翻訳における中間言語Cの構文解析が困難な場合が多い。
また、ユーザがターゲット言語Yにおいて適切な訳を選択し、あるいは修正できるように、翻訳結果として複数の翻訳候補を提示しようとする場合、ソース言語Xから中間言語Cへの翻訳の際に中間言語Cの表現を一意に定めてしまうと、訳出されたターゲット言語Yの翻訳候補の中にユーザの欲する解が含まれない場合がある。
【0021】
以上のような、X−C翻訳の際の情報欠落による翻訳の品質低下を防止するため、本実施の形態では、X−C翻訳の際に当該翻訳処理によって得られる情報を訳出された中間言語Cの文にアノテーション(注釈)として付加し、この注釈情報をC−Y翻訳において利用する。注釈情報としては、例えば次のような情報を翻訳処理の過程で取得することができる。
・単語のスコープ及びその単語の情報(基本形、品詞、その他属性)
・単語間の係り受け情報
・文のスコープ
・別解釈情報(単語及び文全体)
・ソース言語の情報
ここで、単語のスコープとは、1つの単語の範囲を示す情報である。例えば、複合語や固有名詞などのように細かく切りすぎるとかえって誤訳を招くような場合に、適切な単語の範囲を指示することができる。文のスコープとは、1つの文の範囲を示す情報である。例えば英語のピリオドは、文の末尾を示す終止符として用いられると共に、省略語(Mr.等)を示す符号としても用いられるため、文中のピリオドの有無のみでは、そこで文を切るべきかどうかがわからない。このような場合に、適切な1文の範囲を指示することができる。また、別解釈情報とは、訳語や訳文として該当するものが複数ある場合に、それらの候補を提示する。
【0022】
これらの注釈情報を中間言語Cの文に付加する方法としては、種々の方法が考えられ、特定の方法に限定するものではないが、本実施の形態では、中間言語Cの文をXML文書として記述し、XML言語であるLAL(Linguistic Annotation Language)によりアノテーションを付加する方法について説明する(LALについては、例えば非特許文献3参照)。
図3は、英語文「She saw a man with a telescope.」に対してLALによるアノテーションを付加した例を示す図である。図3に示したLALの例では、タグ<lal:s>で文のスコープを示し、タグ<lal:w>で単語のスコープを示している。また、<lal:w>の属性としてlexで基本形を、posで品詞を示している。また、単語の係り受け関係は、<lal:w>のid属性でその単語のIDを示し、mod属性の値として係り先単語のid値を指定することにより表現している。上記の例では、id=“5”の単語「with」の係り先がid=“2”の単語「saw」であることが分かる。このような係り受け情報を参照することができれば、中間言語Cからターゲット言語Yへの翻訳において、「with telescope」の前置詞句が「man」を修飾するのか「saw」を修飾するのかの曖昧性解消をすることなく(すなわち、いずれを修飾するのか無理に決定することなく)、前段階のソース言語Xから中間言語Cへの翻訳の際に認識された構造を復元できる。
【0023】
一般に、1つの単語に対応する訳語は複数存在することが多いため、その中から1つの訳語に絞り込む訳語選択は、機械翻訳にとって困難な処理の1つである。例えば、日本語の「問題」という語の英語の訳語としては、「problem」、「issue」、「question」等が考えられる。日−英翻訳エンジンが「問題」を英語に翻訳する際、差し当たって「problem」を訳語として選択するが、他の訳語候補が存在するという状況を、LALを用いて以下のように記述することができる。
<lal:w lex="problem" lex#cand="issue,question">problem</lal:w>
ソース言語Xから中間言語Cへの翻訳結果が上記のように複数の訳語の情報を持っていると、後段の中間言語Cからターゲット言語Yへの翻訳において、かかる情報に基づき、周辺の単語の関係から候補の中の一語に絞り込むことも可能となるし、少なくとも翻訳結果として別訳語を提示することが可能となる。
【0024】
また、単語訳だけでなく、ソース言語Xの文から中間言語Cの文を生成する際の構文にも複数の可能性がある場合がある。例えば、上記の「She saw a man with a telescope.」という英語文の場合、先にも述べたように、「with」の係り先は「saw」であるか「man」であるか、この文だけでは分からない。このような場合、上記の単語の例の様に、中間言語Cに関して複数の解釈(候補)を情報として保持できることが、中間言語Cからターゲット言語Yへの翻訳において好ましい。LALでは、解釈IDという情報を属性値のプレフィックス(解釈指定子)として用いることで、1つのアノテーション内に複数の解釈を保持することが可能である。
図4は、図3の英語文に対して複数の解釈の情報をLALにより付加した例を示す図である。
図4の例では、id=“5”の単語「with」の係り先を示すmod属性の値がi1とi2という解釈指定子付きの複数の値から構成されていて、解釈i1では「saw」に係ることを示し、解釈i2では「man」に係ることを示している。
【0025】
また、ソース言語Xの情報は、<lal:orig>タグを用いて表現する。
図5は、日本語の「ペン」、「国土交通省」という単語を中間言語Cの英語に翻訳した際のLALの例を示す図である。
基本的に、タグ<lal:orig>グではタグ<lal:w>と同じ属性を使用できる。ただし、langでソース言語Xを指定するのは必須である。
【0026】
中間言語Cの文にX−C翻訳の処理で得られた情報を付加しておくことにより、中間言語Cからターゲット言語Yに翻訳する際に、中間言語Cとターゲット言語Yとの間の対訳辞書(C−Y対訳辞書と呼ぶ)のほか、ソース言語Xとターゲット言語Yとの間の対訳辞書(X−Y対訳辞書と呼ぶ)の両者を参照することができる。この時、C−Y対訳辞書によって得られるターゲット言語Yの訳語の集合と、X−Y対訳辞書によって得られるターゲット言語Yの訳語の集合との共通部分を採れば、C−Y対訳辞書のみを用いる場合に比べて、より適切な翻訳結果を得ることができる。
【0027】
さらに、LALを用いて、丁寧さの度合いのようなニュアンスに関する情報は、当該情報を示す属性を定義して中間言語Cの文に付加することができる。
図6は、上述したドイツ語文(D21)、(D22)を中間言語Cである英語に翻訳した場合のLALの例を示す図である。
図6に示す例では、訳出された英語文(E1)、(E2)はいずれも
「How are you?」
であるが、ドイツ語文(D21)を翻訳した英語文(E1)と、ドイツ語文(D22)を翻訳した英語文(E2)とにおいて、「丁寧さ(polite)」を値とする属性ftrの有無が異なっている。中間言語Cからターゲット言語Yである日本語への翻訳においては、属性ftrの値「丁寧さ」の有無を参照し、これに応じて訳し分けることにより、ドイツ語でのニュアンスの違いを日本語に反映することができる。
【0028】
以上、中間言語Cの文に付加する翻訳処理により得られる情報およびその付加方法について具体例を挙げて説明したが、上述したように、XML文書及びLALを用いる以外にも、種々の方法を取り得る。例えば、タグで中間言語Cの文に直接埋め込むのではなく、注釈情報を別ファイルとして作成し、XPathのような文中の所定の箇所を指定する手段を用いて、中間言語Cの文における該当個所に対応付けることもできる。
また、上述した全ての情報が、中間言語Cの文における該当個所に完全に付加されている必要はなく、文中の重要な部分に関してのみ付加するようにしても良い。中間言語Cからターゲット言語Yへの翻訳においても、全ての情報が完全に付加されていることを前提にすべきではない。
なお、上述した各種の情報は、注釈情報として利用できる情報の例に過ぎず、注釈情報として中間言語Cの文に付加できる情報は、これらに限定されるものではない。言語の種類や文の種類等に応じて、翻訳の精度を向上させるために利用可能な任意の情報を注釈情報として用いることが可能である。
【0029】
図7は、本実施の形態による機械翻訳装置を実現するコンピュータ装置のハードウェア構成の例を模式的に示した図である。
図7に示すコンピュータ装置は、演算手段であるCPU(Central Processing Unit:中央処理装置)101と、M/B(マザーボード)チップセット102及びCPUバスを介してCPU101に接続されたメインメモリ103と、同じくM/Bチップセット102及びAGP(Accelerated Graphics Port)を介してCPU101に接続されたビデオカード104と、PCI(Peripheral Component Interconnect)バスを介してM/Bチップセット102に接続されたハードディスク105、ネットワークインターフェイス106と、さらにこのPCIバスからブリッジ回路107及びISA(Industry Standard Architecture)バスなどの低速なバスを介してM/Bチップセット102に接続されたフロッピーディスクドライブ108及びキーボード/マウス109とを備える。
なお、図7は本実施の形態を実現するコンピュータ装置のハードウェア構成を例示するに過ぎず、本実施の形態を適用可能であれば、他の種々の構成を取ることができる。例えば、ビデオカード104を設ける代わりに、ビデオメモリのみを搭載し、CPU101にてイメージデータを処理する構成としても良いし、外部記憶装置として、ATA(AT Attachment)やSCSI(Small Computer System Interface)などのインターフェイスを介してCD−R(Compact Disc Recordable)やDVD−RAM(Digital Versatile Disc Random Access Memory)のドライブを設けても良い。
【0030】
図8は、本実施の形態による機械翻訳装置の機能構成を示す図である。
図8に示すように、本実施の形態の機械翻訳装置は、ソース言語Xの文(原文)を中間言語Cの文に翻訳するX−C翻訳エンジン10と、中間言語Cの文をターゲット言語Yの文(翻訳文)に翻訳するC−Y翻訳エンジン20と、翻訳の際に参照される各種の辞書を格納した辞書格納部30と、原文を入力する入力部40と、入力された原文を格納する原文格納部50と、翻訳文を格納する翻訳文格納部60と、翻訳文を出力する出力部70とを備える。また、必須の構成要素ではないが、翻訳文をユーザが手作業にて修正するための翻訳結果修正部80を備える。
【0031】
上記構成のうち、X−C翻訳エンジン10、C−Y翻訳エンジン20及び翻訳結果修正部80は、例えば図7におけるプログラム制御されたCPU101にて実現される、仮想的なソフトウェアブロックである。CPU101を制御するプログラムは、磁気ディスクや光ディスク、半導体メモリ、その他の記録媒体に格納して配布したり、ネットワークを介して配信したりすることにより提供することができる。
また、辞書格納部30、原文格納部50及び翻訳文格納部60は、例えば図7におけるメインメモリ103やハードディスク105にて実現される。
入力部40は、キーボード等の入力デバイスで実現され、出力部70は、ディスプレイ装置等で実現される。また、ネットワークを介して外部装置から原文を入力したり、翻訳文を外部装置へ出力したりすることも可能であり、この場合、図7のネットワークインターフェイス106が入力部40及び出力部70として機能する。
【0032】
図9は、X−C翻訳エンジン10の構成を示す図である。
図9を参照すると、X−C翻訳エンジン10は、ソース言語Xの文を構文解析する言語X構文解析部11と、構文解析の結果に基づいてソース言語Xの構文を中間言語Cの構文に変換するX−C構文変換部12と、構文変換の結果に基づいて中間言語Cの文を生成する言語C文生成部13とを備える。これら各機能による処理においては、辞書格納部30に格納された各種の辞書(言語X構文解析用辞書311、X−C構文変換用辞書312、X−C対訳辞書313、言語C文生成用辞書314)が参照される。
【0033】
X−C翻訳エンジン10が、原文格納部50から翻訳対象であるソース言語Xの原文を入力し、前段の中間言語Cへの翻訳を開始する。
まず、言語X構文解析部11が、言語X構文解析用辞書311を用いて当該原文の構文構造を解析する。これにより、当該原文について、単語の属性や係り受けの情報が含まれる構文構造が得られる。次に、X−C構文変換部12が、X−C構文変換用辞書312及びX−C対訳辞書313を用いて、この構文解析結果を中間言語Cの構文構造に変換する。そして、この構文変換の結果に基づき、言語C文生成部13が、言語C文生成用辞書314を用いて、中間言語Cの文を生成する。これにより、中間言語Cの構造が、整序、活用変化などの処理によって通常の文に変換される。
【0034】
上述した構文解析、構文変換、文生成の各処理は、既存の翻訳エンジンによる処理と同様であるが、本実施の形態ではさらに、X−C構文変換部12による構文解析の際および言語C文生成部13による文の生成の際に、言語X構文解析部11による処理結果の構文構造に含まれる単語の属性や係り受け、単語の語彙の情報等が注釈情報として抽出される。そして、言語C文生成部13が、得られた注釈情報を生成した中間言語Cの文に付加する。注釈情報の付加方法は、上述したようにLALのようなタグセットを用いて中間言語Cの文に埋め込む他、別ファイルとして中間言語Cの文を記述した文書ファイルに添付するなど、任意の方法を用いることができる。
以上のようにして生成された、注釈情報を付加された中間言語Cの文は、例えば図7に示したメインメモリ103の作業領域に格納される。
【0035】
図10は、C−Y翻訳エンジン20の構成を示す図である。
図10を参照すると、C−Y翻訳エンジン20は、中間言語Cの文を構文解析する言語C構文解析部21と、構文解析の結果に基づいて中間言語Cの構文をターゲット言語Yの構文に変換するC−Y構文変換部22と、構文変換の結果に基づいてターゲット言語Yの文を生成する言語Y文生成部23とを備える。これら各機能による処理においては、辞書格納部30に格納された各種の辞書(言語C構文解析用辞書321、C−Y構文変換用辞書322、C−Y対訳辞書323、言語Y文生成用辞書324、X−Y対訳辞書325)が参照される。
【0036】
C−Y翻訳エンジン20が、メインメモリ103の作業領域等から注釈情報の付加された中間言語Cの文を読み出し、後段のターゲット言語Yへの翻訳を開始する。翻訳のための構文解析、構文変換、文生成の各処理は、既存の翻訳エンジンによる処理と同様であるが、本実施の形態では、前段のX−C翻訳エンジン10による翻訳の際に生成された注釈情報を適宜参照して翻訳が行われる。
【0037】
まず、言語C構文解析部21が、言語C構文解析用辞書321を用いて当該中間言語Cの文の構文構造を解析する。この際、注釈情報を参照し、中間言語Cの文における構文構造が注釈情報に記述されている場合は、この構文構造の指定と矛盾しないように構文構造を構築するか、または注釈情報にて指定されている構文構造を優先する。
【0038】
次に、C−Y構文変換部22が、C−Y構文変換用辞書322及びC−Y対訳辞書323を用いて、この構文解析結果をターゲット言語Yの構文構造に変換する。この際、注釈情報を参照し、ソース言語Xの言語情報がある場合は、この情報に基づいて、X−Y対訳辞書325をさらに用いて処理を行うことができる。この場合、C−Y対訳辞書323に基づく訳語とX−Y対訳辞書325に基づく訳語の双方の情報を参考に、最も好適な訳語を選択する。
C−Y翻訳エンジン20による翻訳処理のみに着目すると、翻訳元である言語Cと翻訳先である言語Yとの対訳辞書の他に、第3の言語である言語Xと言語Yとの対訳辞書を用いて構文変換を行うこととなる。なお、本実施の形態にて多言語間の翻訳システムを実現するには、中間言語Cとサポートする各言語との対訳辞書の他に、サポートする各言語間の対訳辞書が必要となるが、各言語間の翻訳エンジンを開発する場合と異なり、辞書の作成自体はそれほど多大な開発コストを要しない。
【0039】
また、注釈情報において言語的な属性(単数・複数や丁寧さなど)が指定されている場合、C−Y構文変換部22は、これらの情報にしたがって、構文構造の変換を行う。
最後に、言語Y文生成部23が、言語Y文生成用辞書324を用いて、ターゲット言語Yの文を生成し、翻訳文格納部60に格納する。
翻訳文格納部60に格納されたターゲット言語Yの文は、翻訳結果として出力部70にて出力される。また、装置が翻訳結果修正部80を備える場合は、出力部70にて出力された翻訳結果をユーザが確認して適宜修正することもできる。この場合、ユーザは、出力部70にて出力されたターゲット言語Yの翻訳文に対し、翻訳結果修正部80が提供するユーザインターフェイスを利用して適宜修正を行う。ターゲット言語Yにおける訳語や翻訳文の候補が複数ある場合は、それらを列挙してユーザに選択させることもできる。翻訳結果修正部80は、ユーザによる修正操作を受け付けて、翻訳文格納部60に格納されている翻訳結果に反映させる。
【0040】
次に、本実施の形態による機械翻訳装置の適用例を説明する。
図11は、ネットワークを介してクライアントの依頼に応じてテキストの翻訳を行う翻訳システムの構成例を示す図である。
図11に示す翻訳システムは、インターネット等のネットワーク1100上に設けられた翻訳サーバ1110と、ネットワーク1100を介して翻訳サーバ1110にアクセスするクライアント1120とを備えて構成される。
【0041】
翻訳サーバ1110は、ネットワーク1100上で外部からの要求に応じてテキストの翻訳を行うサービスを提供するサーバであり、パーソナルコンピュータやワークステーション、その他のコンピュータにて実現される。この翻訳機能として、本実施の形態による機械翻訳装置1111を搭載する。
クライアント1120は、ネットワーク1120を介して翻訳サーバ1110にアクセス可能な、ネットワーク機能を備えた、コンピュータやPDA(Personal Digital Assistant)、携帯電話、その他の情報端末である。
【0042】
クライアント1120から翻訳サーバ1110へ翻訳対象のテキストと共に翻訳要求が送られると、翻訳サーバ1110は、機械翻訳装置1111によって当該テキストの翻訳を行い、翻訳結果であるテキストを返送する。上述したように、本実施の形態による機械翻訳装置1111は、X−C翻訳エンジン10とC−Y翻訳エンジン20という2種類の翻訳エンジンを用い、2段階の処理によって、ソース言語Xからターゲット言語Yへの翻訳を実行する。したがって、X−C翻訳エンジン10とC−Y翻訳エンジン20とを複数備え、図1に示した多言語翻訳システムの構成とすることにより、X−C翻訳エンジン10及びC−Y翻訳エンジン20が対応する任意の言語から任意の言語への翻訳が可能である。
【0043】
また、図11に示した構成例の他、例えばネットワークを介してチャットを行うチャットシステムなどでも、本実施の形態による機械翻訳装置を搭載した翻訳サーバを介在させることにより、多言語によるチャットを精度の高い翻訳で行うことが可能となる。
【0044】
【発明の効果】
以上説明したように、本発明によれば、翻訳時の情報の欠落を防止して精度の高い多言語間の機械翻訳を実現できる。
また本発明によれば、所定の自然言語を中間言語として用いて、かかる精度の高い機械翻訳を実現する翻訳システム及びその方法を提供することができる。
【図面の簡単な説明】
【図1】 本実施の形態によって実現される多言語翻訳システムの全体構成を示す図である。
【図2】 日本語及びフランス語で区別される語が英語では同一の語になる例を示す図である。
【図3】 英語文「She saw a man with a telescope.」に対して、本実施の形態で用いるLALによるアノテーションを付加した例を示す図である。
【図4】 図3の英語文に対して複数の解釈の情報をLALにより付加した例を示す図である。
【図5】 日本語の「ペン」、「国土交通省」という単語を中間言語の英語に翻訳した際のLALの例を示す図である。
【図6】 ドイツ語文を中間言語である英語に翻訳した場合のLALの例を示す図である。
【図7】 本実施の形態による機械翻訳装置を実現するコンピュータ装置のハードウェア構成の例を模式的に示した図である。
【図8】 本実施の形態による機械翻訳装置の機能構成を示す図である。
【図9】 本実施の形態によるX−C翻訳エンジンの構成を示す図である。
【図10】 本実施の形態によるC−Y翻訳エンジンの構成を示す図である。
【図11】 ネットワークを介してクライアントの依頼に応じてテキストの翻訳を行う翻訳システムの構成例を示す図である。
【符号の説明】
10…X−C翻訳エンジン、11…言語X構文解析部、12…X−C構文変換部、13…言語C文生成部、20…C−Y翻訳エンジン、21…言語C構文解析部、22…C−Y構文変換部、23…言語Y文生成部、30…辞書格納部、311…言語X構文解析用辞書、312…X−C構文変換用辞書、313…X−C対訳辞書、314…言語C文生成用辞書、321…言語C構文解析用辞書、322…C−Y構文変換用辞書、323…C−Y対訳辞書、324…言語Y文生成用辞書、325…X−Y対訳辞書、40…入力部、50…原文格納部、60…翻訳文格納部、70…出力部、80…翻訳結果修正部、101…CPU、103…メインメモリ、105…ハードディスク、106…ネットワークインターフェイス
Claims (9)
- ソース言語で記述された原文を所定の中間言語の文に翻訳すると共に、当該翻訳によって得られる当該原文の構文構造または当該原文中の単語の語彙を含む注釈情報を取得して訳出された当該中間言語の文に付加する第1の翻訳エンジンと、
前記中間言語の文をターゲット言語の文に翻訳する翻訳エンジンであって、当該中間言語の文に付加された前記注釈情報に基づいて、前記中間言語と前記ターゲット言語との間の辞書に加えて前記ソース言語と前記ターゲット言語との間の辞書を用い、前記原文中の単語に対応する前記ターゲット言語の訳語を選んで、前記ソース言語による前記原文に即した翻訳を行う第2の翻訳エンジンと
を備えることを特徴とする機械翻訳装置。 - 前記第2の翻訳エンジンは、前記注釈情報に基づいて翻訳した翻訳文と前記注釈情報に基づかずに翻訳した翻訳文とを、翻訳結果としていずれも出力することを特徴とする請求項1に記載の機械翻訳装置。
- 前記第1の翻訳エンジンは、前記中間言語の文を所定のマークアップ言語の文書ファイルに記述し、前記注釈情報を当該マークアップ言語のタグとして当該文書ファイル中に記述することを特徴とする請求項1に記載の機械翻訳装置。
- 前記第2の翻訳エンジンによる翻訳結果を出力し、出力された当該翻訳結果に対するユーザによる処理を受け付けて、当該翻訳結果に反映させる翻訳結果修正部をさらに備えることを特徴とする請求項1に記載の機械翻訳装置。
- 複数のソース言語にそれぞれ対応する複数の前記第1の翻訳エンジンを備えることを特徴とする請求項1に記載の機械翻訳装置。
- 複数のターゲット言語にそれぞれ対応する複数の前記第2の翻訳エンジンを備えることを特徴とする請求項1に記載の機械翻訳装置。
- 第1の言語で記述された文を第2の言語の文に翻訳する機械翻訳装置において、
前記第1の言語で記述された文に対する構文解析を行う構文解析部と、
前記第1の言語と前記第2の言語との間の辞書に加えて、第3の言語で記述された原文を当該第1の言語に翻訳する際に得られた当該原文中の単語の語彙を含む情報であって前記第1の言語で記述された文に付加された情報である注釈情報に基づき当該第3の言語と当該第2の言語との間の辞書を用い、当該原文中の単語に対応する当該第2の言語の訳語を選んで、前記第1の言語で記述された文の構文を前記第2の言語の構文に変換する構文変換部と、
前記構文変換部の処理結果に基づいて前記第2の言語の文を生成する文生成部と
を備えることを特徴とする機械翻訳装置。 - コンピュータを制御して、ソース言語で記述された原文をターゲット言語の文に翻訳するプログラムであって、
前記ソース言語で記述された原文を所定の中間言語の文に翻訳し、所定のマークアップ言語の文書ファイルに記述すると共に、当該翻訳によって得られる当該原文の構文構造または当該原文中の単語の語彙を含む注釈情報を取得して当該マークアップ言語のタグとして当該文書ファイル中に記述し、所定の記憶手段に格納する第1の翻訳手段と、
前記中間言語の文をターゲット言語の文に翻訳する翻訳手段であって、前記所定の記憶手段に格納された前記文書ファイルに記述されている前記中間言語の文に対して、当該文書ファイルに記述されている前記注釈情報に基づいて、前記中間言語と前記ターゲット言語との間の辞書に加えて前記ソース言語と前記ターゲット言語との間の辞書を用い、前記原文中の単語に対応する前記ターゲット言語の訳語を選んで、前記ソース言語による前記原文に即した翻訳を行う第2の翻訳手段として
前記コンピュータを機能させるプログラム。 - 前記コンピュータを、複数のソース言語にそれぞれ対応する複数の前記第1の翻訳手段と、複数のターゲット言語にそれぞれ対応する複数の前記第2の翻訳手段として機能させることを特徴とする請求項8に記載のプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003133537A JP4410486B2 (ja) | 2003-05-12 | 2003-05-12 | 機械翻訳装置及びプログラム |
US10/843,748 US9002695B2 (en) | 2003-05-12 | 2004-05-12 | Machine translation device, method of processing data, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003133537A JP4410486B2 (ja) | 2003-05-12 | 2003-05-12 | 機械翻訳装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004334791A JP2004334791A (ja) | 2004-11-25 |
JP4410486B2 true JP4410486B2 (ja) | 2010-02-03 |
Family
ID=33508048
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003133537A Expired - Fee Related JP4410486B2 (ja) | 2003-05-12 | 2003-05-12 | 機械翻訳装置及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9002695B2 (ja) |
JP (1) | JP4410486B2 (ja) |
Families Citing this family (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7543270B1 (en) * | 2004-01-23 | 2009-06-02 | The Math Works, Inc. | Tracing output descriptions generated from corresponding input descriptions |
US8731954B2 (en) | 2006-03-27 | 2014-05-20 | A-Life Medical, Llc | Auditing the coding and abstracting of documents |
US20070282594A1 (en) * | 2006-06-02 | 2007-12-06 | Microsoft Corporation | Machine translation in natural language application development |
US8145473B2 (en) | 2006-10-10 | 2012-03-27 | Abbyy Software Ltd. | Deep model statistics method for machine translation |
US8548795B2 (en) * | 2006-10-10 | 2013-10-01 | Abbyy Software Ltd. | Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system |
US20080086298A1 (en) * | 2006-10-10 | 2008-04-10 | Anisimovich Konstantin | Method and system for translating sentences between langauges |
US8195447B2 (en) | 2006-10-10 | 2012-06-05 | Abbyy Software Ltd. | Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US9235573B2 (en) | 2006-10-10 | 2016-01-12 | Abbyy Infopoisk Llc | Universal difference measure |
US9984071B2 (en) | 2006-10-10 | 2018-05-29 | Abbyy Production Llc | Language ambiguity detection of text |
US9645993B2 (en) | 2006-10-10 | 2017-05-09 | Abbyy Infopoisk Llc | Method and system for semantic searching |
US8214199B2 (en) * | 2006-10-10 | 2012-07-03 | Abbyy Software, Ltd. | Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US9633005B2 (en) | 2006-10-10 | 2017-04-25 | Abbyy Infopoisk Llc | Exhaustive automatic processing of textual information |
US9047275B2 (en) | 2006-10-10 | 2015-06-02 | Abbyy Infopoisk Llc | Methods and systems for alignment of parallel text corpora |
US8959011B2 (en) | 2007-03-22 | 2015-02-17 | Abbyy Infopoisk Llc | Indicating and correcting errors in machine translation systems |
US8185375B1 (en) * | 2007-03-26 | 2012-05-22 | Google Inc. | Word alignment with bridge languages |
US8682823B2 (en) | 2007-04-13 | 2014-03-25 | A-Life Medical, Llc | Multi-magnitudinal vectors with resolution based on source vector features |
US7908552B2 (en) | 2007-04-13 | 2011-03-15 | A-Life Medical Inc. | Mere-parsing with boundary and semantic driven scoping |
US8812296B2 (en) | 2007-06-27 | 2014-08-19 | Abbyy Infopoisk Llc | Method and system for natural language dictionary generation |
JP5235344B2 (ja) * | 2007-07-03 | 2013-07-10 | 株式会社東芝 | 機械翻訳を行う装置、方法およびプログラム |
US9946846B2 (en) | 2007-08-03 | 2018-04-17 | A-Life Medical, Llc | Visualizing the documentation and coding of surgical procedures |
US7962324B2 (en) * | 2007-08-28 | 2011-06-14 | International Business Machines Corporation | Method for globalizing support operations |
JP5007977B2 (ja) * | 2008-02-13 | 2012-08-22 | 独立行政法人情報通信研究機構 | 機械翻訳装置、機械翻訳方法、及びプログラム |
US9262409B2 (en) | 2008-08-06 | 2016-02-16 | Abbyy Infopoisk Llc | Translation of a selected text fragment of a screen |
US20100274839A1 (en) * | 2009-04-28 | 2010-10-28 | Inventec Corporation | Updating system for word banks and the method thereof |
JP5525529B2 (ja) * | 2009-08-04 | 2014-06-18 | 株式会社東芝 | 機械翻訳装置および翻訳プログラム |
US8655644B2 (en) | 2009-09-30 | 2014-02-18 | International Business Machines Corporation | Language translation in an environment associated with a virtual application |
CN101739395A (zh) * | 2009-12-31 | 2010-06-16 | 程光远 | 机器翻译方法和系统 |
US8875019B2 (en) | 2010-03-16 | 2014-10-28 | International Business Machines Corporation | Virtual cultural attache |
WO2011146934A2 (en) * | 2010-05-21 | 2011-11-24 | Western Standard Publishing Company, Inc. | Apparatus, system, and method for computer aided translation |
US9465797B2 (en) | 2012-02-23 | 2016-10-11 | Google Inc. | Translating text using a bridge language |
US8989485B2 (en) | 2012-04-27 | 2015-03-24 | Abbyy Development Llc | Detecting a junction in a text line of CJK characters |
US8971630B2 (en) | 2012-04-27 | 2015-03-03 | Abbyy Development Llc | Fast CJK character recognition |
US8762133B2 (en) | 2012-08-30 | 2014-06-24 | Arria Data2Text Limited | Method and apparatus for alert validation |
US8762134B2 (en) | 2012-08-30 | 2014-06-24 | Arria Data2Text Limited | Method and apparatus for situational analysis text generation |
US9135244B2 (en) | 2012-08-30 | 2015-09-15 | Arria Data2Text Limited | Method and apparatus for configurable microplanning |
US9405448B2 (en) | 2012-08-30 | 2016-08-02 | Arria Data2Text Limited | Method and apparatus for annotating a graphical output |
US9336193B2 (en) | 2012-08-30 | 2016-05-10 | Arria Data2Text Limited | Method and apparatus for updating a previously generated text |
US9600471B2 (en) | 2012-11-02 | 2017-03-21 | Arria Data2Text Limited | Method and apparatus for aggregating with information generalization |
WO2014076524A1 (en) | 2012-11-16 | 2014-05-22 | Data2Text Limited | Method and apparatus for spatial descriptions in an output text |
WO2014076525A1 (en) | 2012-11-16 | 2014-05-22 | Data2Text Limited | Method and apparatus for expressing time in an output text |
US10115202B2 (en) | 2012-12-27 | 2018-10-30 | Arria Data2Text Limited | Method and apparatus for motion detection |
WO2014102569A1 (en) | 2012-12-27 | 2014-07-03 | Arria Data2Text Limited | Method and apparatus for motion description |
GB2524934A (en) | 2013-01-15 | 2015-10-07 | Arria Data2Text Ltd | Method and apparatus for document planning |
US9146919B2 (en) * | 2013-01-16 | 2015-09-29 | Google Inc. | Bootstrapping named entity canonicalizers from English using alignment models |
WO2015028844A1 (en) | 2013-08-29 | 2015-03-05 | Arria Data2Text Limited | Text generation from correlated alerts |
WO2015035193A1 (en) | 2013-09-05 | 2015-03-12 | A-Life Medical, Llc | Automated clinical indicator recognition with natural language processing |
US9244894B1 (en) | 2013-09-16 | 2016-01-26 | Arria Data2Text Limited | Method and apparatus for interactive reports |
US9396181B1 (en) | 2013-09-16 | 2016-07-19 | Arria Data2Text Limited | Method, apparatus, and computer program product for user-directed reporting |
JP2015060458A (ja) * | 2013-09-19 | 2015-03-30 | 株式会社東芝 | 機械翻訳装置、方法、及びプログラム |
US10133727B2 (en) | 2013-10-01 | 2018-11-20 | A-Life Medical, Llc | Ontologically driven procedure coding |
CN103577399B (zh) * | 2013-11-05 | 2018-01-23 | 北京百度网讯科技有限公司 | 双语语料库的数据扩充方法和装置 |
RU2592395C2 (ru) | 2013-12-19 | 2016-07-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Разрешение семантической неоднозначности при помощи статистического анализа |
RU2586577C2 (ru) | 2014-01-15 | 2016-06-10 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Фильтрация дуг в синтаксическом графе |
US10664558B2 (en) | 2014-04-18 | 2020-05-26 | Arria Data2Text Limited | Method and apparatus for document planning |
RU2596600C2 (ru) | 2014-09-02 | 2016-09-10 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы обработки изображений математических выражений |
US9626358B2 (en) | 2014-11-26 | 2017-04-18 | Abbyy Infopoisk Llc | Creating ontologies by analyzing natural language texts |
CN104731776B (zh) | 2015-03-27 | 2017-12-26 | 百度在线网络技术(北京)有限公司 | 翻译信息的提供方法及系统 |
CN106557478A (zh) * | 2015-09-25 | 2017-04-05 | 四川省科技交流中心 | 基于桥梁语的分布式跨语种检索系统及其检索方法 |
CN106557466A (zh) * | 2015-09-25 | 2017-04-05 | 四川省科技交流中心 | 基于集中式翻译的分布式跨语种检索系统及其检索方法 |
CN106557467A (zh) * | 2015-09-28 | 2017-04-05 | 四川省科技交流中心 | 基于桥梁语的机器翻译系统及翻译方法 |
KR101740671B1 (ko) * | 2015-11-12 | 2017-05-26 | 이현옥 | 다국어 번역 방법 |
JP2017162876A (ja) * | 2016-03-07 | 2017-09-14 | 株式会社ジェイデバイス | 半導体パッケージの製造方法 |
KR102251832B1 (ko) * | 2016-06-16 | 2021-05-13 | 삼성전자주식회사 | 번역 서비스를 제공하는 전자 장치 및 방법 |
US10445432B1 (en) | 2016-08-31 | 2019-10-15 | Arria Data2Text Limited | Method and apparatus for lightweight multilingual natural language realizer |
US10467347B1 (en) | 2016-10-31 | 2019-11-05 | Arria Data2Text Limited | Method and apparatus for natural language document orchestrator |
TWI613554B (zh) * | 2017-03-24 | 2018-02-01 | Zhuang Shi Cheng | 翻譯輔助系統 |
US11386276B2 (en) * | 2019-05-24 | 2022-07-12 | International Business Machines Corporation | Method and system for language and domain acceleration with embedding alignment |
US11222176B2 (en) * | 2019-05-24 | 2022-01-11 | International Business Machines Corporation | Method and system for language and domain acceleration with embedding evaluation |
US20210319189A1 (en) * | 2020-04-08 | 2021-10-14 | Rajiv Trehan | Multilingual concierge systems and method thereof |
US11553618B2 (en) | 2020-08-26 | 2023-01-10 | PassiveLogic, Inc. | Methods and systems of building automation state load and user preference via network systems activity |
CN112800781A (zh) * | 2021-01-26 | 2021-05-14 | 浙江香侬慧语科技有限责任公司 | 一种文言文翻译的方法、装置及存储介质 |
CN113343718A (zh) * | 2021-06-16 | 2021-09-03 | 统信软件技术有限公司 | 一种多语言实现方法、计算设备及储存介质 |
CN114154522A (zh) * | 2021-12-09 | 2022-03-08 | 上海开放大学 | 一种基于多种语言学习平台翻译智能处理方法和系统 |
CN114168251A (zh) * | 2022-02-14 | 2022-03-11 | 龙旗电子(惠州)有限公司 | 语言切换方法、装置、设备、计算机可读存储介质及产品 |
CN117744671A (zh) * | 2024-02-21 | 2024-03-22 | 睿云联(厦门)网络通讯技术有限公司 | 一种智能对讲产品全自动化多语言解决方法、设备及介质 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4635199A (en) * | 1983-04-28 | 1987-01-06 | Nec Corporation | Pivot-type machine translating system comprising a pragmatic table for checking semantic structures, a pivot representation, and a result of translation |
US4864503A (en) * | 1987-02-05 | 1989-09-05 | Toltran, Ltd. | Method of using a created international language as an intermediate pathway in translation between two national languages |
US5675815A (en) * | 1992-11-09 | 1997-10-07 | Ricoh Company, Ltd. | Language conversion system and text creating system using such |
JP3066274B2 (ja) * | 1995-01-12 | 2000-07-17 | シャープ株式会社 | 機械翻訳装置 |
US5987401A (en) * | 1995-12-08 | 1999-11-16 | Apple Computer, Inc. | Language translation for real-time text-based conversations |
US6470306B1 (en) * | 1996-04-23 | 2002-10-22 | Logovista Corporation | Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens |
US6092035A (en) * | 1996-12-03 | 2000-07-18 | Brothers Kogyo Kabushiki Kaisha | Server device for multilingual transmission system |
US6275789B1 (en) * | 1998-12-18 | 2001-08-14 | Leo Moser | Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language |
CN1415097A (zh) | 1999-11-17 | 2003-04-30 | 联合国 | 用于创建通用语言的表达的系统和记录其使用的转换规则的记录介质 |
JP2001282786A (ja) * | 2000-03-27 | 2001-10-12 | Internatl Business Mach Corp <Ibm> | 機械翻訳システム、機械翻訳方法及び機械翻訳方法を実行するためのプログラムを記憶した記憶媒体 |
FR2809509B1 (fr) * | 2000-05-26 | 2003-09-12 | Bull Sa | Systeme et procede d'internationalisation du contenu de documents a balises dans un systeme informatique |
US20020173946A1 (en) * | 2001-03-28 | 2002-11-21 | Christy Samuel T. | Translation and communication of a digital message using a pivot language |
US6993472B2 (en) * | 2001-07-31 | 2006-01-31 | International Business Machines Corporation | Method, apparatus, and program for chaining machine translation engines to control error propagation |
JP2003058481A (ja) | 2001-08-10 | 2003-02-28 | Logo Vista Corp | 多言語チャットシステム |
US7620538B2 (en) * | 2002-03-26 | 2009-11-17 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
JP3919771B2 (ja) * | 2003-09-09 | 2007-05-30 | 株式会社国際電気通信基礎技術研究所 | 機械翻訳システム、その制御装置、及びコンピュータプログラム |
-
2003
- 2003-05-12 JP JP2003133537A patent/JP4410486B2/ja not_active Expired - Fee Related
-
2004
- 2004-05-12 US US10/843,748 patent/US9002695B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20050010421A1 (en) | 2005-01-13 |
US9002695B2 (en) | 2015-04-07 |
JP2004334791A (ja) | 2004-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4410486B2 (ja) | 機械翻訳装置及びプログラム | |
JP4256891B2 (ja) | 機械翻訳の精度を向上させる技術 | |
US7478092B2 (en) | Key term extraction | |
JP4319860B2 (ja) | 転移ベースの機械翻訳システムで使用される転移辞書を開発するための方法および装置 | |
JP2009534743A (ja) | 非構造化リソースの構文解析方法 | |
JP2004362249A (ja) | 翻訳知識最適化装置、翻訳知識最適化のためのコンピュータプログラム、コンピュータ及び記憶媒体 | |
KR101664258B1 (ko) | 텍스트 전처리 방법 및 이를 수행하는 전처리 시스템 | |
JP2017199363A (ja) | 機械翻訳装置及び機械翻訳のためのコンピュータプログラム | |
JP4304268B2 (ja) | 複数言語対訳テキスト入力による第3言語テキスト生成アルゴリズム及び装置、プログラム | |
JP5107556B2 (ja) | 改善された中国語−英語翻訳ツール | |
JP2015060458A (ja) | 機械翻訳装置、方法、及びプログラム | |
JP2017151553A (ja) | 機械翻訳装置、機械翻訳方法、及びプログラム | |
US7983899B2 (en) | Apparatus for and method of analyzing chinese | |
JP6766384B2 (ja) | 情報処理装置及びプログラム | |
JP4869281B2 (ja) | 機械翻訳装置、プログラム及び方法 | |
JP5245291B2 (ja) | 文書解析装置、および文書解析方法、並びにコンピュータ・プログラム | |
WO2009144890A1 (ja) | 翻訳前換言規則生成システム | |
EP4273738A1 (en) | Semantic representation generation method, semantic representation generation device, and semantic representation generation program | |
JP4313967B2 (ja) | 自然言語変換システム | |
JP2006126886A (ja) | 文短縮用知識の学習装置、文短縮装置、機械翻訳装置および文短縮のためのコンピュータプログラム | |
JP2009258887A (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP2006252290A (ja) | 機械翻訳装置及びコンピュータプログラム | |
JP3267168B2 (ja) | 自然言語変換システム | |
Sato et al. | Translating HPSG-style outputs of a robust parser into typed dynamic logic | |
JP2005004626A (ja) | 異表記正規化処理装置、異表記正規化処理プログラム、これを記憶する記憶媒体、文書検索装置、文書検索プログラム及びこれを記憶する記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060718 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061012 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061031 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070125 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070411 |
|
A912 | Removal of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20070420 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091006 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20091105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091113 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121120 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121120 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131120 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |