JP4504555B2 - 翻訳支援システム - Google Patents
翻訳支援システム Download PDFInfo
- Publication number
- JP4504555B2 JP4504555B2 JP2000381611A JP2000381611A JP4504555B2 JP 4504555 B2 JP4504555 B2 JP 4504555B2 JP 2000381611 A JP2000381611 A JP 2000381611A JP 2000381611 A JP2000381611 A JP 2000381611A JP 4504555 B2 JP4504555 B2 JP 4504555B2
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- text
- translation
- database
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/45—Example-based machine translation; Alignment
Description
【発明の属する技術分野】
本発明は、ある自然言語から他の自然言語へ表現を翻訳することに関し、特に、翻訳者が任意の句(phrase)の適切な訳語を得る際の支援に関する。
【0002】
【従来の技術】
どんな翻訳者も二つの基準で評価される。つまり翻訳速度と翻訳の質である。これらの基準に影響する問題の一つに、翻訳者を躊躇させる単語または単語群の出現がある。適切な訳語を見つけるために、時間がかかる手作業を行うかもしれないが、これにより必ずしも適切な訳語が見つかる保証はない。
【0003】
現在、翻訳者支援技術がいくつか開発されている。それらの一つに、文脈辞書ルックアップを用いる方法がある。文脈辞書を用いれば、文脈に即した訳語が見つけられる。しかしこの技術は見いだされる訳語の範囲が強く制限されている。つまり、文脈辞書を参照しても、翻訳者にはわずかな訳語しか提示されない。
【0004】
また、多言語用語データベース(multi-lingual terminology database)は事前に認められた訳語に基づくので、該データベースの使用は、事前に記憶された一連の用語に限定される。したがって、事前に記憶された一連の用語に含まれない表現を翻訳する場合には、翻訳者を支援できない。
【0005】
また、既に翻訳された文章を記憶した翻訳メモリを使用する技術もある。ある文章を翻訳する場合、該システムはデータベースを照会して、自動的に訳語を提案する。しかし、該システムは、完成した文面をたとえ曖昧(fuzzy)でも一致させる必要があるので、該技術の適用範囲は非常に制約される。
【0006】
また、M.ナガオが提案した翻訳技術「類推原則による日英機械翻訳構成」人工人間知能(A.Elithorn and R.Banerji, eds),Elsevier Science Publishers,1984,pgs.173−180)は、文章を連携させ(align)、言語分析して機械翻訳を行う。更に、各文章対をもとに要素分析ツリー(parse tree)も連携させる。この技術の欠点の一つは、かかる機械翻訳システムでは、翻訳文全体を分析しなければならないことである。別の欠点は、サブツリーを連携させなければならないので、非常に高いコンピュータ処理負荷がかかることである。
【0007】
【発明が解決しようとする課題】
このように従来の翻訳支援においては、適切な訳語が提示されず、高品質の翻訳に資することができないという問題点があった。
【0008】
本発明は係る状況に鑑みてなされたものであり、翻訳者がより高い質の翻訳を行うための支援を主な目的とする。
【0009】
本発明の別の目的は、未知表現に対して費用がかかる手作業検索を行わないために制御した翻訳を行う一助となり、訳語メモリや用語データベースを用いる機能に加えて別の機能を提供することである。
【0010】
本発明のさらに別の目的は、翻訳者の支援依頼に即時対応できる、使い易く高効率かつ高信頼性のツールを提供することである。
【0011】
本発明のさらに別の目的は、現存の技術やソフトウェアツールとの互換性を有することである。
【0012】
上記またはこれら以外の本発明の目的は、以後の説明で明確になるであろう。
【課題を解決するための手段】
これらの目標を達成するために、本発明の第1の態様では、単語句を第1の自然言語から第2の自然言語に翻訳する方法を提供する。ここで単語句とは、2個以上の単語の集まり(group)である。本発明の方法は、第1の言語で記載されたテキストの入力を受け付けるステップと、前記入力を受け付けるステップで受け付けられたテキストから単語句を抽出するステップと、前記第1の自然言語で記載されたテキスト断片と、このテキスト断片の翻訳に対応するテキスト断片であって前記第2の自然言語で記載されたテキスト断片と、を対応づけるテキスト断片対を記憶するデータベースを照会し、前記抽出した単語句を句見出し(phrase index)とするテキスト断片対を検索するステップと、前記検索するステップの結果として前記データベースから取得されたテキスト断片対の一つにおける前記第2の自然言語で記載されたテキスト断片に含まれる単語句を、前記抽出した単語句の翻訳に対応する単語句として取得するステップと、前記取得するステップで取得された、前記抽出した単語句の翻訳に対応する単語句であって前記第2の自然言語で記載された単語句、を出力するステップと、を有し、前記各ステップはコンピュータによって実行される。句見出しは、テキスト断片(text fragment)の見出しとして設定された単語句である。テキスト断片は、少なくとも一つの節(clause)を有する主要な文法的単位を示す。
【0013】
本発明の第2の態様では、第1の態様に係るステップを実行して単語句を第1の自然言語から第2の自然言語に翻訳するための指示を記録するコンピュータ読み取り可能な記録媒体を提供する。
【0014】
本発明の第3の態様では、入力された翻訳対象テキストを元の自然言語から目標となる自然言語への翻訳を支援するシステムを提供する。本システムは、複数のテキスト断片対を含むデータベースを記録する記録手段を有する。テキスト断片は、少なくとも一つの節を含む主要な文法的単位を表す。各対は、元の言語で記載されたテキスト断片と、このテキスト断片の目標の自然言語への翻訳に相当するテキスト断片であって目標の言語で記載されたテキスト断片と、を対応づける。各テキスト断片は、少なくとも一つの単語句を含む。単語句は、複数の単語からなる文法的単位であって、主語及び述語を含む節を有しない文法的単位である。また、このデータベースは、各テキスト断片対に関連付けて、当該テキスト断片対における前記元の自然言語で記載されたテキスト断片に含まれる単語句を当該テキスト断片対の句見出しとして記憶する。本システムは、入力された翻訳対象テキストに含まれる単語のうちの少なくとも1つを選択する選択指示に応じて、この選択指示によって特定される単語を含む単語句を前記翻訳対象テキストから抽出する句抽出部と、抽出した単語句のうちの少なくとも1つについて、当該単語句を句見出しとして前記データベースに記憶されたテキスト断片対を前記データベースから読み出し、読み出したテキスト断片対をディスプレイに表示させる処理を行う制御ユニットと、を有する。本システムは、読み出したテキスト断片対の一つをユーザが選択して、抽出した単語句の訳語を取得できるようにするユーザインターフェイス手段を更に含む。
【0015】
本発明の第4の態様では、第1の自然言語から第2の自然言語に単語句を翻訳する際に使用するテキスト断片データベースの生成方法を提供する。単語句は、2語以上の単語の集まりである。本方法は、第1の言語で記載されたテキストを含む第1の文書を入力するステップと、第2の言語で記載されたテキストを含む第2の文書を入力するステップと、第1の文書および第2の文書の対応するテキスト断片を提携(align)させるステップと、第1の文書のテキスト断片から単語句を抽出するステップと、抽出した単語句と、該単語句を含む提携させたテキスト断片とに関する見出し情報を生成するステップとを含む。テキスト断片は、少なくとも一つの節を含む主要な文法的単位を示す。
【0016】
本発明の他の態様においては、第1から第4の態様に係る本発明の方法およびシステムにおいて、単語句は名詞句であることが好適である。あるいは、動詞句であってもよい。または、少なくとも一つの動詞と名詞または名詞的用法の形容詞を含む述語であってもよい。
【0017】
本発明の更に別の態様では、主要な文法的単位は文章である。
【0018】
本発明の更に別の態様では、テキスト断片対をデータベースから読み出し、該読み出したテキスト断片対を翻訳者に提示する。または、読み出したテキスト断片対に基づいて、抽出した単語句の訳語を翻訳者に提示する。いずれの場合も、翻訳者は訳語を是認すると、この是認した訳語を読み出した単語句の訳語として用いる。
【0019】
本発明の更に別の態様では、上記態様に係るシステムまたは方法における、抽出した句に関してデータベースに照会するステップは、部分句(sub-phrase)、つまり抽出した句の一部に一致するすべての単語句に関して、データベースに照会するステップを含む。
【0020】
最後に、本発明の任意の上記態様では、句見出し付テキスト断片データベースに加えて用語ベースも照会して訳語を取得するステップを含んでもよい。
【0021】
本発明のアプローチを用いると、データベースには句による見出しが付される。抽出した単語句を用いて、テキスト断片全体の見出しとする。好適な実施形態では、名詞句を用いて文章データベースの見出しとする。抽出した名詞句を用いて文章全体の見出しとする。これによって、翻訳文中の対応する部分の単位の認識をユーザに委ねるので、翻訳文全体の分析は行わず、部分ツリー(subtree)を連携させる必要もない。
【0022】
本発明は事前に翻訳された部分を使用し、好適な本実施形態では、元の言語および目標となった言語の双方で書かれた名詞句の各々を含む文章を翻訳者に提示する点で効果的である。句による見出し付きの文章データベースの使用により、翻訳速度と翻訳の質を改善する。
【0023】
明細書の一部として添付する図面は、本発明のいくつかの実施形態を示す。説明と共にこれらの図面を参照すれば、本発明の本質が明らかになるであろう。図面は、本発明の作成方法および使用方法に関する好適な例を説明する目的で用意したものであり、本発明がこれに限定されるものではない。これら以外の特徴や利点は、後述する、本発明の多様な実施形態に関するより特定した説明および添付の図面から明らかになるであろう。
【0024】
【発明の実施の形態】
本発明の実施の形態に係るシステムは、翻訳を支援するためのシステムであって、事前に翻訳対象文書と、その文書を翻訳した結果として得られた文書とを比較対照して、例えば節(文の一部分で、それ自体で主語と述語を有する部分)を少なくとも一つ含んでなる所定の文法的単位(テキスト断片)をキーとして、翻訳前のものと翻訳後のものとからなるテキスト断片対(ここでの対としては、元の言語に対し翻訳後の言語が複数あってもよい)を関連づけたデータベースを作成しておく。また、このデータベースを用いて、翻訳対象として入力されたテキストから単語句を抽出し、この単語句のうち選択されたものを検索キーとして、上記のデータベースを検索して、選択された単語句に対する訳語を提示する。
【0025】
すなわち、本発明によると、少なくとも1つの節を含む主要な文法単位を表すテキスト断片の見出しとして、単語句を用いる。
【0026】
「句」とは通常、少数の単語のみからなる表現であり、一つの考えを示したり、文章の別個の部分を形成する。具体的に「句」は2語以上の単語の集まりであり、主語や述語を含まない。名詞句は代名詞または名詞を含む句である。名詞は通常、現存するあるいは想像上の物、質または行動の名称として用いられる単語である。代名詞は名詞の代わりとして用いられる単語である。つまり、名詞句としては「road test」、「fuel pressure test operations」「verb phrase」等がある。一方、動詞句は一個以上の動詞を含む句であり、「broadened」、「have been fitted」等がある。また、元言語によっては(例えば日本語ならば)、これら名詞句は、「路上テスト」、「燃料圧テスト操作」、「動詞句」等であり、動詞句は「広げられた」、「嵌合された」等である。
【0027】
「句(phrase)」と区別される「節(clause)」は、主語と述語を含む単語の集まりである。つまり、「節」は、文章の一部または単文全体を形成する統語論的構造(syntactic construction)である。文章は1個以上の単語からなる文法上の単位であり、その前後の単語に対して最小限の統語論的関係、つまり最小限の完結性と統一性を有する。文章は、事実の言明であれ、質問であれ、命令であれ、驚嘆であれ、完結した一つの概念を表現する。
【0028】
つまり、「句」や「文章」は、主要な文法単位であると規定できる。文章は「句」や「節」を含み、「節」は「句」を含むかもしれないが、「句」は他の「句」や「文章」を含むことができない。本発明の好適な実施形態では、名詞句を利用して文章の見出し(index)とする。
【0029】
図1において、本発明の実施形態における翻訳システムは、制御ユニット14を含む。制御ユニット14は、パソコンやワークステーション等の任意の種類のコンピュータでもよく、例えばウィンドウズNT(商標)やUNIX(商標)等の従来のオペーレーションシステムを動作させる。制御ユニット14が動作させるソフトウェアアプリケーションは、ディスプレイ11を用いて、ポインタデバイス12やキーボード13によって制御される。インターフェイスソフトウェアは、例えばVisual Basic(商標)等に書き込まれてもよく、できあがったアプリケーションは、任意のVisual Basic(商標)またはC/C++コードに直接一体化できるOLEサーバでもよい。しかし、当業者は、他の多様な実施方法が可能であることが分かるであろう。
【0030】
制御ユニット14上で動作するアプリケーションプログラムは、文章データベース17に対するアクセスを有する。文章データベース17は、Access(商標)またはOracle(商標)データベースでもよく、UNIX(商標)ワークステーションを用いて好適に生成される。データベースの大きさは該システムを使用する分野によって異なる。繰り返すが、これら以外の実施方法も可能である。
【0031】
文章データベース17は、元の言語の例としての複数の英文を記憶し、各英文に対応する目標となった言語の例としての仏文を記憶する。文章データベース17は更に、データベースに保存された任意の文章中にある名詞句の各々に対する見出し付き情報を含む。これは、それぞれの名詞句を含む文章を示す。制御ユニット14上で動作する翻訳ソフトウェアは更に、句抽出部(Phrase Extractor)15へのアクセスを有する。句抽出部15は、複文言語アルゴリズム(complex liguistic algorithm)を用いて、入力されたテキストから名詞句を抽出する。テキストは任意のテキストソースから入力されてもよい。例えば、記憶媒体、スキャナ、メッセージ、音声認識等でもよい。
【0032】
図2は、句見出し付き文章データベース17の生成処理を示すフローチャートである。ステップ21および22で該システムは、元の言語で記載された文書と、目標となった言語で記載された対応する文書とを入手する。ステップ23で、元の文書と目標となった文書の対における文章を連携(align)する。文章の連携とは、元の文章の各々と、対応する目標となった文章との間にリンクを確立することである。文章を連携した後、ステップ24で、元の文章の各々から名詞句を抽出し、句見出し付文章データベース17に加える。この時、該名詞句を抽出した文書に関する情報もあわせて付加する。ステップ25で、抽出した名詞句そのものを句見出しとしてデータベース17に付加した後、ステップ26で、他の元/目標の文書対を読み出すか否かを決定する。読み出す場合、データベース生成処理はステップ21に戻り、新たな文書を入手し、文章を連携させ、名詞句を抽出して記憶する。一連の翻訳文の対に対してステップ21〜26の処理を繰り返し、これまでに出現した多くの名詞句と、それらを含む文章とを記憶する総括的データベースを構築する。
【0033】
句見出し付文章データベース17の生成に関連して図2の処理を説明したが、当業者は、図示した処理を任意に行って、新たな文書対の中にある文章や名詞句を記録して、既存のデータベースを充実できることが分かるであろう。更に、データベースの更新や生成処理を文書を対象にして説明したが、文書断片を対象にしても同様の処理ができることは、当業者には明白であろう。
【0034】
本発明の別の実施形態では、一つの同じ分野における文書のみ、例えば自動車メンテナンス文書等を用いて、データベースを構築する。この方法では、各名詞句に対する訳語候補の数が減少するので、該データベースが十分に大きい場合、ほとんどの名詞句に見出しが付き、ほぼすべての要求に対して訳語が用意される。
【0035】
図3および図4は、翻訳処理を示すフローチャートである。ステップ31で、ユーザは翻訳すべきテキストを入力する。該テキストが表示されると、ユーザは未知の単語や単語の群を、例えば該単語上でダブルクリックすることで選択できる。ステップ32で単語を選択した後、ステップ33で、選択された単語に関して考え得る名詞句をすべて句抽出部15によって抽出する。ステップ34で、一連の考え得る名詞句を表示し、ステップ35で、自動的またはユーザ要求によって、表示された考え得る名詞句の一つを選択する。デフォルトの場合、ユーザの選択の必要なく、抽出された名詞句の中で最長の名詞句を選択する。この自動選択(デフォルトによる選択)は、その名詞句がデータベース中に存在するか否かを基準に行ってもよい。この場合、データベース中に存在する最長の(部分(sub))名詞句を選択する。いずれの場合も、ユーザが選択してもよいし、選択を変更してもよい。
【0036】
図5は、これらの情報をユーザに表示する例を示す図である。ウィンドウ操作システムでは、制御ユニット14によってウィンドウ51を表示する。ウィンドウの中はいくつかのフィールドに区切られている。ステップ32においてダブルクリックによって選択した単語をフィールド55に表示する。また、ステップ33で抽出した一連の考え得る名詞句をフィールド53に表示する。ユーザは、これらの名詞句から、図5の例では、「road test(路上テスト)」という名詞句を選択する。選択された名詞句はフィールド52に表示される。
【0037】
考え得る名詞句の一つをユーザが選択すると、ステップ41において制御ユニット14が句見出し付文章データベースを照会する。文書データベース17に保存されたすべての文章は名詞句による見出しが付されているので、該システムは、大きな遅延なく、選択された名詞句を見出しとする文章対を全て読み出せる。ステップ42で該システムは、読み出した全ての文章対を原文との関係性をもとに分類する。この目的のために、入力されたテキスト原文に含まれる全ての名詞句と、読み出した文章に含まれる全ての名詞句とを比較する。この時、関係性は共通名詞句(common noun phyrases)の数によって異なる。したがってこのシステムは、ステップ43にて、文章の対を翻訳の対象となった文書に最も近いものからユーザに対して提示することができる。ソートされて表示された一連の文章の対の例を、図5のフィールド54に示す。
【0038】
図4のステップ44で、フィールド54に表示された文章の一つを選択する。選択された文章をフィールト56および57にコピーする。これによってユーザは、提示された訳語をより徹底的に検証できる。選択した翻訳文の対(ペア)を用いて、入力テキストから選んだ単語を翻訳することをユーザが決定すると、ステップ45において句抽出部15は、選択した文章対から当該名詞句の訳語を抽出して、入力テキストの訳文に自動的に挿入する。
【0039】
ステップ46で翻訳者は、さらに他の名詞句も翻訳する必要があるか否かを決定する。その必要があれば、ステップ32の処理に戻り、その意味がわからない他の単語(翻訳者が翻訳できない他の単語)を選択する。
【0040】
図6は、実施形態におけるフィールド52に対する操作を示す図である。次にこの図を参照して、本発明に係るシステムの部分名詞句に対する操作を行う動作を説明する。ユーザがステップ35で選択した名詞句が句見出し付文章データベース17に登録されていない場合、本システムは部分的に一致する名詞句を自動的に捜す。あるいは、フィールド61または62に部分句リストを表示してユーザに示し、ユーザがこのリストから登録事項を選択して翻訳処理を行ってもよい。例えば、「燃料圧テスト操作」という名詞句を含む文章がデータベースに登録されていない場合、ユーザはサブ句である「燃料圧テスト」をフィールド62から選ぶ。この用語に対しては、句見出付き文章データベース17に登録があるかもしれない。すなわち、ユーザが選択した句がない場合には、所定のルールに従って、単語を部分的に減らしながら句見出し付きデータベース17の検索作業を再帰的に実行するのである。
【0041】
本発明に係る翻訳システムを名詞句見出し付き文章データベース17を有するシステムであるとして説明してきたが、図1の実施形態における本システムは、更に用語ベース16も有する。制御ユニット14上で動作する翻訳アプリケーションは、該用語ベース16に対してアクセス可能である。ユーザがステップ35で翻訳を要する名詞句を選択すると、該システムはステップ36で用語ベースを照会する。該用語ベースが選択された名詞句の訳語を有する場合、該システムは該訳語を読み出し、図7のフィールド78に表示してユーザに示す。ユーザはこの語を是認してフィールド78に表示することができる。あるいは、句見出し付文章データベース17から読み出して提案された訳語を是認して、フィールド74に表示されたリストからこれを選択することもできる。どの訳語を用いるかをユーザが決定する際に更に支援するために、用語ベース16から読み出した訳語をフィールド74に表示されたリスト中の各訳語が出現する場所でハイライトするなど、強調して表示される。
【0042】
上述の通り本発明は、名詞句そのものが文章全体の見出しとなる名詞句見出し付文章データベースを用い、翻訳文に含まれる対応する部分単位の認識をユーザに委ねる点で多くの利点を有する。つまり、翻訳文の全体的な分析は行わない。しかし、本発明に係るシステムは、例文に基づく機械翻訳、文脈辞書ルックアップ、多言語用語データベース、または翻訳メモリ等の従来の翻訳ツールと一体化してもよい。句見出し付き文章データベースを用いた翻訳環境を提供することで、いかなる翻訳者も強力な翻訳支援を得る。
【0043】
本発明を、好適な物理的な実施形態を用いて説明してきたが、当業者は、上記の技術について本発明の範囲を逸脱することなく請求の範囲内で、多様な変更、変形、改良を行え得ることが分かるであろう。更に、当業者が熟知すると思われる分野の記載をここでは割愛したが、ここで説明する発明を不必要に混乱させないためである。例えば、ユーザが任意に新しい名詞句をタイプ入力する、あるいは部分句リストの他の要素を選択することで、選択した単語を変えられることは当然である。
【0044】
したがって、本発明は上記の特定の実施形態に限定されるものではなく、請求の範囲にのみ限定される。
【図面の簡単な説明】
【図1】 本発明に係る翻訳システムを示す図である。
【図2】 本発明に係る句見出し付文章データベースの生成処理を示すフローチャートである。
【図3】 本発明に係る翻訳処理を示すフローチャートである。
【図4】 本発明に係る翻訳処理を示すフローチャートである。
【図5】 本発明に係るユーザインターフェイスの第1実施形態を示す図である。
【図6】 部分句の使用を示す図である。
【図7】 本発明に係るユーザインターフェイスの第2実施形態を示す図である。
【符号の説明】
11 ディスプレイ、12 ポインタデバイス、13 キーボード、14 制御ユニット、15 句抽出部、16 用語ベース、17 句見出し付き文章データベース。
Claims (1)
- 入力された翻訳対象テキストについての元の自然言語から目標の自然言語への翻訳を支援するシステムであって、
前記元の自然言語で記載されたテキスト断片と、このテキスト断片の前記目標の自然言語への翻訳に相当するテキスト断片であって前記目標の自然言語で記載されたテキスト断片と、を対応付けるテキスト断片対を複数記憶するデータベースであって、各テキスト断片対に関連付けて、当該テキスト断片対における前記元の自然言語で記載されたテキスト断片に含まれる単語句を当該テキスト断片対の句見出しとして記憶するデータベースと、
前記翻訳対象テキストに含まれる単語のうちの少なくとも1つを選択する選択指示に応じて、この選択指示によって特定される単語を含む単語句を前記翻訳対象テキストから抽出する句抽出部と、
前記句抽出部が抽出した単語句のうちの少なくとも1つについて、当該単語句を句見出しとして前記データベースに記憶されたテキスト断片対を前記データベースから読み出し、読み出したテキスト断片対をディスプレイに表示させる処理を行う制御ユニットと、
を備え、
前記テキスト断片は、複数の単語からなる文法的単位であって、主語及び述語を含む節を少なくとも1つ有する文法的単位であり、
前記単語句は、複数の単語からなる文法的単位であって、主語及び述語を含む節を有しない文法的単位であることを特徴とするシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/466823 | 1999-12-20 | ||
US09/466,823 US6473729B1 (en) | 1999-12-20 | 1999-12-20 | Word phrase translation using a phrase index |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001195404A JP2001195404A (ja) | 2001-07-19 |
JP4504555B2 true JP4504555B2 (ja) | 2010-07-14 |
Family
ID=23853235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000381611A Expired - Fee Related JP4504555B2 (ja) | 1999-12-20 | 2000-12-15 | 翻訳支援システム |
Country Status (4)
Country | Link |
---|---|
US (1) | US6473729B1 (ja) |
EP (1) | EP1111514B1 (ja) |
JP (1) | JP4504555B2 (ja) |
DE (1) | DE60029732T2 (ja) |
Families Citing this family (102)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5836771A (en) * | 1996-12-02 | 1998-11-17 | Ho; Chi Fai | Learning method and system based on questioning |
US6498921B1 (en) * | 1999-09-01 | 2002-12-24 | Chi Fai Ho | Method and system to answer a natural-language question |
AU2440100A (en) | 1999-03-19 | 2000-10-09 | Trados Gmbh | Workflow management system |
US20060116865A1 (en) * | 1999-09-17 | 2006-06-01 | Www.Uniscape.Com | E-services translation utilizing machine translation and translation memory |
US7389221B1 (en) * | 2000-07-17 | 2008-06-17 | Globalenglish Corporation | System and method for interactive translation |
US7660740B2 (en) | 2000-10-16 | 2010-02-09 | Ebay Inc. | Method and system for listing items globally and regionally, and customized listing according to currency or shipping area |
US6983240B2 (en) | 2000-12-18 | 2006-01-03 | Xerox Corporation | Method and apparatus for generating normalized representations of strings |
US7860706B2 (en) * | 2001-03-16 | 2010-12-28 | Eli Abir | Knowledge system method and appparatus |
US8874431B2 (en) * | 2001-03-16 | 2014-10-28 | Meaningful Machines Llc | Knowledge system method and apparatus |
US20030083860A1 (en) * | 2001-03-16 | 2003-05-01 | Eli Abir | Content conversion method and apparatus |
WO2002093417A1 (en) * | 2001-05-17 | 2002-11-21 | University Of Southern California | Statistical method for building a translation memory |
AU2002316581A1 (en) | 2001-07-03 | 2003-01-21 | University Of Southern California | A syntax-based statistical translation model |
US7752266B2 (en) * | 2001-10-11 | 2010-07-06 | Ebay Inc. | System and method to facilitate translation of communications between entities over a network |
US20030101044A1 (en) * | 2001-11-28 | 2003-05-29 | Mark Krasnov | Word, expression, and sentence translation management tool |
WO2004001623A2 (en) | 2002-03-26 | 2003-12-31 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
US8719041B2 (en) | 2002-06-10 | 2014-05-06 | Ebay Inc. | Method and system for customizing a network-based transaction facility seller application |
US8078505B2 (en) | 2002-06-10 | 2011-12-13 | Ebay Inc. | Method and system for automatically updating a seller application utilized in a network-based transaction facility |
US7941348B2 (en) | 2002-06-10 | 2011-05-10 | Ebay Inc. | Method and system for scheduling transaction listings at a network-based transaction facility |
US7308399B2 (en) * | 2002-06-20 | 2007-12-11 | Siebel Systems, Inc. | Searching for and updating translations in a terminology database |
US7293015B2 (en) * | 2002-09-19 | 2007-11-06 | Microsoft Corporation | Method and system for detecting user intentions in retrieval of hint sentences |
US7194455B2 (en) | 2002-09-19 | 2007-03-20 | Microsoft Corporation | Method and system for retrieving confirming sentences |
US7171351B2 (en) * | 2002-09-19 | 2007-01-30 | Microsoft Corporation | Method and system for retrieving hint sentences using expanded queries |
US9881308B2 (en) | 2003-04-11 | 2018-01-30 | Ebay Inc. | Method and system to facilitate an online promotion relating to a network-based marketplace |
US7742985B1 (en) | 2003-06-26 | 2010-06-22 | Paypal Inc. | Multicurrency exchanges between participants of a network-based transaction facility |
US8548794B2 (en) | 2003-07-02 | 2013-10-01 | University Of Southern California | Statistical noun phrase translation |
US20070112553A1 (en) * | 2003-12-15 | 2007-05-17 | Laboratory For Language Technology Incorporated | System, method, and program for identifying the corresponding translation |
US20100262621A1 (en) * | 2004-03-05 | 2010-10-14 | Russ Ross | In-context exact (ice) matching |
US7983896B2 (en) | 2004-03-05 | 2011-07-19 | SDL Language Technology | In-context exact (ICE) matching |
US8296127B2 (en) | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
EP1733304A2 (de) * | 2004-04-02 | 2006-12-20 | Star AG | Computergestütztes hilfsmittel (dynamic linking) für ein verfahren zur erstellung von fremdsprachigen dokumenten |
US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
US9189568B2 (en) | 2004-04-23 | 2015-11-17 | Ebay Inc. | Method and system to display and search in a language independent manner |
GB2415518A (en) * | 2004-06-24 | 2005-12-28 | Sharp Kk | Method and apparatus for translation based on a repository of existing translations |
US8600728B2 (en) | 2004-10-12 | 2013-12-03 | University Of Southern California | Training for a text-to-text application which uses string to tree conversion for training and decoding |
US7937396B1 (en) | 2005-03-23 | 2011-05-03 | Google Inc. | Methods and systems for identifying paraphrases from an index of information items and associated sentence fragments |
US8719244B1 (en) | 2005-03-23 | 2014-05-06 | Google Inc. | Methods and systems for retrieval of information items and associated sentence fragments |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
JP4234698B2 (ja) * | 2005-06-20 | 2009-03-04 | 富士通株式会社 | 構造化文書処理システム |
US7653531B2 (en) * | 2005-08-25 | 2010-01-26 | Multiling Corporation | Translation quality quantifying apparatus and method |
US7937265B1 (en) | 2005-09-27 | 2011-05-03 | Google Inc. | Paraphrase acquisition |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US20070162481A1 (en) * | 2006-01-10 | 2007-07-12 | Millett Ronald P | Pattern index |
US8176052B2 (en) * | 2006-03-03 | 2012-05-08 | Perfect Search Corporation | Hyperspace index |
US8266152B2 (en) * | 2006-03-03 | 2012-09-11 | Perfect Search Corporation | Hashed indexing |
US20080213734A1 (en) * | 2006-04-02 | 2008-09-04 | Steve George Guide | Method for Decoding Pictographic Signs Present on Ancient Artifacts |
US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
US8684265B1 (en) | 2006-05-25 | 2014-04-01 | Sean I. Mcghie | Rewards program website permitting conversion/transfer of non-negotiable credits to entity independent funds |
US9704174B1 (en) | 2006-05-25 | 2017-07-11 | Sean I. Mcghie | Conversion of loyalty program points to commerce partner points per terms of a mutual agreement |
US8668146B1 (en) | 2006-05-25 | 2014-03-11 | Sean I. Mcghie | Rewards program with payment artifact permitting conversion/transfer of non-negotiable credits to entity independent funds |
US7703673B2 (en) | 2006-05-25 | 2010-04-27 | Buchheit Brian K | Web based conversion of non-negotiable credits associated with an entity to entity independent negotiable funds |
US10062062B1 (en) | 2006-05-25 | 2018-08-28 | Jbshbm, Llc | Automated teller machine (ATM) providing money for loyalty points |
US8209163B2 (en) * | 2006-06-02 | 2012-06-26 | Microsoft Corporation | Grammatical element generation in machine translation |
US7865352B2 (en) * | 2006-06-02 | 2011-01-04 | Microsoft Corporation | Generating grammatical elements in natural language sentences |
US7725306B2 (en) * | 2006-06-28 | 2010-05-25 | Microsoft Corporation | Efficient phrase pair extraction from bilingual word alignments |
US20080027911A1 (en) * | 2006-07-28 | 2008-01-31 | Microsoft Corporation | Language Search Tool |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US8639782B2 (en) | 2006-08-23 | 2014-01-28 | Ebay, Inc. | Method and system for sharing metadata between interfaces |
US8521506B2 (en) | 2006-09-21 | 2013-08-27 | Sdl Plc | Computer-implemented method, computer software and apparatus for use in a translation system |
US8433556B2 (en) | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
EP2115630A4 (en) * | 2007-01-04 | 2016-08-17 | Thinking Solutions Pty Ltd | LANGUAGE ANALYSIS |
US8468149B1 (en) | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
NZ553484A (en) * | 2007-02-28 | 2008-09-26 | Optical Systems Corp Ltd | Text management software |
US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US9779079B2 (en) * | 2007-06-01 | 2017-10-03 | Xerox Corporation | Authoring system |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
US8548791B2 (en) * | 2007-08-29 | 2013-10-01 | Microsoft Corporation | Validation of the consistency of automatic terminology translation |
US7774353B2 (en) * | 2007-08-30 | 2010-08-10 | Perfect Search Corporation | Search templates |
US7774347B2 (en) * | 2007-08-30 | 2010-08-10 | Perfect Search Corporation | Vortex searching |
US7912840B2 (en) * | 2007-08-30 | 2011-03-22 | Perfect Search Corporation | Indexing and filtering using composite data stores |
US8135574B2 (en) * | 2007-11-15 | 2012-03-13 | Weikel Bryan T | Creating and displaying bodies of parallel segmented text |
KR100917784B1 (ko) * | 2007-12-24 | 2009-09-21 | 한성주 | 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법 및 시스템 |
US8032495B2 (en) * | 2008-06-20 | 2011-10-04 | Perfect Search Corporation | Index compression |
GB2468278A (en) | 2009-03-02 | 2010-09-08 | Sdl Plc | Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation |
US9262403B2 (en) | 2009-03-02 | 2016-02-16 | Sdl Plc | Dynamic generation of auto-suggest dictionary for natural language translation |
US9189475B2 (en) * | 2009-06-22 | 2015-11-17 | Ca, Inc. | Indexing mechanism (nth phrasal index) for advanced leveraging for translation |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
US8380486B2 (en) | 2009-10-01 | 2013-02-19 | Language Weaver, Inc. | Providing machine-generated translations and corresponding trust levels |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
CN103038764A (zh) * | 2010-04-14 | 2013-04-10 | 惠普发展公司,有限责任合伙企业 | 用于关键字提取的方法 |
KR101416098B1 (ko) | 2010-10-12 | 2014-07-09 | 한국전자통신연구원 | 구단위 번역 지식 학습 방법 및 이를 수행하는 장치 |
KR101356417B1 (ko) * | 2010-11-05 | 2014-01-28 | 고려대학교 산학협력단 | 병렬 말뭉치를 이용한 동사구 번역 패턴 구축 장치 및 그 방법 |
US9128929B2 (en) | 2011-01-14 | 2015-09-08 | Sdl Language Technologies | Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
CN103164390B (zh) * | 2011-12-15 | 2016-05-18 | 富士通株式会社 | 文档处理方法和文档处理装置 |
CN102591859B (zh) * | 2011-12-28 | 2014-11-05 | 华为技术有限公司 | 一种重用行业标准格式文件的方法及相关装置 |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US9183197B2 (en) | 2012-12-14 | 2015-11-10 | Microsoft Technology Licensing, Llc | Language processing resources for automated mobile language translation |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
US10747419B2 (en) | 2015-09-25 | 2020-08-18 | CSOFT International | Systems, methods, devices, and computer readable media for facilitating distributed processing of documents |
US11200217B2 (en) | 2016-05-26 | 2021-12-14 | Perfect Search Corporation | Structured document indexing and searching |
US10635863B2 (en) | 2017-10-30 | 2020-04-28 | Sdl Inc. | Fragment recall and adaptive automated translation |
US10817676B2 (en) | 2017-12-27 | 2020-10-27 | Sdl Inc. | Intelligent routing services and systems |
US11256867B2 (en) | 2018-10-09 | 2022-02-22 | Sdl Inc. | Systems and methods of machine learning for digital assets and message creation |
RU2767965C2 (ru) * | 2019-06-19 | 2022-03-22 | Общество С Ограниченной Ответственностью «Яндекс» | Способ и система для перевода исходной фразы на первом языке целевой фразой на втором языке |
USD917549S1 (en) | 2019-06-20 | 2021-04-27 | Yandex Europe Ag | Display screen or portion thereof with graphical user interface |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07114565A (ja) * | 1993-10-18 | 1995-05-02 | Sharp Corp | 電子辞書 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8900600A (nl) | 1989-03-13 | 1990-10-01 | Bso Buro Voor Systeemontwikkel | Tweetalige kennisbank. |
JPH02301869A (ja) * | 1989-05-17 | 1990-12-13 | Hitachi Ltd | 自然言語処理システム保守支援方式 |
US5329446A (en) * | 1990-01-19 | 1994-07-12 | Sharp Kabushiki Kaisha | Translation machine |
JPH0417065A (ja) | 1990-05-11 | 1992-01-21 | Hitachi Ltd | 翻訳支援装置 |
GB2272091B (en) * | 1992-10-30 | 1996-10-23 | Canon Europa Nv | Apparatus for use in aligning bilingual corpora |
GB2279164A (en) * | 1993-06-18 | 1994-12-21 | Canon Res Ct Europe Ltd | Processing a bilingual database. |
US5659765A (en) * | 1994-03-15 | 1997-08-19 | Toppan Printing Co., Ltd. | Machine translation system |
JP3377290B2 (ja) * | 1994-04-27 | 2003-02-17 | シャープ株式会社 | イディオム処理機能を持つ機械翻訳装置 |
JPH0950435A (ja) | 1995-08-04 | 1997-02-18 | Sharp Corp | 翻訳装置 |
JP3254642B2 (ja) * | 1996-01-11 | 2002-02-12 | 株式会社日立製作所 | 索引の表示方法 |
US6098034A (en) * | 1996-03-18 | 2000-08-01 | Expert Ease Development, Ltd. | Method for standardizing phrasing in a document |
US6161083A (en) * | 1996-05-02 | 2000-12-12 | Sony Corporation | Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation |
EP0887748B1 (en) | 1997-06-27 | 2007-06-27 | International Business Machines Corporation | Multilingual terminology extraction system |
US6535842B1 (en) | 1998-12-10 | 2003-03-18 | Global Information Research And Technologies, Llc | Automatic bilingual translation memory system |
-
1999
- 1999-12-20 US US09/466,823 patent/US6473729B1/en not_active Expired - Lifetime
-
2000
- 2000-12-15 JP JP2000381611A patent/JP4504555B2/ja not_active Expired - Fee Related
- 2000-12-19 EP EP00127817A patent/EP1111514B1/en not_active Expired - Lifetime
- 2000-12-19 DE DE60029732T patent/DE60029732T2/de not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07114565A (ja) * | 1993-10-18 | 1995-05-02 | Sharp Corp | 電子辞書 |
Also Published As
Publication number | Publication date |
---|---|
JP2001195404A (ja) | 2001-07-19 |
EP1111514B1 (en) | 2006-08-02 |
DE60029732D1 (de) | 2006-09-14 |
DE60029732T2 (de) | 2006-11-30 |
EP1111514A1 (en) | 2001-06-27 |
US6473729B1 (en) | 2002-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4504555B2 (ja) | 翻訳支援システム | |
JP3356536B2 (ja) | 機械翻訳装置 | |
US6269189B1 (en) | Finding selected character strings in text and providing information relating to the selected character strings | |
US5675815A (en) | Language conversion system and text creating system using such | |
JP3408291B2 (ja) | 辞書作成支援装置 | |
US8024175B2 (en) | Computer program, apparatus, and method for searching translation memory and displaying search result | |
JPH11110416A (ja) | データベースからドキュメントを検索するための方法および装置 | |
JP2008152760A (ja) | マシンアシスト翻訳ツール | |
US8041556B2 (en) | Chinese to english translation tool | |
JPH08129554A (ja) | 関係表現抽出装置および関係表現検索装置 | |
JP3352799B2 (ja) | 機械翻訳方法及び機械翻訳装置 | |
JP3326646B2 (ja) | 機械翻訳システム用辞書・ルール学習装置 | |
JP2838984B2 (ja) | 汎用参照装置 | |
JP4845857B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP5909123B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
JP4007630B2 (ja) | 対訳例文登録装置 | |
JP5039114B2 (ja) | 機械翻訳装置及びプログラム | |
JPH0561902A (ja) | 機械翻訳システム | |
JPH06266770A (ja) | 文書情報検索装置及び検索装置及び機械翻訳装置及び文書作成装置 | |
JP4368550B2 (ja) | 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム | |
JP2786211B2 (ja) | 機械翻訳装置における後編集装置 | |
JPH04174069A (ja) | 言語理解支援装置 | |
JPH05225232A (ja) | テキスト自動前編集装置 | |
JP2002117028A (ja) | 辞書作成装置および方法と辞書作成プログラムを記録した記録媒体 | |
JPH02110771A (ja) | 電訳機 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071211 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071211 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080108 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080407 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081111 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090206 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091006 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100126 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20100215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100330 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100423 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130430 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140430 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |