JP4504555B2 - 翻訳支援システム - Google Patents

翻訳支援システム Download PDF

Info

Publication number
JP4504555B2
JP4504555B2 JP2000381611A JP2000381611A JP4504555B2 JP 4504555 B2 JP4504555 B2 JP 4504555B2 JP 2000381611 A JP2000381611 A JP 2000381611A JP 2000381611 A JP2000381611 A JP 2000381611A JP 4504555 B2 JP4504555 B2 JP 4504555B2
Authority
JP
Japan
Prior art keywords
phrase
text
translation
database
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000381611A
Other languages
English (en)
Other versions
JP2001195404A (ja
Inventor
ガスタルド ミシェル
グルファンステット グレゴリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2001195404A publication Critical patent/JP2001195404A/ja
Application granted granted Critical
Publication of JP4504555B2 publication Critical patent/JP4504555B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Description

【0001】
【発明の属する技術分野】
本発明は、ある自然言語から他の自然言語へ表現を翻訳することに関し、特に、翻訳者が任意の句(phrase)の適切な訳語を得る際の支援に関する。
【0002】
【従来の技術】
どんな翻訳者も二つの基準で評価される。つまり翻訳速度と翻訳の質である。これらの基準に影響する問題の一つに、翻訳者を躊躇させる単語または単語群の出現がある。適切な訳語を見つけるために、時間がかかる手作業を行うかもしれないが、これにより必ずしも適切な訳語が見つかる保証はない。
【0003】
現在、翻訳者支援技術がいくつか開発されている。それらの一つに、文脈辞書ルックアップを用いる方法がある。文脈辞書を用いれば、文脈に即した訳語が見つけられる。しかしこの技術は見いだされる訳語の範囲が強く制限されている。つまり、文脈辞書を参照しても、翻訳者にはわずかな訳語しか提示されない。
【0004】
また、多言語用語データベース(multi-lingual terminology database)は事前に認められた訳語に基づくので、該データベースの使用は、事前に記憶された一連の用語に限定される。したがって、事前に記憶された一連の用語に含まれない表現を翻訳する場合には、翻訳者を支援できない。
【0005】
また、既に翻訳された文章を記憶した翻訳メモリを使用する技術もある。ある文章を翻訳する場合、該システムはデータベースを照会して、自動的に訳語を提案する。しかし、該システムは、完成した文面をたとえ曖昧(fuzzy)でも一致させる必要があるので、該技術の適用範囲は非常に制約される。
【0006】
また、M.ナガオが提案した翻訳技術「類推原則による日英機械翻訳構成」人工人間知能(A.Elithorn and R.Banerji, eds),Elsevier Science Publishers,1984,pgs.173−180)は、文章を連携させ(align)、言語分析して機械翻訳を行う。更に、各文章対をもとに要素分析ツリー(parse tree)も連携させる。この技術の欠点の一つは、かかる機械翻訳システムでは、翻訳文全体を分析しなければならないことである。別の欠点は、サブツリーを連携させなければならないので、非常に高いコンピュータ処理負荷がかかることである。
【0007】
【発明が解決しようとする課題】
このように従来の翻訳支援においては、適切な訳語が提示されず、高品質の翻訳に資することができないという問題点があった。
【0008】
本発明は係る状況に鑑みてなされたものであり、翻訳者がより高い質の翻訳を行うための支援を主な目的とする。
【0009】
本発明の別の目的は、未知表現に対して費用がかかる手作業検索を行わないために制御した翻訳を行う一助となり、訳語メモリや用語データベースを用いる機能に加えて別の機能を提供することである。
【0010】
本発明のさらに別の目的は、翻訳者の支援依頼に即時対応できる、使い易く高効率かつ高信頼性のツールを提供することである。
【0011】
本発明のさらに別の目的は、現存の技術やソフトウェアツールとの互換性を有することである。
【0012】
上記またはこれら以外の本発明の目的は、以後の説明で明確になるであろう。
【課題を解決するための手段】
これらの目標を達成するために、本発明の第1の態様では、単語句を第1の自然言語から第2の自然言語に翻訳する方法を提供する。ここで単語句とは、2個以上の単語の集まり(group)である。本発明の方法は、第1の言語で記載されたテキストの入力を受け付けるステップと、前記入力を受け付けるステップで受け付けられたテキストから単語句を抽出するステップと、前記第1の自然言語で記載されたテキスト断片と、このテキスト断片の翻訳に対応するテキスト断片であって前記第2の自然言語で記載されたテキスト断片と、を対応づけるテキスト断片対を記憶するデータベースを照会し、前記抽出した単語句を句見出し(phrase index)とするテキスト断片対を検索するステップと、前記検索するステップの結果として前記データベースから取得されたテキスト断片対の一つにおける前記第2の自然言語で記載されたテキスト断片に含まれる単語句を、前記抽出した単語句の翻訳に対応する単語句として取得するステップと、前記取得するステップで取得された、前記抽出した単語句の翻訳に対応する単語句であって前記第2の自然言語で記載された単語句、を出力するステップと、を有し、前記各ステップはコンピュータによって実行される。句見出しは、テキスト断片(text fragment)の見出しとして設定された単語句である。テキスト断片は、少なくとも一つの節(clause)を有する主要な文法的単位を示す。
【0013】
本発明の第2の態様では、第1の態様に係るステップを実行して単語句を第1の自然言語から第2の自然言語に翻訳するための指示を記録するコンピュータ読み取り可能な記録媒体を提供する。
【0014】
本発明の第3の態様では、入力された翻訳対象テキストを元の自然言語から目標となる自然言語への翻訳を支援するシステムを提供する。本システムは、複数のテキスト断片対を含むデータベースを記録する記録手段を有する。テキスト断片は、少なくとも一つの節を含む主要な文法的単位を表す。各対は、元の言語で記載されたテキスト断片と、このテキスト断片の目標の自然言語への翻訳に相当するテキスト断片であって目標言語で記載されたテキスト断片と、を対応づける。各テキスト断片は、少なくとも一つの単語句を含む。単語句は、複数の単語からなる文法的単位であって、主語及び述語を含む節を有しない文法的単位であるまた、このデータベースは、各テキスト断片対に関連付けて、当該テキスト断片対における前記元の自然言語で記載されたテキスト断片に含まれる単語句を当該テキスト断片対の句見出しとして記憶する。本システムは、入力された翻訳対象テキストに含まれる単語のうちの少なくとも1つを選択する選択指示に応じて、この選択指示によって特定される単語を含む単語句を前記翻訳対象テキストから抽出する句抽出部と、抽出した単語句のうちの少なくとも1つについて、当該単語句を句見出しとして前記データベースに記憶されたテキスト断片対を前記データベースから読み出し、読み出したテキスト断片対をディスプレイに表示させる処理を行う制御ユニットと、を有する。本システムは、読み出したテキスト断片対の一つをユーザが選択して、抽出した単語句の訳語を取得できるようにするユーザインターフェイス手段を更に含む。
【0015】
本発明の第4の態様では、第1の自然言語から第2の自然言語に単語句を翻訳する際に使用するテキスト断片データベースの生成方法を提供する。単語句は、2語以上の単語の集まりである。本方法は、第1の言語で記載されたテキストを含む第1の文書を入力するステップと、第2の言語で記載されたテキストを含む第2の文書を入力するステップと、第1の文書および第2の文書の対応するテキスト断片を提携(align)させるステップと、第1の文書のテキスト断片から単語句を抽出するステップと、抽出した単語句と、該単語句を含む提携させたテキスト断片とに関する見出し情報を生成するステップとを含む。テキスト断片は、少なくとも一つの節を含む主要な文法的単位を示す。
【0016】
本発明の他の態様においては、第1から第4の態様に係る本発明の方法およびシステムにおいて、単語句は名詞句であることが好適である。あるいは、動詞句であってもよい。または、少なくとも一つの動詞と名詞または名詞的用法の形容詞を含む述語であってもよい。
【0017】
本発明の更に別の態様では、主要な文法的単位は文章である。
【0018】
本発明の更に別の態様では、テキスト断片対をデータベースから読み出し、該読み出したテキスト断片対を翻訳者に提示する。または、読み出したテキスト断片対に基づいて、抽出した単語句の訳語を翻訳者に提示する。いずれの場合も、翻訳者は訳語を是認すると、この是認した訳語を読み出した単語句の訳語として用いる。
【0019】
本発明の更に別の態様では、上記態様に係るシステムまたは方法における、抽出した句に関してデータベースに照会するステップは、部分句(sub-phrase)、つまり抽出した句の一部に一致するすべての単語句に関して、データベースに照会するステップを含む。
【0020】
最後に、本発明の任意の上記態様では、句見出し付テキスト断片データベースに加えて用語ベースも照会して訳語を取得するステップを含んでもよい。
【0021】
本発明のアプローチを用いると、データベースには句による見出しが付される。抽出した単語句を用いて、テキスト断片全体の見出しとする。好適な実施形態では、名詞句を用いて文章データベースの見出しとする。抽出した名詞句を用いて文章全体の見出しとする。これによって、翻訳文中の対応する部分の単位の認識をユーザに委ねるので、翻訳文全体の分析は行わず、部分ツリー(subtree)を連携させる必要もない。
【0022】
本発明は事前に翻訳された部分を使用し、好適な本実施形態では、元の言語および目標となった言語の双方で書かれた名詞句の各々を含む文章を翻訳者に提示する点で効果的である。句による見出し付きの文章データベースの使用により、翻訳速度と翻訳の質を改善する。
【0023】
明細書の一部として添付する図面は、本発明のいくつかの実施形態を示す。説明と共にこれらの図面を参照すれば、本発明の本質が明らかになるであろう。図面は、本発明の作成方法および使用方法に関する好適な例を説明する目的で用意したものであり、本発明がこれに限定されるものではない。これら以外の特徴や利点は、後述する、本発明の多様な実施形態に関するより特定した説明および添付の図面から明らかになるであろう。
【0024】
【発明の実施の形態】
本発明の実施の形態に係るシステムは、翻訳を支援するためのシステムであって、事前に翻訳対象文書と、その文書を翻訳した結果として得られた文書とを比較対照して、例えば節(文の一部分で、それ自体で主語と述語を有する部分)を少なくとも一つ含んでなる所定の文法的単位(テキスト断片)をキーとして、翻訳前のものと翻訳後のものとからなるテキスト断片対(ここでの対としては、元の言語に対し翻訳後の言語が複数あってもよい)を関連づけたデータベースを作成しておく。また、このデータベースを用いて、翻訳対象として入力されたテキストから単語句を抽出し、この単語句のうち選択されたものを検索キーとして、上記のデータベースを検索して、選択された単語句に対する訳語を提示する。
【0025】
すなわち、本発明によると、少なくとも1つの節を含む主要な文法単位を表すテキスト断片の見出しとして、単語句を用いる。
【0026】
「句」とは通常、少数の単語のみからなる表現であり、一つの考えを示したり、文章の別個の部分を形成する。具体的に「句」は2語以上の単語の集まりであり、主語や述語を含まない。名詞句は代名詞または名詞を含む句である。名詞は通常、現存するあるいは想像上の物、質または行動の名称として用いられる単語である。代名詞は名詞の代わりとして用いられる単語である。つまり、名詞句としては「road test」、「fuel pressure test operations」「verb phrase」等がある。一方、動詞句は一個以上の動詞を含む句であり、「broadened」、「have been fitted」等がある。また、元言語によっては(例えば日本語ならば)、これら名詞句は、「路上テスト」、「燃料圧テスト操作」、「動詞句」等であり、動詞句は「広げられた」、「嵌合された」等である。
【0027】
「句(phrase)」と区別される「節(clause)」は、主語と述語を含む単語の集まりである。つまり、「節」は、文章の一部または単文全体を形成する統語論的構造(syntactic construction)である。文章は1個以上の単語からなる文法上の単位であり、その前後の単語に対して最小限の統語論的関係、つまり最小限の完結性と統一性を有する。文章は、事実の言明であれ、質問であれ、命令であれ、驚嘆であれ、完結した一つの概念を表現する。
【0028】
つまり、「句」や「文章」は、主要な文法単位であると規定できる。文章は「句」や「節」を含み、「節」は「句」を含むかもしれないが、「句」は他の「句」や「文章」を含むことができない。本発明の好適な実施形態では、名詞句を利用して文章の見出し(index)とする。
【0029】
図1において、本発明の実施形態における翻訳システムは、制御ユニット14を含む。制御ユニット14は、パソコンやワークステーション等の任意の種類のコンピュータでもよく、例えばウィンドウズNT(商標)やUNIX(商標)等の従来のオペーレーションシステムを動作させる。制御ユニット14が動作させるソフトウェアアプリケーションは、ディスプレイ11を用いて、ポインタデバイス12やキーボード13によって制御される。インターフェイスソフトウェアは、例えばVisual Basic(商標)等に書き込まれてもよく、できあがったアプリケーションは、任意のVisual Basic(商標)またはC/C++コードに直接一体化できるOLEサーバでもよい。しかし、当業者は、他の多様な実施方法が可能であることが分かるであろう。
【0030】
制御ユニット14上で動作するアプリケーションプログラムは、文章データベース17に対するアクセスを有する。文章データベース17は、Access(商標)またはOracle(商標)データベースでもよく、UNIX(商標)ワークステーションを用いて好適に生成される。データベースの大きさは該システムを使用する分野によって異なる。繰り返すが、これら以外の実施方法も可能である。
【0031】
文章データベース17は、元の言語の例としての複数の英文を記憶し、各英文に対応する目標となった言語の例としての仏文を記憶する。文章データベース17は更に、データベースに保存された任意の文章中にある名詞句の各々に対する見出し付き情報を含む。これは、それぞれの名詞句を含む文章を示す。制御ユニット14上で動作する翻訳ソフトウェアは更に、句抽出部(Phrase Extractor)15へのアクセスを有する。句抽出部15は、複文言語アルゴリズム(complex liguistic algorithm)を用いて、入力されたテキストから名詞句を抽出する。テキストは任意のテキストソースから入力されてもよい。例えば、記憶媒体、スキャナ、メッセージ、音声認識等でもよい。
【0032】
図2は、句見出し付き文章データベース17の生成処理を示すフローチャートである。ステップ21および22で該システムは、元の言語で記載された文書と、目標となった言語で記載された対応する文書とを入手する。ステップ23で、元の文書と目標となった文書の対における文章を連携(align)する。文章の連携とは、元の文章の各々と、対応する目標となった文章との間にリンクを確立することである。文章を連携した後、ステップ24で、元の文章の各々から名詞句を抽出し、句見出し付文章データベース17に加える。この時、該名詞句を抽出した文書に関する情報もあわせて付加する。ステップ25で、抽出した名詞句そのものを句見出しとしてデータベース17に付加した後、ステップ26で、他の元/目標の文書対を読み出すか否かを決定する。読み出す場合、データベース生成処理はステップ21に戻り、新たな文書を入手し、文章を連携させ、名詞句を抽出して記憶する。一連の翻訳文の対に対してステップ21〜26の処理を繰り返し、これまでに出現した多くの名詞句と、それらを含む文章とを記憶する総括的データベースを構築する。
【0033】
句見出し付文章データベース17の生成に関連して図2の処理を説明したが、当業者は、図示した処理を任意に行って、新たな文書対の中にある文章や名詞句を記録して、既存のデータベースを充実できることが分かるであろう。更に、データベースの更新や生成処理を文書を対象にして説明したが、文書断片を対象にしても同様の処理ができることは、当業者には明白であろう。
【0034】
本発明の別の実施形態では、一つの同じ分野における文書のみ、例えば自動車メンテナンス文書等を用いて、データベースを構築する。この方法では、各名詞句に対する訳語候補の数が減少するので、該データベースが十分に大きい場合、ほとんどの名詞句に見出しが付き、ほぼすべての要求に対して訳語が用意される。
【0035】
図3および図4は、翻訳処理を示すフローチャートである。ステップ31で、ユーザは翻訳すべきテキストを入力する。該テキストが表示されると、ユーザは未知の単語や単語の群を、例えば該単語上でダブルクリックすることで選択できる。ステップ32で単語を選択した後、ステップ33で、選択された単語に関して考え得る名詞句をすべて句抽出部15によって抽出する。ステップ34で、一連の考え得る名詞句を表示し、ステップ35で、自動的またはユーザ要求によって、表示された考え得る名詞句の一つを選択する。デフォルトの場合、ユーザの選択の必要なく、抽出された名詞句の中で最長の名詞句を選択する。この自動選択(デフォルトによる選択)は、その名詞句がデータベース中に存在するか否かを基準に行ってもよい。この場合、データベース中に存在する最長の(部分(sub))名詞句を選択する。いずれの場合も、ユーザが選択してもよいし、選択を変更してもよい。
【0036】
図5は、これらの情報をユーザに表示する例を示す図である。ウィンドウ操作システムでは、制御ユニット14によってウィンドウ51を表示する。ウィンドウの中はいくつかのフィールドに区切られている。ステップ32においてダブルクリックによって選択した単語をフィールド55に表示する。また、ステップ33で抽出した一連の考え得る名詞句をフィールド53に表示する。ユーザは、これらの名詞句から、図5の例では、「road test(路上テスト)」という名詞句を選択する。選択された名詞句はフィールド52に表示される。
【0037】
考え得る名詞句の一つをユーザが選択すると、ステップ41において制御ユニット14が句見出し付文章データベースを照会する。文書データベース17に保存されたすべての文章は名詞句による見出しが付されているので、該システムは、大きな遅延なく、選択された名詞句を見出しとする文章対を全て読み出せる。ステップ42で該システムは、読み出した全ての文章対を原文との関係性をもとに分類する。この目的のために、入力されたテキスト原文に含まれる全ての名詞句と、読み出した文章に含まれる全ての名詞句とを比較する。この時、関係性は共通名詞句(common noun phyrases)の数によって異なる。したがってこのシステムは、ステップ43にて、文章の対を翻訳の対象となった文書に最も近いものからユーザに対して提示することができる。ソートされて表示された一連の文章の対の例を、図5のフィールド54に示す。
【0038】
図4のステップ44で、フィールド54に表示された文章の一つを選択する。選択された文章をフィールト56および57にコピーする。これによってユーザは、提示された訳語をより徹底的に検証できる。選択した翻訳文の対(ペア)を用いて、入力テキストから選んだ単語を翻訳することをユーザが決定すると、ステップ45において句抽出部15は、選択した文章対から当該名詞句の訳語を抽出して、入力テキストの訳文に自動的に挿入する。
【0039】
ステップ46で翻訳者は、さらに他の名詞句も翻訳する必要があるか否かを決定する。その必要があれば、ステップ32の処理に戻り、その意味がわからない他の単語(翻訳者が翻訳できない他の単語)を選択する。
【0040】
図6は、実施形態におけるフィールド52に対する操作を示す図である。次にこの図を参照して、本発明に係るシステムの部分名詞句に対する操作を行う動作を説明する。ユーザがステップ35で選択した名詞句が句見出し付文章データベース17に登録されていない場合、本システムは部分的に一致する名詞句を自動的に捜す。あるいは、フィールド61または62に部分句リストを表示してユーザに示し、ユーザがこのリストから登録事項を選択して翻訳処理を行ってもよい。例えば、「燃料圧テスト操作」という名詞句を含む文章がデータベースに登録されていない場合、ユーザはサブ句である「燃料圧テスト」をフィールド62から選ぶ。この用語に対しては、句見出付き文章データベース17に登録があるかもしれない。すなわち、ユーザが選択した句がない場合には、所定のルールに従って、単語を部分的に減らしながら句見出し付きデータベース17の検索作業を再帰的に実行するのである。
【0041】
本発明に係る翻訳システムを名詞句見出し付き文章データベース17を有するシステムであるとして説明してきたが、図1の実施形態における本システムは、更に用語ベース16も有する。制御ユニット14上で動作する翻訳アプリケーションは、該用語ベース16に対してアクセス可能である。ユーザがステップ35で翻訳を要する名詞句を選択すると、該システムはステップ36で用語ベースを照会する。該用語ベースが選択された名詞句の訳語を有する場合、該システムは該訳語を読み出し、図7のフィールド78に表示してユーザに示す。ユーザはこの語を是認してフィールド78に表示することができる。あるいは、句見出し付文章データベース17から読み出して提案された訳語を是認して、フィールド74に表示されたリストからこれを選択することもできる。どの訳語を用いるかをユーザが決定する際に更に支援するために、用語ベース16から読み出した訳語をフィールド74に表示されたリスト中の各訳語が出現する場所でハイライトするなど、強調して表示される。
【0042】
上述の通り本発明は、名詞句そのものが文章全体の見出しとなる名詞句見出し付文章データベースを用い、翻訳文に含まれる対応する部分単位の認識をユーザに委ねる点で多くの利点を有する。つまり、翻訳文の全体的な分析は行わない。しかし、本発明に係るシステムは、例文に基づく機械翻訳、文脈辞書ルックアップ、多言語用語データベース、または翻訳メモリ等の従来の翻訳ツールと一体化してもよい。句見出し付き文章データベースを用いた翻訳環境を提供することで、いかなる翻訳者も強力な翻訳支援を得る。
【0043】
本発明を、好適な物理的な実施形態を用いて説明してきたが、当業者は、上記の技術について本発明の範囲を逸脱することなく請求の範囲内で、多様な変更、変形、改良を行え得ることが分かるであろう。更に、当業者が熟知すると思われる分野の記載をここでは割愛したが、ここで説明する発明を不必要に混乱させないためである。例えば、ユーザが任意に新しい名詞句をタイプ入力する、あるいは部分句リストの他の要素を選択することで、選択した単語を変えられることは当然である。
【0044】
したがって、本発明は上記の特定の実施形態に限定されるものではなく、請求の範囲にのみ限定される。
【図面の簡単な説明】
【図1】 本発明に係る翻訳システムを示す図である。
【図2】 本発明に係る句見出し付文章データベースの生成処理を示すフローチャートである。
【図3】 本発明に係る翻訳処理を示すフローチャートである。
【図4】 本発明に係る翻訳処理を示すフローチャートである。
【図5】 本発明に係るユーザインターフェイスの第1実施形態を示す図である。
【図6】 部分句の使用を示す図である。
【図7】 本発明に係るユーザインターフェイスの第2実施形態を示す図である。
【符号の説明】
11 ディスプレイ、12 ポインタデバイス、13 キーボード、14 制御ユニット、15 句抽出部、16 用語ベース、17 句見出し付き文章データベース。

Claims (1)

  1. 入力された翻訳対象テキストについての元の自然言語から目標の自然言語への翻訳を支援するシステムであって、
    前記元の自然言語で記載されたテキスト断片と、このテキスト断片の前記目標の自然言語への翻訳に相当するテキスト断片であって前記目標の自然言語で記載されたテキスト断片と、を対応付けるテキスト断片対を複数記憶するデータベースであって、各テキスト断片対に関連付けて、当該テキスト断片対における前記元の自然言語で記載されたテキスト断片に含まれる単語句を当該テキスト断片対の句見出しとして記憶するデータベースと、
    前記翻訳対象テキストに含まれる単語のうちの少なくとも1つを選択する選択指示に応じて、この選択指示によって特定される単語を含む単語句を前記翻訳対象テキストから抽出する句抽出部と、
    前記句抽出部が抽出した単語句のうちの少なくとも1つについて、当該単語句を句見出しとして前記データベースに記憶されたテキスト断片対を前記データベースから読み出し、読み出したテキスト断片対をディスプレイに表示させる処理を行う制御ユニットと、
    を備え、
    前記テキスト断片は、複数の単語からなる文法的単位であって、主語及び述語を含む節を少なくとも1つ有する文法的単位であり、
    前記単語句は、複数の単語からなる文法的単位であって、主語及び述語を含む節を有しない文法的単位であることを特徴とするシステム。
JP2000381611A 1999-12-20 2000-12-15 翻訳支援システム Expired - Fee Related JP4504555B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/466823 1999-12-20
US09/466,823 US6473729B1 (en) 1999-12-20 1999-12-20 Word phrase translation using a phrase index

Publications (2)

Publication Number Publication Date
JP2001195404A JP2001195404A (ja) 2001-07-19
JP4504555B2 true JP4504555B2 (ja) 2010-07-14

Family

ID=23853235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000381611A Expired - Fee Related JP4504555B2 (ja) 1999-12-20 2000-12-15 翻訳支援システム

Country Status (4)

Country Link
US (1) US6473729B1 (ja)
EP (1) EP1111514B1 (ja)
JP (1) JP4504555B2 (ja)
DE (1) DE60029732T2 (ja)

Families Citing this family (102)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5836771A (en) * 1996-12-02 1998-11-17 Ho; Chi Fai Learning method and system based on questioning
US6498921B1 (en) * 1999-09-01 2002-12-24 Chi Fai Ho Method and system to answer a natural-language question
AU2440100A (en) 1999-03-19 2000-10-09 Trados Gmbh Workflow management system
US20060116865A1 (en) * 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US7389221B1 (en) * 2000-07-17 2008-06-17 Globalenglish Corporation System and method for interactive translation
US7660740B2 (en) 2000-10-16 2010-02-09 Ebay Inc. Method and system for listing items globally and regionally, and customized listing according to currency or shipping area
US6983240B2 (en) 2000-12-18 2006-01-03 Xerox Corporation Method and apparatus for generating normalized representations of strings
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US8874431B2 (en) * 2001-03-16 2014-10-28 Meaningful Machines Llc Knowledge system method and apparatus
US20030083860A1 (en) * 2001-03-16 2003-05-01 Eli Abir Content conversion method and apparatus
WO2002093417A1 (en) * 2001-05-17 2002-11-21 University Of Southern California Statistical method for building a translation memory
AU2002316581A1 (en) 2001-07-03 2003-01-21 University Of Southern California A syntax-based statistical translation model
US7752266B2 (en) * 2001-10-11 2010-07-06 Ebay Inc. System and method to facilitate translation of communications between entities over a network
US20030101044A1 (en) * 2001-11-28 2003-05-29 Mark Krasnov Word, expression, and sentence translation management tool
WO2004001623A2 (en) 2002-03-26 2003-12-31 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
US8719041B2 (en) 2002-06-10 2014-05-06 Ebay Inc. Method and system for customizing a network-based transaction facility seller application
US8078505B2 (en) 2002-06-10 2011-12-13 Ebay Inc. Method and system for automatically updating a seller application utilized in a network-based transaction facility
US7941348B2 (en) 2002-06-10 2011-05-10 Ebay Inc. Method and system for scheduling transaction listings at a network-based transaction facility
US7308399B2 (en) * 2002-06-20 2007-12-11 Siebel Systems, Inc. Searching for and updating translations in a terminology database
US7293015B2 (en) * 2002-09-19 2007-11-06 Microsoft Corporation Method and system for detecting user intentions in retrieval of hint sentences
US7194455B2 (en) 2002-09-19 2007-03-20 Microsoft Corporation Method and system for retrieving confirming sentences
US7171351B2 (en) * 2002-09-19 2007-01-30 Microsoft Corporation Method and system for retrieving hint sentences using expanded queries
US9881308B2 (en) 2003-04-11 2018-01-30 Ebay Inc. Method and system to facilitate an online promotion relating to a network-based marketplace
US7742985B1 (en) 2003-06-26 2010-06-22 Paypal Inc. Multicurrency exchanges between participants of a network-based transaction facility
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US20070112553A1 (en) * 2003-12-15 2007-05-17 Laboratory For Language Technology Incorporated System, method, and program for identifying the corresponding translation
US20100262621A1 (en) * 2004-03-05 2010-10-14 Russ Ross In-context exact (ice) matching
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US8296127B2 (en) 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
EP1733304A2 (de) * 2004-04-02 2006-12-20 Star AG Computergestütztes hilfsmittel (dynamic linking) für ein verfahren zur erstellung von fremdsprachigen dokumenten
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
US9189568B2 (en) 2004-04-23 2015-11-17 Ebay Inc. Method and system to display and search in a language independent manner
GB2415518A (en) * 2004-06-24 2005-12-28 Sharp Kk Method and apparatus for translation based on a repository of existing translations
US8600728B2 (en) 2004-10-12 2013-12-03 University Of Southern California Training for a text-to-text application which uses string to tree conversion for training and decoding
US7937396B1 (en) 2005-03-23 2011-05-03 Google Inc. Methods and systems for identifying paraphrases from an index of information items and associated sentence fragments
US8719244B1 (en) 2005-03-23 2014-05-06 Google Inc. Methods and systems for retrieval of information items and associated sentence fragments
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
JP4234698B2 (ja) * 2005-06-20 2009-03-04 富士通株式会社 構造化文書処理システム
US7653531B2 (en) * 2005-08-25 2010-01-26 Multiling Corporation Translation quality quantifying apparatus and method
US7937265B1 (en) 2005-09-27 2011-05-03 Google Inc. Paraphrase acquisition
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US20070162481A1 (en) * 2006-01-10 2007-07-12 Millett Ronald P Pattern index
US8176052B2 (en) * 2006-03-03 2012-05-08 Perfect Search Corporation Hyperspace index
US8266152B2 (en) * 2006-03-03 2012-09-11 Perfect Search Corporation Hashed indexing
US20080213734A1 (en) * 2006-04-02 2008-09-04 Steve George Guide Method for Decoding Pictographic Signs Present on Ancient Artifacts
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US8684265B1 (en) 2006-05-25 2014-04-01 Sean I. Mcghie Rewards program website permitting conversion/transfer of non-negotiable credits to entity independent funds
US9704174B1 (en) 2006-05-25 2017-07-11 Sean I. Mcghie Conversion of loyalty program points to commerce partner points per terms of a mutual agreement
US8668146B1 (en) 2006-05-25 2014-03-11 Sean I. Mcghie Rewards program with payment artifact permitting conversion/transfer of non-negotiable credits to entity independent funds
US7703673B2 (en) 2006-05-25 2010-04-27 Buchheit Brian K Web based conversion of non-negotiable credits associated with an entity to entity independent negotiable funds
US10062062B1 (en) 2006-05-25 2018-08-28 Jbshbm, Llc Automated teller machine (ATM) providing money for loyalty points
US8209163B2 (en) * 2006-06-02 2012-06-26 Microsoft Corporation Grammatical element generation in machine translation
US7865352B2 (en) * 2006-06-02 2011-01-04 Microsoft Corporation Generating grammatical elements in natural language sentences
US7725306B2 (en) * 2006-06-28 2010-05-25 Microsoft Corporation Efficient phrase pair extraction from bilingual word alignments
US20080027911A1 (en) * 2006-07-28 2008-01-31 Microsoft Corporation Language Search Tool
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US8639782B2 (en) 2006-08-23 2014-01-28 Ebay, Inc. Method and system for sharing metadata between interfaces
US8521506B2 (en) 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
EP2115630A4 (en) * 2007-01-04 2016-08-17 Thinking Solutions Pty Ltd LANGUAGE ANALYSIS
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
NZ553484A (en) * 2007-02-28 2008-09-26 Optical Systems Corp Ltd Text management software
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US9779079B2 (en) * 2007-06-01 2017-10-03 Xerox Corporation Authoring system
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US8548791B2 (en) * 2007-08-29 2013-10-01 Microsoft Corporation Validation of the consistency of automatic terminology translation
US7774353B2 (en) * 2007-08-30 2010-08-10 Perfect Search Corporation Search templates
US7774347B2 (en) * 2007-08-30 2010-08-10 Perfect Search Corporation Vortex searching
US7912840B2 (en) * 2007-08-30 2011-03-22 Perfect Search Corporation Indexing and filtering using composite data stores
US8135574B2 (en) * 2007-11-15 2012-03-13 Weikel Bryan T Creating and displaying bodies of parallel segmented text
KR100917784B1 (ko) * 2007-12-24 2009-09-21 한성주 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법 및 시스템
US8032495B2 (en) * 2008-06-20 2011-10-04 Perfect Search Corporation Index compression
GB2468278A (en) 2009-03-02 2010-09-08 Sdl Plc Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US9189475B2 (en) * 2009-06-22 2015-11-17 Ca, Inc. Indexing mechanism (nth phrasal index) for advanced leveraging for translation
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
CN103038764A (zh) * 2010-04-14 2013-04-10 惠普发展公司,有限责任合伙企业 用于关键字提取的方法
KR101416098B1 (ko) 2010-10-12 2014-07-09 한국전자통신연구원 구단위 번역 지식 학습 방법 및 이를 수행하는 장치
KR101356417B1 (ko) * 2010-11-05 2014-01-28 고려대학교 산학협력단 병렬 말뭉치를 이용한 동사구 번역 패턴 구축 장치 및 그 방법
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
CN103164390B (zh) * 2011-12-15 2016-05-18 富士通株式会社 文档处理方法和文档处理装置
CN102591859B (zh) * 2011-12-28 2014-11-05 华为技术有限公司 一种重用行业标准格式文件的方法及相关装置
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9183197B2 (en) 2012-12-14 2015-11-10 Microsoft Technology Licensing, Llc Language processing resources for automated mobile language translation
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
US10747419B2 (en) 2015-09-25 2020-08-18 CSOFT International Systems, methods, devices, and computer readable media for facilitating distributed processing of documents
US11200217B2 (en) 2016-05-26 2021-12-14 Perfect Search Corporation Structured document indexing and searching
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
RU2767965C2 (ru) * 2019-06-19 2022-03-22 Общество С Ограниченной Ответственностью «Яндекс» Способ и система для перевода исходной фразы на первом языке целевой фразой на втором языке
USD917549S1 (en) 2019-06-20 2021-04-27 Yandex Europe Ag Display screen or portion thereof with graphical user interface

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114565A (ja) * 1993-10-18 1995-05-02 Sharp Corp 電子辞書

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8900600A (nl) 1989-03-13 1990-10-01 Bso Buro Voor Systeemontwikkel Tweetalige kennisbank.
JPH02301869A (ja) * 1989-05-17 1990-12-13 Hitachi Ltd 自然言語処理システム保守支援方式
US5329446A (en) * 1990-01-19 1994-07-12 Sharp Kabushiki Kaisha Translation machine
JPH0417065A (ja) 1990-05-11 1992-01-21 Hitachi Ltd 翻訳支援装置
GB2272091B (en) * 1992-10-30 1996-10-23 Canon Europa Nv Apparatus for use in aligning bilingual corpora
GB2279164A (en) * 1993-06-18 1994-12-21 Canon Res Ct Europe Ltd Processing a bilingual database.
US5659765A (en) * 1994-03-15 1997-08-19 Toppan Printing Co., Ltd. Machine translation system
JP3377290B2 (ja) * 1994-04-27 2003-02-17 シャープ株式会社 イディオム処理機能を持つ機械翻訳装置
JPH0950435A (ja) 1995-08-04 1997-02-18 Sharp Corp 翻訳装置
JP3254642B2 (ja) * 1996-01-11 2002-02-12 株式会社日立製作所 索引の表示方法
US6098034A (en) * 1996-03-18 2000-08-01 Expert Ease Development, Ltd. Method for standardizing phrasing in a document
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
EP0887748B1 (en) 1997-06-27 2007-06-27 International Business Machines Corporation Multilingual terminology extraction system
US6535842B1 (en) 1998-12-10 2003-03-18 Global Information Research And Technologies, Llc Automatic bilingual translation memory system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114565A (ja) * 1993-10-18 1995-05-02 Sharp Corp 電子辞書

Also Published As

Publication number Publication date
JP2001195404A (ja) 2001-07-19
EP1111514B1 (en) 2006-08-02
DE60029732D1 (de) 2006-09-14
DE60029732T2 (de) 2006-11-30
EP1111514A1 (en) 2001-06-27
US6473729B1 (en) 2002-10-29

Similar Documents

Publication Publication Date Title
JP4504555B2 (ja) 翻訳支援システム
JP3356536B2 (ja) 機械翻訳装置
US6269189B1 (en) Finding selected character strings in text and providing information relating to the selected character strings
US5675815A (en) Language conversion system and text creating system using such
JP3408291B2 (ja) 辞書作成支援装置
US8024175B2 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
JP2008152760A (ja) マシンアシスト翻訳ツール
US8041556B2 (en) Chinese to english translation tool
JPH08129554A (ja) 関係表現抽出装置および関係表現検索装置
JP3352799B2 (ja) 機械翻訳方法及び機械翻訳装置
JP3326646B2 (ja) 機械翻訳システム用辞書・ルール学習装置
JP2838984B2 (ja) 汎用参照装置
JP4845857B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP5909123B2 (ja) 機械翻訳装置、機械翻訳方法およびプログラム
JP4007630B2 (ja) 対訳例文登録装置
JP5039114B2 (ja) 機械翻訳装置及びプログラム
JPH0561902A (ja) 機械翻訳システム
JPH06266770A (ja) 文書情報検索装置及び検索装置及び機械翻訳装置及び文書作成装置
JP4368550B2 (ja) 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム
JP2786211B2 (ja) 機械翻訳装置における後編集装置
JPH04174069A (ja) 言語理解支援装置
JPH05225232A (ja) テキスト自動前編集装置
JP2002117028A (ja) 辞書作成装置および方法と辞書作成プログラムを記録した記録媒体
JPH02110771A (ja) 電訳機

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071211

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071211

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081111

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090206

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091006

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100126

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100330

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100423

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130430

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140430

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees