JP2002513970A - マシンアシスト翻訳ツール - Google Patents

マシンアシスト翻訳ツール

Info

Publication number
JP2002513970A
JP2002513970A JP2000547557A JP2000547557A JP2002513970A JP 2002513970 A JP2002513970 A JP 2002513970A JP 2000547557 A JP2000547557 A JP 2000547557A JP 2000547557 A JP2000547557 A JP 2000547557A JP 2002513970 A JP2002513970 A JP 2002513970A
Authority
JP
Japan
Prior art keywords
placeable
translation
target
type
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000547557A
Other languages
English (en)
Inventor
フンメル、ヨヒェン
ナイファウゼン、イコ
Original Assignee
トラドス・ゲーエムベーハー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by トラドス・ゲーエムベーハー filed Critical トラドス・ゲーエムベーハー
Publication of JP2002513970A publication Critical patent/JP2002513970A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Nonmetallic Welding Materials (AREA)

Abstract

(57)【要約】 本発明は、ソース言語をターゲット言語に変換するための改良された方法および装置を提供する。本発明はプレーサブル(例えば適切な名詞、タイトルおよび名称、日付、時間、単位および測定、数、フォーマット情報、タグまたはエスケープシーケンス、スタイル、グラフ、ハイパーリンク)を使用し、翻訳者を助け、翻訳される必要のない情報を再度タイプする必要がなく、必要な場合にはターゲット現場に対して同様の速度で変換することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は、テキストおよび言語のマシン処理に関し、特に、マシンアシストの
翻訳または機械翻訳のためのソフトウエア実行を含む方法および装置に関する。
【0002】
【従来の技術】
1つの言語から別の言語へのテキストの翻訳は,しばしば熟練した翻訳者の努
力を必要とする面倒な作業である。コンピュータの出現後間もなく、研究者は本
来の言語翻訳の補助としてコンピュータを使用し始めた。初期の機械翻訳(MT
)システムは大きな2言語用の辞書に依存しており、その辞書ではソース言語(
SL)のワードの入力に対して1以上のターゲット言語(TL)中のそれと等価
なワードを与える。この方法は、シンタックスおよび文法に対する辞書のルール
が非常に複雑であり、熟練者でも機械翻訳を記述するルールのセットを開発する
ことはできないことが明らかになり、放棄された。
【0003】 世界中で多数の人々の多言語交換および多国間取引のために翻訳サービスに
対する要求が増加している。商業的および技術的文献の翻訳に対する需要は翻訳
市場の大きい、成長する領域となっている。そのような文献の例としては契約書
、指令マニュアル、フォーム、およびコンピュータソフトウエアがある。製品又
はサービスが新しい市場に対して“局地化”されるとき、大量の文献が翻訳され
なければならないことがしばしばであり、経済的な翻訳に必要性が生じて来る。
商業的および技術的文献は詳細で正確なものであることが必要であるから、正確
な翻訳が継続的に望まれている。
【0004】 機械翻訳(MT)システムは通常は直接法、転送ベース、またはインターリ
ンガ(国際語)ベースのいずれかに分類される。直接法では、ソース言語とター
ゲット言語との中間的な表現はない。ソース言語テキストはそれをターゲットテ
キストに翻訳するために“直接”処理される。この処理は本質的に調整を含むワ
ードからワードへの翻訳である。この方法は、文章の内部構造の全ての観点につ
いて知らないことに対する知覚された弱い属性によって現在ではMTシステムで
は使用されていない。
【0005】 転送ベースの方法では、ソーステキストからの解析の種々の段階からの情報
がターゲットテキストの発生の対応する段階へ転送される。例えば、転送は語句
レベル、文法レベル、または文法により構築された構造のレベル等々で対応を設
定することによって行われる。転送方法は言語の特別の対においてのみ動作し、
それ故、言語の各対に対して特別に、苦労して生成されなければならない。
【0006】 インターリンガベースの方法は、ソーステキストがターゲットテキストにマ
ップされることができる中間表現にマップされることができるような適当な中間
表現が規定されることができるとの仮定に依存している。原理的にこの方法は明
らかに魅力的であり、それは転送ベースの方法とは異なり、言語の各対に対して
別々の転送プログラムを作成する必要がないからである。しかしながら、真に言
語と無関係の中間表現を考えることができるか否かは明らかではない。現在のイ
ンターリンガベースのシステムは、中間表現の一般性に対してのクレームについ
てはるかに望みが少ない。高い品質の翻訳に対しては、ソース言語とターゲット
言語の特別の観点にアクセスする必要がしばしばある。
【0007】 転送ベースの方法では、最近いくつかの進歩があった。文法の数学および計
算モデルの発達で、語句のアイテムを有する関連構造により語句のアイテムを直
接統語ならびに警戒情報の位置を決めるときに強調することが増えている。この
観点から、言語に特有の全ての情報は語句のアイテムおよびそれらと関連する構
造中にカプセル化されル。異なった言語はこのレベルで区別されるが、全ての言
語に対して同じであるこれらの構造を構成するための動作に関係しない。そのア
イディアはその後このレベルにおいて全てのバイリンガル対応を規定する。この
方法が異なった種々の言語間で実行されることができるか否かを観察することが
残されている。
【0008】 既存のいくつかのMTシステムは文書が高度に制限されたテキストに書かれ
ることを要求している。そのようなシステムは異なった言語のマニュアルを処理
するために有効である。そのシステムは1つの自然語で書かれたマニュアルを実
際に他の自然語のセットに翻訳するのではなく、高度に制限されたテキストから
マルチリンガルテキストを発生し、それによりに通常のMTにおける多くの問題
を回避するものである。
【0009】 最近の研究は、自動的に翻訳を行うのではなく、人間の翻訳者の補助を行う
装置を使用する方法に焦点が絞られている。この方法はマシンアシストされた人
間の翻訳(MAHT)と呼ばれている。それらのシステムは人間の翻訳者によっ
て行われた翻訳と予め翻訳された断片的部分を使用してビジネス対応の高品質の
翻訳を生成するために利用できる。マシンアシストされた翻訳ツールの1例は翻
訳メモリ(TM)システムである。翻訳メモリシステムは翻訳者に創造的な作業
を残すが、それらは翻訳者から学習することができ、それらは既存の翻訳および
用語を自動的に示唆することによって翻訳処理を支援する。翻訳メモリは、行わ
れた翻訳を、ソース言語の等価のものと共に集めるデータベースである。多数の
翻訳が行われて翻訳メモリに記憶された後、翻訳メモリは新しい翻訳を助けるた
めにアクセスされることができる。その場合に、新しい翻訳は翻訳メモリ中に含
まれている同一または類似のソース言語テキストを含んでいる。
【0010】 このようなシステムの利点は、それが理論的に既存のMT技術に梃入れして
人間の翻訳者によって行われる伝統的な正確さを犠牲にすることなく遥かに効率
的に翻訳を行うことができることである。このシステムは翻訳者が同じソーステ
キストを2回翻訳することを確実になくすことによって翻訳をより効率的にする
。翻訳者が作業しているとき、翻訳メモリは学習したもとの文章およびその対応
する翻訳を基礎として動作する。この処理において、このデータは神経ネットワ
ークにリンクされる。その後、翻訳メモリは、新しい翻訳を作成するために、迅
速に同一または類似の文章を発見し、作業ベースでそれらを自動的に表示する。
したがって、翻訳メモリは2回翻訳される必要を確実に避けることを可能にする
【0011】 翻訳メモリは、同一の整合の位置を決めることができるときのみならず、近
似的な、或いは“ファジイな整合”の位置を決めることができるときにも最も有
効である。ファジイな整合はワードの順序、語形、格、スペル等に僅かな相違が
あるテキストの検索を容易にする。近似的な整合は自然の言語テキスト中で生じ
る大きな変更の可能性のために必要である。類似した内容の文章を発見するため
のファジイな整合はニューラルネットワーク技術の構成により完全にされた性能
を示す。翻訳者はメモリにより自動的に示唆されたものに加えて別の翻訳間の選
択をする選択肢を有する。ソース文章とその翻訳と共に、各翻訳装置はまた、ユ
ーザ、日付、使用の頻度、および属性とテキストフィールドの分類についての情
報を記憶することができる。この情報は翻訳メモリの保守を容易にすることがで
き、それは当然時間の経過と共に大きくなる。
【0012】 用語索引は翻訳者により通常使用される別のツールである。電子用語索引は
テキストストリング、すなわちワード、フレーズ、またはセンテンスを有するフ
ァイルであり、それはワードが特定の文書中に現れた文脈と整合される。翻訳者
が特定のワードにより与えられる意味が確かでないとき、用語索引はワードがい
くつかの異なった文脈でどのように使用されるかを説明することができる。この
情報は、ソース言語文書の意味を正確に反映するために翻訳のより適切な選択を
可能にする。電子用語索引は、所望のワードまたはフレーズを含むライブラリ中
の全てのテキストストリングを翻訳者が抽出することを可能にするテキスト検索
ソフトウエアを含んでいる。抽出されたテキストストリングは迅速に検査されて
どのように特定のワードまたはフレーズが文脈中で使用されるかのよりよい理解
を与える。
【0013】
【発明が解決しようとする課題】
マルチリンガルの自然言語の処理は、国際的な商業および通信の分野で必要性
および機会が増加している。マシンアシスト翻訳ツールは文書の翻訳をより効率
的で廉価なものとするために必要とされる。さらにマシンアシスト翻訳ツールは
予め翻訳された商業的および技術的文書として利用できる記憶された大量の知識
を効率的に梃入れすることを必要とされている。特に、言語に無関係に、正確で
、迅速に予め翻訳された材料のファジイな検索を行う翻訳メモリツールに対する
必要性が存在する。
【0014】 現在まで、プレーサブルであると考えられたテキストは翻訳者によって翻訳
されて手作業で入力されなければならない。プレーサブルはしばしば翻訳された
テキストまたは変換された形態で再使用される。そのようなプレーサブルの例は
、適当な名詞、タイトルおよび名称、日付、時間、単位および測定、数や番号、
フォーマット情報、タグまたは漏れたシーケンス、スタイル、グラフ、ハイパー
リンク、クロスリファレンス、テキスト中の自動フィールド、或いはその他の翻
訳されないが、文脈についての知識なしに変換される任意の情報である。プレー
サブルの翻訳は時間がかかり、通貨、例えばドルから円へ変換する場合および速
度、例えばマイル/時間をキロメータ/時間へ変換する場合のような変換が行わ
れる場合にエラーを生じる。プレーサブルであると考えられるテキストを識別し
て、必要な変換を行い、そのプレーサブルをターゲットテキスト中に挿入するプ
ログラムが必要とされている。
【0015】 本発明の目的は、手動のタイプの必要をなくすことによって、ソース情報を
ターゲット情報に翻訳し、或いはプレーサブルをターゲット情報に挿入すること
を許容することによってプレーサブルを翻訳中に移動させ、ターゲットプレーサ
ブルコンバータにより任意所望の変換を行うために翻訳者に要求されている努力
を減少させることである。
【0016】 本発明の別の目的は、自動的にプレーサブル、例えば日付、測定単位をター
ゲットテキストに挿入するために変換することによりソーステキストを翻訳する
ために必要な時間量また努力を減少させることである。
【0017】 本発明の別の目的は、翻訳者が自動的なプレーサブルデータの変換によりソ
ーステキスト中の測定単位を手作業でターゲットテキストに変換する時に生じる
エラーを減少させることである。
【0018】 本発明の別の目的は、自動的にフォーマットコードを識別してそのコードを
ターゲットテキストに挿入することによりソーステキストを翻訳するために必要
な時間量また努力を減少させることである。
【0019】 本発明の別の目的は、自動的にハイパーテキストリンクを翻訳することによ
りソーステキストをターゲットテキストに翻訳するために必要な時間量また努力
を減少させることである。
【0020】 本発明の別の目的は、プレーサブルを言語に無関係のフォーマットに変換さ
せることである。
【0021】 本発明の別の目的は、適当であれば、例えば、測定単位、データフォーマッ
ト、通貨値および単位、タイトルおよび名称等を変換することによりプレーサブ
ルエレメントの出現を自動的に変化させることである。
【0022】 本発明のさらに別の目的は、ソース情報を翻訳するとき、ユーザとの対話に
おいて、例えば1以上のキーストロークにおいて、または1以上の音声命令にお
いて、またはマウスのクリックにおいてなどでプレーサブルエレメントをターゲ
ットテキストのユーザの定めた位置に半自動的に挿入することである。
【0023】 本発明の目的は、参照材料その他のマシンで計算可能な情報の助けにより、
ユーザとの対話なしに機械が挿入位置を決定することが許容されるプレーサブル
エレメントを自動的に挿入することである。
【0024】 本発明の目的は、手動翻訳により、または翻訳メモリにより使用できること
である。
【0025】
【課題を解決するための手段】
本発明は、ソース言語をターゲット言語に翻訳するための改良された方法およ
び装置を提供する。本発明はプレーサブルを使用し、ターゲット言語中にプレー
サブルを自動的または半自動的に配置することを容易にし、ターゲット地域(lo
cale)、例えば“ドイツ -標準方式”にしたがって必要な変換を行うことによっ
て翻訳者を支援する。ここで使用される用語“プレーサブル”とはターゲット言
語に翻訳する必要のないデータ、または場合によっては半自動的に置換するのに
特に適しているデータ(例えば、適当な名詞、タイトルおよび名称、フォーマッ
ト情報、タグまたは漏れたシーケンス、スタイル、グラフ)、またはデータの文
脈を変更しない翻訳を必要とするデータ(例えば、物理単位および通貨単位、時
間範囲、データフォーマット、ハイパーリンク等)を意味する用語である。さら
に、プレーサブルはもっと複雑で進歩したものでもよい。例えばプレーサブルは
特別の辞書および/または翻訳のために指定された全体の情報の文脈または環境
情報、例えば化学環境、自動車環境、音楽リリック、法律環境におけるデータに
よって決定されることができる。文脈または環境情報はある用語がどのように翻
訳されるかを決定する。ソースプレーサブル識別子が使用されてプレーサブルの
文脈または環境に関するソース索引に基づいてソース情報、例えばソース地域を
識別してもよい。翻訳メモリにおいてプレーサブルは言語に関係のないフォーマ
ット、例えばメタ表現に変換されることもできる。言語に関係のないフォーマッ
トは、フォーマットが全ての地域に共通であるため、翻訳メモリが任意のターゲ
ット言語にプレーサブルを変換することを可能にする。無関係のフォーマットに
変換した後、プレーサブルは自動的または半自動的にターゲット翻訳中に位置さ
せることができる。ターゲットプレーサブルコンバータが使用されてプレーサブ
ルの文脈または環境に関連するターゲット索引に基づいてプレーサブルをターゲ
ット情報、例えばターゲット地域に変換する。
【0026】 本発明によるシステムは、プレーサブルを識別し、プレーサブル次の処理を
容易にするためにそのタイプを決定し、プレーサブルの位置の決定、変換、また
は翻訳を容易にする。プレーサブルの識別およびそのタイプの決定は、規則にし
たがったプロセスによって行われることができる。さらに、識別および決定プロ
セスは、検索表機能または文字毎の決定のような有限状態マシンの援助により行
われることができる。
【0027】 本発明を使用するデータベース駆動TMでは、プレーサブル情報と共にテン
プレートまたはスケルトンのようなユニットを記憶することによりソースユニッ
トとターゲット単位とを対で記憶することを必要とする記憶スペースの量を減少
させる高い可能性を有する。
【0028】
【発明の実施の形態】
本発明は商業的に利用可能な種々の言語翻訳コンピュータソフトウエアプログ
ラムによって実行可能である。本発明は翻訳メモリを用いて動作することができ
るが、それは不可欠ではない。システムは少なくとも2つの言語を支援する利点
を有している まず、システムはテキストデータまたは音声データのような入力ソース翻訳情
報を受信することができ、それは種々の方法で入力または検索することができる
(例えばデータファイル、走査されたデータ、音声記録、音声口述等)。プログ
ラムはソース翻訳情報を発音形式またはデータ翻訳ユニットに分割することがで
きる。これはソース翻訳情報をワード、センテンス、またはパラグラフにセグメ
ント化することにより行われる。このプロセスはシステム指定またはユーザ指定
されることができる。 [手動翻訳] 図1は翻訳者が翻訳メモリを使用しない時の本発明によるプロセスを示すフロ
ーチャートである。最初に、入力ソース翻訳情報はセンテンスのようなセグメン
トに分割されることができる。セグメントのエレメントはステップ110 でプロセ
ッサに与えられる。システムはエレメントがプレーサブルであるか否かを決定す
る(ステップ 120)。テキストの翻訳中、システムはデータエレメントがプレー
サブルであり、翻訳者がこのプレーサブルをターゲットテキスト中に挿入するこ
とが可能であることを翻訳者に教える(ステップ 130)。この時点で、システム
はまた翻訳者を補助するためにプレーサブルのタイプを決定する。このタイプ情
報は任意の適当なフォーマット、例えば、指導信号、色、フォント変化等で翻訳
者に与えられることがでる。この方法では、翻訳者はプレーサブルをどこに挿入
するかを、例えば、1回以上のキー操作、1回以上の言葉による命令、マウスの
クリック等により決定することができる。プレーサブルがターゲット情報に変換
することが必要な場合には、このシステムは、ユーザがターゲットテキスト中に
プレーサブルをドロップすることを選択したときタイプに基づいてそのプレーサ
ブルを自動的に変換するように設定することができる(ステップ 140)。この変
換はターゲット出力の位置情報(例えば、ターゲットの地域、ターゲットの環境
または内容に基づいたターゲット辞書)にしたがってターゲットプレーサブルコ
ンバータによって行われる。手動翻訳はウインドウズ環境で行われることができ
る。 [翻訳メモリ] 翻訳メモリは情報が翻訳されるときに参照の目的で使用される。図2は翻訳メ
モリを使用するときに翻訳のための参照材料を管理するための市販のソフトウエ
アプログラムを示している。参照材料は通常2以上の言語のテキストの集合体で
あり、前に翻訳されたソーステキストユニットはターゲットテキストユニットと
関連される。翻訳に指定された入力はソース翻訳情報と呼ばれる。上述のように
翻訳メモリは同一の整合の位置を定めるだけでなく、近似的な、ファジイな整合
の位置を定めることができるので最も有効である。ファジイな整合はソース翻訳
情報と僅かに異なっているテキストの検索を容易にする。翻訳メモリは検索され
た示唆された情報がソース翻訳情報とどのような近似で整合するかを示す情報を
翻訳に与えることができる。この情報はパーセンテージのような数値の形態で与
えられることができる。以前に正確に翻訳されている翻訳されるべきテキスト(
すなわちソース翻訳情報)のユニットが翻訳メモリ中で得られたソーステキスト
のユニットと同一であるか、または非常に類似している場合には、検索システム
はターゲットテキストとして翻訳メモリ中に記憶されている翻訳を参照として示
すことができる。翻訳者はこの参照のユニットをコピーし、それを修正して新し
いソース翻訳情報に適合させることができる。従来のシステムにおいては、プレ
ーサブルが翻訳されるテキスト中に存在し、翻訳メモリソーステキストの対応す
るエレメントとは異なる場合には、手作業で転送して必要な場合には翻訳し、プ
レーサブルデータをターゲット情報に翻訳または変換する必要がある。
【0029】 翻訳ソフトウエアのユーザインターフェースは、翻訳者に対して異なったア
イテムを表示するためにプログラムウインドウ(200) を提供する。この特定の例
では、翻訳ソフトウエアプログラムウインドウ(210) およびワードプロセッサの
プログラムウインドウ(240) を同時に示し、それによりユーザは全体のソース翻
訳情報或いは関心のあるそれより小さいqqを翻訳プロセス中に観察することが
できる。アイテム(240) はまた翻訳プロセス中に最終的なターゲット情報、例え
ば翻訳されたテキストを表示するように構成されることができる。アイテム(210
) は翻訳に対して指定されたソース翻訳情報の発音形態またはデータ翻訳単位を
表示することのできる区域(220) を示している。さらに、ウインドウ(210) は翻
訳メモリツール(230) を使用するとき、発音形態に対して示唆されたいくつかの
翻訳を表示する。
【0030】 図3および5は、翻訳者が翻訳メモリを使用するときの本発明を示している
。最初に、ソース翻訳情報の発音qqはさらにトークンまたはソースエレメント
に分割される。ソースエレメントがプレーサブルとして識別されたとき(ステッ
プ 310)、そのタイプ(すなわち、日付、時間、リンク等)が決定され(ステッ
プ 330)、プレーサブルがメタ表現のような言語に関係のないフォーマットに変
換されることができ(ステップ 340)、或いは直接ターゲット言語または地域に
変換されることができる。メタ表現(420, 520)はシステムがプレーサブルを任
意のターゲット言語に変換することを可能にする。その理由はフォーマット(メ
タ表現)が全ての場合に共通しているからである。メタ表現はターゲットプレー
サブル(360)を生成するために任意のターゲット地域に応じて変換されることが
できる。この時点で、プレーサブルはターゲット言語中に挿入され、任意の変換
が自動的または半自動的に行われることができる。
【0031】 次のような文章“A man , called Mr.Miller,left his apartment on the25t
h of January in a car that is capable of driving at speeds above 160mph
”について検討する。機械翻訳プログラムは“A man , called Mr.Miller on th
e phone ”か否か、または“A man ”が“Mr.Miller ”と同一人物か否かを決定
するのは困難である。この疑問は文脈を評価しなければ答えることがでない。換
言すれば、もしもワード“called”だけを見る場合には文章を正確に翻訳するこ
とは不可能である。しかしながら、“A man , called Mr.Miller”の全体のトー
クン(410)を考慮すれば、翻訳者(または翻訳装置)は意味のある翻訳をするこ
とができる。図3は本発明がこの文章をどのように処理するか、プレーサブルが
最初に識別されたときどのように処理されるかを示している。識別されたこれら
のプレーサブルは、Mr.Miller 、25th of January および160mphである。
【0032】 識別された 分類および言語に無関係 ターゲットテキスト プレーサブル のフォーマット に挿入される翻訳 Mr.Miller プレーサブル/名称w Miller氏 /タイトル 25th of January プレーサブル/日付長期間 1月25日 160mph プレーサブル/数w/単位 260km/h システムが翻訳されるべきテキストの入力(例えばソース翻訳情報)の一部と
して前のテキストに存在しているとき、システムはまずテキストをセグメント化
し、好ましくはセンテンスに分割する。前のセンテンスはその場合有効にトーク
ン処理されることができる。本発明の1実施形態によれば、ソース翻訳センテン
ス中のワードまたはフレーズに対応したエレメントにトークン化処理される。ト
ークン化処理は、エレメントがルールに基づいた列にしたがったプレーサブルと
して識別されるか、または検索表のような有限状態ツールを使用するかのいずれ
かを考慮する。次にプレーサブルとして識別されたエレメントのタイプが決定さ
れる。この決定はまたルールベースの列と、表によるような有限状態プロセスの
少なくとも一方によって行われることができる。トークン装置の出力はプレーサ
ブルでないエレメントと、任意のプレーサブルエレメントのタイプの指示とを含
んでいる。この出力は前に翻訳された同一または類似のセグメントの位置を決定
するために翻訳メモリに対して与えられる。システムは翻訳メモリ中にある前に
翻訳されたターゲットテキストに基づいた翻訳を提案し、直接プレーサブルエレ
メントを変換し、または変換せずに位置させることができる。システムはパーソ
ナルコンピュータのような汎用コンピュータにおけるソフトウエアによって構成
されることが有利である。
【0033】 プレーサブルの決定は、ルールベースのシステムまたは有限状態システムを
使用する1または2ステップの方法である。1ステップの方法はまた全体のトー
クンを観察するルールベースのシステムを使用してタイプを決定することにより
行われる。たとえば、このトークンは日付であるか、このトークンは適切な名詞
であるか、このトークンはハイパーリンクであるか?等である。2ステップの方
法は最初にトークンがプレーサブルであるか否かが決定され、次にそのタイプが
が決定される。これは決定に到達するまで一時に1つのトークンの各文字を検査
する有限状態プロセスを使用して行われることができる。
【0034】 プレーサブルの識別特徴の1つはその意味が文脈により変化する可能性がほ
とんどないことである。そのようなプレーサブルはたとえば数値またはグラフの
翻訳に直接使用されるタイプを含んでいてもよい。プレーサブルの別のタイプは
単位により結合されている数のように変換後に使用されるものである。例えば、
毎時62マイルとして現れたプレーサブルは毎時100キロメートルに変換しな
ければならないこともある。そのような変換はその公式的な性質により翻訳とは
区別される。公式的な変換は内容がほとんど翻訳に影響しない状態において適し
ている。
【0035】 以下の例は別のソーステキスト中に類似したプレーサブルを含んでいるテキ
ストの翻訳を示している。翻訳メモリシステムは以下のソーステキスト単位プラ
ス参照ファイルからのその翻訳を含んでいる。 翻訳メモリソーステキスト:“A man , called Mr. Smith,left his apartment
on the1st of April in a car that is capable of driving at speeds above
100mph” 翻訳ツールターゲットテキスト単位(ドイツ語):“Ein Mann , namens Herr S
mith,verliess sein Apartment am 1. April in einem Auto, das schneller a
ls 160km/h fahren kann” 翻訳されるべき新しいテキストユニット:“A man , called Mr.Miller,left hi
s apartment on the25th of January in a car that is capable of driving at
speeds above 160mph” 図5に示されるように、新しいソーステキストユニットはエレメント(510)に
分割される。プレーサブルはそれから分類され、言語に関係のないフォーマット
(520)に変換される。ソフトウエアが翻訳メモリソーステキストユニットおよび
翻訳される新しいテキストの両者におけるプレーサブルと翻訳メモリターゲット
テキストユニットの3つのプレーサブルと相関することができるとき、本発明を
使用する翻訳メモリシステムは自動的に、すなわちユーザが介入することなくプ
レーサブルを挿入する位置を決定し提案することができる。上記の例では、シス
テムは次のようなことを決定することができる。 I.テキストユニット(翻訳されるべきもの)と翻訳メモリソーステキストユニ
ット(前に翻訳されたものと類似するテキスト)との差だけが3つのトークン中
で発見される。 II.3つのトークン全てがプレーサブルである。 III.プレーサブルトークンのタイプ(すなわち、日付、速度、名前)が翻訳メモ
リソーステキストユニットと翻訳されるべきテキストにおいて同じである。 IV.古いターゲットテキストユニットでは、プレーサブルトークンの正確に同じ
数およびタイプが発見できる。翻訳システムは前の翻訳(翻訳メモリソーステキ
ストユニット)を再使用し、プレーサブルトークンを新しい名前(= Mr.Miller
)、新しい日付(=1月25日)、および新しい速度(=160mph)で置換
するすることを提案することができる。 V.ソフトウエアはタイプに応じてプレーサブルのある部分を変換することがで
きる。この例では“Herr Miller ”,“1月25日”,“280km/h”であ
る。 [プレーサブルの記憶] 今日市場には2つのタイプの翻訳メモリシステムが存在する。すなわち、参照
ファイルで駆動されるTMとデータベースで駆動されるTMである。参照ファイ
ルで駆動されるTMはソーステキストとターゲットテキストとを2つの異なった
位置に維持して互いの基準ポインタのリストを維持することによって両者を整列
させる。参照ファイルで駆動されるシステムでは、今まで書き込まれた全てのソ
ーステキスト(またはそれでなければ生成された)およびその全ての翻訳が物理
的にファイルに記憶されて維持される。本発明で使用するデータベースで駆動さ
れるTMではテンプレートまたはスケルトンのようなテキストユニットを単に記
憶することによってデータ記憶スペースを保全する高い潜在性がある。
【図面の簡単な説明】
【図1】 本発明の1実施形態のフロー図。
【図2】 本発明の別の実施形態の概略図。
【図3】 本発明の別の実施形態のフロー図。
【図4】 本発明の別の実施形態の説明図。
【図5】 本発明の別の実施形態の説明図。
【手続補正書】特許協力条約第34条補正の翻訳文提出書
【提出日】平成12年6月28日(2000.6.28)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,UG,ZW),E A(AM,AZ,BY,KG,KZ,MD,RU,TJ ,TM),AE,AL,AM,AT,AU,AZ,BA ,BB,BG,BR,BY,CA,CH,CN,CU, CZ,DE,DK,EE,ES,FI,GB,GD,G E,GH,GM,HR,HU,ID,IL,IS,JP ,KE,KG,KP,KR,KZ,LC,LK,LR, LS,LT,LU,LV,MD,MG,MK,MN,M W,MX,NO,NZ,PL,PT,RO,RU,SD ,SE,SG,SI,SK,SL,TJ,TM,TR, TT,UA,UG,UZ,VN,YU,ZA,ZW Fターム(参考) 5B091 AA01 AB02 AB06 BA12

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 エレメント中への入力ソース情報をパースし、 予め定められた基準によってプレーサブルエレメントを識別し、 タイプにより前記プレーサブルエレメントを指定するステップを含んでいるこ
    とを特徴とするソース情報の処理方法。
  2. 【請求項2】 さらに、ソース地域を決定するステップを含んでいる請求項
    1記載のソース情報の処理方法。
  3. 【請求項3】 さらに、前記エレメントの前記タイプを決定するためにソー
    スプレーサブル識別子を適用するステップを含んでいる請求項2記載のソース情
    報の処理方法。
  4. 【請求項4】 さらに、ターゲット地域を決定するステップを含んでいる請
    求項1記載のソース情報の処理方法。
  5. 【請求項5】 さらに、前記エレメントの前記タイプを変換するためにター
    ゲットプレーサブルコンバータを適用するステップを含んでいる請求項1記載の
    ソース情報の処理方法。
  6. 【請求項6】 さらに、タイプにより前記エレメントを決定するために前記
    ソース地域を適用するステップを含んでいる請求項2記載のソース情報の処理方
    法。
  7. 【請求項7】 さらに、前記エレメントを言語に無関係のフォーマットに変
    換するステップを含んでいる請求項1記載のソース情報の処理方法。
  8. 【請求項8】 さらに、前記プレーサブルが適切な名詞であるか否かを決定
    し、前記プレーサブルを直接ターゲット出力に位置させるステップを含んでいる
    請求項1記載のソース情報の処理方法。
  9. 【請求項9】 さらに、前記プレーサブルが日付であるか否かを決定し、前
    記日付をターゲット地域情報にしたがってターゲット情報に変換するステップを
    含んでいる請求項1記載のソース情報の処理方法。
  10. 【請求項10】 さらに、前記プレーサブルが適切な名詞であるか否かを決
    定し、前記プレーサブルを言語に無関係なフォーマットに変換するステップを含
    んでいる請求項1記載のソース情報の処理方法。
  11. 【請求項11】 さらに、前記プレーサブルが適切な名詞であるか否かを決
    定し、前記プレーサブルをメタ表現に変換するステップを含んでいる請求項1記
    載のソース情報の処理方法。
  12. 【請求項12】 さらに、前記プレーサブルが日付であるか否かを決定し、
    前記プレーサブルを言語に無関係なフォーマットに変換するステップを含んでい
    る請求項1記載のソース情報の処理方法。
  13. 【請求項13】 さらに、前記プレーサブルが変換を要求するか否かを決定
    するステップを含んでいる請求項1記載のソース情報の処理方法。
  14. 【請求項14】 さらに、前記プレーサブルが適切な名詞であるか否かを決
    定するステップを含んでいる請求項1記載のソース情報の処理方法。
  15. 【請求項15】 さらに、前記プレーサブルが日付であるか否かを決定する
    ステップを含んでいる請求項1記載のソース情報の処理方法。
  16. 【請求項16】 さらに、変換の要求を出力することを決定するステップを
    含んでいる請求項1記載のソース情報の処理方法。
  17. 【請求項17】 パーサと、 前記パーサの出力に接続されているエレメント識別装置と、 前記エレメント識別装置の出力に接続されているタイプ指定装置とを具備して
    いることを特徴とするソース情報を処理するためのコンピュータ駆動言語処理シ
    ステム。
  18. 【請求項18】 ソース情報をエレメントにパースするパーサと、 予め定められた基準によってプレーサブルエレメントを識別するエレメント識
    別装置と、 前記プレーサブルエレメントをタイプにより指定するタイプ指定装置とを具備
    していることを特徴とするソース情報を処理するためのコンピュータ駆動言語処
    理システム。
  19. 【請求項19】 入力ソース情報をエレメントへセグメント化し、 予め定められた基準によってプレーサブルなエレメントを識別し、 タイプにより前記プレーサブルエレメントを指定するステップを含んでいるこ
    とを特徴とするソース情報の処理方法。
  20. 【請求項20】 さらに、前記プレーサブルエレメントをデータセットと比
    較するステップを含んでいる請求項8記載のソース情報の処理方法。
  21. 【請求項21】 さらに、前記プレーサブルエレメントをデータセットとタ
    イプによって比較するステップを含んでいる請求項8記載のソース情報の処理方
    法。
JP2000547557A 1998-05-04 1999-04-30 マシンアシスト翻訳ツール Pending JP2002513970A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/071,900 US7020601B1 (en) 1998-05-04 1998-05-04 Method and apparatus for processing source information based on source placeable elements
US09/071,900 1998-05-04
PCT/EP1999/002959 WO1999057651A1 (en) 1998-05-04 1999-04-30 Machine-assisted translation tools

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007282902A Division JP2008152760A (ja) 1998-05-04 2007-10-31 マシンアシスト翻訳ツール

Publications (1)

Publication Number Publication Date
JP2002513970A true JP2002513970A (ja) 2002-05-14

Family

ID=22104320

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2000547557A Pending JP2002513970A (ja) 1998-05-04 1999-04-30 マシンアシスト翻訳ツール
JP2007282902A Pending JP2008152760A (ja) 1998-05-04 2007-10-31 マシンアシスト翻訳ツール

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2007282902A Pending JP2008152760A (ja) 1998-05-04 2007-10-31 マシンアシスト翻訳ツール

Country Status (10)

Country Link
US (1) US7020601B1 (ja)
EP (1) EP1076861B1 (ja)
JP (2) JP2002513970A (ja)
CN (1) CN1179289C (ja)
AT (1) ATE298111T1 (ja)
AU (1) AU761311B2 (ja)
CA (1) CA2331184C (ja)
DE (1) DE69925831T2 (ja)
MX (1) MXPA00010835A (ja)
WO (1) WO1999057651A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8935148B2 (en) 2009-03-02 2015-01-13 Sdl Plc Computer-assisted natural language translation
US8935150B2 (en) 2009-03-02 2015-01-13 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US9342506B2 (en) 2004-03-05 2016-05-17 Sdl Inc. In-context exact (ICE) matching
US9400786B2 (en) 2006-09-21 2016-07-26 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US9600472B2 (en) 1999-09-17 2017-03-21 Sdl Inc. E-services translation utilizing machine translation and translation memory
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation

Families Citing this family (87)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2336899A3 (en) * 1999-03-19 2014-11-26 Trados GmbH Workflow management system
US7346488B2 (en) 2000-07-10 2008-03-18 Fujitsu Limited Automatic translator and computer-readable storage medium having automatic translation program recorded thereon
FR2812102B1 (fr) * 2000-07-18 2005-02-04 Tradweb Procede et systeme pour la traduction linguistique
JP2002189627A (ja) * 2000-12-21 2002-07-05 Tsubasa System Co Ltd 文書データの変換方法
AUPR329501A0 (en) * 2001-02-22 2001-03-22 Worldlingo, Inc Translation information segment
US7191115B2 (en) * 2001-06-20 2007-03-13 Microsoft Corporation Statistical method and apparatus for learning translation relationships among words
US20080300856A1 (en) * 2001-09-21 2008-12-04 Talkflow Systems, Llc System and method for structuring information
EP1351159A3 (en) * 2002-02-08 2003-10-22 Hewlett Packard Company, a Delaware Corporation Improvements relating to the content of the electronic documents
US7110937B1 (en) * 2002-06-20 2006-09-19 Siebel Systems, Inc. Translation leveraging
US7249012B2 (en) * 2002-11-20 2007-07-24 Microsoft Corporation Statistical method and apparatus for learning translation relationships among phrases
US7627817B2 (en) * 2003-02-21 2009-12-01 Motionpoint Corporation Analyzing web site for translation
US7356457B2 (en) * 2003-02-28 2008-04-08 Microsoft Corporation Machine translation using learned word associations without referring to a multi-lingual human authored dictionary of content words
JP3987533B2 (ja) 2003-03-14 2007-10-10 富士通株式会社 翻訳支援装置
US8050906B1 (en) * 2003-06-01 2011-11-01 Sajan, Inc. Systems and methods for translating text
US8135575B1 (en) 2003-08-21 2012-03-13 Google Inc. Cross-lingual indexing and information retrieval
AU2003278102A1 (en) * 2003-10-17 2005-05-19 Baher Yahya Al-Ramady Method for operating an output device
EP1745392A2 (de) 2004-03-16 2007-01-24 Star AG Computergestütztes hilfsmittel für ein verfahren zur erstellung von fremdsprachigen dokumenten
US20050216256A1 (en) * 2004-03-29 2005-09-29 Mitra Imaging Inc. Configurable formatting system and method
DE202005021923U1 (de) 2004-04-02 2011-06-09 Star Ag Computergestütztes Hilfsmittel für ein Verfahren zur Erstellung von fremdsprachigen Dokumenten
EP1733320A2 (de) 2004-04-03 2006-12-20 Star AG Computergestütztes hilfsmittel (ref-spell-checker) für ein verfahren zur erstellung von dokumenten
GB2415518A (en) 2004-06-24 2005-12-28 Sharp Kk Method and apparatus for translation based on a repository of existing translations
GB2417103A (en) * 2004-08-11 2006-02-15 Sdl Plc Natural language translation system
US8412521B2 (en) * 2004-08-20 2013-04-02 Multimodal Technologies, Llc Discriminative training of document transcription system
US8335688B2 (en) * 2004-08-20 2012-12-18 Multimodal Technologies, Llc Document transcription system training
US7577561B2 (en) * 2004-11-09 2009-08-18 Sony Online Entertainment Llc System and method for generating a target language markup language text template
US7827026B2 (en) * 2004-12-21 2010-11-02 Xerox Corporation Bilingual authoring assistant for the “tip of the tongue” problem
US7680646B2 (en) * 2004-12-21 2010-03-16 Xerox Corporation Retrieval method for translation memories containing highly structured documents
CN100392649C (zh) * 2004-12-31 2008-06-04 北京联动在线通讯科技有限公司 对屏幕显示的特定匹配词语实现快速链接的方法
US8126702B2 (en) * 2005-08-01 2012-02-28 Sap Ag Translating data objects
US8549492B2 (en) * 2006-04-21 2013-10-01 Microsoft Corporation Machine declarative language for formatted data processing
US7831423B2 (en) * 2006-05-25 2010-11-09 Multimodal Technologies, Inc. Replacing text representing a concept with an alternate written form of the concept
US20080086298A1 (en) * 2006-10-10 2008-04-10 Anisimovich Konstantin Method and system for translating sentences between langauges
US8548795B2 (en) * 2006-10-10 2013-10-01 Abbyy Software Ltd. Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
US9645993B2 (en) 2006-10-10 2017-05-09 Abbyy Infopoisk Llc Method and system for semantic searching
US8195447B2 (en) * 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US8145473B2 (en) 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US9633005B2 (en) 2006-10-10 2017-04-25 Abbyy Infopoisk Llc Exhaustive automatic processing of textual information
US9235573B2 (en) 2006-10-10 2016-01-12 Abbyy Infopoisk Llc Universal difference measure
US8214199B2 (en) * 2006-10-10 2012-07-03 Abbyy Software, Ltd. Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9984071B2 (en) 2006-10-10 2018-05-29 Abbyy Production Llc Language ambiguity detection of text
US9047275B2 (en) 2006-10-10 2015-06-02 Abbyy Infopoisk Llc Methods and systems for alignment of parallel text corpora
US8335679B2 (en) * 2006-11-21 2012-12-18 Lionbridge Technologies, Inc. Methods and systems for local, computer-aided translation incorporating translator revisions to remotely-generated translation predictions
US8494834B2 (en) * 2006-11-21 2013-07-23 Lionbridge Technologies, Inc. Methods and systems for using and updating remotely-generated translation predictions during local, computer-aided translation
US8046233B2 (en) * 2006-11-21 2011-10-25 Lionbridge Technologies, Inc. Methods and systems for local, computer-aided translation using remotely-generated translation predictions
US20080177623A1 (en) * 2007-01-24 2008-07-24 Juergen Fritsch Monitoring User Interactions With A Document Editing System
US8959011B2 (en) 2007-03-22 2015-02-17 Abbyy Infopoisk Llc Indicating and correcting errors in machine translation systems
CN101034394B (zh) * 2007-03-30 2010-05-26 传神联合(北京)信息技术有限公司 一种提高翻译效率的系统及方法
US20080312928A1 (en) * 2007-06-12 2008-12-18 Robert Patrick Goebel Natural language speech recognition calculator
US20080313208A1 (en) * 2007-06-14 2008-12-18 International Business Machines Corporation Apparatus, system, and method for automated context-sensitive message organization
US8812296B2 (en) 2007-06-27 2014-08-19 Abbyy Infopoisk Llc Method and system for natural language dictionary generation
JP5186154B2 (ja) * 2007-08-21 2013-04-17 インターナショナル・ビジネス・マシーンズ・コーポレーション プログラムが表示するメッセージの修正を支援する技術
CN101419759B (zh) * 2007-10-26 2011-02-09 英业达股份有限公司 一种应用于全文翻译的语言学习方法及其系统
US9529820B2 (en) * 2008-05-23 2016-12-27 International Business Machines Corporation Automated content tracking and conversion
US9262409B2 (en) 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
US20100049752A1 (en) * 2008-08-22 2010-02-25 Inventec Corporation Dynamic word translation system and method thereof
US20100125446A1 (en) * 2008-11-20 2010-05-20 Wathen Dana L Method for modifying document in data processing device
US8719002B2 (en) 2009-01-15 2014-05-06 International Business Machines Corporation Revising content translations using shared translation databases
KR101542136B1 (ko) 2009-03-31 2015-08-05 삼성전자 주식회사 문자 메시지 작성 방법 및 이를 이용한 휴대 단말기
GB2474839A (en) 2009-10-27 2011-05-04 Sdl Plc In-context exact matching of lookup segment to translation memory source text
US9465782B2 (en) 2010-07-13 2016-10-11 Motionpoint Corporation Dynamic language translation of web site content
US8515977B2 (en) 2010-09-10 2013-08-20 International Business Machines Corporation Delta language translation
US8670973B2 (en) 2010-09-16 2014-03-11 International Business Machines Corporation Language translation reuse in different systems
WO2012079257A1 (zh) * 2010-12-17 2012-06-21 北京交通大学 机器翻译装置和方法
US9244902B2 (en) * 2011-10-20 2016-01-26 Zynga, Inc. Localization framework for dynamic text
US8983825B2 (en) * 2011-11-14 2015-03-17 Amadou Sarr Collaborative language translation system
WO2013102052A1 (en) * 2011-12-28 2013-07-04 Bloomberg Finance L.P. System and method for interactive automatic translation
US9292498B2 (en) 2012-03-21 2016-03-22 Paypal, Inc. Device orientation based translation system
US9141606B2 (en) 2012-03-29 2015-09-22 Lionbridge Technologies, Inc. Methods and systems for multi-engine machine translation
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
KR20140011073A (ko) * 2012-07-17 2014-01-28 삼성전자주식회사 텍스트 추천 방법 및 장치
EP2901303A4 (en) * 2012-09-25 2016-06-01 Moneydesktop Inc ROUTING AGGREGATION SOURCE
US9588675B2 (en) 2013-03-15 2017-03-07 Google Inc. Document scale and position optimization
CN103455477B (zh) * 2013-09-09 2016-04-06 高晋愚 一种用于辅助翻译的术语统一方法
RU2592395C2 (ru) 2013-12-19 2016-07-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Разрешение семантической неоднозначности при помощи статистического анализа
RU2586577C2 (ru) 2014-01-15 2016-06-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Фильтрация дуг в синтаксическом графе
RU2596600C2 (ru) 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений
US9626358B2 (en) 2014-11-26 2017-04-18 Abbyy Infopoisk Llc Creating ontologies by analyzing natural language texts
US9881003B2 (en) * 2015-09-23 2018-01-30 Google Llc Automatic translation of digital graphic novels
US9692815B2 (en) 2015-11-12 2017-06-27 Mx Technologies, Inc. Distributed, decentralized data aggregation
US9959272B1 (en) * 2017-07-21 2018-05-01 Memsource a.s. Automatic classification and translation of written segments
US20190050376A1 (en) * 2017-08-10 2019-02-14 Sap Se Automatic value formatting based on intrinsic structural semantics
CN107391500A (zh) * 2017-08-21 2017-11-24 阿里巴巴集团控股有限公司 文本翻译方法、装置及设备
US10803257B2 (en) * 2018-03-22 2020-10-13 Microsoft Technology Licensing, Llc Machine translation locking using sequence-based lock/unlock classification
CN108763228A (zh) * 2018-05-21 2018-11-06 王伟宙 一种自然语言辅助处理系统
CN111310481B (zh) * 2020-01-19 2021-05-18 百度在线网络技术(北京)有限公司 语音翻译方法、装置、计算机设备和存储介质
CN112364669B (zh) * 2020-10-14 2021-09-03 北京中科凡语科技有限公司 机器翻译译后的术语翻译方法、装置、设备及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1988002516A1 (en) * 1986-10-03 1988-04-07 British Telecommunications Public Limited Company Language translation system
US5224040A (en) * 1991-03-12 1993-06-29 Tou Julius T Method for translating chinese sentences
JPH05135095A (ja) * 1991-11-12 1993-06-01 Toshiba Corp 翻訳システム
JPH05197746A (ja) * 1992-01-22 1993-08-06 Nec Corp 翻訳支援装置
JPH0635962A (ja) * 1992-07-21 1994-02-10 Matsushita Electric Ind Co Ltd 機械翻訳装置
JPH08501166A (ja) * 1992-09-04 1996-02-06 キャタピラー インコーポレイテッド 総合オーサリング及び翻訳システム
DE69430421T2 (de) * 1994-01-14 2003-03-06 Sun Microsystems Inc Verfahren und Gerät zur Automatisierung der Umgebungsanpassung von Rechnerprogrammen
US5995920A (en) * 1994-12-22 1999-11-30 Caterpillar Inc. Computer-based method and system for monolingual document development
JPH09259126A (ja) * 1996-03-21 1997-10-03 Sharp Corp データ処理装置
JPH1097530A (ja) * 1996-07-22 1998-04-14 Fujitsu Ltd 日付変換方法および日付変換機能を備えた文書処理装置並びに文書処理プログラムを記録した記録媒体

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9600472B2 (en) 1999-09-17 2017-03-21 Sdl Inc. E-services translation utilizing machine translation and translation memory
US10216731B2 (en) 1999-09-17 2019-02-26 Sdl Inc. E-services translation utilizing machine translation and translation memory
US10198438B2 (en) 1999-09-17 2019-02-05 Sdl Inc. E-services translation utilizing machine translation and translation memory
US10248650B2 (en) 2004-03-05 2019-04-02 Sdl Inc. In-context exact (ICE) matching
US9342506B2 (en) 2004-03-05 2016-05-17 Sdl Inc. In-context exact (ICE) matching
US9400786B2 (en) 2006-09-21 2016-07-26 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US8935150B2 (en) 2009-03-02 2015-01-13 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US8935148B2 (en) 2009-03-02 2015-01-13 Sdl Plc Computer-assisted natural language translation
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US11321540B2 (en) 2017-10-30 2022-05-03 Sdl Inc. Systems and methods of adaptive automated translation utilizing fine-grained alignment
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11475227B2 (en) 2017-12-27 2022-10-18 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation

Also Published As

Publication number Publication date
CA2331184C (en) 2009-07-14
JP2008152760A (ja) 2008-07-03
MXPA00010835A (es) 2002-05-07
EP1076861A1 (en) 2001-02-21
WO1999057651A1 (en) 1999-11-11
AU761311B2 (en) 2003-06-05
US7020601B1 (en) 2006-03-28
CA2331184A1 (en) 1999-11-11
DE69925831D1 (de) 2005-07-21
CN1308748A (zh) 2001-08-15
DE69925831T2 (de) 2005-10-27
CN1179289C (zh) 2004-12-08
EP1076861B1 (en) 2005-06-15
AU3825999A (en) 1999-11-23
ATE298111T1 (de) 2005-07-15

Similar Documents

Publication Publication Date Title
JP2002513970A (ja) マシンアシスト翻訳ツール
US5646840A (en) Language conversion system and text creating system using such
US5850561A (en) Glossary construction tool
JP4504555B2 (ja) 翻訳支援システム
US6081774A (en) Natural language information retrieval system and method
US6092035A (en) Server device for multilingual transmission system
US6356894B2 (en) Document searching method for multilingual documents and storage medium therefore
EP0361464A2 (en) Method and apparatus for producing an abstract of a document
US20060004560A1 (en) Method and apparatus for translation based on a repository of existing translations
US20060111893A1 (en) Display of results of cross language search
JP2002215617A (ja) 品詞タグ付けをする方法
US5289376A (en) Apparatus for displaying dictionary information in dictionary and apparatus for editing the dictionary by using the above apparatus
JP2838984B2 (ja) 汎用参照装置
Ahmad et al. Terminology management: a corpus-based approach
JP2001101207A (ja) 文書要約装置
Bernth et al. Terminology extraction for global content management
JPH10149364A (ja) 訳語選択装置と記憶媒体
JP2000029882A (ja) 要約文作成装置
Boitet Gradable quality translations through mutualization of human translation and revision, and UNL-based MT and coedition
Ide et al. Background and context for the development of a Corpus Encoding Standard
JP2002183134A (ja) 翻訳装置
Boitet New architectures for" democratic" tunable quality MT systems
JPH05225232A (ja) テキスト自動前編集装置
JP2000242643A (ja) 英文作成支援装置及び方法並びに記憶媒体
JP2006163769A (ja) 利用者辞書作成システム、利用者辞書作成装置、利用者辞書作成方法及びプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20051209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20051209

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070109

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070409

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070501

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071001