JP2011095841A - 文脈内正確(ice)一致 - Google Patents
文脈内正確(ice)一致 Download PDFInfo
- Publication number
- JP2011095841A JP2011095841A JP2009246729A JP2009246729A JP2011095841A JP 2011095841 A JP2011095841 A JP 2011095841A JP 2009246729 A JP2009246729 A JP 2009246729A JP 2009246729 A JP2009246729 A JP 2009246729A JP 2011095841 A JP2011095841 A JP 2011095841A
- Authority
- JP
- Japan
- Prior art keywords
- context
- match
- level
- source
- ice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 claims abstract description 179
- 238000000034 method Methods 0.000 claims abstract description 71
- 230000015654 memory Effects 0.000 claims abstract description 56
- 238000012913 prioritisation Methods 0.000 claims description 17
- 230000014616 translation Effects 0.000 description 157
- 230000008569 process Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 12
- 238000007726 management method Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 230000007958 sleep Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000004438 eyesight Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000004064 recycling Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004870 electrical engineering Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Abstract
【解決手段】本発明は、複数のソーステキスト内のルックアップセグメントに関するすべての正確一致を判定し、少なくとも1つの正確一致が判定される場合に、ルックアップセグメントの文脈がそれぞれの正確一致の文脈と一致する場合に、それぞれの正確一致がルックアップセグメントの文脈内正確一致であると判定する。必要な文脈マッチングの度合は、事前に決定することができ、結果に優先順位を付けることができる。本発明は、文脈を含めて、翻訳メモリにソーステキスト及びターゲットテキストの翻訳対を格納する方法、システム、及びプログラム製品、並びにそのように形成された翻訳メモリをも含む。内容が、以前に翻訳された内容と同一に翻訳され、翻訳者介入を減らす。
【選択図】図1
Description
複数のソーステキスト内のルックアップセグメントのすべての正確一致を判定するステップと、
少なくとも1つの正確一致が判定される場合に、ルックアップセグメントの文脈がそれぞれの正確一致の文脈と一致する場合にそれぞれの正確一致がルックアップセグメントの文脈内正確(in−context exact、ICE)一致であると判定するステップと
を含み、文脈が、少なくとも2つのレベルを含み、
少なくとも2つのレベルが、ソース使用文脈レベル及びターゲット使用文脈レベルを含む
方法が提供される。したがって、翻訳メモリが、特定のルックアップセグメントの出現について検索されるときに、複数の正確一致が見つかる場合には、本発明は、複数の正確一致の間での曖昧性除去を可能にする。曖昧性除去は、正確一致のそれぞれの文脈と比較したルックアップセグメントの文脈に従って実行される。あるセグメントの少なくとも1つの文脈レベルがルックアップセグメントの文脈レベルと一致する場合に、そのセグメントは、ICE一致である。ICE一致は、非ICE一致より関連する傾向がある。ICE一致を、ソース言語のソース使用文脈レベル及び/又はターゲット言語のターゲット使用文脈レベルなど、文脈の異なるレベルに従って識別することができる。
ソース使用文脈レベルが、先行ソース使用文脈レベルを含み、ターゲット文脈使用レベルが、先行ターゲット使用文脈レベルを含み、
ルックアップセグメントの先行ソース使用文脈レベル及び/又は先行ターゲット使用文脈レベルと一致する先行ソース使用文脈レベル及び/又は先行ターゲット使用文脈レベルを有するICE一致が、ルックアップセグメントの構造的文脈レベルと一致する構造的文脈レベルのみを有するICE一致より高い度合の文脈マッチングがあるとされる。一致する先行ソース使用文脈レベル及び先行ターゲット使用文脈レベルを用いる翻訳は、構造的文脈マッチングだけを用いる翻訳より関連する傾向があり、したがって、前者は、後者より高い優先順位を与えられる。
複数のソーステキスト内のルックアップセグメントのすべての正確一致を判定する手段と、
少なくとも1つの正確一致が判定される場合に、ルックアップセグメントの文脈がそれぞれの正確一致の文脈と一致する場合にそれぞれの正確一致がルックアップセグメントの文脈内正確(ICE)一致であると判定する手段と
を備え、文脈が、少なくとも2つのレベルを含み、
少なくとも2つのレベルが、ソース使用文脈レベル及びターゲット使用文脈レベルを含む
システムが提供される。
翻訳単位に文脈を割り当てるステップであって、文脈が、少なくとも2つのレベルを含み、少なくとも2つのレベルが、ソース使用文脈レベル及びターゲット使用文脈レベルを含む、ステップと、
翻訳単位と共に文脈を格納するステップと
を含む方法が提供される。
翻訳単位に文脈を割り当てる手段であって、文脈が、少なくとも2つのレベルを含み、少なくとも2つのレベルが、ソース使用文脈レベル及びターゲット使用文脈レベルを含む、手段と、
翻訳単位と共に文脈を格納する手段と
を含むシステムが提供される。
ソーステキストごとの文脈識別子と、
を備え、文脈識別子が、ソース使用文脈部分及びターゲット使用文脈部分を含む
翻訳メモリが提供される。
翻訳システムによって翻訳されるセグメントにセグメント識別子を割り当てる手段であって、セグメント識別子が、セグメントのソース使用文脈及びターゲット使用文脈を示す、手段と、
翻訳メモリの一部としての格納のためにセグメント識別子割当を通信する手段と
を備えるクライアント側システムが提供される。
複数のソーステキスト内のルックアップセグメントのすべてのファジイ一致を判定するステップと、
少なくとも1つのファジイ一致が判定される場合に、ルックアップセグメントの文脈がそれぞれのファジイ一致の文脈と一致する場合に、それぞれのファジイ一致がルックアップセグメントの文脈内ファジイ一致であると判定することと
を含む方法が提供される。
複数のソーステキスト内のルックアップセグメントのすべてのファジイ一致を判定する手段と、
少なくとも1つのファジイ一致が判定される場合に、ルックアップセグメントの文脈がそれぞれのファジイ一致の文脈と一致する場合に、それぞれのファジイ一致がルックアップセグメントの文脈内ファジイ一致であると判定する手段と
を含むシステムが提供される。
「資産」は、たとえば文脈、使用、サイズなどによる、関連する内容の束縛された集合又はテキストセグメントのグループ化を定義する内容ソースを意味する。一般に、資産は、ハイパーテキストマークアップ言語(HTML)ファイル、Microsoft(登録商標)Word(登録商標)文書、又は単純なテキストファイルなど、文書に関連付けられる。しかし、一部の資産は、ファイルシステムファイルに対応しない。資産を、実際に、データベーステーブルの列又はextensible markup language(XML)リポジトリ内の構造体から定義することができる。物理的にどのように表されるかにはかかわりなく、資産は、すべて、共通の目的すなわち、アクセスでき、操作でき、最終的に翻訳できる関連する内容の束縛された集合を定義することを共有する。資産は、内容、フォーマッティング情報、及び資産の性質に依存する内部構造化データを含むことができる。
本発明は、なかんずく、翻訳されるルックアップセグメントへの翻訳メモリに格納された複数のソーステキストのマッチングレベルを判定する方法、システム、及びプログラム製品を提供する。本発明は、翻訳メモリ(TM)内の以前に格納された翻訳からのソース内容に関する高品質一致を生成する。関連技術では、入手可能な最良一致は、正確一致すなわち、ソーステキストがTM内の1つ又は複数のエントリと同一である一致であった。しかし、所与のセグメントについて最良の正確一致を正確に選択し、又は所与の正確一致がそれが適用されている文脈に関する適切な一致であったかどうかを検証する、自動化されたプロセスはない。具体的に言うと、あるセグメントが、異なる状況又は文脈の下で異なって翻訳される場合がある。正確一致の適切性は、文脈情報の評価を必要とし、この文脈情報は、内容使用(それを取り巻く文又はセグメントによって定義される)、構造的文脈、資産文脈(所期の聴衆に応じて異なる言葉遣いを必要とする場合がある)、及び/又は領域識別子、顧客名などのメタデータ、若しくはシステムのユーザによって供給されるか自動的に生成されるか以前の翻訳プロジェクトから抽出される他の情報に基づくものとすることができる。
添付図面を参照すると、図1は、本発明による文脈内正確一致翻訳システム100のブロック図である。システム100が別々のシステムとして図示されているが、これを、Idiom社のWorldServer(商標)などのより大きい内容管理システム又は翻訳システムの一部として実施できることを了解されたい。これに関して、システム100の説明が、翻訳システムのある種の機能性を含むが、説明を明瞭にするために他の機能性を省略する場合がある。さらに、システム100は、クライアント−サーバ(たとえば、ウェブベースの)環境で図示されているが、他の構成も可能であることを了解されたい。
図2A〜Bに移り、本発明の動作方法論の一実施形態の流れ図をこれから説明する。図2A〜Bの議論は、図1、3、及び4と共に行われる。
図2Aから始めると、予備ステップPSとして、一実施形態で、ルックアップセグメント154が、直接にリンクされた或いはあるタイプのネットワーク、たとえばLAN、WAN、又はインターネットによってリンクされたクライアントコンピュータシステム150によってICE一致システム100にロードされる。たとえば、ルックアップセグメント154を、ICE一致システム100がその一部であるものとすることができる、翻訳ワークフローアプリケーションサーバ(図示せず)、たとえばIdiom社のWorldServer(商標)を介してロードすることができる。ルックアップセグメント154を、より大きい資産の一部としてロードすることができる。この場合に、システム100は、たとえばIdiom社のWorldServer(商標)によって提供されるように、ルックアップセグメント154を作成する現在既知の又は今後に開発される任意の形でより大きい資産のセグメント化を行うことができる。セグメント化は、それを介して資産の内容が解析され翻訳可能セグメントとして公開されるプロセスである。セグメントのサイズは、セグメント化ルールに依存し、セグメント化ルールは、ユーザ定義とすることができる。
ステップS1〜S12は、ルックアップセグメント154ごとの分析を表す。
図3を参照し、例示的なルックアップセグメント154がテキスト「team of visionaries」を含み、これがフランス語に翻訳されなければならないと仮定する。また、ルックアップセグメント「team of visionaries」が、333のLS先行UCハッシュコード及び4444のLS後UCハッシュコードを有すると仮定し、666666の資産文脈を仮定する(図3のすべてのハッシュコードが、図を明瞭にするために単純化されていることを理解されたい)。図3に示されているように、正確一致デターミナ130は、フランス語に翻訳された時のルックアップセグメント「team of visionaries」の4つの正確一致すなわち1)e’quipe de visionnaires、2)groupe de visionnaires、3)bande des visionnaires、及び4)groupe de futurologuesを判定するはずである。ICE一致エバリュエータ144は、正確一致を再検討し、図3に示されているように、ルックアップセグメント「team of visionaries」がフランス語に翻訳される時に、ソーステキスト「groupe de visionnaires」が、同一の資産文脈170及び使用文脈(ハッシュコード)172、174を有するので、同一の文脈を有すると判定するはずである。したがって、「groupe de visionnaires」は、ICE一致になるはずである。他のソーステキストは、ルックアップセグメント「team of visionaries」の少なくとも1つの文脈コードを有しないので、ICE一致としての資格を有しないはずである。
図3を参照し、例示的なルックアップセグメント154が、テキスト「global enterprises」を含み、これがドイツ語に翻訳されなければならないと仮定する。また、ルックアップセグメント「global enterprises」が、1234のLS先行UCハッシュコード及び4321のLS後UCハッシュコードを有すると仮定し、7890の資産文脈を仮定する。図3に示されているように、正確一致デターミナ130は、ドイツ語に翻訳された時のルックアップセグメント「global enterprises」の3つの正確一致すなわち、1)globale Wesen、2)globale Unternehmen、及び3)globale Geschaefteを判定するはずである。1つの使用文脈レベルだけが、正確一致がICE一致になるために必要であると仮定すると、ICE一致エバリュエータ144は、正確一致を再検討し、図3に示されているように、ルックアップセグメント「global enterprises」がドイツ語に翻訳される時に、ソーステキスト「globale Wesen」及び「globale Unternehmen」が、それぞれLS UCハッシュコードの1つと一致する1つのUCハッシュコードを有するので、同一の文脈を有すると判定するはずである。すなわち、「globale Wesen」は、ルックアップセグメントと同一の前(先行)ソースUCハッシュコードを有し、「globale Untemehmen」は、ルックアップセグメントと同一の後ソースUCハッシュコードを有する。他のソーステキストは、ルックアップセグメント「global enterprises」の少なくとも1つの文脈レベルを有しないので、ICE一致としての資格を有しないはずである。システム100が複数のICE一致にどのように優先順位を付けるかの詳細を、下で説明する。
ソース1(s1) 構造化文脈=見出しテキスト「Print the document」
ターゲット1(t1) 構造化文脈=見出しテキスト「Das Dokument ausdrucken」
この場合に、見出し構造的文脈(翻訳単位内のソースセグメントとターゲットセグメントとの両方について同一)において、ドイツ語翻訳は、翻訳において不定詞(非命令法)形を使用する。
ソース2(s2) 構造的文脈=指示リスト「Print the document」
ターゲット2(t2) 構造的文脈=指示リスト「Drucken Sie das Dokument aus」
図2Bを参照すると、ステップS11〜12は、複数のICE一致がステップS5で判定される状況すなわちステップS9のYESに対処するオプションのステップを表す。一実施形態(図示せず)で、ICE一致デターミナ130は、単純に、ユーザがICE一致のリストからICE一致を選択することを可能にすることができる。しかし、これは、ICE一致の1つの目的すなわち、正確一致を妥当性検査する必要がないことをくつがえすので、好ましくはない。図2Bに示された好ましい実施形態では、複数のICE一致が判定される場合に、ICE一致プライオリタイザ146は、ステップS11で、文脈一致の度合に従って各ICEに優先順位を付ける(ランキングする)。上で説明したように、「文脈マッチングの度合」は、事前に決定されるものとすることができる。このステップは、文脈マッチングの各ICE一致度合に優先順位を付け、ステップS12で、選択のためにユーザにICE一致を提示するか、最高ランキングのICE一致を自動的に選択するかのいずれかを行う。複数ICE一致に優先順位を付けるさまざまな定式が、文脈レベルの個数に依存して可能であることを理解されたい。1つ又は複数の固定された定式の代替又はそれへの追加として、最適の(又は他の形で許容可能な)優先順位付けに、学習プロセスを介して到達することができ、ここで、所与のトレーニングコーパスから、又は所定の期間にわたる以前の翻訳プロジェクトからの出力若しくは生翻訳プロジェクトからの部分からの観察された結果が、異なる文脈レベルの優先順位付けを調整するのに使用される。
文脈が、使用文脈レベル及び資産文脈レベルを含み、ルックアップセグメント「team of visionaries」が、図4に示されているようにソース文書180に基づいて図3のTM 128を使用してフランス語に翻訳されなければならないと仮定する。この場合に、「team of visionaries」は、以前に格納された翻訳に基づいて、4つの正確一致すなわち、1)e’quipe de visionnaires、2)groupe de visionnaires、3)bande des visionnaires、及び4)groupe de futurologuesを有する。また、ルックアップセグメント「team of visionaries」が、LS前ソースUCハッシュコード333、LS後ソースUCハッシュコード4444、及び資産コード666666を有すると仮定する。また、正確一致がICE一致デターミナ132によってICE一致として示されるために、1つの文脈レベルだけがルックアップセグメントの文脈レベルと一致する必要があると仮定する。この場合に、各正確一致は、ICE一致である。具体的に言うと、1)「e’quipe de visionnaires」は、一致する前ソースUCハッシュコード及び資産コードを有し、2)「groupe de visionnaires」は、すべての一致する文脈レベルを有し、3)「bande des visionnaires」は、一致する資産コードを有し、4)「groupe de futurologues」は、一致する後ソースUCハッシュコードを有する。
ルックアップセグメントと同一のソースUCハッシュコード及びターゲットUCハッシュコードのみを有するICE一致よりも、ルックアップセグメントと同一のソースUCハッシュコードとターゲットUCハッシュコードとの両方並びに同一の構造的文脈一致を有するICE一致が優先される。
ルックアップセグメントと同一のソースUCハッシュコードだけを有するICE一致よりも、ルックアップセグメントと同一のソースUCハッシュコードとターゲットUCハッシュコードとの両方を有するICE一致が優先される。
ルックアップセグメントの後ソース使用文脈レベル又は後ターゲット使用文脈レベルと一致するそれらのレベルのいずれかのみを有するICE一致よりも、ルックアップセグメントの先行ソース使用文脈レベル又は先行ターゲット使用文脈レベルと一致するそれらのレベルのいずれかを有するICE一致が優先される。
ルックアップセグメントのハッシュコードと一致する1つのソースUCだけを有する正確一致が、ICE一致(「部分一致と称する)と考えられると仮定すると、部分一致よりも、ルックアップセグメントと同一の前ソースUCハッシュコードと後ソースUCハッシュコードとの両方を有するICE一致(「フルソースUC一致」と称する)が優先される。言い換えると、ルックアップセグメントの前ソースUCレベル及び後ソースUCレベルと一致する前ソースUCレベルと後ソースUCレベルとの両方を有するICE一致が、ルックアップセグメントの前ソースUCレベル又は後ソースUCレベルと一致する前ソースUCレベル及び後ソースUCレベルの一方だけを有するICE一致より優先される。たとえば、ICE一致2)「groupe de visionnaires」は、これがルックアップセグメントと一致する前UCハッシュコード(333)及び後UCハッシュコード(4444)を有するので、他のすべてより優先される。
この場合に、複数のICE一致を、上で説明した部分一致よりフル一致を優先することによって区別することはできない、すなわち、第1優先は、非決定的であり、資産コードに基づいて、ルックアップセグメントと同一の資産からのICE一致が優先される。言い換えると、第1優先が非決定的である場合に、ルックアップセグメントと同一の資産からのICE一致が、異なる資産からのICE一致よりも優先される。この例では、ICE一致1)「e’quipe de visionnaires」及び4)「groupe de futurologues」は、両方とも部分ICE一致であるが、ICE一致1)「e’quipe de visionnaires」は、ルックアップセグメントと同一の資産「666666」からであり、これが優先されるはずである。
この優先順位付けは、ルックアップセグメント154が、単一のソース資産180内の多数の位置に存在し、その結果として複数のICE一致が特定の資産について存在する状況に対処するものである。たとえば、図4に、ルックアップセグメント「team of visionaries」154A、154Bの2つの出現を含むソース資産180を示す。この場合に、ICE一致プライオリタイザ146は、特定のルックアップセグメントの資産内の位置を評価し、同一資産からの他のICE一致よりも、ルックアップセグメントの資産内の位置に最も近いICE一致を優先する。言い換えると、第2優先が非決定的である場合に、資産内のルックアップセグメントの位置に最も近い位置を有するICE一致が、他のICE一致よりも優先される。位置のこの評価は、特定の資産内のルックアップセグメントの任意の回数の繰り返しについて繰り返すことができる。
上で説明した本発明の実施形態は、主に、ソース使用文脈レベルである使用文脈レベルすなわち、ソース言語の翻訳されるテキストを取り巻くテキストに関連する使用文脈を含む。しかし、本発明の他の実施形態は、ターゲット使用文脈レベルである使用文脈レベルすなわち、ターゲット言語の翻訳されるテキストの翻訳を取り巻くテキストに関連する使用文脈を含む。
The cat sleeps. It is cute. It purrs.
という3つの文の形の3つのセグメントを含むとする。
TMエントリに関する文脈情報の存在は、システム100動作のために必要である。したがって、本発明の実施態様は、TMに追加されるすべての新しい翻訳と共に文脈情報が格納されることを必要とする。これは、以前に翻訳された文書へのアクセスを必要とせずに、ルックアップセグメントの文脈情報を以前に翻訳されたセグメントの文脈情報と効率的に比較することを可能にする。
上で説明した発明は、ソース内容をTMの内容と完全に照合する能力を翻訳者に与え、ソース内容をTMに関して妥当性検査する必要を軽減し、真に再利用可能なTMシステムを作成することによって、翻訳者に価値を提供し、これによって、より効率的な翻訳プロセスを可能にする。
102 コンピュータ
112 メモリ
114 処理ユニット
116 I/Oインターフェース
118 バス
120 I/Oデバイス
122 ストレージシステム
128 翻訳メモリ
130 正確一致デターミナ
132 ICE一致デターミナ
133 ハッシュアルゴリズム
134 ファジイ一致デターミナ
136 TMジェネレータ
138 セグメントリトリーバ
140 他のシステム構成要素
142 文脈アイデンティファイヤ
144 ICE一致エバリュエータ
146 ICE一致プライオリタイザ
148 TMエントリ
150 クライアント側システム
152 ソーステキスト
154 ルックアップセグメント
162 ターゲットテキスト
164 ターゲットテキスト
166 文脈識別
168 ソース使用文脈部分
170 資産文脈部分
172 先行UCハッシュコード
174 後UCハッシュコード
180 ソース資産
190 直接に先行するセグメント
192 直接に続くセグメント
200 SIDアサイナ
202 コミュニケータ
Claims (35)
- 翻訳されるルックアップセグメントに対する翻訳メモリに格納された複数のソーステキストのマッチングレベルを判定する方法であって、
前記複数のソーステキスト内の前記ルックアップセグメントのすべての正確一致を判定するステップと、
少なくとも1つの正確一致が判定される場合に、前記ルックアップセグメントの文脈がそれぞれの正確一致の文脈と一致するとき、前記それぞれの正確一致が前記ルックアップセグメントの文脈内正確(ICE)一致であると判定するステップと
を含み、
前記文脈が、少なくとも2つのレベルを含み、
前記少なくとも2つのレベルが、ソース使用文脈レベル及びターゲット使用文脈レベルを含む、方法。 - 複数のICE一致が判定される場合に、ICE一致を判定する前記ステップが、より適切なICE一致が1つ又は複数の他のICE一致より優先され得るようにするために、文脈マッチングの度合に従って各ICE一致に優先順位を付けることを含む、請求項1に記載の方法。
- 前記ルックアップセグメントのソース使用文脈レベルとターゲット使用文脈レベルとの両方と一致するソース使用文脈レベルとターゲット使用文脈レベルとの両方とを有するICE一致が、前記ルックアップセグメントのソース使用文脈レベルと一致するソース使用文脈レベルのみを有するICE一致より高い度合の文脈マッチングがあるとされる、請求項1又は2に記載の方法。
- 前記ルックアップセグメントのターゲット使用文脈レベルと一致するターゲット使用文脈レベルを有するICE一致が、前記ルックアップセグメントのソース使用文脈レベルと一致するソース使用文脈レベルのみを有するICE一致より高い度合の文脈マッチングがあるとされる、請求項1〜3のいずれか一項に記載の方法。
- 前記ソース使用文脈レベルが、先行ソース使用文脈レベルを含み、及び/又は前記ターゲット文脈使用レベルが、先行ターゲット使用文脈レベルを含む、請求項1〜4のいずれか一項に記載の方法。
- 前記ソース使用文脈レベルが、後ソース使用文脈レベルを含み、及び/又は前記ターゲット文脈使用レベルが、後ターゲット使用文脈レベルを含む、請求項1〜5のいずれか一項に記載の方法。
- 前記少なくとも2つのレベルが、構造的文脈レベルを含む、請求項1〜6のいずれか一項に記載の方法。
- 複数のICE一致が判定される場合に、ICE一致を判定する前記ステップが、より適切なICE一致が1つ又は複数の他のICE一致より優先され得るようにするために、文脈マッチングの度合に従って各ICE一致に優先順位を付けるステップを含み、
前記ソース使用文脈レベルが、先行ソース使用文脈レベルを含み、前記ターゲット文脈使用レベルが、先行ターゲット使用文脈レベルを含み、
前記ルックアップセグメントの先行ソース使用文脈レベル及び/又は先行ターゲット使用文脈レベルと一致する先行ソース使用文脈レベル及び/又は先行ターゲット使用文脈レベルを有するICE一致が、前記ルックアップセグメントの構造的文脈レベルと一致する構造的文脈レベルのみを有するICE一致より高い度合の文脈マッチングがあるとされる、請求項1〜7のいずれか一項に記載の方法。 - ICE一致を判定する前記ステップは、前記ルックアップセグメントの複数の文脈レベルがそれぞれの正確一致の文脈レベルと一致する場合に限って、前記それぞれの正確一致が前記ルックアップセグメントのICE一致であることを示す、請求項1〜8のいずれか一項に記載の方法。
- ICE一致を判定する前記ステップは、前記ルックアップセグメントの少なくとも1つの使用文脈レベル及び構造的文脈レベルがそれぞれの正確一致の少なくとも1つの使用文脈レベル及び構造的文脈レベルと一致する場合に限って、前記それぞれの正確一致が前記ルックアップセグメントのICE一致であることを示す、請求項1〜9のいずれか一項に記載の方法。
- 前記少なくとも1つの使用文脈レベルが、先行ターゲット使用文脈レベルを含む、請求項10に記載の方法。
- 前記少なくとも1つの使用文脈レベルが、先行ソース使用文脈レベルを含む、請求項10に記載の方法。
- 複数のICE一致が判定される場合に、ICE一致を判定する前記ステップが、より適切なICE一致が1つ又は複数の他のICE一致より優先され得るようにするために、文脈一致の度合に従って各ICE一致に優先順位を付けるステップを含み、
前記優先順位を付けるステップが、
前記ルックアップセグメントのソース使用文脈レベル、ターゲット使用文脈レベル、及び構造文脈レベルと一致するソース使用文脈レベル、ターゲット使用文脈レベル、及び構造文脈レベルを有するICE一致を第1に優先するステップ
を含む、請求項1〜12のいずれか一項に記載の方法。 - 第1に優先する前記ステップが、非決定的である場合に、前記ルックアップセグメントのソース使用文脈レベル及びターゲット使用文脈レベルと一致するソース使用文脈レベル及びターゲット使用文脈レベルを有するICE一致を第2に優先するステップを含む、請求項13に記載の方法。
- 前記ソース文脈レベルが、先行ソース使用文脈レベルであり、前記ターゲット使用文脈レベルが、先行ターゲット使用文脈レベルである、請求項13又は14に記載の方法。
- 第2に優先する前記ステップが、非決定的である場合に、前記ルックアップセグメントの後ソース使用文脈レベル又は後ターゲット使用文脈レベルと一致する後ソース使用文脈レベル又は後ターゲット使用文脈レベルのいずれかのみを有するICE一致よりも、前記ルックアップセグメントの先行ソース使用文脈レベル又は先行ターゲット使用文脈レベルと一致する先行ソース使用文脈レベル又は先行ターゲット使用文脈レベルのいずれかを有するICE一致を第3に優先するステップを含む、請求項14に記載の方法。
- 第3に優先する前記ステップが、非決定的である場合に、前記ルックアップセグメントの構造的文脈レベルと一致する構造的文脈レベルのみを有するICE一致よりも、前記ルックアップセグメントの任意の使用文脈レベルと一致する使用文脈レベルを有するICE一致を第4に優先するステップを含む、請求項16に記載の方法。
- 第4に優先する前記ステップが、非決定的である場合に、前記ルックアップセグメントの構造的文脈レベルとは異なる構造的文脈レベルを有するICE一致よりも、前記ルックアップセグメントの構造的文脈レベルと一致する構造的文脈レベルを有するICE一致を第5に優先するステップを含む、請求項17に記載の方法。
- 第5に優先する前記ステップが、非決定的である場合に、資産内の前記ルックアップセグメントの位置に最も近い位置を有するICE一致を第6に優先するステップを含む、請求項18に記載の方法。
- ユーザが優先順位付けに基づいて前記ICE一致を選択することを可能にするステップをさらに含む、請求項2〜19のいずれか一項に記載の方法。
- 前記ルックアップセグメントが、内容に関して実質的に同一である複数のルックアップセグメントを含み、
ICE一致を判定する前記ステップが、ルックアップセグメントごとにICE一致を判定するステップを含む、請求項1〜20のいずれか一項に記載の方法。 - 前記少なくとも1つのルックアップセグメントが、少なくとも1つの他のルックアップセグメントとは異なるICE一致を有する、請求項21に記載の方法。
- 翻訳されるルックアップセグメントに対する翻訳メモリに格納された複数のソーステキストのマッチングレベルを判定するシステムであって、
前記複数のソーステキスト内の前記ルックアップセグメントのすべての正確一致を判定する手段と、
少なくとも1つの正確一致が判定される場合に、前記ルックアップセグメントの文脈がそれぞれの正確一致の文脈と一致するとき、前記それぞれの正確一致が前記ルックアップセグメントの文脈内正確(ICE)一致であると判定する手段と
を備え、
前記文脈が、少なくとも2つのレベルを含み、
前記少なくとも2つのレベルが、ソース使用文脈レベル及びターゲット使用文脈レベルを含む、システム。 - 翻訳メモリ内にソーステキスト及びターゲットテキストの翻訳単位を格納する方法であって、
前記翻訳単位に文脈を割り当てるステップであって、前記文脈が、少なくとも2つのレベルを含み、前記少なくとも2つのレベルが、ソース使用文脈レベル及びターゲット使用文脈レベルを含む、ステップと、
前記翻訳単位と共に前記文脈を格納するステップと
を含む方法。 - 翻訳メモリ内にソーステキスト及びターゲットテキストの翻訳単位を格納するシステムであって、
前記翻訳単位に文脈を割り当てる手段であって、前記文脈が、少なくとも2つのレベルを含み、前記少なくとも2つのレベルが、ソース使用文脈レベル及びターゲット使用文脈レベルを含む、手段と、
前記翻訳単位と共に前記文脈を格納する手段と
を含むシステム。 - ルックアップセグメントとの比較のための複数のソーステキストと、
ソーステキストごとの文脈識別子と、
を備え、前記文脈識別子が、ソース使用文脈部分及びターゲット使用文脈部分を含む、翻訳メモリ。 - 前記ソース使用文脈部分及び/又はターゲット使用文脈部分が、先行使用文脈部分及び/又は後使用文脈部分を備える、請求項26に記載の翻訳メモリ。
- 前記文脈識別子が、構造的文脈部分を備える、請求項26又は27に記載の翻訳メモリ。
- 翻訳メモリを含む翻訳システムと対話するクライアント側システムであって、
前記翻訳システムによって翻訳されるセグメントにセグメント識別子を割り当てる手段であって、前記セグメント識別子が、前記セグメントのソース使用文脈及びターゲット使用文脈を示す、手段と、
前記翻訳メモリの一部としての格納のために前記セグメント識別子割当を通信する手段と
を備えるクライアント側システム。 - 前記セグメント識別子が、構造的文脈を備える、請求項29に記載のクライアント側システム。
- 翻訳されるルックアップセグメントに対する翻訳メモリに格納された複数のソーステキストのマッチングレベルを判定する方法であって、
前記複数のソーステキスト内の前記ルックアップセグメントのすべてのファジイ一致を判定するステップと、
少なくとも1つのファジイ一致が判定される場合に、前記ルックアップセグメントの文脈がそれぞれのファジイ一致の文脈と一致するとき、前記それぞれのファジイ一致が前記ルックアップセグメントの文脈内ファジイ一致であると判定するステップと
を含む方法。 - 前記判定されたファジイ一致が、同一の度合のファジイマッチングを有するファジイ一致を含む、請求項31に記載の方法。
- 前記文脈が、構造的文脈を含む、請求項31又は32に記載の方法。
- 翻訳されるルックアップセグメントに対する翻訳メモリに格納された複数のソーステキストのマッチングレベルを判定するシステムであって、
前記複数のソーステキスト内の前記ルックアップセグメントのすべてのファジイ一致を判定する手段と、
少なくとも1つのファジイ一致が判定される場合に、前記ルックアップセグメントの文脈がそれぞれのファジイ一致の文脈と一致するとき、前記それぞれのファジイ一致が前記ルックアップセグメントの文脈内ファジイ一致であると判定する手段と
を含むシステム。 - 請求項1、24、又は31のいずれか一項に記載の方法を実行するように適合されたコンピュータソフトウェア。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009246729A JP5473533B2 (ja) | 2009-10-27 | 2009-10-27 | 文脈内正確(ice)一致 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009246729A JP5473533B2 (ja) | 2009-10-27 | 2009-10-27 | 文脈内正確(ice)一致 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011095841A true JP2011095841A (ja) | 2011-05-12 |
JP5473533B2 JP5473533B2 (ja) | 2014-04-16 |
Family
ID=44112701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009246729A Active JP5473533B2 (ja) | 2009-10-27 | 2009-10-27 | 文脈内正確(ice)一致 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5473533B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8935148B2 (en) | 2009-03-02 | 2015-01-13 | Sdl Plc | Computer-assisted natural language translation |
US8935150B2 (en) | 2009-03-02 | 2015-01-13 | Sdl Plc | Dynamic generation of auto-suggest dictionary for natural language translation |
US9128929B2 (en) | 2011-01-14 | 2015-09-08 | Sdl Language Technologies | Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself |
US9342506B2 (en) | 2004-03-05 | 2016-05-17 | Sdl Inc. | In-context exact (ICE) matching |
US9400786B2 (en) | 2006-09-21 | 2016-07-26 | Sdl Plc | Computer-implemented method, computer software and apparatus for use in a translation system |
US9600472B2 (en) | 1999-09-17 | 2017-03-21 | Sdl Inc. | E-services translation utilizing machine translation and translation memory |
US10635863B2 (en) | 2017-10-30 | 2020-04-28 | Sdl Inc. | Fragment recall and adaptive automated translation |
CN111177098A (zh) * | 2019-12-27 | 2020-05-19 | 中信百信银行股份有限公司 | 查看系统日志上下文的方法及系统 |
US10817676B2 (en) | 2017-12-27 | 2020-10-27 | Sdl Inc. | Intelligent routing services and systems |
US11256867B2 (en) | 2018-10-09 | 2022-02-22 | Sdl Inc. | Systems and methods of machine learning for digital assets and message creation |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04152466A (ja) * | 1990-10-17 | 1992-05-26 | Hitachi Ltd | 機械翻訳方法 |
JPH0793331A (ja) * | 1993-09-24 | 1995-04-07 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 対話文翻訳装置 |
JP2004318510A (ja) * | 2003-04-16 | 2004-11-11 | Toshiba Corp | 対訳情報作成装置、対訳情報作成用プログラム、対訳情報作成方法、対訳情報検索装置、対訳情報検索用プログラム及び対訳情報検索方法 |
US20050197827A1 (en) * | 2004-03-05 | 2005-09-08 | Russ Ross | In-context exact (ICE) matching |
-
2009
- 2009-10-27 JP JP2009246729A patent/JP5473533B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04152466A (ja) * | 1990-10-17 | 1992-05-26 | Hitachi Ltd | 機械翻訳方法 |
JPH0793331A (ja) * | 1993-09-24 | 1995-04-07 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 対話文翻訳装置 |
JP2004318510A (ja) * | 2003-04-16 | 2004-11-11 | Toshiba Corp | 対訳情報作成装置、対訳情報作成用プログラム、対訳情報作成方法、対訳情報検索装置、対訳情報検索用プログラム及び対訳情報検索方法 |
US20050197827A1 (en) * | 2004-03-05 | 2005-09-08 | Russ Ross | In-context exact (ICE) matching |
Non-Patent Citations (2)
Title |
---|
松永 聡彦: "改版文書翻訳システムにおける文脈を考慮した文対応付け手法", 電子情報通信学会技術研究報告, vol. 第103巻,第280号, JPN6013028782, 22 August 2003 (2003-08-22), pages 43 - 48, ISSN: 0002555978 * |
熊野 正: "文脈素性のベクタ空間モデルを用いた日英翻訳選択−SENSEVAL−2日本語翻訳タスク参加システムの開", 自然言語処理, vol. 第10巻,第3号, JPN6013028781, 10 April 2003 (2003-04-10), pages 39 - 59, ISSN: 0002555979 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9600472B2 (en) | 1999-09-17 | 2017-03-21 | Sdl Inc. | E-services translation utilizing machine translation and translation memory |
US10216731B2 (en) | 1999-09-17 | 2019-02-26 | Sdl Inc. | E-services translation utilizing machine translation and translation memory |
US10198438B2 (en) | 1999-09-17 | 2019-02-05 | Sdl Inc. | E-services translation utilizing machine translation and translation memory |
US9342506B2 (en) | 2004-03-05 | 2016-05-17 | Sdl Inc. | In-context exact (ICE) matching |
US10248650B2 (en) | 2004-03-05 | 2019-04-02 | Sdl Inc. | In-context exact (ICE) matching |
US9400786B2 (en) | 2006-09-21 | 2016-07-26 | Sdl Plc | Computer-implemented method, computer software and apparatus for use in a translation system |
US8935148B2 (en) | 2009-03-02 | 2015-01-13 | Sdl Plc | Computer-assisted natural language translation |
US9262403B2 (en) | 2009-03-02 | 2016-02-16 | Sdl Plc | Dynamic generation of auto-suggest dictionary for natural language translation |
US8935150B2 (en) | 2009-03-02 | 2015-01-13 | Sdl Plc | Dynamic generation of auto-suggest dictionary for natural language translation |
US9128929B2 (en) | 2011-01-14 | 2015-09-08 | Sdl Language Technologies | Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself |
US10635863B2 (en) | 2017-10-30 | 2020-04-28 | Sdl Inc. | Fragment recall and adaptive automated translation |
US11321540B2 (en) | 2017-10-30 | 2022-05-03 | Sdl Inc. | Systems and methods of adaptive automated translation utilizing fine-grained alignment |
US10817676B2 (en) | 2017-12-27 | 2020-10-27 | Sdl Inc. | Intelligent routing services and systems |
US11475227B2 (en) | 2017-12-27 | 2022-10-18 | Sdl Inc. | Intelligent routing services and systems |
US11256867B2 (en) | 2018-10-09 | 2022-02-22 | Sdl Inc. | Systems and methods of machine learning for digital assets and message creation |
CN111177098A (zh) * | 2019-12-27 | 2020-05-19 | 中信百信银行股份有限公司 | 查看系统日志上下文的方法及系统 |
CN111177098B (zh) * | 2019-12-27 | 2023-09-22 | 中信百信银行股份有限公司 | 查看系统日志上下文的方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP5473533B2 (ja) | 2014-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10248650B2 (en) | In-context exact (ICE) matching | |
EP2317447B1 (en) | In-context exact (ICE) matching | |
JP5473533B2 (ja) | 文脈内正確(ice)一致 | |
US20100262621A1 (en) | In-context exact (ice) matching | |
CN107209759B (zh) | 注解辅助装置及记录介质 | |
US9778929B2 (en) | Automated efficient translation context delivery | |
US7478092B2 (en) | Key term extraction | |
CN106934069B (zh) | 数据检索方法及系统 | |
US20190287197A1 (en) | Interactive tutorial integration | |
US20110307243A1 (en) | Multilingual runtime rendering of metadata | |
Nithya et al. | A hybrid approach to English to Malayalam machine translation | |
Bryl et al. | Interlinking and knowledge fusion | |
Alegria et al. | Reciprocal enrichment between basque wikipedia and machine translation | |
RU2546064C1 (ru) | Распределенная система и способ языкового перевода | |
JP2012113459A (ja) | 用例翻訳システム、用例翻訳方法及び用例翻訳プログラム | |
US10229113B1 (en) | Leveraging content dimensions during the translation of human-readable languages | |
US10235362B1 (en) | Continuous translation refinement with automated delivery of re-translated content | |
US10261995B1 (en) | Semantic and natural language processing for content categorization and routing | |
US10223356B1 (en) | Abstraction of syntax in localization through pre-rendering | |
US10275459B1 (en) | Source language content scoring for localizability | |
JP6797038B2 (ja) | ソフトウェア素材選定支援装置及びソフトウェア素材選定支援プログラム | |
US8200651B2 (en) | Comprehension of digitally encoded texts | |
Morris et al. | Welsh automatic text summarisation | |
JP5909123B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
Pang et al. | I can guess what you mean: A monolingual query enhancement for machine translation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120626 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120925 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120928 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121018 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121023 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121126 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130618 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130918 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130924 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131018 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140204 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5473533 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |