JP5280685B2 - 文法的に正しいテキスト文字列を生成するシステムおよび方法 - Google Patents
文法的に正しいテキスト文字列を生成するシステムおよび方法 Download PDFInfo
- Publication number
- JP5280685B2 JP5280685B2 JP2007541240A JP2007541240A JP5280685B2 JP 5280685 B2 JP5280685 B2 JP 5280685B2 JP 2007541240 A JP2007541240 A JP 2007541240A JP 2007541240 A JP2007541240 A JP 2007541240A JP 5280685 B2 JP5280685 B2 JP 5280685B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- template
- target language
- language
- token
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 79
- 238000013519 translation Methods 0.000 claims description 66
- 230000000153 supplemental effect Effects 0.000 claims description 43
- 230000008521 reorganization Effects 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 2
- 230000004807 localization Effects 0.000 description 96
- 235000013601 eggs Nutrition 0.000 description 25
- 241000270295 Serpentes Species 0.000 description 19
- 238000010586 diagram Methods 0.000 description 18
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 18
- 238000011161 development Methods 0.000 description 11
- 229910052697 platinum Inorganic materials 0.000 description 11
- 230000003068 static effect Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 210000000988 bone and bone Anatomy 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000001788 irregular Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- SAPGTCDSBGMXCD-UHFFFAOYSA-N (2-chlorophenyl)-(4-fluorophenyl)-pyrimidin-5-ylmethanol Chemical compound C=1N=CN=CC=1C(C=1C(=CC=CC=1)Cl)(O)C1=CC=C(F)C=C1 SAPGTCDSBGMXCD-UHFFFAOYSA-N 0.000 description 2
- 241001605695 Pareronia Species 0.000 description 2
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 229910052709 silver Inorganic materials 0.000 description 2
- 239000004332 silver Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000219357 Cactaceae Species 0.000 description 1
- 241000282461 Canis lupus Species 0.000 description 1
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 241000289581 Macropus sp. Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 240000003380 Passiflora rubra Species 0.000 description 1
- 229920001872 Spider silk Polymers 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 210000000007 bat wing Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/154—Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Description
ターゲット(Emperor Crush)およびダメージのポイント数のすべての可能な組合せのテキスト文字列をメモリに保管するのではなく、テキストテンプレートをTMLで生成し、ターゲットおよびポイント数に従って解析することができる。方法700およびステップ704によれば、この例のテキスト文字列内のターゲット(Emperor Crush)は、可変テキスト要素として識別することができる。ステップ706で、可変テキスト要素の文法規則を識別し、トークン演算子をその可変テキスト要素に割り当てる。一実施形態によれば、複数の記号が、トークン演算子として指定され、各記号は、事前定義の文法規則に対応する。たとえば、次の記号を、可変テキスト要素の指定された文法規則に対応するために事前に定義することができる。
^:固有名詞の所有格(Bob's)
%:主格代名詞(I-you-he/she/it-we-you-they)
#:目的格代名詞(me-you-him/her/it-us-you-them)
&:所有格代名詞(my-your-his/her/its-our-your-their)
=:直接話法(sir/sire/milord-madame/madam/milady)
+:目的語のカウント/個数
<:不定冠詞(a/an/some)
>:定冠詞(the)
*:ソースロケール以外のロケールに使用される
~:ソースロケール以外のロケールに使用される
一実施形態で、上の記号は、対にされた時にその通常の文字表現を与えられる。たとえば、テキスト文字列が記号“$”の表示を必要とする場合に、その記号は、TMLテキストテンプレートでは“$$”と書かれる。
A:動作主、thisを呼んでいる主要な実体
T:現在の動作主のターゲット
P:現在の動作主のペット
M:現在の動作主の主君
S:現在の話す人([A, T, P, M, 0-9]をポイントする)
L:現在の聞く人([A, T, P, M, 0-9]をポイントする)
@:thisポインタ(動作主として呼ばれる場合にA、ターゲットとして呼ばれる場合にTなど)
この例のテキスト文字列について、可変テキスト要素“Emperor Crush”のコンテキストタイプは、ターゲットである。したがって、上の例示的な記号の定義によれば、この可変テキスト要素は、トークンオペランド“T”を割り当てられるはずである。したがって、この例のテキスト文字列に関する方法700のステップ708の完了時に、部分的に形成されたTMLテキストテンプレートは、次のようになるはずである。
一実施形態で、トークンオペランド(A、T、P、M、S、L)が、この例のテキストテンプレートのように大文字にされる場合に、展開されるトークンの最初の文字は、強制的に大文字にされる。トークンオペランドが小文字である(a、t、p、m、s、l)場合には、展開されるトークンの大文字小文字は、変更されない。たとえば、トークン“$a”について、a=“Boomba”である場合に、展開されるトークンは、元の大文字化を保つ。
所与のコンテキストが、元のテキスト文字列に従って定義される場合、すなわち、“T”が“Emperor Crush”として定義され、“0”が23のカウントを有する“point”として定義される場合に、補足情報は、このテキスト文字列に関してステップ710で不要であり、この方法は、ステップ712に進み、これらのトークンが基本トークンとして識別される。ステップ714では、この例のテキスト文字列に残りのテキスト可変要素がないので、この方法はステップ716に進み、ここで、上のTMLテキストテンプレートを、クライアント16のソースデータベース/メモリ304(図3)などのメモリに保管する。方法700は、ステップ718で終了する。
*fe *ves (knife)
*ff *ffs (skiff)
*f *ves (wolf, calf)
*h *hs “*ch”および“*sh”を除く
*ch *ches (switch)
*sh *shes (bush)
*o *oes “kangaroo”、“piano”、“studio”、および“zoo”を除く
*s *ses (glass)
*x *xes (box)
*y *ies “*ay”、“*ey”、“*oy”、および“*uy”を除く
*ay *ays (day)
*ey *eys (Turkey)
*oy *oys (boy)
*uy *uys (guy)
*z *zes (buzz)
一部の変則的な単語は、生来複数である(scissors、police、people)か、複数形化について変則的な規則に従う(cactus、datum、focus)。そのような不規則な複数形の語は、メタデータを用いて処理することができ、変形テキストに関して本明細書で後でさらに詳細に述べる。
方法700によれば、最初の可変テキスト要素は、ステップ704で識別され、この例では、最初の可変テキスト要素は、“orc pawn”になるはずである。この最初の可変テキスト要素は、標準ベーステキストなので、これにステップ706でトークン演算子“$”を割り当てることができる。ステップ708で、可変テキスト要素“orc pawn”に、トークンオペランド“t”を割り当てることができる。というのは、これがターゲットであるからである。一実施形態で、方法700に、テキストテンプレートへの不定冠詞トークンの追加を含めることができる。ターゲットがorc pawnである現在の例では、不定冠詞トークン演算子“<”が割り当てられ、この不定冠詞のトークンオペランドは、ターゲット“T”である。不定冠詞演算子に応答して、ローカライゼーションエンジン504は、オペランド“T”のベーステキスト(この場合には“orc pawn”)を分析し、メモリに保管された規則の組に従って、使用すべき不定冠詞を決定する。現在の例では、ローカライゼーションは、オペランドのベーステキストが母音から始まるので、“an”を用いて不定冠詞トークンを展開する。さらに、オペランドが大文字化されているので、展開されたトークンも大文字化されて、“An”になる。同様に、ターゲット“orc pawn”は、文の先頭ではなく、固有名詞でもないので、このテキストを大文字化してはならない。したがって、ターゲットトークン“$t”内のトークンオペランドは、大文字化されない。
0 “point”, 3
テンプレート “<T $t pierces you for +0 $0 of damage.”
出力 “An orc pawn pierces you for 3 points of damage.”
一実施形態では、ターゲットトークンに、ターゲットベーステキストが固有名詞であってもなくてもよい、冠詞機能を含めることができる。一実施形態で、不定冠詞(<T)およびターゲットベーステキスト($T)の2つのトークンを、冠詞機能を使用して単一のトークンに置換することができる。現在の例での置換トークンは、“<(T)”になるはずであり、ここで、ローカライゼーションエンジン504は、不定冠詞演算子“<”に応答して、括弧でくくられた部分の中のオペランドを分析して、それが固有名詞であるかどうかを判定する。括弧でくくられた部分の中のオペランドが固有名詞ではない場合には、ローカライゼーションエンジン504は、適当な不定冠詞(aまたはan)を挿入し、スペースを挿入し、ターゲットのベーステキスト“orc pawn”を追加する。上で述べたように、オペランドが大文字化されている場合には、ベーステキストの最初の文字が、強制的に大文字化される。トークン“<(T)”について、ローカライゼーションエンジン504は、不定冠詞が割り当てられる場合に、ターゲットのベーステキストではなく不定冠詞を大文字化する。ターゲットベーステキストが、“Emperor Crush”などの固有名詞である場合には、ローカライゼーションエンジン504は、不定冠詞を削除し、スペースを挿入しない。
0 “point”, 1
テンプレート “<(T) pierces you for +0 $0 of damage.”
出力 “Emperor Crush pierces you for 1 point of damage.”
一実施形態で、ローカライゼーションエンジン504は、不定冠詞の追加に似た形で、定冠詞およびスペースを追加する。上で述べたように、一実施形態で、記号“>”は、定冠詞トークン演算子に対応する。したがって、ローカライゼーションエンジン504は、定冠詞トークン演算子に応答してトークンオペランドを分析し、そのトークンオペランドのベーステキストが固有名詞であるかどうかを判定する。ベーステキストが固有名詞ではない場合には、定冠詞“the”が挿入され、これにスペースが続き、ベーステキストが挿入される。ターゲットが固有名詞ではない、次のコンテキストおよびテンプレートについて、ローカライゼーションエンジン504は、テンプレートを展開し、適当な出力を作る。
テンプレート “>(T) falls silently to the ground, and lies still.”
出力 “The orc pawn falls silently to the ground, and lies still.”
ターゲットが、供給されるコンテキストメタデータ({np})による識別に従って固有名詞である場合に、ローカライゼーションエンジン504は、不定冠詞を削除し、それ相応に出力を生成する。
テンプレート “>(T) falls silently to the ground, and lies still.”
出力 “Emperor Crush falls silently to the ground, and lies still.”
一実施形態で、ローカライゼーションエンジン504は、トークンオペランドのベーステキストが複数形である時すなわち、カウントが1より大きい時に、不定冠詞“some”を選択する。たとえば、次のコンテキストおよびテンプレートを与えられれば、ローカライゼーションエンジン504は、このコンテキストを使用してこのテンプレートを展開し、適当な出力テキスト文字列を生成する。
ターゲット “Boomba the Big”, 1
0 “adequate tin breastplate”, 1
テンプレート “$T says, ‘Greetings $a, you look like you could use <(0).’”
出力 “Boomba the Big says, ‘Greetings Arwen, you look like you could use an adequate tin breastplate.’”
この番号付き引数のベーステキストが1より大きいカウントを有するようにコンテキストが変更される場合に、トークンオペランド“0”の不定冠詞は、“a”または“an”ではなく“some”になる。たとえば、この番号付き引数“0”が、20のカウントを有する“arrow”と定義される場合に、次のテンプレートは、適当な出力テキスト文字列を生成するように展開される。
ターゲット “Boomba the Big”, 1
0 “arrow”, 20
テンプレート “$T says, ‘Greetings $a, you look like you could use <(0).’”
出力 “Boomba the Big says, ‘Greetings Arwen, you look like you could use some arrows.’”
変更された不定冠詞の使用を、特定のカウントについてさらにカスタマイズすることができ、ここで、挿入される不定冠詞は、たとえば、トークンオペランドのカウントに応じて、“a couple”、“a few”、“several”、または“many”である。
1 “point”, 3
テンプレート “<0|(cap) $0 pierces you for +1 $1 of damage.”
出力 “An orc pawn pierces you for 3 points of damage.”
一実施形態で、補足詳細(“$0|a”)は、欠けている性別およびカウントのコンテキストを与える。いくつかの実施形態で、この補足詳細は、動詞および句に最も有用であるが、冠詞および直接話法にも役立つことができる。動詞について、補足詳細は、文の主語の性別およびカウントを与える。一実施形態で、デフォルトは、男性、単数形、正常状態、および三人称である。句について、補足詳細は、選択されるべき性別およびカウントを示す。一実施形態で、デフォルトは、男性単数形である。形容詞について、いくつかのターゲット言語は、形容詞語尾を決定するために名詞の性別およびカウントを必要とする。補足情報は、視点が話す人の視点でない場合に、直接話法トークン(=)に追加情報を与える。不定冠詞トークン(<)の補足情報は、オペランドが形容詞である場合に情報を提供し、カウントは名詞から与えられ、この名詞は、別の可変テキスト要素である。
“Buy my stuff!”
現在の例では、このテキスト文字列内の最初の可変テキスト要素を、ステップ704で動詞“buy”として識別することができる。この可変テキスト要素は、標準ベーステキストなので、ステップ706でこれにトークン演算子“$”を割り当てることができる。この可変テキスト要素は、動作主、ターゲット、ペット、および主君ではないので、ステップ708でこれに番号付きトークン演算子“0”を割り当てることができる。この方法がステップ710に継続する時に、この可変テキスト要素が分析されて、補足情報を割り当てなければならないかどうかが判定される。現在の例では、この可変テキスト要素は動詞なので、ローカライゼーションエンジン504は、通常は、テキストテンプレートを展開する時に使用すべき動詞の形態を知る必要がある。現在の例の動詞“buy”に関する補足情報は、話す人が聞く人に話しかけていることの補足詳細を含むはずである。したがって、補足情報“|L”が、拡張トークンを形成するためにステップ720でトークン“$0”に割り当てられる。
1 “{v}buy{ts=buys}”
テンプレート “$1|L|(cap) &s stuff!”
出力 “Buy my stuff!”
拡張トークンが補足詳細と補足ディレクティブとの両方を含む一実施形態では、上の例で示されているように、補足詳細が、最初であり、これにディレクティブが続く。拡張トークンには、メモリ内の識別または番号付きの位置をルックアップし、定義された可変テキスト要素からのコンテキストを適用するディレクティブを含めることもできる。句を、性別およびカウントに関する補足詳細によって調整することもできる。たとえば、女性の放浪者は、“these stiletto heels are killing my feet”(このスティレットヒールは痛い)と言う可能性があり、男性の放浪者は、“these cowboy boots are killing my feet”(このカウボーイブーツは痛い)と言う可能性がある。性別は、英語では、他のターゲット言語ほど文法的に問題でない。
敬称の定義での“!”記号の使用は、ソフトウェアアプリケーションによって供給されるコンテキストを無視するようにローカライゼーションエンジン504に指示する。Fippy Darkpawの例と同様に、ソフトウェアアプリケーションが、性別を供給しない場合には、デフォルトの男性が使用される。したがって、ローカライゼーションエンジン504は、まず、TMLテキストテンプレートへのコンテキストの適用中に静的デフォルトを適用し、次に、TMLテキストテンプレートが展開され、動的オーバーライドが適用され、最後に、静的オーバーライドが適用される。
・male(男性)
・female(女性)
・neuter(中性。該当なし、またはドイツ語の中性)
・both(両方。男性と女性との両方を含む混合グループ)
2) ctまたはct! - そのトークンオペランドのカウント(0から始まる数)
3) beまたはbe! - 生き物のタイプ
・human(人間)
・subhuman(不完全な人間)
・animal(動物)
・monster(モンスター)
・undead(アンデッド)
・object(物体)
4) hnまたはhn! - 名誉または尊敬のレベル
・-2 極端に低い
・-1 低い
・ 0 通常
・ 1 高い
・ 2 極端に高い
5) agまたはag! - 年齢(0から始まる数)
一実施形態では、最初の文字が、性別(m、f、n、またはb)または生き物のタイプ(h、s、a、m、u、またはo)に十分である。より多くの文字を供給して、望み通りに信頼性を高めることができる(“sx!=female”)。
{n}bone chip
{n}bone chip{pl = “bone chips”}
これらの3つの例のすべてが、ローカライゼーションエンジン504によって同一に出力され、単数形の場合には“bone chip”、複数系の場合には“bone chips”になる。第1のコンテキストブロックは、コンテキストに情報を追加することによってメタデータを追加しまたは拡張する。一実施形態で、第1のコンテキストブロック(現在の例では{n})は、ベーステキストに関する品詞(たとえば、名詞、動詞、形容詞、または句)を識別する。第1のコンテキストブロックに、上で述べた性別および敬称レベルなど、コンテキスト的データに関する静的デフォルトまたはオーバーライドを含めることもできる。普通でない複数形または割り当てられた性別に従う異なる形など、ベーステキストの事前定義の変形を、メタデータを使用して定義することができる。これらの事前定義の変形を、変形テキストと呼ぶことができる。
f=またはfem=は女性名詞
fs=は女性名詞単数形
fp=は女性名詞複数形
f3-6=は女性名詞、範囲付きの複数形(“a few actresses”)
f20=は女性名詞、特定のカウント(“a stack of hit women”)
m=またはmas=は男性名詞
ms=は男性名詞単数形
mp=は男性名詞複数形
m3-6=は男性名詞、範囲付きの複数形(“a few actors”)
m20=は男性名詞、特定のカウント(“a stack of hit men”)
pl=は複数形
si=は単数形
3-6=は範囲付きの複数形(“a few spider silks”)
20=は特定のカウント(“a stack of batwings”)
{v} - 動詞
1s=またはfs=は一人称単数形
2s=またはss=は二人称単数形
3s=またはts=は三人称単数形
1p=またはfp=は一人称複数形
2p=またはsp=は二人称複数形
3p=またはtp=は三人称複数形
{p}または{pl}または{ps} - 句; {ps}は話す人をキーオフ(key off)し、{pl}は聞く人をキーオフする。
fs=は女性名詞単数形
fp=は女性名詞複数形
m=またはmas=は男性名詞
ms=は男性名詞単数形
mp=は男性名詞複数形
pl=は複数形
si=は単数形
単数形または“si=”変形は、対称性をもたらし、メタデータを用いて具体的に識別することができる。一実施形態で、デフォルトまたはベーステキストは、そのテキストの単数形版である。
この第1のコンテキストブロックは、名詞としてベーステキストを識別し、男性のデフォルト性別を割り当てる。第2のテキストブロックは、性別が男性または女性のどちらであるか、およびカウントが単数または複数のどちらであるかに従って、“hit man”の変形形態をリストする。一実施形態で、2文字を使用して、変形テキストが使用されなければならない場合を識別することができる。現在の例では、文字“fs”は、性別が女性であり、カウントが単数すなわち1の場合を識別し、文字“fp”は、性別が女性であり、カウントが複数すなわち1より大きい場合を識別し、文字“pl”は、カウントが複数すなわち1より大きく、性別が供給されない場合を識別する。
{n}platinum{pl=-}
この2つのコンテキスト的定義は、同一の効果を有する。カウントに応じて、これらの定義は、“0 platinum”、“1 platinum”、または“10,000 platinum”になり得る。マイナス記号“-”は、ローカライゼーションエンジン504によって「複数形を形成するために何かを追加してはならない」と解釈される。一実施形態で、名詞の複数形のテキストは、複数形を定義する際に“-”記号の後に“s”または“es”を挿入することによって定義することができ、ここで、“-”記号の後に供給される文字は、その名詞の複数形を形成するためにベーステキストに追加される。
{n}actress{m=actor}
この2つのメタデータ拡張コンテキストの例は、同一の効果を有し、ローカライゼーションエンジン504は、ソフトウェアアプリケーションによって供給されるコンテキストが、性別が女性であることを示す(この場合にはテキスト“actress”が使用される)場合を除いて、ベーステキスト“actor”を使用する。第2の例では、ローカライゼーションエンジン504は、ソフトウェアアプリケーションによって供給されるコンテキストが、性別が男性であることを示す(この場合にはテキスト“actor”が使用される)場合を除いて、ベーステキスト“actress”を使用する。この両方の例で、ローカライゼーションエンジン504は、性別選択の後に標準複数形化規則を適用し、ここで、1より大きいカウントについて、テキスト“actor”は“actors”になり、テキスト“actress”は“actresses”になる。
{n}actor{f=actress}
実施される時に、この2つの例は、同一の出力をもたらす。第1の例について、女性名詞単数形コンテキストがソフトウェアアプリケーションによって供給される場合に、ローカライゼーションエンジン504は、“fs=”変形を使用する。第2の例では、女性名詞単数形コンテキストに関する最も正確な変形は、単純な女性名詞“f=”であり、したがって、ローカライゼーションエンジン504は、テキスト“actress”を使用する。その代わりに、ソフトウェアアプリケーションによって供給されるコンテキストが、女性名詞複数形である場合には、ローカライゼーションエンジン504は、第1の例では“fp=”変形を使用する。第2の例では、女性名詞複数形コンテキストに関する最も正確な変形は、“f=”であり、したがって、ローカライゼーションエンジン504は、テキスト“actress”を使用し、標準複数形化規則を使用して複数形を形成する。
テンプレート “Bring me $1!”
出力 “Bring me a snake egg!”
1 “{n}a snake egg{pl = “+@ snake eggs”}, 7
テンプレート “Bring me $1!”
出力 “Bring me 7 snake eggs!”
この第1の例では、番号付きオペランド“1”のカウントが、1であり、したがって、ベーステキストの単数形またはデフォルト版が、TMLテキストテンプレートに適用され、それ相応に出力される。この第2の例では、番号付き引数と共に供給されるコンテキストが、7であり、これは1より大きく、したがって、ローカライゼーションエンジン504は、複数形識別子“pl=”によって定義される、このベーステキストの複数形を使用する。thisポインタに従って、ローカライゼーションエンジン504は、トークン“+@”に応答して番号付き引数のカウントを出力し、所望の文法的に正しいテキスト文字列を出力する。
テンプレート “Bring me $1!”
出力 “Bring me a stack of snake eggs!”
ローカライゼーションエンジン504は、メタデータ内で見つけることのできる最も正確な変形一致を使用し、範囲付き複数形は、より正確に扱われる。この例では、20に関するカウント一致があるので、ローカライゼーションエンジン504は、トークン“$1”についてテキスト“a stack of snake eggs”を出力する。コンテキストが13の場合には、正確な一致はなく、ローカライゼーションエンジン504は、一般的な複数形を使用し、“13 snake eggs”を出力するはずである。
テンプレート “Beware the evil $1!”
出力 “Beware the evil bevy of actresses!”
1 “{n}actor{fem=actress, f2 = “actress twins”, f20=“stack of actresses”, f3+=“bevy of actresses”, m2=“actor buddies”, m20=“beefcake stack”, m3+=“rat pack”}, 20, female
テンプレート “Beware the evil $1!”
出力 “Beware the evil stack of actresses!”
一実施形態で、ローカライゼーションエンジン504は、変形テキスト識別子内で最初に見つけた変形テキスト一致を使用する。カウントが19の場合に、上の例の最初の女性名詞変形一致は、“bevy of actresses”であり、ローカライゼーションエンジン504は、このテキストを使用して、トークン“$1”を解析する。カウントが20の場合には、“f20=”識別子が、ローカライゼーションエンジン504がより広義の識別子“f3+=”に達する前の成功の女性名詞一致であり、したがって、ローカライゼーションエンジン504は、“f20=”識別子で停止し、定義された変形テキストを使用した。ソフトウェアアプリケーションによって供給される性別が男性である場合には、ローカライゼーションエンジン504は、各例でそれぞれ“rat pack”および“beefcake stack”を供給したものとなっている。
{v}buys{1s=buy,2s=buy,1p=buy,2p=buy,3p=buy}
{v}buy{3s=buys}
これらの3つの方法は、ローカライゼーションエンジン504によって実施される時に実質的に同一の効果を有する。特定の形態が変形から欠けている場合に、ローカライゼーションエンジン504は、デフォルトのベーステキストを使用する。この例では、“1s”は、一人称単数形変形テキストを識別し、“2s”は、二人称単数形変形テキストを識別し、“3s”は、三人称単数形変形テキストを識別し、“1p”は、一人称複数形変形テキストを識別し、“2p”は、二人称複数形変形テキストを識別し、“3p”は、三人称複数形変形テキストを識別する。動詞“buy”について、語形変化は、三人称単数形の場合を除いて同一である。したがって、最後の方法に示されているように、三人称単数形変形テキストだけを定義する必要がある。
1 “{v}cost{3s=costs}”
2 “{n}platinum{pl=-}”, 3
テンプレート “$T $1|t +2 $2.”
出力 “A snake egg costs 3 platinum.”
現在の例では、ローカライゼーションエンジン504は、動詞“cost”の三人称単数形を使用しなければならないと判定し、三人称単数形は、メタデータを用いて”costs”と定義されている。したがって、“$1|t”トークンは、動詞テキスト“costs”を用いて解析される。次の例では、ターゲットのカウントが20に増やされ、したがって、動詞“cost”の三人称複数形が使用されなければならない。
1 “{v}cost{3s=costs}”
2 “{n}platinum{pl=-}”, 60
テンプレート “$T $1|t +2 $2
出力 “20 snake eggs cost 60 platinum.”
三人称複数識別子がメタデータに現れていないので、ローカライゼーションエンジン504は、この動詞にデフォルトまたはベーステキストを使用し、このデフォルトは、この場合には三人称複数形の正しい形である。
ターゲット “orc pawn”, 1, male, subhuman
聞く人 “Galadriel”, 1, female, human
テンプレート “\413|L”
出力 “Attacking an orc pawn, mistress.”
上の例では、聞く人について供給される性別コンテキストが、女性であり、したがって、ローカライゼーションエンジン504は、ルックアップテーブルアドレス“413”の女性の性別について識別された変形句を使用し、ターゲットについて供給されたコンテキストに従って、この変形句についてテンプレートを解析する。
ターゲット “orc pawn”, 1, male, subhuman
聞く人 “Gandalf”, 1, male, human
テンプレート “\413|L”
出力 “Attacking an orc pawn, master.”
この例では、聞く人について供給される性別コンテキストが、男性であり、したがって、ローカライゼーションエンジン504は、ルックアップテーブルアドレス“413”のベーステキストまたはデフォルト句を使用し、ターゲットについて供給されたコンテキストを使用して、このデフォルト句テンプレートを解析する。
ターゲット “orc pawn”, 1, male, subhuman
聞く人 “Galadriel”, 1, female, human
テンプレート “\414"
出力 “Attacking an orc pawn, mistress.”
この例では、結果は、基本句({p})が補足詳細と組み合わせて使用された場合と同一であるが、TMLテキストテンプレートは、聞く人のコンテキストを使用するようにローカライゼーションエンジン504に指示する補足情報がテンプレートから除去されているので、より短い。
聞く人 “Jane”, female
0 “\414"
\414 “{ps}I tore my shirt{f=‘I tore my dress’}”
テンプレート “$S says, ‘$0’.”
出力 “Bob says, 'I tore my shirt.'”
話す人 “Fido"
聞く人 “Jane”, female
0 “\415"
\415 “{pl}My master $L loves me{f=‘My mistress loves me’}”
テンプレート “$S says, ‘$0’.”
出力 “Fido says, ‘My mistress Jane loves me.’”
上の例では、トークン“$0”に使用される性別およびカウントが、聞く人または話す人のいずれかに対して参照され、そのような指定が、TMLテキストテンプレート内に“$0|L”または“$0|S”の形で現れる必要がない場合に、同一のテンプレートを使用することができる。
1 “beautiful”, 0
2 “silver”, 0
テンプレート “You buy <1 $1 $2 $0”
一実施形態で、ソース言語TMLテキストテンプレートおよび関連するメタデータは、それぞれが事前定義のアドレスを有するチャートまたはテーブル内で供給される。ソース言語TMLテキストテンプレートと関連するベーステキストおよびメタデータとのステップ804での受取に続いて、トランスレータは、ベーステキストを翻訳し、ターゲット言語に関する必要に応じてメタデータを追加し、変更する。現在の例では、ターゲット言語はフランス語であり、ソース言語メタデータを、ステップ806でそれ相応に変更することができ、ベーステキストを次のように翻訳して、ベーステキストの変形の諸形態およびデフォルト性別を定義することができる。
1 “{ap}beau{ma=bel, fs=belle, fp=belles}”, 0
2 “{a}argente{}”, 0
上で述べたように、番号付き引数に割り当てられる単語の品詞は、コンテキスト内でメタデータを用いて指定される。フランス語などの複数の言語で、名詞ともう1つ以上の形容詞の順序は、英語テンプレートからの順序が使用される場合に文法的に正しくない場合がある。したがって、品詞指定{n}、{ap}、{a}は、一部の地域別の設定情報(ロケール)について、文法的に正しいテキストを生成する際に有用である。追加の変形テキスト識別子が、フランス語ターゲット言語に固有の現在の例で番号付き引数“1”に関するコンテキストで使用される。具体的に言うと、識別子“ma”は、形容詞“beau”の男性名詞第二形(masculine aspire form)すなわち、形容詞が母音または無音の“h”から始まる男性名詞の前に置かれる時の形を指定する。ターゲット言語ごとに、そのターゲット言語に独特の追加の変形テキスト識別子を使用することができ、あるいは、いくつかの地域別の設定情報に共通の識別子を使用することもできる。
現在の例では、マクロトークンは、フランス語の文法的規則に従って、ターゲット言語にローカライズされたテンプレートに適用され、トランスレータ開発ツールは、番号付き引数“1”および“2”の変更されたメタデータを分析して、形容詞のタイプを判定する。この例では、番号付き引数“1”は、接頭形容詞を定義し、番号付き引数“2”は、接尾形容詞を定義する。ローカライゼーションエンジン504でコーディングされたフランス語の文法的規則に従って、ローカライゼーションエンジン504は、マクロを展開し、次のターゲット言語にローカライズされたテンプレートを生成するはずである。
ステップ812でのターゲット言語にローカライズされたテンプレートへの拡張トークン(複数)の適用に続いて、トランスレータは、ステップ814で、ターゲット言語TMLテキストテンプレートおよび関連するメタデータの正確さを検証する。この検証は、たとえばトランスレータ開発ツール36および図9に示されたトランスレータインターフェース900を使用して実行することができる。ターゲット言語TMLテキストテンプレートおよび関連するメタデータが不正確である場合には、トランスレータは、TMLテキストテンプレートおよびメタデータが、ローカライゼーションエンジン504によって展開された時にターゲット言語で文法的に正しいテキスト文字列を作るように、メタデータおよび/またはターゲット言語TMLテキストテンプレートを変更することができる。ステップ814でターゲット言語TMLテキストテンプレートおよび関連するメタデータの正確さが検証された時に、方法800はステップ816で終了する。
%:主格代名詞(ich/du/er-sie-esなど)
#:対格代名詞(mich/dich/inh-sie-esなど)
~:与格代名詞(mir/dir/ihm-ihr-ihmなど)
*:再帰代名詞 (mich/dich/sich、mir/dir/sichなど)
&:所有格形容詞(mein/dein/sein-ihr-seinなど)
<:不定冠詞(ein*/kein*/einige/viele)
>:定冠詞(der/die/das、den/die/das、dem/der/dem、des/der/desなど)
+:目的語のカウント/個数
^:名詞の属格形(Kunden)
=:直接話法(コンテキストからの性別および尊敬形、Herr/Dame)
トランスレータは、指定された文法規則のこの組を使用して、ターゲット言語TMLテキストテンプレートを定義することができる。
1 “beautiful”, 0
2 “silver”, 0
テンプレート “You buy <1 $1 $2 $0”
ステップ1006で、ローカライゼーションエンジン504は、TMLルックアップモジュール506の援助によってソース言語TMLテキストテンプレートおよびソース言語コンテキストをメモリ内でルックアップし、次の対応するターゲット言語TMLテキストテンプレートおよびターゲット言語のコンテキストを入手するが、現在の例のターゲット言語は、フランス語である。
1 “{ap}beau{ma=bel,fs=belle,fp=belles}”, 0
2 “{a}argente{}”, 0
テンプレート “Vous achette \noun($0, $1, $2)”
ステップ1008で、ローカライゼーションエンジン504は、ターゲット言語コンテキストと共に供給されたメタデータを使用して、ターゲット言語コンテキストをターゲット言語TMLテキストテンプレートトークンに適用する。ステップ1010で、ローカライゼーションエンジン504は、現在の例ではターゲット言語のフランス語の規則であるターゲット言語文法規則に従って、ターゲット言語TMLテキストテンプレートを展開する。フランス語の文法規則に従って、ターゲット言語TMLテキストテンプレートが展開され、このテンプレートは、次の展開されたてプレートに置換されるはずである。
ステップ1012で、ローカライゼーションエンジン504は、翻訳アプリケーションインターフェース502を介して、次の文法的に正しいストリングを出力するはずである。
ステップ1014で、ディスプレイモジュール302が、このターゲット言語の文法的に正しいテキスト文字列を表示し、この方法は、ステップ1016で終了する。
Claims (17)
- コンピュータによって実行される、ターゲット言語にローカライズされたテンプレートを生成する方法であって、
ソース言語テキストストリングに基づいてソース言語マークアップ言語(ML)テキストテンプレートを生成することと、ここで、前記ソース言語MLテキストテンプレートは少なくとも一つのトークンを含んでおり、前記少なくとも一つのトークンは、
ソース言語テキストストリングに含まれる可変テキスト要素に割り当てられるトークン演算子と、ここで第1の記号が前記トークン演算子として指定され、かつ、前記第1の記号は事前定義の文法規則に対応し、
可変テキスト要素に割り当てられたトークンオペランドと、ここで、第2の記号が前記トークンオペランドとして指定され、かつ、前記第2の記号は事前定義のコンテキストタイプに対応し、
を含んでおり、
ターゲット言語MLテキストテンプレートを生成するために、前記ソース言語MLテキストテンプレート内の1つまたは複数の単語を前記ターゲット言語の1つまたは複数の単語に翻訳することと、ここで、ターゲット言語MLテキストテンプレートは、クライアントコンピュータ及びサーバコンピュータの少なくとも一方にある少なくとも1つの翻訳ツールによって生成され、かつ、前記ターゲット言語MLテキストテンプレートは、前記トークン演算子を含んでおり、
前記翻訳された単語を使用して、前記ターゲット言語MLテキストテンプレート用のターゲット言語にローカライズされたテンプレートを定義することと
を含む方法。 - ターゲット言語の属性に従って、ソース言語テキストストリングに関連する変形テキストに関するメタデータを追加し、変更することをさらに含み、前記ターゲット言語にローカライズされたテンプレートは、前記翻訳された単語に加えて前記変更されたメタデータを使用して定義される、請求項1に記載の方法。
- 補足詳細及び補足ディレクティブのうち少なくとも一方を含んでいる補足情報を用いて、前記ターゲット言語にローカライズされたテンプレートを変更することをさらに含む、請求項1に記載の方法。
- 前記ターゲット言語MLテキストテンプレートおよびターゲット言語にローカライズされたテンプレートの正確さを検証することをさらに含む、請求項1に記載の方法。
- 前記事前定義のコンテキストタイプは、個数、性別、タイプ、名誉、年齢、および党派のうちの少なくとも1つを含む、請求項1に記載の方法。
- 前記ターゲット言語にローカライズされたテンプレートは、前記ソース言語MLテキストテンプレートおよびコンテキストに基づく前記ターゲット言語の品詞の再編成および文法上の一致に関する指示を含む、請求項1に記載の方法。
- ソース言語の対応するマークアップ言語(ML)テキストテンプレートに少なくとも部分的に基づいてターゲット言語のMLテキストテンプレートを生成するシステムであって、
プロセッサと、
前記プロセッサに接続されたディスプレイとを備え、
前記ディスプレイは、ソース言語テキストストリング入力セクションによってソース言語のテキストストリングを表示し、可変テキスト入力セクションによって可変テキスト要素をも表示し、前記可変テキスト要素はターゲット言語の単語又は句を表し、また、前記ディスプレイは、ターゲット言語MLテキストテンプレート入力セクションによってターゲット言語MLテキストテンプレートをも表示し、
ここで、ターゲット言語MLテキストテンプレートは、少なくとも一つのトークンを含んでおり、前記トークンは、トークン演算子及びトークンオペランドを含んでおり、前記トークン演算子は可変テキスト要素を表し、前記トークンオペランドはコンテキストタイプを表し、
前記ターゲット言語MLテキストテンプレートは、クライアントコンピュータ及びサーバコンピュータのうちの少なくとも一方にある少なくとも一つの翻訳ツールによって生成され、
前記トークン演算子は、事前定義の文法規則に対応する第1の記号によって指定され、 前記トークンオペランドは、事前定義のコンテキストタイプに対応する第2の記号によって指定され、
前記ディスプレイは、前記ターゲット言語MLテキストテンプレートの展開のために、少なくとも一つのコンテキスト入力セクションによって少なくとも1つのコンテキスト要素を表示するように構成され、ターゲット言語テキストストリング出力セクションによってターゲット言語のテキストストリングを表示するよう構成され、前記ターゲット言語テキストストリングは、前記可変テキストおよび少なくとも1つのコンテキスト要素を使用する前記ターゲット言語MLテキストテンプレートの展開に基づいて、前記プロセッサによって生成される、システム。 - 前記可変テキスト入力セクションは、前記可変テキスト要素のメタデータを表示するようにさらに構成され、前記ターゲット言語テキストストリングは、前記メタデータに少なくとも部分的に基づいて生成される、請求項7に記載のシステム。
- 前記少なくとも1つのコンテキスト要素は、個数、性別、タイプ、名誉、年齢、および党派のうちの少なくとも1つを含む、請求項7に記載のシステム。
- 前記少なくとも1つのコンテキスト要素は、リストからユーザによって選択可能である、請求項7に記載のシステム。
- 前記ターゲット言語MLテキストテンプレートは、英数字の記号によって識別される複数の引数を含み、各引数は、可変テキストに対応し、前記ディスプレイはさらに、前記可変テキスト入力セクションに表示された前記可変テキストに対応する前記引数の文字または番号を表示する、請求項7に記載のシステム。
- ターゲット言語にローカライズされたテンプレートを生成するシステムであって、
ユーザ入力デバイスと、
前記ユーザ入力デバイスを通して入力されたソース言語テキストストリングに基づいて、ソース言語マークアップ言語(ML)テキストテンプレートを生成するようにされたプロセッサとを備え、
前記ソース言語MLテキストテンプレートは少なくとも一つのトークンを含んでおり、前記少なくとも一つのトークンは、
ソース言語テキストストリングに含まれる可変テキスト要素に割り当てられるトークン演算子と、ここで第1の記号が前記トークン演算子として指定され、かつ、前記第1の記号は事前定義の文法規則に対応し、
可変テキスト要素に割り当てられたトークンオペランドと、ここで、第2の記号が前記トークンオペランドとして指定され、かつ、前記第2の記号は事前定義のコンテキストタイプに対応し、
を含んでおり、
さらに、ターゲット言語MLテキストテンプレートを生成するために、前記ソース言語MLテキストテンプレート内の1つまたは複数の単語を前記ターゲット言語の1つまたは複数の単語に翻訳するトランスレータを備えており、
前記ターゲット言語MLテキストテンプレートは、前記トークン演算子を含んでおり、前記翻訳された単語を使用して、前記ターゲット言語MLテキストテンプレート用のターゲット言語にローカライズされたテンプレートを定義するシステム。 - ターゲット言語の属性に従って、ソース言語の追加され及び変更されるテキストストリングに関連する変形テキストに関するメタデータをさらに含み、前記変更されたメタデータは、前記ターゲット言語にローカライズされたテンプレートを定義するのに使用される、請求項12に記載のシステム。
- 追加され及び変更される補足情報を有する前記ターゲット言語にローカライズされたテンプレートをさらに含み、前記補足情報は補足詳細及び補足ディレクティブのうち少なくとも一方を含んでいる、請求項12に記載のシステム。
- 前記ターゲット言語MLテキストテンプレートおよびターゲット言語にローカライズされたテンプレートの正確さを検証する検証モジュールをさらに含む、請求項12に記載のシステム。
- 前記事前定義のコンテキストタイプは、個数、性別、タイプ、名誉、年齢、および党派のうちの少なくとも1つを含む、請求項12に記載のシステム。
- 前記ターゲット言語にローカライズされたテンプレートは、前記ソース言語MLテキストテンプレートおよびコンテキストに基づく前記ターゲット言語の品詞の再編成および文法上の一致に関する指示を含む、請求項12に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/985,338 US7577561B2 (en) | 2004-11-09 | 2004-11-09 | System and method for generating a target language markup language text template |
US10/985,338 | 2004-11-09 | ||
PCT/US2005/039650 WO2006052600A2 (en) | 2004-11-09 | 2005-11-02 | System and method for generating a target language markup language text template |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008520042A JP2008520042A (ja) | 2008-06-12 |
JP5280685B2 true JP5280685B2 (ja) | 2013-09-04 |
Family
ID=36317432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007541240A Active JP5280685B2 (ja) | 2004-11-09 | 2005-11-02 | 文法的に正しいテキスト文字列を生成するシステムおよび方法 |
Country Status (3)
Country | Link |
---|---|
US (2) | US7577561B2 (ja) |
JP (1) | JP5280685B2 (ja) |
WO (1) | WO2006052600A2 (ja) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7665063B1 (en) | 2004-05-26 | 2010-02-16 | Pegasystems, Inc. | Integration of declarative rule-based processing with procedural programming |
US8335704B2 (en) | 2005-01-28 | 2012-12-18 | Pegasystems Inc. | Methods and apparatus for work management and routing |
US8225232B2 (en) * | 2005-02-28 | 2012-07-17 | Microsoft Corporation | Dynamic configuration of unified messaging state changes |
US20070027670A1 (en) * | 2005-07-13 | 2007-02-01 | Siemens Medical Solutions Health Services Corporation | User Interface Update System |
US7571092B1 (en) | 2005-07-29 | 2009-08-04 | Sun Microsystems, Inc. | Method and apparatus for on-demand localization of files |
US7636656B1 (en) | 2005-07-29 | 2009-12-22 | Sun Microsystems, Inc. | Method and apparatus for synthesizing multiple localizable formats into a canonical format |
US8924335B1 (en) | 2006-03-30 | 2014-12-30 | Pegasystems Inc. | Rule-based user interface conformance methods |
US20090132232A1 (en) * | 2006-03-30 | 2009-05-21 | Pegasystems Inc. | Methods and apparatus for implementing multilingual software applications |
US20070233456A1 (en) * | 2006-03-31 | 2007-10-04 | Microsoft Corporation | Document localization |
WO2007139910A2 (en) * | 2006-05-26 | 2007-12-06 | Laden Sondrah S | System and method of language translation |
US8250525B2 (en) | 2007-03-02 | 2012-08-21 | Pegasystems Inc. | Proactive performance management for multi-user enterprise software systems |
US20090094018A1 (en) * | 2007-10-08 | 2009-04-09 | Nokia Corporation | Flexible Phrasebook |
US20090119091A1 (en) * | 2007-11-01 | 2009-05-07 | Eitan Chaim Sarig | Automated pattern based human assisted computerized translation network systems |
CN101960451A (zh) * | 2008-02-29 | 2011-01-26 | 夏普株式会社 | 信息处理装置、方法、以及程序 |
US20090300126A1 (en) * | 2008-05-30 | 2009-12-03 | International Business Machines Corporation | Message Handling |
US8843435B1 (en) | 2009-03-12 | 2014-09-23 | Pegasystems Inc. | Techniques for dynamic data processing |
US8468492B1 (en) | 2009-03-30 | 2013-06-18 | Pegasystems, Inc. | System and method for creation and modification of software applications |
US8521513B2 (en) * | 2010-03-12 | 2013-08-27 | Microsoft Corporation | Localization for interactive voice response systems |
US20110307243A1 (en) * | 2010-06-10 | 2011-12-15 | Microsoft Corporation | Multilingual runtime rendering of metadata |
US20120102386A1 (en) | 2010-10-20 | 2012-04-26 | Microsoft Corporation | Customization of Display Templates |
US9063931B2 (en) * | 2011-02-16 | 2015-06-23 | Ming-Yuan Wu | Multiple language translation system |
US8880487B1 (en) | 2011-02-18 | 2014-11-04 | Pegasystems Inc. | Systems and methods for distributed rules processing |
US8862455B2 (en) * | 2011-05-09 | 2014-10-14 | Microsoft Corporation | Creating and implementing language-dependent string pluralizations |
US9552213B2 (en) * | 2011-05-16 | 2017-01-24 | D2L Corporation | Systems and methods for facilitating software interface localization between multiple languages |
US8942971B1 (en) * | 2011-11-28 | 2015-01-27 | Google Inc. | Automated project localization into multiple languages by using machine translation |
US9195936B1 (en) | 2011-12-30 | 2015-11-24 | Pegasystems Inc. | System and method for updating or modifying an application without manual coding |
US9116885B2 (en) * | 2012-01-16 | 2015-08-25 | Google Inc. | Techniques for a gender weighted pinyin input method editor |
US10469396B2 (en) | 2014-10-10 | 2019-11-05 | Pegasystems, Inc. | Event processing with enhanced throughput |
US9483465B2 (en) * | 2015-03-06 | 2016-11-01 | Ricoh Company, Ltd. | Language translation for multi-function peripherals |
US10698599B2 (en) | 2016-06-03 | 2020-06-30 | Pegasystems, Inc. | Connecting graphical shapes using gestures |
US10698647B2 (en) | 2016-07-11 | 2020-06-30 | Pegasystems Inc. | Selective sharing for collaborative application usage |
US10235362B1 (en) | 2016-09-28 | 2019-03-19 | Amazon Technologies, Inc. | Continuous translation refinement with automated delivery of re-translated content |
US10229113B1 (en) * | 2016-09-28 | 2019-03-12 | Amazon Technologies, Inc. | Leveraging content dimensions during the translation of human-readable languages |
US10261995B1 (en) | 2016-09-28 | 2019-04-16 | Amazon Technologies, Inc. | Semantic and natural language processing for content categorization and routing |
US10275459B1 (en) | 2016-09-28 | 2019-04-30 | Amazon Technologies, Inc. | Source language content scoring for localizability |
US10223356B1 (en) | 2016-09-28 | 2019-03-05 | Amazon Technologies, Inc. | Abstraction of syntax in localization through pre-rendering |
US11048488B2 (en) | 2018-08-14 | 2021-06-29 | Pegasystems, Inc. | Software code optimizer and method |
US11048885B2 (en) * | 2018-09-25 | 2021-06-29 | International Business Machines Corporation | Cognitive translation service integrated with context-sensitive derivations for determining program-integrated information relationships |
US11567945B1 (en) | 2020-08-27 | 2023-01-31 | Pegasystems Inc. | Customized digital content generation systems and methods |
US20220366154A1 (en) * | 2021-05-12 | 2022-11-17 | Google Llc | Interactive graphical interfaces for efficient localization of natural language generation responses, resulting in natural and grammatical target language output |
CN113342436B (zh) * | 2021-06-10 | 2023-03-17 | 网易(杭州)网络有限公司 | 一种游戏翻译方法和装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5408603A (en) * | 1992-03-31 | 1995-04-18 | Dow Benelux N.V. | Global process control information system and method |
JP3220560B2 (ja) * | 1992-05-26 | 2001-10-22 | シャープ株式会社 | 機械翻訳装置 |
US6760695B1 (en) * | 1992-08-31 | 2004-07-06 | Logovista Corporation | Automated natural language processing |
US6470306B1 (en) * | 1996-04-23 | 2002-10-22 | Logovista Corporation | Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens |
US7020601B1 (en) * | 1998-05-04 | 2006-03-28 | Trados Incorporated | Method and apparatus for processing source information based on source placeable elements |
US6275789B1 (en) * | 1998-12-18 | 2001-08-14 | Leo Moser | Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language |
US6356865B1 (en) * | 1999-01-29 | 2002-03-12 | Sony Corporation | Method and apparatus for performing spoken language translation |
US6560774B1 (en) * | 1999-09-01 | 2003-05-06 | Microsoft Corporation | Verifier to check intermediate language |
US7860706B2 (en) * | 2001-03-16 | 2010-12-28 | Eli Abir | Knowledge system method and appparatus |
JP2003108331A (ja) * | 2001-09-27 | 2003-04-11 | Fujitsu Ltd | データ変換方法、プログラム及び記録媒体 |
US7412388B2 (en) * | 2003-12-12 | 2008-08-12 | International Business Machines Corporation | Language-enhanced programming tools |
US20050210047A1 (en) * | 2004-03-18 | 2005-09-22 | Zenodata Corporation | Posting data to a database from non-standard documents using document mapping to standard document types |
US20060253273A1 (en) * | 2004-11-08 | 2006-11-09 | Ronen Feldman | Information extraction using a trainable grammar |
-
2004
- 2004-11-09 US US10/985,338 patent/US7577561B2/en not_active Ceased
-
2005
- 2005-11-02 WO PCT/US2005/039650 patent/WO2006052600A2/en active Application Filing
- 2005-11-02 JP JP2007541240A patent/JP5280685B2/ja active Active
-
2011
- 2011-05-04 US US13/101,011 patent/USRE43621E1/en active Active
Also Published As
Publication number | Publication date |
---|---|
USRE43621E1 (en) | 2012-08-28 |
WO2006052600A3 (en) | 2007-03-22 |
JP2008520042A (ja) | 2008-06-12 |
US7577561B2 (en) | 2009-08-18 |
WO2006052600A2 (en) | 2006-05-18 |
US20060100847A1 (en) | 2006-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5280685B2 (ja) | 文法的に正しいテキスト文字列を生成するシステムおよび方法 | |
JP5209319B2 (ja) | 文法的に正しいテキスト文字列を生成するシステムおよび方法 | |
JP5172348B2 (ja) | 文法的に正しいテキスト文字列を生成するシステムおよび方法 | |
CN1618064B (zh) | 翻译方法与计算机设备 | |
JP2004502241A (ja) | オンライン環境内で複数言語コンテンツを提供する装置及びその方法 | |
EP1903454A1 (en) | Method, used by computers, for developing an ontology from a text in natural language | |
JP5540335B2 (ja) | 自然言語文生成装置及びコンピュータプログラム | |
US8812294B2 (en) | Translating phrases from one language into another using an order-based set of declarative rules | |
JPS6091450A (ja) | テ−ブル型言語翻訳器 | |
JPS61255469A (ja) | 言語生成装置 | |
KR102523806B1 (ko) | 사전 저장된 번역 결과를 활용하여 기계 번역에 대한 보완을 수행하는 문서 번역 서비스 서버 및 그 동작 방법 | |
CN107247612A (zh) | 作业描述方法及装置 | |
KR20190037988A (ko) | 복합명사 분석장치 및 방법, 컴퓨터 프로그램 | |
US7296260B2 (en) | System and method for composing a multi-lingual instructional software | |
Teixeira et al. | Services to support use and development of speech input for multilingual multimodal applications for mobile scenarios | |
US20120330641A1 (en) | Translating a symbolic representation of a lingual phrase into a representation in a different medium | |
JP4198737B2 (ja) | 機械翻訳プログラム、機械翻訳装置 | |
JP2790886B2 (ja) | 日本語文推敲装置 | |
JP3051747B2 (ja) | 機械翻訳方法及び機械翻訳システム | |
JP3892227B2 (ja) | 機械翻訳システム | |
JP4399154B2 (ja) | 翻訳装置、及び翻訳プログラム | |
JP2004264960A (ja) | 用例ベースの文変換装置、およびコンピュータプログラム | |
JPH0713822B2 (ja) | 翻訳方法 | |
JP2006244236A (ja) | 機械翻訳プログラム、機械翻訳装置 | |
JPH05108714A (ja) | 機械翻訳装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080930 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20100702 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100702 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110905 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111205 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120611 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120911 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121112 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130212 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130219 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130311 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130318 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130412 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130513 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130523 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5280685 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |