JP2008520041A - 文法的に正しいテキスト文字列を生成するシステムおよび方法 - Google Patents
文法的に正しいテキスト文字列を生成するシステムおよび方法 Download PDFInfo
- Publication number
- JP2008520041A JP2008520041A JP2007541239A JP2007541239A JP2008520041A JP 2008520041 A JP2008520041 A JP 2008520041A JP 2007541239 A JP2007541239 A JP 2007541239A JP 2007541239 A JP2007541239 A JP 2007541239A JP 2008520041 A JP2008520041 A JP 2008520041A
- Authority
- JP
- Japan
- Prior art keywords
- text
- variable
- template
- text element
- variable text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 230000000153 supplemental effect Effects 0.000 claims abstract description 58
- 230000008859 change Effects 0.000 claims description 6
- 230000004807 localization Effects 0.000 description 96
- 238000013519 translation Methods 0.000 description 64
- 235000013601 eggs Nutrition 0.000 description 25
- 241000270295 Serpentes Species 0.000 description 19
- 238000010586 diagram Methods 0.000 description 18
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 18
- 238000011161 development Methods 0.000 description 11
- 229910052697 platinum Inorganic materials 0.000 description 11
- 230000003068 static effect Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 210000000988 bone and bone Anatomy 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000001788 irregular Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- SAPGTCDSBGMXCD-UHFFFAOYSA-N (2-chlorophenyl)-(4-fluorophenyl)-pyrimidin-5-ylmethanol Chemical compound C=1N=CN=CC=1C(C=1C(=CC=CC=1)Cl)(O)C1=CC=C(F)C=C1 SAPGTCDSBGMXCD-UHFFFAOYSA-N 0.000 description 2
- 241001605695 Pareronia Species 0.000 description 2
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 229910052709 silver Inorganic materials 0.000 description 2
- 239000004332 silver Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000219357 Cactaceae Species 0.000 description 1
- 241000282461 Canis lupus Species 0.000 description 1
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 241000289581 Macropus sp. Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 240000003380 Passiflora rubra Species 0.000 description 1
- 229920001872 Spider silk Polymers 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 210000000007 bat wing Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
【選択図】図1
Description
ターゲット(Emperor Crush)およびダメージのポイント数のすべての可能な組合せのテキスト文字列をメモリに保管するのではなく、テキストテンプレートをTMLで生成し、ターゲットおよびポイント数に従って解析することができる。方法700およびステップ704によれば、この例のテキスト文字列内のターゲット(Emperor Crush)は、可変テキスト要素として識別することができる。ステップ706で、可変テキスト要素の文法規則を識別し、トークン演算子をその可変テキスト要素に割り当てる。一実施形態によれば、複数の記号が、トークン演算子として指定され、各記号は、事前定義の文法規則に対応する。たとえば、次の記号を、可変テキスト要素の指定された文法規則に対応するために事前に定義することができる。
^:固有名詞の所有格(Bob's)
%:主格代名詞(I-you-he/she/it-we-you-they)
#:目的格代名詞(me-you-him/her/it-us-you-them)
&:所有格代名詞(my-your-his/her/its-our-your-their)
=:直接話法(sir/sire/milord-madame/madam/milady)
+:目的語のカウント/個数
<:不定冠詞(a/an/some)
>:定冠詞(the)
*:ソースロケール以外のロケールに使用される
~:ソースロケール以外のロケールに使用される
一実施形態で、上の記号は、対にされた時にその通常の文字表現を与えられる。たとえば、テキスト文字列が記号“$”の表示を必要とする場合に、その記号は、TMLテキストテンプレートでは“$$”と書かれる。
A:動作主、thisを呼んでいる主要な実体
T:現在の動作主のターゲット
P:現在の動作主のペット
M:現在の動作主の主君
S:現在の話す人([A, T, P, M, 0-9]をポイントする)
L:現在の聞く人([A, T, P, M, 0-9]をポイントする)
@:thisポインタ(動作主として呼ばれる場合にA、ターゲットとして呼ばれる場合にTなど)
この例のテキスト文字列について、可変テキスト要素“Emperor Crush”のコンテキストタイプは、ターゲットである。したがって、上の例示的な記号の定義によれば、この可変テキスト要素は、トークンオペランド“T”を割り当てられるはずである。したがって、この例のテキスト文字列に関する方法700のステップ708の完了時に、部分的に形成されたTMLテキストテンプレートは、次のようになるはずである。
一実施形態で、トークンオペランド(A、T、P、M、S、L)が、この例のテキストテンプレートのように大文字にされる場合に、展開されるトークンの最初の文字は、強制的に大文字にされる。トークンオペランドが小文字である(a、t、p、m、s、l)場合には、展開されるトークンの大文字小文字は、変更されない。たとえば、トークン“$a”について、a=“Boomba”である場合に、展開されるトークンは、元の大文字化を保つ。
所与のコンテキストが、元のテキスト文字列に従って定義される場合、すなわち、“T”が“Emperor Crush”として定義され、“0”が23のカウントを有する“point”として定義される場合に、補足情報は、このテキスト文字列に関してステップ710で不要であり、この方法は、ステップ712に進み、これらのトークンが基本トークンとして識別される。ステップ714では、この例のテキスト文字列に残りのテキスト可変要素がないので、この方法はステップ716に進み、ここで、上のTMLテキストテンプレートを、クライアント16のソースデータベース/メモリ304(図3)などのメモリに保管する。方法700は、ステップ718で終了する。
*fe *ves (knife)
*ff *ffs (skiff)
*f *ves (wolf, calf)
*h *hs “*ch”および“*sh”を除く
*ch *ches (switch)
*sh *shes (bush)
*o *oes “kangaroo”、“piano”、“studio”、および“zoo”を除く
*s *ses (glass)
*x *xes (box)
*y *ies “*ay”、“*ey”、“*oy”、および“*uy”を除く
*ay *ays (day)
*ey *eys (Turkey)
*oy *oys (boy)
*uy *uys (guy)
*z *zes (buzz)
一部の変則的な単語は、生来複数である(scissors、police、people)か、複数形化について変則的な規則に従う(cactus、datum、focus)。そのような不規則な複数形の語は、メタデータを用いて処理することができ、変形テキストに関して本明細書で後でさらに詳細に述べる。
方法700によれば、最初の可変テキスト要素は、ステップ704で識別され、この例では、最初の可変テキスト要素は、“orc pawn”になるはずである。この最初の可変テキスト要素は、標準ベーステキストなので、これにステップ706でトークン演算子“$”を割り当てることができる。ステップ708で、可変テキスト要素“orc pawn”に、トークンオペランド“t”を割り当てることができる。というのは、これがターゲットであるからである。一実施形態で、方法700に、テキストテンプレートへの不定冠詞トークンの追加を含めることができる。ターゲットがorc pawnである現在の例では、不定冠詞トークン演算子“<”が割り当てられ、この不定冠詞のトークンオペランドは、ターゲット“T”である。不定冠詞演算子に応答して、ローカライゼーションエンジン504は、オペランド“T”のベーステキスト(この場合には“orc pawn”)を分析し、メモリに保管された規則の組に従って、使用すべき不定冠詞を決定する。現在の例では、ローカライゼーションは、オペランドのベーステキストが母音から始まるので、“an”を用いて不定冠詞トークンを展開する。さらに、オペランドが大文字化されているので、展開されたトークンも大文字化されて、“An”になる。同様に、ターゲット“orc pawn”は、文の先頭ではなく、固有名詞でもないので、このテキストを大文字化してはならない。したがって、ターゲットトークン“$t”内のトークンオペランドは、大文字化されない。
0 “point”, 3
テンプレート “<T $t pierces you for +0 $0 of damage.”
出力 “An orc pawn pierces you for 3 points of damage.”
一実施形態では、ターゲットトークンに、ターゲットベーステキストが固有名詞であってもなくてもよい、冠詞機能を含めることができる。一実施形態で、不定冠詞(<T)およびターゲットベーステキスト($T)の2つのトークンを、冠詞機能を使用して単一のトークンに置換することができる。現在の例での置換トークンは、“<(T)”になるはずであり、ここで、ローカライゼーションエンジン504は、不定冠詞演算子“<”に応答して、括弧でくくられた部分の中のオペランドを分析して、それが固有名詞であるかどうかを判定する。括弧でくくられた部分の中のオペランドが固有名詞ではない場合には、ローカライゼーションエンジン504は、適当な不定冠詞(aまたはan)を挿入し、スペースを挿入し、ターゲットのベーステキスト“orc pawn”を追加する。上で述べたように、オペランドが大文字化されている場合には、ベーステキストの最初の文字が、強制的に大文字化される。トークン“<(T)”について、ローカライゼーションエンジン504は、不定冠詞が割り当てられる場合に、ターゲットのベーステキストではなく不定冠詞を大文字化する。ターゲットベーステキストが、“Emperor Crush”などの固有名詞である場合には、ローカライゼーションエンジン504は、不定冠詞を削除し、スペースを挿入しない。
0 “point”, 1
テンプレート “<(T) pierces you for +0 $0 of damage.”
出力 “Emperor Crush pierces you for 1 point of damage.”
一実施形態で、ローカライゼーションエンジン504は、不定冠詞の追加に似た形で、定冠詞およびスペースを追加する。上で述べたように、一実施形態で、記号“>”は、定冠詞トークン演算子に対応する。したがって、ローカライゼーションエンジン504は、定冠詞トークン演算子に応答してトークンオペランドを分析し、そのトークンオペランドのベーステキストが固有名詞であるかどうかを判定する。ベーステキストが固有名詞ではない場合には、定冠詞“the”が挿入され、これにスペースが続き、ベーステキストが挿入される。ターゲットが固有名詞ではない、次のコンテキストおよびテンプレートについて、ローカライゼーションエンジン504は、テンプレートを展開し、適当な出力を作る。
テンプレート “>(T) falls silently to the ground, and lies still.”
出力 “The orc pawn falls silently to the ground, and lies still.”
ターゲットが、供給されるコンテキストメタデータ({np})による識別に従って固有名詞である場合に、ローカライゼーションエンジン504は、不定冠詞を削除し、それ相応に出力を生成する。
テンプレート “>(T) falls silently to the ground, and lies still.”
出力 “Emperor Crush falls silently to the ground, and lies still.”
一実施形態で、ローカライゼーションエンジン504は、トークンオペランドのベーステキストが複数形である時すなわち、カウントが1より大きい時に、不定冠詞“some”を選択する。たとえば、次のコンテキストおよびテンプレートを与えられれば、ローカライゼーションエンジン504は、このコンテキストを使用してこのテンプレートを展開し、適当な出力テキスト文字列を生成する。
ターゲット “Boomba the Big”, 1
0 “adequate tin breastplate”, 1
テンプレート “$T says, ‘Greetings $a, you look like you could use <(0).’”
出力 “Boomba the Big says, ‘Greetings Arwen, you look like you could use an adequate tin breastplate.’”
この番号付き引数のベーステキストが1より大きいカウントを有するようにコンテキストが変更される場合に、トークンオペランド“0”の不定冠詞は、“a”または“an”ではなく“some”になる。たとえば、この番号付き引数“0”が、20のカウントを有する“arrow”と定義される場合に、次のテンプレートは、適当な出力テキスト文字列を生成するように展開される。
ターゲット “Boomba the Big”, 1
0 “arrow”, 20
テンプレート “$T says, ‘Greetings $a, you look like you could use <(0).’”
出力 “Boomba the Big says, ‘Greetings Arwen, you look like you could use some arrows.’”
変更された不定冠詞の使用を、特定のカウントについてさらにカスタマイズすることができ、ここで、挿入される不定冠詞は、たとえば、トークンオペランドのカウントに応じて、“a couple”、“a few”、“several”、または“many”である。
1 “point”, 3
テンプレート “<0|(cap) $0 pierces you for +1 $1 of damage.”
出力 “An orc pawn pierces you for 3 points of damage.”
一実施形態で、補足詳細(“$0|a”)は、欠けている性別およびカウントのコンテキストを与える。いくつかの実施形態で、この補足詳細は、動詞および句に最も有用であるが、冠詞および直接話法にも役立つことができる。動詞について、補足詳細は、文の主語の性別およびカウントを与える。一実施形態で、デフォルトは、男性、単数形、正常状態、および三人称である。句について、補足詳細は、選択されるべき性別およびカウントを示す。一実施形態で、デフォルトは、男性単数形である。形容詞について、いくつかのターゲット言語は、形容詞語尾を決定するために名詞の性別およびカウントを必要とする。補足情報は、視点が話す人の視点でない場合に、直接話法トークン(=)に追加情報を与える。不定冠詞トークン(<)の補足情報は、オペランドが形容詞である場合に情報を提供し、カウントは名詞から与えられ、この名詞は、別の可変テキスト要素である。
“Buy my stuff!”
現在の例では、このテキスト文字列内の最初の可変テキスト要素を、ステップ704で動詞“buy”として識別することができる。この可変テキスト要素は、標準ベーステキストなので、ステップ706でこれにトークン演算子“$”を割り当てることができる。この可変テキスト要素は、動作主、ターゲット、ペット、および主君ではないので、ステップ708でこれに番号付きトークン演算子“0”を割り当てることができる。この方法がステップ710に継続する時に、この可変テキスト要素が分析されて、補足情報を割り当てなければならないかどうかが判定される。現在の例では、この可変テキスト要素は動詞なので、ローカライゼーションエンジン504は、通常は、テキストテンプレートを展開する時に使用すべき動詞の形態を知る必要がある。現在の例の動詞“buy”に関する補足情報は、話す人が聞く人に話しかけていることの補足詳細を含むはずである。したがって、補足情報“|L”が、拡張トークンを形成するためにステップ720でトークン“$0”に割り当てられる。
1 “{v}buy{ts=buys}”
テンプレート “$1|L|(cap) &s stuff!”
出力 “Buy my stuff!”
拡張トークンが補足詳細と補足ディレクティブとの両方を含む一実施形態では、上の例で示されているように、補足詳細が、最初であり、これにディレクティブが続く。拡張トークンには、メモリ内の識別または番号付きの位置をルックアップし、定義された可変テキスト要素からのコンテキストを適用するディレクティブを含めることもできる。句を、性別およびカウントに関する補足詳細によって調整することもできる。たとえば、女性の放浪者は、“these stiletto heels are killing my feet”(このスティレットヒールは痛い)と言う可能性があり、男性の放浪者は、“these cowboy boots are killing my feet”(このカウボーイブーツは痛い)と言う可能性がある。性別は、英語では、他のターゲット言語ほど文法的に問題でない。
敬称の定義での“!”記号の使用は、ソフトウェアアプリケーションによって供給されるコンテキストを無視するようにローカライゼーションエンジン504に指示する。Fippy Darkpawの例と同様に、ソフトウェアアプリケーションが、性別を供給しない場合には、デフォルトの男性が使用される。したがって、ローカライゼーションエンジン504は、まず、TMLテキストテンプレートへのコンテキストの適用中に静的デフォルトを適用し、次に、TMLテキストテンプレートが展開され、動的オーバーライドが適用され、最後に、静的オーバーライドが適用される。
・male(男性)
・female(女性)
・neuter(中性。該当なし、またはドイツ語の中性)
・both(両方。男性と女性との両方を含む混合グループ)
2) ctまたはct! - そのトークンオペランドのカウント(0から始まる数)
3) beまたはbe! - 生き物のタイプ
・human(人間)
・subhuman(不完全な人間)
・animal(動物)
・monster(モンスター)
・undead(アンデッド)
・object(物体)
4) hnまたはhn! - 名誉または尊敬のレベル
・-2 極端に低い
・-1 低い
・ 0 通常
・ 1 高い
・ 2 極端に高い
5) agまたはag! - 年齢(0から始まる数)
一実施形態では、最初の文字が、性別(m、f、n、またはb)または生き物のタイプ(h、s、a、m、u、またはo)に十分である。より多くの文字を供給して、望み通りに信頼性を高めることができる(“sx!=female”)。
{n}bone chip
{n}bone chip{pl = “bone chips”}
これらの3つの例のすべてが、ローカライゼーションエンジン504によって同一に出力され、単数形の場合には“bone chip”、複数系の場合には“bone chips”になる。第1のコンテキストブロックは、コンテキストに情報を追加することによってメタデータを追加しまたは拡張する。一実施形態で、第1のコンテキストブロック(現在の例では{n})は、ベーステキストに関する品詞(たとえば、名詞、動詞、形容詞、または句)を識別する。第1のコンテキストブロックに、上で述べた性別および敬称レベルなど、コンテキスト的データに関する静的デフォルトまたはオーバーライドを含めることもできる。普通でない複数形または割り当てられた性別に従う異なる形など、ベーステキストの事前定義の変形を、メタデータを使用して定義することができる。これらの事前定義の変形を、変形テキストと呼ぶことができる。
f=またはfem=は女性名詞
fs=は女性名詞単数形
fp=は女性名詞複数形
f3-6=は女性名詞、範囲付きの複数形(“a few actresses”)
f20=は女性名詞、特定のカウント(“a stack of hit women”)
m=またはmas=は男性名詞
ms=は男性名詞単数形
mp=は男性名詞複数形
m3-6=は男性名詞、範囲付きの複数形(“a few actors”)
m20=は男性名詞、特定のカウント(“a stack of hit men”)
pl=は複数形
si=は単数形
3-6=は範囲付きの複数形(“a few spider silks”)
20=は特定のカウント(“a stack of batwings”)
{v} - 動詞
1s=またはfs=は一人称単数形
2s=またはss=は二人称単数形
3s=またはts=は三人称単数形
1p=またはfp=は一人称複数形
2p=またはsp=は二人称複数形
3p=またはtp=は三人称複数形
{p}または{pl}または{ps} - 句; {ps}は話す人をキーオフ(key off)し、{pl}は聞く人をキーオフする。
fs=は女性名詞単数形
fp=は女性名詞複数形
m=またはmas=は男性名詞
ms=は男性名詞単数形
mp=は男性名詞複数形
pl=は複数形
si=は単数形
単数形または“si=”変形は、対称性をもたらし、メタデータを用いて具体的に識別することができる。一実施形態で、デフォルトまたはベーステキストは、そのテキストの単数形版である。
この第1のコンテキストブロックは、名詞としてベーステキストを識別し、男性のデフォルト性別を割り当てる。第2のテキストブロックは、性別が男性または女性のどちらであるか、およびカウントが単数または複数のどちらであるかに従って、“hit man”の変形形態をリストする。一実施形態で、2文字を使用して、変形テキストが使用されなければならない場合を識別することができる。現在の例では、文字“fs”は、性別が女性であり、カウントが単数すなわち1の場合を識別し、文字“fp”は、性別が女性であり、カウントが複数すなわち1より大きい場合を識別し、文字“pl”は、カウントが複数すなわち1より大きく、性別が供給されない場合を識別する。
{n}platinum{pl=-}
この2つのコンテキスト的定義は、同一の効果を有する。カウントに応じて、これらの定義は、“0 platinum”、“1 platinum”、または“10,000 platinum”になり得る。マイナス記号“-”は、ローカライゼーションエンジン504によって「複数形を形成するために何かを追加してはならない」と解釈される。一実施形態で、名詞の複数形のテキストは、複数形を定義する際に“-”記号の後に“s”または“es”を挿入することによって定義することができ、ここで、“-”記号の後に供給される文字は、その名詞の複数形を形成するためにベーステキストに追加される。
{n}actress{m=actor}
この2つのメタデータ拡張コンテキストの例は、同一の効果を有し、ローカライゼーションエンジン504は、ソフトウェアアプリケーションによって供給されるコンテキストが、性別が女性であることを示す(この場合にはテキスト“actress”が使用される)場合を除いて、ベーステキスト“actor”を使用する。第2の例では、ローカライゼーションエンジン504は、ソフトウェアアプリケーションによって供給されるコンテキストが、性別が男性であることを示す(この場合にはテキスト“actor”が使用される)場合を除いて、ベーステキスト“actress”を使用する。この両方の例で、ローカライゼーションエンジン504は、性別選択の後に標準複数形化規則を適用し、ここで、1より大きいカウントについて、テキスト“actor”は“actors”になり、テキスト“actress”は“actresses”になる。
{n}actor{f=actress}
実施される時に、この2つの例は、同一の出力をもたらす。第1の例について、女性名詞単数形コンテキストがソフトウェアアプリケーションによって供給される場合に、ローカライゼーションエンジン504は、“fs=”変形を使用する。第2の例では、女性名詞単数形コンテキストに関する最も正確な変形は、単純な女性名詞“f=”であり、したがって、ローカライゼーションエンジン504は、テキスト“actress”を使用する。その代わりに、ソフトウェアアプリケーションによって供給されるコンテキストが、女性名詞複数形である場合には、ローカライゼーションエンジン504は、第1の例では“fp=”変形を使用する。第2の例では、女性名詞複数形コンテキストに関する最も正確な変形は、“f=”であり、したがって、ローカライゼーションエンジン504は、テキスト“actress”を使用し、標準複数形化規則を使用して複数形を形成する。
テンプレート “Bring me $1!”
出力 “Bring me a snake egg!”
1 “{n}a snake egg{pl = “+@ snake eggs”}, 7
テンプレート “Bring me $1!”
出力 “Bring me 7 snake eggs!”
この第1の例では、番号付きオペランド“1”のカウントが、1であり、したがって、ベーステキストの単数形またはデフォルト版が、TMLテキストテンプレートに適用され、それ相応に出力される。この第2の例では、番号付き引数と共に供給されるコンテキストが、7であり、これは1より大きく、したがって、ローカライゼーションエンジン504は、複数形識別子“pl=”によって定義される、このベーステキストの複数形を使用する。thisポインタに従って、ローカライゼーションエンジン504は、トークン“+@”に応答して番号付き引数のカウントを出力し、所望の文法的に正しいテキスト文字列を出力する。
テンプレート “Bring me $1!”
出力 “Bring me a stack of snake eggs!”
ローカライゼーションエンジン504は、メタデータ内で見つけることのできる最も正確な変形一致を使用し、範囲付き複数形は、より正確に扱われる。この例では、20に関するカウント一致があるので、ローカライゼーションエンジン504は、トークン“$1”についてテキスト“a stack of snake eggs”を出力する。コンテキストが13の場合には、正確な一致はなく、ローカライゼーションエンジン504は、一般的な複数形を使用し、“13 snake eggs”を出力するはずである。
テンプレート “Beware the evil $1!”
出力 “Beware the evil bevy of actresses!”
1 “{n}actor{fem=actress, f2 = “actress twins”, f20=“stack of actresses”, f3+=“bevy of actresses”, m2=“actor buddies”, m20=“beefcake stack”, m3+=“rat pack”}, 20, female
テンプレート “Beware the evil $1!”
出力 “Beware the evil stack of actresses!”
一実施形態で、ローカライゼーションエンジン504は、変形テキスト識別子内で最初に見つけた変形テキスト一致を使用する。カウントが19の場合に、上の例の最初の女性名詞変形一致は、“bevy of actresses”であり、ローカライゼーションエンジン504は、このテキストを使用して、トークン“$1”を解析する。カウントが20の場合には、“f20=”識別子が、ローカライゼーションエンジン504がより広義の識別子“f3+=”に達する前の成功の女性名詞一致であり、したがって、ローカライゼーションエンジン504は、“f20=”識別子で停止し、定義された変形テキストを使用した。ソフトウェアアプリケーションによって供給される性別が男性である場合には、ローカライゼーションエンジン504は、各例でそれぞれ“rat pack”および“beefcake stack”を供給したものとなっている。
{v}buys{1s=buy,2s=buy,1p=buy,2p=buy,3p=buy}
{v}buy{3s=buys}
これらの3つの方法は、ローカライゼーションエンジン504によって実施される時に実質的に同一の効果を有する。特定の形態が変形から欠けている場合に、ローカライゼーションエンジン504は、デフォルトのベーステキストを使用する。この例では、“1s”は、一人称単数形変形テキストを識別し、“2s”は、二人称単数形変形テキストを識別し、“3s”は、三人称単数形変形テキストを識別し、“1p”は、一人称複数形変形テキストを識別し、“2p”は、二人称複数形変形テキストを識別し、“3p”は、三人称複数形変形テキストを識別する。動詞“buy”について、語形変化は、三人称単数形の場合を除いて同一である。したがって、最後の方法に示されているように、三人称単数形変形テキストだけを定義する必要がある。
1 “{v}cost{3s=costs}”
2 “{n}platinum{pl=-}”, 3
テンプレート “$T $1|t +2 $2.”
出力 “A snake egg costs 3 platinum.”
現在の例では、ローカライゼーションエンジン504は、動詞“cost”の三人称単数形を使用しなければならないと判定し、三人称単数形は、メタデータを用いて”costs”と定義されている。したがって、“$1|t”トークンは、動詞テキスト“costs”を用いて解析される。次の例では、ターゲットのカウントが20に増やされ、したがって、動詞“cost”の三人称複数形が使用されなければならない。
1 “{v}cost{3s=costs}”
2 “{n}platinum{pl=-}”, 60
テンプレート “$T $1|t +2 $2
出力 “20 snake eggs cost 60 platinum.”
三人称複数識別子がメタデータに現れていないので、ローカライゼーションエンジン504は、この動詞にデフォルトまたはベーステキストを使用し、このデフォルトは、この場合には三人称複数形の正しい形である。
ターゲット “orc pawn”, 1, male, subhuman
聞く人 “Galadriel”, 1, female, human
テンプレート “\413|L”
出力 “Attacking an orc pawn, mistress.”
上の例では、聞く人について供給される性別コンテキストが、女性であり、したがって、ローカライゼーションエンジン504は、ルックアップテーブルアドレス“413”の女性の性別について識別された変形句を使用し、ターゲットについて供給されたコンテキストに従って、この変形句についてテンプレートを解析する。
ターゲット “orc pawn”, 1, male, subhuman
聞く人 “Gandalf”, 1, male, human
テンプレート “\413|L”
出力 “Attacking an orc pawn, master.”
この例では、聞く人について供給される性別コンテキストが、男性であり、したがって、ローカライゼーションエンジン504は、ルックアップテーブルアドレス“413”のベーステキストまたはデフォルト句を使用し、ターゲットについて供給されたコンテキストを使用して、このデフォルト句テンプレートを解析する。
ターゲット “orc pawn”, 1, male, subhuman
聞く人 “Galadriel”, 1, female, human
テンプレート “\414"
出力 “Attacking an orc pawn, mistress.”
この例では、結果は、基本句({p})が補足詳細と組み合わせて使用された場合と同一であるが、TMLテキストテンプレートは、聞く人のコンテキストを使用するようにローカライゼーションエンジン504に指示する補足情報がテンプレートから除去されているので、より短い。
聞く人 “Jane”, female
0 “\414"
\414 “{ps}I tore my shirt{f=‘I tore my dress’}”
テンプレート “$S says, ‘$0’.”
出力 “Bob says, 'I tore my shirt.'”
話す人 “Fido"
聞く人 “Jane”, female
0 “\415"
\415 “{pl}My master $L loves me{f=‘My mistress loves me’}”
テンプレート “$S says, ‘$0’.”
出力 “Fido says, ‘My mistress Jane loves me.’”
上の例では、トークン“$0”に使用される性別およびカウントが、聞く人または話す人のいずれかに対して参照され、そのような指定が、TMLテキストテンプレート内に“$0|L”または“$0|S”の形で現れる必要がない場合に、同一のテンプレートを使用することができる。
1 “beautiful”, 0
2 “silver”, 0
テンプレート “You buy <1 $1 $2 $0”
一実施形態で、ソース言語TMLテキストテンプレートおよび関連するメタデータは、それぞれが事前定義のアドレスを有するチャートまたはテーブル内で供給される。ソース言語TMLテキストテンプレートと関連するベーステキストおよびメタデータとのステップ804での受取に続いて、トランスレータは、ベーステキストを翻訳し、ターゲット言語に関する必要に応じてメタデータを追加し、変更する。現在の例では、ターゲット言語はフランス語であり、ソース言語メタデータを、ステップ806でそれ相応に変更することができ、ベーステキストを次のように翻訳して、ベーステキストの変形の諸形態およびデフォルト性別を定義することができる。
1 “{ap}beau{ma=bel, fs=belle, fp=belles}”, 0
2 “{a}argente{}”, 0
上で述べたように、番号付き引数に割り当てられる単語の品詞は、コンテキスト内でメタデータを用いて指定される。フランス語などの複数の言語で、名詞ともう1つ以上の形容詞の順序は、英語テンプレートからの順序が使用される場合に文法的に正しくない場合がある。したがって、品詞指定{n}、{ap}、{a}は、一部の地域別の設定情報(ロケール)について、文法的に正しいテキストを生成する際に有用である。追加の変形テキスト識別子が、フランス語ターゲット言語に固有の現在の例で番号付き引数“1”に関するコンテキストで使用される。具体的に言うと、識別子“ma”は、形容詞“beau”の男性名詞第二形(masculine aspire form)すなわち、形容詞が母音または無音の“h”から始まる男性名詞の前に置かれる時の形を指定する。ターゲット言語ごとに、そのターゲット言語に独特の追加の変形テキスト識別子を使用することができ、あるいは、いくつかの地域別の設定情報に共通の識別子を使用することもできる。
現在の例では、マクロトークンは、フランス語の文法的規則に従って、ターゲット言語にローカライズされたテンプレートに適用され、トランスレータ開発ツールは、番号付き引数“1”および“2”の変更されたメタデータを分析して、形容詞のタイプを判定する。この例では、番号付き引数“1”は、接頭形容詞を定義し、番号付き引数“2”は、接尾形容詞を定義する。ローカライゼーションエンジン504でコーディングされたフランス語の文法的規則に従って、ローカライゼーションエンジン504は、マクロを展開し、次のターゲット言語にローカライズされたテンプレートを生成するはずである。
ステップ812でのターゲット言語にローカライズされたテンプレートへの拡張トークン(複数)の適用に続いて、トランスレータは、ステップ814で、ターゲット言語TMLテキストテンプレートおよび関連するメタデータの正確さを検証する。この検証は、たとえばトランスレータ開発ツール36および図9に示されたトランスレータインターフェース900を使用して実行することができる。ターゲット言語TMLテキストテンプレートおよび関連するメタデータが不正確である場合には、トランスレータは、TMLテキストテンプレートおよびメタデータが、ローカライゼーションエンジン504によって展開された時にターゲット言語で文法的に正しいテキスト文字列を作るように、メタデータおよび/またはターゲット言語TMLテキストテンプレートを変更することができる。ステップ814でターゲット言語TMLテキストテンプレートおよび関連するメタデータの正確さが検証された時に、方法800はステップ816で終了する。
%:主格代名詞(ich/du/er-sie-esなど)
#:対格代名詞(mich/dich/inh-sie-esなど)
~:与格代名詞(mir/dir/ihm-ihr-ihmなど)
*:再帰代名詞 (mich/dich/sich、mir/dir/sichなど)
&:所有格形容詞(mein/dein/sein-ihr-seinなど)
<:不定冠詞(ein*/kein*/einige/viele)
>:定冠詞(der/die/das、den/die/das、dem/der/dem、des/der/desなど)
+:目的語のカウント/個数
^:名詞の属格形(Kunden)
=:直接話法(コンテキストからの性別および尊敬形、Herr/Dame)
トランスレータは、指定された文法規則のこの組を使用して、ターゲット言語TMLテキストテンプレートを定義することができる。
1 “beautiful”, 0
2 “silver”, 0
テンプレート “You buy <1 $1 $2 $0”
ステップ1006で、ローカライゼーションエンジン504は、TMLルックアップモジュール506の援助によってソース言語TMLテキストテンプレートおよびソース言語コンテキストをメモリ内でルックアップし、次の対応するターゲット言語TMLテキストテンプレートおよびターゲット言語のコンテキストを入手するが、現在の例のターゲット言語は、フランス語である。
1 “{ap}beau{ma=bel,fs=belle,fp=belles}”, 0
2 “{a}argente{}”, 0
テンプレート “Vous achette \noun($0, $1, $2)”
ステップ1008で、ローカライゼーションエンジン504は、ターゲット言語コンテキストと共に供給されたメタデータを使用して、ターゲット言語コンテキストをターゲット言語TMLテキストテンプレートトークンに適用する。ステップ1010で、ローカライゼーションエンジン504は、現在の例ではターゲット言語のフランス語の規則であるターゲット言語文法規則に従って、ターゲット言語TMLテキストテンプレートを展開する。フランス語の文法規則に従って、ターゲット言語TMLテキストテンプレートが展開され、このテンプレートは、次の展開されたてプレートに置換されるはずである。
ステップ1012で、ローカライゼーションエンジン504は、翻訳アプリケーションインターフェース502を介して、次の文法的に正しいストリングを出力するはずである。
ステップ1014で、ディスプレイモジュール302が、このターゲット言語の文法的に正しいテキスト文字列を表示し、この方法は、ステップ1016で終了する。
Claims (23)
- マークアップ言語テキストテンプレートを生成する方法であって、
ソース言語テキストストリング内の可変テキスト要素を識別し、第1の事前定義の記号を前記可変テキスト要素に割り当てることと、
前記可変テキスト要素の文法的規則を識別し、前記識別された文法的規則に基づいて、第2の事前定義の記号を前記可変テキスト要素に割り当てることと、
補足情報を前記可変テキスト要素に割り当てるかどうかを判定することであって、前記第1の事前定義の記号、前記第2の事前定義の記号、および前記補足情報は、割り当てられる場合にトークンを表す、判定することと、
1つまたは複数のトークンを含むマークアップ言語テキストテンプレートを完成するために、前記ソース言語テキストストリング内の残りの可変テキスト要素について、文法的規則の識別、第1および第2の事前定義の記号の割当、および補足情報を割り当てるかどうかの判定を繰り返すことと
を含む方法。 - 前記補足情報は、前記可変テキスト要素の変更に関する追加情報のソースに対応するアドレスを含む、請求項1に記載の方法。
- 可変テキスト要素は、動詞であり、前記動詞可変テキスト要素に関する前記補足情報は、前記動詞の主語の性別、カウント、年齢、形式、および党派のうちの少なくとも1つを含む、請求項1に記載の方法。
- 前記動詞可変テキスト要素に関する前記補足情報は、デフォルト情報を含む、請求項3に記載の方法。
- 前記デフォルト情報は、男性性別、単数可算、一人称話法、および通常党派を含む、請求項4に記載の方法。
- 可変テキスト要素は、形容詞であり、前記形容詞可変テキスト要素に関する前記補足情報は、前記形容詞によって修飾される名詞の性別、文法的格、およびカウントと、前記テキストストリング内のその名詞の位置決めに関する文法的格とのうちの少なくとも1つを含む、請求項1に記載の方法。
- 前記補足情報は、前記可変テキスト要素を変更するコマンドを含む、請求項1に記載の方法。
- 前記コマンドは、大文字化、一人称話法、二人称話法、三人称話法、対格話法、主格話法、過去時制、現在時制、未来時制、分詞形、および不定詞形のうちの少なくとも1つを含む、請求項7に記載の方法。
- 前記第1の事前定義の記号は、英数字文字を含む、請求項1に記載の方法。
- 前記第1の事前定義の記号は、動作主、ターゲット、現在の動作主のペット、現在の動作主の主君、番号付き引数、およびポインタのうちの1つに対応する、請求項1に記載の方法。
- 前記第2の事前定義の記号は、名詞、動詞、形容詞、主格代名詞、対格代名詞、与格代名詞、再帰代名詞、所有格形容詞、不定冠詞、定冠詞、カウント、および名詞の属格形のうちの1つに対応する、請求項1に記載の方法。
- ターゲット言語の文法的に正しいテキストストリングを出力するために命令を実行するプログラムを含むコンピュータ可読媒体であって、前記命令は、
対応する可変テキスト要素を表す1つまたは複数のトークンを含むマークアップ言語テキストテンプレートであって、トークンは、
可変テキスト要素に関連する文法規則に少なくとも部分的に基づいて割り当てられる第1の事前定義の記号であって、前記命令は、少なくとも1つの可変テキスト要素を含むソース言語テキストストリングに基づく、第1の事前定義の記号と、
前記可変テキスト要素に関して割り当てられるベーステキストになるように構成された可変物である第2の事前定義の記号と
を含む、マークアップ言語テキストテンプレート
を含む、コンピュータ可読媒体。 - 前記トークンは、さらに、補足情報を含む、請求項12に記載のコンピュータ可読媒体。
- 前記補足情報は、前記可変テキスト要素の変更に関する追加情報のソースに対応するアドレスを含む、請求項13に記載のコンピュータ可読媒体。
- 可変テキスト要素は、動詞であり、前記動詞可変テキスト要素に関する前記補足情報は、前記動詞の主語の性別、カウント、年齢、形式、および党派のうちの少なくとも1つを含む、請求項13に記載のコンピュータ可読媒体。
- 前記動詞可変テキスト要素に関する前記補足情報は、デフォルト情報を含む、請求項15に記載のコンピュータ可読媒体。
- 前記デフォルト情報は、男性性別、単数可算、一人称話法、および通常党派を含む、請求項16に記載のコンピュータ可読媒体。
- 可変テキスト要素は、形容詞であり、前記形容詞可変テキスト要素に関する前記補足情報は、前記形容詞によって修飾される名詞の性別、文法的格、およびカウントと、前記テキストストリング内のその名詞の位置決めに関する文法的格とのうちの少なくとも1つを含む、請求項13に記載のコンピュータ可読媒体。
- 前記補足情報は、前記可変テキスト要素を変更するコマンドを含む、請求項13に記載のコンピュータ可読媒体。
- 前記コマンドは、大文字化、一人称話法、二人称話法、三人称話法、対格話法、主格話法、過去時制、現在時制、未来時制、分詞形、および不定詞形のうちの少なくとも1つを含む、請求項19に記載のコンピュータ可読媒体。
- 前記第2の事前定義の記号は、英数字文字を含む、請求項12に記載のコンピュータ可読媒体。
- 前記第2の事前定義の記号は、動作主、ターゲット、現在の動作主のペット、現在の動作主の主君、番号付き引数、およびポインタのうちの1つに対応する、請求項12に記載のコンピュータ可読媒体。
- 前記第1の事前定義の記号は、名詞、動詞、形容詞、主格代名詞、対格代名詞、与格代名詞、再帰代名詞、所有格形容詞、不定冠詞、定冠詞、カウント、および名詞の属格形のうちの1つに対応する、請求項12に記載のコンピュータ可読媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/985,351 | 2004-11-09 | ||
US10/985,351 US7711544B2 (en) | 2004-11-09 | 2004-11-09 | System and method for generating markup language text templates |
PCT/US2005/039649 WO2006057781A2 (en) | 2004-11-09 | 2005-11-02 | System and method for generating markup language text templates |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008520041A true JP2008520041A (ja) | 2008-06-12 |
JP5172348B2 JP5172348B2 (ja) | 2013-03-27 |
Family
ID=36317442
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007541239A Active JP5172348B2 (ja) | 2004-11-09 | 2005-11-02 | 文法的に正しいテキスト文字列を生成するシステムおよび方法 |
Country Status (3)
Country | Link |
---|---|
US (2) | US7711544B2 (ja) |
JP (1) | JP5172348B2 (ja) |
WO (1) | WO2006057781A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015019774A1 (ja) * | 2013-08-09 | 2015-02-12 | シャープ株式会社 | データ生成装置、データ生成方法、翻訳処理装置、プログラム、およびデータ |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7548849B2 (en) * | 2005-04-29 | 2009-06-16 | Research In Motion Limited | Method for generating text that meets specified characteristics in a handheld electronic device and a handheld electronic device incorporating the same |
US20070027670A1 (en) * | 2005-07-13 | 2007-02-01 | Siemens Medical Solutions Health Services Corporation | User Interface Update System |
US7636656B1 (en) | 2005-07-29 | 2009-12-22 | Sun Microsystems, Inc. | Method and apparatus for synthesizing multiple localizable formats into a canonical format |
US7571092B1 (en) | 2005-07-29 | 2009-08-04 | Sun Microsystems, Inc. | Method and apparatus for on-demand localization of files |
US8126702B2 (en) * | 2005-08-01 | 2012-02-28 | Sap Ag | Translating data objects |
US7739586B2 (en) * | 2005-08-19 | 2010-06-15 | Microsoft Corporation | Encoding of markup language data |
WO2007120418A2 (en) * | 2006-03-13 | 2007-10-25 | Nextwire Systems, Inc. | Electronic multilingual numeric and language learning tool |
US8260602B1 (en) * | 2006-11-02 | 2012-09-04 | The Math Works, Inc. | Timer analysis and identification |
JP2008146295A (ja) * | 2006-12-08 | 2008-06-26 | Ricoh Co Ltd | 情報処理装置と情報処理方法とプログラムとコンピュータ読み取り可能な記録媒体 |
US8799856B2 (en) | 2007-06-12 | 2014-08-05 | International Business Machines Corporation | System and method for automatically declaring variables |
US20080312902A1 (en) * | 2007-06-18 | 2008-12-18 | Russell Kenneth Dollinger | Interlanguage communication with verification |
US9594748B2 (en) * | 2007-10-25 | 2017-03-14 | Disney Enterprises, Inc. | System and method for localization of assets using dictionary file build |
US8364469B2 (en) * | 2007-11-26 | 2013-01-29 | Red Hat, Inc. | Natural language enhanced user interface in a business rule management system |
KR20100134618A (ko) * | 2008-02-29 | 2010-12-23 | 샤프 가부시키가이샤 | 정보 처리 장치, 방법 및 기록 매체 |
US8543377B2 (en) * | 2010-07-29 | 2013-09-24 | Intuit Inc. | Using linguistically-aware variables in computer-generated text |
US9223859B2 (en) * | 2011-05-11 | 2015-12-29 | Here Global B.V. | Method and apparatus for summarizing communications |
US9372844B2 (en) * | 2011-10-01 | 2016-06-21 | Oracle International Corporation | Automatically generating a business process flow GUI using a symbolic annotation language |
US8712761B2 (en) * | 2011-11-22 | 2014-04-29 | Google Inc. | Techniques for performing translation of messages |
US9152619B2 (en) | 2012-05-21 | 2015-10-06 | Google Inc. | System and method for constructing markup language templates and input data structure specifications |
GB2511667A (en) * | 2012-11-06 | 2014-09-10 | Intuit Inc | Stack-based adaptive localization and internationalization of applications |
US9575965B2 (en) * | 2013-03-13 | 2017-02-21 | Red Hat, Inc. | Translation assessment based on computer-generated subjective translation quality score |
US9411804B1 (en) * | 2013-07-17 | 2016-08-09 | Yseop Sa | Techniques for automatic generation of natural language text |
US10037317B1 (en) * | 2013-07-17 | 2018-07-31 | Yseop Sa | Techniques for automatic generation of natural language text |
JP5748381B1 (ja) * | 2014-07-31 | 2015-07-15 | 楽天株式会社 | メッセージ処理装置、メッセージ処理方法、記録媒体およびプログラム |
US10331792B1 (en) * | 2015-10-19 | 2019-06-25 | Tg Inc | Localization of embedded databases |
US10521253B2 (en) * | 2016-06-28 | 2019-12-31 | International Business Machines Corporation | Framework for automated globalization enablement on development operations |
CN108021360B (zh) * | 2016-11-04 | 2021-03-05 | 华为技术有限公司 | 规则处理方法、代码处理方法及相关设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0318969A (ja) * | 1989-06-15 | 1991-01-28 | Nec Corp | 日本語文法登録エディタ装置 |
JP2002297588A (ja) * | 2001-03-30 | 2002-10-11 | Fujitsu Ltd | 訳例辞書の自動生成方法およびプログラムおよび装置 |
JP2003330926A (ja) * | 2002-05-14 | 2003-11-21 | Nippon Telegr & Teleph Corp <Ntt> | 翻訳方法、翻訳装置及び翻訳プログラム |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3220560B2 (ja) * | 1992-05-26 | 2001-10-22 | シャープ株式会社 | 機械翻訳装置 |
US6760695B1 (en) * | 1992-08-31 | 2004-07-06 | Logovista Corporation | Automated natural language processing |
US5608622A (en) * | 1992-09-11 | 1997-03-04 | Lucent Technologies Inc. | System for analyzing translations |
US6470306B1 (en) * | 1996-04-23 | 2002-10-22 | Logovista Corporation | Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens |
US6275789B1 (en) * | 1998-12-18 | 2001-08-14 | Leo Moser | Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language |
US6356865B1 (en) * | 1999-01-29 | 2002-03-12 | Sony Corporation | Method and apparatus for performing spoken language translation |
US6912538B2 (en) * | 2000-10-20 | 2005-06-28 | Kevin Stapel | System and method for dynamic generation of structured documents |
CN1529861B (zh) * | 2000-11-07 | 2010-12-29 | 阿斯科瑞帕兹公司 | 由语言输入创建数据库和结构化信息的系统及方法 |
US6665642B2 (en) * | 2000-11-29 | 2003-12-16 | Ibm Corporation | Transcoding system and method for improved access by users with special needs |
JP4330285B2 (ja) * | 2001-04-16 | 2009-09-16 | 沖電気工業株式会社 | 機械翻訳用辞書登録装置、機械翻訳用辞書登録方法、機械翻訳装置、機械翻訳方法及び記録媒体 |
EP1349079A1 (en) * | 2002-03-28 | 2003-10-01 | BRITISH TELECOMMUNICATIONS public limited company | Machine translation |
US7257575B1 (en) * | 2002-10-24 | 2007-08-14 | At&T Corp. | Systems and methods for generating markup-language based expressions from multi-modal and unimodal inputs |
EP1576586A4 (en) * | 2002-11-22 | 2006-02-15 | Transclick Inc | LANGUAGE TRANSLATION SYSTEM AND METHOD |
US7383542B2 (en) * | 2003-06-20 | 2008-06-03 | Microsoft Corporation | Adaptive machine translation service |
US7412388B2 (en) * | 2003-12-12 | 2008-08-12 | International Business Machines Corporation | Language-enhanced programming tools |
US7526490B2 (en) * | 2004-06-08 | 2009-04-28 | Oracle International Corporation | Method of and system for providing positional based object to XML mapping |
US20060253273A1 (en) * | 2004-11-08 | 2006-11-09 | Ronen Feldman | Information extraction using a trainable grammar |
-
2004
- 2004-11-09 US US10/985,351 patent/US7711544B2/en not_active Ceased
-
2005
- 2005-11-02 JP JP2007541239A patent/JP5172348B2/ja active Active
- 2005-11-02 WO PCT/US2005/039649 patent/WO2006057781A2/en active Application Filing
-
2011
- 2011-05-04 US US13/101,004 patent/USRE43861E1/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0318969A (ja) * | 1989-06-15 | 1991-01-28 | Nec Corp | 日本語文法登録エディタ装置 |
JP2002297588A (ja) * | 2001-03-30 | 2002-10-11 | Fujitsu Ltd | 訳例辞書の自動生成方法およびプログラムおよび装置 |
JP2003330926A (ja) * | 2002-05-14 | 2003-11-21 | Nippon Telegr & Teleph Corp <Ntt> | 翻訳方法、翻訳装置及び翻訳プログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015019774A1 (ja) * | 2013-08-09 | 2015-02-12 | シャープ株式会社 | データ生成装置、データ生成方法、翻訳処理装置、プログラム、およびデータ |
Also Published As
Publication number | Publication date |
---|---|
WO2006057781A3 (en) | 2006-12-14 |
US7711544B2 (en) | 2010-05-04 |
USRE43861E1 (en) | 2012-12-11 |
US20060100858A1 (en) | 2006-05-11 |
WO2006057781A2 (en) | 2006-06-01 |
JP5172348B2 (ja) | 2013-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5172348B2 (ja) | 文法的に正しいテキスト文字列を生成するシステムおよび方法 | |
JP5280685B2 (ja) | 文法的に正しいテキスト文字列を生成するシステムおよび方法 | |
JP5209319B2 (ja) | 文法的に正しいテキスト文字列を生成するシステムおよび方法 | |
CN1618064B (zh) | 翻译方法与计算机设备 | |
US20160163314A1 (en) | Dialog management system and dialog management method | |
JP2004502241A (ja) | オンライン環境内で複数言語コンテンツを提供する装置及びその方法 | |
JP5540335B2 (ja) | 自然言語文生成装置及びコンピュータプログラム | |
JPS6091450A (ja) | テ−ブル型言語翻訳器 | |
US8812294B2 (en) | Translating phrases from one language into another using an order-based set of declarative rules | |
JP2012078647A (ja) | 言語モデル学習装置及びコンピュータプログラム | |
JPS61255469A (ja) | 言語生成装置 | |
CN107247612A (zh) | 作业描述方法及装置 | |
US7296260B2 (en) | System and method for composing a multi-lingual instructional software | |
KR20190037988A (ko) | 복합명사 분석장치 및 방법, 컴퓨터 프로그램 | |
Teixeira et al. | Services to support use and development of speech input for multilingual multimodal applications for mobile scenarios | |
Mitrache | Intertäxtualität und Phraseologie in den drei Versionen der Panne von Friedrich Dürrenmatt: Aspekte von Groteske und Ironie | |
JP4986549B2 (ja) | 電子機器、その制御方法、および、翻訳文出力用プログラム | |
JP2790886B2 (ja) | 日本語文推敲装置 | |
JP3051747B2 (ja) | 機械翻訳方法及び機械翻訳システム | |
JP3892227B2 (ja) | 機械翻訳システム | |
JP4399154B2 (ja) | 翻訳装置、及び翻訳プログラム | |
JP2004264960A (ja) | 用例ベースの文変換装置、およびコンピュータプログラム | |
KR20220105551A (ko) | 사전 저장된 번역 결과를 활용하여 기계 번역에 대한 보완을 수행하는 문서 번역 서비스 서버 및 그 동작 방법 | |
JPH03222069A (ja) | 機械翻訳装置 | |
JP2008027458A (ja) | 機械翻訳プログラム、機械翻訳装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080930 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20100702 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100702 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110905 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111205 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120521 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120821 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120828 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120921 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5172348 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |