JP2014519074A - キーワードのローカライズ翻訳 - Google Patents

キーワードのローカライズ翻訳 Download PDF

Info

Publication number
JP2014519074A
JP2014519074A JP2014506551A JP2014506551A JP2014519074A JP 2014519074 A JP2014519074 A JP 2014519074A JP 2014506551 A JP2014506551 A JP 2014506551A JP 2014506551 A JP2014506551 A JP 2014506551A JP 2014519074 A JP2014519074 A JP 2014519074A
Authority
JP
Japan
Prior art keywords
keyword
keywords
target language
language
corpus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014506551A
Other languages
English (en)
Inventor
マンダヤム・ソンダヌール・ラグナス
Original Assignee
グーグル・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グーグル・インコーポレーテッド filed Critical グーグル・インコーポレーテッド
Publication of JP2014519074A publication Critical patent/JP2014519074A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

一実装形態では、方法は、1つまたは複数の第1キーワードをソース言語からターゲット言語に翻訳する要求を受信するステップと、機械翻訳処理を使用して、第1キーワードをソース言語からターゲット言語の複数の第2キーワードに翻訳するステップとを含む。本方法は、コンピュータシステムによって、ターゲット言語に関連付けられるコーパス内でそれぞれの第2キーワードが出現する頻度を決定するステップも含みうる。本方法は、コンピュータシステムによって、決定された出現頻度に基づいてターゲット言語で使用するために第2キーワードのサブセットを選択するステップをさらに含みうる。

Description

本明細書は、一般的に情報提示について記載する。
[関連出願の相互参照]
本出願は、2011年4月21日に出願された米国特許出願第13/091,272号「LOCALIZED TRANSLATION OF KEYWORDS」の優先権を主張し、その開示を参照により本明細書に組み込む。
キーワード(たとえば、単語、語句、頭字語、略語、タグ、または他のメタデータ)は、様々なコンピュータシステムと組み合わせて使用されている。たとえば、キーワードは、画像やビデオの主題を示すために画像やビデオに関連付けられている。このようなキーワードは、ユーザからの検索クエリに関連する画像およびビデオを識別するために、画像およびビデオ検索システムによって使用されている。
他の例では、コンピュータベースの広告システムは、広告主が、潜在的に興味のあるユーザに関連付けられる広告機会を識別するために使用できるキーワードを選択できるように構成されている。広告機会は、検索結果と共に提示される広告、Webページと共に提示されるバナー広告、電子ビデオの開始時に再生されるビデオ広告などの、ユーザに広告を提供する(たとえば表示する、または聞こえるように出力する)機会を含む。たとえば、新たな低燃費車の広告を提示したい広告主は、「低燃費自動車」、「低燃費車」、「低燃費車両」、「mpg(「1ガロン当たりのマイル」の意)」、および「高mpg」などの、広告に関連する様々なキーワードを選択できる。広告主の広告は、とりわけ(たとえば、広告オークションの結果)、ユーザの検索クエリ(たとえば、「高mpg車」)と選択された広告キーワードとの比較に基づいて、ユーザの検索クエリへの検索結果とともに提示されうる。
ソース言語からターゲット言語にキーワードを翻訳するために、機械翻訳技術が使用されている。たとえば、例示的な機械翻訳技術は、ソース言語の単語とターゲット言語の単語との間のマッピングを使用してキーワードを翻訳することができる。
本明細書は、一般的に、ソース言語からターゲット言語へのキーワードのローカライズ翻訳について記載する。キーワードのローカライズ翻訳は、ソース言語(たとえば、英語)で特定の意味を伝えるキーワードを、ターゲット言語(たとえば、フランス語)で類似のローカライズされた意味を伝えるキーワードに翻訳することを含む。このようなキーワードのローカライズ翻訳は、たとえば、ターゲット言語の検索クエリのコーパスなどの、ターゲット言語に関連付けられる様々なコーパスを使用して実行されうる。ターゲット言語のコーパスは、ターゲット言語内の共通の、および/または頻繁に出現するキーワードを、そのターゲット言語のユーザによって実際に使用されるものとして有機的に識別するために分析されうる。
一実装形態では、方法は、1つまたは複数の第1キーワードをソース言語からターゲット言語に翻訳する要求を受信するステップと、機械翻訳処理を使用して、第1キーワードをソース言語からターゲット言語の複数の第2キーワードに翻訳するステップとを含む。本方法は、コンピュータシステムによって、ターゲット言語に関連付けられるコーパス内でそれぞれの第2キーワードが出現する頻度を決定するステップも含みうる。本方法は、コンピュータシステムによって、決定された出現頻度に基づいてターゲット言語で使用するために第2キーワードのサブセットを選択するステップをさらに含みうる。
他の実装形態では、ソース言語からターゲット言語にキーワードを翻訳するためのシステムは、1つまたは複数のコンピュータと、1つまたは複数の第1キーワードをソース言語からターゲット言語に翻訳する要求を受信するように構成されたコンピュータへのインターフェースとを含む。本システムは、第1キーワードをソース言語からターゲット言語の複数の第2キーワードに翻訳するように構成されたコンピュータの機械翻訳モジュールも含みうる。本システムは、ターゲット言語に関連付けられるコーパス内でそれぞれの第2キーワードが出現する頻度を決定するように構成されたコンピュータのキーワード頻度モジュールをさらに含みうる。本システムは、決定された出現頻度に基づいてターゲット言語で使用するために第2キーワードのサブセットを選択するように構成されたコンピュータのキーワード選択コンポーネントをさらに含みうる。
他の実装形態では、コンピュータ可読媒体上で符号化されたコンピュータプログラム製品は、データ処理装置に、1つまたは複数の第1キーワードをソース言語からターゲット言語に翻訳する要求を受信するステップと、機械翻訳処理を使用して、第1キーワードをソース言語からターゲット言語の複数の第2キーワードに翻訳するステップとを含む動作を実施させるように動作可能である。本動作は、ターゲット言語に関連付けられるコーパス内でそれぞれの第2キーワードが出現する頻度を決定するステップをさらに含みうる。本動作は、決定された出現頻度に基づいて、ターゲット言語で使用するために第2キーワードのサブセットを選択するステップも含みうる。
1つまたは複数の実施形態の詳細は、添付の図面および以下の記述において説明する。開示されたシステム、装置、および方法によって、0、1つ、または複数の利点が提供されうる。たとえば、従来の機械翻訳処理を通して翻訳されたキーワードよりも、一般的な使用法を考慮する翻訳されたキーワードの方が、ソース言語からキーワードの意味をより正確に伝えることができる。他の例では、人による翻訳よりも迅速かつ低コストで、ソース言語からターゲット言語に正確にキーワードを翻訳することができる。さらに、キーワード翻訳の精度は、人による翻訳に類似している(または、さらに優れている)。さらなる例では、言語の使用法における地域差をキーワード翻訳に容易に組み込むことができる。たとえば、このような情報を翻訳に組み込むために、調査、ポーリング、または地域差の知識を持つ翻訳者が必要ない場合がある。他の例では、キーワードの使用法の経時的な変化を正式に認識することなしに、言語におけるそのような変化をキーワード翻訳に有機的かつ自動的に組み込むことができる。
他の特徴、目的、および利点は、説明および図面、ならびに特許請求の範囲から明らかになるであろう。
例示的なローカライズ翻訳サーバシステムの概念図である。 キーワードのローカライズ翻訳を提供するための例示的システムを示す図である。 ソース言語からターゲット言語への、1つまたは複数のキーワードのローカライズ翻訳を提供するための例示的方法を示す図である。 本明細書に記載のシステムおよび方法を実装するために使用されうるコンピューティングデバイスのブロック図である。
様々な図面における同様の参照記号は、同様の要素を示す。
本明細書は、一般的に、ソース言語からターゲット言語へのキーワードのローカライズ翻訳を記述する。たとえば、英語ユーザをターゲットにするために英語でキーワードを生成した当事者は、それらのキーワードを、フランス語などの他の言語のユーザをターゲットにするために他の言語に翻訳することに関心がある場合がある。当事者は、ソース言語のユーザを効率的にターゲットにすることが分かったキーワードのセットに到達する前に、いくつかの改訂を経ることがしばしばある。このようなソース言語のキーワードをローカライズ翻訳することによって、当事者は、ソース言語のキーワードを開発および改良するために使用された作業成果のうちのいくつかを、ターゲット言語のキーワードに持ち越すことができるようになる。
言語から言語への辞書(たとえば、英仏辞書)を使用するキーワードの単なる翻訳は、ソース言語のキーワードと同じ意味を有する、正確でローカライズされたターゲット言語のキーワードを生み出す可能性が低い。効果的なキーワードは、ある言語において単語および語句が何を意味するかというローカライズ知識に基づいて選択されるものであり、言語から言語への辞書では正確に反映されない、または機械翻訳技術によっては提供されない傾向がある。たとえば、英仏辞書を使用して「car insurance(自動車保険)」という語句を英語からフランス語に翻訳すると、「l'assurance automobile」という語句が生じる傾向がある。しかし、フランス語を話す人は、自動車保険に言及する際には「l'assurance voiture」という語句をより一般的に使用する。このようなキーワードを効果的に翻訳するためには、「car insurance」および「l'assurance voiture」がそれぞれ英語およびフランス語で何を意味するかというローカライズ知識が有用である。
このようなキーワードを翻訳するために人による翻訳が使用されてきたが、人による翻訳はコストおよび時間がかかる場合があり、ソース言語とターゲット言語との両方のローカライズ知識を有する翻訳者を見つけるのが難しい場合がある。
本明細書は、人による翻訳なしの、広告キーワードなどのキーワードのローカライズ翻訳を記述する。記述される技術、方法、システム、およびコンピュータプログラム製品は、ターゲット言語に関連付けられるコーパス(たとえば、文書、検索ログ、ソーシャルネットワークコンテンツ等)を使用して、ローカライズされたキーワードを提供することを対象とする。ターゲット言語のキーワードの最良の翻訳を示すためにこのようなコーパスを使用することによって、ローカリゼーションが有機的に実現される。このようなコーパスに含まれる情報は、ユーザのプライバシー保護のために匿名化されうる。
コーパスは、ユーザを識別できる、および/またはユーザに関する詳細を提供できる情報を含みうる。たとえば、検索ログのコーパスは、検索クエリの記録、および検索クエリが送信されたコンピュータのインターネットプロトコル(IP)アドレスを含みうる。ユーザはこのようなIPアドレス情報から識別されうる。ユーザのプライバシー保護のために、ユーザを識別する情報、またはユーザについての詳細を提供する情報は削除および/または遮蔽されうるので、コーパスからプライベートなユーザ情報を取得または推測することはできない。
一例をあげると、複数の候補キーワード翻訳のうちのいずれがソース言語のキーワードの最良の翻訳でありそうかを決定するために、ターゲット言語の検索ログのコーパス(たとえば、ユーザによって検索エンジンに提出された検索クエリのログ)が使用されうる。このような決定は、検索ログにおける候補キーワードごとの出現頻度などの様々な要因に基づきうる。たとえば、検索ログに最も高い頻度で出現するターゲット言語の1つまたは複数の候補キーワードが、ソース言語のキーワードの最良の翻訳として選択されうる。
上記の「car insurance」の例を拡大して、ある広告主がキーワード「car insurance」を英語からフランス語に翻訳したいとする。キーワードは、まずフランス語のいくつかの候補キーワードに翻訳されうる(たとえば、機械翻訳処理を使用して、または言語から言語への電子辞書を使用して)。たとえば、候補キーワードは、「l'assurance automobile」および「l'assurance voiture」などの様々なキーワードを含みうる。フランス語を話すローカルの人によって理解されるような、フランス語での「car insurance」に最も似ているのはどの候補キーワードかを決定するために、それぞれの候補キーワードはフランス語のコーパス(たとえば、検索ログ、ウェブページ、ソーシャルネットワークコンテンツ)に照らして調べられうる。これらの候補キーワードを、それぞれのこれらの用語がコーパス内で出現する頻度などのフランス語のコーパスに照らして評価するために、様々なメトリクスが使用されうる。たとえば、候補キーワード「l'assurance voiture」の方が候補キーワード「l'assurance automobile」よりも頻繁に出現する場合、「l'assurance voiture」が「car insurance」のより良いローカライズ翻訳として仮定されて、フランス語で使用するために選択されうる。
ローカライズ翻訳は、広告キーワード、および/またはコンテンツに関連付けられる記述キーワード(たとえば、画像、ビデオ、記事等の主題を記述するキーワード)などの、任意の様々なコンテンツを翻訳するために使用されうる。たとえば、広告主は、広告キャンペーン(たとえば、特定の製品/サービスの広告の集まり)に関心がありそうなユーザを正確にターゲットとするキーワードのセットに到達する前に、その広告キャンペーンに関連付けられるキーワードのセットについていくつかの改訂を経る場合がある。異なる地域、および/または異なる言語を使用するターゲット層に広告キャンペーンを展開する場合、これらの異なる言語のキーワードのセットを容易に生成することができる。ローカライズ翻訳によって、広告キャンペーンに関心がありそうなユーザをより効率的に識別するために改訂されたソース言語の広告のキーワードの意味を、ターゲット言語の翻訳された広告キーワードに持ち越すことができるようになる。
他の例では、他の言語で画像の主題を正確に記述するために、ローカライズ翻訳を使用して、画像に関連付けられるメタデータ(たとえば、キーワード)が翻訳されうる。このような翻訳されたメタデータ(たとえば、キーワード)は、様々な方法で使用されうる。たとえば、画像検索機能を提供する検索エンジンは、翻訳されたキーワードを使用して、他の言語で画像検索クエリを提出しているユーザに画像を供給できる。
これらの機能、ならびに上述していない他の機能を、以下で図面を参照してより詳細に記述する。
図1は、ソース言語からターゲット言語へのコンテンツ(たとえば、キーワード)のローカライズ翻訳を実行するように構成された、例示的なローカライズ翻訳サーバシステム100の概念図を示している。図示された例では、ローカライズ翻訳サーバシステム100は、キーワードを英語からスペイン語に翻訳する要求を受信して、それに応答して翻訳されたキーワードを提供する。
ローカライズ翻訳サーバシステム100は、ラップトップコンピュータ、デスクトップコンピュータ、分散型サーバシステム、またはそれらの任意の組合せなどの、様々なコンピューティングデバイスのいずれでもよい。ステップA(102)によって示されるように、ローカライズ翻訳サーバシステム100が、「soda pop(ソーダ水)」(キーワード104)を英語からスペイン語に翻訳する電子要求を受信する。電子要求は、インターネット、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、仮想プライベートネットワーク(VPN)、無線ネットワーク(たとえば、WiFi、セルラー式電話ネットワーク、3G/4Gデータネットワーク等)、またはそれらの任意の組合せなどの任意の様々な通信チャネルを通じて、ローカライズ翻訳サーバシステム100によって受信されうる。
図示されていないが、要求は、他のコンピュータサーバシステム、モバイル電話、スマートフォン、タブレットコンピューティングデバイス、デスクトップコンピュータ、またはそれらの任意の組合せなどの、任意の様々な他のコンピューティングデバイスによって、ローカライズ翻訳サーバシステム100に提供されうる。このような他のコンピューティングデバイスは、他のコンピューティングデバイスのユーザによってその要求が生成された電子文書(たとえば、ウェブページ)、および/またはアプリケーション(たとえば、スタンドアロンキーワード翻訳アプリケーション、ウェブブラウザ等)を、以前に受信している場合がある。たとえば、他のコンピューティングデバイスのユーザは、ローカライズ翻訳サーバシステム100によってホストされる、およびローカライズキーワード翻訳を要求するために使用されうるフォーム(たとえば、キーワードフィールド、ソース言語フィールド、ターゲット言語フィールド、提出ボタン等)を含む、ウェブページのキーワード翻訳を以前に要求している場合がある。フォームに「soda pop」を入力して、要求をトリガするための動作(たとえば、提出ボタンを選択する、フォームのフィールドを完了する等)を実行する他のコンピューティングデバイスのユーザに応答して、他のコンピューティングデバイスはその要求をローカライズ翻訳サーバシステム100に送信できる。
ステップB(106)によって示されるように、ローカライズ翻訳サーバシステム100は、英語のキーワードをスペイン語のキーワードにマッピングする電子英西辞書を使用する機械翻訳技術などの、知られている任意の様々な翻訳技術を使用して、英語のキーワード「soda pop」をスペイン語に翻訳する。図示された例では、キーワード「soda pop」がスペイン語のキーワード「gaseosa」に翻訳される(108)。翻訳されたキーワード「gaseosa」は、「soda pop」のローカライズ翻訳の候補と考えられる。
ステップC(110)で、ローカライズ翻訳サーバシステム100は、「gaseosa」に関連するキーワードを含むために、ステップBの後に「gaseosa」を含むターゲット言語(スペイン語)の候補キーワードのグループを増大(augment)させる。ステップCは、ターゲット言語(スペイン語)で類似しているが異なる意味を有するさらなる関連キーワードを含むために、候補キーワードのグループを拡大するために実行されうる。関連キーワードを識別するために、関連キーワードのグルーピングを提供する単語クラスタ、および/または同義語のリストを提供する電子シソーラスの使用などの、様々な技術が使用されうる。この例では、ステップCの実行によってもたらされるターゲット言語の増大された候補キーワードのグループは、「gaseosa」、「refresco」、「bebida cabonata」、および「soda」を含む(112)。
ステップD(114)によって示されるように、ローカライズ翻訳サーバシステム100は、スペイン語に関連付けられる1つまたは複数のコーパス内の候補キーワードごとに出現頻度を決定する。ステップDで使用されるコーパスは、さらなる分析の有無にかかわらず、キーワードが様々な言語でどのように使用されるかを示す情報を含みうる。たとえば、ステップDで使用されうる例示的なコーパス116a〜nは、検索クエリログ116a、電子文書116b、およびソーシャルネットワークコンテンツ116nを含む。コーパス116a〜nからアクセスされる情報は、ユーザのプライバシー保護のために匿名化されうる。
検索クエリログ116aは、ユーザによって検索エンジンなどのコンピュータシステムに提出された検索クエリの記録を含む。検索クエリは簡潔である場合が多いことを考えると、検索クエリログを調べることによって、ユーザがどのキーワードに引き寄せられるか、および/またはユーザが関心を持っている概念または考えを伝えるための最良の方法としてどのキーワードを選択するかを示すことができる。たとえば、英語ユーザは、「automobile」という単語よりも「car」という単語を含む検索クエリを頻繁に提出する可能性がある。検索クエリログ116aにおいて「car」の頻度がより多いことによって、「automobile」ではなく「car」に関する英語ユーザのローカル嗜好の表示を提供できる。検索クエリログ116aを使用することによって、このようなローカライズされた嗜好を有機的に識別でき、最近のユーザ検索クエリで検索クエリログ116aを継続的に更新することによってこのような嗜好における経時的な変化を自動的に識別できる。
検索クエリに関連付けられる言語(たとえば、ユーザのコンピューティングデバイスによって使用される言語)、検索クエリのタイムスタンプ、および/または検索クエリが送信される地理的領域(たとえば、大陸、国、州、市等)などの、様々な情報が検索クエリログ116aに含まれ/関連付けられうる。検索クエリログは、検索クエリを受信するコンピュータシステムによって生成されうる。ローカライズ翻訳サーバシステム100は、検索クエリログ116aへのアクセスを提供され、検索クエリログ116aはインデックスおよび/またはハッシュテーブルなどの様々なデータ構造を使用して編成されうる。
検索クエリログ116aにおけるスペイン語の候補キーワード112の頻度を決定する場合、コーパスから調べられる検索クエリログを、発信の地理的領域および/または検索クエリが受信された時間枠などの様々な基準を満たす検索クエリに絞り込むことができる。たとえば、メキシコで使用されるスペイン語のキーワードは、スペインで使用されるスペイン語のキーワードとは異なる場合がある。「soda pop」をスペイン語に翻訳する要求を処理する場合、ローカライズ翻訳サーバシステム100は、頻度分析に使用されるスペイン語の検索クエリログを、要求で指定された(明示的または暗示的に)地理的領域からの検索クエリログに絞ることができる。同様に、ローカライズ翻訳サーバシステム100は、使用される検索クエリログの時間枠を制限できる。たとえば、ローカライズ翻訳サーバシステム100は、検索クエリログを、最近1時間以内、1日以内、1か月以内、1年以内、5年以内、10年以内等に受信された検索クエリログに制限できる。
電子文書コーパス116bは、電子文書(たとえば、ウェブページ)に関する情報を含みうる。たとえば、電子文書コーパス116bは、様々な電子文書で使用されるキーワードのインデックス、および電子文書に関連付けられる情報(たとえば、言語、ウェブアドレス、タイムスタンプ等)を含みうる。検索クエリログ116a同様、電子文書コーパス116bは、言語のユーザ、および/または特定の地理的領域内のユーザによって、キーワードがどのように使用されるかという表示を提供できる。たとえば、ウェブページを作成するユーザが「automobile」よりも「car」という単語を頻繁に使用する場合、このような頻度の差によって、ユーザは「automobile」よりも「car」を好むという表示を提供できる。電子文書コーパス116bは、関連コンピュータシステム(たとえば、検索エンジン、ウェブクローラエンジン等)によって作成および維持されてよく、ローカライズ翻訳サーバシステム100は、少なくとも頻度分析のためにコーパス116bへのアクセスを提供されうる。
ソーシャルネットワークコンテンツコーパス116nは、ソーシャルネットワーク(たとえば、フェイスブック、ツイッター、LINKEDIN、YOUTUBE(登録商標)等)上でユーザによって作成されたコンテンツ(たとえば、コメント、ポスト、プロフィール情報等)を含みうる。上述の検索クエリログおよび電子文書と同様、ソーシャルネットワークのユーザによって作成されたコンテンツは、キーワードがどのように使用されるか、および特定の言語内でキーワードが何を意味するかを示すことができる。ソーシャルネットワークコンテンツコーパス116nは、ソーシャルネットワークコンテンツに関連付けられる言語、コンテンツが発信された地理的領域、および/またはコンテンツのタイムスタンプなどの、コーパス116b内のキーワードの頻度を分析する際にローカライズ翻訳サーバシステム100によって使用されうる様々な追加情報を含みうる。ソーシャルネットワークコンテンツコーパス116nは、対応するソーシャルネットワークサーバシステムによって追加および維持されてよく、ローカライズ翻訳サーバシステム100はコーパス116nへのアクセスを提供されうる。
図1に図示または記述されない他の様々なコーパスも、ローカライズ翻訳サーバシステム100によって参照されうる。
ローカライズ翻訳サーバシステム100は、コーパス116a〜nのうちの1つまたは複数におけるスペイン語の候補キーワード112の出現頻度を決定できる。表118は、コーパス116a〜nのうちの1つまたは複数におけるキーワード112の例示的な頻度を提供する。表118に示されるように、「refresco」というキーワードが出現100回で最も頻度が高く、「soda pop」の元々の翻訳であった「gaseosa」というキーワード(ステップB参照)は出現25回で2番目に頻度が高い。
出現は様々な方法で数えることができる。たとえば、出現は、キーワードが現れる文書および/または検索クエリの数でもよく、キーワードが現れる回数(同じ文書および/または検索クエリ内の複数の出現を含む)でもよい。出現は、集計(表118に示されるような)、割合、および/または出現の集合レベル(たとえば、高頻度、中頻度、低頻度)などの、様々なデータフォーマットを使用して決定されうる。
出現は、キーワードのいくつかの出現が、他の出現よりも大きい重みを有する(より強い表示を提供する)ように重み付けされうる。たとえば、文書タイトル内のキーワードの出現は、そのキーワードの方が、文書の下部の小さいフォントの定型的な表現におけるキーワードの出現よりも好まれているというより強い表示を提供しうる。他の例では、検索クエリ内の最初のキーワードは、ユーザが検索クエリ内のキーワードを重要性に従って順序付けた可能性があるので、検索クエリ内の最後のキーワードよりもわずかに大きい重みを有することができる。さらなる例では、一連の検索クエリ(たとえば、セッション)内で提出されたキーワードの改良は、ユーザが他のキーワードよりも適している(たとえば、より良い結果をもたらす)1つのキーワードを見つけたかどうかを示すことができる。たとえば、ユーザが「home building」という検索クエリを提出し、次いで「home construction」という検索クエリを提出した(および、ユーザのセッション中にさらなる検索クエリがない)ことを検索ログが示す場合、「home building」というキーワードから提供される結果よりも、「home construction」というキーワードの方が、ユーザが好む結果を提供するものと推測されうる。このようなセッション情報に基づいて、「home construction」というキーワードは、「home building」というキーワードよりも大きい重みを受け取ることができる。このような重要性および/またはユーザ嗜好の指標は、出現に重み付けするために使用されうる表示を提供できる。
ステップE(120)によって示されるように、ローカライズ翻訳サーバシステム100は、表118に示されるような、決定された出現頻度に基づいてスペイン語のキーワードのうちの1つまたは複数を選択する。この例では、ローカライズ翻訳サーバシステム100は、ローカライズ翻訳サーバシステム100によって調べられるコーパス116a〜nのうちの1つまたは複数において出現頻度が最も高いキーワード122に基づいて、「refresco」(キーワード122)を選択する。
ステップF(126)によって示されるように、ローカライズ翻訳サーバシステム100は、「soda pop」をスペイン語に翻訳する要求の受信に応答してキーワード122を提供する。キーワード122は、翻訳する要求を送信したコンピューティングデバイスに提供され、単独で、またはウェブページなどの電子文書と組み合わせて提供されうる。たとえば、ローカライズ翻訳サーバシステム100は、ユーザからの要求の結果として翻訳を提供するウェブページを供給できる。このようなウェブページは、HTML、拡張マークアップ言語(XML)、SHOCKWAVE/FLASH、JAVASCRIPT(登録商標)、および/またはHTML5などの、任意の様々な電子データフォーマットで提供されうる。
図2は、キーワードのローカライズ翻訳を提供するための例示的システム200を示している。システム200は、キーワードのローカライズ翻訳を提供するように構成されたローカライズ翻訳サーバシステム202を含む。また、システム200は、ユーザにコンテンツを提供し、コンテンツ供給の一部として、ローカライズ翻訳サーバシステム202がキーワード翻訳のために使用できるコーパス206を生成/維持するコンテンツサーバシステム204を含む。また、例示的システム200は、ローカライズ翻訳サーバシステム202と(たとえば、キーワード翻訳を要求するために)、および/またはコンテンツサーバシステム204と(たとえば、コンテンツを要求するために)対話できる、クライアントコンピューティングデバイス208を含むものとして示されている。ローカライズ翻訳サーバシステム202は、図1に関連して上述したローカライズ翻訳サーバシステム100と類似していてよい。
クライアントコンピューティングデバイス208は、ラップトップコンピュータ、デスクトップコンピュータ、ネットブック、モバイル電話、スマートフォン、タブレットコンピューティングデバイス、および/またはコンピュータサーバシステムなどの、様々なコンピューティングデバイスのいずれでもよい。クライアントコンピューティングデバイス208は、デバイス208がネットワーク212を介して他のコンピューティングデバイスと通信するために使用する、入力/出力(I/O)インターフェース210を含む。I/Oインターフェース210は、イーサネット(登録商標)カード、無線ネットワークカード、セルラー式ネットワークトランシーバ、またはそれらの任意の組合せなどの、様々な通信インターフェースのいずれでもよい。クライアントコンピューティングデバイス208は、コンテンツサーバシステム204にコンテンツを求める、および/またはネットワーク212を介してローカライズ翻訳サーバシステム202にキーワード翻訳を求める要求を提供するように構成された要求モジュール214を含む。要求モジュール214は、ユーザが電子文書(たとえば、ウェブページ)によって提供されたリンクおよび/またはボタンを選択することなどのユーザ入力に応答して、このような要求を作成するように構成されうる。また、クライアントコンピューティングデバイス208は、コンテンツサーバシステム204から受信されたコンテンツ、および/またはローカライズ翻訳サーバシステム202から受信された翻訳されたキーワードを、クライアントコンピューティングデバイス208上でそれぞれ提供する(たとえば表示する、聞こえるように再生する等)ように構成されたプレゼンテーションモジュール216を含みうる。
ネットワーク212は、コンピューティングデバイスが通信できる様々なネットワークのいずれでもよい。たとえば、ネットワーク212は、LAN、WAN、VPN、無線ネットワーク、インターネット、ポイントツーポイントネットワーク、電話ネットワーク(たとえば、公衆交換電話網(PSTN))、セルラー式電話ネットワーク、3G/4Gネットワーク、またはそれらの任意の組合せを含みうる。
コンテンツサーバシステム204は、デスクトップコンピュータ、ラップトップコンピュータ、分散型コンピュータサーバシステム、専用コンピュータサーバシステム、および/または共同設置コンピュータサーバシステムなどの、様々なコンピューティングデバイスのいずれでもよい。コンテンツサーバシステム204は、要求されたコンテンツを、クライアントコンピューティングデバイス208などの様々なコンピューティングデバイスに供給するように構成される。コンテンツサーバシステム204は、様々なコンテンツ、検索クエリ、電子文書、および/またはソーシャルネットワーク情報を供給するように構成されうる。たとえば、コンテンツサーバシステム204は検索エンジンでよい。他の例では、コンテンツサーバシステム204はソーシャルネットワークシステムでよい。
コンテンツサーバシステム204はI/Oインターフェース218を含み、このI/Oインターフェースはクライアントコンピューティングデバイス208のI/Oインターフェースと類似していてよい。また、コンテンツサーバシステム204は、検索クエリおよび/またはソーシャルネットワークのページを求める要求などの、コンテンツを求める要求を供給するように構成されたコンテンツ要求処理モジュール220を含む。コンテンツ要求処理モジュール220は、様々な受信および処理された要求に関連付けられる情報を格納するように構成されうる。たとえば、コンテンツ要求処理モジュール220は、クライアントコンピューティングデバイス208から受信した検索クエリをコーパス206に記録することができる。他の例では、コンテンツ要求処理モジュール220は、ソーシャルネットワークのユーザによって作成されたコンテンツ(たとえば、コメント、ポスト等)(たとえば、ソーシャルネットワークに新しいコンテンツを追加するよう要求する)、および/またはコンテンツを求める要求(たとえば、ソーシャルネットワークの他のユーザのプロフィールページを求める要求)に関するログ情報を格納できる。
コンテンツ要求処理モジュール220は、情報に適用可能な1つまたは複数の言語222(たとえば、英語、スペイン語、フランス語等)に関連する情報をコーパス206に格納できる。たとえば、コンテンツサーバシステム204によって受信された英語ユーザからの英語の検索クエリを、英語に関連してコーパス206に格納できる。いくつかの実装形態では、言語ごとに別々のコーパスが使用される。様々なさらなる詳細が、情報が発信された地理的領域、および/またはその情報に関連付けられるタイムスタンプなどの情報と共にコーパスに格納されうる。
ローカライズ翻訳サーバシステム202は、ネットワーク212、およびローカライズ翻訳サーバシステム202のI/Oインターフェース224を通じて、1つまたは複数のキーワードのローカライズ翻訳を求める要求を受信できる。I/Oインターフェース224は、I/Oインターフェース210および218と類似していてよい。翻訳を求める要求は、クライアントコンピューティングデバイス208から受信されうる。たとえば、ローカライズ翻訳サーバシステム202は、キーワード翻訳サービスを、クライアントコンピューティングデバイス208などのエンドユーザに提供する(たとえば、ウェブページを供給する、キーワードデータを供給する等)ように構成されうる。他の例では、ローカライズ翻訳サーバシステム202は、このような情報をエンドユーザに供給するように構成されたコンテンツサーバシステム204などの他のコンピュータシステムに、キーワード翻訳情報を提供するように構成されうる。
ローカライズ翻訳サーバシステム202は、ソース言語のキーワードをキーワードの関連グループにグルーピングするように構成されたキーワードグルーピングモジュール226を含む。これらのグルーピングは、機械翻訳されたキーワードの意味にコンテキストを提供するために、ローカライズ翻訳サーバシステム202によって使用されうる。このようなコンテキストは、ターゲット言語の候補キーワードのグループをより正確に増大させるために使用されうる。たとえば、ローカライズ翻訳サーバシステム202が複数のキーワードを英語(ソース言語)からフランス語(ターゲット言語)に一括翻訳する要求を受信すると、英語のキーワードは、機械翻訳および頻度分析の前にキーワードグルーピングモジュール226によってグルーピングされうる。これらのグルーピングは、さらなる関連キーワードを含むために、フランス語の候補キーワードを増大する際に、機械翻訳されたフランス語のキーワードがコンテキストを提供するために維持されうる。
たとえば、「jaguar」というキーワードは、大きな動物を指すこともでき、車のブランドを指すこともできる。「jaguar」が動物に関連するキーワードでグルーピングされると、これらの他のキーワードは「jaguar」について意図された意味を示すコンテキストを提供できる。同様に、「jaguar」が車に関連するキーワードでグルーピングされると、他のキーワードによって提供されるコンテキストは、「jaguar」が車のブランドに対応することが意図されることを示すことができる。
キーワードグルーピングモジュール226は、共にグルーピングされるべき関連キーワードを識別するために、キーワード関係データリポジトリ228(たとえば、データベース、ファイルシステム等)を使用できる。キーワード関係データリポジトリ228は、キーワードをグルーピングするためにキーワードグルーピングモジュール226によって使用されうるキーワード間の関係をマッピングできる。
グルーピングされたキーワードは、キーワードグルーピングモジュール226によって、グルーピングされたキーワードをソース言語からターゲット言語に翻訳する自動翻訳モジュール230に提供されうる。自動翻訳モジュール230は、ソース言語のキーワードをターゲット言語のキーワードにマッピングする電子辞書を参照すること、ならびに/あるいは様々なルールおよび/またはキーワードマッピングを使用してキーワードをソース言語からターゲット言語に自動的に翻訳する機械翻訳処理を使用することなどの、キーワードを翻訳するための様々な技術を使用できる。ターゲット言語に翻訳されたキーワードは、候補キーワードとして参照されうる。
ターゲット言語の候補キーワードは、ターゲット言語のさらなる関連キーワードを含むために候補キーワードのグループを増大するように構成されたキーワード増大モジュール232に提供されうる。キーワードグルーピングモジュール226によって決定されたソース言語のキーワードグルーピングは、キーワードの意図される元々の意味を推測して、関連キーワードを識別するために、キーワード増大モジュール232によって使用されうる。ターゲット言語の関連キーワードを識別するために、単語クラスタおよび/または電子シソーラスの使用などの様々な技術が使用されうる。
増大された候補キーワードのグループは、ターゲット言語の検索クエリログのコーパス、および/またはターゲット言語の電子文書のコーパスなどの、1つまたは複数の適切なコーパス内のそれぞれの候補キーワードの頻度を決定するように構成されたキーワード頻度モジュール234に提供されうる。頻度モジュール234は、コンテンツサーバシステム204によって生成および維持されるコーパス206にアクセスして、このような頻度決定を行うことができる。ローカライズ翻訳サーバシステム202は、ネットワーク212および/またはコンテンツサーバシステム204を使用せずにコーパス206にアクセスできるものとして示されているが、コーパス206へのアクセスは、ネットワーク212および/またはコンテンツサーバシステム204を通じて提供されうる。キーワード頻度モジュール234は、言語の関連付け222を使用して、頻度分析を実行するためのコーパスの関連部分を識別できる。さらに、図1に関して上述したように、キーワード出現は、キーワード出現のプロミネンス(たとえば、文書のタイトルに出現する、定型文に出現する等)などの様々な要因に基づいて重み付けされうる。
決定されたキーワード頻度は、決定された頻度に基づいてソース言語のキーワードの最良の翻訳を選択するように構成された、キーワード選択コンポーネント236に提供されうる。決定された出現頻度に基づいてキーワード選択を行うために、様々な技術が使用されうる。たとえば、キーワード選択コンポーネント236は、決定された出現頻度が最高である候補キーワードの数(たとえば、1、2、5、7、10等)を選択できる。他の例では、キーワード選択コンポーネント236は、少なくともしきい値の出現頻度を有する候補キーワードを選択できる。キーワードは、キーワードグルーピングモジュール226によって決定されたそれぞれのキーワードグルーピングから選択されうる。キーワード選択コンポーネント236は、選択されたキーワード(ターゲット言語の)を、I/Oインターフェース224およびネットワーク212を通じて、クライアントコンピューティングデバイス208および/またはコンテンツサーバシステム204などの、要求しているコンピューティングデバイスに提供できる。
図示されていないが、ローカライズ翻訳サーバシステム202は、少なくともしきい値期間の間、キーワード選択コンポーネント236によって行われたキーワード選択をキャッシュできる。類似の要求が受信されると、要求しているコンピューティングデバイスにキーワード翻訳を提供するために、キャッシュされたキーワード選択がショートカットとして使用されうる。
図3は、ソース言語からターゲット言語への、1つまたは複数のキーワードのローカライズ翻訳を提供するための例示的方法300を示している。方法300は、図1に関して上述したローカライズ翻訳サーバシステム100、および/または図2に関して上述したローカライズ翻訳サーバシステム202などの、任意の様々なコンピューティングデバイス/システムによって実行されうる。
ソース言語からターゲット言語への、1つまたは複数の第1キーワードのローカライズ翻訳を求める要求を受信すると、方法300が段階302から開始される。たとえば、要求は、英語のキーワードのグループをスペイン語のキーワードに翻訳することでよい。それぞれのキーワードは、1つまたは複数の単語を含みうる。
いくつかの実装形態では、受信された要求は、第1キーワードを、地理的領域に関連するターゲット言語に翻訳することをさらに指定できる。たとえば、受信された要求は、英語のキーワードが、(スペインなどの他の国で使用されるスペイン語のキーワードではなく)メキシコで使用されるスペイン語のキーワードに翻訳されるよう指定できる。ローカライズキーワード翻訳を実行するために、ターゲット言語および要求された地理的領域に関連付けられるコーパス(またはその一部)が使用されうる。
ある実装形態では、ソース言語の第1キーワードは、関連キーワードの1つまたは複数の第1グループにグルーピングされうる(段階304)。たとえば、ローカライズ翻訳サーバシステム202のキーワードグルーピングモジュール226は、機械翻訳を実行する前に、ソース言語のキーワード(第1キーワード)をグルーピングできる。図2に関連して上述したように、第1キーワードのグルーピングは、翻訳する際に失われるソース言語のキーワードの意味を最小化するために、機械翻訳キーワード(ターゲット言語の)にコンテキストを提供するために使用されうる。
段階306で、第1キーワードがソース言語からターゲット言語の複数の第2キーワードに翻訳される。翻訳は、機械翻訳処理を使用して実行されうる。たとえば、第1キーワードをソース言語からターゲット言語の第2キーワードに翻訳するために、図2に関して上述した自動翻訳モジュール230が使用されうる。
いくつかの実装形態では、第2キーワードが、それぞれの第2キーワードがそこから翻訳された第1グループおよび第1キーワードに基づいて、キーワードの1つまたは複数の第2グループにグルーピングされる(段階308)。たとえば、ソース言語(たとえば、英語)の第1キーワードAs、Bs、Cs、およびDsが、関連キーワードAsおよびBsの第1グループ、ならびに関連キーワードCsおよびDsの第2グループにグルーピングされる。第1キーワードは、段階306で、ターゲット言語(たとえば、スペイン語)の第2キーワードAt、Bt、Ct、およびDtにそれぞれ翻訳される。第2キーワードAt、Bt、Ct、およびDtは、それらが翻訳された第1キーワード(たとえば、AsはAtから翻訳された)、および第1キーワードの関連グループ(たとえば、AsおよびBsの第1グループ)によってグルーピングされうる。たとえば、第2キーワードは、AtおよびBt、ならびにCtおよびDtとしてグルーピングされうる。
いくつかの実装形態では、キーワードの第2グループに基づいて、第2キーワードの1つまたは複数のあらかじめ定められた単語クラスタが識別されうる(段階310)。上述のように、単語クラスタは、関連する意味を有するキーワードの集合を含みうる。キーワードの第2グループは、ソース言語の第1キーワードの意味に類似するターゲット言語の意味を伝える適切な単語クラスタを識別するために使用されうる。クラスタは、単独でソース言語のキーワードとの強い関連性を有するが、他の関連するターゲット言語のキーワードとの関連で見るとソース言語のキーワードとのより弱い関連性を有するターゲット言語のキーワードにコンテキストを提供するために使用されうる。前の段落における例を拡大すると、ターゲット言語の単語クラスタは、第2キーワードAtおよびBtのグループに基づいて識別されうる。それぞれの第2キーワードAtおよびBtが、それらが翻訳された第1キーワードAsおよびBsの意味から少し変更された可能性がある事を考えると、第2キーワードAtおよびBtのグルーピングは翻訳されたキーワードの意味におけるあらゆるずれを軽減することに役立ち、また適切な単語クラスタの識別を助けることができる。
段階312で、それぞれが第2キーワードのうちの1つまたは複数との少なくとも1つのしきい値関連付けを有するターゲット言語のさらなるキーワードを含むために、第2キーワード(候補キーワード)が増大される。たとえば、ローカライズ翻訳サーバシステム202のキーワード増大モジュール232は、ターゲット言語の候補キーワードのグループをターゲット言語の関連キーワードで増大できる。
様々な技術を使用して、第2キーワードに含めるためのさらなるキーワードが識別されうる。たとえば、さらなるキーワードのうちの1つまたは複数は、キーワードに関連付けられるターゲット言語の1つまたは複数のランディングページ(たとえば、ウェブページ)から抽出されうる(段階314)。たとえば、翻訳されているキーワードは、広告される商品/サービスの1つまたは複数のランディングページにユーザを導く広告に関連付けられる広告キーワードでよい。ソース言語および/またはターゲット言語の、広告される商品/サービスのランディングページが識別されうる。ターゲット言語のこれらの関連ランディングページから、第2キーワードに含まれうるさらなるキーワードのうちの1つまたは複数が抽出されうる。同様に、ターゲット言語の広告から、第2キーワードに含まれうるさらなるキーワードのうちの1つまたは複数が抽出されうる(たとえば、創造的な広告(ad creative)から抽出される)。
他の例では、第2キーワードのうちの1つとの少なくとも1つのしきい値関連付けを有すると決定されているさらなるキーワードに基づいて、第2キーワードに含めるためのさらなるキーワードが選択されうる。このようなしきい値関連付けは、ターゲット言語で同義語と識別されているさらなるキーワードおよび第2キーワードに基づいて決定されうる。また、このようなしきい値関連付けは、ステップ310で識別された単語クラスタなどの、意味的に類似するキーワードのあらかじめ定められた単語クラスタに含まれているさらなるキーワードおよび第2キーワードに基づいて決定されうる。
いくつかの実装形態では、増大された第2キーワードを記録するために使用する、1つまたは複数のコーパスが選択される(段階315)。たとえば、図1に関連して上述したように、ローカライズ翻訳サーバシステム100は、スペイン語の候補キーワード112を記録するために使用する、コーパス116a〜nのうちの1つまたは複数(たとえば、検索クエリログ116a、ソーシャルネットワークコンテンツ116n)を選択できる。1つまたは複数のコーパスは、ローカライズ翻訳に関連付けられる翻訳のターゲット言語(たとえば、スペイン語、フランス語)、および/または地理的領域(たとえば、スペイン、メキシコ)などの、様々な要因に基づいて選択されうる。たとえば、メキシコでの使用目的(たとえば、ユーザ要求で指定された)のためにキーワードを英語からスペイン語に翻訳する場合、メキシコから発信される検索クエリログ、および/またはメキシコ人ユーザからのソーシャルネットワークコンテンツなどの、メキシコで使用されるスペイン語に関連付けられる1つまたは複数のコーパスが選択されうる。
段階316で、それぞれの第2キーワードがターゲット言語に関連付けられるコーパス内で出現する頻度が決定されうる。たとえば、図2に関連して上述したように、キーワード頻度モジュール234が、第2キーワードがコーパス206内で出現する頻度を決定できる。図1に関連して上述したように、第2キーワードの出現頻度は、ステップD(114)と同様に実行されうる。
第2キーワードの出現頻度を決定するために、様々なコーパスが使用されうる。たとえば、出現頻度決定のために使用されるコーパスは、図1に関連して上述した検索クエリログコーパス116aと同様に、ターゲット言語に関連付けられる検索クエリの検索ログを含みうる。決定された頻度は、現在の時間のしきい値時間以内(たとえば、最近1時間以内、1日以内、1週間以内、1か月以内、1年以内、10年以内等)で受信された検索クエリの検索ログに基づきうる。他の例では、コーパスは、電子文書のコーパス(たとえば、電子文書コーパス116b)などの、検索エンジンからの1つまたは複数のコーパスを含む。このような検索エンジンコーパスで出現頻度を決定するステップは、少なくとも部分的に、関連する検索エンジンコンピュータシステムを使用して第2キーワードごとに検索を行うステップを含みうる。さらなる例では、コーパスは、1つまたは複数のソーシャルネットワークからの、およびターゲット言語に関連付けられる、ユーザが作成したコンテンツ(たとえば、ソーシャルネットワークコンテンツコーパス116n)を含みうる。
段階318で、決定された出現頻度に少なくとも部分的に基づいて、ターゲット言語で使用するための第2キーワードのサブセットが選択されうる。たとえば、図2に関して上述したように、キーワード頻度モジュール234によって決定された頻度に基づいて、キーワード選択コンポーネント236がターゲット言語で使用するために提供するためにキーワードを選択できる。
段階320で、第2キーワードの選択されたサブセットが要求する当事者に提供されるか、および/または後続の処理で使用されうる。たとえば、ローカライズ翻訳サーバシステム202は、第1キーワードのローカライズ翻訳を、クライアントコンピューティングデバイス208および/またはコンテンツサーバシステム204などの要求する当事者に提供できる。いくつかの実装形態では、ローカライズ翻訳サーバシステム202は、検索クエリ内に出現する識別されたキーワードの存在に基づいて検索クエリに応じた広告を提供することなどの、さらなるキーワードベースのサービスを提供できる。たとえば、第2キーワードのサブセットを選択するステップとともに、第2キーワードのサブセットがターゲット言語の1つまたは複数の広告に関連付けられうる。このようなキーワードと広告との関連付けは、検索結果のような関連コンテンツを有する広告を供給するために使用されうる。たとえば、広告および検索クエリに関連付けられる第2キーワードのサブセットとの比較に基づいて識別された広告が、検索結果とともにターゲット言語で提供されうる。
いくつかの実装形態では、第2キーワードの選択されたサブセットが、人による調査のために第2キーワードの選択されたサブセットをキューに入れるコンピュータシステムに提供されうる。人による調査は、ターゲット言語に堪能な人が選択された第2キーワードを見直して、それらが意味を成す、および/または意図される意味を伝えることを確認することを含みうる。このような人は、ソース言語に堪能である必要がなく、ソース言語を知っている必要さえない場合があるが、代わりに、選択されたキーワードがターゲット言語の対応するコンテンツ(たとえば、広告のランディングページ、画像等)に適切に対応するかどうかに焦点を当てることができる。このようなコンピュータシステムから、選択されたキーワードが人による調査をパスするかどうかを示す応答を受信できる。キーワードがパスすると、そのキーワードを上述のように提供および/または使用できる。キーワードがパスしない場合、使用される機械翻訳処理、コーパス、キーワードグルーピング、および/またはキーワード増大技術への変更など、技術の様々な側面を変更して、技術300を再び実行できる。いくつかの実装形態では、第2キーワードの選択されたサブセットが人による調査をパスしない場合、これらのキーワードは削除/除外されて、技術300をより寛容なオプションで(たとえば、より低い頻度しきい値を使用して)再実行できる。
図4は、本明細書に記載のシステムおよび方法を、クライアント、あるいはサーバ、または複数のサーバとして実装するために使用されうるコンピューティングデバイス400、450のブロック図である。コンピューティングデバイス400は、ラップトップ、デスクトップ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、メインフレーム、および他の適切なコンピュータなどの、様々な形式のデジタルコンピュータを表すことが意図される。コンピューティングデバイス450は、携帯情報端末、セルラー式電話、スマートフォン、および他の類似のコンピューティングデバイスなどの、様々な形式のモバイルデバイスを表すことが意図される。さらに、コンピューティングデバイス400または450は、ユニバーサルシリアルバス(USB)フラッシュドライブを含みうる。USBフラッシュドライブは、オペレーティングシステムおよび他のアプリケーションを格納できる。USBフラッシュドライブは、無線送信機、または他のコンピューティングデバイスのUSBポートに挿入されうるUSBコネクタなどの入力/出力コンポーネントを含みうる。図示されたコンポーネント、それらの接続および関係、ならびにそれらの機能は例示的なものを意味するに過ぎず、本明細書に記述および/または主張される実装形態を限定することを意味するものではない。
コンピューティングデバイス400は、プロセッサ402、メモリ404、ストレージデバイス406、メモリ404と高速拡張ポート410とを接続する高速インターフェース408、および低速バス414とストレージデバイス406とを接続する低速インターフェース412を含む。それぞれのコンポーネント402、404、406、408、410、および412は、様々なバスを使用して相互接続されており、共通のマザーボード上に、または必要に応じて他の方法で搭載されうる。プロセッサ402は、高速インターフェース408に結合されたディスプレイ416などの外部の入力/出力デバイスにGUIのためのグラフィック情報を表示するために、メモリ404またはストレージデバイス406に格納された命令を含む、コンピューティングデバイス400内で実行するための命令を処理できる。他の実装形態では、複数のメモリおよびメモリタイプとともに、複数のプロセッサおよび/または複数のバスが必要に応じて使用されうる。また、複数のコンピューティングデバイス400が接続されてよく、それぞれのデバイスが動作の一部を提供する(たとえば、サーババンク、ブレードサーバのグループ、またはマルチプロセッサシステムとして)。
メモリ404は、コンピューティングデバイス400内に情報を格納する。一実装形態では、メモリ404は揮発性メモリユニットである。他の実装形態では、メモリ404は不揮発性メモリユニットである。メモリ404は、磁気ディスクまたは光ディスクなどの他の形式のコンピュータ可読媒体でもよい。
ストレージデバイス406は、コンピューティングデバイス400のための大容量記憶装置を提供できる。一実装形態では、ストレージデバイス406は、フロッピー(登録商標)ディスクデバイス、ハードディスクデバイス、光ディスクデバイス、またはテープデバイス、フラッシュメモリまたは他の類似のソリッドステートメモリデバイス、あるいはストレージエリアネットワークまたは他の構成内のデバイスを含む数々のデバイスなどのコンピュータ可読媒体でもよく、またコンピュータ可読媒体を含んでもよい。コンピュータプログラム製品は、情報媒体に明白に組み入れることができる。また、コンピュータプログラム製品は、実行されると、上述の方法などの1つまたは複数の方法を実施する命令を含みうる。情報媒体は、メモリ404、ストレージデバイス406、またはプロセッサ402上のメモリなどのコンピュータ可読媒体、あるいは機械可読媒体である。
高速コントローラ408はコンピューティングデバイス400の帯域幅集中型動作を管理し、低速コントローラ412はより低い帯域幅集中型動作を管理する。このような機能割当ては例示的なものにすぎない。一実装形態では、高速コントローラ408は、メモリ404、ディスプレイ416(たとえば、グラフィックプロセッサまたはアクセラレータを通じて)、および高速拡張ポート410に結合されており、様々な拡張カード(図示せず)を受け入れることができる。この実装形態では、低速コントローラ412は、ストレージデバイス406および低速拡張ポート414に結合されている。様々な通信ポート(たとえば、USB、ブルートゥース(登録商標)、イーサネット(登録商標)、無線イーサネット(登録商標))を含みうる低速拡張ポートは、たとえばネットワークアダプタを通じて、キーボード、ポインティングデバイス、スキャナ、あるいはスイッチまたはルータなどのネットワーキングデバイスなどの、1つまたは複数の入力/出力デバイスに結合されうる。
コンピューティングデバイス400は、図示されるように、いくつかの異なる形式で実装されうる。たとえば、コンピューティングデバイス400は、標準サーバ420として実装されてもよく、このようなサーバのグループの中に複数回実装されてもよい。また、コンピューティングデバイス400は、ラックサーバシステム424の一部として実装されうる。さらに、コンピューティングデバイス400は、ラップトップコンピュータ422などのパーソナルコンピュータに実装されうる。あるいは、コンピューティングデバイス400からのコンポーネントは、デバイス450などのモバイルデバイス(図示せず)内の他のコンポーネントと結合されうる。それぞれのこのようなデバイスは、1つまたは複数のコンピューティングデバイス400、450を含むことができ、システム全体は、相互に通信する複数のコンピューティングデバイス400、450で構成されうる。
コンピューティングデバイス450は、他のコンポーネントの中でも特に、プロセッサ452、メモリ464、ディスプレイ454などの入力/出力デバイス、通信インターフェース466、およびトランシーバ468を含む。デバイス450は、さらなるストレージを提供するために、マイクロドライブまたは他のデバイスなどのストレージデバイスを備えうる。それぞれのコンポーネント450、452、464、454、466、および468は、様々なバスを使用して相互接続されており、コンポーネントのうちのいくつかは共通のマザーボード上に、または必要に応じて他の方法で搭載されうる。
プロセッサ452は、メモリ464に格納された命令を含む、コンピューティングデバイス450内の命令を実行できる。プロセッサは、別々かつ複数のアナログおよびデジタルプロセッサを含むチップのチップセットとして実装されうる。さらに、プロセッサは任意のいくつかのアーキテクチャを使用して実装されうる。たとえば、プロセッサ410はCISC(複合命令セットコンピュータ)プロセッサ、RISC(縮小命令セットコンピュータ)プロセッサ、またはMISC(縮小命令セットコンピュータ)プロセッサでもよい。プロセッサは、たとえば、ユーザインターフェースの制御、デバイス450によって実行されるアプリケーション、およびデバイス450による無線通信などの、デバイス450の他のコンポーネントの調整を提供できる。
プロセッサ452は、ディスプレイ454に結合された制御インターフェース458およびディスプレイインターフェース456を通じてユーザと通信できる。ディスプレイ454は、たとえば、TFT(薄膜トランジスタ)液晶ディスプレイ、OLED(有機発光ダイオード)ディスプレイ、または他の適切なディスプレイ技術でよい。ディスプレイインターフェース456は、グラフィック情報および他の情報をユーザに提示するためにディスプレイ454を駆動するための、適切な回路を備えうる。制御インターフェース458は、ユーザからコマンドを受信して、プロセッサ452に提出するためにそれらを変換しうる。さらに、デバイス450と他のデバイスとの近距離通信を可能にするために、外部インターフェース462をプロセッサ452と通信するように提供できる。外部インターフェース462は、たとえば、ある実装形態における有線通信、または他の実装形態における無線通信を提供でき、複数のインターフェースも使用されうる。
メモリ464は、情報をコンピューティングデバイス450に格納する。メモリ464は、1つまたは複数のコンピュータ可読媒体、揮発性メモリユニット、または不揮発性メモリユニットとして実装されうる。拡張メモリ474も提供されて、拡張インターフェース472を通じてデバイス450に接続されうる。拡張メモリ474は、たとえば、SIMM(シングルインラインメモリモジュール)カードインターフェースを含みうる。このような拡張メモリ474は、デバイス450のためのさらなるストレージスペースを提供することもでき、またデバイス450のためのアプリケーションまたは他の情報を格納することもできる。特に、拡張メモリ474は、上述の処理を実行または補完するための命令を含むことができ、また安全情報も含むことができる。したがって、たとえば、拡張メモリ474はデバイス450のためのセキュリティモジュールとして提供されてよく、またデバイス450の安全な使用を許可する命令でプログラムされてよい。さらに、ハッキングできない方法で識別情報をSIMMカードに配置することなどのさらなる情報とともに、安全なアプリケーションはSIMMカードを介して提供されうる。
後述するように、メモリは、たとえばフラッシュメモリおよび/またはNVRAMメモリを含みうる。一実装形態では、コンピュータプログラム製品は、情報媒体に明白に組み入れられる。コンピュータプログラム製品は、実行されると、上述の方法などの1つまたは複数の方法を実行する命令を含む。情報媒体は、メモリ464、拡張メモリ474、あるいはたとえばトランシーバ468または外部インターフェース462を介して受信されうるプロセッサ452上のメモリなどの、コンピュータ可読媒体、または機械可読媒体である。
デバイス450は、通信インターフェース466を介して無線で通信でき、必要に応じてデジタル信号処理回路を含みうる。通信インターフェース466は、とりわけGSM(登録商標)ボイスコール、SMS、EMS、またはMMSメッセージング、CDMA、TDMA、PDC、WCDMA(登録商標)、CDMA2000、またはGPRSなどの様々なモードまたはプロトコルの下に通信を提供しうる。このような通信は、たとえば無線周波数トランシーバ468を通じて発生しうる。さらに、近距離通信は、ブルートゥース(登録商標)、WiFi、または他のこうしたトランシーバ(図示せず)を使用するなどして発生しうる。さらに、GPS(グローバルポジショニングシステム)受信モジュール470は、さらなるナビゲーション、および位置関連無線データをデバイス450に提供できる。そのデータは、デバイス450上で実行しているアプリケーションによって必要に応じて使用されうる。
デバイス450は、ユーザからの音声情報を受信して使用可能なデジタル情報に変換できる音声コーデック460を使用して、聴覚的に通信できる。同様に、音声コーデック460は、たとえばデバイス450のハンドセット内のスピーカを通じるなどして、ユーザのために可聴音を生成できる。このような音は、音声電話コールからの音を含んでもよく、録音された音(ボイスメッセージ、音楽ファイル等)を含んでもよく、またデバイス450上で動作しているアプリケーションによって生成された音を含んでもよい。
コンピューティングデバイス450は、図示されるように、いくつかの異なる形式で実装されうる。たとえば、コンピューティングデバイス450は、セルラー式電話480として実装されうる。また、コンピューティングデバイス450は、スマートフォン482、携帯情報端末、または他の類似のモバイルデバイスの一部として実装されうる。
デジタル電子回路、集積回路、特別に設計されたACIS(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組合せで、様々な実装形態が実現されうる。これらの様々な実装形態は、そこからデータおよび命令を受信するために、ならびにそこにデータおよび命令を送信するために、ストレージシステム、少なくとも1つの入力デバイス、および少なくとも1つの出力デバイスに結合された、専用でも汎用でもよい少なくとも1つのプログラム可能プロセッサを含むプログラム可能システム上で実行可能および/または解釈可能な、1つまたは複数のコンピュータプログラムにおける実装形態を含みうる。
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとしても知られる)は、プログラム可能プロセッサのための機械命令を含み、ハイレベルの手続き型および/またはオブジェクト指向プログラム言語、ならびに/あるいはアセンブリ/機械言語に実装されうる。本明細書で使用されるように、「機械可読媒体」、「コンピュータ可読媒体」という用語は、機械可読信号として機械命令を受信する機械可読媒体を含むプログラム可能プロセッサに機械命令および/またはデータを提供するために使用される、任意のコンピュータプログラム製品、装置、および/またはデバイス(たとえば、磁気ディスク、光ディスク、メモリ、プログラム可能論理デバイス(PLD))を指す。「機械可読信号」という用語は、機械命令および/またはデータをプログラム可能プロセッサに提供するために使用される任意の信号を指す。
ユーザとの対話を提供するために、本明細書に記載のシステムおよび技術は、情報をユーザに表示するためのディスプレイデバイス(たとえば、CRT(ブラウン管)またはLCD(液晶ディスプレイ)モニタ)、ならびにユーザが入力をコンピュータに提供できるキーボードおよびポインティングデバイス(たとえば、マウスまたはトラックボール)を有するコンピュータに実装されうる。ユーザとの対話を提供するために、他の種類のデバイスも使用されうる。たとえば、ユーザに提供されるフィードバックはどのような形式の感覚フィードバック(たとえば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)でもよく、ユーザからの入力は、音響入力、音声入力、または触覚入力を含むどのような形式で受信されてもよい。
本明細書に記載のシステム、方法、装置、および技術は、バックエンドコンポーネント(たとえば、データサーバとして)を含む、またはミドルウェアコンポーネント(たとえば、アプリケーションサーバ)を含む、またはフロントエンドコンポーネント(たとえば、グラフィカルユーザインターフェースを有するクライアントコンピュータ、またはユーザが本明細書に記載のシステムまたは技術の実装形態と対話できるウェブブラウザ)を含む、あるいはこのようなバックエンドコンポーネント、ミドルウェアコンポーネント、フロントエンドコンポーネントの任意の組合せを含む、コンピューティングシステムに実装されうる。本システムのコンポーネントは、任意の形式または媒体のデジタルデータ通信(たとえば、通信ネットワーク)によって相互接続されうる。通信ネットワークの例には、ローカルエリアネットワーク(「LAN」)、ワイドエリアネットワーク(「WAN」)、ピアツーピアネットワーク(臨時または静的メンバーを有する)、グリッドコンピューティングインフラストラクチャ、およびインターネットがある。
本コンピューティングシステムは、クライアントおよびサーバを含みうる。クライアントおよびサーバは、一般的に相互から離れており、典型的に通信ネットワークを通じて対話する。クライアントとサーバとの関係は、それぞれのコンピュータ上で実行している、および相互にクライアント-サーバ関係を有するコンピュータプログラムによって生じる。
いくつかの実装形態を上記で詳細に説明したが、他の修正形態が可能である。さらに、キーワードのローカライズ翻訳を提供するための他のメカニズムが使用されうる。さらに、所望の結果を実現するために、図示された論理フローは、図示された特定の順序、または連続する順序である必要はない。上述のフローに他のステップが提供されてもよく、ステップが削除されてもよく、また上述のシステムに他のコンポーネントが追加されてもよく、除去されてもよい。したがって、他の実装形態は以下の特許請求の範囲内である。
100 ローカライズ翻訳サーバシステム
104 soda pop(ソーダ水)
112 スペイン語の候補キーワード
116a〜n コーパス
116a 検索クエリログコーパス
116b 電子文書コーパス
116n ソーシャルネットワークコンテンツコーパス
118 表
122 キーワード
200 例示的システム
202 ローカライズ翻訳サーバシステム
204 コンテンツサーバシステム
206 コーパス
208 クライアントコンピューティングデバイス
210 入力/出力(I/O)インターフェース
212 ネットワーク
214 要求モジュール
216 プレゼンテーションモジュール
218 I/Oインターフェース
220 コンテンツ要求処理モジュール
222 言語
224 I/Oインターフェース
226 キーワードグルーピングモジュール
228 キーワード関係データリポジトリ
230 自動翻訳モジュール
232 キーワード増大モジュール
234 キーワード頻度モジュール
236 キーワード選択コンポーネント
300 例示的方法
400 コンピューティングデバイス
402 プロセッサ
404 メモリ
406 ストレージデバイス
408 高速インターフェース
410 高速拡張ポート
412 低速インターフェース
414 低速バス
414 低速拡張ポート
416 ディスプレイ
420 標準サーバ
422 ラップトップコンピュータ
424 ラックサーバシステム
450 コンピューティングデバイス
452 プロセッサ
454 ディスプレイ
456 ディスプレイインターフェース
458 制御インターフェース
460 音声コーデック
462 外部インターフェース
464 メモリ
466 通信インターフェース
468 トランシーバ
470 GPS(グローバルポジショニングシステム)受信モジュール
472 拡張インターフェース
474 拡張メモリ
480 セルラー式電話
482 スマートフォン

Claims (22)

  1. 機械翻訳処理を使用して、1つまたは複数の第1キーワードをソース言語からターゲット言語の複数の第2キーワードに翻訳するステップと、
    コンピュータシステムによって、前記ターゲット言語に関連付けられるコーパス内でそれぞれの前記第2キーワードが出現する頻度を決定するステップと、
    前記コンピュータシステムによって、前記決定された出現頻度に基づいて前記ターゲット言語で使用するために前記第2キーワードのサブセットを選択するステップと、
    を備えることを特徴とする方法。
  2. 前記出現頻度を決定するステップの前に、それぞれが前記第2キーワードのうちの1つまたは複数との少なくとも1つのしきい値関連付けを有する前記ターゲット言語のさらなるキーワードを含むために、前記第2キーワードを増大するステップをさらに備える、請求項1に記載の方法。
  3. さらなるキーワードが、意味的に類似するキーワードの1つまたは複数のあらかじめ定められた単語クラスタに含まれている前記さらなるキーワードおよび前記第2キーワードに基づいて、前記第2キーワードのうちの1つとの少なくとも1つのしきい値関連付けを有すると決定される、請求項2に記載の方法。
  4. 前記第1キーワードを前記第2キーワードに翻訳するステップの前に、前記第1キーワードを、関連キーワードの1つまたは複数の第1グループにグルーピングするステップと、
    前記第1キーワードを前記第2キーワードに翻訳するステップの後に、前記第2キーワードを、それぞれの前記第2キーワードがそこから翻訳された前記第1グループおよび前記第1キーワードに基づいて、キーワードの1つまたは複数の第2グループにグルーピングするステップと、
    キーワードの前記第2グループに基づいて、前記第2キーワードの前記1つまたは複数のあらかじめ定められた単語クラスタを識別するステップと、
    をさらに備える、請求項3に記載の方法。
  5. さらなるキーワードが、前記ターゲット言語で同義語と識別されている前記さらなるキーワードおよび前記第2キーワードに基づいて、前記第2キーワードのうちの1つとの少なくとも1つのしきい値関連付けを有すると決定される、請求項2に記載の方法。
  6. 前記ターゲット言語の前記第2キーワードのうちの1つまたは複数に関連付けられる1つまたは複数のランディングページから前記さらなるキーワードのうちの1つまたは複数を抽出するステップをさらに備える、請求項2に記載の方法。
  7. 前記コーパスが、前記ターゲット言語に関連付けられる検索クエリの検索ログを備える、請求項1に記載の方法。
  8. 前記決定された頻度が、現在の時間からしきい値時間以内で受信された検索クエリの検索ログに基づく、請求項7に記載の方法。
  9. 前記コーパスが、検索エンジンによって使用される1つまたは複数のコーパスを備え、前記頻度を決定するステップが、少なくとも部分的に、前記検索エンジンを使用して前記第2キーワードごとに検索を行うステップを含む、請求項1に記載の方法。
  10. 前記コーパスが、前記ターゲット言語に関連付けられる、および1つまたは複数のソーシャルネットワークからの、ユーザが作成したコンテンツを備える、請求項1に記載の方法。
  11. 前記第2キーワードの前記サブセットの選択が、前記第2キーワードの前記サブセットと、前記ターゲット言語の1つまたは複数の広告との関連付けを含む、請求項1に記載の方法。
  12. 前記第2キーワードの前記サブセットからの1つまたは複数のキーワードを含む、検索結果に対応する検索クエリに基づいて、前記広告のうちの1つまたは複数を提供するための、前記ターゲット言語に関連付けられる検索結果を識別するステップをさらに備える、請求項11に記載の方法。
  13. 前記要求が、前記第1キーワードを、地理的領域に関連するターゲット言語に翻訳することをさらに指定し、
    前記コーパスが、前記ターゲット言語および前記地理的領域に関連付けられる、請求項1に記載の方法。
  14. それぞれのキーワードが1つまたは複数の単語を備える、請求項1に記載の方法。
  15. 前記第1キーワードの前記ソース言語から前記ターゲット言語への翻訳を求める前記受信された要求に基づいて、前記ターゲット言語に関連付けられる前記コーパスを選択するステップをさらに備える、請求項1に記載の方法。
  16. 前記コーパスが、前記受信された要求によって指定された前記ターゲット言語に関連付けられる地理的領域に基づいて選択される、請求項15に記載の方法。
  17. 1つまたは複数のコンピュータと、
    1つまたは複数の第1キーワードをソース言語からターゲット言語の複数の第2キーワードに翻訳するように構成された前記コンピュータの機械翻訳モジュールと、
    前記ターゲット言語に関連付けられるコーパス内でそれぞれの前記第2キーワードが出現する頻度を決定するように構成された前記コンピュータのキーワード頻度モジュールと、
    前記決定された出現頻度に基づいて前記ターゲット言語で使用するために前記第2キーワードのサブセットを選択するように構成された前記コンピュータのキーワード選択コンポーネントと、
    を備えることを特徴とするソース言語からターゲット言語にキーワードを翻訳するためのシステム。
  18. それぞれが前記第2キーワードのうちの1つまたは複数との少なくとも1つのしきい値関連付けを有する前記ターゲット言語のさらなるキーワードを含むために、前記第2キーワードを増大するように構成されたキーワード増大モジュールをさらに備える、請求項17に記載のシステム。
  19. さらなるキーワードが、意味的に類似するキーワードのあらかじめ定められた単語クラスタに含まれている前記さらなるキーワードおよび前記第2キーワードに基づいて、前記第2キーワードのうちの1つとの少なくとも1つのしきい値関連付けを有するように決定される、請求項18に記載のシステム。
  20. 命令を符号化するコンピュータ可読媒体を備える装置であって、コンピューティングデバイスによる実行に応答して、前記コンピューティングデバイスに、
    機械翻訳処理を使用して、1つまたは複数の第1キーワードをソース言語からターゲット言語の複数の第2キーワードに翻訳するステップと、
    前記ターゲット言語に関連付けられるコーパス内でそれぞれの前記第2キーワードが出現する頻度を決定するステップと、
    前記決定された出現頻度に基づいて前記ターゲット言語で使用するために前記第2キーワードのサブセットを選択するステップと、
    を備える動作を実施させることを特徴とする装置。
  21. 前記動作が、前記出現頻度を決定するステップの前に、それぞれが前記第2キーワードのうちの1つまたは複数との少なくとも1つのしきい値関連付けを有する前記ターゲット言語のさらなるキーワードを含むために、前記第2キーワードを増大するステップをさらに備える、請求項20に記載のコンピュータプログラム製品。
  22. さらなるキーワードが、意味的に類似するキーワードのあらかじめ定められた単語クラスタに含まれている前記さらなるキーワードおよび前記第2キーワードに基づいて、前記第2キーワードのうちの1つとの少なくとも1つのしきい値関連付けを有するように決定される、請求項21に記載のコンピュータプログラム製品。
JP2014506551A 2011-04-21 2012-04-19 キーワードのローカライズ翻訳 Pending JP2014519074A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/091,272 US8484218B2 (en) 2011-04-21 2011-04-21 Translating keywords from a source language to a target language
US13/091,272 2011-04-21
PCT/US2012/034265 WO2012145521A1 (en) 2011-04-21 2012-04-19 Localized translation of keywords

Publications (1)

Publication Number Publication Date
JP2014519074A true JP2014519074A (ja) 2014-08-07

Family

ID=46085157

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014506551A Pending JP2014519074A (ja) 2011-04-21 2012-04-19 キーワードのローカライズ翻訳

Country Status (5)

Country Link
US (1) US8484218B2 (ja)
EP (1) EP2700027A1 (ja)
JP (1) JP2014519074A (ja)
KR (1) KR101735024B1 (ja)
WO (1) WO2012145521A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014519104A (ja) * 2011-05-20 2014-08-07 グーグル インコーポレイテッド ソーシャルネットワークのためのフィード翻訳
JP2019180965A (ja) * 2018-04-13 2019-10-24 グリー株式会社 ゲームプログラム及びゲーム装置

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009016631A2 (en) * 2007-08-01 2009-02-05 Ginger Software, Inc. Automatic context sensitive language correction and enhancement using an internet corpus
US9710429B1 (en) * 2010-11-12 2017-07-18 Google Inc. Providing text resources updated with translation input from multiple users
US10140320B2 (en) 2011-02-28 2018-11-27 Sdl Inc. Systems, methods, and media for generating analytical data
US9984054B2 (en) 2011-08-24 2018-05-29 Sdl Inc. Web interface including the review and manipulation of a web document and utilizing permission based control
WO2013030823A2 (en) * 2011-08-29 2013-03-07 Jobookit Technologies Ltd. An intelligent job recruitment system and method
US9916306B2 (en) 2012-10-19 2018-03-13 Sdl Inc. Statistical linguistic analysis of source content
US20140280295A1 (en) * 2013-03-14 2014-09-18 Microsoft Corporation Multi-language information retrieval and advertising
WO2014162211A2 (en) 2013-03-15 2014-10-09 Translate Abroad, Inc. Systems and methods for displaying foreign character sets and their translations in real time on resource-constrained mobile devices
US8965129B2 (en) 2013-03-15 2015-02-24 Translate Abroad, Inc. Systems and methods for determining and displaying multi-line foreign language translations in real time on mobile devices
US20140344058A1 (en) * 2013-03-15 2014-11-20 Fision Holdings, Inc Systems and methods for distributed marketing automation
JP5449633B1 (ja) * 2013-03-22 2014-03-19 パナソニック株式会社 広告翻訳装置、広告表示装置、および広告翻訳方法
TWI504860B (zh) * 2013-06-14 2015-10-21 Insyde Software Corp An electronic device and how to launch an app based on address information
US9262411B2 (en) * 2013-07-10 2016-02-16 International Business Machines Corporation Socially derived translation profiles to enhance translation quality of social content using a machine translation
US9852129B2 (en) * 2013-11-26 2017-12-26 International Business Machines Corporation Language independent processing of logs in a log analytics system
US9639526B2 (en) * 2014-01-10 2017-05-02 Microsoft Technology Licensing, Llc Mobile language translation of web content
US9870425B2 (en) * 2014-02-27 2018-01-16 Excalibur Ip, Llc Localized selectable location and/or time for search queries and/or search query results
US10349093B2 (en) * 2014-03-10 2019-07-09 Cisco Technology, Inc. System and method for deriving timeline metadata for video content
CA2943513C (en) 2014-03-29 2020-08-04 Thomson Reuters Global Resources Improved method, system and software for searching, identifying, retrieving and presenting electronic documents
US20150302006A1 (en) * 2014-04-18 2015-10-22 Verizon Patent And Licensing Inc. Advanced search for media content
USD749115S1 (en) 2015-02-20 2016-02-09 Translate Abroad, Inc. Mobile device with graphical user interface
CN104751456B (zh) * 2015-03-13 2017-10-20 深圳大学 基于条件直方图码书的盲图像质量评价方法
WO2017015220A1 (en) * 2015-07-17 2017-01-26 Speak Easy Language Learning Incorporated Second language acquisition systems, methods, and devices
TWI712899B (zh) * 2015-07-28 2020-12-11 香港商阿里巴巴集團服務有限公司 資訊查詢方法及裝置
KR102407630B1 (ko) * 2015-09-08 2022-06-10 삼성전자주식회사 서버, 사용자 단말 및 이들의 제어 방법.
KR102578982B1 (ko) * 2015-11-30 2023-09-18 삼성전자주식회사 번역 서비스를 제공하는 방법 및 이를 위한 전자 장치
KR102251832B1 (ko) 2016-06-16 2021-05-13 삼성전자주식회사 번역 서비스를 제공하는 전자 장치 및 방법
US11829428B2 (en) 2016-07-06 2023-11-28 Vimio Co. Ltd App name search method and system
US10248406B2 (en) * 2016-11-17 2019-04-02 International Business Machines Corporation Locale object management
US10268674B2 (en) * 2017-04-10 2019-04-23 Dell Products L.P. Linguistic intelligence using language validator
US10432987B2 (en) 2017-09-15 2019-10-01 Cisco Technology, Inc. Virtualized and automated real time video production system
KR102449842B1 (ko) 2017-11-30 2022-09-30 삼성전자주식회사 언어 모델 학습 방법 및 이를 사용하는 장치
TWI685759B (zh) * 2018-08-31 2020-02-21 愛酷智能科技股份有限公司 智能學習語詞編修與多國語言互譯的系統與方法
CN109408822A (zh) * 2018-10-30 2019-03-01 中译语通科技股份有限公司 一种跨语言图书相关度分析方法及系统

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5384701A (en) * 1986-10-03 1995-01-24 British Telecommunications Public Limited Company Language translation system
US5765131A (en) * 1986-10-03 1998-06-09 British Telecommunications Public Limited Company Language translation system and method
US5263162A (en) * 1990-11-07 1993-11-16 Hewlett-Packard Company Method of validating a label translation configuration by parsing a real expression describing the translation configuration
US5557794A (en) * 1991-09-02 1996-09-17 Fuji Xerox Co., Ltd. Data management system for a personal data base
CA2078423C (en) * 1991-11-19 1997-01-14 Per-Kristian Halvorsen Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
JP2502023B2 (ja) * 1992-04-13 1996-05-29 インターナショナル・ビジネス・マシーンズ・コーポレイション デ―タ・ファイルの比較方法及びシステム
US5495604A (en) * 1993-08-25 1996-02-27 Asymetrix Corporation Method and apparatus for the modeling and query of database structures using natural language-like constructs
US5774845A (en) * 1993-09-17 1998-06-30 Nec Corporation Information extraction processor
CA2138830A1 (en) * 1994-03-03 1995-09-04 Jamie Joanne Marschner Real-time administration-translation arrangement
US5546583A (en) * 1994-04-05 1996-08-13 International Business Machines Corporation Method and system for providing a client/server interface in a programming language
JPH0877176A (ja) * 1994-09-07 1996-03-22 Hitachi Ltd 外国語翻訳装置
US5615301A (en) * 1994-09-28 1997-03-25 Rivers; W. L. Automated language translation system
US5675801A (en) * 1994-09-30 1997-10-07 International Business Machines Corporation Object oriented system and method for generating target language code
JP3152868B2 (ja) * 1994-11-16 2001-04-03 富士通株式会社 検索装置および辞書/テキスト検索方法
JPH08329105A (ja) * 1995-05-31 1996-12-13 Canon Inc 文書処理方法及びその装置
JP3385146B2 (ja) * 1995-06-13 2003-03-10 シャープ株式会社 会話文翻訳装置
US5805775A (en) * 1996-02-02 1998-09-08 Digital Equipment Corporation Application user interface
GB2314183A (en) * 1996-06-14 1997-12-17 Sharp Kk Accessing a database
US6523170B1 (en) * 1996-07-26 2003-02-18 International Business Machines Corporation Technique for creating internet enabled resource files
US5878425A (en) * 1996-08-21 1999-03-02 International Business Machines Corp. Intuitive technique for visually creating resource files
US6122606A (en) * 1996-12-10 2000-09-19 Johnson; William J. System and method for enhancing human communications
US5956711A (en) * 1997-01-16 1999-09-21 Walter J. Sullivan, III Database system with restricted keyword list and bi-directional keyword translation
US6341372B1 (en) * 1997-05-01 2002-01-22 William E. Datig Universal machine translator of arbitrary languages
US6233545B1 (en) * 1997-05-01 2001-05-15 William E. Datig Universal machine translator of arbitrary languages utilizing epistemic moments
US20020038308A1 (en) * 1999-05-27 2002-03-28 Michael Cappi System and method for creating a virtual data warehouse
US6598038B1 (en) * 1999-09-17 2003-07-22 Oracle International Corporation Workload reduction mechanism for index tuning
US6715129B1 (en) * 1999-10-13 2004-03-30 International Business Machines Corporation Achieving application-specific document content by transcoding using Java Server Pages
US6738745B1 (en) * 2000-04-07 2004-05-18 International Business Machines Corporation Methods and apparatus for identifying a non-target language in a speech recognition system
US6604101B1 (en) * 2000-06-28 2003-08-05 Qnaturally Systems, Inc. Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network
US9946788B2 (en) * 2002-07-23 2018-04-17 Oath Inc. System and method for automated mapping of keywords and key phrases to documents
JP3973549B2 (ja) * 2002-12-19 2007-09-12 沖電気工業株式会社 対訳依存構造対応付け装置、方法及びプログラム、並びに、対訳依存構造対応付けプログラムを記録した記録媒体
US20040249824A1 (en) * 2003-06-05 2004-12-09 International Business Machines Corporation Semantics-bases indexing in a distributed data processing system
JP3790825B2 (ja) * 2004-01-30 2006-06-28 独立行政法人情報通信研究機構 他言語のテキスト生成装置
US7664629B2 (en) * 2005-07-19 2010-02-16 Xerox Corporation Second language writing advisor
US20070022134A1 (en) 2005-07-22 2007-01-25 Microsoft Corporation Cross-language related keyword suggestion
KR100522029B1 (ko) * 2005-07-27 2005-10-18 엔에이치엔(주) 실시간 급상승 검색어 검출 방법 및 실시간 급상승 검색어검출 시스템
US20070214158A1 (en) * 2006-03-08 2007-09-13 Yakov Kamen Method and apparatus for conducting a robust search
US7447684B2 (en) * 2006-04-13 2008-11-04 International Business Machines Corporation Determining searchable criteria of network resources based on a commonality of content
US7814098B2 (en) * 2006-06-14 2010-10-12 Yakov Kamen Method and apparatus for keyword mass generation
US8041596B2 (en) * 2006-09-08 2011-10-18 Eldis Inc. Methods for estimating search engine market share for websites
KR100795304B1 (ko) 2007-05-16 2008-01-15 박정규 확장 키워드를 이용하여 검색어에 대응하는 광고를표시하는 광고 제공 시스템, 광고 제공 서버, 사용자 단말및 광고 제공 방법
US8051061B2 (en) * 2007-07-20 2011-11-01 Microsoft Corporation Cross-lingual query suggestion
US8126880B2 (en) * 2008-02-22 2012-02-28 Tigerlogic Corporation Systems and methods of adaptively screening matching chunks within documents
US7937395B2 (en) * 2008-02-22 2011-05-03 Tigerlogic Corporation Systems and methods of displaying and re-using document chunks in a document development application
WO2009144698A1 (en) * 2008-05-26 2009-12-03 Kenshoo Ltd. A system for finding website invitation cueing keywords and for attribute-based generation of invitation-cueing instructions
US20110047136A1 (en) * 2009-06-03 2011-02-24 Michael Hans Dehn Method For One-Click Exclusion Of Undesired Search Engine Query Results Without Clustering Analysis
US8713078B2 (en) * 2009-08-13 2014-04-29 Samsung Electronics Co., Ltd. Method for building taxonomy of topics and categorizing videos
TWI434187B (zh) * 2010-11-03 2014-04-11 Inst Information Industry 文字轉換方法與系統

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014519104A (ja) * 2011-05-20 2014-08-07 グーグル インコーポレイテッド ソーシャルネットワークのためのフィード翻訳
JP2019180965A (ja) * 2018-04-13 2019-10-24 グリー株式会社 ゲームプログラム及びゲーム装置

Also Published As

Publication number Publication date
WO2012145521A1 (en) 2012-10-26
US8484218B2 (en) 2013-07-09
US20120271828A1 (en) 2012-10-25
KR20140027285A (ko) 2014-03-06
EP2700027A1 (en) 2014-02-26
KR101735024B1 (ko) 2017-05-24

Similar Documents

Publication Publication Date Title
US8484218B2 (en) Translating keywords from a source language to a target language
JP6419905B2 (ja) クエリについての逆演算子の使用
JP6193518B2 (ja) オンライン・ソーシャル・ネットワーク上での検索クエリ対話
JP6435307B2 (ja) クエリについての検索意図
US10325033B2 (en) Determination of content score
JP6334696B2 (ja) ハッシュタグおよびコンテンツ提示
JP5255055B2 (ja) クエリ統計プロバイダ
US11966432B2 (en) Media consumption context for personalized instant query suggest
US7984034B1 (en) Providing parallel resources in search results
US10496649B1 (en) Personalized suggestions based on past queries
US20170220579A1 (en) Mentions-Modules on Online Social Networks
US20110040769A1 (en) Query-URL N-Gram Features in Web Ranking
US9934283B2 (en) Social annotations for enhanced search results
US10262057B2 (en) Presenting content in accordance with a placement designation
US8712850B1 (en) Promoting content
US9811592B1 (en) Query modification based on textual resource context
US9092463B2 (en) Keyword generation
US8892596B1 (en) Identifying related documents based on links in documents
US10042936B1 (en) Frequency-based content analysis
US20160148261A1 (en) System for contextualizing geocodable queries