JP2004516527A - クロス言語ライティングウィザードを伴うコンピュータ支援ライティングのシステムおよび方法 - Google Patents
クロス言語ライティングウィザードを伴うコンピュータ支援ライティングのシステムおよび方法 Download PDFInfo
- Publication number
- JP2004516527A JP2004516527A JP2001579138A JP2001579138A JP2004516527A JP 2004516527 A JP2004516527 A JP 2004516527A JP 2001579138 A JP2001579138 A JP 2001579138A JP 2001579138 A JP2001579138 A JP 2001579138A JP 2004516527 A JP2004516527 A JP 2004516527A
- Authority
- JP
- Japan
- Prior art keywords
- native
- word
- language
- english
- chinese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/47—Machine-assisted translation, e.g. using translation memory
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
Description
(技術分野)
本発明は、コンピュータ支援ライティングのシステムおよび方法に関する。より詳細には、本発明は、複数言語の入力を容易にし、非母語の入力についてユーザを援助する、言語入力ユーザインターフェースおよび基礎となるアーキテクチャに関する。
【0002】
(発明の背景)
インターネットの急速な発展に伴って、全世界のコンピュータユーザが英語を書くことがますます珍しくなくなりつつある。残念ながら、大きく異なる文化および書き方を有する社会にとって、英語で書く能力は、常に存在する障壁である。これは、知識の欠如に起因するものではない。というのは、調査から、多数の非英語圏ユーザが、英語を母語とする人が書いた文と、ブロークンイングリッシュで書かれた文を簡単に区別するのに十分な英語の知識を有することが示されるからである。英語が、例として使用されるが、この問題は、他の言語境界にまたがって存在する。
【0003】
中国人ユーザの場合を検討する。通常、中国人ユーザは、綴りまたは使い方に精通していない英語の単語/句を書きたい時に、通常は、中英辞書でその単語/句を探す。辞書が電子辞書である場合には、ユーザは、ある入力機構を介して中国語の単語/句を入力しなければならない。この処理は、3つの短所を有する。第1に、中国人ユーザが中国語の単語/句を入力することは都合よくない。第2に、ユーザに中国語の単語/句を入力することを強制することによって、英語で書く時の思考の流れが中断される。第3に、英語を母語としない人間として、中国人ユーザが辞書から適当な単語を選択することは困難である。
【0004】
したがって、英語を母語とするユーザとして綴り、文法、および書き方について非英語圏ユーザを助けるコンピュータ支援ライティングシステムが必要とされている。本発明人が想像するように、そのようなコンピュータ支援ライティングシステムは、必要な時に必ずさまざまな種類のヘルプを提供し、ユーザが書き方を制御できるようにするコンサルタントとして働かなければならない。そのようなシステムは、綴りの難しい単語についてユーザを援助するために綴り方のヘルプを提供し、それと同時にある文脈での使用法を検査することができる。コンピュータ支援ライティングシステムは、さらに、完全な例文を提供することによって、ユーザが書き方を洗練できるようにする何らかの形の文ヘルプを提供することができる。
【0005】
複数のコンピュータ支援手法が提案されてきた。これらの手法は、(1)自動翻訳、および(2)翻訳メモリという2つのカテゴリに分類される。両方が、文レベルで動作する。前者は、ユーザによって入力された文を、文法的および文体的に正しい文に自動的に翻訳することを試みる。しかし、現在のシステムでの完全自動コンピュータ翻訳の品質は、高い品質を確保するために翻訳後かなりの量の手作業による編集が必要なので、完全に満足なものではない。翻訳メモリ手法は、文を与えられて、翻訳例データベースから似た文を検索するという点で、ケースベースのシステムに似た形で動作する。その後、ユーザが、類推によって対象の文を翻訳する。
【0006】
どちらの手法にもいくつかの長所があるが、コンピュータ支援ライティングシステムを用いるユーザの体験を改善する余地がある。具体的に言うと、非英語圏ユーザが、力ずくの労力を減らして最高の品質のライティングを達成する形でコンピュータと共同作業できるようにするコンピュータ支援ライティングシステムが必要とされている。
【0007】
(発明の概要)
コンピュータ支援ライティングシステムが、非母語で書くユーザに、ユーザが助けを必要とする時に、ユーザが入力タスクから注意をそらすことを必要とせずに、援助を提供する。ライティングシステムは、ライティング援助と通常のテキスト入力を統合するユーザインターフェース(UI)を提供する。ライティングシステムは、非母語単語の綴りまたは所与の文脈に適当な単語の選択に悩んでいるユーザに援助を提供する。ライティングシステムは、単語の使い方を示し、文を正しく作る方法を示すために、例の文構造も提供する。
【0008】
本明細書に記載の実施態様では、ライティングシステムが、ワードプロセッシングプログラムのライティングウィザードとして実施される。ライティングウィザードは、ユーザが非母語の単語を入力できるようにするグラフィカルUIを介して公開される。ユーザが、単語の綴りまたは単語が適当であるかどうかについて確信がない時に、ユーザは、対応する母語単語を、進行中の文の行に直接に入力することができる。
【0009】
誤りを許容するスペリングツールが、母語単語(綴りが誤っていたり誤入力されたものであっても)を受け入れ、所与の文脈について最も確からしい非母語単語の導出を試みる。スペリングツールは、2ヶ国語辞書を使用して、可能な非母語単語翻訳候補を判定する。これらの候補は、非母語モデル(たとえばトライグラム言語モデル)および翻訳モデルに渡される。非母語モデルは、現在の文または句の文脈を与えられて、候補に関連する確率を生成する。翻訳モデルは、非母語単語候補を与えられて、母語単語がどのように意図されるかの確率を生成する。これらの確率から、スペリングツールが、最も有望な非母語単語翻訳を判定する。ライティングウィザードが、ネイティブ入力文字列を非母語単語に置換する。ユーザにとって、置換は、ネイティブ入力文字列の入力のほぼ直後に行われる。
【0010】
ユーザが非母語単語を好む場合に、ユーザは、単純にその文を継続することができる。その一方で、ユーザが、まだ非母語単語について確信がない場合に、ユーザは、ライティングウィザードからさらに援助を呼び出すことができる。たとえば、ライティングウィザードは、単語の使い方を習得するために、ユーザが文の文脈で非母語単語を見られるようにする文推薦ツールを有する。例の2ヶ国語の文の対を含むウィンドウが、ユーザに提示され、その結果、ユーザが、非母語単語が文でどのように使用されるかを習得でき、母語で書かれた対応する文を見られるようになる。さらに、ウィザードは、入力文字列の他の母語単語翻訳のリストならびに他の非母語単語候補のリストを提示することができる。ユーザは、これらの単語のどれでも選択でき、2ヶ国語の文の例の対で選択された単語をレビューすることができる。この形で、スペリングツールおよび文推薦ツールが、統一された形で一緒に働いて、非母語でのライティングの生産性を大いに高める。
【0011】
同一の符号を使用して、複数の図面を通じて類似する構成要素および特徴を示す。
【0012】
(好適実施形態の詳細な説明)
コンピュータ支援ライティングシステムは、綴りおよび文構造に関するコンサルテーション援助を提供することによって、ユーザが非母語で書くのを助ける。ライティングシステムは、スペリングを援助する統計的スペリングツールと、例文を知的に推薦する文推薦ツールを実装する。ツールは、非母語でのライティングの生産性を非常に高める統合された機構としてユーザインターフェースを介して表示される。
【0013】
ライティングのシステムおよび方法について、英語で書く非英語圏ユーザを助けるものとして説明する。具体的に言うと、例示のためにこの開示全体を通じて使用される例示的実施形態は、英語で書く中国人ユーザを対象とする。しかし、本明細書に記載の原理および概念は、他の言語および他の国のユーザに簡単に移植できる。
【0014】
議論のために、コンピュータ支援ライティングシステムを、汎用コンピュータによって実行されるワードプロセッシングプログラムの全般的な文脈で説明する。しかし、コンピュータ支援ライティングシステムは、ワードプロセッシング以外の多数の異なる環境(たとえば、電子メールシステム、ブラウザなど)で実施することができ、多数の別個のタイプのデバイスで実践することができる。
【0015】
システムアーキテクチャ
図1に、中央処理装置(CPU)102、メモリ104、および入出力(I/O)インターフェース106を有する例示的なコンピュータシステム100を示す。CPU102は、メモリ104およびI/Oインターフェース106と通信する。メモリ104は、揮発性メモリ(たとえばRAM)および不揮発性メモリ(たとえばROM、ハードディスクなど)の両方を表す。プログラム、データ、ファイルを、メモリ104に保管し、CPU102上で実行することができる。
【0016】
コンピュータシステム100は、I/Oインターフェース106を介して接続される1つまたは複数の周辺装置を有する。例示的な周辺装置には、マウス110、キーボード112(たとえば、英数字QWERTYキーボード、音標キーボードなど)、ディスプレイモニタ114、プリンタ116、周辺記憶装置118、およびマイクロフォン120が含まれる。コンピュータシステムは、たとえば、汎用コンピュータとして実施することができる。したがって、コンピュータシステム100は、メモリ104に保管され、CPU102上で実行されるコンピュータオペレーティングシステム(図示せず)を実施する。オペレーティングシステムは、ウィンドウイング環境をサポートするマルチタスクオペレーティングシステムであることが好ましい。適当なオペレーティングシステムの例が、Microsoft Corporation社のWindows(登録商標)ブランドオペレーティングシステムである。
【0017】
ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースの、またはプログラマブルな消費者電子製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、および類似物など、他のコンピュータシステム構成を使用できることに留意されたい。さらに、図1にはスタンドアローンコンピュータが示されているが、言語入力システムを、通信ネットワーク(たとえば、LAN、インターネットなど)を介してリンクされたリモート処理装置によってタスクが実行される分散コンピューティング環境で実践することができる。分散コンピューティング環境では、プログラムモジュールを、ローカルとリモートの両方のメモリストレージデバイスに配置することができる。
【0018】
コンピュータシステム100は、(1)言語変換と(2)非母語でのライティングの援助という2つの機能をサービスするライティングシステムを実施する。第1の機能は、入力文字列(たとえば音標テキスト)を受け取り、入力文字列を出力文字列(たとえば言語テキスト)に自動的に変換することである。変換処理では、綴りおよび入力の誤りが許容される。第2の機能は、スペリング援助および正しい文の構造および文体に関するガイダンスを提供することによる、非母語で単語および文を書くユーザを支援することである。
【0019】
ライティングシステムは、図1では、メモリ104に保管され、CPU102上で実行されるデータ処理プログラムまたはワードプロセッシングプログラム130として実施される。ワードプロセッシングプログラム130は、言語変換およびライティング援助を実行する言語入力アーキテクチャ132を実施する。言語入力アーキテクチャ132は、変換機能を実施する変換システム134と、非ネイティブテキストを入力する時にユーザを援助するクロス言語ウィザード136を有する。変換システム134およびクロス言語ウィザード136は、統一されたユーザインターフェース(UI)138を介して公開される。ワードプロセッシングプログラム130に、アーキテクチャ132に加えて他のコンポーネントを含めることができるが、そのようなコンポーネントは、ワードプロセッシングプログラムに標準的であるとみなされ、詳細に図示も説明もしない。
【0020】
変換システム134
変換システム134は、ある形態(たとえば音標テキスト文字)の入力文字列を別の形態(たとえば言語テキスト文字)の出力文字列に変換する。変換システム134には、検索エンジン140、1つまたは複数のタイピングモデル142、言語モデル144、およびさまざまな言語に関する1つまたは複数の語彙146が含まれる。アーキテクチャ132は、言語独立である。UI138および検索エンジン140は、包括的であり、どの言語にも使用することができる。アーキテクチャ132は、言語モデル144、タイピングモデル142、および語彙146を変更することによって、特定の言語に適応される。
【0021】
ユーザは、マウス110、キーボード112、またはマイクロフォン120などの1つまたは複数の周辺入力装置を介して入力文字列を入力する。この形で、ユーザは、キー入力または口頭音声を使用して音標情報を入力することができる。口頭音声の場合に、コンピュータシステムが、さらに、話された単語を受け取り、それらを音標テキストに変換する音声認識モジュール(図示せず)を実施することができる。以下の議論では、キーボード112を介するテキストの入力が、フルサイズの標準英数QWERTYキーボード上で実行されると仮定する。
【0022】
UI138は、入力される際に入力文字列を表示する。UI138は、グラフィカルユーザインターフェースであることが好ましい。UI138のより詳細な説明は、上で参照した米国特許出願第 号、表題「Language Input User Interface」に記載されている。一例として、入力文字列に、音標テキストまたは音標テキストと非音標テキストの混合が含まれる。「音標テキスト」は、全般的に、所与の言語を話す時に作られる音を表す英数字テキストである。「非音標テキスト」は、所与の言語を話す時に作られる音を表さない英数字テキストである。非音標テキストには、句読点、特殊な記号、および言語テキスト以外の書かれた言語を表す英数字テキストを含めることができる。
【0023】
変換システム134は、音標テキストを言語テキストに変換する。「言語テキスト」は、書かれた言語を表す文字および非文字記号である。おそらく、一般的に言って、音標テキストは、書かれた時にローマ字文字セットを使用しない所与の言語を話す時に作られる音を表す、ローマ字ベースの文字セット(たとえば英語のアルファベット)で表現されたすべての英数字テキストとすることができる。言語テキストは、所与の言語に対応する書かれた記号である。
【0024】
議論のために、ワードプロセッサ130を、中国語ベースのワードプロセッサの文脈で説明し、言語入力アーキテクチャ132を、ピンインを簡体字に変換するように構成する。すなわち、音標テキストが、ピンインであり、言語テキストが、簡体字である。しかし、言語入力アーキテクチャは、言語独立であり、他の言語に使用することができる。たとえば、音標テキストを、話された日本語(ひらがな、かたかな)の形とすることができ、言語テキストが、漢字などの日本語の書かれた言語を表す。存在する多数の他の言語に、アラビア語、韓国語、インド語、他のアジアの言語などが含まれるが、これに制限されない。
【0025】
ユーザインターフェース138は、音標テキスト(P)を検索エンジン140に渡し、検索エンジン140は、音標テキストをタイピングモデル142に渡す。タイピングモデル142は、音標テキストに誤りが含まれる可能性があるものとして、ユーザの意図した音標テキストの適当な編集とすることができるさまざまなタイピング候補(TC1、…、TCN)を生成する。タイピングモデル142は、適度な確率を有する複数のタイピング候補を検索エンジン140に返し、検索エンジン140は、タイピング候補を言語モデル144に渡す。言語モデル144は、進行中の文の文脈内でタイピング候補を評価し、ユーザの意図した音標テキストの変換された形を表すことができる言語テキストで書かれたさまざまな変換候補(CC1、…、CCN)を生成する。変換候補は、タイピング候補と関連付けられる。
【0026】
音標テキストから言語テキストへの変換は、1対1変換ではない。同一のまたは類似する音標テキストが、言語テキストの複数の文字または記号を表す場合がある。したがって、言語テキストへの変換の前に、音標テキストの文脈を解釈する。その一方で、非音標テキストの変換は、通常は、表示される英数字テキストが英数字入力と同一である、直接の1対1変換である。
【0027】
変換候補(CC1、…、CCN)は、検索エンジン140に渡され、検索エンジン140は、統計的分析を行って、どのタイピング候補および変換候補が、ユーザによって意図されることの最も高い確率を示すかを判定する。確率が計算された後に、検索エンジン140は、最高の確率を有する候補を選択し、変換候補の言語テキストをUI138に返す。UI138は、音標テキストを、ディスプレイの同一行内で変換候補の言語テキストに置換する。その間に、新たに入力された音標テキストが、行内で新たに挿入された言語テキストの先に表示され続ける。
【0028】
ユーザが、検索エンジン140によって選択されたものから言語テキストを変更したい場合には、ユーザインターフェース138が、選択が実際に意図された答である確度の順でランキングされた他の高い確率の候補の最初のリストを提示する。ユーザが、可能な候補でまだ満足しない場合には、UI138が、すべての可能な選択肢を提供する第2のリストを提示する。第2のリストは、確率または他のメトリック(たとえば、中国文字の画数または複雑さ)に関してランキングすることができる。
【0029】
クロス言語ウィザード136
ワードプロセッシングプログラム130は、その代わりにまたは追加して、主に非母語で書くのに使用することができる。クロス言語ライティングウィザード136は、非母語で効率的に書くのに必要なサポートを与える。ユーザは、UI138を介して非母語を入力する。ユーザは、単語または句をどう書くのか自信がない時に、自分の母語で単語を入力することができる。ライティングウィザード136は、異なる言語入力を認識し、ユーザの注意を入力タスクからそらさずに効果的なヘルプを提供する。ウィザードは、ユーザのライティングを改善する方法として、スペリング援助を提供し、文構造および文体を推薦する。
【0030】
たとえば、中国人ユーザが、英語でテキストを書きたがっていると仮定する。このユーザは、UI138によって提示される入力領域に英文を書く。ユーザは、ある発想を英語でどのように表現するのか確信がない時に、精通した中国ピンインで書くことを決定することができる。ライティングウィザード136は、ピンイン入力を認識し、ピンインを、即座に最も適する英単語に翻訳する。対応する中国語単語が、ユーザの参照のために英単語の横に示される。ユーザは、英単語が全く正しくないと思う時に、中国語ピンインに関連する他の英単語を要求することができる。ユーザは、英単語がこの文脈に最適であるかどうかに確信がない場合に、中国語の単語と英単語が一緒に提示される、中英2ヶ国語文例をブラウズすることができる。文脈情報は、どの単語が現在の文脈に最も適するかをユーザが判断するのを助ける。さらに、ユーザは、中国語の文パターンを直接に入力し、2ヶ国語文例をブラウズすることによって適当な英文を選択することができる。
【0031】
例示的なライティングウィザードアーキテクチャ
図2に、ユーザインターフェース138とライティングウィザード136を統合する例示的なライティングウィザードアーキテクチャ200を示す。ライティングウィザードアーキテクチャ200を用いると、ユーザが、UI138を介して1つまたは複数の言語で文字を入力でき、ユーザがヘルプを必要とする時に、ユーザの注意を入力領域からそらさずにヘルプを提供できるようになる。
【0032】
ライティングウィザード200は、単語または句のレベルでスペリング援助を提供するスペリングツール202と、文構造に関する有用な提案を提供する文推薦ツール204を有する。ツール202および204は、ユーザが必要とする援助を提供するために一緒に働く。やはり、議論のために、ツールを、中国人ユーザが英語で書くという文脈で説明する。しかし、ツールは、どの言語の組合せでも実施することができる。
【0033】
スペリングツール202
スペリングツール202は、2つの主要な機能を実行する。第1の機能は、ユーザによって入力された英単語に関連する類義語または反意語を提供することである。スペリングツールは、英語シソーラス210にアクセスして、英単語の類義語または反意語を検索する。
【0034】
ツール202の第2の機能は、ユーザが入力した母語単語を非母語単語に翻訳することである。スペリングツールは、入力された文字列をユーザに馴染みのある母語単語に自動的に変換するトランスレータ212を備える。たとえば、中国人ユーザは、ピンイン文字列を入力することができ、トランスレータ212が、ピンインを簡体字文字の中国語の単語に変換する。トランスレータ212は、中国語の単語に関するピンイン確率を展開する(たとえば、中国語の単語「 」が、2つのピンインの組「le」および「yue」を有する)音声モデル、誤綴りおよび入力エラーを受け入れるフォールトトレラントモデル、および簡略化されたピンインモデル(たとえば、ユーザが「huanjing」の代わりに「hj」を入力できるようにする)を含むように実施される。
【0035】
最初の形態変換に続いて、トランスレータ212は、母語単語を、進行中の文で使用することができる適当な非母語単語に翻訳する。中英ライティングシステムを用いる図示の実施形態では、トランスレータ212が、変換をもたらす3つのモデルすなわち、(1)英語言語モデル214、(2)中英2ヶ国語辞書216、および(3)英中翻訳モデル218を使用する。
【0036】
中英2ヶ国語辞書216には、中国語の単語に関する可能な英単語翻訳候補を提供するために、中国語の単語とそれに対応する英語翻訳が含まれる。一例として、辞書216に、約115000個の中国語の単語および対応する英語翻訳を含めることができる。辞書216に、品詞、意味論的分類などの他の情報を含めることもできる。
【0037】
英語言語モデル214は、現在の文または句の文脈を与えられて、英単語候補に関連する確率を生成する。一実施形態では、英語言語モデル214が、「Statistical Methods for Speech Recognition」、Frederick Jelinek著、The MIT Press、Cambridge、Massachusetts、1997年に記載のNグラムマルコフモデルなどの統計的Nグラムモデルである。1つの適当な例として、英語言語モデル214を、約240000000個のトライグラムおよび58000単語の語彙を使用するトライグラムモデル(すなわちN=3)として構成することができる。
【0038】
英中翻訳モデル218は、英単語候補のそれぞれを与えられて、中国語の単語がどのように意図されたものであるかの確率を生成する。一実施形態では、英中翻訳モデル218が、コーパス224(下で説明する)から導出することができる、単語整列された2ヶ国語コーパスからトレーニングされた統計モデルである。翻訳モデル218は、トレーニング2ヶ国語コーパスが十分に大きい場合にはトライグラムモデルとすることができ、そうでない場合には、バイグラムまたはユニグラムの翻訳モデルを使用することができる。書かれた中国語が、単語の間にスペースがない文字ストリームからなるので、中国語の文は、単語翻訳トレーニングの前に分節化される。トレーニングの前に、単語リストを最適化プロシージャと共に使用して、文を分節化する。適当な最適化プロシージャの一例が、Jianfeng Gao、Han−Feng Wang、Mingjing Li、およびKai−Fu Lee共著の論文、表題「A unified approach to statistical language modeling for Chinese」、IEEE、ICASPP2000、2000年に記載されている。
【0039】
分節化の後に、2ヶ国語トレーニングプロセスが、単語に対してトレーニングされる。1つの適当なプロセスは、中国語の文字または単語を与えられて英単語を生成する尤度を最大化する反復EM(期待値最大化)プロシージャに基づく。トレーニングプロセスの出力は、各中国語単語の潜在的な英語翻訳の組と、各翻訳の確率推定値である。1つの適当なEM手順が、Brown. P.F.、Jennifer C. Lai、およびR.L. Merce共著の論文、表題「Aligning sentences in parallel corpora」、In Proceedings of the 29th Annual Conference of the Association for Computational Linguistics、169−176 Berkeley、1991年に記載されている。
【0040】
トランスレータ212は、英語言語モデル214および英中翻訳モデル218から返された確率を使用して、文の文脈内のピンイン文字列に対してユーザが意図した単語である確率が最も高い英単語候補を判定する。ライティングウィザード136は、最適の単語をUI138に返し、UI138は、中国語ピンイン入力文字列を英単語に置換する。ユーザにとって、英単語は、ピンイン文字列を入力した後に、ほとんど即座に置換される。
【0041】
スペリングツール204をさらに示すために、中国人ユーザが、2つの英単語EW1およびEW2を入力し、その後、英語の新しい単語の綴りまたは表現について確信を持てなくなったと仮定する。中国人ユーザは、ユーザの意図を表すピンイン文字列PYを入力する。スペリングツール202は、文字列PYをトランスレータ212に渡し、トランスレータ212は、ピンイン中国語辞書からすべての候補中国語単語をルックアップする。
【0042】
図3に、単語レベルピンイン英語翻訳300を示す。第1行302に、ユーザが入力した英単語EW1およびEW2とピンインPYが示されている。第2行304で、ピンイン文字列が、複数の中国語の単語CW1、CW2、…、CWmに翻訳される。トランスレータ212は、その後、中国語の単語CW1、CW2、…、CWmのそれぞれについて、中英2ヶ国語辞書216から候補英語翻訳のリストを得る。第3行306に中国語の単語CW1に関する英単語EW11、…、EW1nと、最後の中国語の単語CWmに関する英単語EWm1、…、EWmqが示されている。
【0043】
行306の候補英単語は、当初は、原型または語根の形で返され、文の文脈におさまらない場合がある。翻訳モデルが、各単語を他の語形論的形態に展開する。たとえば、語根「go」は、「went」、「goes」、「going」、および「gone」などの活用形に展開される。
【0044】
候補リストから、トランスレータ212は、この指定された文脈条件で最適の英単語を選択することを試み、その単語をユーザに提示する。トランスレータは、図3の行306のすべての英単語を比較し、最高の確率を有する英単語を、ピンイン入力文字列PYの最も正しい翻訳として選択する。これは、統計的には、実際の入力のPY、EW1、およびEW2を与えられた場合に、英単語候補EWijが、ユーザによって意図された確率として表現することができ、次式のように記述される。
【0045】
【数1】
【0046】
ベイズの法則によれば、条件付き確率が、次のように推定される。
【0047】
【数2】
【0048】
分母が、EWijと独立であり、すべての情況に関して同一なので、分母を省略することができ、次の関係が残される。
【0049】
【数3】
【0050】
項P(PY|EWij, EW1, EW2)に中国語の単語CWiを導入することによって、次式が得られる。
【0051】
【数4】
【0052】
式を単純にするために、下記の前提を設ける。
【0053】
【数5】
【0054】
この前提によって、下記のように式(3)を近似することが可能になる。
【0055】
【数6】
【0056】
式(2)および(4)を組み合わせることによって、次式が得られる。
【0057】
【数7】
【0058】
ここで、項P(CWi|EWij)が、英中翻訳モデル218であり、項P(PY|CWi)が、多音字モデルであり、これに1がセットされ、項P(EWij|EW1, EW2)が、英語トライグラム言語モデル214である。
【0059】
したがって、スペリングツールの元々の目標を、最高の条件付き確率を有する英単語を検索することによって、ピンイン文字列PYの最も確率の高い翻訳を見つけること言い換えることができる。
【0060】
【数8】
【0061】
文推薦ツール204
文推薦ツール204は、文レベルで動作して、非母語でユーザが句および文を正しく書くのを援助するために、可能な文を提案する。ユーザは、援助を必要とする時に、UI138を介して、意図された文の本質を伝えることを試みるキーワードのシーケンスまたは短い句を入力する。文推薦ツール204は、照会(クエリー,query)展開220を使用して、照会を関連する代替表現に展開する。文推薦ツール204は、展開された照会を文検索アルゴリズム222に渡し、文検索アルゴリズム222が、大きい2ヶ国語コーパス224を検索する。文検索アルゴリズム222は、ユーザの照会に関連する意味を表すか構文的な関連を有する2ヶ国語文の1つまたは複数の対を返す。文の対には、母語で書かれた文と、非母語で正しく書かれた対応する文が含まれる。
【0062】
2ヶ国語コーパス224は、多くの形で構成することができる。1つの手法が、ワールドワイドウェブ2ヶ国語サイト、辞書、書籍、2ヶ国語ニュースおよび雑誌、および製品マニュアルなどのさまざまなオンラインおよびオフラインのソースから文の対を収集することである。一例として、本発明人によって構成された2ヶ国語コーパスには、96362個の文対が含まれる。図2のアーキテクチャで、コーパス224は、下記の3つのタスクに使用される。
【0063】
(1)文推薦ツール204をサポートする翻訳メモリとして働く。
(2)単語レベルおよび句レベルで英中翻訳モデル218をサポートする。
(3)中英2ヶ国語辞書216を拡充するために2ヶ国語の用語を抽出する。
【0064】
文整列された2ヶ国語コーパスを構成するために、整列アルゴリズムが、コーパス内の文を自動的に整列し、その結果が手作業で訂正される。語彙ベースの技法および統計技法などのさまざまな整列アルゴリズムを使用することができる。語彙ベースの技法では、広範囲のオンライン2ヶ国語語彙を使用して、文を突き合わせるが、統計技法は、事前の知識をほとんど必要とせず、文の長さだけに基づく。
【0065】
文整列された2ヶ国語コーパスを構成する1つの独特の手法が、語彙ベースの技法と統計技法の両方を組み込むことである。まず統計技法を使用して、予備結果を得る。その後、テキスト内でアンカを識別して、複雑さを減らす。アンカは、n個の連続する文からなるブロックと定義される。経験から、n=3の時に最良の性能が達成されることが示される。最後に、語彙キューの小さい制限された組を、さらなる改善のためにアンカに適用する。
【0066】
文整列された2ヶ国語コーパス224が構成された後に、これを使用して、中英2ヶ国語辞書216を拡充することができる。文整列されたコーパス224から二ヶ国用語を抽出するために、2ステップが行われる。第1に、中国語一言語の用語が、コーパス224の中国語部分から抽出される。この抽出のための方法の1つが、Lee−Feng Chien著の論文、表題「PAT−tree−based adaptive key phrase extraction for intelligent Chinese information retrieval」、special issue on ”Information Retrieval with Asian Language”、Information Processing and Management、1998年にある。第2に、対応する英単語を、単語整列情報と共にコーパス224の英語部分から抽出する。その結果が、中英二ヶ国用語の候補リストである。このリストが評価され、用語は、2ヶ国語辞書216に手作業で追加することができる。
【0067】
文推薦ツール204を説明するために、ユーザが中国文字のシーケンスを入力すると仮定する。文字列は、当初に1つまたは複数の単語に分節化される。分節化された単語文字列は、照会展開220に渡されるユーザ照会として働く。語形論的に修正された単語または他の展開された単語形が、照会展開220から文推薦ツール204に返される。
【0068】
ユーザ照会が、複数の中国語単語CW1、CW2、…、CWmの形であると仮定する。照会の各単語のすべての類義語が、下に示されているように、中国語シソーラス(図示されていないが、照会展開220の一部として含まれる)に基づいてリストされる。
【0069】
【数9】
【0070】
照会展開220が、照会内の単語をその類義語に置換することによって、照会を展開する。生成しすぎないようにするために、1つの実装パラメータが、1時に1単語に置換を制限するためにある。
【0071】
例として、照会が「□□ □□」であると仮定する。類義語リストは次のようになる。
【0072】
□□=>□□□□□□□□□□□□□□□□□□……
□□=>□□□□□□□□□……
【0073】
この照会は、2単語からなる。第1単語の置換によって、「□ □□」、「□□ □□」、「□□ □□」などの展開された照会がもたらされる。第2単語の置換によって、「□□ □□」、「□□ □□」、「□□ □□」などの展開された照会がもたらされる。
【0074】
文推薦ツール204は、例文対の検索に使用する展開された照会を選択する。適当な照会を選択する手法の1つが、次式のように、照会との単語の相互情報を推定することである。
【0075】
【数10】
【0076】
ここで、CWkは、照会内でk番目の中国語の単語であり、CWijは、i番目の中国語の単語のj番目の類義語である。上の例では、「□□ □□」が選択される。選択は、統計的に導出されるが、この例では適当な選択である。
【0077】
ツール204は、選択された照会を文検索アルゴリズム222に渡して、「□□ □□」を含む2ヶ国語文の1つまたは複数の対を検索する。検索された文対のすべてが、スコアリング戦略に基づいてランキングされる。
【0078】
ランキングアルゴリズムの一実施形態を、これから説明する。ランキングアルゴリズムの入力は、照会Qであり、これは、下に示されているように中国語文字列である。
【0079】
Q = T1、T2、T3、…、Tk
【0080】
出力は、下記の形の関連する2ヶ国語例文対の組である。
【0081】
【数11】
【0082】
ここで、C−Sentは、2ヶ国語文対の中国語の文、E−Sentは、英語の文、δは、閾値である。
【0083】
文ごとに、関連スコアを、2つの部分すなわち(1)入力照会とターゲット文の類似性を表すボーナスと、(2)入力照会とターゲット文の不同性を表すペナルティで計算する。
【0084】
ボーナスは、次式によって計算される。
【0085】
【数12】
【0086】
ここで、Wjは、照会Qのj番目の単語の重み(下で説明する)、tfijは、j番目の単語が文iに現れる回数、nは、コーパス内の文の数、dfjは、Wjを含む文の数、Liは、i番目の文の単語数である。
【0087】
上の式では、代数的類似性が考慮される。幾何学的類似性を考慮に入れるために、ペナルティの式を使用して、幾何学的類似性の表現として編集距離を導出する。
【0088】
照会Qと文の間の一致した単語リストが、
Ri = Bonusi − Penaltyi
であり、それぞれ
【0089】
A1, A2, A3, ... Am
B1, B2, B3, ... BN
【0090】
のAおよびBとして表されるものとする。
【0091】
編集距離は、BをAに変換する編集動作の回数と定義される。ペナルティは、編集動作ごとに増加するが、スコアは、異なる品詞について異なる。たとえば、ペナルティは、動詞に関して名詞より大きい。
【0092】
【数13】
【0093】
ここで、Wj’は、j番目の単語のペナルティであり、Ejは、編集距離である。品詞の各種類のスコアおよびペナルティを、表1で定義する。
【0094】
【表1】
【0095】
最高のランキングの文対が、文推薦ツール204に返され、UI138を介してユーザに提案される。ユーザは、文を構成する方法についてよりよい情報を得ることができる。
【0096】
全般的な動作
図4に、ユーザが非ネイティブの単語、句、および文を書くのを援助する全般的な方法400を示す。この処理は、ライティングシステム、具体的にはUI138およびクロス言語ライティングウィザード136によってソフトウェアで実施されることが好ましい。したがって、処理400は、CPU102などの処理システムで実行される時に、図4にブロックとして示された動作およびタスクを実行する、コンピュータ実行可能命令として実施することができる。進行中の例の実施形態によれば、本発明は、中英ライティング環境に関して示されるが、ここで、英語が非母語であり、中国語が母語である。しかし、この処理は、他の言語で実施することができる。
【0097】
ブロック402で、UI138が、英語文字およびピンイン文字からなる、ユーザが入力した文字列を受け取る。文字が英単語を形成する場合(すなわち、ブロック404からの「yes」分岐)には、ユーザが英単語のライティングおよびスペリングの問題を経験していないと仮定されるので、ライティングウィザードは、ほとんどヘルプを提供しない。逆に、ユーザが、英単語の綴り方またはどの英単語を使用するかについて確信がないときには、ユーザは、ピンイン文字列を入力することができる。ピンインが受け取られた(すなわち、404からの「no」分岐)時には、スペリングツール200は、ピンインを受け取り、中国語単語/ピンイントランスレータ212に渡す。
【0098】
ブロック406で、トランスレータ212が、ピンイン文字列を1つまたは複数の中国語の単語(たとえば簡体字文字)に翻訳する。トランスレータ212は、トレーニングコーパスから前に学習した統計的確率に基づいて、最も確からしい中国語単語翻訳を選択する。トランスレータ212は、誤入力または誤綴りに起因するユーザによって入力された誤りも許容する。
【0099】
ブロック408で、トランスレータ212が、中英辞書216を調べて、可能な英単語翻訳候補を判定する。ブロック410で、トランスレータ212が、英語言語モデル214を使用して、現在の文または句の文脈に対して、異なる英単語候補に関連する確率を生成する。一実施形態では、英語言語モデル214が、前の2単語EW1およびEW2に対して、異なる英単語候補EWijに関連する確率P(EWij|EW1, EW2)を生成する。ブロック412で、トランスレータ212が、英中翻訳モデル218を調べて、英語単語候補のそれぞれについて、中国語単語がどれほど意図されたものであるかの確率を生成する。たとえば、英中翻訳モデル218が、さまざまな英単語候補EWijに対して中国語単語CWiがどのように意図されるかを識別する確率P(CWi|EWij)を作る。
【0100】
ブロック414で、トランスレータ212が、英語言語モデルおよび英中翻訳モデルから返された確率を使用して、文の文脈内でピンイン文字列に対してユーザによって意図された単語である確率が最も高い英単語候補を判定する。ライティングウィザード136は、最適の単語をUI138に渡し、UI138は、中国語ピンイン入力文字列を英単語に置換する(ブロック416)。ユーザに対して、英単語は、本質的にピンイン文字列から即座に置換される。確率計算は、ユーザにとって無視することができる処理速度で行われる。
【0101】
ユーザが英単語を好む場合(すなわち、ブロック418からの「yes」分岐)、ユーザは、単純に次の英単語またはピンイン文字列を書き続けることができる。その一方で、ユーザが、まだ英単語について確信がない場合には、ユーザは、「ESC」キーを押すなど、ある事前に定義された入力を介してライティングウィザードからのより多くの援助を呼び出すことができる(すなわち、ブロック418からの「no」分岐)。
【0102】
このユーザアクションに応答して、ライティングウィザードは、ユーザが、単語を使用できる方法を習得するために文の文脈で英単語を見られるようにする(ブロック420)。ユーザは、英単語を含む、2ヶ国語コーパス224から抽出された例の2ヶ国語文対を有するウィンドウを呼び出すことができる。さらに、ウィザードは、ピンイン文字列の他の中国語単語翻訳のリストならびに他の英単語候補のリストを提示する。ユーザは、これらの単語のどれでも選択することができ、選択された単語を2ヶ国語文の例の対でレビューすることができる。
【0103】
ライティングウィザードのユーザインターフェース
残りの議論は、ライティングウィザードを提示する時のユーザインターフェース138の特徴を対象とする。具体的に言うと、ライティングウィザードのユーザインターフェース138を用いると、スクリーンの同一の入力行内で非母語および母語からの2ヶ国語単語のユーザ入力が可能になる。特徴の多くを、これらがディスプレイスクリーン上で視覚的にどのように見えるかに関して説明する。そのような特徴が、ユーザインターフェース138だけによって、またはオペレーティングシステムと共に、提供されることに留意されたい。
【0104】
図5−15に、ワードプロセッシングプログラムまたは他のコンピュータ支援ライティングシステムの一部としてユーザに提示されるグラフィカルUI(GUI)として実施される例示的なライティングウィザードユーザインターフェースを示す。奇数の図5、7、9、11、および13は、ライティングウィザードユーザインターフェースのさまざまな特徴を示す包括的なグラフィカルユーザインターフェース(GUI)を提示する。偶数の図6、8、10、12、および14は、図5、7、9、11、および13の包括的ユーザインターフェースに対応する、中英コンピュータライティングシステムの特有のGUIを提示する。
【0105】
図5に、言語入力UI138だけによって、またはオペレーティングシステムと共に、提示されるスクリーンディスプレイ500を示す。この図では、スクリーンディスプレイ500が、Microsoft社のWindows(登録商標)ブランドオペレーティングシステムによって生成されるものなどの通例のグラフィカルウィンドウに似ている。グラフィカルウィンドウは、言語入力の文脈での使用に適合され、非母語単語および母語単語をユーザが入力できるインライン入力領域502を提示する。インライン領域502は、平行の破線によって表されている。入力カーソル(図示せず)を使用して、データ入力の現在位置をマークすることができる。
【0106】
グラフィカルUIに、さらに、ツールバー504および508などの複数のツールバーまたは、アプリケーション(たとえばワードプロセッサ、データプロセッサ、スプレッドシート、インターネットブラウザ、電子メール、オペレーティングシステムなど)に依存する機能的特徴を含めることができる。ツールバーは、一般に、ワードプロセッシングまたはデータプロセッシングの技術で既知であり、詳細には説明しない。
【0107】
図5では、ユーザが、2つの非母語単語EW1およびEW2を入力している。議論のために、記号「EW」を、奇数の図面全体を通じて、英単語など、入力されUIに表示される非母語単語を表すのに使用する。ユーザが、次の非母語単語の綴り方に確信がない時に、ユーザは、単純に、自分の母語で対応する単語を入力する。この例では、中国人ユーザが、同一の入力領域502内の位置510に中国語ピンイン文字PYを入力する。中国人ユーザは、中国語単語(たとえば簡体字文字)ではなくピンインを入力する。というのは、ピンインを、標準QWERTYキーボードまたは音声認識システムを使用して便利に入力できるからである。ピンインが、音標テキストの例であり、簡体字が、言語テキストの例である。
【0108】
図6に、図5に対応する例のGUI600を示す。GUI600に、2つの英単語602(たとえば「I have」)とそれに続くピンイン文字列604(たとえば「wancheng」)が示されている。
【0109】
母語単語(たとえばピンイン)を入力し、「スペース」キー(または他のアクチュエーション)を押した後に、クロス言語ウィザード136が、現在の入力が母語単語であり、非母語単語ではないことを自動的に認識する。スペリングツール202が、母語単語を対応する非母語単語に変換する。母語単語が、わずかに誤綴りがあるか不正に入力された場合に、スペリングツールは、その誤りを許容し、最も確からしい非母語単語を返す。その後、非母語単語が、母語単語の代わりにインライン入力領域502に表示される。
【0110】
図7に、母語単語(たとえばPY)が対応する非母語単語EW3に変換され、置換された後に、言語入力UI138によって提示されるスクリーンディスプレイ700を示す。ネイティブ入力文字列のそれぞれについて、母語での複数の可能な解釈が存在する可能性がある。ライティングウィザードは、上で説明した統計手法を使用して、最も確からしい翻訳を判定する。その結果、入力文字列が、まず、母語の対応する単語に翻訳され、その後、最も確からしい母語単語が、後続の非母語単語への翻訳のために選択される。
【0111】
CW1によって表される最も確からしい母語単語が、変換された非母語単語EW3の下のポップアップボックス702に示される。ユーザは、母語単語ボックス702を見て、翻訳が自分の意図したものであるかどうかを判定することができる。
【0112】
図8に、図7に対応する例のGUI800を示す。GUI800には、2つの英単語「I have」と、それに続く第3の英単語「accomplished」が示され、この第3の英単語は、ピンイン入力文字列「wancheng」(図6)から翻訳されたものである。翻訳された単語「accomplished」の下に、中国語の単語「 」を有するポップアップボックス702がある。
【0113】
中国語では、ピンインから中国語の単語へのマッピングが、1対多であり、これは、1つのピンイン文字列が、多数の異なる中国語単語に翻訳される可能性があることを意味する。さらに、1つの中国語の単語が、多数の異なる英単語にマッピングされる。ポップアップボックス702には、ピンインが最初に翻訳された最も確からしい中国語簡体字単語が含まれる。この中国語単語が、その後、英単語「accomplished」に翻訳された。
【0114】
ユーザが、この英単語に同意する場合に、ユーザは、単純にインライン入力領域内での英単語の入力を継続する。その一方で、ユーザがこの英単語に満足しない場合には、ライティングウィザード136を用いて、ユーザが、「ESC」キーを押すなどのなんらかのユーザ入力を介して選択肢を変更することができる。
【0115】
図9に、ユーザが選択肢を変更するために「ESC」キーを押すこと(または他のキュー)に応答して言語入力UI138によって提示されるスクリーンディスプレイ900を示す。ライティングウィザード136が、位置902にネイティブ入力文字列PYを復元し、これによって、自動的に選択された非母語単語EW3(図7)が置換される。
【0116】
ポップアップボックス702が展開されて、CW1およびCW2によって表される、入力文字列の他の可能な翻訳が含まれる。最も確からしい単語CW1が、最上部に位置決めされ、当初に強調表示されて、これが統計的に最も確からしい翻訳であることが示される。2番目に確からしい単語CW2が、最も確からしい単語の下にリストされる。ユーザは、通常のフォーカスアンド選択技法を使用して(たとえば、スクロールと入力、ポイントアンドクリック、矢印キーとスペースキーなど)可能な翻訳の1つを選択することができる。
【0117】
図10に、図9に対応する例のGUI1000を示す。GUI1000には、英単語「accomplished」の代わりに復元されたピンイン入力文字列「wancheng」が示されている。ピンイン入力文字列「wancheng」の下に、2つの中国語単語を有するポップアップボックス702がある。
【0118】
図11に、ユーザが最初にリストされた母語単語CW1を選択することに応答して言語入力UI138によって提示されるスクリーンディスプレイ1100を示す。母語単語CW1が、位置1102の入力文字列PYを置換する。母語単語CW1からの1つまたは複数の可能な非ネイティブ翻訳EW3、EW4、EW5、およびEW6を含む第2のポップアップボックス1104も、提示される。最上部にリストされた候補EW3が、強調表示または他の形でボックス1104内で識別される。この候補は、当初は、最も確からしい候補とすることができる。ユーザは、ボックス1104をブラウズして、標準ナビゲーション技法を使用して(たとえばポイントアンドクリック、矢印キーとスペース/リターンキーなど)より望ましい非ネイティブ翻訳を選択することができる。
【0119】
図12に、図11に対応する例のGUI1200を示す。GUI1200に、ピンイン入力文字列「wancheng」を置換した中国語単語「 」が示されている。中国語単語の下に、5つの代替の英単語を有するポップアップボックス1104がある。より多数または少数の単語を、ボックス1104内で提示することができる。ユーザは、上/下矢印キーおよびスクロールバーなどの通常のナビゲーションツールを使用して、ボックス1104をスクロールすることができる。
【0120】
ユーザが、まだ正しい英単語について確信がない場合には、ユーザは、英単語を使用する例文を要求することによって、ライティングウィザードからさらに援助を呼び出すことができる。ユーザは、ポップアップ英単語ボックス1104内の望みの単語にフォーカスを移動し、キーボードキー(たとえば右矢印キー)を押して、例文を含むウィンドウを呼び出す。
【0121】
図13に、ユーザがボックス1104内の非母語単語EW3にフォーカスを置き、例文ウィンドウ1302を呼び出すことに応答して、言語入力UI138によって提示されるスクリーンディスプレイ1300を示す。ウィンドウ1302は、母語単語CW3、CW4、…、CWNで書かれた文と、非母語単語EW8、EW9、…、EWMで書かれた対応する文を含む2ヶ国語文対を提示する。2ヶ国語文例の主題である母語単語CW1および対応する非母語単語EW3が、強調表示または他の形(たとえば、斜体、太字など)で識別される。2ヶ国語例文は、ユーザが非母語単語を特定の文脈で使用する方法をよりよく理解するのを助ける。
【0122】
図14に、図13に対応する例のGUI1400を示す。GUI1400に、ポップアップボックス1104と、文で英単語「completed」を使用する例文ウィンドウ1302が示されている。この例では、英文が、「If there had not be a hard layer of rock beneath the soil, they would have completed the job in a few hours.」である。対応する簡体字テキストで書かれた中国語の文が、英文の上に提示される。
【0123】
ユーザが英単語および文でのその単語の使い方をよりよく理解した後に、ユーザは、適当な英単語の入力を確認することができる。確認時に、英単語が、2つの英単語に続く中国語の単語と置換される。その後、UIは、3つの英単語「I have completed」だけを提示し、2つのポップアップウィンドウ1104および1302が、除去される。
【0124】
文援助
ユーザは、文を正しく構成する方法に関するヘルプを求める場合がある。ライティングウィザードは、ユーザが、句または文を直接に入力できるようにする。たとえば、ユーザが、下記の中国語の句を(直接にまたは中国語の単語に変換されるピンイン入力を介してのいずれかで)入力したと仮定する。
【0125】
提供机会|
【0126】
その後、ユーザは、「ESC」キーを押すことによるか他の手段によって、直接にサンプル2ヶ国語文ウィンドウ1302を呼び出すことができる。
【0127】
図15に、ユーザが中国語の句を入力し、文ウィンドウ1302を直接に呼び出したことに応答して言語入力UI138によって提示されるスクリーンディスプレイ1500を示す。中国語の句と英文の同等物を使用する、文の対応する対(1つは中国語、もう1つは英語)が、ウィンドウ1302に提示される。主題の句は、強調表示または他の形で文内で識別される。
【0128】
結論
上の説明では、構造的特徴および/または方法論的行為に固有の言語を使用したが、請求項で定義される本発明が、説明した特定の特徴または行為に制限されないことを理解されたい。そうではなく、特定の特徴および行為は、本発明の実施の例示的形態として開示されたものである。
【図面の簡単な説明】
【図1】
クロス言語ライティングウィザードを有するライティングシステムを実施するコンピュータシステムのブロック図である。
【図2】
クロス言語ライティングウィザードのソフトウェアアーキテクチャのブロック図である。
【図3】
第1言語の単語と第2言語の単語の間の単語レベル翻訳を示す図である。
【図4】
非母語で書くことを試みているユーザにライティング援助を提供する処理の流れ図である。
【図5】
ライティングシステムのユーザインターフェースのスクリーンディスプレイを示す線図であり、UIのインライン入力機能を示す図である。
【図6】
ライティングシステムの中英バージョンに適合された図5のディスプレイに対応するスクリーンディスプレイである。
【図7】
母語の入力文字列(たとえばピンイン)から非母語単語(たとえば英語)への自動変換を示すライティングシステムUIのスクリーンディスプレイの線図である。
【図8】
ライティングシステムの中英バージョンに適合された図7のディスプレイに対応するスクリーンディスプレイである。
【図9】
母語の入力文字列の代替翻訳(たとえばピンインから翻訳された代替の中国語単語)を示すライティングシステムUIのスクリーンディスプレイの線図である。
【図10】
ライティングシステムの中英バージョンに適合された図9のディスプレイに対応するスクリーンディスプレイである。
【図11】
選択された母語単語に基づく非母語単語の代替翻訳(たとえば、中国語の単語に対応する可能な英語の単語)を示す、ライティングシステムUIのスクリーンディスプレイの線図である。
【図12】
ライティングシステムの中英バージョンに適合された図11のディスプレイに対応するスクリーンディスプレイである。
【図13】
選択された非母語単語を使用する例の2ヶ国語文を示す、ライティングシステムUIのスクリーンディスプレイの線図である。
【図14】
ライティングシステムの中英バージョンに適合された図13のディスプレイに対応するスクリーンディスプレイである。
【図15】
母語テキストのユーザ入力に応答して直接に呼び出される、例の2ヶ国語文を示す、ライティングシステムUIのスクリーンディスプレイの線図である。
Claims (84)
- ユーザによって入力される非母語の非母語単語および母語の少なくとも1つの母語単語を受け取るステップ、および、
前記母語単語を対応する非母語単語に変換するステップ
を含むことを特徴とする方法。 - 前記非母語が、英語であり、前記母語が、中国語であることを特徴とする請求項0に記載の方法。
- 前記非母語単語が、英単語であり、前記母語単語が、中国語ピンインであることを特徴とする請求項0に記載の方法。
- 前記母語単語が、音標テキストで書かれることを特徴とする請求項0に記載の方法。
- 共通の入力行内に前記非母語単語および前記母語単語を表示するステップをさらに含むことを特徴とする請求項0に記載の方法。
- 前記変換が、前記ユーザによって前に入力された前記非母語単語によって確立される文脈に対して最も確からしい非母語単語を判定するステップを含むことを特徴とする請求項0に記載の方法。
- 前記母語単語が、音標形態で入力され、前記変換するステップが、さらに、
前記母語単語を前記音標形態から言語形態に翻訳するステップ、および、
前記言語形態の前記母語単語を前記非母語単語に翻訳するステップ
を含むことを特徴とする請求項0に記載の方法。 - 前記母語単語が、音標形態で入力され、前記変換するステップが、さらに、
前記母語単語の最も確からしい言語形態を判定し、前記母語単語を前記音標形態から前記最も確からしい言語形態に翻訳するステップ、および、
前記母語単語の前記最も確からしい言語形態に対して最も確からしい非母語単語を判定するステップ
を含むことを特徴とする請求項0に記載の方法。 - 前記母語単語が、音標形態で入力され、前記変換するステップが、前記母語単語を前記音標形態から言語形態の1つまたは複数の母語単語に翻訳するステップを含み、前記方法が、さらに、前記言語形態の前記1つまたは複数の母語単語を表示するステップを含むことを特徴とする請求項0に記載の方法。
- 共通の入力行に、前記非母語単語および前記母語単語の前記音標形態を表示するステップ、および、
前記入力行に隣接するポップアップボックス内に、前記言語形態の前記1つまたは複数の母語単語を表示するステップ
をさらに含むことを特徴とする請求項9に記載の方法。 - 確率に従って前記ポップアップボックス内の前記母語単語を順序付けるステップをさらに含むことを特徴とする請求項10に記載の方法。
- ユーザが前記ポップアップボックス内でスクロール可能なことを特徴とする請求項10に記載の方法。
- 前記母語単語が、音標形態で入力され、前記変換するステップが、
前記母語単語を前記音標形態から言語形態の1つまたは複数の母語単語に翻訳するステップ、
前記言語形態の前記1つまたは複数の母語単語を表示するステップ、
前記言語形態の少なくとも1つの母語単語を1つまたは複数の非母語単語に翻訳するステップ、および、
前記1つまたは複数の非母語単語を表示するステップ
を含むことを特徴とする請求項0に記載の方法。 - 共通の入力行内に前記非母語単語および前記母語単語の前記音標形態を表示するステップ、
前記入力行に隣接するポップアップボックス内で前記言語形態の前記1つまたは複数の母語単語を表示するステップ
をさらに含むことを特徴とする請求項13に記載の方法。 - 前記1つまたは複数の非母語単語への翻訳に続いて、共通の入力行に前記非母語単語および前記母語単語の前記言語形態を表示するステップ、および、
前記入力行に隣接するポップアップボックス内に前記1つまたは複数の非母語単語を表示するステップ
をさらに含むことを特徴とする請求項13に記載の方法。 - 前記母語で書かれ、前記母語単語を含むネイティブ文と、前記非母語で書かれ、前記非母語単語を含む対応する非ネイティブ文とを有する2ヶ国語文対を表示するステップをさらに含むことを特徴とする請求項0に記載の方法。
- プロセッサ上で実行される時に請求項0に記載の前記方法を実行するようにコンピュータに指示するコンピュータ実行可能命令を有することを特徴とする1つまたは複数のコンピュータ可読媒体。
- ユーザインターフェースを介して、ユーザが文字列を入力する際に、第1言語の文字列を第2言語の少なくとも1つの文字列と一緒に表示するステップ、
前記第2言語の前記文字列を前記第1言語の別の文字列に変換するステップおよび、
前記ユーザインターフェース内で前記第2言語の前記文字列を前記第1言語の前記別の文字列に置換するステップ
を含むことを特徴とする方法。 - 前記第1言語が、英語であり、前記第2言語が、中国語であることを特徴とする請求項18に記載の方法。
- 共通の入力行内に前記第1言語および前記第2言語の前記文字列を表示するステップをさらに含むことを特徴とする請求項18に記載の方法。
- 前記変換するステップが、前記ユーザによって前に入力された前記文字列によって確立される文脈に対して最も確からしい文字列を判定するステップを含むことを特徴とする請求項18に記載の方法。
- プロセッサ上で実行される時に、請求項18に記載の前記方法を実行するようにコンピュータに指示するコンピュータ実行可能命令を有することを特徴とする1つまたは複数のコンピュータ可読媒体。
- ユーザによって入力される、非母語の非母語単語および母語の少なくとも1つの母語単語を受け取るステップ、および、
前記母語単語の可能な翻訳である非母語単語の候補リストを提示するステップ
を含むことを特徴とする方法。 - 前記非母語が、英語であり、前記母語が、中国語であることを特徴とする請求項23に記載の方法。
- 共通の入力行内に前記非母語単語および前記母語単語を表示するステップをさらに含むことを特徴とする請求項23に記載の方法。
- 2ヶ国語文対を有する文ウィンドウを提示するステップをさらに含むことを特徴とする請求項23に記載の方法。
- プロセッサ上で実行される時に、請求項23に記載の前記方法を実行するようにコンピュータに指示するコンピュータ実行可能命令を有することを特徴とする1つまたは複数のコンピュータ可読媒体。
- ユーザによって入力される非母語の非母語単語および母語の少なくとも1つの母語単語を受け取り、前記母語単語が、音標テキストとして入力されるステップ、および、
言語テキストで書かれた前記母語単語の1つまたは複数の翻訳のリストを提示するステップ
を含むことを特徴とする方法。 - 前記非母語が、英語であり、前記母語が、中国語であることを特徴とする請求項28に記載の方法。
- 共通の入力行内に前記非母語単語および前記母語単語を表示するステップをさらに含むことを特徴とする請求項28に記載の方法。
- 2ヶ国語文対を有する文ウィンドウを提示するステップをさらに含むことを特徴とする請求項28に記載の方法。
- プロセッサ上で実行される時に、請求項28に記載の前記方法を実行するようにコンピュータに指示するコンピュータ実行可能命令を有することを特徴とする1つまたは複数のコンピュータ可読媒体。
- 非母語の非母語単語および母語の少なくとも1つの母語単語を受け取り、前記母語単語が、前記母語の第1形態で受け取られるステップ、
前記母語単語をその第1形態から第2形態の少なくとも1つの母語単語に翻訳するステップ、
前記第2形態の前記母語単語を少なくとも1つの非母語単語に翻訳するステップ
を含むことを特徴とする方法。 - 前記非母語が、英語であり、前記母語が、中国語であることを特徴とする請求項33に記載の方法。
- 前記非母語単語が、英単語であり、前記母語単語の前記第1形態が、中国語ピンインであり、前記母語単語の前記第2形態が、北京官話であることを特徴とする請求項33に記載の方法。
- 前記母語単語のその第1形態からの前記翻訳が、統計的確率に基づいて前記第2形態の最も確からしい母語単語を選択するステップを含むことを特徴とする請求項33に記載の方法。
- 前記第1形態の前記母語単語の誤綴りバージョンを受け入れることをさらに含むことを特徴とする請求項33に記載の方法。
- 共通の入力行内に前記非母語単語および前記母語単語を表示するステップをさらに含むことを特徴とする請求項33に記載の方法。
- 前記母語単語のその第1形態から前記非母語単語への前記翻訳するステップが、
前記母語単語の前記第2形態から可能な非母語単語候補を判定するステップ、
前に入力された非母語単語によって確立される文脈に対して、個々の非母語単語候補が前記ユーザによって意図されたものである可能性を示す、前記非母語単語候補に関連する第1確率を生成するステップ、
個々の非母語単語候補に対して、前記母語単語の前記第2形態が意図されたものである可能性を示す、前記非母語単語候補に関連する第2確率を生成するステップ、および、
前記第1確率および前記第2確率に基づいて、前記非母語単語候補の間から最も確からしい非母語単語を導出するステップ
を含むことを特徴とする請求項33に記載の方法。 - その第1形態の前記母語単語を前記非母語単語に置換するステップをさらに含むことを特徴とする請求項33に記載の方法。
- プロセッサ上で実行される時に、請求項33に記載の前記方法を実行するようにコンピュータに指示するコンピュータ実行可能命令を有することを特徴とする1つまたは複数のコンピュータ可読媒体。
- ユーザが、非母語の非母語単語および母語の音標テキスト文字列を入力可能にするステップ、
共通の入力行内に前記非母語単語および前記音標テキスト文字列を表示するステップ、
前記音標テキスト文字列を前記母語の少なくとも1つの母語単語に翻訳するステップ、
前記母語の前記母語単語から可能な非母語単語候補を判定するステップ、
前に入力された非母語単語によって確立される文脈に対して、個々の非母語単語が前記ユーザによって意図されたものである可能性を示す、前記非母語単語候補に関連する第1確率を生成するステップ、
個々の非母語単語候補に対して、前記母語単語が意図されたものである可能性を示す、前記非母語単語候補に関連する第2確率を生成するステップ、
前記第1確率および前記第2確率に基づいて、前記非母語単語候補の間から最も確からしい非母語単語を導出するステップ、および、
前記母語単語を前記最も確からしい非母語単語に翻訳するステップ
を含むことを特徴とする方法。 - 前記非母語が、英語であり、前記母語が、中国語であることを特徴とする請求項42に記載の方法。
- 前記非母語単語が、英単語であり、前記音標テキストが、中国語ピンインであり、前記母語単語が、中国語簡体字であることを特徴とする請求項42に記載の方法。
- 前記音声文字列の前記翻訳が、統計的確率に基づいて最も確からしい母語単語を選択するステップを含むことを特徴とする請求項42に記載の方法。
- 前記判定ステップが、前記非母語単語候補を識別するために2ヶ国語辞書を使用することを特徴とする請求項42に記載の方法。
- 第1確率の前記生成するステップが、統計的言語モデルを使用することを特徴とする請求項42に記載の方法。
- 第2確率の前記生成するステップが、翻訳モデルを使用することを特徴とする請求項42に記載の方法。
- 前記音標テキスト文字列の代わりに前記最も確からしい非母語単語を表示するステップをさらに含むことを特徴とする請求項42に記載の方法。
- プロセッサ上で実行される時に、請求項42に記載の前記方法を実行するようにコンピュータに指示するコンピュータ実行可能命令を有することを特徴とする1つまたは複数のコンピュータ可読媒体。
- クロス言語入力ユーザインターフェースであって、
行ベースの入力領域と、
前記行ベースの入力領域内に表示される非ネイティブテキストと、
前記行ベースの入力領域内に前記非ネイティブテキストと一緒に表示されるネイティブテキストと
を含むことを特徴とするクロス言語入力ユーザインターフェース。 - 前記非ネイティブテキストが、英語を含み、前記ネイティブテキストが、中国語を含むことを特徴とする請求項51に記載のクロス言語入力ユーザインターフェース。
- 前記行ベースの入力領域が、水平に向けられることを特徴とする請求項51に記載のクロス言語入力ユーザインターフェース。
- 前記ネイティブテキストから変換され、前記行ベースの入力領域内の前記ネイティブテキストと置換される、変換された非ネイティブテキストをさらに含むことを特徴とする請求項51に記載のクロス言語入力ユーザインターフェース。
- 前記ネイティブテキストの可能な翻訳である非母語単語の候補リストをさらに含むことを特徴とする請求項51に記載のクロス言語入力ユーザインターフェース。
- 前記ネイティブテキストの可能な翻訳である非母語単語の候補リストをさらに含み、前記非母語単語が、ランキングに従って前記候補リスト内で順序付けられることを特徴とする請求項51に記載のクロス言語入力ユーザインターフェース。
- 前記行ベースの入力領域が第1方向に向けられ、前記第1方向に垂直の第2方向に向けられた、前記ネイティブテキストの可能な翻訳である非母語単語の候補リストをさらに含むことを特徴とする請求項51に記載のクロス言語入力ユーザインターフェース。
- ユーザによって呼出し可能である、前記ネイティブテキストおよび前記非ネイティブテキストを含む2ヶ国語文を提示する、文ウィンドウをさらに含むことを特徴とする請求項51に記載のクロス言語入力ユーザインターフェース。
- 請求項51に記載の前記言語入力ユーザインターフェースを含むワードプロセッサ。
- クロス言語入力ユーザインターフェースであって、
第1言語で書かれた第1単語および第2言語で書かれた少なくとも1つの第2単語を受け入れる入力領域と、
前記第2単語からの可能な翻訳である第1単語の候補リストと
を含むことを特徴とするクロス言語入力ユーザインターフェース。 - 前記第1言語が、英語であり、前記第2言語が、中国語であることを特徴とする請求項60に記載のクロス言語入力ユーザインターフェース。
- 前記入力領域が、第1方向に向けられた行ベースの入力領域を含み、前記候補リストが、前記行ベースの入力領域に隣接して提示され、前記第1方向に垂直の第2方向に向けられることを特徴とする請求項60に記載のクロス言語入力ユーザインターフェース。
- ユーザによって呼出し可能である、前記第1言語および前記第2言語で書かれた2ヶ国語文を提示する、文ウィンドウをさらに含むことを特徴とする請求項60に記載のクロス言語入力ユーザインターフェース。
- 請求項60に記載の前記言語入力ユーザインターフェースを含むワードプロセッサ。
- クロス言語入力ユーザインターフェースであって、
ユーザが英語単語と中国語ピンインの両方を入力可能な入力領域と、
前記中国語ピンインから翻訳された少なくとも1つの中国語単語を有するポップアップボックスと
を含むことを特徴とするクロス言語入力ユーザインターフェース。 - 前記ポップアップボックスからの中国語単語の選択時の、前記中国語単語からの可能な翻訳である英語単語の候補リストをさらに含むことを特徴とする請求項65に記載のクロス言語入力ユーザインターフェース。
- ユーザによって前記候補リストから呼出し可能である、前記候補リストからの特定の英単語の使用法を示すために英語および中国語で書かれた2ヶ国語文を提示する、文ウィンドウをさらに含むことを特徴とする請求項66に記載のクロス言語入力ユーザインターフェース。
- 請求項65に記載の前記言語入力ユーザインターフェースを含むことを特徴とするワードプロセッサ。
- クロス言語ライティングアーキテクチャであって、
母語になれたユーザが、非母語からの非母語単語を入力可能にするユーザインターフェースと、
前記非母語単語の正しい入力に関して前記ユーザを援助するスペリングツールと
を含むことを特徴とするクロス言語ライティングアーキテクチャ。 - 前記ユーザインターフェースが、前記ユーザが前記非母語単語の代わりに前記母語からの母語単語を入力可能となし、前記スペリングツールが、前記母語単語を対応する非母語単語に翻訳するトランスレータを含むことを特徴とする請求項69に記載のクロス言語ライティングアーキテクチャ。
- 前記トランスレータが、2ヶ国語辞書を使用することを特徴とする請求項70に記載のクロス言語ライティングアーキテクチャ。
- 前記トランスレータが、統計的言語モデルを使用することを特徴とする請求項70に記載のクロス言語ライティングアーキテクチャ。
- 前記トランスレータが、2ヶ国語翻訳モデルを使用することを特徴とする請求項70に記載のクロス言語ライティングアーキテクチャ。
- 前記スペリングツールが、シソーラスを使用することを特徴とする請求項69に記載のクロス言語ライティングアーキテクチャ。
- 請求項69に記載の前記言語入力アーキテクチャを含むワードプロセッサ。
- クロス言語ライティングアーキテクチャであって、
母語になれたユーザが、非母語からの非母語単語を入力可能にするユーザインターフェースと、
前記非母語で可能な文構造を提案する文推薦ツールと
を含むことを特徴とするクロス言語ライティングアーキテクチャ。 - 前記文推薦ツールが、
前記母語および前記非母語の両方で書かれた2ヶ国語文対を含む2ヶ国語コーパスと、
前記2ヶ国語コーパスから2ヶ国語文対を検索する文検索ユニットと
を含むことを特徴とする請求項76に記載のクロス言語ライティングアーキテクチャ。 - 前記文推薦ツールが、前記2ヶ国語コーパスから検索された前記文をランキングすることを特徴とする請求項77に記載のクロス言語ライティングアーキテクチャ。
- 請求項76に記載の前記言語入力アーキテクチャを含むワードプロセッサ。
- クロス言語ライティングアーキテクチャであって、
中国語ピンインと共に英単語の入力を可能にするユーザインターフェースと、
前記中国語ピンインを1つまたは複数の中国語単語に翻訳するスペリングツールであって、さらに、前記中国語単語を、前記中国語ピンインと置換することが可能な1つまたは複数の英単語に翻訳するように構成されるスペリングツールと、
ユーザによって呼出し可能である、英単語を文内で使用する方法を示すために英語および中国語で書かれた対応する文の対を提供する文推薦ツールと
を含むことを特徴とするクロス言語ライティングアーキテクチャ。 - 前記スペリングツールが、
前記中国語単語から可能な英単語候補を判定するための中英辞書と、
前に入力された英単語に対して、前記ユーザが前記英単語候補をどのように意図したかを判定するための英語言語モデルと、
前記英単語候補に対して、個々の中国語単語がどのように意図されたかを判定するための英中翻訳モデルと
を含むことを特徴とする請求項80に記載のクロス言語ライティングアーキテクチャ。 - 前記文推薦ツールが、
英語および中国語の両方で書かれた2ヶ国語文対を含む2ヶ国語コーパスと、
前記2ヶ国語コーパスから2ヶ国語文対を検索する文検索ユニットと
を含むことを特徴とする請求項80に記載のクロス言語ライティングアーキテクチャ。 - 請求項80に記載の前記言語入力アーキテクチャを含むワードプロセッサ。
- コンピュータ実行可能命令を有する1つまたは複数のコンピュータ可読媒体であって、前記コンピュータ実行可能命令が、プロセッサ上で実行される時に、
英単語および中国語ピンインの入力を可能にし、
前記中国語ピンインを少なくとも1つの中国語単語に翻訳し、
前記中国語単語から可能な英単語候補を判定し、
前に入力された英単語に対して、前記英単語候補のそれぞれがどのように意図されたかを示す、前記英単語候補に関連する第1確率を生成し、
前記英単語候補のそれぞれに対して、前記中国語単語がどのように意図されたかを示す、前記英単語候補に関連する第2確率を生成し、
前記第1確率および前記第2確率に基づいて前記英単語候補の中から最も確からしい英単語を導出し、
前記中国語単語を前記最も確からしい英単語に翻訳する
ようにコンピュータに指示することを特徴とする、1つまたは複数のコンピュータ可読媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/556,229 US7107204B1 (en) | 2000-04-24 | 2000-04-24 | Computer-aided writing system and method with cross-language writing wizard |
PCT/US2001/040228 WO2001082119A2 (en) | 2000-04-24 | 2001-03-02 | Computer-aided writing system and method with cross-language writing wizard |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004516527A true JP2004516527A (ja) | 2004-06-03 |
JP2004516527A5 JP2004516527A5 (ja) | 2008-02-28 |
Family
ID=24220434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001579138A Pending JP2004516527A (ja) | 2000-04-24 | 2001-03-02 | クロス言語ライティングウィザードを伴うコンピュータ支援ライティングのシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7107204B1 (ja) |
EP (1) | EP1277136A2 (ja) |
JP (1) | JP2004516527A (ja) |
AU (1) | AU2001251708A1 (ja) |
WO (1) | WO2001082119A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014109791A (ja) * | 2012-11-30 | 2014-06-12 | Toshiba Corp | 外国語文章作成支援装置、方法、及びプログラム |
Families Citing this family (283)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7712053B2 (en) * | 1998-12-04 | 2010-05-04 | Tegic Communications, Inc. | Explicit character filtering of ambiguous text entry |
US8938688B2 (en) | 1998-12-04 | 2015-01-20 | Nuance Communications, Inc. | Contextual prediction of user words and user actions |
US7750891B2 (en) | 2003-04-09 | 2010-07-06 | Tegic Communications, Inc. | Selective input system based on tracking of motion parameters of an input device |
CA2392446C (en) | 1999-05-27 | 2009-07-14 | America Online Incorporated | Keyboard system with automatic correction |
US7610194B2 (en) * | 2002-07-18 | 2009-10-27 | Tegic Communications, Inc. | Dynamic database reordering system |
US7030863B2 (en) * | 2000-05-26 | 2006-04-18 | America Online, Incorporated | Virtual keyboard system with automatic correction |
US7286115B2 (en) | 2000-05-26 | 2007-10-23 | Tegic Communications, Inc. | Directional input system with automatic correction |
US7821503B2 (en) | 2003-04-09 | 2010-10-26 | Tegic Communications, Inc. | Touch screen and graphical user interface |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US8706747B2 (en) * | 2000-07-06 | 2014-04-22 | Google Inc. | Systems and methods for searching using queries written in a different character-set and/or language from the target pages |
US7389221B1 (en) * | 2000-07-17 | 2008-06-17 | Globalenglish Corporation | System and method for interactive translation |
US7689405B2 (en) * | 2001-05-17 | 2010-03-30 | Language Weaver, Inc. | Statistical method for building a translation memory |
US8214196B2 (en) | 2001-07-03 | 2012-07-03 | University Of Southern California | Syntax-based statistical translation model |
US20030101044A1 (en) * | 2001-11-28 | 2003-05-29 | Mark Krasnov | Word, expression, and sentence translation management tool |
US7536294B1 (en) * | 2002-01-08 | 2009-05-19 | Oracle International Corporation | Method and apparatus for translating computer programs |
US20030160830A1 (en) * | 2002-02-22 | 2003-08-28 | Degross Lee M. | Pop-up edictionary |
US7620538B2 (en) | 2002-03-26 | 2009-11-17 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
US20040004599A1 (en) * | 2002-07-03 | 2004-01-08 | Scott Shepard | Systems and methods for facilitating playback of media |
US20040024598A1 (en) * | 2002-07-03 | 2004-02-05 | Amit Srivastava | Thematic segmentation of speech |
US7194455B2 (en) | 2002-09-19 | 2007-03-20 | Microsoft Corporation | Method and system for retrieving confirming sentences |
US7293015B2 (en) | 2002-09-19 | 2007-11-06 | Microsoft Corporation | Method and system for detecting user intentions in retrieval of hint sentences |
US7171351B2 (en) | 2002-09-19 | 2007-01-30 | Microsoft Corporation | Method and system for retrieving hint sentences using expanded queries |
US7111237B2 (en) * | 2002-09-30 | 2006-09-19 | Qnaturally Systems Inc. | Blinking annotation callouts highlighting cross language search results |
US7249012B2 (en) * | 2002-11-20 | 2007-07-24 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among phrases |
ES2301857T3 (es) * | 2002-12-26 | 2008-07-01 | Casio Computer Co., Ltd. | Diccionario electronico con ejemplos de frases. |
JP3793879B2 (ja) * | 2002-12-27 | 2006-07-05 | カシオ計算機株式会社 | 携帯型電子辞書装置及びプログラム |
US7536293B2 (en) * | 2003-02-24 | 2009-05-19 | Microsoft Corporation | Methods and systems for language translation |
US7356457B2 (en) | 2003-02-28 | 2008-04-08 | Microsoft Corporation | Machine translation using learned word associations without referring to a multi-lingual human authored dictionary of content words |
US8548794B2 (en) | 2003-07-02 | 2013-10-01 | University Of Southern California | Statistical noun phrase translation |
US7346487B2 (en) * | 2003-07-23 | 2008-03-18 | Microsoft Corporation | Method and apparatus for identifying translations |
US7412385B2 (en) * | 2003-11-12 | 2008-08-12 | Microsoft Corporation | System for identifying paraphrases using machine translation |
US7584092B2 (en) | 2004-11-15 | 2009-09-01 | Microsoft Corporation | Unsupervised learning of paraphrase/translation alternations and selective application thereof |
US8200475B2 (en) * | 2004-02-13 | 2012-06-12 | Microsoft Corporation | Phonetic-based text input method |
US7478033B2 (en) * | 2004-03-16 | 2009-01-13 | Google Inc. | Systems and methods for translating Chinese pinyin to Chinese characters |
US8296127B2 (en) | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
WO2005103947A1 (ja) * | 2004-04-27 | 2005-11-03 | Matsushita Electric Industrial Co., Ltd. | アプリケーション装置と入力サーバとからなる文字入力システム |
US8095364B2 (en) | 2004-06-02 | 2012-01-10 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
GB2415518A (en) * | 2004-06-24 | 2005-12-28 | Sharp Kk | Method and apparatus for translation based on a repository of existing translations |
US20060048055A1 (en) * | 2004-08-25 | 2006-03-02 | Jun Wu | Fault-tolerant romanized input method for non-roman characters |
US7711542B2 (en) * | 2004-08-31 | 2010-05-04 | Research In Motion Limited | System and method for multilanguage text input in a handheld electronic device |
DE202005022113U1 (de) | 2004-10-12 | 2014-02-05 | University Of Southern California | Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet |
US7546235B2 (en) * | 2004-11-15 | 2009-06-09 | Microsoft Corporation | Unsupervised learning of paraphrase/translation alternations and selective application thereof |
US7827026B2 (en) * | 2004-12-21 | 2010-11-02 | Xerox Corporation | Bilingual authoring assistant for the “tip of the tongue” problem |
US9471566B1 (en) * | 2005-04-14 | 2016-10-18 | Oracle America, Inc. | Method and apparatus for converting phonetic language input to written language output |
JP4058057B2 (ja) * | 2005-04-26 | 2008-03-05 | 株式会社東芝 | 日中機械翻訳装置、日中機械翻訳方法および日中機械翻訳プログラム |
US20070024646A1 (en) * | 2005-05-23 | 2007-02-01 | Kalle Saarinen | Portable electronic apparatus and associated method |
US9785329B2 (en) * | 2005-05-23 | 2017-10-10 | Nokia Technologies Oy | Pocket computer and associated methods |
US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US7277029B2 (en) * | 2005-06-23 | 2007-10-02 | Microsoft Corporation | Using language models to expand wildcards |
US7664629B2 (en) * | 2005-07-19 | 2010-02-16 | Xerox Corporation | Second language writing advisor |
US20070043553A1 (en) * | 2005-08-16 | 2007-02-22 | Microsoft Corporation | Machine translation models incorporating filtered training data |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7908132B2 (en) * | 2005-09-29 | 2011-03-15 | Microsoft Corporation | Writing assistance using machine translation techniques |
US20070106664A1 (en) * | 2005-11-04 | 2007-05-10 | Minfo, Inc. | Input/query methods and apparatuses |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US20070164782A1 (en) * | 2006-01-17 | 2007-07-19 | Microsoft Corporation | Multi-word word wheeling |
US7769804B2 (en) * | 2006-01-17 | 2010-08-03 | Microsoft Corporation | Server side search with multi-word word wheeling and wildcard expansion |
US20070250307A1 (en) * | 2006-03-03 | 2007-10-25 | Iq Technology Inc. | System, method, and computer readable medium thereof for language learning and displaying possible terms |
US8126700B2 (en) * | 2006-03-29 | 2012-02-28 | International Business Machines Corporation | Computer-assisted comprehension of texts |
US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
US7778837B2 (en) | 2006-05-01 | 2010-08-17 | Microsoft Corporation | Demographic based classification for local word wheeling/web search |
US7801722B2 (en) * | 2006-05-23 | 2010-09-21 | Microsoft Corporation | Techniques for customization of phonetic schemes |
EP2044533A2 (en) * | 2006-07-17 | 2009-04-08 | Total Recall Aps | A computer-implemented translation tool |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8433556B2 (en) | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
GB2444084A (en) * | 2006-11-23 | 2008-05-28 | Sharp Kk | Selecting examples in an example based machine translation system |
US20080140519A1 (en) * | 2006-12-08 | 2008-06-12 | Microsoft Corporation | Advertising based on simplified input expansion |
US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
US9275036B2 (en) * | 2006-12-21 | 2016-03-01 | International Business Machines Corporation | System and method for adaptive spell checking |
JP4997966B2 (ja) * | 2006-12-28 | 2012-08-15 | 富士通株式会社 | 対訳例文検索プログラム、対訳例文検索装置、および対訳例文検索方法 |
CA2675208A1 (en) * | 2007-01-10 | 2008-07-17 | National Research Council Of Canada | Means and method for automatic post-editing of translations |
US20080172219A1 (en) * | 2007-01-17 | 2008-07-17 | Novell, Inc. | Foreign language translator in a document editor |
US8468149B1 (en) | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
US8225203B2 (en) | 2007-02-01 | 2012-07-17 | Nuance Communications, Inc. | Spell-check for a keyboard system with automatic correction |
US8201087B2 (en) | 2007-02-01 | 2012-06-12 | Tegic Communications, Inc. | Spell-check for a keyboard system with automatic correction |
US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
CN105117376B (zh) | 2007-04-10 | 2018-07-10 | 谷歌有限责任公司 | 多模式输入法编辑器 |
US8799307B2 (en) * | 2007-05-16 | 2014-08-05 | Google Inc. | Cross-language information retrieval |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
JP5638948B2 (ja) * | 2007-08-01 | 2014-12-10 | ジンジャー ソフトウェア、インコーポレイティッド | インターネットコーパスを用いた、文脈依存言語の自動的な修正および改善 |
US8413049B2 (en) * | 2007-08-31 | 2013-04-02 | Research In Motion Limited | Handheld electronic device and associated method enabling the generation of a proposed character interpretation of a phonetic text input in a text disambiguation environment |
US20090083640A1 (en) * | 2007-09-21 | 2009-03-26 | Microsoft Corporation | String based user interface specification |
US8209164B2 (en) * | 2007-11-21 | 2012-06-26 | University Of Washington | Use of lexical translations for facilitating searches |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8289283B2 (en) | 2008-03-04 | 2012-10-16 | Apple Inc. | Language input interface on a device |
TWI457868B (zh) * | 2008-03-12 | 2014-10-21 | Univ Nat Kaohsiung 1St Univ Sc | 機器翻譯譯文之自動修飾方法 |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US8015129B2 (en) * | 2008-04-14 | 2011-09-06 | Microsoft Corporation | Parsimonious multi-resolution value-item lists |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20090326916A1 (en) * | 2008-06-27 | 2009-12-31 | Microsoft Corporation | Unsupervised chinese word segmentation for statistical machine translation |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
JP2010055235A (ja) * | 2008-08-27 | 2010-03-11 | Fujitsu Ltd | 翻訳支援プログラム、及び該システム |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8583418B2 (en) | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
JP2010093707A (ja) * | 2008-10-10 | 2010-04-22 | Nec Saitama Ltd | 携帯型電子装置、文字入力画面表示方法およびプログラム |
KR101045762B1 (ko) * | 2008-11-03 | 2011-07-01 | 한국과학기술원 | 실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법 |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US9361879B2 (en) * | 2009-02-24 | 2016-06-07 | Nexidia Inc. | Word spotting false alarm phrases |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
JP5362095B2 (ja) | 2009-03-19 | 2013-12-11 | グーグル・インコーポレーテッド | インプットメソッドエディタ |
KR101522375B1 (ko) * | 2009-03-19 | 2015-05-21 | 구글 인코포레이티드 | 입력 방법 편집기 |
KR20120016060A (ko) * | 2009-03-20 | 2012-02-22 | 구글 인코포레이티드 | 입력 방식 편집기 컴퓨팅 디바이스와의 상호작용 |
US8798983B2 (en) * | 2009-03-30 | 2014-08-05 | Microsoft Corporation | Adaptation for statistical language model |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US20120226490A1 (en) * | 2009-07-09 | 2012-09-06 | Eliyahu Mashiah | Content sensitive system and method for automatic input language selection |
US8484225B1 (en) | 2009-07-22 | 2013-07-09 | Google Inc. | Predicting object identity using an ensemble of predictors |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
US9053202B2 (en) * | 2009-09-25 | 2015-06-09 | Yahoo! Inc. | Apparatus and methods for user generated translation |
US8380486B2 (en) | 2009-10-01 | 2013-02-19 | Language Weaver, Inc. | Providing machine-generated translations and corresponding trust levels |
WO2011050494A1 (en) * | 2009-10-29 | 2011-05-05 | Google Inc. | Generating input suggestions |
US8732577B2 (en) | 2009-11-24 | 2014-05-20 | Clear Channel Management Services, Inc. | Contextual, focus-based translation for broadcast automation software |
US11416214B2 (en) | 2009-12-23 | 2022-08-16 | Google Llc | Multi-modal input on an electronic device |
EP2339576B1 (en) | 2009-12-23 | 2019-08-07 | Google LLC | Multi-modal input on an electronic device |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
DE202011111062U1 (de) | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
US20110184723A1 (en) * | 2010-01-25 | 2011-07-28 | Microsoft Corporation | Phonetic suggestion engine |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US8463592B2 (en) | 2010-07-27 | 2013-06-11 | International Business Machines Corporation | Mode supporting multiple language input for entering text |
US8635059B2 (en) * | 2010-11-15 | 2014-01-21 | Google Inc. | Providing alternative translations |
US8903719B1 (en) * | 2010-11-17 | 2014-12-02 | Sprint Communications Company L.P. | Providing context-sensitive writing assistance |
US8862595B1 (en) | 2010-11-23 | 2014-10-14 | Google Inc. | Language selection for information retrieval |
US8712989B2 (en) | 2010-12-03 | 2014-04-29 | Microsoft Corporation | Wild card auto completion |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9009030B2 (en) * | 2011-01-05 | 2015-04-14 | Google Inc. | Method and system for facilitating text input |
JP5666937B2 (ja) * | 2011-02-16 | 2015-02-12 | 株式会社東芝 | 機械翻訳装置、機械翻訳方法および機械翻訳プログラム |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US10672399B2 (en) | 2011-06-03 | 2020-06-02 | Apple Inc. | Switching between text data and audio data based on a mapping |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
US8706472B2 (en) * | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8725497B2 (en) * | 2011-10-05 | 2014-05-13 | Daniel M. Wang | System and method for detecting and correcting mismatched Chinese character |
US9304712B2 (en) * | 2011-10-10 | 2016-04-05 | Alcatel Lucent | Automated word substitution for contextual language learning |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
US8490008B2 (en) | 2011-11-10 | 2013-07-16 | Research In Motion Limited | Touchscreen keyboard predictive display and generation of a set of characters |
US9652448B2 (en) | 2011-11-10 | 2017-05-16 | Blackberry Limited | Methods and systems for removing or replacing on-keyboard prediction candidates |
US9122672B2 (en) | 2011-11-10 | 2015-09-01 | Blackberry Limited | In-letter word prediction for virtual keyboard |
US9310889B2 (en) | 2011-11-10 | 2016-04-12 | Blackberry Limited | Touchscreen keyboard predictive display and generation of a set of characters |
US9715489B2 (en) | 2011-11-10 | 2017-07-25 | Blackberry Limited | Displaying a prediction candidate after a typing mistake |
US9348479B2 (en) | 2011-12-08 | 2016-05-24 | Microsoft Technology Licensing, Llc | Sentiment aware user interface customization |
US9378290B2 (en) | 2011-12-20 | 2016-06-28 | Microsoft Technology Licensing, Llc | Scenario-adaptive input method editor |
US9152323B2 (en) | 2012-01-19 | 2015-10-06 | Blackberry Limited | Virtual keyboard providing an indication of received input |
US9557913B2 (en) | 2012-01-19 | 2017-01-31 | Blackberry Limited | Virtual keyboard display having a ticker proximate to the virtual keyboard |
WO2013123571A1 (en) | 2012-02-24 | 2013-08-29 | Research In Motion Limited | Virtual keyboard with dynamically reconfigurable layout |
EP2631758B1 (en) | 2012-02-24 | 2016-11-02 | BlackBerry Limited | Touchscreen keyboard providing word predictions in partitions of the touchscreen keyboard in proximate association with candidate letters |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
US8996356B1 (en) * | 2012-04-10 | 2015-03-31 | Google Inc. | Techniques for predictive input method editors |
US9201510B2 (en) | 2012-04-16 | 2015-12-01 | Blackberry Limited | Method and device having touchscreen keyboard with visual cues |
US9354805B2 (en) | 2012-04-30 | 2016-05-31 | Blackberry Limited | Method and apparatus for text selection |
US9292192B2 (en) | 2012-04-30 | 2016-03-22 | Blackberry Limited | Method and apparatus for text selection |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9207860B2 (en) | 2012-05-25 | 2015-12-08 | Blackberry Limited | Method and apparatus for detecting a gesture |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
EP2864856A4 (en) | 2012-06-25 | 2015-10-14 | Microsoft Technology Licensing Llc | SEIZURE METHOD EDITOR APPLICATION PLATFORM |
US9116552B2 (en) | 2012-06-27 | 2015-08-25 | Blackberry Limited | Touchscreen keyboard providing selection of word predictions in partitions of the touchscreen keyboard |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US8959109B2 (en) | 2012-08-06 | 2015-02-17 | Microsoft Corporation | Business intelligent in-document suggestions |
CN103631802B (zh) * | 2012-08-24 | 2015-05-20 | 腾讯科技(深圳)有限公司 | 歌曲信息检索方法、装置及相应的服务器 |
US9767156B2 (en) | 2012-08-30 | 2017-09-19 | Microsoft Technology Licensing, Llc | Feature-based candidate selection |
US9524290B2 (en) | 2012-08-31 | 2016-12-20 | Blackberry Limited | Scoring predictions based on prediction length and typing speed |
US9063653B2 (en) | 2012-08-31 | 2015-06-23 | Blackberry Limited | Ranking predictions based on typing speed and typing confidence |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
KR101755625B1 (ko) * | 2013-01-07 | 2017-07-07 | 삼성전자주식회사 | 디스플레이 장치, 그의 ui 표시 방법 및 컴퓨터 판독가능 기록매체 |
US20140208258A1 (en) * | 2013-01-22 | 2014-07-24 | Jenny Yuen | Predictive Input Using Custom Dictionaries |
EP4138075A1 (en) | 2013-02-07 | 2023-02-22 | Apple Inc. | Voice trigger for a digital assistant |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
KR101759009B1 (ko) | 2013-03-15 | 2017-07-17 | 애플 인크. | 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것 |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
CN110442699A (zh) | 2013-06-09 | 2019-11-12 | 苹果公司 | 操作数字助理的方法、计算机可读介质、电子设备和系统 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的系统和方法 |
US10791216B2 (en) | 2013-08-06 | 2020-09-29 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
WO2015018055A1 (en) | 2013-08-09 | 2015-02-12 | Microsoft Corporation | Input method editor providing language assistance |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US20150370891A1 (en) * | 2014-06-20 | 2015-12-24 | Sony Corporation | Method and system for retrieving content |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
JP5959072B2 (ja) * | 2014-09-29 | 2016-08-02 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 入力文字列に関連付けられた変換候補を表示する方法、その電子装置及びサーバ・コンピュータ、並びに電子装置用プログラム及びサーバ・コンピュータ用プログラム |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
CN104731776B (zh) | 2015-03-27 | 2017-12-26 | 百度在线网络技术(北京)有限公司 | 翻译信息的提供方法及系统 |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US9678954B1 (en) * | 2015-10-29 | 2017-06-13 | Google Inc. | Techniques for providing lexicon data for translation of a single word speech input |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
CN105446957B (zh) * | 2015-12-03 | 2018-07-20 | 小米科技有限责任公司 | 相似性确定方法、装置及终端 |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US9400781B1 (en) * | 2016-02-08 | 2016-07-26 | International Business Machines Corporation | Automatic cognate detection in a computer-assisted language learning system |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
KR20170122505A (ko) * | 2016-04-27 | 2017-11-06 | 삼성전자주식회사 | 부가 정보를 제공하는 단말 장치 및 제공 방법 |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US20180089172A1 (en) * | 2016-09-27 | 2018-03-29 | Intel Corporation | Communication system supporting blended-language messages |
CN106649288B (zh) * | 2016-12-12 | 2020-06-23 | 北京百度网讯科技有限公司 | 基于人工智能的翻译方法和装置 |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
CN107193807B (zh) * | 2017-05-12 | 2021-05-28 | 北京百度网讯科技有限公司 | 基于人工智能的语言转换处理方法、装置及终端 |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10387576B2 (en) | 2017-11-30 | 2019-08-20 | International Business Machines Corporation | Document preparation with argumentation support from a deep question answering system |
US11217232B2 (en) * | 2018-09-10 | 2022-01-04 | Sap Portals Israel Ltd. | Recommendations and fraud detection based on determination of a user's native language |
US10942980B2 (en) | 2018-09-10 | 2021-03-09 | Sap Se | Real-time matching of users and applications |
CN111125344B (zh) * | 2019-12-23 | 2023-09-05 | 新方正控股发展有限责任公司 | 相关词推荐方法和装置 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4679951A (en) * | 1979-11-06 | 1987-07-14 | Cornell Research Foundation, Inc. | Electronic keyboard system and method for reproducing selected symbolic language characters |
US5164900A (en) * | 1983-11-14 | 1992-11-17 | Colman Bernath | Method and device for phonetically encoding Chinese textual data for data processing entry |
US5212638A (en) * | 1983-11-14 | 1993-05-18 | Colman Bernath | Alphabetic keyboard arrangement for typing Mandarin Chinese phonetic data |
US4565459A (en) * | 1984-06-04 | 1986-01-21 | Dilucia Gilbert | Phonetic Chinese printing apparatus |
JP2728423B2 (ja) * | 1988-03-15 | 1998-03-18 | 富士通株式会社 | 自動翻訳装置 |
TW268115B (ja) | 1991-10-14 | 1996-01-11 | Omron Tateisi Electronics Co | |
US5267345A (en) | 1992-02-10 | 1993-11-30 | International Business Machines Corporation | Speech recognition apparatus which predicts word classes from context and words from word classes |
US5535119A (en) | 1992-06-11 | 1996-07-09 | Hitachi, Ltd. | Character inputting method allowing input of a plurality of different types of character species, and information processing equipment adopting the same |
JPH0793335A (ja) | 1993-06-07 | 1995-04-07 | Internatl Business Mach Corp <Ibm> | テキストの言語機能を提供する方法 |
US5615296A (en) * | 1993-11-12 | 1997-03-25 | International Business Machines Corporation | Continuous speech recognition and voice response system and method to enable conversational dialogues with microprocessors |
WO1995017729A1 (en) | 1993-12-22 | 1995-06-29 | Taligent, Inc. | Input methods framework |
US6014615A (en) * | 1994-08-16 | 2000-01-11 | International Business Machines Corporaiton | System and method for processing morphological and syntactical analyses of inputted Chinese language phrases |
US5787230A (en) * | 1994-12-09 | 1998-07-28 | Lee; Lin-Shan | System and method of intelligent Mandarin speech input for Chinese computers |
JP3394856B2 (ja) * | 1995-08-14 | 2003-04-07 | 株式会社東芝 | 翻訳方法及び機械翻訳装置 |
US5893133A (en) * | 1995-08-16 | 1999-04-06 | International Business Machines Corporation | Keyboard for a system and method for processing Chinese language text |
US5903861A (en) * | 1995-12-12 | 1999-05-11 | Chan; Kun C. | Method for specifically converting non-phonetic characters representing vocabulary in languages into surrogate words for inputting into a computer |
US6067520A (en) * | 1995-12-29 | 2000-05-23 | Lee And Li | System and method of recognizing continuous mandarin speech utilizing chinese hidden markou models |
US6292768B1 (en) * | 1996-12-10 | 2001-09-18 | Kun Chun Chan | Method for converting non-phonetic characters into surrogate words for inputting into a computer |
US6408266B1 (en) * | 1997-04-01 | 2002-06-18 | Yeong Kaung Oon | Didactic and content oriented word processing method with incrementally changed belief system |
WO1998058329A1 (fr) | 1997-06-17 | 1998-12-23 | Omron Corporation | Appareil et procede de traitement d'informations, et support d'enregistrement contenant un programme de traitement d'informations range en memoire |
JP3539479B2 (ja) * | 1999-03-11 | 2004-07-07 | シャープ株式会社 | 翻訳装置及び翻訳方法並びに翻訳プログラムを記録した記録媒体 |
-
2000
- 2000-04-24 US US09/556,229 patent/US7107204B1/en not_active Expired - Lifetime
-
2001
- 2001-03-02 AU AU2001251708A patent/AU2001251708A1/en not_active Abandoned
- 2001-03-02 WO PCT/US2001/040228 patent/WO2001082119A2/en active Application Filing
- 2001-03-02 JP JP2001579138A patent/JP2004516527A/ja active Pending
- 2001-03-02 EP EP01925116A patent/EP1277136A2/en not_active Ceased
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014109791A (ja) * | 2012-11-30 | 2014-06-12 | Toshiba Corp | 外国語文章作成支援装置、方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
EP1277136A2 (en) | 2003-01-22 |
WO2001082119A2 (en) | 2001-11-01 |
US7107204B1 (en) | 2006-09-12 |
AU2001251708A1 (en) | 2001-11-07 |
WO2001082119A3 (en) | 2002-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7107204B1 (en) | Computer-aided writing system and method with cross-language writing wizard | |
US6848080B1 (en) | Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors | |
US7165019B1 (en) | Language input architecture for converting one text form to another text form with modeless entry | |
US6393389B1 (en) | Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions | |
Bassil et al. | Ocr post-processing error correction algorithm using google online spelling suggestion | |
US7149970B1 (en) | Method and system for filtering and selecting from a candidate list generated by a stochastic input method | |
US6760695B1 (en) | Automated natural language processing | |
US9471566B1 (en) | Method and apparatus for converting phonetic language input to written language output | |
US20070011132A1 (en) | Named entity translation | |
US20070021956A1 (en) | Method and apparatus for generating ideographic representations of letter based names | |
US20050216253A1 (en) | System and method for reverse transliteration using statistical alignment | |
US20120296635A1 (en) | User-modifiable word lattice display for editing documents and search queries | |
JP2013117978A (ja) | タイピング効率向上のためのタイピング候補の生成方法 | |
US7136803B2 (en) | Japanese virtual dictionary | |
WO2002039318A1 (en) | User alterable weighting of translations | |
EP0310049B1 (en) | Document generator and correction support device | |
WO1997040453A1 (en) | Automated natural language processing | |
Liu et al. | PENS: A machine-aided English writing system for Chinese users | |
Sankaravelayuthan et al. | English to tamil machine translation system using parallel corpus | |
JPH11238051A (ja) | 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体 | |
Yamabana et al. | A language conversion front-end for cross-language information retrieval | |
Bhatia et al. | Predictive and corrective text input for desktop editor using n-grams and suffix trees | |
Vasuki et al. | English to Tamil machine translation system using parallel corpus | |
Tesema et al. | Enhancing the Text Production and Assisting Disable Users in Developing Word Prediction and Completion in Afan Oromo | |
Seligman et al. | Rapid portability among domains in an interactive spoken language translation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071228 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071228 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20071228 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20080123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080129 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080430 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080430 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080919 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20081216 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20081224 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090119 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090421 |