JP2001249920A - 推測入力源からのテキストに対して候補を提供する方法およびシステム - Google Patents
推測入力源からのテキストに対して候補を提供する方法およびシステムInfo
- Publication number
- JP2001249920A JP2001249920A JP2000305651A JP2000305651A JP2001249920A JP 2001249920 A JP2001249920 A JP 2001249920A JP 2000305651 A JP2000305651 A JP 2000305651A JP 2000305651 A JP2000305651 A JP 2000305651A JP 2001249920 A JP2001249920 A JP 2001249920A
- Authority
- JP
- Japan
- Prior art keywords
- text
- candidate list
- input
- inferred
- guess
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/274—Converting codes to words; Guess-ahead of partial word inputs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Character Discrimination (AREA)
Abstract
方法を提供する。 【解決手段】 選択テキスト用の候補を決定するに当た
り、推測入力結合器は、選択テキストを、入力源ごとの
テキスト要素に分解する。推測入力結合器は、各テキス
ト要素の候補を含んだ確率モデルを検索する。テキスト
要素が連続した推測入力源の処理結果であれば、推測入
力結合器は、全入力源の結果の確率を正確に反映した確
率モデルを取得する。推測入力結合器は、検索した確率
モデルを結合することにより、選択テキスト用の候補リ
ストを作成する。推測入力結合器は、選択テキスト全体
に自然言語原理を適用することにより、候補リストを修
正することができる。選択テキスト用候補リストは、ユ
ーザに提示する。ユーザが候補の1つを選ぶと、ワード
プロセッサはその選んだ候補で選択テキストを置換す
る。
Description
キストを入力するための方法に関する。さらに詳しく
は、複数の推測入力源からの選択テキストに対して、複
数の候補を提供することに関する。
マウスを使ってワードプロセッサにテキストを入力して
きた。最近のワードプロセッサは改良が進み、ユーザは
音声や手書き等の入力方法を介しても、テキストの入力
ができる。コンピュータは、このような入力を必ずしも
正確に解釈できないが、その入力に対する候補テキスト
のリストを作成できる。さらにコンピュータは、ユーザ
の意図に対する確率を各候補に付加できる。このように
確率を付加できる入力を「推測入力」と呼ぶ。一方、タ
イプしたテキストのように正確に決定できる入力は、
「非推測入力」と呼ぶ。
らワードプロセッサへ入力したテキストは、ユーザが編
集しないと意図したテキストにならない。この編集作業
は、ユーザが推測テキスト内でテキストを選択し、その
選択テキストに対応する候補を要求することで簡単に行
われてきた。コンピュータは、候補の要求を受けると、
グラフィカルユーザインタフェースを介して、選択テキ
ストに対する候補をユーザに提供する。ユーザが候補の
1つを選ぶと、コンピュータはその選択候補で選択テキ
ストを置き換える。
い、ワードプロセッサにテキストを入力し、そのテキス
トを編集する場合を考える。例えばユーザは、テキスト
中の1語を置換するため、キーボードを使って新しい語
をタイプし、コンピュータに入力する。現在のワードプ
ロセッサは、タイプしたテキストを、選択テキスト用候
補の中に挿入しない。従って、推測入力源からのテキス
トを編集した場合に、この編集したテキストにも候補を
提供する手段が必要である。
る場合、そのような選択テキストに対してユーザが候補
を要求すると問題が起きる。例えば選択テキストが、手
書き入力に基づく語と音声入力に基づく語とを含み、こ
の選択テキストに対してユーザが候補を要求するような
場合である。現在のワードプロセッサは、このような選
択テキストに対して、意味のある候補を提供できない。
従って、複数の推測入力源に基づく選択テキストにも候
補を提供する手段が必要である。
タを生成し、それをワードプロセッサへの入力とする。
一般にIMEは、入力を外国語テキストに変換する。I
MEへの入力は例えば、キーボードおよびマウスを介し
てコンピュータに入力したテキストである。IMEは、
アジア言語等における表意文字を生成するのに特に有用
である。このような言語は、キーボードのキーよりはる
かに多い表意文字を持つ。特定の表意文字をコンピュー
タに入力するには、複数のキーを打ち込み、それをIM
Eが合成文字として解釈する。
スペルを英字でタイプする。多くの中国語文字は発音が
似ており、タイプした音声スペルは異なる中国語文字に
対応することが多い。するとIMEは、タイプした音声
スペルに対応する最適候補をユーザに提供し、ユーザは
その中から正しい1つを選べる。
ば役に立つと考えてきた。まず音声をテキストに変換
し、そのテキストをIMEへの入力とする。前述したよ
うに、音声の解釈は元来が推測である。このため音声解
釈から生成したテキストは、ユーザが意図したテキスト
でないことがある。不正確なテキストをIMEへ入力す
れば、IMEは不正確な結果を生成する。従って音声を
IMEへの入力として使う場合、音声データを解釈する
プログラムは、音声解釈によって生成したテキストをま
ずユーザに修正させ、その修正テキストをIMEへ入力
する。IMEがそれを外国語に翻訳すると、ユーザは再
び候補から選択する。IMEの翻訳結果も推測だからで
ある。このように2つの編集処理をユーザに求めるの
は、非能率で不便である。従って、IMEへの音声入力
処理を行う改良方法が必要である。
を受け入れる推測入力結合器を提供することにより、前
記必要を満たす。本発明は、ユーザが選択したテキスト
に対して候補を提供する。この選択テキストは、1つ以
上の推測入力を含む複数の入力源から生成したものでも
構わない。
ユーザインタフェースを介してユーザに候補リストを提
供する。ユーザは、その候補から1つを選択し、その候
補で選択テキストを置換する。選択テキストとは、編集
する目的でユーザが強調表示したテキストである。この
方法は、ユーザが自分で候補を考え、それに基づいてキ
ーボードとマウスによって修正を行うより早い。選択テ
キストに対する所望の候補が見つからなければ、ユーザ
はキーボードとマウスを使い、選択テキストを編集でき
る。すると推測入力結合器は、そのユーザの修正を取り
入れた候補リストを提供する。ユーザが選択テキストを
部分的に編集するだけで、推測入力結合器は候補を提供
するから、編集効率が向上する。
利用できる。自然言語モデルは、自然言語原理を用いて
選択テキストを分析し、より良い候補リストを提供でき
る。これもまた、ユーザの編集効率を向上する。
る。ユーザはまず、コンピュータにテキストを入力す
る。この時ユーザは、複数の推測入力源や、キーボード
およびマウスを用いる。
トは、非推測入力源の例である。すなわちこのテキスト
は、正確に決定可能である。一方、推測入力源からの入
力は、候補リストに変換する。各候補は、正確さの確率
が100%以下である。コンピュータは音声を完璧に解
釈することはできないため、音声認識装置は推測入力源
の一例である。従って音声入力は、テキスト候補リスト
に変換する。推測入力源の他の例は、手書き認識装置お
よび入力システム(IME)である。選択テキスト中の
テキスト要素の入力源が推測入力源である場合、最適候
補をそのテキスト要素の代表として使う。
し、その入力テキストの一部を選択し、修正作業を開始
する。選択テキストは、複数のテキスト要素を含む。各
テキスト要素は、選択テキストの一部であり、単一の入
力源を介してユーザが入力したものである。選択テキス
トは、様々な入力源からのテキスト要素を含むこともあ
る。それら入力源は、推測入力源も含み得る。
スト全体に対する候補を表示するコマンドを入力する。
推測入力結合器は、選択テキストを入力源別のテキスト
要素に分解し、各推測入力源のテキスト要素用の候補を
代表する確率モデルを検索する。この確率モデルは、各
候補とその確率を含んだリストを持つ。確率モデルは、
格子を含むこともできる。
テキスト要素とを結合し、前記選択テキスト用候補リス
トを作成し、そのリストをモニタ等の表示装置に表示す
る。ユーザは、表示候補の1つを選択できる。選択した
候補は、前記選択テキストに置き換わる。
できる。この場合、推測入力結合器は、各テキスト要素
の確率モデルを結合して選択テキスト用中間候補リスト
を作成し、それを自然言語モデルへ送る。自然言語モデ
ルは、選択テキスト全体に自然言語原理を適用し、前記
中間候補リストを再評価し、修正候補リストを作成す
る。自然言語モデルは、前記中間候補リストに無い新し
い候補を前記修正候補リストに追加できる。自然言語モ
デルは、修正候補リストを推測入力結合器へ送る。推測
入力結合器は、その修正候補リストを表示する。
は、連続した推測入力源から生成した推測テキスト要素
である。少なくとも1つの推測入力源が推測結果を生成
し、それを次の推測入力源の入力とする。第1推測入力
源はユーザ入力を受け取り、それに対する候補を生成す
る。これら候補は、第2推測入力源の入力となる。例え
ば音声認識装置はテキストを生成し、そのテキストがI
MEへの入力となる。連続した推測入力源が1つの推測
テキスト要素を生成すると、推測入力結合器は連続確率
モデルを生成できる。この連続確率モデルは、推測テキ
スト要素用候補とこれら候補の正確な確率とを含む。こ
れら確率は、連続した入力源の各入力源への入力の確率
である。この形態によれば、第1推測入力源から第2推
測入力源へ入力を与える際、ユーザが入力を選択する必
要がない。
らのテキスト要素に対して連続確率モデルを生成する
際、第1推測入力源にユーザ入力を送る。第1推測入力
源は、それを処理し、推測結果を生成する。この推測結
果は、複数の候補を有する。推測入力結合器は、その推
測結果を第2推測入力源への入力とする。第2推測入力
源は、複数の第2推測結果を生成する。各第2推測結果
は、複数の候補を有する。第2推測結果のいずれかがベ
ストn候補リストでなければ、推測入力結合器は、それ
をベストn候補リストに変換する。全推測結果を同一フ
ォーマットに変換すれば、結合処理が簡単だからであ
る。推測入力結合器は、第2推測結果を結合し、総合候
補リストを作成する。連続した推測入力源が2個であれ
ば、前記総合候補リストは、前記連続した推測入力源か
らのテキスト要素用確率モデルとなる。
範囲を広げ、より大きな単位テキストにすることもでき
る。これを行うため推測入力結合器は、選択テキストを
修正範囲モデルへ送り、修正範囲の調整が必要か否かを
判断する。修正範囲モデルは、推測入力結合器に単位テ
キストを返す。この単位テキストは、選択テキストと少
なくとも1つの隣接語とを含む。推測入力結合器は、そ
の単位テキスト用の候補リストを作成し、それを表示装
置に表示する。
ながら実施例を詳細に説明し、本発明の様々な形態を明
らかにする。
から入力を受け取れるワードプロセッサにおいて実施す
る。複数の入力源とは、非推測入力源および推測入力源
を含む。キーボードおよびマウスによるテキスト入力
は、非推測入力源の例である。非推測入力源の場合、コ
ンピュータはユーザが意図したテキストを正確に決定で
きる。一方、推測入力源は、入力を推測結果に変換す
る。1つの推測結果は複数の候補を有し、各候補の正確
さの確率は100%以下である。推測入力源の例は、音
声認識装置である。音声認識装置は、音声入力をテキス
ト候補リストに変換する。コンピュータが音声を完璧に
解釈することは不可能だからである。推測入力源の他の
例は、手書き認識装置および入力システム(IME)で
ある。
ストの一部を選択し、その選択テキストに対する候補を
要求できる。選択テキストが1つ以上の推測入力源を元
にコンピュータが作成したものであれば、その選択テキ
ストには候補が存在する。ワードプロセッサは、選択テ
キスト用の候補を決定すると、グラフィカルユーザイン
タフェースを介してそれら候補を表示する。候補の1つ
をユーザが選択すると、ワードプロセッサはその選択候
補で前記選択テキストを置き換える。
希望の候補がなければ、ユーザはキーボードおよびマウ
スを使って前記選択テキストを編集する。例えばユーザ
は、前記選択テキスト中の1語を変更する。するとワー
ドプロセッサは、その編集を取り入れて候補リストを修
正し、修正した候補リストをユーザに提示する。修正し
た候補リストの1候補をユーザが選択すると、ワードプ
ロセッサはその選択候補で前記選択テキストを置き換え
る。
であり、選択テキストに対する候補を生成する。推測入
力結合器はこれを行うため、選択テキストをテキスト要
素に分解する。各テキスト要素は、1つの推測入力源に
対応する。推測入力結合器は、各推測テキスト要素につ
き、その候補を代表する確率モデルを検索する。推測入
力結合器は、検索した確率モデルと他のテキスト要素と
を結合し、選択テキスト全体に対する候補リストを作成
する。
リケーションの一部であっても良いし、オペレーティン
グシステムの一部であっても良い。推測入力結合器は、
オペレーティングシステムの一部ではなく、ワードプロ
セッサとインタフェースする独立したプログラムであっ
ても良い。
リストの向上を図るため、自然言語モデルを利用でき
る。自然言語モデルは、選択テキスト全体に自然言語原
理を適用し、推測入力結合器が作成した各候補の適切さ
を再評価し、候補リストに新しい候補を追加する。自然
言語モデルは、各テキスト要素に自然言語原理を適用す
ることにより、候補リスト作成に使用する確率モデルの
向上を図ることもできる。
にすることもある。少なくとも1つの推測入力源が推測
結果を生成し、それを次の推測入力源への入力とする。
この場合、第1推測入力源はユーザ入力を受け取り、最
後の推測入力源はテキスト要素用の候補を生成する。推
測入力結合器は、テキスト要素に対応する候補を含んだ
連続確率モデルを取得する。この処理において次の推測
入力源へ入力を与える際、推測入力結合器は前の入力源
の結果の選択をユーザに求めない。
確率モデルを取得するため、選択テキストの元となった
ユーザ入力を選択し、そのユーザ入力を連続した推測入
力源の第1推測入力源へ送る。次に推測入力結合器は、
第1推測入力源が生成した各候補を第2推測入力源の入
力とする。第2推測入力源は、受け取った候補の各々か
ら推測結果を生成する。第2推測入力源からの推測結果
は、総合候補リストにまとめる必要がある。さらに第3
推測入力源が存在すれば、推測入力結合器は、総合候補
リストの各候補を第3推測入力源への入力とする。連続
した推測入力源における最後の推測入力源から作成する
総合候補リストは、連続確率モデルである。
ことが多い。ユーザは修正過程において、そのエラーの
範囲全体に気付かないことがある。例えばユーザが「認
識(recognize、レコグナイズ)」と口述した
時、音声認識エンジンが最適解釈として「素敵を破壊
(wreck a nice、レックアナイス)」と決
定したとする。編集の時、ユーザは「破壊」を目にし、
その語についてのみ候補を要求する。ユーザは、それに
続く「素敵を」がやはり不正確であることに気付いてい
ない。
トを選択し、ワードプロセッサがその選択テキストのみ
を用いて候補リストを作成すれば、そのリストはユーザ
が意図したテキストに対応する候補を1つも持たないで
あろう。ユーザがリストから候補を選び、その選んだ候
補で前記選択テキストを置き換えてしまうと、不正確な
隣接語はそのままテキストに残る。
力結合器は、選択テキストを修正範囲モデルへ送る。修
正範囲モデルは、修正範囲を拡大すべきか否かを決定す
る。前記「認識」の例では、修正用の適切な単位テキス
トは「素敵を破壊」であろう。この決定を下すに当た
り、修正範囲モデルは、自然言語モデルと、類似エラー
のモデルと、前記テキストをワードプロセッサへ提供し
た入力方法に関するモデルとが含む情報を参照する。入
力方法に関するモデルとは、音声認識用音声モデル、手
書き入力用手書きモデル、手話・身振り認識用視覚モデ
ルを含む。
と判断すると、1つ以上の単位テキストを特定する。こ
の特定した単位テキストに対して、推測入力結合器は前
記方法において候補を生成する。修正範囲モデルは、こ
のような単位テキストのリストを推測入力結合器へ送
る。推測入力結合器は、そのリストを処理する。
する。図中、同一番号は同一要素を示す。
環境100の概略を説明する。一例としての動作環境1
00は、従来のパーソナルコンピュータシステム120
を含む。このパーソナルコンピュータシステムは、処理
装置121と、システムメモリ122と、システムバス
123とを含む。システムバス123は、システムメモ
リ122を処理装置121に接続する。システムメモリ
122は、リードオンリメモリ(ROM)124とラン
ダムアクセスメモリ(RAM)125とを含む。ROM
124は基本入出力システム126(BIOS)を含
む。このBIOSは基本ルーチンを含む。この基本ルー
チンは、起動時等にパーソナルコンピュータ120内の
各要素間の情報転送を支援する。
は、ハードディスクドライブ127と、取出し可能磁気
ディスク129を読み書きするための磁気ディスクドラ
イブ128と、CD−ROM等の光媒体である取出し可
能光ディスク131を読み書きするための光ディスクド
ライブ130とをさらに含む。ハードディスクドライブ
127と磁気ディスクドライブ128と光ディスクドラ
イブ130とは、各々ハードディスクドライブインタフ
ェース132と磁気ディスクドライブインタフェース1
33と光ドライブインタフェース134とを介して、シ
ステムバス123に接続する。これらドライブおよび関
連するコンピュータ読取り可能媒体は、不揮発性記憶手
段をパーソナルコンピュータシステム120に提供す
る。ここに示したコンピュータ読取り可能媒体は、ハー
ドディスク、取出し可能磁気ディスク,およびCD−R
OMディスクだが、当業者には明らかなように、他のコ
ンピュータ読取り可能媒体を、一例として示した前記動
作環境に用いても良い。例えば磁気カセット、フラッシ
ュメモリカード、デジタルビデオディスク、ベルヌーイ
カートリッジ等を用いても良い。
2等のポインティングデバイス等の入力装置を介して、
パーソナルコンピュータシステム120にコマンドや情
報を入力する。マイクロフォン161は、コンピュータ
システム120に会話等の音声入力を行うために使用す
る。ユーザは、コンピュータシステムに図や手書きのグ
ラフィック情報を入力する場合、スタイラスを用いて筆
記タブレット162にグラフィック情報を描く。コンピ
ュータシステム120は、他の入力装置(図示せず)と
してジョイスティック、ゲームパッド、衛星アンテナ、
スキャナ、タッチスクリーン、スタイラス等を含んでも
良い。マイクロフォン161は、システムバスに接続し
たオーディオアダプタ160を介して処理装置121に
接続できる。他の入力装置は、システムバスに接続した
シリアルポートインタフェース146を介して処理装置
121に接続する場合が多い。しかしながらゲームポー
ト、ユニバーサルシリアルバス(USB)等のインタフ
ェースによって接続することもできる。
プタ148等のインタフェースを介してシステムバス1
23に接続する。モニタに加え、パーソナルコンピュー
タシステムは、スピーカやプリンタ等の周辺出力装置
(図示せず)を一般に含む。
は、ネットワーク環境で動作させ、1つ以上の遠隔コン
ピュータ149に論理接続しても良い。遠隔コンピュー
タ149は、サーバ、ルータ、ピア装置、共通ネットワ
ークノード等であり、一般に前記パーソナルコンピュー
タシステム120に関連して説明した要素の多くあるい
は全てを含む。ただし図1は記憶装置150のみを示
す。図1に示す論理接続は、ローカルエリアネットワー
ク(LAN)151と、ワイドエリアネットワーク(W
AN)152とを含む。このようなネットワーク環境
は、事務所、企業コンピュータネットワーク、イントラ
ネット、インターネットにおいて普及している。
ンピュータシステム120は、ネットワークインタフェ
ース153を介してローカルネットワーク151に接続
する。WAN環境で使用する場合、パーソナルコンピュ
ータシステム120は、一般にモデム154等の手段を
含み、インターネット等のワイドエリアネットワーク1
52を介して通信を確立する。モデム154は内蔵また
は外付けであり、シリアルポートインタフェース146
を介してシステムバス123に接続する。ネットワーク
環境の場合、パーソナルコンピュータシステム120の
プログラムモジュールは、遠隔記憶装置150に格納し
ても良い。図示のネットワーク接続は例であり、コンピ
ュータシステム間の通信リンクは他の手段で確立しても
良い。また本発明は、パーソナルコンピュータシステム
以外に、ホストまたはサーバコンピュータシステムでも
実現可能であり、CD−ROM以外の手段、例えばネッ
トワーク接続インタフェース153によってホストコン
ピュータシステムにデータを送ることができる。
タシステム120の駆動装置やRAM125に格納でき
る。プログラムモジュールは、コンピュータシステム1
20の機能を制御し、ユーザ、入出力装置、あるいは他
のコンピュータと対話する。プログラムモジュールは、
ルーチン、オペレーティングシステム135,アプリケ
ーションプログラムモジュール138,データ構造、ブ
ラウザ、他のソフトウエア部品、あるいはファームウエ
ア部品を含む。本発明は、推測入力結合プログラムモジ
ュール137、推測入力インタフェースプログラムモジ
ュール139等の1つ以上のプログラムモジュールによ
って好適に実施できる。これらモジュールの各々は、発
明の詳細な説明に記載した方法に基づく。
38は、本発明に関連して使用する様々なアプリケーシ
ョンからなる。図2はその幾つかを示す。これらプログ
ラムモジュールの目的および相互作用は、図2を参照し
て詳細に説明する。これらプログラムモジュールは、ワ
ードプロセッサプログラム210(ワシントン州レドモ
ンドのマイクロソフト社の製品であるワード等)、手書
き認識プログラムモジュール230,音声認識プログラ
ムモジュール240,および入力システム(IME)2
50を含む。
の特定のプログラミング言語は説明しない。理由は、以
下の説明および添付図面における動作、処理段階、およ
び手順は、十分な開示を行っているため、当業者であれ
ばそれらに基づいて本発明の実施例を実現可能だからで
ある。さらに実施例の実行に使用可能なコンピュータお
よびオペレーティングシステムは多数あり、これら多く
の異なるシステムに適用可能な詳細コンピュータプログ
ラムを提示するのは困難だからである。特定コンピュー
タのユーザは、そのユーザの必要性および目的に最も適
した言語およびツールを知っているであろう。
コンピュータシステム構成でも実施可能である。例えば
携帯装置、マルチプロセッサシステム、マイクロプロセ
ッサベースの消費者用電子機器、プログラム可能消費者
用電子機器、マイクロコンピュータ、メインフレームコ
ンピュータ等でも実施可能である。本発明は分散コンピ
ュータ環境でも実施可能である。分散コンピュータ環境
では、通信ネットワークでリンクした各遠隔処理装置に
よってタスクを実行し、プログラムモジュールを局所記
憶装置および遠隔記憶装置の両方に置くことができる。
ラムモジュールの全体を示す。これらプログラムモジュ
ールの主たる目的は、ユーザが推測入力源および非推測
入力源を用いて、ワードプロセッサ等のアプリケーショ
ン210にテキストを入力できるようにすることであ
る。代表的な推測入力源は、手書き認識プログラムモジ
ュール230、音声認識プログラムモジュール240,
入力システム(IME)250、音声認識プログラムモ
ジュール260である。キーボード140は、代表的な
非推測入力源である。ユーザは、1つ以上のこれら入力
源を介してワードプロセッサ210にテキストを入力
し、テキストの一部を選択し、その選択テキストに対す
る候補リストを要求できる。この選択テキストは、複数
の推測入力源および非推測入力源からの入力を含むこと
がある。選択テキストが少なくとも1つの推測入力源か
らのデータを含んでいれば、その選択テキストに対する
候補が存在する。プログラムモジュールは、その候補リ
ストを作成し、グラフィカルユーザインタフェースを介
してそれをユーザに提示する。ユーザが候補の1つを選
ぶと、選んだ候補で前記選択テキストを置換する。推測
入力源230,240,250,260の動作を順次説
明する。
は、ユーザからの手書き入力280を受け取る。ユーザ
は、スタイラスを用いて筆記タブレット162に筆記す
ることにより、手書き入力280を生成できる。他の装
置を用いても良い。例えばマウス142を用いて、モニ
タ147に書いても良い。スタイラスを用いて、タッチ
スクリーンに書くこともできる。手書き入力280は、
好ましくはオペレーティングシステム135の筆記タブ
レットドライバモジュールにより、手書き認識プログラ
ムモジュール230へ送る。
しい。手書き認識プログラムモジュール230は、手書
き入力280を完全に解釈できるとは限らない。プログ
ラムモジュール230が行う最良のことは、手書き入力
280の候補を生成し、各候補に正当性の確率を割り当
て、推測結果を提供することである。確率モデル270
aは、データ構造を含む。このデータ構造は、手書き認
識プログラムモジュール230が手書き入力280を処
理して生成した確率データを含む。
ために使用するデータ構造は、どのようなものでも構わ
ない。2つの有用なデータ構造は、格子およびベストn
候補リストである。格子は、当業者に良く知られた構造
であるため、詳細説明は省略する。簡単に説明すると、
格子は、推測入力源が生成した語または句をノードに格
納する。各語または句は確率データであるため、各ノー
ドは対応する語または句に割り当てた確率も格納する。
当業者に公知の方法を用いて格子を探索し、各テキスト
要素用の候補を生成できる。テキストの隣接部を代表す
る複数の格子を連結してメタ格子を作成できる。このメ
タ格子を探索することにより、隣接するテキスト要素の
候補を生成できる。
り当てた確率とのリストでも良い。ある語または句に対
するベストn候補リストは、その語または句を代表する
格子から作ることもできる。
手書き認識プログラムモジュール230と同様に動作す
る。ただし音声認識プログラムモジュール240は、マ
イクロフォン161を介してユーザから音声入力290
を受け取る。マイクロフォン161は、オペレーティン
グシステム135のマイクロフォンドライバモジュール
で駆動する。音声は解釈が難しい。発音が似て意味やス
ペルが異なる語がたくさんあるからである。従って音声
認識プログラムモジュール240も、推測結果を生成す
る。確率モデル270bは、データ構造を格納する。こ
のデータ構造は、音声認識プログラムモジュール240
が音声入力290を処理して生成した確率データを含
む。
ータを生成する。IME250は、入力を外国語テキス
トに変換する。IME250への入力は、例えばキーボ
ード140およびマウス142を介してコンピュータへ
タイプ入力したテキストである。確率モデル270c
は、データ構造を含む。このデータ構造は、IME25
0が生成した確率データを含む。
意文字を生成する時、特に有用である。かかる言語にお
ける表意文字数は、キーボードのキー数よりはるかに多
いからである。IME250を使わなければ、特定の表
意文字をコンピュータに入力するのは難しい。代表的な
IME250の場合、ユーザは所望の中国語文字の音声
スペルを英字でタイプする。多くの中国語文字は発音が
類似しているため、タイプした音声スペルは、多くの異
なる中国語文字の1つを意図していよう。そこでIME
250は、推測結果を生成すると共に、タイプした音声
スペルが意図したであろう最も確率の高い候補をユーザ
に提示する。ユーザは、その候補から正しい1つを選択
できる。
次の推測入力源への推測入力とすることもできる。この
場合、これら推測入力源は「連続した推測入力源」であ
り、連続配置していると考えられる。これはプログラム
モジュールの構成293に示すとおりである。この構成
293は、IME250の他の実施例でもある。
をコンピュータに入力し、それを使って日本語テキスト
を生成できる。音声262は、音声認識プログラムモジ
ュール260へ送る。音声認識プログラムモジュール2
60の動作は、音声認識プログラムモジュール240の
動作とほぼ同じである。モジュール260を独立して示
した理由は、それが異なる音声解釈エンジンを持てるか
らである。例えば音声認識プログラムモジュール260
は、音声認識プログラムモジュール240とは異なる言
語を解釈できる。確率モデル270dは、データ構造を
含む。このデータ構造は、音声認識プログラムモジュー
ル260が音声入力を処理して生成した確率データを含
む。
プログラムモジュール260は、英語音声から英語テキ
スト候補を生成し、それを確率モデル270dに格納で
きる。確率モデル270dに格納した1つ以上の英語テ
キスト候補は、IME250への入力となる。IME2
50は、その英語テキスト入力を日本語文字に変換す
る。IME250への各候補入力は、個別の推測結果を
生成する。ただしIME250への2つの個別入力に基
づく推測結果間には、候補の重複があり得る。
ール260からIME250への矢印は、音声認識プロ
グラムモジュール260がIME250の推測入力源で
あることを示している。しかしこれら2つのプログラム
モジュールは、直接インタフェースしているわけではな
い。音声認識プログラムモジュール260からIME2
50への推測入力は、例えば推測入力インタフェース1
39等のインタフェースプログラムモジュールを中継す
る。この推測入力インタフェース139に対して、各推
測入力源は直接接続している。
力源と、アプリケーション210との間で、推測データ
を受け渡す。ここで推測入力源は、例えば手書き認識プ
ログラムモジュール230、音声認識プログラムモジュ
ール240,IME250である。推測データ通路とし
て推測入力インタフェース139を設けと、推測データ
を受け取るアプリケーション210と推測入力源との通
信が簡略になる利点がある。すなわちアプリケーション
は、推測入力インタフェースとの通信方法を持つだけで
良く、推測入力源に対しての通信方法を持たないで良
い。推測データを受け取るアプリケーション210は、
本発明の一実施例においてワードプロセッサである。ア
プリケーション210は、スプレッドシート、ブラウ
ザ、電子メールプログラム、音楽編集プログラム、CA
Dプログラム、プレゼンテーションソフトウエア(ワシ
ントン州レドモンドのマイクロソフト社の製品であるパ
ワーポイン等)、オペレーティングシステム等のソフト
ウエアプログラムでも良い。
ロセッサ210は、推測入力インタフェース139を介
して、最適候補テキストを受け取る。各最適候補は、ワ
ードプロセッサにデータを入力した各推測入力源からの
ものである。複数の推測入力源からワードプロセッサ2
10にデータを送ることに加え、例えばキーボード14
0でタイプすることにより、非推測データをワードプロ
セッサに入力できる。ワードプロセッサ210は、これ
ら元データを結合して複数入力源テキストを作成し、そ
れをユーザに提示する。ワードプロセッサ210は、そ
のテキストの各要素の入力源をユーザに示さないが、記
録している。
ストの一部を選択し、その選択テキストに対する候補を
要求することを可能にする。選択テキストが1つ以上の
推測入力源を元にしていれば、候補が存在する。ワード
プロセッサ210は、選択テキスト自体とその選択テキ
ストの各要素の入力源とを推測入力インタフェース13
9へ送り、候補リストを要求する。推測入力インタフェ
ース139は、その要求を処理し、全選択テキストに対
する候補リストをワードプロセッサ210に返す。ワー
ドプロセッサは、グラフィカルユーザインタフェースを
介してその候補リストをユーザに提示する。候補リスト
からユーザが1つを選ぶと、ワードプロセッサは、選ん
だ候補で選択テキストを置き換える。
ンタフェース139は、その要求を推測入力結合器13
7へ送る。推測入力結合器137は、推測入力インタフ
ェース139を介して推測入力源と通信し、確率モデル
270に関する必要情報を検索し、候補リストを作成す
る。
の際、自然言語モデル220を参照しても良い。この場
合、結合器137は、確率モデル270から検索した情
報を用いて、中間候補リストを作成し、それを自然言語
モデル220へ送る。自然言語モデルは、文法、テキス
ト全体の意味、様々な語順の確率等を手掛かりに、中間
候補リストを分析する。これに基づき自然言語モデル2
20は、追加候補を生成し、中間候補リスト中の候補の
確率を再評価する。選択テキストの候補リストを生成す
る方法を図3〜9および11を参照しながら説明する。
0,250は、各自の推測データを他の推測入力源を介
して選別することなく、ワードプロセッサ210に提供
できる。すなわち推測入力源230,240,250
は、各々が直接(ただし推測入力インタフェース139
を介して)推測データをワードプロセッサ210へ送る
ことができる。各入力源からの推測データは、ワードプ
ロセッサの同一文書に含めることができる。従ってこれ
ら入力源は、並列推測入力源296であり、並列構成と
言える。
説明してきたが、当業者には明らかなように、これらプ
ログラムモジュールは、様々に組み合わせることが可能
であり、新しいプログラムモジュールを作成して同様の
結果を得ることもできる。特に推測入力結合器137と
自然言語モデル220とは、推測入力インタフェース1
39に含めることができる。これら3つのプログラムモ
ジュールは、オペレーティングシステム135またはワ
ードプロセッサ210の一部とすることもできる。結合
器137および自然言語モデル220は、各独立したプ
ログラムとし、各々がワードプロセッサ210と直接イ
ンタフェースしても良い。また推測入力源230,24
0,250,260は、各々が独立アプリケーションプ
ログラムモジュール138でも良く、オペレーティング
システム136の一部でも良い。
発明実施例においてユーザが目で見ながら行う状況を示
すと共に、推測入力結合器137と自然言語モデル22
0との機能を示す。
数のテキスト入力方法を有し、ユーザからの入力を受け
取り、それをワードプロセッサ等のアプリケーション2
10へ送る。コンピュータは、その入力をテキスト30
0に変換し、モニタ147に表示する。本例において、
ユーザは「THIS IS A MESSAGE WRITTEN BY A THOUSAND
MONKEYS TYPING AT RANDOM. (これは千匹の猿がで
たらめにタイプして書いたメッセージです。)」とのテ
キストを意図した。ところがコンピュータは、それを
「THIS IS A MESSAGE WRITTEN BY A TOWN OF MY KEYS T
AIPING AT RANDOM. (これはでたらめに私の鍵のタ
イピンの町が書いたメッセージです。)」と解釈し、テ
キスト300を生成した。
その一部を強調表示することにより、選択テキスト31
0を作成する。図3の選択テキスト310は、3つのテ
キスト要素312,314,316を有する。これらテ
キスト要素は、各々が異なる推測入力源から生成されて
いる。例えばテキスト要素312は、手書き認識プログ
ラムモジュール230が手書き入力280を処理して生
成した候補の1つである。この推測入力源から生成した
候補は、確率モデル270aが保持する。候補リスト3
18は、確率モデル270aが格納するテキスト要素3
12用候補リストである。この候補リストからコンピュ
ータは、「TOWN OF(の町)」を選んだ。その理由は、
テキスト要素312の元となった手書き入力280に対
し、候補リスト318の「TOWN OF(の町)」が最適で
あるとコンピュータが判断したからである。しかしなが
ら候補リスト318が示すように、コンピュータは「GO
WNOF(のガウン)」および「THOUSAND(千匹の)」もテキス
ト要素312の候補として認識している。
音声入力290を処理して推測結果を生成し、それを確
率モデル270bに格納する。候補リスト320は、テ
キスト要素314に対して確率モデル270bが格納し
ている候補である。ここでは「MY KEYS(私の
鍵)」が最適であるとして選択された。
イピン)」は、第3の推測入力源から来ている。この推
測入力源の候補は、確率モデル270cに格納されてお
り、候補リスト322に含まれる。
8,320,322から様々な組合せを作成し、各組合
せの順位リストを作成する。この順位付けは、選択テキ
スト310に対する各組合せの正当性の確率を計算して
行う。選択テキスト310に対する候補のうち上位を、
候補リスト330としてモニタ147に表示する。
後、ユーザは選択テキストを編集することもできる。図
4においてユーザは、タイピング編集410により、
「TOWN OF(の町)」を「THOUSAND(千
匹の)」で上書きした。この結果、選択テキスト310
のテキスト要素312は、テキスト要素312’に置換
された。
142を用いて行うこともできる。このような入力方法
は、非推測入力であるため、テキスト要素312’に対
する候補は無い。この変更は候補リスト318’に反映
する。候補リスト318’は、図3の候補リスト318
に置き換わる。候補リスト318’は、「THOUSA
ND(千匹の)」が唯一の候補である。
は、候補リスト318’、320,322から再び様々
な組合せを作り、編集後選択テキスト310用の候補を
作成する。これら候補は、候補リスト430としてモニ
タ147に表示する。
て、候補リスト430に表示されているもの以外をユー
ザが希望する場合、ユーザは再び選択テキスト310を
編集する。これを図11に示す。ユーザは、図4の選択
テキスト310にある「MYKEYS(マイ キーズ:
私の鍵)」に「MONKEYS(モンキーズ:猿)」を
上書きタイプして編集412を行う。その結果、テキス
ト要素314’「MONKEYS(猿)」がテキスト要
素314「MY KEYS(私の鍵)」に置き換わる。
そして候補リスト320は候補リスト320’に置き換
わる。この候補リスト320’は、1つの候補しか含ま
ない。なぜなら前記編集が非推測的だからである。推測
入力結合器137は、再び各候補リスト318’、32
0’、322の候補を組合せ、選択テキスト310に対
する候補リスト430’を作成する。
候補として、適切な候補414を見つけ、その候補41
4を強調表示させて選択する。すると候補414は選択
テキスト310に置き換わり、新しいテキスト416を
生成する。
ル220を動作させた場合の本発明実施例を示す。図3
に示したように、ユーザはテキスト要素312,31
4,316からなる選択テキスト310を選ぶ。推測入
力結合器137は、これらテキスト要素の様々な候補組
合せを作成し、選択テキスト310用中間候補リストを
作成する。結合器137は、最適候補を表示することに
代えて、前記中間候補リストを自然言語モデル220へ
送る。
10全体に自然言語原理を適用することにより、中間候
補リストの各候補の確率を再評価する。この再評価は、
選択テキストが含む文法等の言語的手掛かりの分析を含
む。自然言語モデル220は、中間候補リストが含まな
い候補を追加することもある。自然言語モデル220
は、中間候補リストの再評価および生成した追加候補に
基づいて修正候補リストを作成し、それを推測入力結合
器137に返す。結合器137は、修正候補リストから
上位候補を選択し、候補リスト530として表示する。
530は、図3の候補リスト330より優れていること
が多い。従ってユーザは、候補リスト530から候補5
02を選択でき、選択テキスト310を編集する必要が
ない。図5の例においてユーザは、選択テキスト310
を候補502と置き換えることにより新しいテキスト5
04を作成する。
0の各ステップを示すフローチャートである。このルー
チンは、図3,5,11に示した実施例を実行するため
の各段階を含む。ルーチン600は、ステップ602に
おいて開始する。ワードプロセッサは、複数の入力源か
ら元データを受け取る。入力源は、手書き認識プログラ
ムモジュール230,音声認識プログラムモジュール2
40、入力システム250等の推測入力源でも良い。あ
るいはキーボード140およびマウス142を使ってタ
イピング入力した非推測入力でも良い。あるいは連続し
た2つ以上の推測入力源からのデータでも良い。連続し
た推測入力源からのデータの場合、各推測入力源は、そ
れぞれ異なる入力源として扱うことができる。
データを受け取ると、ステップ604においてそのデー
タを複数入力源テキスト列に結合する。すなわち、ワー
ドプロセッサは、元データに対応するテキストを生成し
てモニタ147に表示可能とする。さらにワードプロセ
ッサは、そのテキストの各語の入力源を記録するための
データ構造を生成する。
応じて表示テキストの一部を選択する。この選択テキス
トは、複数の入力源を有するテキストでも良い。例えば
ユーザは、選択テキストの開始位置でマウスボタンを押
し、選択テキストの終端までマウスをドラッグし、そこ
でマウスボタンを離す。ワードプロセッサは、その選択
テキストを強調表示し、該当部分を明示することが好ま
しい。
は、選択テキストに対する「候補表示」コマンドを受け
取る。それに応じてワードプロセッサは、ステップ61
0において、複数の入力源を有する選択テキスト用の候
補を決定する。
は、それら候補をモニタ147に表示する。ワードプロ
セッサは、グラフィカルユーザインタフェースを介し
て、それら候補を確率順に表示することが好ましい。こ
のグラフィカルユーザインタフェースは、ユーザが表示
候補の1つを選択することを可能にする。グラフィカル
ユーザインタフェースは、サブウインドウに表示しても
良い。ユーザはそのサブウインドウを任意に移動するこ
とにより、その下に隠れたテキストを表示できる。
プロセッサにコマンドを与える。このコマンドは例え
ば、表示候補の選択、選択テキストの編集、あるいは選
択テキスト外のテキストの一部にマウスを移動しボタン
を押すことによる新たなテキスト選択等である。
サは、ユーザが表示候補の1つを選択したか否かを決定
する。ユーザが表示候補の1つを選択していれば、ステ
ップ618においてワードプロセッサは、その選択候補
で選択テキストを置換する。次にステップ624におい
てワードプロセッサは、候補の表示を中断する。そして
ステップ626においてルーチンは終了する。ステップ
626の後、ステップ602に戻ってルーチンを繰り返
すこともできる。
を選択しなければ、ステップ620を実行する。ステッ
プ620においてワードプロセッサは、ユーザが選択テ
キスト内のテキストを編集したか否かを決定する。ユー
ザが選択テキスト内のテキストを編集していれば、ステ
ップ622においてワードプロセッサは、その編集を処
理する。ワードプロセッサが編集処理を完了すると、ル
ーチンはステップ610にループし、編集後選択テキス
ト用の新しい候補を決定する。
で受け取ったユーザコマンドが選択テキストの編集コマ
ンドでなければ、ワードプロセッサはステップ624を
実行する。この場合ユーザは、選択テキストの外側でマ
ウスを押すことにより、新しい選択テキストの生成を開
始している。従ってワードプロセッサは、ステップ62
4において候補の表示を中断し、ステップ626におい
てルーチンを終了する。ここで再びステップ602に戻
ってルーチンを繰り返すこともできる。
す。このルーチンは、複数入力源を有する選択テキスト
に対して、候補を決定するための各ステップを含み、例
えば推測入力結合器が実行する。結合器は、ワードプロ
セッサ内のプログラムモジュール、オペレーティングシ
ステム内の独立プログラム、またはワードプロセッサと
インタフェースする独立プログラムである。
こで推測入力結合器は、選択テキストを解析し、入力源
別のテキスト要素に分解する。すなわち推測入力結合器
は、モニタ147に表示したテキストの各語の入力源を
格納したデータ構造を参照する。選択テキストをテキス
ト要素に分解することにより、選択テキスト用候補の決
定が管理しやすくなる。
の定義は多様である。図7〜9に示したものとは異なる
定義を用いても良い。この場合、解析ステップ702や
他のルーチンを適切に変更する必要がある。テキスト要
素は、例えば単一の語、または同一入力源を有する複数
の語からなる句である。推測入力から得た句の場合、そ
の句の中間に編集を挿入すると、元の句と編集とは異な
るテキスト要素となり得る。
は、隣接のテキスト要素とは異なる1つまたは連続した
推測入力源を有する最大単位テキストと定義し、このテ
キスト要素は、タイピングにより編集したテキストを包
むことができる。タイピングにより作成した単位テキス
トであって、推測入力源からのテキスト要素の編集では
ない場合、その単位テキストはテキスト要素と見なす。
例えば異なる推測入力源を元とする2つのテキスト要素
の間に、ユーザがタイピングによってテキストを挿入し
た場合、この挿入したテキストはそれ自体がテキスト要
素である。
は、独自の推測入力源を有するテキスト要素について、
対応する確率モデルを検索する。ステップ706におい
て推測入力結合器は、確率モデルが全て格子であるか否
かを決定する。全ての確率モデルが格子であれば、ステ
ップ708を実行する。
は、検索した全格子を連結してメタ格子を作成する。こ
のメタ格子を作成するに当たり、推測入力結合器は、タ
イプしたテキスト要素用ノードを生成する。タイプした
テキスト要素は、推測入力源を元とするテキスト要素に
含まれない。ステップ710において入力結合器は、当
業者に公知の格子探索方法を用いてメタ格子を探索し、
選択テキスト用候補リストを作成する。次にステップ7
16に移る。このステップは、ステップ706の「N
O」の分岐の後に説明する。
検索した全確率モデルが格子でなければ、推測入力結合
器はステップ712を実行する。この場合、少なくとも
1つの確率モデルがベストn候補リストである。従って
推測入力結合器は、各格子をベストn候補リストに変換
し、ステップ714を実行する。
は、ベストn候補リストとタイプしたテキスト要素とを
結合し、結合候補リストを作成する。これは、ベストn
候補のあらゆる組合せを形成することによって行う。推
測入力結合器は、各組合せについて、選択テキストに現
れる順序に候補を配置する。そして選択テキスト用候補
リストを形成する。ステップ714からステップ716
へ進む。
716へ進む時、推測入力結合器は、選択テキスト用候
補リストを作成済みである。ステップ716はオプショ
ンであり、自然言語モデルを利用できる。このステップ
において推測入力結合器は、選択テキスト用候補リスト
を自然言語モデルへ送る。
718も実行する。このステップにおいて、自然言語モ
デルは、順位付けした修正候補リストを推測入力結合器
へ返す。この修正候補リストは、自然言語モデルへ送っ
た候補リストの各候補の確率を再評価した結果を含む。
修正候補リストはさらに、選択テキストに対して自然言
語モデルが生成した新しい候補も含む。自然言語モデル
は、自然言語原理を用いて修正候補リストを生成する。
自然言語原理は、自然言語モデルが選択テキスト全体に
適用する文法等の言語的手掛かりの分析を含む。
は、表示用に上位候補を選択する。オプションのステッ
プ716および718を実行した場合、推測入力結合器
は、自然言語モデルから受け取る修正候補リストから表
示用候補を選択する。ステップ716および718を実
行しない場合、推測入力結合器は、ステップ710また
は714において作成した候補リストから表示用候補を
選択する。ステップ720の後、ステップ722におい
てルーチンは終了する。
プを示す。このルーチンにおいて推測入力結合器は、1
つの推測入力源を元とする各テキスト要素に関し、確率
モデルを検索する。ステップ802においてルーチンを
開始し、各テキスト要素を処理するループに入る。ステ
ップ802において推測入力結合器は、テキスト要素を
検索する。ステップ804において推測入力結合器は、
当該テキスト要素が推測テキスト要素であるか否かを決
定する。推測テキスト要素でなければ、ステップ806
へ進む。この場合、当該テキスト要素は、例えばキーボ
ードとマウスを用いてタイプしたテキストである。この
テキスト要素は非推測であるため、推測入力結合器は、
そのテキスト要素に100%の確率を割り当てる。次に
推測入力結合器は、ステップ818を実行する。このス
テップは後述する。
検索したテキスト要素が推測テキスト要素であれば、推
測入力結合器はステップ808を実行する。このステッ
プにおいて推測入力結合器は、そのテキスト要素が連続
した推測入力源からか否かを決定する。連続した推測入
力源からであれば、推測入力結合器はステップ810を
実行し、連続した推測入力源の最後の推測入力源が生成
した連続確率モデルを取得する。ルーチン810の後、
推測入力結合器はステップ812を実行する。ステップ
808において、ステップ802で検索したテキスト要
素が連続した推測入力源からでない場合も、ステップ8
12へ進む。
は、ユーザがキーボードおよびマウスを使用してテキス
ト要素を編集したか否かを決定する。編集していれば、
ステップ814において推測入力結合器は、対応する確
率モデルを更新する。この更新は、対応する確率モデル
が格子であれば、当該テキスト要素から削除された語に
対応するノードの削除を含む。また推測入力結合器は、
当該テキスト要素に新しい語があれば、それに対応して
ノードを追加する。確率モデルがベストn候補リストで
あれば、推測入力結合器は、削除された語を削除し、挿
入された語を追加することにより、リストの各候補を更
新する。
む。ステップ812においてユーザが当該テキスト要素
を編集していないと決定した場合も、ステップ816へ
進む。ステップ816において、推測入力結合器は、ス
テップ802で選択したテキスト要素に対し、確率モデ
ル結果を検索する。当該テキスト要素が連続した確率モ
デルから得たものであれば、検索した確率モデルはステ
ップ810で作成した連続確率モデルである。また当該
テキスト要素が編集されていれば、ステップ814で更
新した連続確率モデルである。検索した確率モデルは、
格子またはベストn候補リストである。検索した確率モ
デルは、選択テキスト要素に関する情報を含んでいれば
良いので、推測入力結合器は、当該テキスト要素を含む
大きなテキスト用確率モデルから当該確率モデルを検索
することもできる。
は、推測入力からのものでも、候補を代表する確率モデ
ルが用意されていない場合がある。この場合、当該テキ
スト要素は非推測テキスト要素と同様に扱う。すなわち
推測入力結合器は、当該テキスト要素用の既知の候補に
100%の確率を割り当てる。推測入力結合器は、ステ
ップ816の次にステップ818を実行する。
806に続いて実行する。ステップ818において推測
入力結合器は、選択テキスト内に未処理のテキスト要素
があるか否かを決定する。未処理のテキスト要素があれ
ば、ルーチンはステップ802にループし、推測入力結
合器は次のテキスト要素を取得し処理する。
要素が無ければ、推測入力結合器はオプションのステッ
プ820を実行し、自然言語モデルを利用する。このス
テップにおいて推測入力結合器は、テキスト要素用に検
索した各確率モデルを自然言語モデルへ送る。自然言語
モデルは、そのテキスト要素に自然言語原理を適用し、
結果を推測入力結合器に返す。ステップ820において
自然言語モデルは、選択テキスト全体ではなく各テキス
ト要素に対して動作するため、ステップ820は、ステ
ップ716および718の代替としてあるいは追加とし
て実行する。ステップ820の後、ルーチンはステップ
822で終了する。
プを示す。このルーチンにおいて推測入力結合器は、連
続した推測入力源を持つテキスト要素に対応する連続確
率モデルを得る。
る。このステップは、連続した推測入力源のうち、最後
の推測入力源を除く全てを順次処理するためのループを
開始する。第1回目のステップ902において、推測入
力結合器は、連続した推測入力源から第1推測入力源を
選択する。この第1推測入力源は、当該テキスト要素を
生成したユーザ入力を受け取った入力源である。
れらは第2推測入力源への入力となる。第2回目以降の
ステップ902では、推測入力結合器は、ステップ91
4において(後述する)、ステップ902で選択した推
測入力源用の総合候補リストを作成している。この総合
候補リストは、選択した推測入力源に関連する候補を含
んでおり、これら候補は次の推測入力源の入力として使
われる。ステップ904は、選択した推測入力源に関す
る全候補を処理するループを開始する。ステップ904
において推測入力結合器は、選択した入力源用候補の1
つを取り出す。
は、ステップ904で取り出した候補を次の推測入力源
へ入力として渡す。次の入力源もやはり推測入力源であ
るため、同様に推測結果を生成する。推測入力結合器
は、この推測結果を取り出す。
は、ステップ906で取り出した推測結果が格子である
か否かを決定する。格子でなければ順位付け候補リスト
であるため、ステップ912(後述する)へ進む。格子
であれば、ステップ910において推測入力結合器は、
その格子を順位付け候補リストに変換し、各候補に確率
を割り当てる。次にステップ912へ進む。
は、選択した入力源はさらに候補を持つか否かを決定す
る。さらに候補があれば、ルーチンはステップ904に
戻り、推測入力結合器は次の候補を取得する。さらに候
補がなければ、ステップ914へ進む。
は、ステップ902で選択した入力源用候補を後続の推
測入力源への入力として生成した候補リストを全て結合
し、総合候補リストを作成する。この総合候補リストを
作成するに当たり、推測入力結合器は、各候補リストの
各一意の候補に対して1つの項目を総合候補リストに準
備する。そして推測入力結合器は、総合候補リスト中の
各候補の確率を計算する。これは、各候補リストにおけ
る各候補の確率を合計して行う。推測入力結合器は、各
合計した確率を総合候補リスト中の対応する候補に割り
当てる。
は、現在次の入力源となっている入力源の後にさらに別
の入力源が存在するか否かを決定する。さらに別の入力
源が存在すれば、推測入力結合器は、ステップ902に
おいて現在次の入力源となっている入力源を選択し、前
記さらに別の入力源を次の入力源とする。この時、推測
入力結合器は、前記総合候補リストの各候補を選択した
入力源への入力とする。
がなければ、ルーチンはステップ918において終了す
る。ステップ914で作成した最新の総合候補リスト
は、連続確率モデルとなる。
施例1000における各ステップを示す論理フローチャ
ートである。このルーチンは、ユーザのテキスト選択に
応じて修正する単位テキストを自動的に調整するルーチ
ンである。
始する。このステップにおいて、ワードプロセッサ21
0は、ユーザが修正するために選択した選択テキストを
受け取る。ユーザは、マウス142を用いて語または語
群を選択することにより前記選択テキストを指定する。
あるいはユーザは、マウスを用いて単一の語からなる選
択テキストを当該語の上または近くにマウスポインタを
おくことにより指定する。ワードプロセッサ210は、
その選択テキストを推測入力結合器137へ送り、修正
候補を決定する。
137は、選択テキストを修正範囲モデルへ送り、修正
範囲を調整すべきか否かを決定する。修正範囲の調整は
例えば、選択テキストよりも良いテキスト修正候補をユ
ーザに提供できる単位テキストを特定することを含む。
例えば選択テキストは、エラーを含んだ隣接語を包含し
ていないことがある。このような隣接語のエラーは、選
択テキストと共に修正すべきものである。一般に、選択
テキストの隣接語が含むエラーは、選択テキスト内のエ
ラーに関連しているため、特定可能である。
ストは、選択テキストに1つ以上の隣接語を追加したも
のとなろう。修正範囲モデルは、修正すべきテキストと
して、単一の単位テキストではなく、複数の単位テキス
トを指定することもできる。この場合、各単位テキスト
は、テキスト修正用として優れた候補を提供する可能性
がある。
器137は、ユーザに提供すべき修正候補用の単位テキ
ストリストを修正範囲モデルから受け取る。修正範囲モ
デルが、修正範囲の調整は必要ないと判断すれば、当該
単位テキストリストは選択テキストだけを含む。修正範
囲モデルが、修正用として1つの単位テキストのみを指
定すれば、前記単位テキストリストはその1つの単位テ
キストのみを含む。ステップ1020は、単位テキスト
リスト中の各単位テキストを処理するためのループを開
始する。この単位テキストリストは、ステップ1015
において修正範囲モデルが推測入力結合器137に返し
たものである。ステップ1020において結合器137
は、処理する単位テキストを選択する。ステップ102
5において結合器137は、図7のルーチンの各ステッ
プを実行し、選択した単位テキスト用の候補を決定す
る。結合器137が図7の各ステップを実行することに
よってルーチン1025を行う際、図7の「選択テキス
ト」は、選択した単位テキストに対応する。
137は、処理すべき単位テキストがまだあるか否かを
決定する。処理すべき単位テキストがあれば、ルーチン
は「YES」の分岐をたどってステップ1020に戻
り、次の単位テキストを処理する。処理すべき単位テキ
ストが無ければ、「NO」の分岐をたどってステップ1
035へ進む。
137は、各修正候補とそれに対応する単位テキストと
をワードプロセッサ210へ送る。ワードプロセッサ2
10はこれら候補を適切な方法で表示する。修正範囲が
調整されていなければ、各候補は図6で説明したように
表示される。修正範囲が単一の単位テキストまで拡張さ
れていれば、ワードプロセッサ137は、拡張部分の追
加語を、選択テキストの強調表示色とは別の強調表示色
で表示しても良い。ワードプロセッサは、その単位テキ
ストに対する候補を、図6を参照して説明したグラフィ
カルユーザインタフェースによって提示できる。
正用に指定した場合、ワードプロセッサ210は、候補
メニューをユーザに提示し、各候補に対応する単位テキ
ストを示すことができる。
ーザインタフェースを介してユーザに修正候補を提示す
ると、ルーチンはステップ1040において終了する。
ワードプロセッサ210は、候補に対するユーザからの
応答を、図6を参照して説明したように処理する。
逸脱することなく、他の実施例も可能である。従って本
発明の範囲は、前記説明に依ることなく請求の範囲によ
って定められる。
ク図である。
ジュールの概略を示すブロック図である。
である。
の実施例を示すブロック図である。
示すブロック図である。
の各ステップを示すフローチャートである。
するルーチンの各ステップを示すフローチャートであ
る。
モデルを検索するためのルーチンの各ステップを示すフ
ローチャートである。
ステップを示すフローチャートである。
んだオプションの元データ処理ルーチンにおける各ステ
ップを示すフローチャートである。
本発明の実施例動作を示すブロック図である。
Claims (27)
- 【請求項1】 入力源を異にする複数のテキスト要素で
構成した選択テキストを受け取とるステップと、 前記テキスト要素の少なくとも1つが、推測入力源また
は連続した推測入力源からの推測テキスト要素であり、 前記選択テキスト用の候補を表示するコマンドを受け取
るステップと、 前記選択テキストを前記テキスト要素に分解するステッ
プと、 前記推測テキスト要素に対応する推測入力源または連続
した推測入力源から前記推測テキスト要素に対応する確
率モデルを取り出すステップと、 前記確率モデルと他のテキスト要素とを結合して前記選
択テキスト用候補リストを作成するステップと、 前記選択テキスト用候補リストを表示装置に表示するス
テップとを有することを特徴とするコンピュータで実施
するテキスト修正方法。 - 【請求項2】 前記表示した候補の1つを選択するユー
ザコマンドを受け取るステップと、 前記選択テキストを前記選択した候補で置き換えるステ
ップとをさらに有することを特徴とする請求項1に記載
の方法。 - 【請求項3】 前記選択テキストに対する編集を受け取
るステップと、 編集した前記選択テキスト用の修正候補リストを作成す
るステップと、 前記編集した選択テキスト用修正候補リストを表示する
ステップとをさらに有することを特徴とする請求項1に
記載の方法。 - 【請求項4】 前記推測テキスト要素の1つに対する編
集を受け取るステップと、 編集した前記推測テキスト要素に対応する推測入力源ま
たは連続した推測入力源から当該編集した推測テキスト
要素用の改訂確率モデルを取り出すステップと、 前記改訂確率モデルと前記選択テキストに対応する他の
確率モデルとを結合して、編集した前記選択テキスト用
の修正候補リストを作成するステップと、 前記編集した選択テキスト用修正候補リストを表示する
ステップとをさらに有することを特徴とする請求項1に
記載の方法。 - 【請求項5】 前記選択テキストが、ワードプロセッサ
とスプレッドシートとブラウザと電子メールプログラム
と音楽編曲プログラムとCADプログラムとプレゼンテ
ーションプログラムとオペレーティングシステムとから
なるグループから選択した1アプリケーションのファイ
ル内におけるテキストの一部を有することを特徴とする
請求項1に記載の方法。 - 【請求項6】 前記選択テキスト用候補を表示するステ
ップが、 前記選択テキスト用候補を確率順に並べるステップと、 前記候補を前記確率順で表示装置に表示するステップと
をさらに有することを特徴とする請求項1に記載の方
法。 - 【請求項7】 前記候補を前記確率順で表示するステッ
プが、 所定数の上位候補を選択するステップと、 前記選択した上位候補を表示装置に表示するステップと
をさらに有することを特徴とする請求項6に記載の方
法。 - 【請求項8】 前記選択テキストが複数の推測テキスト
要素からなり、前記確率モデルを結合するステップが、 各推測テキスト要素用の確率モデルを結合して、前記選
択テキスト用の中間候補リストを作成するステップと、 前記中間候補リストを自然言語モデルへ送るステップ
と、 前記自然言語モデルは、自然言語原理を前記選択テキス
ト全体に適用することによって前記中間候補リストを再
評価し、前記選択テキスト用の修正候補リストを作成
し、該修正候補リストを提供するステップと、 前記修正候補リストを前記自然言語モデルから受け取
り、それを前記選択テキスト用の候補リストとして表示
するステップとをさらに有することを特徴とする請求項
1に記載の方法。 - 【請求項9】 前記修正候補リストが、前記自然言語モ
デルが作成した追加候補であって前記自然言語モデルへ
送った中間候補リストには無い追加候補を含むことを特
徴とする請求項8に記載の方法。 - 【請求項10】 1つ以上の推測テキスト要素用に検索
した確率モデルを自然言語モデルへ送り、該確率モデル
を自然言語原理に基づく再評価に利用するステップをさ
らに有することを特徴とする請求項8に記載の方法。 - 【請求項11】 各推測テキスト要素用の確率モデルを
自然言語モデルへ送り、該確率モデルを修正候補リスト
作成に利用するステップをさらに有することを特徴とす
る請求項8に記載の方法。 - 【請求項12】 前記選択テキストが複数の推測テキス
ト要素からなり、前記テキスト要素用の確率モデルが格
子からなり、 前記確率モデルを結合して前記選択テキスト用の候補リ
ストを作成するステップが、 前記格子を連結して、非推測入力源からの全テキスト要
素に関する情報をも含んだメタ格子を作成するステップ
と、 前記メタ格子から前記選択テキスト用の候補リストを作
成するステップとをさらに有することを特徴とする請求
項1に記載の方法。 - 【請求項13】 前記選択テキストが複数の推測テキス
ト要素からなり、前記確率モデルの1つがベストn候補
からなり、他の確率モデルが格子からなり、 前記確率モデルを結合して前記選択テキスト用の候補リ
ストを作成するステップが、 前記格子に対応するベストn候補リストを作成するステ
ップと、 前記ベストn候補リストを結合して前記選択テキスト用
候補リストを作成するステップとをさらに有することを
特徴とする請求項1に記載の方法。 - 【請求項14】 テキスト要素に対応する確率モデルを
推測入力源から取り出す前記ステップが、 前記テキスト要素は連続した推測入力源からのものか否
かを決定するステップと、 前記テキスト要素が連続した推測入力源からのものであ
れば、各推測入力源からの確率モデルを結合して連続確
率モデルを作成するステップと、 前記連続確率モデルを前記テキスト要素用確率モデルと
して取り出すステップとをさらに有することを特徴とす
る請求項1に記載の方法。 - 【請求項15】 前記推測テキスト要素に対応する推測
入力源または連続した推測入力源から、前記推測テキス
ト要素に対応する確率モデルを取り出すステップが、 連続した推測入力源における第1推測入力源へのユーザ
入力を受け取るステップと、 前記第1推測入力源が生成する複数の候補からなる推測
結果を選択するステップと、 前記第1推測入力源が生成した推測結果の各候補を、前
記連続した推測入力源における第2推測入力源への入力
として用いることにより、前記第2推測入力源の複数の
推測結果を生成するステップと、 前記第2推測入力源の推測結果のいずれかがベストn候
補リストでなければ、その推測結果をベストn候補リス
トに変換するステップと、 前記第2推測入力源の推測結果を結合して前記第2推測
入力源の総合候補リストを作成するステップとをさらに
有することを特徴とする請求項1に記載の方法。 - 【請求項16】 前記第2推測入力源の推測結果を結合
して前記第2推測入力源の総合候補リストを作成するス
テップが、 前記第2推測入力源の複数推測結果の各一意の候補に対
して1つの項目を前記総合候補リスト内に生成するステ
ップと、 前記総合候補リスト内の各候補の確率を、前記第2推測
入力源の複数推測結果において当該候補に割り当てた全
確率を合計して計算するステップと、 前記計算した確率を対応する候補に割り当てるステップ
とをさらに有することを特徴とする請求項15に記載の
方法。 - 【請求項17】 請求項1記載の方法を実行するための
コンピュータ実行命令を有するコンピュータ読取可能媒
体。 - 【請求項18】 請求項1記載の方法を実行するための
コンピュータ。 - 【請求項19】 請求項16記載の方法を実行するため
のコンピュータ実行命令を有するコンピュータ読取可能
媒体。 - 【請求項20】 請求項16記載の方法を実行するため
のコンピュータ。 - 【請求項21】 ユーザから選択テキストを受け取るス
テップと、 前記選択テキスト用の候補を表示するコマンドを受け取
るステップと、 前記選択テキストを修正範囲モデルへ送って修正範囲を
調整すべきか否かを決定するステップと、 前記選択テキストと少なくとも1つの隣接語とを含む単
位テキストを、前記修正範囲モデルから受け取るステッ
プと、 前記単位テキスト用の候補リストを作成するステップ
と、 前記単位テキスト用候補リストを表示装置に表示するス
テップとを有することを特徴とするテキスト修正をコン
ピュータで実施する方法。 - 【請求項22】 前記表示した候補の1つを選択するユ
ーザコマンドを受け取るステップと、 前記単位テキストを前記選択した候補で置き換えるステ
ップとをさらに有することを特徴とする請求項21に記
載の方法。 - 【請求項23】 前記隣接語が、前記選択テキスト内の
1語を不正確にしたエラーに起因して、不正確であるこ
とを特徴とする請求項21に記載の方法。 - 【請求項24】 前記修正範囲モデルが、自然言語モデ
ルと類似エラーモデルと音声モデルと手書きモデルと映
像モデルとからなるグループから選択した判断基準を含
むことを特徴とする請求項21に記載の方法。 - 【請求項25】 前記単位テキスト用の候補リストを作
成するステップが、 前記単位テキストを、入力源別のテキスト要素に分解す
るステップと、 前記テキスト要素の1つが推測テキスト要素であるか否
かを決定するステップと、 前記テキスト要素の1つが推測テキスト要素であれば、
その推測テキスト要素用の確率モデルを検索するステッ
プと、 前記確率モデルと他のテキスト要素とを結合して前記単
位テキスト用候補リストを作成するステップとをさらに
有することを特徴とする請求項21に記載の方法。 - 【請求項26】 請求項21記載の方法を実行するため
のコンピュータ実行命令を有するコンピュータ読取可能
媒体。 - 【請求項27】 請求項25記載の方法を実行するため
のコンピュータ。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/412,822 US6789231B1 (en) | 1999-10-05 | 1999-10-05 | Method and system for providing alternatives for text derived from stochastic input sources |
US09/412822 | 1999-10-05 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001249920A true JP2001249920A (ja) | 2001-09-14 |
Family
ID=23634641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000305651A Ceased JP2001249920A (ja) | 1999-10-05 | 2000-10-05 | 推測入力源からのテキストに対して候補を提供する方法およびシステム |
Country Status (5)
Country | Link |
---|---|
US (2) | US6789231B1 (ja) |
EP (1) | EP1091303B1 (ja) |
JP (1) | JP2001249920A (ja) |
CN (1) | CN1290901A (ja) |
DE (1) | DE60032846T2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002156996A (ja) * | 2000-11-16 | 2002-05-31 | Toshiba Corp | 音声認識装置、認識結果修正方法及び記録媒体 |
JP2007528037A (ja) * | 2003-06-02 | 2007-10-04 | インターナショナル・ビジネス・マシーンズ・コーポレーション | ハンドヘルド携帯装置のための音声入力メソッド・エディタのアーキテクチャ |
JP2008537806A (ja) * | 2005-02-08 | 2008-09-25 | テジック コミュニケーションズ インク | マニュアルで入力されたあいまいなテキスト入力を音声入力を使用して解決する方法および装置 |
WO2008150003A1 (ja) * | 2007-06-06 | 2008-12-11 | Nec Corporation | キーワード抽出モデル学習システム、方法およびプログラム |
JP2015056154A (ja) * | 2013-09-13 | 2015-03-23 | 独立行政法人情報通信研究機構 | テキスト編集装置及びプログラム |
JP2022169992A (ja) * | 2021-04-28 | 2022-11-10 | デロイトトーマツファイナンシャルアドバイザリー合同会社 | 情報処理装置、情報処理方法、端末プログラム、サーバプログラム及び契約書修正支援システム |
JP2023515897A (ja) * | 2020-04-20 | 2023-04-14 | エーアイ スピーチ カンパニー リミテッド | 音声対話の訂正方法及び装置 |
Families Citing this family (264)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8938688B2 (en) | 1998-12-04 | 2015-01-20 | Nuance Communications, Inc. | Contextual prediction of user words and user actions |
US7712053B2 (en) | 1998-12-04 | 2010-05-04 | Tegic Communications, Inc. | Explicit character filtering of ambiguous text entry |
US6789231B1 (en) * | 1999-10-05 | 2004-09-07 | Microsoft Corporation | Method and system for providing alternatives for text derived from stochastic input sources |
US6947885B2 (en) | 2000-01-18 | 2005-09-20 | At&T Corp. | Probabilistic model for natural language generation |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US7213027B1 (en) | 2000-03-21 | 2007-05-01 | Aol Llc | System and method for the transformation and canonicalization of semantically structured data |
US7243069B2 (en) * | 2000-07-28 | 2007-07-10 | International Business Machines Corporation | Speech recognition by automated context creation |
US6836759B1 (en) * | 2000-08-22 | 2004-12-28 | Microsoft Corporation | Method and system of handling the selection of alternates for recognized words |
US7254773B2 (en) * | 2000-12-29 | 2007-08-07 | International Business Machines Corporation | Automated spell analysis |
JP2002358336A (ja) * | 2001-06-01 | 2002-12-13 | Pioneer Electronic Corp | 設計情報公開システム、設計情報公開方法および記録媒体 |
US20070265834A1 (en) * | 2001-09-06 | 2007-11-15 | Einat Melnick | In-context analysis |
US20030125929A1 (en) * | 2001-12-10 | 2003-07-03 | Thomas Bergstraesser | Services for context-sensitive flagging of information in natural language text and central management of metadata relating that information over a computer network |
US7890639B1 (en) | 2002-01-30 | 2011-02-15 | Novell, Inc. | Method and apparatus for controlling access to portal content from outside the portal |
US7412374B1 (en) * | 2002-01-30 | 2008-08-12 | Novell, Inc. | Method to dynamically determine a user's language for a network |
US7987421B1 (en) | 2002-01-30 | 2011-07-26 | Boyd H Timothy | Method and apparatus to dynamically provide web content resources in a portal |
DE10204924A1 (de) * | 2002-02-07 | 2003-08-21 | Philips Intellectual Property | Verfahren und Vorrichtung zur schnellen mustererkennungsunterstützten Transkription gesprochener und schriftlicher Äußerungen |
EP1376394A1 (en) * | 2002-06-20 | 2004-01-02 | Sun Microsystems, Inc. | Methods and systems for processing text elements |
US7236977B1 (en) | 2002-09-20 | 2007-06-26 | Novell, Inc. | Method for dynamically distributing items for changes based on group membership |
US7660843B1 (en) | 2003-01-21 | 2010-02-09 | Novell, Inc. | Method and apparatus for dynamically delivering a gadget |
US7200812B2 (en) | 2003-07-14 | 2007-04-03 | Intel Corporation | Method, apparatus and system for enabling users to selectively greek documents |
KR100989011B1 (ko) * | 2003-08-21 | 2010-10-20 | 마이크로소프트 코포레이션 | 전자 잉크를 분석하기 위한 애플리케이션 프로그래밍 인터페이스를 포함하는 컴퓨터 판독가능 기록 매체, 전자 잉크 분석 방법 및 분석 콘텍스트 대상 생성 방법 |
US7634720B2 (en) * | 2003-10-24 | 2009-12-15 | Microsoft Corporation | System and method for providing context to an input method |
US8095364B2 (en) * | 2004-06-02 | 2012-01-10 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
US20070299664A1 (en) * | 2004-09-30 | 2007-12-27 | Koninklijke Philips Electronics, N.V. | Automatic Text Correction |
US20060285749A1 (en) * | 2005-06-17 | 2006-12-21 | Microsoft Corporation | User-initiated reporting of handwriting recognition errors over the internet |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7707478B2 (en) * | 2005-09-29 | 2010-04-27 | Dolby Laboratories Licensing Corporation | Error correction in packet-based communication networks using validation sets |
CN1766923B (zh) * | 2005-11-23 | 2010-05-05 | 倚天资讯股份有限公司 | 快速选项自动提供方法 |
US7831423B2 (en) * | 2006-05-25 | 2010-11-09 | Multimodal Technologies, Inc. | Replacing text representing a concept with an alternate written form of the concept |
WO2007143003A2 (en) * | 2006-05-31 | 2007-12-13 | Zcubes, Inc. | A web-based experience editor in a recursive browser system and uses thereof |
US20070283258A1 (en) * | 2006-05-31 | 2007-12-06 | Joseph Pally | User-implemented handwritten content in a recursive browser system |
US7817857B2 (en) * | 2006-05-31 | 2010-10-19 | Microsoft Corporation | Combiner for improving handwriting recognition |
US8521510B2 (en) * | 2006-08-31 | 2013-08-27 | At&T Intellectual Property Ii, L.P. | Method and system for providing an automated web transcription service |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US20080255835A1 (en) * | 2007-04-10 | 2008-10-16 | Microsoft Corporation | User directed adaptation of spoken language grammer |
US8504349B2 (en) * | 2007-06-18 | 2013-08-06 | Microsoft Corporation | Text prediction with partial selection in a variety of domains |
US20090037171A1 (en) * | 2007-08-03 | 2009-02-05 | Mcfarland Tim J | Real-time voice transcription system |
CN100592249C (zh) * | 2007-09-21 | 2010-02-24 | 上海汉翔信息技术有限公司 | 快速输入相关词的方法 |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US9454516B2 (en) * | 2008-01-14 | 2016-09-27 | Blackberry Limited | Method and handheld electronic device employing a touch screen for ambiguous word review or correction |
US8010465B2 (en) | 2008-02-26 | 2011-08-30 | Microsoft Corporation | Predicting candidates using input scopes |
US8289283B2 (en) | 2008-03-04 | 2012-10-16 | Apple Inc. | Language input interface on a device |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8862989B2 (en) * | 2008-06-25 | 2014-10-14 | Microsoft Corporation | Extensible input method editor dictionary |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US20100082328A1 (en) * | 2008-09-29 | 2010-04-01 | Apple Inc. | Systems and methods for speech preprocessing in text to speech synthesis |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US20120105486A1 (en) * | 2009-04-09 | 2012-05-03 | Dynavox Systems Llc | Calibration free, motion tolerent eye-gaze direction detector with contextually aware computer interaction and communication methods |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
JP4810594B2 (ja) * | 2009-06-24 | 2011-11-09 | 京セラ株式会社 | 携帯端末、言語設定プログラムおよび言語設定方法 |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US8365059B2 (en) * | 2009-11-03 | 2013-01-29 | Oto Technologies, Llc | E-reader semantic text manipulation |
US8379801B2 (en) | 2009-11-24 | 2013-02-19 | Sorenson Communications, Inc. | Methods and systems related to text caption error correction |
EP3091535B1 (en) | 2009-12-23 | 2023-10-11 | Google LLC | Multi-modal input on an electronic device |
US11416214B2 (en) | 2009-12-23 | 2022-08-16 | Google Llc | Multi-modal input on an electronic device |
US8494852B2 (en) | 2010-01-05 | 2013-07-23 | Google Inc. | Word-level correction of speech input |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
DE202011111062U1 (de) | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
US8423351B2 (en) * | 2010-02-19 | 2013-04-16 | Google Inc. | Speech correction for typed input |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8768686B2 (en) | 2010-05-13 | 2014-07-01 | International Business Machines Corporation | Machine translation with side information |
CN102298582B (zh) * | 2010-06-23 | 2016-09-21 | 商业对象软件有限公司 | 数据搜索和匹配方法和系统 |
US8719014B2 (en) * | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US8352245B1 (en) | 2010-12-30 | 2013-01-08 | Google Inc. | Adjusting language models |
US8296142B2 (en) | 2011-01-21 | 2012-10-23 | Google Inc. | Speech recognition using dock context |
US20120215520A1 (en) * | 2011-02-23 | 2012-08-23 | Davis Janel R | Translation System |
US9037459B2 (en) * | 2011-03-14 | 2015-05-19 | Apple Inc. | Selection of text prediction results by an accessory |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
KR20130080515A (ko) * | 2012-01-05 | 2013-07-15 | 삼성전자주식회사 | 디스플레이 장치 및 그 디스플레이 장치에 표시된 문자 편집 방법. |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US8818791B2 (en) | 2012-04-30 | 2014-08-26 | Google Inc. | Techniques for assisting a user in the textual input of names of entities to a user device in multiple different languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9224386B1 (en) * | 2012-06-22 | 2015-12-29 | Amazon Technologies, Inc. | Discriminative language model training using a confusion matrix |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9292487B1 (en) | 2012-08-16 | 2016-03-22 | Amazon Technologies, Inc. | Discriminative language model pruning |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8498864B1 (en) | 2012-09-27 | 2013-07-30 | Google Inc. | Methods and systems for predicting a text |
US9021380B2 (en) | 2012-10-05 | 2015-04-28 | Google Inc. | Incremental multi-touch gesture recognition |
US8782549B2 (en) | 2012-10-05 | 2014-07-15 | Google Inc. | Incremental feature-based gesture-keyboard decoding |
US8701032B1 (en) | 2012-10-16 | 2014-04-15 | Google Inc. | Incremental multi-word recognition |
US8843845B2 (en) | 2012-10-16 | 2014-09-23 | Google Inc. | Multi-gesture text input prediction |
US8850350B2 (en) | 2012-10-16 | 2014-09-30 | Google Inc. | Partial gesture text entry |
US8819574B2 (en) | 2012-10-22 | 2014-08-26 | Google Inc. | Space prediction for text input |
JP2014099052A (ja) * | 2012-11-14 | 2014-05-29 | International Business Maschines Corporation | テキストを編集する装置、データ処理方法およびプログラム |
US8832589B2 (en) | 2013-01-15 | 2014-09-09 | Google Inc. | Touch keyboard using language and spatial models |
KR20240132105A (ko) | 2013-02-07 | 2024-09-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9477753B2 (en) * | 2013-03-12 | 2016-10-25 | International Business Machines Corporation | Classifier-based system combination for spoken term detection |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
US9081500B2 (en) | 2013-05-03 | 2015-07-14 | Google Inc. | Alternative hypothesis error correction for gesture typing |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101772152B1 (ko) | 2013-06-09 | 2017-08-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
EP3008964B1 (en) | 2013-06-13 | 2019-09-25 | Apple Inc. | System and method for emergency calls initiated by voice command |
KR20150007889A (ko) * | 2013-07-12 | 2015-01-21 | 삼성전자주식회사 | 어플리케이션 운용 방법 및 그 전자 장치 |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
CN104424168A (zh) * | 2013-09-11 | 2015-03-18 | 华为技术有限公司 | 一种文本编辑方法、装置及服务器 |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US20150178289A1 (en) * | 2013-12-20 | 2015-06-25 | Google Inc. | Identifying Semantically-Meaningful Text Selections |
US9842592B2 (en) | 2014-02-12 | 2017-12-12 | Google Inc. | Language models using non-linguistic context |
US9412365B2 (en) | 2014-03-24 | 2016-08-09 | Google Inc. | Enhanced maximum entropy models |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
CN110797019B (zh) | 2014-05-30 | 2023-08-29 | 苹果公司 | 多命令单一话语输入方法 |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
CN105374356B (zh) * | 2014-08-29 | 2019-07-30 | 株式会社理光 | 语音识别方法、语音评分方法、语音识别系统及语音评分系统 |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US10134394B2 (en) | 2015-03-20 | 2018-11-20 | Google Llc | Speech recognition using log-linear model |
US10726197B2 (en) * | 2015-03-26 | 2020-07-28 | Lenovo (Singapore) Pte. Ltd. | Text correction using a second input |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
EP3089159B1 (en) | 2015-04-28 | 2019-08-28 | Google LLC | Correcting voice recognition using selective re-speak |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10409919B2 (en) * | 2015-09-28 | 2019-09-10 | Konica Minolta Laboratory U.S.A., Inc. | Language translation for display device |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9978367B2 (en) | 2016-03-16 | 2018-05-22 | Google Llc | Determining dialog states for language models |
CN105824795A (zh) * | 2016-04-19 | 2016-08-03 | 智者四海(北京)技术有限公司 | 文本中的错误信息的显示方法及装置 |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10832664B2 (en) | 2016-08-19 | 2020-11-10 | Google Llc | Automated speech recognition using language models that selectively use domain-specific model components |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US10311860B2 (en) | 2017-02-14 | 2019-06-04 | Google Llc | Language model biasing system |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
CN110555203B (zh) * | 2018-05-31 | 2023-05-30 | 北京百度网讯科技有限公司 | 文本复述方法、装置、服务器及存储介质 |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US11076039B2 (en) | 2018-06-03 | 2021-07-27 | Apple Inc. | Accelerated task performance |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11615789B2 (en) * | 2019-09-19 | 2023-03-28 | Honeywell International Inc. | Systems and methods to verify values input via optical character recognition and speech recognition |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
US11270104B2 (en) | 2020-01-13 | 2022-03-08 | Apple Inc. | Spatial and temporal sequence-to-sequence modeling for handwriting recognition |
US11482223B2 (en) * | 2020-03-31 | 2022-10-25 | Pricewaterhousecoopers Llp | Systems and methods for automatically determining utterances, entities, and intents based on natural language inputs |
US12079584B2 (en) | 2020-03-31 | 2024-09-03 | PwC Product Sales LLC | Systems and methods for conversation modeling |
US11580112B2 (en) | 2020-03-31 | 2023-02-14 | Pricewaterhousecoopers Llp | Systems and methods for automatically determining utterances, entities, and intents based on natural language inputs |
US11562731B2 (en) | 2020-08-19 | 2023-01-24 | Sorenson Ip Holdings, Llc | Word replacement in transcriptions |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3232705B2 (ja) | 1991-12-05 | 2001-11-26 | ソニー株式会社 | 光学記録ディスクからの樹脂材料の再生方法 |
US5293584A (en) * | 1992-05-21 | 1994-03-08 | International Business Machines Corporation | Speech recognition system for natural language translation |
US5502774A (en) | 1992-06-09 | 1996-03-26 | International Business Machines Corporation | Automatic recognition of a consistent message using multiple complimentary sources of information |
US5481278A (en) * | 1992-10-21 | 1996-01-02 | Sharp Kabushiki Kaisha | Information processing apparatus |
US5659771A (en) * | 1995-05-19 | 1997-08-19 | Mitsubishi Electric Information Technology Center America, Inc. | System for spelling correction in which the context of a target word in a sentence is utilized to determine which of several possible words was intended |
US5680511A (en) | 1995-06-07 | 1997-10-21 | Dragon Systems, Inc. | Systems and methods for word recognition |
US5852801A (en) | 1995-10-04 | 1998-12-22 | Apple Computer, Inc. | Method and apparatus for automatically invoking a new word module for unrecognized user input |
US6161083A (en) * | 1996-05-02 | 2000-12-12 | Sony Corporation | Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation |
US5864805A (en) | 1996-12-20 | 1999-01-26 | International Business Machines Corporation | Method and apparatus for error correction in a continuous dictation system |
US6182028B1 (en) * | 1997-11-07 | 2001-01-30 | Motorola, Inc. | Method, device and system for part-of-speech disambiguation |
US6195637B1 (en) * | 1998-03-25 | 2001-02-27 | International Business Machines Corp. | Marking and deferring correction of misrecognition errors |
US6424983B1 (en) * | 1998-05-26 | 2002-07-23 | Global Information Research And Technologies, Llc | Spelling and grammar checking system |
US6457031B1 (en) * | 1998-09-02 | 2002-09-24 | International Business Machines Corp. | Method of marking previously dictated text for deferred correction in a speech recognition proofreader |
US6789231B1 (en) * | 1999-10-05 | 2004-09-07 | Microsoft Corporation | Method and system for providing alternatives for text derived from stochastic input sources |
-
1999
- 1999-10-05 US US09/412,822 patent/US6789231B1/en not_active Expired - Lifetime
-
2000
- 2000-10-03 DE DE60032846T patent/DE60032846T2/de not_active Expired - Lifetime
- 2000-10-03 EP EP00308681A patent/EP1091303B1/en not_active Expired - Lifetime
- 2000-10-05 JP JP2000305651A patent/JP2001249920A/ja not_active Ceased
- 2000-10-05 CN CN00130564A patent/CN1290901A/zh active Pending
-
2004
- 2004-07-29 US US10/902,527 patent/US7546529B2/en not_active Expired - Fee Related
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002156996A (ja) * | 2000-11-16 | 2002-05-31 | Toshiba Corp | 音声認識装置、認識結果修正方法及び記録媒体 |
JP4509361B2 (ja) * | 2000-11-16 | 2010-07-21 | 株式会社東芝 | 音声認識装置、認識結果修正方法及び記録媒体 |
JP2007528037A (ja) * | 2003-06-02 | 2007-10-04 | インターナショナル・ビジネス・マシーンズ・コーポレーション | ハンドヘルド携帯装置のための音声入力メソッド・エディタのアーキテクチャ |
JP2008537806A (ja) * | 2005-02-08 | 2008-09-25 | テジック コミュニケーションズ インク | マニュアルで入力されたあいまいなテキスト入力を音声入力を使用して解決する方法および装置 |
JP4829901B2 (ja) * | 2005-02-08 | 2011-12-07 | テジック コミュニケーションズ インク | マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置 |
WO2008150003A1 (ja) * | 2007-06-06 | 2008-12-11 | Nec Corporation | キーワード抽出モデル学習システム、方法およびプログラム |
JP5360414B2 (ja) * | 2007-06-06 | 2013-12-04 | 日本電気株式会社 | キーワード抽出モデル学習システム、方法およびプログラム |
JP2015056154A (ja) * | 2013-09-13 | 2015-03-23 | 独立行政法人情報通信研究機構 | テキスト編集装置及びプログラム |
JP2023515897A (ja) * | 2020-04-20 | 2023-04-14 | エーアイ スピーチ カンパニー リミテッド | 音声対話の訂正方法及び装置 |
JP7413568B2 (ja) | 2020-04-20 | 2024-01-15 | エーアイ スピーチ カンパニー リミテッド | 音声対話の訂正方法及び装置 |
JP2022169992A (ja) * | 2021-04-28 | 2022-11-10 | デロイトトーマツファイナンシャルアドバイザリー合同会社 | 情報処理装置、情報処理方法、端末プログラム、サーバプログラム及び契約書修正支援システム |
Also Published As
Publication number | Publication date |
---|---|
CN1290901A (zh) | 2001-04-11 |
EP1091303A3 (en) | 2003-02-05 |
US7546529B2 (en) | 2009-06-09 |
US6789231B1 (en) | 2004-09-07 |
US20050005240A1 (en) | 2005-01-06 |
DE60032846D1 (de) | 2007-02-22 |
DE60032846T2 (de) | 2007-10-18 |
EP1091303A2 (en) | 2001-04-11 |
EP1091303B1 (en) | 2007-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2001249920A (ja) | 推測入力源からのテキストに対して候補を提供する方法およびシステム | |
US7912700B2 (en) | Context based word prediction | |
US7149970B1 (en) | Method and system for filtering and selecting from a candidate list generated by a stochastic input method | |
US5802504A (en) | Text preparing system using knowledge base and method therefor | |
US6356866B1 (en) | Method for converting a phonetic character string into the text of an Asian language | |
KR100650427B1 (ko) | 자연어 인식 애플리케이션 구축을 위한 통합 개발 툴 | |
JP3813911B2 (ja) | 機械翻訳システム、機械翻訳方法及び機械翻訳プログラム | |
US20130073286A1 (en) | Consolidating Speech Recognition Results | |
US20060123358A1 (en) | Method and system for generating input grammars for multi-modal dialog systems | |
JP2008537260A (ja) | ユーザ入力の予測変換 | |
JP2016218995A (ja) | 機械翻訳方法、機械翻訳装置及びプログラム | |
JP4502615B2 (ja) | 類似文検索装置、類似文検索方法、およびプログラム | |
WO2021129074A1 (zh) | 用于处理程序代码中的变量的引用的方法和系统 | |
JPH06266779A (ja) | 制御装置 | |
CN112966479A (zh) | 基于语言模型的辅助写作方法、装置和系统 | |
JP2003271389A (ja) | 自然言語によるソフトウェア・オブジェクトの操作方法及びそのためのプログラム | |
EP0720105B1 (en) | System and method to review the processing of data according to user entered corrections | |
US20240311585A1 (en) | Providing a well-formed alternate phrase as a suggestion in lieu of a not well-formed phrase | |
JP4043176B2 (ja) | 自然言語処理装置 | |
JP2000330984A (ja) | 文書処理装置及び方法 | |
JP2001014304A (ja) | 文書作成装置、変換処理方法及び変換処理プログラムを記録した記録媒体 | |
JPH0969104A (ja) | 仮名漢字変換装置および仮名漢字変換方法 | |
JP3051747B2 (ja) | 機械翻訳方法及び機械翻訳システム | |
JP5481094B2 (ja) | 文字列入力装置、文字列入力方法、および、プログラム | |
JP2004264960A (ja) | 用例ベースの文変換装置、およびコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20050517 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050517 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050517 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071002 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090430 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091023 |
|
A045 | Written measure of dismissal of application [lapsed due to lack of payment] |
Free format text: JAPANESE INTERMEDIATE CODE: A045 Effective date: 20100219 |