JP2001249920A - 推測入力源からのテキストに対して候補を提供する方法およびシステム - Google Patents

推測入力源からのテキストに対して候補を提供する方法およびシステム

Info

Publication number
JP2001249920A
JP2001249920A JP2000305651A JP2000305651A JP2001249920A JP 2001249920 A JP2001249920 A JP 2001249920A JP 2000305651 A JP2000305651 A JP 2000305651A JP 2000305651 A JP2000305651 A JP 2000305651A JP 2001249920 A JP2001249920 A JP 2001249920A
Authority
JP
Japan
Prior art keywords
text
candidate list
input
inferred
guess
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2000305651A
Other languages
English (en)
Inventor
Jeffrey C Reynar
スィー. レイナー ジェフリー
Erick Rucker
ラッカー エリック
Paul Kyong Hwan Kim
キョン ホワン キム ポール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2001249920A publication Critical patent/JP2001249920A/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 選択テキストに対して候補リストを提供する
方法を提供する。 【解決手段】 選択テキスト用の候補を決定するに当た
り、推測入力結合器は、選択テキストを、入力源ごとの
テキスト要素に分解する。推測入力結合器は、各テキス
ト要素の候補を含んだ確率モデルを検索する。テキスト
要素が連続した推測入力源の処理結果であれば、推測入
力結合器は、全入力源の結果の確率を正確に反映した確
率モデルを取得する。推測入力結合器は、検索した確率
モデルを結合することにより、選択テキスト用の候補リ
ストを作成する。推測入力結合器は、選択テキスト全体
に自然言語原理を適用することにより、候補リストを修
正することができる。選択テキスト用候補リストは、ユ
ーザに提示する。ユーザが候補の1つを選ぶと、ワード
プロセッサはその選んだ候補で選択テキストを置換す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コンピュータにテ
キストを入力するための方法に関する。さらに詳しく
は、複数の推測入力源からの選択テキストに対して、複
数の候補を提供することに関する。
【0002】
【従来の技術】コンピュータのユーザは、キーボードと
マウスを使ってワードプロセッサにテキストを入力して
きた。最近のワードプロセッサは改良が進み、ユーザは
音声や手書き等の入力方法を介しても、テキストの入力
ができる。コンピュータは、このような入力を必ずしも
正確に解釈できないが、その入力に対する候補テキスト
のリストを作成できる。さらにコンピュータは、ユーザ
の意図に対する確率を各候補に付加できる。このように
確率を付加できる入力を「推測入力」と呼ぶ。一方、タ
イプしたテキストのように正確に決定できる入力は、
「非推測入力」と呼ぶ。
【0003】
【発明が解決しようとする課題】一般に、推測入力源か
らワードプロセッサへ入力したテキストは、ユーザが編
集しないと意図したテキストにならない。この編集作業
は、ユーザが推測テキスト内でテキストを選択し、その
選択テキストに対応する候補を要求することで簡単に行
われてきた。コンピュータは、候補の要求を受けると、
グラフィカルユーザインタフェースを介して、選択テキ
ストに対する候補をユーザに提供する。ユーザが候補の
1つを選ぶと、コンピュータはその選択候補で選択テキ
ストを置き換える。
【0004】例えばユーザが、音声等の推測入力源を用
い、ワードプロセッサにテキストを入力し、そのテキス
トを編集する場合を考える。例えばユーザは、テキスト
中の1語を置換するため、キーボードを使って新しい語
をタイプし、コンピュータに入力する。現在のワードプ
ロセッサは、タイプしたテキストを、選択テキスト用候
補の中に挿入しない。従って、推測入力源からのテキス
トを編集した場合に、この編集したテキストにも候補を
提供する手段が必要である。
【0005】選択テキストが複数の推測入力源を元とす
る場合、そのような選択テキストに対してユーザが候補
を要求すると問題が起きる。例えば選択テキストが、手
書き入力に基づく語と音声入力に基づく語とを含み、こ
の選択テキストに対してユーザが候補を要求するような
場合である。現在のワードプロセッサは、このような選
択テキストに対して、意味のある候補を提供できない。
従って、複数の推測入力源に基づく選択テキストにも候
補を提供する手段が必要である。
【0006】入力システム(IME)もまた、推測デー
タを生成し、それをワードプロセッサへの入力とする。
一般にIMEは、入力を外国語テキストに変換する。I
MEへの入力は例えば、キーボードおよびマウスを介し
てコンピュータに入力したテキストである。IMEは、
アジア言語等における表意文字を生成するのに特に有用
である。このような言語は、キーボードのキーよりはる
かに多い表意文字を持つ。特定の表意文字をコンピュー
タに入力するには、複数のキーを打ち込み、それをIM
Eが合成文字として解釈する。
【0007】例えばユーザは、希望の中国語文字の音声
スペルを英字でタイプする。多くの中国語文字は発音が
似ており、タイプした音声スペルは異なる中国語文字に
対応することが多い。するとIMEは、タイプした音声
スペルに対応する最適候補をユーザに提供し、ユーザは
その中から正しい1つを選べる。
【0008】プログラマは、IMEに音声を入力できれ
ば役に立つと考えてきた。まず音声をテキストに変換
し、そのテキストをIMEへの入力とする。前述したよ
うに、音声の解釈は元来が推測である。このため音声解
釈から生成したテキストは、ユーザが意図したテキスト
でないことがある。不正確なテキストをIMEへ入力す
れば、IMEは不正確な結果を生成する。従って音声を
IMEへの入力として使う場合、音声データを解釈する
プログラムは、音声解釈によって生成したテキストをま
ずユーザに修正させ、その修正テキストをIMEへ入力
する。IMEがそれを外国語に翻訳すると、ユーザは再
び候補から選択する。IMEの翻訳結果も推測だからで
ある。このように2つの編集処理をユーザに求めるの
は、非能率で不便である。従って、IMEへの音声入力
処理を行う改良方法が必要である。
【0009】
【課題を解決するための手段】本発明は、テキスト編集
を受け入れる推測入力結合器を提供することにより、前
記必要を満たす。本発明は、ユーザが選択したテキスト
に対して候補を提供する。この選択テキストは、1つ以
上の推測入力を含む複数の入力源から生成したものでも
構わない。
【0010】本発明の推測入力結合器は、グラフィカル
ユーザインタフェースを介してユーザに候補リストを提
供する。ユーザは、その候補から1つを選択し、その候
補で選択テキストを置換する。選択テキストとは、編集
する目的でユーザが強調表示したテキストである。この
方法は、ユーザが自分で候補を考え、それに基づいてキ
ーボードとマウスによって修正を行うより早い。選択テ
キストに対する所望の候補が見つからなければ、ユーザ
はキーボードとマウスを使い、選択テキストを編集でき
る。すると推測入力結合器は、そのユーザの修正を取り
入れた候補リストを提供する。ユーザが選択テキストを
部分的に編集するだけで、推測入力結合器は候補を提供
するから、編集効率が向上する。
【0011】この推測入力結合器は、自然言語モデルも
利用できる。自然言語モデルは、自然言語原理を用いて
選択テキストを分析し、より良い候補リストを提供でき
る。これもまた、ユーザの編集効率を向上する。
【0012】本発明は、広くテキスト修正方法に関す
る。ユーザはまず、コンピュータにテキストを入力す
る。この時ユーザは、複数の推測入力源や、キーボード
およびマウスを用いる。
【0013】キーボードおよびマウスで入力したテキス
トは、非推測入力源の例である。すなわちこのテキスト
は、正確に決定可能である。一方、推測入力源からの入
力は、候補リストに変換する。各候補は、正確さの確率
が100%以下である。コンピュータは音声を完璧に解
釈することはできないため、音声認識装置は推測入力源
の一例である。従って音声入力は、テキスト候補リスト
に変換する。推測入力源の他の例は、手書き認識装置お
よび入力システム(IME)である。選択テキスト中の
テキスト要素の入力源が推測入力源である場合、最適候
補をそのテキスト要素の代表として使う。
【0014】ユーザは、コンピュータにテキストを入力
し、その入力テキストの一部を選択し、修正作業を開始
する。選択テキストは、複数のテキスト要素を含む。各
テキスト要素は、選択テキストの一部であり、単一の入
力源を介してユーザが入力したものである。選択テキス
トは、様々な入力源からのテキスト要素を含むこともあ
る。それら入力源は、推測入力源も含み得る。
【0015】テキストを選択した後ユーザは、選択テキ
スト全体に対する候補を表示するコマンドを入力する。
推測入力結合器は、選択テキストを入力源別のテキスト
要素に分解し、各推測入力源のテキスト要素用の候補を
代表する確率モデルを検索する。この確率モデルは、各
候補とその確率を含んだリストを持つ。確率モデルは、
格子を含むこともできる。
【0016】推測入力結合器は、前記確率モデルと他の
テキスト要素とを結合し、前記選択テキスト用候補リス
トを作成し、そのリストをモニタ等の表示装置に表示す
る。ユーザは、表示候補の1つを選択できる。選択した
候補は、前記選択テキストに置き換わる。
【0017】推測入力結合器は、自然言語モデルを利用
できる。この場合、推測入力結合器は、各テキスト要素
の確率モデルを結合して選択テキスト用中間候補リスト
を作成し、それを自然言語モデルへ送る。自然言語モデ
ルは、選択テキスト全体に自然言語原理を適用し、前記
中間候補リストを再評価し、修正候補リストを作成す
る。自然言語モデルは、前記中間候補リストに無い新し
い候補を前記修正候補リストに追加できる。自然言語モ
デルは、修正候補リストを推測入力結合器へ送る。推測
入力結合器は、その修正候補リストを表示する。
【0018】本発明の他の形態において、テキスト要素
は、連続した推測入力源から生成した推測テキスト要素
である。少なくとも1つの推測入力源が推測結果を生成
し、それを次の推測入力源の入力とする。第1推測入力
源はユーザ入力を受け取り、それに対する候補を生成す
る。これら候補は、第2推測入力源の入力となる。例え
ば音声認識装置はテキストを生成し、そのテキストがI
MEへの入力となる。連続した推測入力源が1つの推測
テキスト要素を生成すると、推測入力結合器は連続確率
モデルを生成できる。この連続確率モデルは、推測テキ
スト要素用候補とこれら候補の正確な確率とを含む。こ
れら確率は、連続した入力源の各入力源への入力の確率
である。この形態によれば、第1推測入力源から第2推
測入力源へ入力を与える際、ユーザが入力を選択する必
要がない。
【0019】推測入力結合器は、連続した推測入力源か
らのテキスト要素に対して連続確率モデルを生成する
際、第1推測入力源にユーザ入力を送る。第1推測入力
源は、それを処理し、推測結果を生成する。この推測結
果は、複数の候補を有する。推測入力結合器は、その推
測結果を第2推測入力源への入力とする。第2推測入力
源は、複数の第2推測結果を生成する。各第2推測結果
は、複数の候補を有する。第2推測結果のいずれかがベ
ストn候補リストでなければ、推測入力結合器は、それ
をベストn候補リストに変換する。全推測結果を同一フ
ォーマットに変換すれば、結合処理が簡単だからであ
る。推測入力結合器は、第2推測結果を結合し、総合候
補リストを作成する。連続した推測入力源が2個であれ
ば、前記総合候補リストは、前記連続した推測入力源か
らのテキスト要素用確率モデルとなる。
【0020】推測入力結合器は、選択テキスト中の修正
範囲を広げ、より大きな単位テキストにすることもでき
る。これを行うため推測入力結合器は、選択テキストを
修正範囲モデルへ送り、修正範囲の調整が必要か否かを
判断する。修正範囲モデルは、推測入力結合器に単位テ
キストを返す。この単位テキストは、選択テキストと少
なくとも1つの隣接語とを含む。推測入力結合器は、そ
の単位テキスト用の候補リストを作成し、それを表示装
置に表示する。
【0021】以下、添付図面および請求の範囲を参照し
ながら実施例を詳細に説明し、本発明の様々な形態を明
らかにする。
【0022】
【発明の実施の形態】本発明は代表的に、複数の入力源
から入力を受け取れるワードプロセッサにおいて実施す
る。複数の入力源とは、非推測入力源および推測入力源
を含む。キーボードおよびマウスによるテキスト入力
は、非推測入力源の例である。非推測入力源の場合、コ
ンピュータはユーザが意図したテキストを正確に決定で
きる。一方、推測入力源は、入力を推測結果に変換す
る。1つの推測結果は複数の候補を有し、各候補の正確
さの確率は100%以下である。推測入力源の例は、音
声認識装置である。音声認識装置は、音声入力をテキス
ト候補リストに変換する。コンピュータが音声を完璧に
解釈することは不可能だからである。推測入力源の他の
例は、手書き認識装置および入力システム(IME)で
ある。
【0023】ユーザは、ワードプロセッサを使ってテキ
ストの一部を選択し、その選択テキストに対する候補を
要求できる。選択テキストが1つ以上の推測入力源を元
にコンピュータが作成したものであれば、その選択テキ
ストには候補が存在する。ワードプロセッサは、選択テ
キスト用の候補を決定すると、グラフィカルユーザイン
タフェースを介してそれら候補を表示する。候補の1つ
をユーザが選択すると、ワードプロセッサはその選択候
補で前記選択テキストを置き換える。
【0024】ワードプロセッサが提供する候補リストに
希望の候補がなければ、ユーザはキーボードおよびマウ
スを使って前記選択テキストを編集する。例えばユーザ
は、前記選択テキスト中の1語を変更する。するとワー
ドプロセッサは、その編集を取り入れて候補リストを修
正し、修正した候補リストをユーザに提示する。修正し
た候補リストの1候補をユーザが選択すると、ワードプ
ロセッサはその選択候補で前記選択テキストを置き換え
る。
【0025】推測入力結合器は、プログラムモジュール
であり、選択テキストに対する候補を生成する。推測入
力結合器はこれを行うため、選択テキストをテキスト要
素に分解する。各テキスト要素は、1つの推測入力源に
対応する。推測入力結合器は、各推測テキスト要素につ
き、その候補を代表する確率モデルを検索する。推測入
力結合器は、検索した確率モデルと他のテキスト要素と
を結合し、選択テキスト全体に対する候補リストを作成
する。
【0026】推測入力結合器は、ワードプロセッサアプ
リケーションの一部であっても良いし、オペレーティン
グシステムの一部であっても良い。推測入力結合器は、
オペレーティングシステムの一部ではなく、ワードプロ
セッサとインタフェースする独立したプログラムであっ
ても良い。
【0027】ワードプロセッサは、選択テキスト用候補
リストの向上を図るため、自然言語モデルを利用でき
る。自然言語モデルは、選択テキスト全体に自然言語原
理を適用し、推測入力結合器が作成した各候補の適切さ
を再評価し、候補リストに新しい候補を追加する。自然
言語モデルは、各テキスト要素に自然言語原理を適用す
ることにより、候補リスト作成に使用する確率モデルの
向上を図ることもできる。
【0028】テキスト要素は、連続した推測入力源を元
にすることもある。少なくとも1つの推測入力源が推測
結果を生成し、それを次の推測入力源への入力とする。
この場合、第1推測入力源はユーザ入力を受け取り、最
後の推測入力源はテキスト要素用の候補を生成する。推
測入力結合器は、テキスト要素に対応する候補を含んだ
連続確率モデルを取得する。この処理において次の推測
入力源へ入力を与える際、推測入力結合器は前の入力源
の結果の選択をユーザに求めない。
【0029】推測入力結合器は、テキスト要素用の連続
確率モデルを取得するため、選択テキストの元となった
ユーザ入力を選択し、そのユーザ入力を連続した推測入
力源の第1推測入力源へ送る。次に推測入力結合器は、
第1推測入力源が生成した各候補を第2推測入力源の入
力とする。第2推測入力源は、受け取った候補の各々か
ら推測結果を生成する。第2推測入力源からの推測結果
は、総合候補リストにまとめる必要がある。さらに第3
推測入力源が存在すれば、推測入力結合器は、総合候補
リストの各候補を第3推測入力源への入力とする。連続
した推測入力源における最後の推測入力源から作成する
総合候補リストは、連続確率モデルである。
【0030】推測入力源のエラーは、複数の語にわたる
ことが多い。ユーザは修正過程において、そのエラーの
範囲全体に気付かないことがある。例えばユーザが「認
識(recognize、レコグナイズ)」と口述した
時、音声認識エンジンが最適解釈として「素敵を破壊
(wreck a nice、レックアナイス)」と決
定したとする。編集の時、ユーザは「破壊」を目にし、
その語についてのみ候補を要求する。ユーザは、それに
続く「素敵を」がやはり不正確であることに気付いてい
ない。
【0031】不正確な隣接語を含めずにユーザがテキス
トを選択し、ワードプロセッサがその選択テキストのみ
を用いて候補リストを作成すれば、そのリストはユーザ
が意図したテキストに対応する候補を1つも持たないで
あろう。ユーザがリストから候補を選び、その選んだ候
補で前記選択テキストを置き換えてしまうと、不正確な
隣接語はそのままテキストに残る。
【0032】このような不都合を解消するため、推測入
力結合器は、選択テキストを修正範囲モデルへ送る。修
正範囲モデルは、修正範囲を拡大すべきか否かを決定す
る。前記「認識」の例では、修正用の適切な単位テキス
トは「素敵を破壊」であろう。この決定を下すに当た
り、修正範囲モデルは、自然言語モデルと、類似エラー
のモデルと、前記テキストをワードプロセッサへ提供し
た入力方法に関するモデルとが含む情報を参照する。入
力方法に関するモデルとは、音声認識用音声モデル、手
書き入力用手書きモデル、手話・身振り認識用視覚モデ
ルを含む。
【0033】修正範囲モデルは、修正範囲を調整すべき
と判断すると、1つ以上の単位テキストを特定する。こ
の特定した単位テキストに対して、推測入力結合器は前
記方法において候補を生成する。修正範囲モデルは、こ
のような単位テキストのリストを推測入力結合器へ送
る。推測入力結合器は、そのリストを処理する。
【0034】図面を参照しながら本発明の実施例を説明
する。図中、同一番号は同一要素を示す。
【0035】動作環境例 図1を参照しながら本発明の実施に適したコンピュータ
環境100の概略を説明する。一例としての動作環境1
00は、従来のパーソナルコンピュータシステム120
を含む。このパーソナルコンピュータシステムは、処理
装置121と、システムメモリ122と、システムバス
123とを含む。システムバス123は、システムメモ
リ122を処理装置121に接続する。システムメモリ
122は、リードオンリメモリ(ROM)124とラン
ダムアクセスメモリ(RAM)125とを含む。ROM
124は基本入出力システム126(BIOS)を含
む。このBIOSは基本ルーチンを含む。この基本ルー
チンは、起動時等にパーソナルコンピュータ120内の
各要素間の情報転送を支援する。
【0036】パーソナルコンピュータシステム120
は、ハードディスクドライブ127と、取出し可能磁気
ディスク129を読み書きするための磁気ディスクドラ
イブ128と、CD−ROM等の光媒体である取出し可
能光ディスク131を読み書きするための光ディスクド
ライブ130とをさらに含む。ハードディスクドライブ
127と磁気ディスクドライブ128と光ディスクドラ
イブ130とは、各々ハードディスクドライブインタフ
ェース132と磁気ディスクドライブインタフェース1
33と光ドライブインタフェース134とを介して、シ
ステムバス123に接続する。これらドライブおよび関
連するコンピュータ読取り可能媒体は、不揮発性記憶手
段をパーソナルコンピュータシステム120に提供す
る。ここに示したコンピュータ読取り可能媒体は、ハー
ドディスク、取出し可能磁気ディスク,およびCD−R
OMディスクだが、当業者には明らかなように、他のコ
ンピュータ読取り可能媒体を、一例として示した前記動
作環境に用いても良い。例えば磁気カセット、フラッシ
ュメモリカード、デジタルビデオディスク、ベルヌーイ
カートリッジ等を用いても良い。
【0037】ユーザは、キーボード140やマウス14
2等のポインティングデバイス等の入力装置を介して、
パーソナルコンピュータシステム120にコマンドや情
報を入力する。マイクロフォン161は、コンピュータ
システム120に会話等の音声入力を行うために使用す
る。ユーザは、コンピュータシステムに図や手書きのグ
ラフィック情報を入力する場合、スタイラスを用いて筆
記タブレット162にグラフィック情報を描く。コンピ
ュータシステム120は、他の入力装置(図示せず)と
してジョイスティック、ゲームパッド、衛星アンテナ、
スキャナ、タッチスクリーン、スタイラス等を含んでも
良い。マイクロフォン161は、システムバスに接続し
たオーディオアダプタ160を介して処理装置121に
接続できる。他の入力装置は、システムバスに接続した
シリアルポートインタフェース146を介して処理装置
121に接続する場合が多い。しかしながらゲームポー
ト、ユニバーサルシリアルバス(USB)等のインタフ
ェースによって接続することもできる。
【0038】モニタ147等の表示装置は、ビデオアダ
プタ148等のインタフェースを介してシステムバス1
23に接続する。モニタに加え、パーソナルコンピュー
タシステムは、スピーカやプリンタ等の周辺出力装置
(図示せず)を一般に含む。
【0039】パーソナルコンピュータシステム120
は、ネットワーク環境で動作させ、1つ以上の遠隔コン
ピュータ149に論理接続しても良い。遠隔コンピュー
タ149は、サーバ、ルータ、ピア装置、共通ネットワ
ークノード等であり、一般に前記パーソナルコンピュー
タシステム120に関連して説明した要素の多くあるい
は全てを含む。ただし図1は記憶装置150のみを示
す。図1に示す論理接続は、ローカルエリアネットワー
ク(LAN)151と、ワイドエリアネットワーク(W
AN)152とを含む。このようなネットワーク環境
は、事務所、企業コンピュータネットワーク、イントラ
ネット、インターネットにおいて普及している。
【0040】LAN環境で使用する場合、パーソナルコ
ンピュータシステム120は、ネットワークインタフェ
ース153を介してローカルネットワーク151に接続
する。WAN環境で使用する場合、パーソナルコンピュ
ータシステム120は、一般にモデム154等の手段を
含み、インターネット等のワイドエリアネットワーク1
52を介して通信を確立する。モデム154は内蔵また
は外付けであり、シリアルポートインタフェース146
を介してシステムバス123に接続する。ネットワーク
環境の場合、パーソナルコンピュータシステム120の
プログラムモジュールは、遠隔記憶装置150に格納し
ても良い。図示のネットワーク接続は例であり、コンピ
ュータシステム間の通信リンクは他の手段で確立しても
良い。また本発明は、パーソナルコンピュータシステム
以外に、ホストまたはサーバコンピュータシステムでも
実現可能であり、CD−ROM以外の手段、例えばネッ
トワーク接続インタフェース153によってホストコン
ピュータシステムにデータを送ることができる。
【0041】多くのプログラムモジュールをコンピュー
タシステム120の駆動装置やRAM125に格納でき
る。プログラムモジュールは、コンピュータシステム1
20の機能を制御し、ユーザ、入出力装置、あるいは他
のコンピュータと対話する。プログラムモジュールは、
ルーチン、オペレーティングシステム135,アプリケ
ーションプログラムモジュール138,データ構造、ブ
ラウザ、他のソフトウエア部品、あるいはファームウエ
ア部品を含む。本発明は、推測入力結合プログラムモジ
ュール137、推測入力インタフェースプログラムモジ
ュール139等の1つ以上のプログラムモジュールによ
って好適に実施できる。これらモジュールの各々は、発
明の詳細な説明に記載した方法に基づく。
【0042】アプリケーションプログラムモジュール1
38は、本発明に関連して使用する様々なアプリケーシ
ョンからなる。図2はその幾つかを示す。これらプログ
ラムモジュールの目的および相互作用は、図2を参照し
て詳細に説明する。これらプログラムモジュールは、ワ
ードプロセッサプログラム210(ワシントン州レドモ
ンドのマイクロソフト社の製品であるワード等)、手書
き認識プログラムモジュール230,音声認識プログラ
ムモジュール240,および入力システム(IME)2
50を含む。
【0043】以下に説明する様々な手順を実行するため
の特定のプログラミング言語は説明しない。理由は、以
下の説明および添付図面における動作、処理段階、およ
び手順は、十分な開示を行っているため、当業者であれ
ばそれらに基づいて本発明の実施例を実現可能だからで
ある。さらに実施例の実行に使用可能なコンピュータお
よびオペレーティングシステムは多数あり、これら多く
の異なるシステムに適用可能な詳細コンピュータプログ
ラムを提示するのは困難だからである。特定コンピュー
タのユーザは、そのユーザの必要性および目的に最も適
した言語およびツールを知っているであろう。
【0044】当業者には明らかなように、本発明は他の
コンピュータシステム構成でも実施可能である。例えば
携帯装置、マルチプロセッサシステム、マイクロプロセ
ッサベースの消費者用電子機器、プログラム可能消費者
用電子機器、マイクロコンピュータ、メインフレームコ
ンピュータ等でも実施可能である。本発明は分散コンピ
ュータ環境でも実施可能である。分散コンピュータ環境
では、通信ネットワークでリンクした各遠隔処理装置に
よってタスクを実行し、プログラムモジュールを局所記
憶装置および遠隔記憶装置の両方に置くことができる。
【0045】プログラムモジュールの概要 図2は、複数入力源データ処理システム200のプログ
ラムモジュールの全体を示す。これらプログラムモジュ
ールの主たる目的は、ユーザが推測入力源および非推測
入力源を用いて、ワードプロセッサ等のアプリケーショ
ン210にテキストを入力できるようにすることであ
る。代表的な推測入力源は、手書き認識プログラムモジ
ュール230、音声認識プログラムモジュール240,
入力システム(IME)250、音声認識プログラムモ
ジュール260である。キーボード140は、代表的な
非推測入力源である。ユーザは、1つ以上のこれら入力
源を介してワードプロセッサ210にテキストを入力
し、テキストの一部を選択し、その選択テキストに対す
る候補リストを要求できる。この選択テキストは、複数
の推測入力源および非推測入力源からの入力を含むこと
がある。選択テキストが少なくとも1つの推測入力源か
らのデータを含んでいれば、その選択テキストに対する
候補が存在する。プログラムモジュールは、その候補リ
ストを作成し、グラフィカルユーザインタフェースを介
してそれをユーザに提示する。ユーザが候補の1つを選
ぶと、選んだ候補で前記選択テキストを置換する。推測
入力源230,240,250,260の動作を順次説
明する。
【0046】手書き認識プログラムモジュール230
は、ユーザからの手書き入力280を受け取る。ユーザ
は、スタイラスを用いて筆記タブレット162に筆記す
ることにより、手書き入力280を生成できる。他の装
置を用いても良い。例えばマウス142を用いて、モニ
タ147に書いても良い。スタイラスを用いて、タッチ
スクリーンに書くこともできる。手書き入力280は、
好ましくはオペレーティングシステム135の筆記タブ
レットドライバモジュールにより、手書き認識プログラ
ムモジュール230へ送る。
【0047】コンピュータで手書きを解釈することは難
しい。手書き認識プログラムモジュール230は、手書
き入力280を完全に解釈できるとは限らない。プログ
ラムモジュール230が行う最良のことは、手書き入力
280の候補を生成し、各候補に正当性の確率を割り当
て、推測結果を提供することである。確率モデル270
aは、データ構造を含む。このデータ構造は、手書き認
識プログラムモジュール230が手書き入力280を処
理して生成した確率データを含む。
【0048】確率モデル270が確率データを格納する
ために使用するデータ構造は、どのようなものでも構わ
ない。2つの有用なデータ構造は、格子およびベストn
候補リストである。格子は、当業者に良く知られた構造
であるため、詳細説明は省略する。簡単に説明すると、
格子は、推測入力源が生成した語または句をノードに格
納する。各語または句は確率データであるため、各ノー
ドは対応する語または句に割り当てた確率も格納する。
当業者に公知の方法を用いて格子を探索し、各テキスト
要素用の候補を生成できる。テキストの隣接部を代表す
る複数の格子を連結してメタ格子を作成できる。このメ
タ格子を探索することにより、隣接するテキスト要素の
候補を生成できる。
【0049】確率データは、ベストn候補とそれらに割
り当てた確率とのリストでも良い。ある語または句に対
するベストn候補リストは、その語または句を代表する
格子から作ることもできる。
【0050】音声認識プログラムモジュール240は、
手書き認識プログラムモジュール230と同様に動作す
る。ただし音声認識プログラムモジュール240は、マ
イクロフォン161を介してユーザから音声入力290
を受け取る。マイクロフォン161は、オペレーティン
グシステム135のマイクロフォンドライバモジュール
で駆動する。音声は解釈が難しい。発音が似て意味やス
ペルが異なる語がたくさんあるからである。従って音声
認識プログラムモジュール240も、推測結果を生成す
る。確率モデル270bは、データ構造を格納する。こ
のデータ構造は、音声認識プログラムモジュール240
が音声入力290を処理して生成した確率データを含
む。
【0051】入力システム(IME)250も、確率デ
ータを生成する。IME250は、入力を外国語テキス
トに変換する。IME250への入力は、例えばキーボ
ード140およびマウス142を介してコンピュータへ
タイプ入力したテキストである。確率モデル270c
は、データ構造を含む。このデータ構造は、IME25
0が生成した確率データを含む。
【0052】IME250は、アジア言語等において表
意文字を生成する時、特に有用である。かかる言語にお
ける表意文字数は、キーボードのキー数よりはるかに多
いからである。IME250を使わなければ、特定の表
意文字をコンピュータに入力するのは難しい。代表的な
IME250の場合、ユーザは所望の中国語文字の音声
スペルを英字でタイプする。多くの中国語文字は発音が
類似しているため、タイプした音声スペルは、多くの異
なる中国語文字の1つを意図していよう。そこでIME
250は、推測結果を生成すると共に、タイプした音声
スペルが意図したであろう最も確率の高い候補をユーザ
に提示する。ユーザは、その候補から正しい1つを選択
できる。
【0053】1つの推測入力源が生成する推測結果は、
次の推測入力源への推測入力とすることもできる。この
場合、これら推測入力源は「連続した推測入力源」であ
り、連続配置していると考えられる。これはプログラム
モジュールの構成293に示すとおりである。この構成
293は、IME250の他の実施例でもある。
【0054】この実施例において、英語音声入力262
をコンピュータに入力し、それを使って日本語テキスト
を生成できる。音声262は、音声認識プログラムモジ
ュール260へ送る。音声認識プログラムモジュール2
60の動作は、音声認識プログラムモジュール240の
動作とほぼ同じである。モジュール260を独立して示
した理由は、それが異なる音声解釈エンジンを持てるか
らである。例えば音声認識プログラムモジュール260
は、音声認識プログラムモジュール240とは異なる言
語を解釈できる。確率モデル270dは、データ構造を
含む。このデータ構造は、音声認識プログラムモジュー
ル260が音声入力を処理して生成した確率データを含
む。
【0055】英語音声・日本語IMEの場合、音声認識
プログラムモジュール260は、英語音声から英語テキ
スト候補を生成し、それを確率モデル270dに格納で
きる。確率モデル270dに格納した1つ以上の英語テ
キスト候補は、IME250への入力となる。IME2
50は、その英語テキスト入力を日本語文字に変換す
る。IME250への各候補入力は、個別の推測結果を
生成する。ただしIME250への2つの個別入力に基
づく推測結果間には、候補の重複があり得る。
【0056】図2において、音声認識プログラムモジュ
ール260からIME250への矢印は、音声認識プロ
グラムモジュール260がIME250の推測入力源で
あることを示している。しかしこれら2つのプログラム
モジュールは、直接インタフェースしているわけではな
い。音声認識プログラムモジュール260からIME2
50への推測入力は、例えば推測入力インタフェース1
39等のインタフェースプログラムモジュールを中継す
る。この推測入力インタフェース139に対して、各推
測入力源は直接接続している。
【0057】推測入力インタフェース139は、推測入
力源と、アプリケーション210との間で、推測データ
を受け渡す。ここで推測入力源は、例えば手書き認識プ
ログラムモジュール230、音声認識プログラムモジュ
ール240,IME250である。推測データ通路とし
て推測入力インタフェース139を設けと、推測データ
を受け取るアプリケーション210と推測入力源との通
信が簡略になる利点がある。すなわちアプリケーション
は、推測入力インタフェースとの通信方法を持つだけで
良く、推測入力源に対しての通信方法を持たないで良
い。推測データを受け取るアプリケーション210は、
本発明の一実施例においてワードプロセッサである。ア
プリケーション210は、スプレッドシート、ブラウ
ザ、電子メールプログラム、音楽編集プログラム、CA
Dプログラム、プレゼンテーションソフトウエア(ワシ
ントン州レドモンドのマイクロソフト社の製品であるパ
ワーポイン等)、オペレーティングシステム等のソフト
ウエアプログラムでも良い。
【0058】ワードプロセッサ実施例の場合、ワードプ
ロセッサ210は、推測入力インタフェース139を介
して、最適候補テキストを受け取る。各最適候補は、ワ
ードプロセッサにデータを入力した各推測入力源からの
ものである。複数の推測入力源からワードプロセッサ2
10にデータを送ることに加え、例えばキーボード14
0でタイプすることにより、非推測データをワードプロ
セッサに入力できる。ワードプロセッサ210は、これ
ら元データを結合して複数入力源テキストを作成し、そ
れをユーザに提示する。ワードプロセッサ210は、そ
のテキストの各要素の入力源をユーザに示さないが、記
録している。
【0059】ワードプロセッサ210は、ユーザがテキ
ストの一部を選択し、その選択テキストに対する候補を
要求することを可能にする。選択テキストが1つ以上の
推測入力源を元にしていれば、候補が存在する。ワード
プロセッサ210は、選択テキスト自体とその選択テキ
ストの各要素の入力源とを推測入力インタフェース13
9へ送り、候補リストを要求する。推測入力インタフェ
ース139は、その要求を処理し、全選択テキストに対
する候補リストをワードプロセッサ210に返す。ワー
ドプロセッサは、グラフィカルユーザインタフェースを
介してその候補リストをユーザに提示する。候補リスト
からユーザが1つを選ぶと、ワードプロセッサは、選ん
だ候補で選択テキストを置き換える。
【0060】候補リスト要求を処理する際、推測入力イ
ンタフェース139は、その要求を推測入力結合器13
7へ送る。推測入力結合器137は、推測入力インタフ
ェース139を介して推測入力源と通信し、確率モデル
270に関する必要情報を検索し、候補リストを作成す
る。
【0061】推測入力結合器137は、候補リスト作成
の際、自然言語モデル220を参照しても良い。この場
合、結合器137は、確率モデル270から検索した情
報を用いて、中間候補リストを作成し、それを自然言語
モデル220へ送る。自然言語モデルは、文法、テキス
ト全体の意味、様々な語順の確率等を手掛かりに、中間
候補リストを分析する。これに基づき自然言語モデル2
20は、追加候補を生成し、中間候補リスト中の候補の
確率を再評価する。選択テキストの候補リストを生成す
る方法を図3〜9および11を参照しながら説明する。
【0062】図2において、推測入力源230,24
0,250は、各自の推測データを他の推測入力源を介
して選別することなく、ワードプロセッサ210に提供
できる。すなわち推測入力源230,240,250
は、各々が直接(ただし推測入力インタフェース139
を介して)推測データをワードプロセッサ210へ送る
ことができる。各入力源からの推測データは、ワードプ
ロセッサの同一文書に含めることができる。従ってこれ
ら入力源は、並列推測入力源296であり、並列構成と
言える。
【0063】これまで各プログラムモジュールは別々に
説明してきたが、当業者には明らかなように、これらプ
ログラムモジュールは、様々に組み合わせることが可能
であり、新しいプログラムモジュールを作成して同様の
結果を得ることもできる。特に推測入力結合器137と
自然言語モデル220とは、推測入力インタフェース1
39に含めることができる。これら3つのプログラムモ
ジュールは、オペレーティングシステム135またはワ
ードプロセッサ210の一部とすることもできる。結合
器137および自然言語モデル220は、各独立したプ
ログラムとし、各々がワードプロセッサ210と直接イ
ンタフェースしても良い。また推測入力源230,24
0,250,260は、各々が独立アプリケーションプ
ログラムモジュール138でも良く、オペレーティング
システム136の一部でも良い。
【0064】代表的実施例の図示図3,5,11は、本
発明実施例においてユーザが目で見ながら行う状況を示
すと共に、推測入力結合器137と自然言語モデル22
0との機能を示す。
【0065】図3において、コンピュータ120は、複
数のテキスト入力方法を有し、ユーザからの入力を受け
取り、それをワードプロセッサ等のアプリケーション2
10へ送る。コンピュータは、その入力をテキスト30
0に変換し、モニタ147に表示する。本例において、
ユーザは「THIS IS A MESSAGE WRITTEN BY A THOUSAND
MONKEYS TYPING AT RANDOM. (これは千匹の猿がで
たらめにタイプして書いたメッセージです。)」とのテ
キストを意図した。ところがコンピュータは、それを
「THIS IS A MESSAGE WRITTEN BY A TOWN OF MY KEYS T
AIPING AT RANDOM. (これはでたらめに私の鍵のタ
イピンの町が書いたメッセージです。)」と解釈し、テ
キスト300を生成した。
【0066】テキスト300が表示されると、ユーザは
その一部を強調表示することにより、選択テキスト31
0を作成する。図3の選択テキスト310は、3つのテ
キスト要素312,314,316を有する。これらテ
キスト要素は、各々が異なる推測入力源から生成されて
いる。例えばテキスト要素312は、手書き認識プログ
ラムモジュール230が手書き入力280を処理して生
成した候補の1つである。この推測入力源から生成した
候補は、確率モデル270aが保持する。候補リスト3
18は、確率モデル270aが格納するテキスト要素3
12用候補リストである。この候補リストからコンピュ
ータは、「TOWN OF(の町)」を選んだ。その理由は、
テキスト要素312の元となった手書き入力280に対
し、候補リスト318の「TOWN OF(の町)」が最適で
あるとコンピュータが判断したからである。しかしなが
ら候補リスト318が示すように、コンピュータは「GO
WNOF(のガウン)」および「THOUSAND(千匹の)」もテキス
ト要素312の候補として認識している。
【0067】音声認識プログラムモジュール240は、
音声入力290を処理して推測結果を生成し、それを確
率モデル270bに格納する。候補リスト320は、テ
キスト要素314に対して確率モデル270bが格納し
ている候補である。ここでは「MY KEYS(私の
鍵)」が最適であるとして選択された。
【0068】テキスト要素316「TAIPING(タ
イピン)」は、第3の推測入力源から来ている。この推
測入力源の候補は、確率モデル270cに格納されてお
り、候補リスト322に含まれる。
【0069】推測入力結合器137は、候補リスト31
8,320,322から様々な組合せを作成し、各組合
せの順位リストを作成する。この順位付けは、選択テキ
スト310に対する各組合せの正当性の確率を計算して
行う。選択テキスト310に対する候補のうち上位を、
候補リスト330としてモニタ147に表示する。
【0070】図4において、候補リスト330の表示
後、ユーザは選択テキストを編集することもできる。図
4においてユーザは、タイピング編集410により、
「TOWN OF(の町)」を「THOUSAND(千
匹の)」で上書きした。この結果、選択テキスト310
のテキスト要素312は、テキスト要素312’に置換
された。
【0071】編集410は、キーボード140とマウス
142を用いて行うこともできる。このような入力方法
は、非推測入力であるため、テキスト要素312’に対
する候補は無い。この変更は候補リスト318’に反映
する。候補リスト318’は、図3の候補リスト318
に置き換わる。候補リスト318’は、「THOUSA
ND(千匹の)」が唯一の候補である。
【0072】編集が完了すると、推測入力結合器137
は、候補リスト318’、320,322から再び様々
な組合せを作り、編集後選択テキスト310用の候補を
作成する。これら候補は、候補リスト430としてモニ
タ147に表示する。
【0073】選択テキスト310を置換する候補とし
て、候補リスト430に表示されているもの以外をユー
ザが希望する場合、ユーザは再び選択テキスト310を
編集する。これを図11に示す。ユーザは、図4の選択
テキスト310にある「MYKEYS(マイ キーズ:
私の鍵)」に「MONKEYS(モンキーズ:猿)」を
上書きタイプして編集412を行う。その結果、テキス
ト要素314’「MONKEYS(猿)」がテキスト要
素314「MY KEYS(私の鍵)」に置き換わる。
そして候補リスト320は候補リスト320’に置き換
わる。この候補リスト320’は、1つの候補しか含ま
ない。なぜなら前記編集が非推測的だからである。推測
入力結合器137は、再び各候補リスト318’、32
0’、322の候補を組合せ、選択テキスト310に対
する候補リスト430’を作成する。
【0074】この時、ユーザは選択テキスト310用の
候補として、適切な候補414を見つけ、その候補41
4を強調表示させて選択する。すると候補414は選択
テキスト310に置き換わり、新しいテキスト416を
生成する。
【0075】図5は図3と同様であるが、自然言語モデ
ル220を動作させた場合の本発明実施例を示す。図3
に示したように、ユーザはテキスト要素312,31
4,316からなる選択テキスト310を選ぶ。推測入
力結合器137は、これらテキスト要素の様々な候補組
合せを作成し、選択テキスト310用中間候補リストを
作成する。結合器137は、最適候補を表示することに
代えて、前記中間候補リストを自然言語モデル220へ
送る。
【0076】自然言語モデル220は、選択テキスト3
10全体に自然言語原理を適用することにより、中間候
補リストの各候補の確率を再評価する。この再評価は、
選択テキストが含む文法等の言語的手掛かりの分析を含
む。自然言語モデル220は、中間候補リストが含まな
い候補を追加することもある。自然言語モデル220
は、中間候補リストの再評価および生成した追加候補に
基づいて修正候補リストを作成し、それを推測入力結合
器137に返す。結合器137は、修正候補リストから
上位候補を選択し、候補リスト530として表示する。
【0077】自然言語モデルの動作により、候補リスト
530は、図3の候補リスト330より優れていること
が多い。従ってユーザは、候補リスト530から候補5
02を選択でき、選択テキスト310を編集する必要が
ない。図5の例においてユーザは、選択テキスト310
を候補502と置き換えることにより新しいテキスト5
04を作成する。
【0078】代表的実施例のフローチャート 図6は、元データを処理するための代表的ルーチン60
0の各ステップを示すフローチャートである。このルー
チンは、図3,5,11に示した実施例を実行するため
の各段階を含む。ルーチン600は、ステップ602に
おいて開始する。ワードプロセッサは、複数の入力源か
ら元データを受け取る。入力源は、手書き認識プログラ
ムモジュール230,音声認識プログラムモジュール2
40、入力システム250等の推測入力源でも良い。あ
るいはキーボード140およびマウス142を使ってタ
イピング入力した非推測入力でも良い。あるいは連続し
た2つ以上の推測入力源からのデータでも良い。連続し
た推測入力源からのデータの場合、各推測入力源は、そ
れぞれ異なる入力源として扱うことができる。
【0079】ワードプロセッサは、複数の入力源から元
データを受け取ると、ステップ604においてそのデー
タを複数入力源テキスト列に結合する。すなわち、ワー
ドプロセッサは、元データに対応するテキストを生成し
てモニタ147に表示可能とする。さらにワードプロセ
ッサは、そのテキストの各語の入力源を記録するための
データ構造を生成する。
【0080】ステップ606において、ユーザは必要に
応じて表示テキストの一部を選択する。この選択テキス
トは、複数の入力源を有するテキストでも良い。例えば
ユーザは、選択テキストの開始位置でマウスボタンを押
し、選択テキストの終端までマウスをドラッグし、そこ
でマウスボタンを離す。ワードプロセッサは、その選択
テキストを強調表示し、該当部分を明示することが好ま
しい。
【0081】ステップ608においてワードプロセッサ
は、選択テキストに対する「候補表示」コマンドを受け
取る。それに応じてワードプロセッサは、ステップ61
0において、複数の入力源を有する選択テキスト用の候
補を決定する。
【0082】ステップ612においてワードプロセッサ
は、それら候補をモニタ147に表示する。ワードプロ
セッサは、グラフィカルユーザインタフェースを介し
て、それら候補を確率順に表示することが好ましい。こ
のグラフィカルユーザインタフェースは、ユーザが表示
候補の1つを選択することを可能にする。グラフィカル
ユーザインタフェースは、サブウインドウに表示しても
良い。ユーザはそのサブウインドウを任意に移動するこ
とにより、その下に隠れたテキストを表示できる。
【0083】ステップ614においてユーザは、ワード
プロセッサにコマンドを与える。このコマンドは例え
ば、表示候補の選択、選択テキストの編集、あるいは選
択テキスト外のテキストの一部にマウスを移動しボタン
を押すことによる新たなテキスト選択等である。
【0084】ステップ616において、ワードプロセッ
サは、ユーザが表示候補の1つを選択したか否かを決定
する。ユーザが表示候補の1つを選択していれば、ステ
ップ618においてワードプロセッサは、その選択候補
で選択テキストを置換する。次にステップ624におい
てワードプロセッサは、候補の表示を中断する。そして
ステップ626においてルーチンは終了する。ステップ
626の後、ステップ602に戻ってルーチンを繰り返
すこともできる。
【0085】ステップ616においてユーザが表示候補
を選択しなければ、ステップ620を実行する。ステッ
プ620においてワードプロセッサは、ユーザが選択テ
キスト内のテキストを編集したか否かを決定する。ユー
ザが選択テキスト内のテキストを編集していれば、ステ
ップ622においてワードプロセッサは、その編集を処
理する。ワードプロセッサが編集処理を完了すると、ル
ーチンはステップ610にループし、編集後選択テキス
ト用の新しい候補を決定する。
【0086】ステップ620において、ステップ614
で受け取ったユーザコマンドが選択テキストの編集コマ
ンドでなければ、ワードプロセッサはステップ624を
実行する。この場合ユーザは、選択テキストの外側でマ
ウスを押すことにより、新しい選択テキストの生成を開
始している。従ってワードプロセッサは、ステップ62
4において候補の表示を中断し、ステップ626におい
てルーチンを終了する。ここで再びステップ602に戻
ってルーチンを繰り返すこともできる。
【0087】図7は、図6のルーチン610の詳細を示
す。このルーチンは、複数入力源を有する選択テキスト
に対して、候補を決定するための各ステップを含み、例
えば推測入力結合器が実行する。結合器は、ワードプロ
セッサ内のプログラムモジュール、オペレーティングシ
ステム内の独立プログラム、またはワードプロセッサと
インタフェースする独立プログラムである。
【0088】ルーチンはステップ702で開始する。こ
こで推測入力結合器は、選択テキストを解析し、入力源
別のテキスト要素に分解する。すなわち推測入力結合器
は、モニタ147に表示したテキストの各語の入力源を
格納したデータ構造を参照する。選択テキストをテキス
ト要素に分解することにより、選択テキスト用候補の決
定が管理しやすくなる。
【0089】当業者には明らかなように、テキスト要素
の定義は多様である。図7〜9に示したものとは異なる
定義を用いても良い。この場合、解析ステップ702や
他のルーチンを適切に変更する必要がある。テキスト要
素は、例えば単一の語、または同一入力源を有する複数
の語からなる句である。推測入力から得た句の場合、そ
の句の中間に編集を挿入すると、元の句と編集とは異な
るテキスト要素となり得る。
【0090】図7および図9において、テキスト要素
は、隣接のテキスト要素とは異なる1つまたは連続した
推測入力源を有する最大単位テキストと定義し、このテ
キスト要素は、タイピングにより編集したテキストを包
むことができる。タイピングにより作成した単位テキス
トであって、推測入力源からのテキスト要素の編集では
ない場合、その単位テキストはテキスト要素と見なす。
例えば異なる推測入力源を元とする2つのテキスト要素
の間に、ユーザがタイピングによってテキストを挿入し
た場合、この挿入したテキストはそれ自体がテキスト要
素である。
【0091】ステップ704において推測入力結合器
は、独自の推測入力源を有するテキスト要素について、
対応する確率モデルを検索する。ステップ706におい
て推測入力結合器は、確率モデルが全て格子であるか否
かを決定する。全ての確率モデルが格子であれば、ステ
ップ708を実行する。
【0092】ステップ708において推測入力結合器
は、検索した全格子を連結してメタ格子を作成する。こ
のメタ格子を作成するに当たり、推測入力結合器は、タ
イプしたテキスト要素用ノードを生成する。タイプした
テキスト要素は、推測入力源を元とするテキスト要素に
含まれない。ステップ710において入力結合器は、当
業者に公知の格子探索方法を用いてメタ格子を探索し、
選択テキスト用候補リストを作成する。次にステップ7
16に移る。このステップは、ステップ706の「N
O」の分岐の後に説明する。
【0093】ステップ706に戻り、ステップ704で
検索した全確率モデルが格子でなければ、推測入力結合
器はステップ712を実行する。この場合、少なくとも
1つの確率モデルがベストn候補リストである。従って
推測入力結合器は、各格子をベストn候補リストに変換
し、ステップ714を実行する。
【0094】ステップ714において推測入力結合器
は、ベストn候補リストとタイプしたテキスト要素とを
結合し、結合候補リストを作成する。これは、ベストn
候補のあらゆる組合せを形成することによって行う。推
測入力結合器は、各組合せについて、選択テキストに現
れる順序に候補を配置する。そして選択テキスト用候補
リストを形成する。ステップ714からステップ716
へ進む。
【0095】ステップ710または714からステップ
716へ進む時、推測入力結合器は、選択テキスト用候
補リストを作成済みである。ステップ716はオプショ
ンであり、自然言語モデルを利用できる。このステップ
において推測入力結合器は、選択テキスト用候補リスト
を自然言語モデルへ送る。
【0096】ステップ716を実行する時は、ステップ
718も実行する。このステップにおいて、自然言語モ
デルは、順位付けした修正候補リストを推測入力結合器
へ返す。この修正候補リストは、自然言語モデルへ送っ
た候補リストの各候補の確率を再評価した結果を含む。
修正候補リストはさらに、選択テキストに対して自然言
語モデルが生成した新しい候補も含む。自然言語モデル
は、自然言語原理を用いて修正候補リストを生成する。
自然言語原理は、自然言語モデルが選択テキスト全体に
適用する文法等の言語的手掛かりの分析を含む。
【0097】ステップ720において推測入力結合器
は、表示用に上位候補を選択する。オプションのステッ
プ716および718を実行した場合、推測入力結合器
は、自然言語モデルから受け取る修正候補リストから表
示用候補を選択する。ステップ716および718を実
行しない場合、推測入力結合器は、ステップ710また
は714において作成した候補リストから表示用候補を
選択する。ステップ720の後、ステップ722におい
てルーチンは終了する。
【0098】図8は、図7のルーチン704の各ステッ
プを示す。このルーチンにおいて推測入力結合器は、1
つの推測入力源を元とする各テキスト要素に関し、確率
モデルを検索する。ステップ802においてルーチンを
開始し、各テキスト要素を処理するループに入る。ステ
ップ802において推測入力結合器は、テキスト要素を
検索する。ステップ804において推測入力結合器は、
当該テキスト要素が推測テキスト要素であるか否かを決
定する。推測テキスト要素でなければ、ステップ806
へ進む。この場合、当該テキスト要素は、例えばキーボ
ードとマウスを用いてタイプしたテキストである。この
テキスト要素は非推測であるため、推測入力結合器は、
そのテキスト要素に100%の確率を割り当てる。次に
推測入力結合器は、ステップ818を実行する。このス
テップは後述する。
【0099】ステップ804に戻り、ステップ802で
検索したテキスト要素が推測テキスト要素であれば、推
測入力結合器はステップ808を実行する。このステッ
プにおいて推測入力結合器は、そのテキスト要素が連続
した推測入力源からか否かを決定する。連続した推測入
力源からであれば、推測入力結合器はステップ810を
実行し、連続した推測入力源の最後の推測入力源が生成
した連続確率モデルを取得する。ルーチン810の後、
推測入力結合器はステップ812を実行する。ステップ
808において、ステップ802で検索したテキスト要
素が連続した推測入力源からでない場合も、ステップ8
12へ進む。
【0100】ステップ812において推測入力結合器
は、ユーザがキーボードおよびマウスを使用してテキス
ト要素を編集したか否かを決定する。編集していれば、
ステップ814において推測入力結合器は、対応する確
率モデルを更新する。この更新は、対応する確率モデル
が格子であれば、当該テキスト要素から削除された語に
対応するノードの削除を含む。また推測入力結合器は、
当該テキスト要素に新しい語があれば、それに対応して
ノードを追加する。確率モデルがベストn候補リストで
あれば、推測入力結合器は、削除された語を削除し、挿
入された語を追加することにより、リストの各候補を更
新する。
【0101】ステップ814からステップ816へ進
む。ステップ812においてユーザが当該テキスト要素
を編集していないと決定した場合も、ステップ816へ
進む。ステップ816において、推測入力結合器は、ス
テップ802で選択したテキスト要素に対し、確率モデ
ル結果を検索する。当該テキスト要素が連続した確率モ
デルから得たものであれば、検索した確率モデルはステ
ップ810で作成した連続確率モデルである。また当該
テキスト要素が編集されていれば、ステップ814で更
新した連続確率モデルである。検索した確率モデルは、
格子またはベストn候補リストである。検索した確率モ
デルは、選択テキスト要素に関する情報を含んでいれば
良いので、推測入力結合器は、当該テキスト要素を含む
大きなテキスト用確率モデルから当該確率モデルを検索
することもできる。
【0102】ステップ802で選択したテキスト要素
は、推測入力からのものでも、候補を代表する確率モデ
ルが用意されていない場合がある。この場合、当該テキ
スト要素は非推測テキスト要素と同様に扱う。すなわち
推測入力結合器は、当該テキスト要素用の既知の候補に
100%の確率を割り当てる。推測入力結合器は、ステ
ップ816の次にステップ818を実行する。
【0103】ステップ818は、ステップ816または
806に続いて実行する。ステップ818において推測
入力結合器は、選択テキスト内に未処理のテキスト要素
があるか否かを決定する。未処理のテキスト要素があれ
ば、ルーチンはステップ802にループし、推測入力結
合器は次のテキスト要素を取得し処理する。
【0104】ステップ818において未処理のテキスト
要素が無ければ、推測入力結合器はオプションのステッ
プ820を実行し、自然言語モデルを利用する。このス
テップにおいて推測入力結合器は、テキスト要素用に検
索した各確率モデルを自然言語モデルへ送る。自然言語
モデルは、そのテキスト要素に自然言語原理を適用し、
結果を推測入力結合器に返す。ステップ820において
自然言語モデルは、選択テキスト全体ではなく各テキス
ト要素に対して動作するため、ステップ820は、ステ
ップ716および718の代替としてあるいは追加とし
て実行する。ステップ820の後、ルーチンはステップ
822で終了する。
【0105】図9は、図8のルーチン810の各ステッ
プを示す。このルーチンにおいて推測入力結合器は、連
続した推測入力源を持つテキスト要素に対応する連続確
率モデルを得る。
【0106】ルーチン810はステップ902で開始す
る。このステップは、連続した推測入力源のうち、最後
の推測入力源を除く全てを順次処理するためのループを
開始する。第1回目のステップ902において、推測入
力結合器は、連続した推測入力源から第1推測入力源を
選択する。この第1推測入力源は、当該テキスト要素を
生成したユーザ入力を受け取った入力源である。
【0107】第1推測入力源は複数の候補を生成し、こ
れらは第2推測入力源への入力となる。第2回目以降の
ステップ902では、推測入力結合器は、ステップ91
4において(後述する)、ステップ902で選択した推
測入力源用の総合候補リストを作成している。この総合
候補リストは、選択した推測入力源に関連する候補を含
んでおり、これら候補は次の推測入力源の入力として使
われる。ステップ904は、選択した推測入力源に関す
る全候補を処理するループを開始する。ステップ904
において推測入力結合器は、選択した入力源用候補の1
つを取り出す。
【0108】ステップ906において推測入力結合器
は、ステップ904で取り出した候補を次の推測入力源
へ入力として渡す。次の入力源もやはり推測入力源であ
るため、同様に推測結果を生成する。推測入力結合器
は、この推測結果を取り出す。
【0109】ステップ908において推測入力結合器
は、ステップ906で取り出した推測結果が格子である
か否かを決定する。格子でなければ順位付け候補リスト
であるため、ステップ912(後述する)へ進む。格子
であれば、ステップ910において推測入力結合器は、
その格子を順位付け候補リストに変換し、各候補に確率
を割り当てる。次にステップ912へ進む。
【0110】ステップ912において、推測入力結合器
は、選択した入力源はさらに候補を持つか否かを決定す
る。さらに候補があれば、ルーチンはステップ904に
戻り、推測入力結合器は次の候補を取得する。さらに候
補がなければ、ステップ914へ進む。
【0111】ステップ914において推測入力結合器
は、ステップ902で選択した入力源用候補を後続の推
測入力源への入力として生成した候補リストを全て結合
し、総合候補リストを作成する。この総合候補リストを
作成するに当たり、推測入力結合器は、各候補リストの
各一意の候補に対して1つの項目を総合候補リストに準
備する。そして推測入力結合器は、総合候補リスト中の
各候補の確率を計算する。これは、各候補リストにおけ
る各候補の確率を合計して行う。推測入力結合器は、各
合計した確率を総合候補リスト中の対応する候補に割り
当てる。
【0112】ステップ916において、推測入力結合器
は、現在次の入力源となっている入力源の後にさらに別
の入力源が存在するか否かを決定する。さらに別の入力
源が存在すれば、推測入力結合器は、ステップ902に
おいて現在次の入力源となっている入力源を選択し、前
記さらに別の入力源を次の入力源とする。この時、推測
入力結合器は、前記総合候補リストの各候補を選択した
入力源への入力とする。
【0113】ステップ916においてさらに別の入力源
がなければ、ルーチンはステップ918において終了す
る。ステップ914で作成した最新の総合候補リスト
は、連続確率モデルとなる。
【0114】図10は、元データ処理ルーチンの別の実
施例1000における各ステップを示す論理フローチャ
ートである。このルーチンは、ユーザのテキスト選択に
応じて修正する単位テキストを自動的に調整するルーチ
ンである。
【0115】ルーチン1000はステップ1005で開
始する。このステップにおいて、ワードプロセッサ21
0は、ユーザが修正するために選択した選択テキストを
受け取る。ユーザは、マウス142を用いて語または語
群を選択することにより前記選択テキストを指定する。
あるいはユーザは、マウスを用いて単一の語からなる選
択テキストを当該語の上または近くにマウスポインタを
おくことにより指定する。ワードプロセッサ210は、
その選択テキストを推測入力結合器137へ送り、修正
候補を決定する。
【0116】ステップ1010において推測入力結合器
137は、選択テキストを修正範囲モデルへ送り、修正
範囲を調整すべきか否かを決定する。修正範囲の調整は
例えば、選択テキストよりも良いテキスト修正候補をユ
ーザに提供できる単位テキストを特定することを含む。
例えば選択テキストは、エラーを含んだ隣接語を包含し
ていないことがある。このような隣接語のエラーは、選
択テキストと共に修正すべきものである。一般に、選択
テキストの隣接語が含むエラーは、選択テキスト内のエ
ラーに関連しているため、特定可能である。
【0117】従って修正範囲モデルが指定する単位テキ
ストは、選択テキストに1つ以上の隣接語を追加したも
のとなろう。修正範囲モデルは、修正すべきテキストと
して、単一の単位テキストではなく、複数の単位テキス
トを指定することもできる。この場合、各単位テキスト
は、テキスト修正用として優れた候補を提供する可能性
がある。
【0118】ステップ1015において、推測入力結合
器137は、ユーザに提供すべき修正候補用の単位テキ
ストリストを修正範囲モデルから受け取る。修正範囲モ
デルが、修正範囲の調整は必要ないと判断すれば、当該
単位テキストリストは選択テキストだけを含む。修正範
囲モデルが、修正用として1つの単位テキストのみを指
定すれば、前記単位テキストリストはその1つの単位テ
キストのみを含む。ステップ1020は、単位テキスト
リスト中の各単位テキストを処理するためのループを開
始する。この単位テキストリストは、ステップ1015
において修正範囲モデルが推測入力結合器137に返し
たものである。ステップ1020において結合器137
は、処理する単位テキストを選択する。ステップ102
5において結合器137は、図7のルーチンの各ステッ
プを実行し、選択した単位テキスト用の候補を決定す
る。結合器137が図7の各ステップを実行することに
よってルーチン1025を行う際、図7の「選択テキス
ト」は、選択した単位テキストに対応する。
【0119】ステップ1030において推測入力結合器
137は、処理すべき単位テキストがまだあるか否かを
決定する。処理すべき単位テキストがあれば、ルーチン
は「YES」の分岐をたどってステップ1020に戻
り、次の単位テキストを処理する。処理すべき単位テキ
ストが無ければ、「NO」の分岐をたどってステップ1
035へ進む。
【0120】ステップ1035において推測入力結合器
137は、各修正候補とそれに対応する単位テキストと
をワードプロセッサ210へ送る。ワードプロセッサ2
10はこれら候補を適切な方法で表示する。修正範囲が
調整されていなければ、各候補は図6で説明したように
表示される。修正範囲が単一の単位テキストまで拡張さ
れていれば、ワードプロセッサ137は、拡張部分の追
加語を、選択テキストの強調表示色とは別の強調表示色
で表示しても良い。ワードプロセッサは、その単位テキ
ストに対する候補を、図6を参照して説明したグラフィ
カルユーザインタフェースによって提示できる。
【0121】修正範囲モデルが複数の単位テキストを修
正用に指定した場合、ワードプロセッサ210は、候補
メニューをユーザに提示し、各候補に対応する単位テキ
ストを示すことができる。
【0122】ワードプロセッサ210がグラフィカルユ
ーザインタフェースを介してユーザに修正候補を提示す
ると、ルーチンはステップ1040において終了する。
ワードプロセッサ210は、候補に対するユーザからの
応答を、図6を参照して説明したように処理する。
【0123】結論 当業者には明らかなように、本発明の精神および範囲を
逸脱することなく、他の実施例も可能である。従って本
発明の範囲は、前記説明に依ることなく請求の範囲によ
って定められる。
【図面の簡単な説明】
【図1】本発明の実施例に適した動作環境を示すブロッ
ク図である。
【図2】複数入力源データ処理システムのプログラムモ
ジュールの概略を示すブロック図である。
【図3】本発明の代表的実施例の動作を示すブロック図
である。
【図4】ユーザによる選択テキスト編集が可能な本発明
の実施例を示すブロック図である。
【図5】自然言語モデルを利用可能な本発明の実施例を
示すブロック図である。
【図6】複数入力源からの元データを処理するルーチン
の各ステップを示すフローチャートである。
【図7】複数入力源を有する選択テキスト用候補を決定
するルーチンの各ステップを示すフローチャートであ
る。
【図8】選択テキスト中のテキスト要素に対応する確率
モデルを検索するためのルーチンの各ステップを示すフ
ローチャートである。
【図9】連続確率モデルを取得するためのルーチンの各
ステップを示すフローチャートである。
【図10】選択テキストの修正範囲を変更する処理を含
んだオプションの元データ処理ルーチンにおける各ステ
ップを示すフローチャートである。
【図11】ユーザによる選択テキスト編集を可能にする
本発明の実施例動作を示すブロック図である。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/00 G10L 3/00 551P 15/28 571T 15/22 (72)発明者 エリック ラッカー アメリカ合衆国 98105 ワシントン州 シアトル フォーティエイス アヴェニュ ー 4316 (72)発明者 ポール キョン ホワン キム アメリカ合衆国 98107 ワシントン州 シアトル ナンバー205 エヌダブリュー サーティナインス ストリート 201

Claims (27)

    【特許請求の範囲】
  1. 【請求項1】 入力源を異にする複数のテキスト要素で
    構成した選択テキストを受け取とるステップと、 前記テキスト要素の少なくとも1つが、推測入力源また
    は連続した推測入力源からの推測テキスト要素であり、 前記選択テキスト用の候補を表示するコマンドを受け取
    るステップと、 前記選択テキストを前記テキスト要素に分解するステッ
    プと、 前記推測テキスト要素に対応する推測入力源または連続
    した推測入力源から前記推測テキスト要素に対応する確
    率モデルを取り出すステップと、 前記確率モデルと他のテキスト要素とを結合して前記選
    択テキスト用候補リストを作成するステップと、 前記選択テキスト用候補リストを表示装置に表示するス
    テップとを有することを特徴とするコンピュータで実施
    するテキスト修正方法。
  2. 【請求項2】 前記表示した候補の1つを選択するユー
    ザコマンドを受け取るステップと、 前記選択テキストを前記選択した候補で置き換えるステ
    ップとをさらに有することを特徴とする請求項1に記載
    の方法。
  3. 【請求項3】 前記選択テキストに対する編集を受け取
    るステップと、 編集した前記選択テキスト用の修正候補リストを作成す
    るステップと、 前記編集した選択テキスト用修正候補リストを表示する
    ステップとをさらに有することを特徴とする請求項1に
    記載の方法。
  4. 【請求項4】 前記推測テキスト要素の1つに対する編
    集を受け取るステップと、 編集した前記推測テキスト要素に対応する推測入力源ま
    たは連続した推測入力源から当該編集した推測テキスト
    要素用の改訂確率モデルを取り出すステップと、 前記改訂確率モデルと前記選択テキストに対応する他の
    確率モデルとを結合して、編集した前記選択テキスト用
    の修正候補リストを作成するステップと、 前記編集した選択テキスト用修正候補リストを表示する
    ステップとをさらに有することを特徴とする請求項1に
    記載の方法。
  5. 【請求項5】 前記選択テキストが、ワードプロセッサ
    とスプレッドシートとブラウザと電子メールプログラム
    と音楽編曲プログラムとCADプログラムとプレゼンテ
    ーションプログラムとオペレーティングシステムとから
    なるグループから選択した1アプリケーションのファイ
    ル内におけるテキストの一部を有することを特徴とする
    請求項1に記載の方法。
  6. 【請求項6】 前記選択テキスト用候補を表示するステ
    ップが、 前記選択テキスト用候補を確率順に並べるステップと、 前記候補を前記確率順で表示装置に表示するステップと
    をさらに有することを特徴とする請求項1に記載の方
    法。
  7. 【請求項7】 前記候補を前記確率順で表示するステッ
    プが、 所定数の上位候補を選択するステップと、 前記選択した上位候補を表示装置に表示するステップと
    をさらに有することを特徴とする請求項6に記載の方
    法。
  8. 【請求項8】 前記選択テキストが複数の推測テキスト
    要素からなり、前記確率モデルを結合するステップが、 各推測テキスト要素用の確率モデルを結合して、前記選
    択テキスト用の中間候補リストを作成するステップと、 前記中間候補リストを自然言語モデルへ送るステップ
    と、 前記自然言語モデルは、自然言語原理を前記選択テキス
    ト全体に適用することによって前記中間候補リストを再
    評価し、前記選択テキスト用の修正候補リストを作成
    し、該修正候補リストを提供するステップと、 前記修正候補リストを前記自然言語モデルから受け取
    り、それを前記選択テキスト用の候補リストとして表示
    するステップとをさらに有することを特徴とする請求項
    1に記載の方法。
  9. 【請求項9】 前記修正候補リストが、前記自然言語モ
    デルが作成した追加候補であって前記自然言語モデルへ
    送った中間候補リストには無い追加候補を含むことを特
    徴とする請求項8に記載の方法。
  10. 【請求項10】 1つ以上の推測テキスト要素用に検索
    した確率モデルを自然言語モデルへ送り、該確率モデル
    を自然言語原理に基づく再評価に利用するステップをさ
    らに有することを特徴とする請求項8に記載の方法。
  11. 【請求項11】 各推測テキスト要素用の確率モデルを
    自然言語モデルへ送り、該確率モデルを修正候補リスト
    作成に利用するステップをさらに有することを特徴とす
    る請求項8に記載の方法。
  12. 【請求項12】 前記選択テキストが複数の推測テキス
    ト要素からなり、前記テキスト要素用の確率モデルが格
    子からなり、 前記確率モデルを結合して前記選択テキスト用の候補リ
    ストを作成するステップが、 前記格子を連結して、非推測入力源からの全テキスト要
    素に関する情報をも含んだメタ格子を作成するステップ
    と、 前記メタ格子から前記選択テキスト用の候補リストを作
    成するステップとをさらに有することを特徴とする請求
    項1に記載の方法。
  13. 【請求項13】 前記選択テキストが複数の推測テキス
    ト要素からなり、前記確率モデルの1つがベストn候補
    からなり、他の確率モデルが格子からなり、 前記確率モデルを結合して前記選択テキスト用の候補リ
    ストを作成するステップが、 前記格子に対応するベストn候補リストを作成するステ
    ップと、 前記ベストn候補リストを結合して前記選択テキスト用
    候補リストを作成するステップとをさらに有することを
    特徴とする請求項1に記載の方法。
  14. 【請求項14】 テキスト要素に対応する確率モデルを
    推測入力源から取り出す前記ステップが、 前記テキスト要素は連続した推測入力源からのものか否
    かを決定するステップと、 前記テキスト要素が連続した推測入力源からのものであ
    れば、各推測入力源からの確率モデルを結合して連続確
    率モデルを作成するステップと、 前記連続確率モデルを前記テキスト要素用確率モデルと
    して取り出すステップとをさらに有することを特徴とす
    る請求項1に記載の方法。
  15. 【請求項15】 前記推測テキスト要素に対応する推測
    入力源または連続した推測入力源から、前記推測テキス
    ト要素に対応する確率モデルを取り出すステップが、 連続した推測入力源における第1推測入力源へのユーザ
    入力を受け取るステップと、 前記第1推測入力源が生成する複数の候補からなる推測
    結果を選択するステップと、 前記第1推測入力源が生成した推測結果の各候補を、前
    記連続した推測入力源における第2推測入力源への入力
    として用いることにより、前記第2推測入力源の複数の
    推測結果を生成するステップと、 前記第2推測入力源の推測結果のいずれかがベストn候
    補リストでなければ、その推測結果をベストn候補リス
    トに変換するステップと、 前記第2推測入力源の推測結果を結合して前記第2推測
    入力源の総合候補リストを作成するステップとをさらに
    有することを特徴とする請求項1に記載の方法。
  16. 【請求項16】 前記第2推測入力源の推測結果を結合
    して前記第2推測入力源の総合候補リストを作成するス
    テップが、 前記第2推測入力源の複数推測結果の各一意の候補に対
    して1つの項目を前記総合候補リスト内に生成するステ
    ップと、 前記総合候補リスト内の各候補の確率を、前記第2推測
    入力源の複数推測結果において当該候補に割り当てた全
    確率を合計して計算するステップと、 前記計算した確率を対応する候補に割り当てるステップ
    とをさらに有することを特徴とする請求項15に記載の
    方法。
  17. 【請求項17】 請求項1記載の方法を実行するための
    コンピュータ実行命令を有するコンピュータ読取可能媒
    体。
  18. 【請求項18】 請求項1記載の方法を実行するための
    コンピュータ。
  19. 【請求項19】 請求項16記載の方法を実行するため
    のコンピュータ実行命令を有するコンピュータ読取可能
    媒体。
  20. 【請求項20】 請求項16記載の方法を実行するため
    のコンピュータ。
  21. 【請求項21】 ユーザから選択テキストを受け取るス
    テップと、 前記選択テキスト用の候補を表示するコマンドを受け取
    るステップと、 前記選択テキストを修正範囲モデルへ送って修正範囲を
    調整すべきか否かを決定するステップと、 前記選択テキストと少なくとも1つの隣接語とを含む単
    位テキストを、前記修正範囲モデルから受け取るステッ
    プと、 前記単位テキスト用の候補リストを作成するステップ
    と、 前記単位テキスト用候補リストを表示装置に表示するス
    テップとを有することを特徴とするテキスト修正をコン
    ピュータで実施する方法。
  22. 【請求項22】 前記表示した候補の1つを選択するユ
    ーザコマンドを受け取るステップと、 前記単位テキストを前記選択した候補で置き換えるステ
    ップとをさらに有することを特徴とする請求項21に記
    載の方法。
  23. 【請求項23】 前記隣接語が、前記選択テキスト内の
    1語を不正確にしたエラーに起因して、不正確であるこ
    とを特徴とする請求項21に記載の方法。
  24. 【請求項24】 前記修正範囲モデルが、自然言語モデ
    ルと類似エラーモデルと音声モデルと手書きモデルと映
    像モデルとからなるグループから選択した判断基準を含
    むことを特徴とする請求項21に記載の方法。
  25. 【請求項25】 前記単位テキスト用の候補リストを作
    成するステップが、 前記単位テキストを、入力源別のテキスト要素に分解す
    るステップと、 前記テキスト要素の1つが推測テキスト要素であるか否
    かを決定するステップと、 前記テキスト要素の1つが推測テキスト要素であれば、
    その推測テキスト要素用の確率モデルを検索するステッ
    プと、 前記確率モデルと他のテキスト要素とを結合して前記単
    位テキスト用候補リストを作成するステップとをさらに
    有することを特徴とする請求項21に記載の方法。
  26. 【請求項26】 請求項21記載の方法を実行するため
    のコンピュータ実行命令を有するコンピュータ読取可能
    媒体。
  27. 【請求項27】 請求項25記載の方法を実行するため
    のコンピュータ。
JP2000305651A 1999-10-05 2000-10-05 推測入力源からのテキストに対して候補を提供する方法およびシステム Ceased JP2001249920A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/412,822 US6789231B1 (en) 1999-10-05 1999-10-05 Method and system for providing alternatives for text derived from stochastic input sources
US09/412822 1999-10-05

Publications (1)

Publication Number Publication Date
JP2001249920A true JP2001249920A (ja) 2001-09-14

Family

ID=23634641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000305651A Ceased JP2001249920A (ja) 1999-10-05 2000-10-05 推測入力源からのテキストに対して候補を提供する方法およびシステム

Country Status (5)

Country Link
US (2) US6789231B1 (ja)
EP (1) EP1091303B1 (ja)
JP (1) JP2001249920A (ja)
CN (1) CN1290901A (ja)
DE (1) DE60032846T2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002156996A (ja) * 2000-11-16 2002-05-31 Toshiba Corp 音声認識装置、認識結果修正方法及び記録媒体
JP2007528037A (ja) * 2003-06-02 2007-10-04 インターナショナル・ビジネス・マシーンズ・コーポレーション ハンドヘルド携帯装置のための音声入力メソッド・エディタのアーキテクチャ
JP2008537806A (ja) * 2005-02-08 2008-09-25 テジック コミュニケーションズ インク マニュアルで入力されたあいまいなテキスト入力を音声入力を使用して解決する方法および装置
WO2008150003A1 (ja) * 2007-06-06 2008-12-11 Nec Corporation キーワード抽出モデル学習システム、方法およびプログラム
JP2015056154A (ja) * 2013-09-13 2015-03-23 独立行政法人情報通信研究機構 テキスト編集装置及びプログラム
JP2022169992A (ja) * 2021-04-28 2022-11-10 デロイトトーマツファイナンシャルアドバイザリー合同会社 情報処理装置、情報処理方法、端末プログラム、サーバプログラム及び契約書修正支援システム
JP2023515897A (ja) * 2020-04-20 2023-04-14 エーアイ スピーチ カンパニー リミテッド 音声対話の訂正方法及び装置

Families Citing this family (264)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8938688B2 (en) 1998-12-04 2015-01-20 Nuance Communications, Inc. Contextual prediction of user words and user actions
US7712053B2 (en) 1998-12-04 2010-05-04 Tegic Communications, Inc. Explicit character filtering of ambiguous text entry
US6789231B1 (en) * 1999-10-05 2004-09-07 Microsoft Corporation Method and system for providing alternatives for text derived from stochastic input sources
US6947885B2 (en) 2000-01-18 2005-09-20 At&T Corp. Probabilistic model for natural language generation
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7213027B1 (en) 2000-03-21 2007-05-01 Aol Llc System and method for the transformation and canonicalization of semantically structured data
US7243069B2 (en) * 2000-07-28 2007-07-10 International Business Machines Corporation Speech recognition by automated context creation
US6836759B1 (en) * 2000-08-22 2004-12-28 Microsoft Corporation Method and system of handling the selection of alternates for recognized words
US7254773B2 (en) * 2000-12-29 2007-08-07 International Business Machines Corporation Automated spell analysis
JP2002358336A (ja) * 2001-06-01 2002-12-13 Pioneer Electronic Corp 設計情報公開システム、設計情報公開方法および記録媒体
US20070265834A1 (en) * 2001-09-06 2007-11-15 Einat Melnick In-context analysis
US20030125929A1 (en) * 2001-12-10 2003-07-03 Thomas Bergstraesser Services for context-sensitive flagging of information in natural language text and central management of metadata relating that information over a computer network
US7890639B1 (en) 2002-01-30 2011-02-15 Novell, Inc. Method and apparatus for controlling access to portal content from outside the portal
US7412374B1 (en) * 2002-01-30 2008-08-12 Novell, Inc. Method to dynamically determine a user's language for a network
US7987421B1 (en) 2002-01-30 2011-07-26 Boyd H Timothy Method and apparatus to dynamically provide web content resources in a portal
DE10204924A1 (de) * 2002-02-07 2003-08-21 Philips Intellectual Property Verfahren und Vorrichtung zur schnellen mustererkennungsunterstützten Transkription gesprochener und schriftlicher Äußerungen
EP1376394A1 (en) * 2002-06-20 2004-01-02 Sun Microsystems, Inc. Methods and systems for processing text elements
US7236977B1 (en) 2002-09-20 2007-06-26 Novell, Inc. Method for dynamically distributing items for changes based on group membership
US7660843B1 (en) 2003-01-21 2010-02-09 Novell, Inc. Method and apparatus for dynamically delivering a gadget
US7200812B2 (en) 2003-07-14 2007-04-03 Intel Corporation Method, apparatus and system for enabling users to selectively greek documents
KR100989011B1 (ko) * 2003-08-21 2010-10-20 마이크로소프트 코포레이션 전자 잉크를 분석하기 위한 애플리케이션 프로그래밍 인터페이스를 포함하는 컴퓨터 판독가능 기록 매체, 전자 잉크 분석 방법 및 분석 콘텍스트 대상 생성 방법
US7634720B2 (en) * 2003-10-24 2009-12-15 Microsoft Corporation System and method for providing context to an input method
US8095364B2 (en) * 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US20070299664A1 (en) * 2004-09-30 2007-12-27 Koninklijke Philips Electronics, N.V. Automatic Text Correction
US20060285749A1 (en) * 2005-06-17 2006-12-21 Microsoft Corporation User-initiated reporting of handwriting recognition errors over the internet
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7707478B2 (en) * 2005-09-29 2010-04-27 Dolby Laboratories Licensing Corporation Error correction in packet-based communication networks using validation sets
CN1766923B (zh) * 2005-11-23 2010-05-05 倚天资讯股份有限公司 快速选项自动提供方法
US7831423B2 (en) * 2006-05-25 2010-11-09 Multimodal Technologies, Inc. Replacing text representing a concept with an alternate written form of the concept
WO2007143003A2 (en) * 2006-05-31 2007-12-13 Zcubes, Inc. A web-based experience editor in a recursive browser system and uses thereof
US20070283258A1 (en) * 2006-05-31 2007-12-06 Joseph Pally User-implemented handwritten content in a recursive browser system
US7817857B2 (en) * 2006-05-31 2010-10-19 Microsoft Corporation Combiner for improving handwriting recognition
US8521510B2 (en) * 2006-08-31 2013-08-27 At&T Intellectual Property Ii, L.P. Method and system for providing an automated web transcription service
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US20080255835A1 (en) * 2007-04-10 2008-10-16 Microsoft Corporation User directed adaptation of spoken language grammer
US8504349B2 (en) * 2007-06-18 2013-08-06 Microsoft Corporation Text prediction with partial selection in a variety of domains
US20090037171A1 (en) * 2007-08-03 2009-02-05 Mcfarland Tim J Real-time voice transcription system
CN100592249C (zh) * 2007-09-21 2010-02-24 上海汉翔信息技术有限公司 快速输入相关词的方法
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US9454516B2 (en) * 2008-01-14 2016-09-27 Blackberry Limited Method and handheld electronic device employing a touch screen for ambiguous word review or correction
US8010465B2 (en) 2008-02-26 2011-08-30 Microsoft Corporation Predicting candidates using input scopes
US8289283B2 (en) 2008-03-04 2012-10-16 Apple Inc. Language input interface on a device
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8862989B2 (en) * 2008-06-25 2014-10-14 Microsoft Corporation Extensible input method editor dictionary
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US20100082328A1 (en) * 2008-09-29 2010-04-01 Apple Inc. Systems and methods for speech preprocessing in text to speech synthesis
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US20120105486A1 (en) * 2009-04-09 2012-05-03 Dynavox Systems Llc Calibration free, motion tolerent eye-gaze direction detector with contextually aware computer interaction and communication methods
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
JP4810594B2 (ja) * 2009-06-24 2011-11-09 京セラ株式会社 携帯端末、言語設定プログラムおよび言語設定方法
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8365059B2 (en) * 2009-11-03 2013-01-29 Oto Technologies, Llc E-reader semantic text manipulation
US8379801B2 (en) 2009-11-24 2013-02-19 Sorenson Communications, Inc. Methods and systems related to text caption error correction
EP3091535B1 (en) 2009-12-23 2023-10-11 Google LLC Multi-modal input on an electronic device
US11416214B2 (en) 2009-12-23 2022-08-16 Google Llc Multi-modal input on an electronic device
US8494852B2 (en) 2010-01-05 2013-07-23 Google Inc. Word-level correction of speech input
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US8423351B2 (en) * 2010-02-19 2013-04-16 Google Inc. Speech correction for typed input
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8768686B2 (en) 2010-05-13 2014-07-01 International Business Machines Corporation Machine translation with side information
CN102298582B (zh) * 2010-06-23 2016-09-21 商业对象软件有限公司 数据搜索和匹配方法和系统
US8719014B2 (en) * 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US8352245B1 (en) 2010-12-30 2013-01-08 Google Inc. Adjusting language models
US8296142B2 (en) 2011-01-21 2012-10-23 Google Inc. Speech recognition using dock context
US20120215520A1 (en) * 2011-02-23 2012-08-23 Davis Janel R Translation System
US9037459B2 (en) * 2011-03-14 2015-05-19 Apple Inc. Selection of text prediction results by an accessory
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
KR20130080515A (ko) * 2012-01-05 2013-07-15 삼성전자주식회사 디스플레이 장치 및 그 디스플레이 장치에 표시된 문자 편집 방법.
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US8818791B2 (en) 2012-04-30 2014-08-26 Google Inc. Techniques for assisting a user in the textual input of names of entities to a user device in multiple different languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9224386B1 (en) * 2012-06-22 2015-12-29 Amazon Technologies, Inc. Discriminative language model training using a confusion matrix
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9292487B1 (en) 2012-08-16 2016-03-22 Amazon Technologies, Inc. Discriminative language model pruning
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8498864B1 (en) 2012-09-27 2013-07-30 Google Inc. Methods and systems for predicting a text
US9021380B2 (en) 2012-10-05 2015-04-28 Google Inc. Incremental multi-touch gesture recognition
US8782549B2 (en) 2012-10-05 2014-07-15 Google Inc. Incremental feature-based gesture-keyboard decoding
US8701032B1 (en) 2012-10-16 2014-04-15 Google Inc. Incremental multi-word recognition
US8843845B2 (en) 2012-10-16 2014-09-23 Google Inc. Multi-gesture text input prediction
US8850350B2 (en) 2012-10-16 2014-09-30 Google Inc. Partial gesture text entry
US8819574B2 (en) 2012-10-22 2014-08-26 Google Inc. Space prediction for text input
JP2014099052A (ja) * 2012-11-14 2014-05-29 International Business Maschines Corporation テキストを編集する装置、データ処理方法およびプログラム
US8832589B2 (en) 2013-01-15 2014-09-09 Google Inc. Touch keyboard using language and spatial models
KR20240132105A (ko) 2013-02-07 2024-09-02 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US9477753B2 (en) * 2013-03-12 2016-10-25 International Business Machines Corporation Classifier-based system combination for spoken term detection
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
AU2014233517B2 (en) 2013-03-15 2017-05-25 Apple Inc. Training an at least partial voice command system
US9081500B2 (en) 2013-05-03 2015-07-14 Google Inc. Alternative hypothesis error correction for gesture typing
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101772152B1 (ko) 2013-06-09 2017-08-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
EP3008964B1 (en) 2013-06-13 2019-09-25 Apple Inc. System and method for emergency calls initiated by voice command
KR20150007889A (ko) * 2013-07-12 2015-01-21 삼성전자주식회사 어플리케이션 운용 방법 및 그 전자 장치
DE112014003653B4 (de) 2013-08-06 2024-04-18 Apple Inc. Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen
CN104424168A (zh) * 2013-09-11 2015-03-18 华为技术有限公司 一种文本编辑方法、装置及服务器
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US20150178289A1 (en) * 2013-12-20 2015-06-25 Google Inc. Identifying Semantically-Meaningful Text Selections
US9842592B2 (en) 2014-02-12 2017-12-12 Google Inc. Language models using non-linguistic context
US9412365B2 (en) 2014-03-24 2016-08-09 Google Inc. Enhanced maximum entropy models
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
CN110797019B (zh) 2014-05-30 2023-08-29 苹果公司 多命令单一话语输入方法
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
CN105374356B (zh) * 2014-08-29 2019-07-30 株式会社理光 语音识别方法、语音评分方法、语音识别系统及语音评分系统
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US10134394B2 (en) 2015-03-20 2018-11-20 Google Llc Speech recognition using log-linear model
US10726197B2 (en) * 2015-03-26 2020-07-28 Lenovo (Singapore) Pte. Ltd. Text correction using a second input
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
EP3089159B1 (en) 2015-04-28 2019-08-28 Google LLC Correcting voice recognition using selective re-speak
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10409919B2 (en) * 2015-09-28 2019-09-10 Konica Minolta Laboratory U.S.A., Inc. Language translation for display device
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9978367B2 (en) 2016-03-16 2018-05-22 Google Llc Determining dialog states for language models
CN105824795A (zh) * 2016-04-19 2016-08-03 智者四海(北京)技术有限公司 文本中的错误信息的显示方法及装置
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10832664B2 (en) 2016-08-19 2020-11-10 Google Llc Automated speech recognition using language models that selectively use domain-specific model components
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10311860B2 (en) 2017-02-14 2019-06-04 Google Llc Language model biasing system
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
CN110555203B (zh) * 2018-05-31 2023-05-30 北京百度网讯科技有限公司 文本复述方法、装置、服务器及存储介质
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11076039B2 (en) 2018-06-03 2021-07-27 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11615789B2 (en) * 2019-09-19 2023-03-28 Honeywell International Inc. Systems and methods to verify values input via optical character recognition and speech recognition
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
US11270104B2 (en) 2020-01-13 2022-03-08 Apple Inc. Spatial and temporal sequence-to-sequence modeling for handwriting recognition
US11482223B2 (en) * 2020-03-31 2022-10-25 Pricewaterhousecoopers Llp Systems and methods for automatically determining utterances, entities, and intents based on natural language inputs
US12079584B2 (en) 2020-03-31 2024-09-03 PwC Product Sales LLC Systems and methods for conversation modeling
US11580112B2 (en) 2020-03-31 2023-02-14 Pricewaterhousecoopers Llp Systems and methods for automatically determining utterances, entities, and intents based on natural language inputs
US11562731B2 (en) 2020-08-19 2023-01-24 Sorenson Ip Holdings, Llc Word replacement in transcriptions

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3232705B2 (ja) 1991-12-05 2001-11-26 ソニー株式会社 光学記録ディスクからの樹脂材料の再生方法
US5293584A (en) * 1992-05-21 1994-03-08 International Business Machines Corporation Speech recognition system for natural language translation
US5502774A (en) 1992-06-09 1996-03-26 International Business Machines Corporation Automatic recognition of a consistent message using multiple complimentary sources of information
US5481278A (en) * 1992-10-21 1996-01-02 Sharp Kabushiki Kaisha Information processing apparatus
US5659771A (en) * 1995-05-19 1997-08-19 Mitsubishi Electric Information Technology Center America, Inc. System for spelling correction in which the context of a target word in a sentence is utilized to determine which of several possible words was intended
US5680511A (en) 1995-06-07 1997-10-21 Dragon Systems, Inc. Systems and methods for word recognition
US5852801A (en) 1995-10-04 1998-12-22 Apple Computer, Inc. Method and apparatus for automatically invoking a new word module for unrecognized user input
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
US5864805A (en) 1996-12-20 1999-01-26 International Business Machines Corporation Method and apparatus for error correction in a continuous dictation system
US6182028B1 (en) * 1997-11-07 2001-01-30 Motorola, Inc. Method, device and system for part-of-speech disambiguation
US6195637B1 (en) * 1998-03-25 2001-02-27 International Business Machines Corp. Marking and deferring correction of misrecognition errors
US6424983B1 (en) * 1998-05-26 2002-07-23 Global Information Research And Technologies, Llc Spelling and grammar checking system
US6457031B1 (en) * 1998-09-02 2002-09-24 International Business Machines Corp. Method of marking previously dictated text for deferred correction in a speech recognition proofreader
US6789231B1 (en) * 1999-10-05 2004-09-07 Microsoft Corporation Method and system for providing alternatives for text derived from stochastic input sources

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002156996A (ja) * 2000-11-16 2002-05-31 Toshiba Corp 音声認識装置、認識結果修正方法及び記録媒体
JP4509361B2 (ja) * 2000-11-16 2010-07-21 株式会社東芝 音声認識装置、認識結果修正方法及び記録媒体
JP2007528037A (ja) * 2003-06-02 2007-10-04 インターナショナル・ビジネス・マシーンズ・コーポレーション ハンドヘルド携帯装置のための音声入力メソッド・エディタのアーキテクチャ
JP2008537806A (ja) * 2005-02-08 2008-09-25 テジック コミュニケーションズ インク マニュアルで入力されたあいまいなテキスト入力を音声入力を使用して解決する方法および装置
JP4829901B2 (ja) * 2005-02-08 2011-12-07 テジック コミュニケーションズ インク マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置
WO2008150003A1 (ja) * 2007-06-06 2008-12-11 Nec Corporation キーワード抽出モデル学習システム、方法およびプログラム
JP5360414B2 (ja) * 2007-06-06 2013-12-04 日本電気株式会社 キーワード抽出モデル学習システム、方法およびプログラム
JP2015056154A (ja) * 2013-09-13 2015-03-23 独立行政法人情報通信研究機構 テキスト編集装置及びプログラム
JP2023515897A (ja) * 2020-04-20 2023-04-14 エーアイ スピーチ カンパニー リミテッド 音声対話の訂正方法及び装置
JP7413568B2 (ja) 2020-04-20 2024-01-15 エーアイ スピーチ カンパニー リミテッド 音声対話の訂正方法及び装置
JP2022169992A (ja) * 2021-04-28 2022-11-10 デロイトトーマツファイナンシャルアドバイザリー合同会社 情報処理装置、情報処理方法、端末プログラム、サーバプログラム及び契約書修正支援システム

Also Published As

Publication number Publication date
CN1290901A (zh) 2001-04-11
EP1091303A3 (en) 2003-02-05
US7546529B2 (en) 2009-06-09
US6789231B1 (en) 2004-09-07
US20050005240A1 (en) 2005-01-06
DE60032846D1 (de) 2007-02-22
DE60032846T2 (de) 2007-10-18
EP1091303A2 (en) 2001-04-11
EP1091303B1 (en) 2007-01-10

Similar Documents

Publication Publication Date Title
JP2001249920A (ja) 推測入力源からのテキストに対して候補を提供する方法およびシステム
US7912700B2 (en) Context based word prediction
US7149970B1 (en) Method and system for filtering and selecting from a candidate list generated by a stochastic input method
US5802504A (en) Text preparing system using knowledge base and method therefor
US6356866B1 (en) Method for converting a phonetic character string into the text of an Asian language
KR100650427B1 (ko) 자연어 인식 애플리케이션 구축을 위한 통합 개발 툴
JP3813911B2 (ja) 機械翻訳システム、機械翻訳方法及び機械翻訳プログラム
US20130073286A1 (en) Consolidating Speech Recognition Results
US20060123358A1 (en) Method and system for generating input grammars for multi-modal dialog systems
JP2008537260A (ja) ユーザ入力の予測変換
JP2016218995A (ja) 機械翻訳方法、機械翻訳装置及びプログラム
JP4502615B2 (ja) 類似文検索装置、類似文検索方法、およびプログラム
WO2021129074A1 (zh) 用于处理程序代码中的变量的引用的方法和系统
JPH06266779A (ja) 制御装置
CN112966479A (zh) 基于语言模型的辅助写作方法、装置和系统
JP2003271389A (ja) 自然言語によるソフトウェア・オブジェクトの操作方法及びそのためのプログラム
EP0720105B1 (en) System and method to review the processing of data according to user entered corrections
US20240311585A1 (en) Providing a well-formed alternate phrase as a suggestion in lieu of a not well-formed phrase
JP4043176B2 (ja) 自然言語処理装置
JP2000330984A (ja) 文書処理装置及び方法
JP2001014304A (ja) 文書作成装置、変換処理方法及び変換処理プログラムを記録した記録媒体
JPH0969104A (ja) 仮名漢字変換装置および仮名漢字変換方法
JP3051747B2 (ja) 機械翻訳方法及び機械翻訳システム
JP5481094B2 (ja) 文字列入力装置、文字列入力方法、および、プログラム
JP2004264960A (ja) 用例ベースの文変換装置、およびコンピュータプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20050517

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050517

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050517

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071002

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090430

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091023

A045 Written measure of dismissal of application [lapsed due to lack of payment]

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20100219