JP2008539476A - スペル提示の生成方法およびシステム - Google Patents

スペル提示の生成方法およびシステム Download PDF

Info

Publication number
JP2008539476A
JP2008539476A JP2008507657A JP2008507657A JP2008539476A JP 2008539476 A JP2008539476 A JP 2008539476A JP 2008507657 A JP2008507657 A JP 2008507657A JP 2008507657 A JP2008507657 A JP 2008507657A JP 2008539476 A JP2008539476 A JP 2008539476A
Authority
JP
Japan
Prior art keywords
word
candidate
replacement
input
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008507657A
Other languages
English (en)
Other versions
JP2008539476A5 (ja
Inventor
ダブリュ.ポッター ダグラス
シー.ハート ジュニア エドワード
イガラシ ヒサカズ
エム.シュミッド パトリシア
ディー.ラムジー ウィリアム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2008539476A publication Critical patent/JP2008539476A/ja
Publication of JP2008539476A5 publication Critical patent/JP2008539476A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

文字列の単語に対して置換語を提示するコンピュータ実施方法である。この方法において、入力語からなる入力文字列が受け取られる。入力語は次いで候補テーブルの対象語と照合される。次に、一致した対象語に対応する置換語候補と点数とが候補テーブルから抽出される。各点数は、入力語が対応する置換語候補で置換される確率を示す。最後に、入力語をその対応する置換語候補で置換することが、置換語に対する点数に基づいて選択的に提示される。本発明の別形態は、この方法を実施するよう構成したスペルチェックシステムを対象とする。

Description

本発明は一般にスペルチェック方法およびシステムに関し、より詳細には、入力文字列内の単語に基づいた入力文字列のスペルに対して置換語を提示するよう構成したスペルチェック方法およびシステムに関する。
文書処理アプリケーションを用いて生成した文書内にあるような入力テキストは、スペルミスを含む多くの様々な種類の誤りを含む可能性がある。結果として不正な単語となるスペルミスは一般に用語集(lexicon)ベースのスペルチェッカーで処理することができる。上記のミススペルは、単語のスペルのタイプミスまたは不案内により生ずる可能性がある。
用語集ベースのスペルチェッカーは入力テキスト内の単語を用語集の単語と比較し、用語集内に見つからなかった入力テキスト内の単語を識別する。1つまたは複数の置換語がスペルミスした単語に対して提示されることがよくある。例えば、入力テキスト「fly frm Boston」に対して、スペルチェッカーは「frm」をスペルミスとして識別するであろう。
その他の種類のミススペルでは、一般に従来のスペルチェックアプリケーションでは検出不可能である正式な語がある。例えば、意図した単語のスペルのタイプミスまたは不案内である結果、文書処理アプリケーションのユーザが意図せず正式な語を入力する場合がある。例えば、入力テキスト「fly form Boston」において単語「form」は、その単語が意図した単語「from」のミススペルだとしても従来のスペルチェックアプリケーションでは警告されない正式な語である。この種のミススペルの校正には一般に、その単語が使用されている文脈の分析が必要である。
一般には、従来のスペルチェックアプリケーションは、識別した不正な単語に対して編集距離(edit distance)に基づいて置換語を提示する。編集距離は、正式な代替語の形成に必要な変更を表す。不正な入力語から最短の編集距離を有する用語集内の単語は、ユーザに提示される最初の置換語である。例えば、語句「fly frm Boston」において大多数のスペルチェックアプリケーションは、正しい単語「from」を提示する前に「form」を置換語として提示するであろう。なぜならば、提示を行う際にその単語の文脈を考慮していないからである。ミススペルに対して最適な置換語を提示するため、ミススペルが見つかった文脈の分析を行わなければならない。
従って、ミススペルした単語に対する提示の向上と、使用が不適切な正式な単語に対する検出の改善を行うため、単語を使用している文脈を分析する能力のある改善されたスペルチェック方法およびシステムが必要である。
本発明の実施形態はこれらおよび他の問題に対する解決法を提供し、先行技術に対する利点を提供する。
一般には、本発明はスペルチェック方法およびシステムに関し、本スペルチェック方法およびシステムは対象語(subject word)と置換語候補(candidate replacement word)の対と各対に対する候補点数(candidate score)とを含む候補テーブルを利用し、その候補テーブルに基づいて単語の置換が提示される。
本発明の一態様は、文字列の単語に対して置換語を提示するコンピュータ実施方法に関する。この方法は、入力語の入力文字列が受け取られ、次いで、その入力語は候補テーブルの対象語と照合される。次に、照合された対象語に対応する置換語候補および候補点数が候補テーブルから抽出される。各候補点数は、対応する置換語候補で入力語が置換される確率を示す。最後に、入力語のそれに対応する置換語候補になる置換が、置換語の候補点数に基づいて選択的に提示される。
本発明の別態様は、入力文字列の入力語に対して置換語を提示するスペルチェックシステムを対象としている。システムは候補生成部(candidate generator)および文脈スペルエンジン(contextual spelling engine)を含む。候補生成部は、候補テーブルの対象語と一致する入力語の各々に対して、置換語候補および対応する候補点数の出力をする。各候補点数は、対応する置換語候補で入力語が置換される確率を示す。文脈スペルエンジンは、対応する候補点数に基づいて入力語に対する置換語候補を選択的に出力する。
本発明のさらなる別態様は候補テーブルの形成方法を対象にしている。この候補テーブルはスペルチェックシステムで使用され、入力文字列の入力語に対して置換語を提示する。この方法において単語の用語集が与えられる。次に、用語集内の対象語が用語集内の他の単語と比較される。次いでその比較に基づいて、置換語候補が対象語に対して識別される。次に、識別した対象語とそれに対応する置換語候補との対を含む候補テーブルが形成される。最後に、候補テーブルはコンピュータ可読媒体に格納される。
本発明の実施形態を特徴付ける他の特徴および利点は、以下の詳細説明および添付図面を参照することで明らかになるであろう。
本発明は一般に、不正な入力文字列の入力語に対して正確な置換語を提供するスペルチェック方法およびシステムに関する。さらに、本発明のスペルチェック方法およびシステムは、不適切に使用した入力文字列の正式な入力語に対して、置換語候補の提示を提供することができる。本発明の実施形態は、入力語が使用されている文脈上の置換語の提示に基づいている。
本発明を詳細に説明する前に、本発明を使用できるコンピューティング環境の例を説明する。
コンピューティング環境の例
図1は、本発明を実施可能な適切なコンピューティングシステム環境100の一例を示す。コンピューティングシステム環境100は適切なコンピューティング環境の一例でしかなく、本発明の使用または機能性の範囲に対する限定を示唆するとは意図していない。また、コンピューティング環境100は動作環境例100に示した構成要素の1つまたは組合せに関する依存性または要件を有するとも解釈されるべきでない。
本発明は、多数の他の汎用または特殊用途コンピューティングシステム環境または構成で動作可能である。本発明の使用に適した公知のコンピューティングシステム、環境、および/または構成の例は、これらに限らないが、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドまたはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラム可能家電機器、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記システムまたは装置の任意のものを含む分散コンピューティング環境、等を含む。
本発明は、コンピュータが実行中のプログラムモジュールなどの、コンピュータ実行可能命令の一般的な文脈で記述できる。一般に、プログラムモジュールはルーチン、プログラム、オブジェクト、コンポーネント、データ構造、等を含み、これらは特定のタスクを実行するかまたは特定の抽象データ型を実装する。本発明は分散コンピューティング環境で実施することができ、その環境では、通信ネットワークを通して接続したリモート処理装置によりタスクが実行される。分散コンピューティング環境においては、メモリ記憶装置を含むローカルおよびリモートコンピュータ記憶媒体の両方にプログラムモジュールを置くことができる。
図1を参照すると、本発明を実装するシステムの例は汎用コンピューティングデバイスをコンピュータ110の形式で含む。コンピュータ110の構成要素は、これらに限らないが、処理装置120、システムメモリ130、およびシステムメモリを含む様々なシステムコンポーネントを処理装置120に接続するシステムバス121を含む。システムバス121は数種のバス構造のうち任意のものでよく、それらはメモリバスまたはメモリ制御装置、周辺バス、および様々な任意のバスアーキテクチャを用いるローカルバスがあげられる。限定としてではなく例として、上記アーキテクチャは業界標準アーキテクチャ(ISA)バス、マイクロチャネルアーキテクチャ(MCA)バス、拡張ISA(EISA)バス、ビデオ電子標準協会(VESA)ローカルバス、およびメザニンバスとしても知られる周辺コンポーネント相互接続(PCI)バスを含む。
コンピュータ110は、典型的には様々なコンピュータ可読媒体を含む。コンピュータ可読媒体はコンピュータ110がアクセス可能な任意の利用可能媒体で可能であり、揮発性および不揮発性媒体、ならびに取り外し可能および取り外し不可能媒体の両方を含む。限定としてではなく例として、コンピュータ可読媒体はコンピュータ記憶媒体と通信媒体を含む。コンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュールまたは他のデータなどの情報を格納する任意の方法または技術で実装した、揮発性および不揮発性媒体、取り外し可能および取り外し不可能媒体を含む。コンピュータ記憶媒体は、これらに限らないが、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)または他の光ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶装置、あるいは所望の情報の格納に使用可能で、コンピュータ110がアクセス可能な任意の他の媒体を含む。通信媒体は、典型的にはコンピュータ可読命令、データ構造、プログラムモジュールまたは他のデータを、搬送波などの変調データ信号、または他のトランスポート機構で具現化し、任意の情報配信媒体を含む。用語「変調データ信号」は、1つまたは複数の特性セットを有する信号が、信号内の情報を符号化するように設定または変更した信号を意味する。限定としてではなく例として、通信媒体は、有線ネットワークまたは直接有線接続などの有線媒体、並びに音響、RF、赤外線および他の無線媒体などの無線媒体を含む。上記の任意の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。
システムメモリ130はコンピュータ記憶媒体を、読取専用メモリ(ROM)131およびランダムアクセスメモリ(RAM)132などの揮発性および/または不揮発性メモリの形式で含む。例えば起動時にコンピュータ110内部の構成要素間の情報転送を支援する基本ルーチンを含む基本入出力システム133(BIOS)が、典型的にはROM131内に格納される。RAM132は、典型的には、処理装置120が即座にアクセス可能および/または処理装置120上で現在実行中のデータおよび/またはプログラムモジュールを含む。限定としてではなく例として、図1はオペレーティングシステム134、アプリケーションプログラム135、他のプログラムモジュール136およびプログラムデータ137を示す。
コンピュータ110は他の取り外し可能/取り外し不可能、揮発性/不揮発性コンピュータ記憶媒体もまた含むことができる。ほんの一例として、図1は取り外し不可能、不揮発性磁気媒体を読み書きするハードディスクドライブ141、取り外し可能、不揮発性磁気ディスク152を読み書きする磁気ディスクドライブ151、およびCD ROMまたは他の光媒体のような取り外し可能、不揮発性光ディスク156を読み書きする光ディスクドライブ155を示す。動作環境の例において使用可能な他の取り外し可能/取り外し不可能、揮発性/不揮発性コンピュータ記憶媒体は、これらに限定されないが、磁気テープカセット、フラッシュメモリカード、デジタル多用途ディスク、デジタルビデオテープ、半導体RAM、半導体ROM、等を含む。ハードディスクドライブ141は、典型的にはインタフェース140などの取り外し不可能メモリインタフェースを介してシステムバス121に接続され、磁気ディスクドライブ151および光ディスクドライブ155は、典型的にはインタフェース150などの取り外し可能メモリインタフェースによりシステムバス121に接続される。
上述し、図1に示したドライブとそれらの関連コンピュータ記憶媒体は、コンピュータ110に対するコンピュータ可読命令、データ構造、プログラムモジュールおよび他のデータを格納する。例えば、図1においてハードディスクドライブ141はオペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146およびプログラムデータ147を格納するとして示される。これらのコンポーネントはオペレーティングシステム134、アプリケーションプログラム135、他のプログラムモジュール136、およびプログラムデータ137と同じか、または異なるかのいずれでも可能であることに留意されたい。本明細書において、オペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146、およびプログラムデータ147に異なる番号を与え、少なくともそれらが異なるコピーであることを示す。
ユーザは、キーボード162、マイクロフォン163および、マウス、トラックボールまたはタッチパッド等のポインティングデバイス161などの入力装置を介して、命令および情報をコンピュータ110に入力できる。他の入力装置(不図示)はジョイスティック、ゲームパッド、パラボラアンテナ、スキャナ、等を含むことができる。これらおよび他の入力装置は、システムバスに接続されるユーザ入力インタフェース160を介して処理装置120に接続されることがよくあるが、パラレルポート、ゲームポートまたはユニバーサルシリアルバス(USB)などの他のインタフェースおよびバス構造により接続することもできる。モニタ191または他種の表示装置は、また、ビデオインタフェース190などのインタフェース経由でシステムバス121に接続される。そのモニタに加えて、コンピュータはスピーカ197およびプリンタ196などの他の周辺出力装置を含むこともでき、周辺出力インタフェース190を介してそれらを接続することができる。
コンピュータ110は、リモートコンピュータ180などの1つまたは複数のリモートコンピュータに対する論理接続を用いてネットワーク環境で動作することができる。リモートコンピュータ180はパーソナルコンピュータ、ハンドヘルドデバイス、サーバ、ルータ、ネットワークPC、ピアデバイスまたは他の共通ネットワークノードであることが可能であり、典型的にはコンピュータ110に関して上述した構成要素の多く、または全てを含む。図1に示した論理接続はローカルエリアネットワーク(LAN)171および広域通信網(WAN)173を含むが、他のネットワークを含むこともできる。上記のネットワーク環境は職場、企業規模のコンピュータネットワーク、イントラネットおよびインターネットで一般的である。
LANネットワーク環境で使用するとき、コンピュータ110はネットワークインタフェースまたはアダプタ170を介してLAN171に接続される。WANネットワーク環境で使用するとき、コンピュータ110は、典型的にはモデム172、またはインターネットなどのWAN173上で通信を確立する他の手段を含む。モデム172は内部または外部にあってよく、ユーザ入力インタフェース160または他の適切な機構を経由してシステムバス121に接続可能である。ネットワーク環境において、コンピュータ110に対して示したプログラムモジュールまたはその一部は、リモートメモリ記憶装置に格納することができる。限定としてではなく例として、図1はリモートアプリケーションプログラム185がリモートコンピュータ180上に存在するとして示す。示したネットワーク環境は例であって、コンピュータ間の通信を確立する他の手段を使用できることは理解されるであろう。
本発明は図1に関して説明したようなコンピュータシステム上で実行できることは留意すべきである。しかしながら、本発明はサーバ、メッセージ処理専用のコンピュータ上で実行することができ、また、本発明の様々な部分が、分散コンピューティングシステムの様々な部分で実行される分散システム上で実行できる。
スペルチェック方法およびシステム
上述したように、本発明は、一般には不正な入力文字列の入力語に対して、正確な置換語を提示するスペルチェック方法およびシステムに関する。さらに、本発明のスペルチェック方法およびシステムは、使用が不適切だが正式である入力文字列の入力語に対して置換語を提示することができる。本発明が提示する置換語は、一般に入力語が使用される文脈に基づいている。
さらに、本発明はスペルチェックに対してデータ駆動型のアプローチを与える。結果として、スペルチェック方法およびシステムの実施形態は、構文またはルールベースの文法チェッカーと同様な理論的な言語学的専門知識を必要としない。また、本実施はルールベースのシステムより非常に単純で、保守およびセキュリティのコストが少ない。さらに、候補を生成する機構は一般に言語非依存性であり、複数の言語に容易に拡張できる。
本発明の実施形態を図2および図3を参照して説明する。図2は、本発明の実施形態に従った文字列の単語に対して置換語を提示する方法を示すフローチャートである。図3は本発明の実施形態に従うスペルチェックシステム200のブロック図であり、前記方法を実施するよう構成されている。
当該方法のステップ202では、入力語の入力文字列204がスペルチェックシステム200により受け取られる。文書処理アプリケーション206のユーザは入力文字列204を、キーボード、マイクロフォン(即ち、口述で)、または他の従来方法を通して最初に入力できる。または、入力文字列204を既存の文書、ウェブページ、または別の情報源から抽出することができる。
アプリケーション206は入力文字列204をシステム200に対して完全な文で与えることが望ましい。さらに、入力文字列204をスペルチェックシステム200に対してトークン化した形で、または他の認識可能な形式で与えることができ、またはシステム200が入力文字列204をこのような形式に変換することができる。
入力文字列はシステム200の文脈スペルエンジン210から候補生成部208に与えられる。入力文字列204は正式な(即ち、正確なスペルの)単語のみを含むことが望ましい。
前記方法の一実施形態によると、入力文字列204のミススペル入力文字列は用語集ベースのスペルチェッカー212を用いて校正される。スペルチェッカー212は入力文字列204の各入力語を用語集214の単語と比較する。用語集214内に含まれない入力語に対して提示される置換は、従来の方法に従ってスペルチェッカー212により生成される。スペルチェッカー212が生成した置換候補はユーザに提示され、ユーザはスペルチェッカー212が識別したスペルミス単語に対してその置換候補の中から選択し、それにより入力文字列が修正される。あるいは、ミススペルした入力語に対してスペルチェッカー212が生成する提示された校正候補は、候補生成部208に提供され、その候補生成部208は正式な語のみ含む入力文字列を形成する。正式な単語のみを含む入力文字列は、次に候補生成部208により分析される。
候補生成部208の目的は、入力文字列204の入力語と、同様または関連する置換語候補を識別することである。置換語候補は後にアプリケーション206へ、入力語に対して提示した置換語として提供できる。置換語候補および入力語の対は候補テーブル216に含まれる。
表1は、本発明の実施形態に係る候補テーブル216の一部の例である。候補テーブル216は、各々が置換語候補に関連付けられる対象語と、対象語が置換語候補で置換される確率を示す候補点数とを含む。
Figure 2008539476
候補テーブル216の一実施形態は、各対象語と置換語候補との対に対する編集エントリを含む。編集エントリは、置換語候補の形成のために対象語に対して実施されなければならない変換を記述する。例えば、「aback」を「alack」に変換するため、「aback」の「b」は「l」に変換されなければならず、これを「b:l」と表す。同様に、「aback」内の最初の「a」を削除して置換語候補「back」を形成することは「a:」と表すことができる。「abalones」に「’」を追加して「abalone’s」にすることは単純に「A」で表すことができる。対象語「break」に対する「brake」などの同音異義語の置換語候補は「H」と表される。また、他の方法を使用して、対応する置換語候補に対象語を変換するために実行しなければならない様々な編集を識別することができる。
文脈スペルエンジン210は候補テーブル内の編集エントリを使用して、入力文字列の分析中に置換語候補に対する点数を修正することができる。編集エントリをクラスに分類し、編集タイプクラスの頻度などの情報を反映する様々な値を割当てることができる。その値が高ければ、置換語候補の点数に及ぼす編集タイプの影響が高くなる。これらのクラスまたは編集タイプの点数を候補点数に追加するかまたは含めることができる。例えば、対象語の開始文字を削除して置換語候補を形成した結果、その置換語候補の点数が増加する可能性がある。
本発明の一実施形態によると、候補テーブル216はコンピュータ可読媒体にバイナリファイルとして格納され、スペルチェックシステム200による迅速なアクセスのためにコンピューティング環境のメモリにロードされる。本発明の一実施形態によると、候補テーブル216はハッシュテーブルとしてバイナリファイル内に格納される。
候補テーブル216の別の実施形態によると、対象語および置換語候補を識別するために用語集識別子が使用される。用語集識別子は、図3に示す用語集214などの用語集内の対応する単語へリンクを張っている。本発明のこの実施形態は、大規模な候補テーブル216の格納に必要なメモリ量を削減するように動作する。
当該方法のステップ218で、候補生成部208は入力文字列204の入力語を候補テーブル216の対象語と照合する。次いでステップ220で、置換語候補222および対応する候補点数224が、一致した対応する対象語に基づいて入力文字列204の各入力語に対して候補テーブル216から抽出される。同一の対象語または入力語に関連する多数の置換語候補が存在する可能性があるので、候補生成部208はそれぞれの一致入力語に対して置換語候補と点数との対を複数生成する可能性がある。置換語候補222および点数224の対は文脈スペルエンジン210に出力されてさらに処理される。
一般には、候補テーブル216内の候補点数224は、対応する置換語候補で入力語が置換される確率を示す。さらに、候補点数224は、対象語と対応する置換語候補222との間にある誤りの数を反映することができる。
本発明の一実施形態によると、候補スコア224は1つまたは複数の因子に基づき、それらの各々は互いに掛け合わされて、候補テーブル216内の対象語と置換語候補との対に対する候補点数を形成することが望ましい。上記因子は対象語および置換語候補の間の編集距離またはタイピング距離、ヒューリスティック、対象語および置換語候補の発音の違い、ならびに置換語候補が対象語を置換する可能性に関連する他の因子を含む。
編集タイプとヒューリスティックに基づく候補点数224は、対象語と置換語候補との間の差異に依存して変化する。例えば、単数形の対象語が複数形の置換語候補に変換される可能性は非常に低い。結果として、上記の置換語候補には低い候補点数を与えるべきである。他方、対象語から置換語候補への変換が、最も一般的に起きるスペルミスに関する先頭文字のみの変換を含むとき、上記対象語および置換語候補の対は高い候補点数を得る。
また、対象語への空白追加による対象語の2語への分割に基づく点数も、編集距離に関連する。そのような編集は一般に、それらが相対的に高頻度で出現するので高い候補点数が与えられる。
置換語候補が対象語の同音異義語または同音異義語に近いとき、その単語の対は、置換語候補の発音が対象語と十分には類似していないときよりも高い点数が与えられる。
当該方法のステップ226で、文脈スペルエンジン210は、置換語候補222の対応点数224に基づいて、入力文字列204の入力語に対する置換語候補222の出力230を選択的に生成する。本発明の一実施形態によると、システム200は文脈スペルエンジン210から置換文字列候補242を受信する言語モデル240を含む。置換文字列候補242は修正入力文字列204であり、それらの各々は対応する入力語の代わりとなる置換語候補222を含む。
言語モデル240は、置換文字列候補242の各々に対する確率点数244を出力するよう動作する。一般には、確率点数244は、文の大きなログに対する統計データ246(即ち、他の単語に対する単語の出現頻度データ)に基づいて特定の置換文字列候補242を発見する可能性の指標を与える。一般に、特定の単語の文字列が見つかる可能性が高くなれば、その文字列に含まれる単語が正しく使用される可能性がより高くなると考えられる。従って、各置換文字列候補242に対する確率点数244は、その文字列内の入力文字と置換語候補との正しい組合せをもたらす。
所与の単語の文字列(即ち、w,w,w,...,w)に対する確率点数244(P(context)で表す)を、式1に従い統計データ246を用いて計算できる。一般に、文字列の確率は、他の単語が与えられた場合に各単語が文字列内に出現する確率に等しい。従って文字列の確率は、第1の単語の確率(P(w))に第1の単語が与えられた場合の第2の単語の確率を乗じたもの(P(w|w))に第1および第2の単語が与えられた場合の第3の単語の確率を乗じたもの(P(w|w,w))、等々となる。
P(context)=P(w)*P(w|w)*P(w|w,w)*...
*P(w|wN−1,wN−2...w,w
式1
本発明の一実施形態によると、式2で与えられる式1のトライグラム(trigram)近似が使用される。文字列の各単語に対してトライグラム近似は、文字列のN個の単語全てではなく(存在するならば)2つの先行語を使用する。
P(context)〜P(w)*P(w|w)*P(w|w,w)*...
*P(w|wN−1,wN−2
式2
本発明の一実施形態によると、文脈スペルエンジン210は各置換語文字列候補に対する最終点数に基づいて、提示した置換語候補または置換文字列候補230を選択してアプリケーション206に出力する。最終点数(P(candidate|input word,context)で表す)がそれぞれ、式3に従って計算される。この計算は、置換文字列候補に対する確率点数(P(context,candidate)で表す)に、置換文字列候補242を形成するために入力語を置換した置換語候補222(candidate)に対応する候補点数224を乗じることで行われる。
例えば、「I see you to」という入力文字列204の入力語「to」に対して、置換語候補222「too」、「tot」、および「two」がそれらの対応点数224とともに候補生成部208により生成されるとしよう。対応する置換文字列候補242は次いで「I see you too」、「I see you tot」、および「I see you two」となる。文脈スペルエンジン210は次に言語モデル240に対する呼び出しを何回か行い、言語モデル240は置換文字列候補242の各々に対する確率点数を計算する。
次いで置換文字列候補242に対する最終点数が文脈スペルエンジン210によって、それらの確率点数244にそれらの対応する候補点数224を乗じることで計算される。従って、置換文字列候補242「I see you too」に対する最終点数は、文字列「I see you too」の確率に、候補テーブル216から得た入力語「to」に対する置換語候補「too」に対応する点数224を乗じたものに等しい。
本発明の一実施形態によると、最高の最終点数を有する置換文字列候補の置換語候補222が、文脈スペルエンジン210により出力230としてアプリケーション206に提示される。または、文脈スペルエンジン210は最高の最終点数を有する置換文字列候補242に対応する置換語候補222のみを、それが閾値を超えると提示することができる。本発明の別の実施形態によると、閾値を超える最終点数を有する複数の置換語候補222は文脈スペルエンジン210により出力230としてアプリケーション206に提示される。
閾値は、対象語および候補語の確率の関数として予め決定するか動的に計算することができる。一実施形態において、閾値はThreshold=αP(subject words)+βP(candidate words)+γP(input words)−P(candidate words)から動的に決定される。
候補テーブルの生成
図4は、本発明の実施形態に従ってスペルチェックシステム200が使用するための候補テーブル216の生成方法を示すフローチャートである。この方法のステップ250で、単語の用語集が与えられる。用語集は非常に大規模(例えば、10万語以上)であることが望ましい。次にステップ252で、用語集内の対象語は用語集内の他の単語と比較される。用語集の各単語、または少なくとも用語集のうち最も頻繁に使用される単語は、それぞれ用語集内の他の単語と比較される対象語となることが望ましい。ステップ254で、置換語候補がステップ252の比較に基づいて対象語に対して識別される。
本発明の一実施形態によると、対象語を用語集内の他の単語と比較すること(ステップ252)は、対象語に対する用語集の各単語間の編集距離またはタイピング距離を計算すること、および編集距離を編集距離の閾値と比較することを含む。編集距離閾値を満足する編集距離を有する置換語候補は、対象語に対する置換語候補として識別される。閾値の「満足」は編集距離の計算方法に依存しており、その閾値に到達すること、その閾値を超えること、またはその閾値を下回ることにより満足されると意図されることは理解されるべきである。
比較ステップ252の別の実施形態によると、用語集の各単語の意味が対象語と比較される。識別ステップ254は、次いで、意味が対象語の意味と同様である用語集の単語を置換語候補として識別することを含む。例えば、対象語の同義語が置換語候補として特定される。本発明の一実施形態によると、用語集の対象語はシソーラスデータに対して照合され(check)、当該方法のステップ254で同様な意味を有する置換語候補がシソーラスデータから置換語候補として識別される。
比較ステップ252の別の実施形態によると、用語集内の単語の発音表記が用語集の対象語と比較される。用語集の単語の発音表記は、単語を従来のテキストスピーチ変換エンジンに与えることで自動的に生成されるのが望ましい。対象語の発音表記に一致する発音表記を有する用語集の単語は、識別ステップ254で対象語に対する置換語候補として識別される。これらの対の例には「bear」と「bare」、および「which」と「witch」があげられる。従って、対象語の同音異義語が置換語候補として識別される。本発明の別の実施形態によると、近似的に同音異義語である用語集の単語(即ち、閾値を満足するもの)も置換語候補として識別される。
本発明の別の実施形態は文の大きなログ内に発見されたバイグラム(即ち、単語の対)の分析を含む。この分析は、バイグラムの第1単語と第2単語との間に位置する空白をシフトまたは削除すると少なくとも1つの正式な語が生成されるか否かを決定することを含む。比較ステップ252の一実施形態は、空白シフト分析から生成した正式な語と対象語を比較することを含む。第1単語の終端文字の前、または第2単語の先頭文字の後のいずれかの空白をシフトすることにより、またはその空白を削除することにより形成した正式な語のみを、比較ステップ252で使用することが望ましい。なぜならば、それらはより一般的な誤植に対応しているからである。対象語に一致する新規形成した正式な語は次いで、ステップ254で対象語に対する置換語候補として識別される。例えば、単語の対「use swords」に対する置換語候補は「uses words」であり、単語の対「dog sand」に対する置換語候補は「dogs and」である。同様に、単語の対「any one」に対する置換語候補は「anyone」であり、逆に、単語対「anyone」に対する置換語候補は「any one」である。
当該方法のステップ256で、対象語とそれに対応する識別された置換語候補との対を含む候補リスト216が形成される。最後にステップ258で、候補テーブル216が図1に関して上述したようなコンピュータ可読媒体に格納される。
本発明の別の実施形態によると、上述のように置換語候補が対応する対象語を置換する確率に基づいて、ステップ256で対象語と置換語候補との対の各々に対して候補点数224が生成される。候補点数は、比較ステップ252で分析および上述した1つまたは複数の因子に基づくことが望ましい。候補点数はステップ258で、コンピュータ可読媒体に格納される候補テーブル216に含まれる。
候補排除テーブル
本発明の別の実施形態によると、候補排除テーブル260が生成される。候補排除テーブル260は、候補生成部208が文脈スペルエンジン210に置換語候補222として提示すべきでない或る特定の置換語候補を識別する。従って、候補排除テーブル260は、不適切または望ましくない置換語候補が文脈スペルエンジン210によってアプリケーション206に提示されることを防止する。候補排除テーブル260は不快感を与えるような置換語候補を含むことが望ましい。さらに、「rough」および「tough」などの明確化が困難で同様な文脈に頻繁に出現する単語を候補排除テーブルに含めることができる。「color」と「colour」、または「goodbye」と「good−bye」などの、同じ対象語でスペルが異なる受入れ可能なものは、それらを候補排除テーブル260に含めることで削除される。また、単数形の入力語を複数形とする誤植は稀であるので、単数形の対象語とそれらの複数形は候補排除テーブル260に含めることが望ましい。
本発明の一実施形態によると、候補テーブル216は周期的に更新され、候補排除テーブル260内に照合語の対を有する対象語と置換語候補との対を削除する。さらに、候補排除テーブル260内のものと一致する置換語候補を有する候補テーブル216内の対象語と置換語候補との対も削除することができる。その結果、候補テーブル216の大きさが削減され、スペルチェックシステム200がより効率的に動作することができる。
本発明は特定の実施形態を参照して説明してきたが、当業界の技術者は、本発明の要旨および範囲から逸脱することなく形式的且つ詳細に変更を加えることができることを理解するだろう。
本発明を実施可能なコンピューティング環境のブロック図である。 本発明の実施形態に従って、文字列の単語に対して置換語を提示する方法を示すフローチャートである。 本発明の実施形態に従うスペルチェックシステムのブロック図である。 本発明の実施形態に従ってスペルチェックシステムが、入力文字列の入力語に対して置換語を提示するために使用する、候補テーブルの生成方法を示すフローチャートである。

Claims (20)

  1. 文字列の単語に対して置換語を提示するコンピュータ実施方法であって、
    a)入力語の入力文字列を受信するステップと、
    b)前記入力語を候補テーブルの対象語と照合するステップと、
    c)前記の照合された対象語に対応する置換語候補および候補点数を前記候補テーブルから抽出するステップであって、各候補点数は前記入力語が前記の対応する置換語候補で置き換えられる確率を示すステップと、
    d)前記置換語に対する候補点数に基づいて、前記入力語を該入力語に対応する置換語候補で選択的に置換することを提示するステップと
    を含むことを特徴とする方法。
  2. ミススペルした入力語を前記照合ステップb)の前に校正するステップをさらに含み、それにより前記入力文字列はスペルが正しい入力語のみを含むことを特徴とする請求項1に記載の方法。
  3. 前記入力文字列の前記入力語を前記の対応する置換語候補で置換することより、前記置換語候補を用いて置換文字列候補を形成するステップをさらに含むことを特徴とする請求項1に記載の方法。
  4. 前記置換文字列候補に対して確率点数を計算するステップをさらに含み、
    各確率点数は前記入力語と、前記置換文字列候補内に含まれる前記置換語候補とに基づき、
    前記提示ステップd)は前記確率点数に基づいて前記置換文字列候補の前記の対応する置換語候補で前記入力語の置換を提示することをさらに含むことを特徴とする請求項3に記載の方法。
  5. 前記提示ステップd)は前記確率点数に前記対応する候補点数を乗じて前記置換文字列候補の各々に対する最終点数を得ることを含み、
    前記提示ステップd)は、最高の最終点数を有する前記置換文字列候補の前記の対応する置換語候補で前記入力語の置換を提示することを含むことを特徴とする請求項4に記載の方法。
  6. 前記候補テーブルの前記対象語及び前記の対応する置換語候補は、それぞれ、用語集内の単語を識別する用語集識別子の形であることを特徴とする請求項1に記載の方法。
  7. 前記候補テーブルの前記置換語候補は、閾値を満足する該置換語候補に対応する対象語からの編集距離を有する単語を含むことを特徴とする請求項1に記載の方法。
  8. 前記候補テーブルの前記置換語候補は、該置換語候補に対応する対象語に対して同様な意味を有する単語を含むことを特徴とする請求項1に記載の方法。
  9. 前記候補テーブルの前記置換語候補は、該置換語候補に対応する対象語と発音が一致する単語を含むことを特徴とする請求項1に記載の方法。
  10. 前記候補テーブルの前記置換語候補は、該置換語候補に対応する対象語に対する一般的な校正である単語を含むことを特徴とする請求項1に記載の方法。
  11. 入力文字列の入力単語に対して置換語を提示するスペルチェックシステムにより使用するための候補テーブルを生成するコンピュータ実施方法であって、
    a)単語の用語集を供給するステップと、
    b)前記用語集内の対象語を前記用語集内の前記単語と比較するステップと、
    c)前記比較ステップb)に基づいて前記対象語に対する置換語候補を識別するステップと、
    d)前記対象語と該対象語に対応する識別した置換語候補とを対にした候補テーブルを形成するステップと、
    e)前記候補テーブルをコンピュータ可読媒体に格納するステップと
    を含むことを特徴とする方法。
  12. 前記比較ステップe)は前記用語集内の前記単語から前記対象語に対して測定した編集距離を編集距離の閾値と比較することを含み、
    前記識別ステップc)は前記対象語からの編集距離が編集距離の閾値を満足する置換語候補を前記対象語の各々に対して識別することを含むことを特徴とする請求項11に記載の方法。
  13. 前記比較ステップb)は前記用語集における他の単語の各々の意味を前記対象語の各々と比較することを含み、
    前記識別ステップc)はその意味が前記対象語と同様である置換語候補を前記対象語の各々に対して識別することを特徴とする請求項11に記載の方法。
  14. 前記比較ステップb)は前記用語集における前記単語の各々の発音表記を前記対象語の各々の発音表記と比較することを含み、
    前記識別ステップc)はその発音表記が前記対象語の発音表記と一致する置換語候補を前記対象語の各々に対して識別することを特徴とする請求項11に記載の方法。
  15. 前記形成ステップd)は前記置換語候補が前記の対応する対象語に置換される確率に基づいて対象語と置換語候補との対の各々に対する候補点数を生成し、前記候補点数を含むように前記候補テーブルを形成することを含むことを特徴とする請求項11に記載の方法。
  16. 前記候補点数は前記置換語候補と前記の対応する対象語との間の編集距離に基づくことを特徴とする請求項15に記載の方法。
  17. 文のログ内で空白により分割した第1の単語と第2の単語とを有する単語の対を分析するステップであって、前記分析するステップは、前記空白の削除、前記第1の単語の終端文字の前にある前記空白の移動、および前記第2の単語の先頭文字の後にある前記空白の移動のうちの1つにより形成される新規正式な語を識別することを含むステップと、
    前記形成ステップd)において前記新規正式な語を、第1の単語および第2の単語のうち対応する一方に対する置換語候補として前記候補テーブルに追加するステップと
    を含むことを特徴とする請求項11に記載の方法。
  18. 入力文字列の入力語に対して置換語を提示するスペルチェックシステムであって、
    候補テーブルの対象語に一致する前記入力語の各々に対して置換語候補と対応する候補点数とを出力する候補生成部であって、各候補点数は前記入力語が前記の対応する置換語候補で置換される確率を示す候補生成部と、
    前記の対応する候補点数に基づいて前記入力語に対する置換語候補を選択的に出力する文脈スペルエンジンと
    を備えることを特徴とするシステム。
  19. 前記候補生成部が出力した前記の対応する置換語候補により置換された少なくとも1つの前記入力語を有する前記入力文字列に対応する置換文字列候補に関する確率点数の出力を有する言語モデルを含み、
    前記確率点数の出力は前記置換文字列候補の正確性の指標であり、
    前記文脈スペルエンジンが生成した置換語候補の選択的な出力は、前記置換文字列候補に含まれる前記置換語候補に対応した前記確率点数の出力と前記候補点数とに基づくことを特徴とする請求項18に記載のシステム。
  20. 前記候補生成部の前記出力及び前記文脈スペルエンジンの前記出力のうちの1つから排除される置換語候補のリストを含む候補排除テーブルを含むことを特徴とする請求項18に記載のシステム。
JP2008507657A 2005-04-25 2006-03-14 スペル提示の生成方法およびシステム Pending JP2008539476A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/113,612 US7584093B2 (en) 2005-04-25 2005-04-25 Method and system for generating spelling suggestions
PCT/US2006/009147 WO2006115598A2 (en) 2005-04-25 2006-03-14 Method and system for generating spelling suggestions

Publications (2)

Publication Number Publication Date
JP2008539476A true JP2008539476A (ja) 2008-11-13
JP2008539476A5 JP2008539476A5 (ja) 2009-05-07

Family

ID=37188148

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008507657A Pending JP2008539476A (ja) 2005-04-25 2006-03-14 スペル提示の生成方法およびシステム

Country Status (9)

Country Link
US (1) US7584093B2 (ja)
EP (1) EP1875462A4 (ja)
JP (1) JP2008539476A (ja)
KR (1) KR101292404B1 (ja)
CN (1) CN101371253B (ja)
BR (1) BRPI0609108A2 (ja)
MX (1) MX2007013357A (ja)
RU (1) RU2007139510A (ja)
WO (1) WO2006115598A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011023007A (ja) * 2009-07-17 2011-02-03 Nhn Corp 統計データに基づくユーザクエリ校正システムおよび方法
JP2023501761A (ja) * 2020-10-25 2023-01-19 グーグル エルエルシー 動的空間モデルに基づく仮想キーボードエラー訂正
US11698699B2 (en) 2020-10-25 2023-07-11 Google Llc Virtual keyboard error correction based on a dynamic spatial model

Families Citing this family (243)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7831911B2 (en) * 2006-03-08 2010-11-09 Microsoft Corporation Spell checking system including a phonetic speller
US7562811B2 (en) 2007-01-18 2009-07-21 Varcode Ltd. System and method for improved quality management in a product logistic chain
WO2007129316A2 (en) 2006-05-07 2007-11-15 Varcode Ltd. A system and method for improved quality management in a product logistic chain
EP1855210B1 (en) * 2006-05-11 2018-01-03 Dassault Systèmes Spell checking
US7565624B2 (en) 2006-06-30 2009-07-21 Research In Motion Limited Method of learning character segments during text input, and associated handheld electronic device
US8395586B2 (en) 2006-06-30 2013-03-12 Research In Motion Limited Method of learning a context of a segment of text, and associated handheld electronic device
US9552349B2 (en) * 2006-08-31 2017-01-24 International Business Machines Corporation Methods and apparatus for performing spelling corrections using one or more variant hash tables
US8626486B2 (en) * 2006-09-05 2014-01-07 Google Inc. Automatic spelling correction for machine translation
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US9275036B2 (en) * 2006-12-21 2016-03-01 International Business Machines Corporation System and method for adaptive spell checking
US8074172B2 (en) 2007-01-05 2011-12-06 Apple Inc. Method, system, and graphical user interface for providing word recommendations
US7991609B2 (en) * 2007-02-28 2011-08-02 Microsoft Corporation Web-based proofing and usage guidance
US8775931B2 (en) * 2007-03-30 2014-07-08 Blackberry Limited Spell check function that applies a preference to a spell check algorithm based upon extensive user selection of spell check results generated by the algorithm, and associated handheld electronic device
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
JP2010526386A (ja) 2007-05-06 2010-07-29 バーコード リミティド バーコード標識を利用する品質管理のシステムと方法
CN101802812B (zh) * 2007-08-01 2015-07-01 金格软件有限公司 使用互联网语料库的自动的上下文相关的语言校正和增强
US8055670B2 (en) * 2007-08-13 2011-11-08 Yahoo! Inc. System and method for the generation of replacement titles for content items
US7761524B2 (en) * 2007-08-20 2010-07-20 International Business Machines Corporation Automatically generated subject recommendations for email messages based on email message content
US20090100335A1 (en) * 2007-10-10 2009-04-16 John Michael Garrison Method and apparatus for implementing wildcard patterns for a spellchecking operation
WO2009063464A2 (en) 2007-11-14 2009-05-22 Varcode Ltd. A system and method for quality management utilizing barcode indicators
US8176419B2 (en) * 2007-12-19 2012-05-08 Microsoft Corporation Self learning contextual spell corrector
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8232973B2 (en) 2008-01-09 2012-07-31 Apple Inc. Method, device, and graphical user interface providing word recommendations for text input
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20090300126A1 (en) * 2008-05-30 2009-12-03 International Business Machines Corporation Message Handling
US11704526B2 (en) 2008-06-10 2023-07-18 Varcode Ltd. Barcoded indicators for quality management
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8762153B2 (en) * 2008-08-18 2014-06-24 At&T Intellectual Property I, L.P. System and method for improving name dialer performance
KR101480711B1 (ko) * 2008-09-29 2015-01-09 에스케이플래닛 주식회사 주제 탐지 장치와 주제 탐지 방법, 저장 매체, 정보 제공 시스템, 서비스 서버 및 방법
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
KR101126406B1 (ko) * 2008-11-27 2012-04-20 엔에이치엔(주) 유사어 결정 방법 및 시스템
KR101049358B1 (ko) * 2008-12-08 2011-07-13 엔에이치엔(주) 유사어 결정 방법 및 시스템
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US20100332215A1 (en) * 2009-06-26 2010-12-30 Nokia Corporation Method and apparatus for converting text input
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
WO2011036830A1 (ja) * 2009-09-24 2011-03-31 日本電気株式会社 単語認識装置、方法及びプログラムが格納された非一時的なコンピュータ可読媒体並びに発送物区分装置
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US20110179353A1 (en) * 2010-01-19 2011-07-21 Research In Motion Limited Mobile Electronic Device and Associated Method Providing Proposed Spelling Corrections Based Upon a Location of Cursor At or Adjacent a Character of a Text Entry
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
EP2531930A1 (en) 2010-02-01 2012-12-12 Ginger Software, Inc. Automatic context sensitive language correction using an internet corpus particularly for small keyboard devices
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8266528B1 (en) 2010-06-24 2012-09-11 Google Inc. Spelling suggestions based on an input sequence including accidental “delete”
US9262397B2 (en) 2010-10-08 2016-02-16 Microsoft Technology Licensing, Llc General purpose correction of grammatical and word usage errors
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US8639494B1 (en) * 2010-12-28 2014-01-28 Intuit Inc. Technique for correcting user-interface shift errors
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US20120246133A1 (en) * 2011-03-23 2012-09-27 Microsoft Corporation Online spelling correction/phrase completion system
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US9298693B2 (en) 2011-12-16 2016-03-29 Microsoft Technology Licensing, Llc Rule-based generation of candidate string transformations
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8612213B1 (en) 2012-10-16 2013-12-17 Google Inc. Correction of errors in character strings that include a word delimiter
US8713433B1 (en) 2012-10-16 2014-04-29 Google Inc. Feature-based autocorrection
US8807422B2 (en) 2012-10-22 2014-08-19 Varcode Ltd. Tamper-proof quality management barcode indicators
KR20150104615A (ko) 2013-02-07 2015-09-15 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10303762B2 (en) * 2013-03-15 2019-05-28 Disney Enterprises, Inc. Comprehensive safety schema for ensuring appropriateness of language in online chat
CN105027197B (zh) 2013-03-15 2018-12-14 苹果公司 训练至少部分语音命令系统
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US9489372B2 (en) * 2013-03-15 2016-11-08 Apple Inc. Web-based spell checker
CN104102625B (zh) * 2013-04-15 2017-07-04 佳能株式会社 通过应用键盘布局信息来改进拼写检查的方法和设备
US9122376B1 (en) * 2013-04-18 2015-09-01 Google Inc. System for improving autocompletion of text input
US8887103B1 (en) 2013-04-22 2014-11-11 Google Inc. Dynamically-positioned character string suggestions for gesture typing
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
AU2014278595B2 (en) 2013-06-13 2017-04-06 Apple Inc. System and method for emergency calls initiated by voice command
CN104298672B (zh) * 2013-07-16 2018-09-11 北京搜狗科技发展有限公司 一种输入的纠错方法和装置
CN105453026A (zh) 2013-08-06 2016-03-30 苹果公司 基于来自远程设备的活动自动激活智能响应
US20150073771A1 (en) * 2013-09-10 2015-03-12 Femi Oguntuase Voice Recognition Language Apparatus
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
KR101990929B1 (ko) * 2014-03-12 2019-06-20 네이버 주식회사 문자열 사이의 연관성 판단을 통한 오타 수정 방법
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10255267B2 (en) 2014-05-30 2019-04-09 Apple Inc. Device, method, and graphical user interface for a predictive keyboard
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US20160062979A1 (en) * 2014-08-27 2016-03-03 Google Inc. Word classification based on phonetic features
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US11354755B2 (en) 2014-09-11 2022-06-07 Intuit Inc. Methods systems and articles of manufacture for using a predictive model to determine tax topics which are relevant to a taxpayer in preparing an electronic tax return
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10013721B1 (en) 2014-10-31 2018-07-03 Intuit Inc. Identification of electronic tax return errors based on declarative constraints
US10255641B1 (en) 2014-10-31 2019-04-09 Intuit Inc. Predictive model based identification of potential errors in electronic tax return
KR102392867B1 (ko) * 2014-11-28 2022-04-29 한화테크윈 주식회사 영상 검색 방법 및 장치
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
GB2535439A (en) * 2015-01-06 2016-08-24 What3Words Ltd A method for suggesting candidate words as replacements for an input string received at an electronic device
GB2549240A (en) * 2015-01-06 2017-10-18 What3Words Ltd A method for suggesting one or more multi-word candidates based on an input string received at an electronic device
KR101670326B1 (ko) 2015-03-03 2016-11-10 울산과학기술원 언어 문장 패턴 제안을 위한 생성 시스템
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9760560B2 (en) * 2015-03-19 2017-09-12 Nuance Communications, Inc. Correction of previous words and other user text input errors
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10740853B1 (en) 2015-04-28 2020-08-11 Intuit Inc. Systems for allocating resources based on electronic tax return preparation program user characteristics
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
CN107615027B (zh) 2015-05-18 2020-03-27 发可有限公司 用于可激活质量标签的热致变色墨水标记
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
JP6898298B2 (ja) 2015-07-07 2021-07-07 バーコード リミティド 電子品質表示指標
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10740854B1 (en) 2015-10-28 2020-08-11 Intuit Inc. Web browsing and machine learning systems for acquiring tax data during electronic tax return preparation
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10410295B1 (en) 2016-05-25 2019-09-10 Intuit Inc. Methods, systems and computer program products for obtaining tax data
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US9858257B1 (en) * 2016-07-20 2018-01-02 Amazon Technologies, Inc. Distinguishing intentional linguistic deviations from unintentional linguistic deviations
US20180039608A1 (en) * 2016-08-03 2018-02-08 Google Inc. Correction of previously received textual messages based on one or more later received textual messages
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
CN108008832A (zh) * 2016-10-31 2018-05-08 北京搜狗科技发展有限公司 一种输入方法和装置、一种用于输入的装置
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10089297B2 (en) * 2016-12-15 2018-10-02 Microsoft Technology Licensing, Llc Word order suggestion processing
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
KR20190024072A (ko) * 2017-08-31 2019-03-08 필아이티 주식회사 가상 키보드를 통하여 입력받은 문자열을 교정하는 모바일 장치 및 방법
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
CN110083819B (zh) * 2018-01-26 2024-02-09 北京京东尚科信息技术有限公司 拼写纠错方法、装置、介质及电子设备
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
CN109858004B (zh) * 2019-02-12 2023-08-01 四川无声信息技术有限公司 文本改写方法、装置及电子设备
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
CN110209783B (zh) * 2019-04-26 2024-03-15 平安科技(深圳)有限公司 聊天应答方法及系统、电子装置及可读存储介质
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11194467B2 (en) 2019-06-01 2021-12-07 Apple Inc. Keyboard management user interfaces
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
US11416136B2 (en) 2020-09-14 2022-08-16 Apple Inc. User interfaces for assigning and responding to user inputs
KR102368418B1 (ko) * 2020-12-31 2022-03-02 (주)휴에버그린팜 펀치 라인이 포함되는 랩 가사 생성 장치 및 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62143173A (ja) * 1985-12-18 1987-06-26 Hitachi Ltd 文字列つづり訂正方法
JPH08314929A (ja) * 1995-05-19 1996-11-29 Mitsubishi Electric Res Lab Inc スペリング訂正装置
WO1999062000A2 (en) * 1998-05-26 1999-12-02 Teragram Corporation Spelling and grammar checking system

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5604897A (en) 1990-05-18 1997-02-18 Microsoft Corporation Method and system for correcting the spelling of misspelled words
US5649222A (en) 1995-05-08 1997-07-15 Microsoft Corporation Method for background spell checking a word processing document
US6085206A (en) 1996-06-20 2000-07-04 Microsoft Corporation Method and system for verifying accuracy of spelling and grammatical composition of a document
US5878386A (en) * 1996-06-28 1999-03-02 Microsoft Corporation Natural language parser with dictionary-based part-of-speech probabilities
US6154843A (en) 1997-03-21 2000-11-28 Microsoft Corporation Secure remote access computing system
US6131102A (en) 1998-06-15 2000-10-10 Microsoft Corporation Method and system for cost computation of spelling suggestions and automatic replacement
US6401060B1 (en) 1998-06-25 2002-06-04 Microsoft Corporation Method for typographical detection and replacement in Japanese text
US6144958A (en) * 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
GB2343037B (en) * 1998-10-22 2002-12-31 Ibm Phonetic spell checker
US6304878B1 (en) 1998-11-23 2001-10-16 Microsoft Corporation Method and system for improved enumeration of tries
US6298321B1 (en) 1998-11-23 2001-10-02 Microsoft Corporation Trie compression using substates and utilizing pointers to replace or merge identical, reordered states
KR100749289B1 (ko) * 1998-11-30 2007-08-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 텍스트의 자동 세그멘테이션 방법 및 시스템
US6601059B1 (en) 1998-12-23 2003-07-29 Microsoft Corporation Computerized searching tool with spell checking
US6675169B1 (en) 1999-09-07 2004-01-06 Microsoft Corporation Method and system for attaching information to words of a trie
US6889361B1 (en) * 2000-06-13 2005-05-03 International Business Machines Corporation Educational spell checker
US6694296B1 (en) 2000-07-20 2004-02-17 Microsoft Corporation Method and apparatus for the recognition of spelled spoken words
US7627596B2 (en) * 2001-02-22 2009-12-01 International Business Machines Corporation Retrieving handwritten documents using multiple document recognizers and techniques allowing both typed and handwritten queries
US20040111475A1 (en) * 2002-12-06 2004-06-10 International Business Machines Corporation Method and apparatus for selectively identifying misspelled character strings in electronic communications
US7346615B2 (en) * 2003-10-09 2008-03-18 Google, Inc. Using match confidence to adjust a performance threshold

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62143173A (ja) * 1985-12-18 1987-06-26 Hitachi Ltd 文字列つづり訂正方法
JPH08314929A (ja) * 1995-05-19 1996-11-29 Mitsubishi Electric Res Lab Inc スペリング訂正装置
WO1999062000A2 (en) * 1998-05-26 1999-12-02 Teragram Corporation Spelling and grammar checking system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011023007A (ja) * 2009-07-17 2011-02-03 Nhn Corp 統計データに基づくユーザクエリ校正システムおよび方法
JP2023501761A (ja) * 2020-10-25 2023-01-19 グーグル エルエルシー 動的空間モデルに基づく仮想キーボードエラー訂正
US11698699B2 (en) 2020-10-25 2023-07-11 Google Llc Virtual keyboard error correction based on a dynamic spatial model
JP7438238B2 (ja) 2020-10-25 2024-02-26 グーグル エルエルシー 動的空間モデルに基づく仮想キーボードエラー訂正

Also Published As

Publication number Publication date
KR101292404B1 (ko) 2013-08-01
CN101371253B (zh) 2010-11-03
US20060241944A1 (en) 2006-10-26
MX2007013357A (es) 2008-01-11
WO2006115598A2 (en) 2006-11-02
EP1875462A2 (en) 2008-01-09
RU2007139510A (ru) 2009-04-27
CN101371253A (zh) 2009-02-18
EP1875462A4 (en) 2010-08-11
BRPI0609108A2 (pt) 2010-02-23
US7584093B2 (en) 2009-09-01
KR20080003364A (ko) 2008-01-07
WO2006115598A3 (en) 2008-10-16

Similar Documents

Publication Publication Date Title
JP2008539476A (ja) スペル提示の生成方法およびシステム
US7831911B2 (en) Spell checking system including a phonetic speller
JP5113750B2 (ja) 定義の抽出
US7856350B2 (en) Reranking QA answers using language modeling
US7617093B2 (en) Authoring speech grammars
US7599828B2 (en) Grammatically correct contraction spelling suggestions for french
CN101815996A (zh) 检测名称实体和新词
US20020123877A1 (en) Method and apparatus for performing machine translation using a unified language model and translation model
US20120262461A1 (en) System and Method for the Normalization of Text
US20120166942A1 (en) Using parts-of-speech tagging and named entity recognition for spelling correction
JP2008262587A (ja) 用例ベースの機械翻訳システム
JP2006031295A (ja) 単語境界確率推定装置及び方法、確率的言語モデル構築装置及び方法、仮名漢字変換装置及び方法、並びに、未知語モデルの構築方法、
JP2009500754A (ja) 文書中のコロケーション誤りを処理すること
US7398210B2 (en) System and method for performing analysis on word variants
Bick A constraint grammar based spellchecker for danish with a special focus on dyslexics
Gadde et al. Adapting a WSJ trained part-of-speech tagger to noisy text: preliminary results
CA2504111A1 (en) Critiquing clitic pronoun ordering in french
KR20150092879A (ko) n-gram 데이터 및 언어 분석에 기반한 문법 오류 교정장치 및 방법
US8977538B2 (en) Constructing and analyzing a word graph
JP3309174B2 (ja) 文字認識方法及び装置
US7430716B2 (en) Enhanced efficiency in handling novel words in spellchecking module
US20210133394A1 (en) Experiential parser
JPH07325825A (ja) 英文法チェックシステム装置
CN114661917A (zh) 文本扩增方法、系统、计算机设备及可读存储介质
JP2007072940A (ja) 検索問い合わせ式生成装置、方法、及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090313

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090313

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110909

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111007