JP2013073240A - コンテキスト情報を使用した音声認識修正 - Google Patents

コンテキスト情報を使用した音声認識修正 Download PDF

Info

Publication number
JP2013073240A
JP2013073240A JP2012214570A JP2012214570A JP2013073240A JP 2013073240 A JP2013073240 A JP 2013073240A JP 2012214570 A JP2012214570 A JP 2012214570A JP 2012214570 A JP2012214570 A JP 2012214570A JP 2013073240 A JP2013073240 A JP 2013073240A
Authority
JP
Japan
Prior art keywords
interpreters
interpreter
application
api
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012214570A
Other languages
English (en)
Inventor
Riku Harry Chen
ハリー チェン リク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apple Inc
Original Assignee
Apple Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apple Inc filed Critical Apple Inc
Publication of JP2013073240A publication Critical patent/JP2013073240A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition

Abstract

【課題】音声認識結果をコンテキスト情報を用いて修正
する方法を提供する。
【解決手段】音声制御システムは、発話コマンド及び関連付けられた単語(例えば、「call mom at home」)を認識し、選択されたアプリケーション(例えば、電話ダイヤラ)にコマンドを実行させることにより、コマンド(例えば、look up mom’s phone number at home and dial it to establish a telehone call)に基づいてスマートフォン等のデータ処理システムに動作を実行させる。音声制御システムは、音声認識システムから認識されたテキストを修正するためにインタプリタの集合を使用し、集合からの結果は、選択されたアプリケーションに提供される最終的に修正されたトランスクリプションにマージされる。
【選択図】図1

Description

本発明は、音声認識システム及び1つの実施形態においてデータ処理システムを制御するために使用される音声認識システムに関する。
多くの音声認識システムに関する共通の問題は精度である。ユーザは音声認識器に話しかけ、システムは認識したテキストで応答するが、音声認識器がユーザの単語を正しく認識しなかったために、認識されたテキストは多くの誤りを含むことが多々ある。
音声認識は、ユーザが電話でコマンド「call mom」を発話する等電話で音声ダイヤルを呼び出すために使用される。ユーザが「call mom」ではなく「call Tom」と発話したと音声認識器システムからのトランスクリプションエラーが発生したと判断する場合、データ処理システムを制御する音声を使用した結果、異常なシステム動作を招くことになる。トランスクリプションエラーは、例えばBluetooth(登録商標)ヘッドセットを介して高品質のオーディオ録音を入手できないというハードウェアの欠陥、不正確又は不完全な発音等のユーザエラー、あるいは背景雑音により発生する。音声認識システムの中には、音声認識システムを改善するためにコンテキストの使用を採用するものもある。特許文献1は、音声認識処理において支援するためにコンテキストを採用する音声認識システムの一例を提供する。
米国特許第7,478,037号公報
本発明の一実施形態は、発話コマンド及び関連付けられた単語(例えば、「call mom at home」)を認識する音声制御システムを提供し、選択されたアプリケーション(例えば、電話ダイヤラ)にコマンドを実行させることにより、コマンド及び関連付けられた単語(例えば、place a phone call to mom at home)に基づいてシステム(スマートフォンであってもよい)に動作を実行させる。1つの実施形態において、音声制御システムは、ユーザの音声から取得したデジタル化された入力からテキスト出力を生成するために、従来の音響モデル及び従来の言語モデルを含む音声認識器を使用する。音声制御システムは、1つの実施形態においてユーザが呼び出す音声アシスタントアプリケーションにより起動され、この音声アシスタントアプリケーションは、音声認識器からのテキスト出力を解釈及び修正し、修正されたテキスト出力をアプリケーションの集合の選択されたアプリケーションに提供し、例えばアプリケーションの集合は、電話アプリケーション(音声通話接続をダイヤル及び確立する)、メディアプレーヤアプリケーション(例えば、iTunes)、SMS(ショートメッセージサービス)「テキストメッセージ」アプリケーション、テレビ会議(例えば、「FaceTime」)アプリケーション又はチャットアプリケーション、友人等の個人を発見あるいはその場所を特定するアプリケーション及び他のアプリケーション等の1つ以上のアプリケーションを含む。
1つの実施形態において、音声アシスタントアプリケーションは、アプリケーションの集合が使用する特定の種類のテキストを解釈するようにそれぞれが設計されるインタプリタの集合を使用してテキスト出力を解釈する。例えば、名インタプリタは、アドレス帳データベース又は連絡先データベースにおける名(名フィールドにおける)を解釈するように設計され、姓インタプリタは、アドレス帳データベース又は連絡先データベースにおける姓(姓フィールドにおける)を解釈するように設計され、姓名インタプリタは、アドレス帳データベース又は連絡先データベースにおける姓名を解釈するように設計され、店舗名インタプリタは、アドレス帳データベース又は連絡先データベースにおける店舗名を解釈するように設計される。1つの実施形態において、これらのインタプリタは、テキスト出力における各単語を解釈するために種々のアルゴリズム又は処理を使用するように構成される。例えば、姓名インタプリタは、テキスト出力における単語をアドレス帳データベース又は連絡先データベースにおける単語と比較するためにファジィマッチング(編集距離類似性測定を用いた)アルゴリズムを使用するが、1つの実施形態においてテキスト出力における単語をアドレス帳データベース又は連絡先データベースにおける単語と比較するためにnグラムアルゴリズムを使用せず、名インタプリタは、テキスト出力における単語をアドレス帳データベース又は連絡先データベースにおける単語と比較するためにnグラムアルゴリズムを使用する。1つの実施形態において、更にこれらのインタプリタは、マッチングをアドレス帳データベース又は連絡先データベース中を検索する場合に種々の検索アルゴリズムを使用する。1つの実施形態において、各インタプリタは、単語を解釈する場合にコンテキスト(例えばコンテキストは、メディアプレーヤが曲を再生していることを示す)を更に使用する。1つの実施形態において、例えばコンテキストは、会話履歴(例えば、前に認識された音声)等のユーザ入力の履歴又はアプリケーションの集合のアプリケーションの状態を含む。集合の各インタプリタは、1つの実施形態においてテキスト出力における各単語を処理して単語を修正できるかを判定しようとし、各インタプリタは、1つの実施形態において各単語を修正できるかを自身で判断し、インタプリタは、単語を修正できるかを示すスコア又は信頼性のレベルを生成する。
1つの実施形態において、インタプリタの集合の制御装置は、結果として得られる修正された解釈をランク付けし、ランク付けを実行するために各インタプリタのスコア又は信頼性のレベルを使用し、且つランク付けされた解釈をマージすることにより、インタプリタの集合の結果を処理する。1つの実施形態において、1つのインタプリタからの出力のみが特定の単語を修正するために使用されるように、マージにより解釈における重複を回避しようとする。
1つの実施形態において、音声アシスタントアプリケーションは、単語の文字列における単語の位置に基づいて、あるいはコマンドを判定するために文法パーサを使用することにより、音声認識器システムからテキスト出力におけるコマンドを判定し、そのコマンドは、修正された音声トランスクリプションと共に、特定のアプリケーションが修正された音声トランスクリプションを使用してコマンドを実行するために、音声アシスタントアプリケーションによりアプリケーションの集合の特定のアプリケーションに渡される。本実施形態において、音声アシスタントアプリケーションは、コマンドに基づいて特定のアプリケーションを選択する。例えば、認識されたテキストにおける「call」コマンドにより、音声アシスタントアプリケーションは、APIを介して、修正された音声トランスクリプションと共に「call」コマンドを電話ダイヤラ又は電話アプリケーションに渡し、認識されたテキストにおける「stop」コマンドにより、音声アシスタントアプリケーションは、APIを介して、「stop」コマンドをメディアプレーヤ(例えば、iTunes)に渡して現在再生中の曲の再生を停止する。この例において、インタプリタの集合のメディアプレーヤインタプリタに提供されたコンテキストはメディアの状態を含む(例えばコンテキストは、認識された単語「stop」を含む音声入力が音声認識器システムにより受信された時にBeatlesの曲「Come Together」が現在再生中であるという状態を含む)。この例において、ユーザは、コマンドを発話する前に特定の所望のアプリケーションを選択する必要はない。ユーザは、最前面のアプリケーションである(且つ音声入力フォーカスを有する)音声アシスタントアプリケーションと話し、次に音声アシスタントアプリケーションは、コマンドに基づいてアプリケーションの集合の適切なアプリケーションを自動的に(ユーザがアプリケーションを直接指定せずに)選択し、APIを介して選択されたアプリケーションにコマンドを渡す。
一態様において、機械により実現される方法は、データ処理システムのユーザから音声入力を受信するステップと、データ処理システムにおいて音声入力に対するコンテキストを判定するステップと、音声認識システムを通じて前記音声入力におけるテキストを認識し、該テキストを認識することによりテキスト出力を生成するステップと、それぞれがテキスト出力における単語を示す複数のトークンを有する構文解析されたデータ構造としてテキスト出力を格納するステップと、それぞれがテキスト出力における特定の種類の誤りを修正し、1つ以上のデータベースを検索してデータベースにおける1つ以上の項目と各トークンとの間のマッチングを識別し、且つインタプリタがテキスト出力におけるトークンを修正できるかを識別したマッチング及びコンテキストから判定するように設計されるインタプリタの集合により各トークンを処理するステップと、インタプリタの集合により生成された選択された結果をマージしてテキスト出力の修正バージョンを示す修正された音声トランスクリプションを生成するステップと、修正された音声トランスクリプションにおけるコマンドに基づいてアプリケーションの集合のコマンドを実行するように構成される選択されたアプリケーションに修正された音声トランスクリプションを提供するステップとを備える。
いくつかの実施形態において、コンテキストは前のユーザ入力の履歴を含み、1つ以上のデータベースは、名前、アドレス及び電話番号のうちの少なくとも1つを格納する連絡先データベースを含む。
いくつかの実施形態において、コンテキストは会話履歴を含み、1つ以上のデータベースは、曲、タイトル及びアーティストのうちの少なくとも1つを格納するメディアデータベースを含み、インタプリタの集合に含まれるインタプリタは、可能なマッチングを評価する場合に少なくとも2つの単語の文字列を使用する。
いくつかの実施形態において、インタプリタの集合に含まれる第1のインタプリタは単語を修正するかを判定するために第1のアルゴリズムを使用し、インタプリタの集合に含まれる第2のインタプリタは単語を修正するかを判定するために第2のアルゴリズムを使用し、第1のアルゴリズムは第2のアルゴリズムとは異なる。
いくつかの実施形態において、インタプリタの集合に含まれる第3のインタプリタは1つ以上のデータベースを検索するために第3のアルゴリズムを使用し、インタプリタの集合に含まれる第4のインタプリタは1つ以上のデータベースを検索するために第4のアルゴリズムを使用し、第3のアルゴリズムは第4のアルゴリズムとは異なる。
いくつかの実施形態において、インタプリタの集合に含まれるインタプリタはコマンドの修正を禁止する。
いくつかの実施形態において、マージはインタプリタの集合から重複していない結果のみをマージし、インタプリタの集合からの重複結果はランク付けされた集合においてランク付けされ、ランク付けされた集合の1つの結果は選択されて修正された音声トランスクリプションにマージされる。
いくつかの実施形態において、各インタプリタが修正するように設計される特定の種類の誤りは、インタプリタにより検索される1つ以上のデータベースにおける1つ以上のフィールドに基づいて判定される。
いくつかの実施形態において、インタプリタの集合は、1つ以上のデータベースを検索し、テキスト出力における1つ以上の単語を修正するかを判定する場合にテキスト出力における単語を1つ以上のデータベースにおける1つ以上の項目と比較する。
いくつかの実施形態において、文法パーサは、テキスト出力からコマンドを判定する。
いくつかの実施形態において、アプリケーションの集合は、(a)電話番号をダイヤルするために修正された音声トランスクリプションを使用する電話ダイヤラ、(b)曲又は他のコンテンツを再生するメディアプレーヤ、(c)テキストメッセージングアプリケーション、(d)電子メールアプリケーション、(e)カレンダアプリケーション、(f)ローカル検索アプリケーション、(g)テレビ会議アプリケーション、あるいは(h)人物又はオブジェクトの位置決めアプリケーションのうちの少なくとも2つを含む。
いくつかの実施形態において、方法は上述の特徴のあらゆる組合せを含む。
一態様において、データ処理システムは、音声入力におけるテキストを認識し且つテキスト出力を生成するように動作可能な音声認識器と、音声入力に対するコンテキストを判定するように動作可能なコンテキスト判定モジュールと、音声入力を音声認識器に提供する音声認識器に結合されたマイクと、それぞれがテキスト出力における単語を示す複数のトークンを有する構文解析されたデータ構造としてテキスト出力を格納する記憶装置と、それぞれがテキスト出力における特定の種類の誤りを修正し、1つ以上のデータベースを検索してデータベースにおける1つ以上の項目と各トークンとの間のマッチングを識別し、且つインタプリタがテキスト出力におけるトークンを修正できるかを識別されたマッチング及びコンテキストから判定するように設計される音声認識器及びコンテキスト判定モジュールに結合されたインタプリタの集合と、インタプリタの集合により生成された選択された結果をマージしてテキスト出力の修正バージョンを示す修正された音声トランスクリプションを生成し、且つ修正された音声トランスクリプションにおけるコマンドに基づいてアプリケーションの集合のコマンドを実行するように構成される選択されたアプリケーションに修正された音声トランスクリプションを提供する制御装置とを備える。
いくつかの実施形態において、コンテキストは前のユーザ入力の履歴を含み、1つ以上のデータベースは、名前、アドレス及び電話番号のうちの少なくとも1つを格納する連絡先データベースを含む。
いくつかの実施形態において、コンテキストは会話履歴を含み、1つ以上のデータベースは、曲、タイトル及びアーティストのうちの少なくとも1つを格納するメディアを含み、インタプリタの集合のインタプリタは、可能なマッチングを評価する場合に少なくとも2つの単語の文字列を使用する。
いくつかの実施形態において、インタプリタの集合の第1のインタプリタは単語を修正するかを判定するために第1のアルゴリズムを使用し、インタプリタの集合の第2のインタプリタは単語を修正するかを判定するために第2のアルゴリズムを使用し、第1のアルゴリズムは第2のアルゴリズムとは異なる。
いくつかの実施形態において、インタプリタの集合の第3のインタプリタは1つ以上のデータベースを検索するために第3のアルゴリズムを使用し、インタプリタの集合の第4のインタプリタは1つ以上のデータベースを検索するために第4のアルゴリズムを使用し、第3のアルゴリズムは第4のアルゴリズムとは異なる。
いくつかの実施形態において、インタプリタの集合のインタプリタはコマンドを修正しようとしない。
いくつかの実施形態において、マージはインタプリタの集合から重複していない結果のみをマージし、インタプリタの集合からの重複結果はランク付けされた集合においてランク付けされ、ランク付けされた集合の1つの結果は選択されて修正された音声トランスクリプションにマージされる。
いくつかの実施形態において、各インタプリタが修正するように設計される特定の種類の誤りは、インタプリタにより検索される1つ以上のデータベースにおける1つ以上のフィールドに基づいて判定される。
いくつかの実施形態において、システムは、テキスト出力からコマンドを判定する文法パーサを更に含む。
いくつかの実施形態において、システムは上述の特徴のあらゆる組合せを含む。
本明細書において説明された実施形態は、非一時的な機械可読記憶媒体又は方法、あるいはデータ処理システムとして実現される。
上述の概要は、本発明の全ての態様の完全なリストを含まない。本発明は、先に概要を示された種々の態様の全ての適切な組合せ及び更に以下の発明を実施するための形態において開示される全ての適切な組合せから実施されると考えられる。
本発明は、例として示され、同一の図中符号が同様の要素を示す添付の図面において制限されない。
本発明の1つの実施形態に係る方法を示すフローチャートである。 本発明の1つの実施形態に係るソフトウェアモジュール及びデータ構造を含むアーキテクチャの一例を示す図である。 本発明の1つの実施形態に係る方法を示すフローチャートである。 制御装置モジュールが本発明の1つの実施形態に従ってインタプリタの集合からの修正された結果をランク付け及びマージするために使用される本発明の1つの実施形態に係るアーキテクチャの一例を示す図である。 本発明の1つの実施形態に係る方法を示すフローチャートである。 本明細書において説明される1つ以上の実施形態において採用される1つ以上のAPIを含むソフトウェアアーキテクチャを示す図である。 現在のコンテキストが音声認識システムにおいて判定及び使用される1つの実施形態に係るアーキテクチャを示す図である。 本明細書において説明される1つ以上の実施形態において修正処理で使用されるデータ構造の一例を示す図である。 インタプリタが音声認識システムにより認識されている特定の単語を修正するか否かを判定している場合に本明細書において説明されたインタプリタのうちの1つ以上により使用される特定のアルゴリズムの一例を示す図である。 本発明の1つの実施形態に係るデータ処理システムの一例を示す図である。 本発明のいくつかの実施形態において使用されるソフトウェアスタックの一例を示す図である。 本発明のいくつかの実施形態において使用される例示的なAPIアーキテクチャを示すブロック図である。
本発明の種々の実施形態及び態様は、以下において説明される詳細を参照して説明され、添付の図面は種々の実施形態を示す。以下の説明及び図面は、本発明を例示し、本発明を限定するものとして解釈されるべきではない。多くの特定の詳細は、本発明の種々の実施形態を完全に理解するために説明される。しかし、ある特定の例において、既知の詳細又は従来の詳細は、本発明の実施形態を簡潔に説明するために示されない。
明細書において「1つの実施形態」又は「一実施形態」を参照することは、実施形態と関連して説明された特定の機能、構造又は特徴が本発明の少なくとも1つの実施形態に含まれることを意味する。明細書の種々の箇所に「1つの実施形態において」というフレーズが示されることは、必ずしも同一の実施形態を全て参照することではない。後続する図示された処理は、ハードウェア(例えば、回路網、専用論理等)、ソフトウェア又は双方の組合せを含む処理論理により実行される。処理はいくつかの一連の動作に関して以下において説明されるが、説明される動作のうちのいくつかは異なる順序で実行されてもよいことが理解されるべきである。また、いくつかの動作は、順次ではなく並列に実行される。
本発明の1つの実施形態は、それぞれが音声認識器システムにより提供された認識されたテキストにおける特定の種類の誤りを修正するように設計又は構成されるインタプリタの集合を提供する。音声認識器システムは、音響モデル及び言語モデルの双方を含む従来のソフトウェアベースの音声認識システムであり、音声認識器システムにおいてこれらのモデルを組み合わせることにより、後にインタプリタの集合により修正されるテキスト出力を生成する。インタプリタは、特定のデータベース及びデータベースにおけるコンテンツ、並びにこれらのデータベースを使用する特定のアプリケーションを用いて動作するように構成される。1つの実施形態において、音声認識システムからインタプリタの集合を分離することにより(音声認識システムが出力を提供した後にインタプリタの集合が動作するように)、音声制御システムを設計するに当たりより大きな柔軟性を許す。特定のアプリケーション及び/又はこれらのデータベースのあらゆる変化は、基礎となる音声認識システムを変更する必要なく適切な対応するインタプリタの変化において反映される。例えばデータ処理システムは、従来の既製の音声認識システムを使用し、次にデータ処理システム上でアプリケーション又はアプリケーションの集合毎に発話コマンドに出現するコンテンツを含む特定のアプリケーション及び特定のデータベースに対して適合される適合されたインタプリタを提供する。例えば、「call John Smith on mobile」等のコマンドは、ユーザの連絡先データベース又はアドレス帳データベースに出現すると推定される単語を使用する。名のJohn及び姓のSmithは、データベースに出現すると推定される。更にデータベースは、電話番号のうちの1つがJohn Smithの移動電話番号であることを示すフィールド識別子を含むべきである。コマンド「call」が発話コマンドの最初にある必要があるか、あるいはデータ処理システムは、発話コマンドからコマンドの位置を判定するために文法パーサを使用する。連絡先データベース又は電話アプリケーションが変化する(例えば、コマンドが追加又は削除、あるいは変更される)場合、データベース及びアプリケーションに対するインタプリタは、音声認識システムを変更する必要なく(例えば、音声認識システムの言語モデルを変更する必要なく)変更される。例えばインタプリタは、対話するフィールド(データベースにおける)又はテキスト出力における単語(音声認識システムからの)をデータベースにおけるフィールドとマッチングするために使用されたアルゴリズムを変更すること、あるいはデータベースを検索するために使用された検索アルゴリズムを変更することにより変更される。
図1は、音響モデル及び言語モデルを使用するシステム等の音声認識器システムにより提供されているテキスト出力を修正するためにインタプリタの集合を使用する本発明の1つの実施形態に係る方法の一例を示す。方法は、音声制御システムが起動される動作10において開始する。例えば1つの実施形態において、ユーザは、ボタンを押下するか、ボタンを押下及び押下し続けるか、音声アシスタントアプリケーションを選択又は起動するか、あるいは単に常に動作する背景デーモンとして音声アシスタントアプリケーションを呼び出すデータ処理システムをonにする。音声制御システムは、起動された後に(例えば、音声アシスタントアプリケーションが最前面にあり且つ音声入力フォーカスを有する)音声入力を受信する(12)。1つの実施形態において、ユーザは、例えば「call John Smith on mobile」、「tell John Smith that I am in traffic and will be late for the meeting」、「play all songs by the Beatles」又は「tell my son to pick up milk if he goes to Safeway after school」等のコマンドを発話する。次に動作14において、従来の音声認識システム又は音声認識器は、ユニコード又はASCIIのフォーマット、あるいは符号化又は他の文字符号化におけるテキスト出力を生成するために音響モデル及び言語モデルの双方を採用する従来の音声認識システムを使用してデジタル化並びに処理されている発話入力において受信された単語を認識する。従来の音声制御システム又は音声認識システムは、更なる処理なしでこの時点で結果として得られる出力を使用する。本発明の少なくともいくつかの実施形態において、出力は、動作14により提供された音声認識器システムから認識されたテキスト出力における1つ以上の単語を修正するか否かを判定するために更に処理される。例えば、本発明の1つの実施形態において、動作16は、認識されたテキストにおける1つ以上の単語が修正されるか否かを判定するようにユニコード符号化における認識されたテキストを処理することにより実行される。1つの実施形態において、修正は、各インタプリタがデータベースのデータ構造の特定のフィールドの誤り等の特定の種類の誤りを修正するように設計又は構成されるインタプリタの集合により実行される。例えば、1つのインタプリタは、連絡先データベースの名の誤りを修正するように構成及び設計され、別のインタプリタは、連絡先データベースにおける店舗名の誤りを修正するように設計される。種々の処理アルゴリズム又は検索アルゴリズムを含む種々のアルゴリズムを使用して、各インタプリタが特定のフィールドの特定の種類の誤りを修正するように構成される方法を以下において更に説明する。動作16における処理の結果、修正されたテキストは、動作18において提供され、次にアプリケーションの集合内の1つのアプリケーションである特定のアプリケーションに実際のコマンドとして提供される。
1つの実施形態において、データ処理システムは、集合の2つのアプリケーション、例えば音声入力により制御される電話ダイヤラ及びiTunes等のメディアプレーヤを含む。別の実施形態において、アプリケーションの集合は、これらのアプリケーション、並びにテキストメッセージング(SMS、すなわちショートメッセージングサービス)アプリケーション、電子メールアプリケーション、カレンダアプリケーション、リマインダアプリケーション、ローカル検索アプリケーション、テレビ会議アプリケーション及び人物又は物体の位置決めアプリケーションを含む。ローカル検索アプリケーションは、ユーザがユーザの現在位置に地理的に近接する近くにある店舗又は近くにあるエンティティに関する情報を提供するようにデータ処理システムに命令するアプリケーションである。例えば、ローカル検索発話コマンドは、ユーザの現在地に基づいて近くにある中華料理屋をウェブブラウザ中を検索することを呼び出す「find a Chinese restaurant」である。あるいは、ローカル検索アプリケーションの場合、発話コマンドは「call DNJ Auto Repair」である。ユーザのシステムにおける連絡先データベースがDNJ Auto Repairに対するエントリを含まない場合、システムは、応答してユーザの現在地(例えば、GPS受信機により判定された場所)の近くにある領域においてDNJ Auto Repairとして既知である店舗に対するウェブ検索を呼び出す。
図2は、複数のソフトウェアモジュールからのデータベース及び出力等のデータ構造を更に含む図2に示された各ブロックを実現する複数のソフトウェアモジュール又はハードウェアサブシステムを含むデータ処理システムのアーキテクチャの一例を示す。1つの実施形態において、各要素201、205、207、211、215及び219は、図3に示される方法又は図5Aに示される方法、あるいは図3及び図5Aに示される方法の組合せを実行するために1つ以上のAPIを介して対話するソフトウェアモジュール又はソフトウェアアプリケーションとして実現される。図2に示されたアーキテクチャは、デジタル化された音声入力を音声認識器システム201に提供する音声アシスタントアプリケーションを更に含む。1つの実施形態において、音声アシスタントアプリケーションは、要素207として示されたインタプリタの集合及び要素215として示された制御装置を含み、要素205として示されたプリプロセッサとして動作する。更に音声アシスタントアプリケーションは、要素211として示されるコンテキスト判定モジュールを更に含む。
図2の要素201は、ユーザからデジタル化された発話コマンド又は発話入力における単語を認識するために音響モデル及び言語モデルの双方を採用する従来の音声認識器システムを含む。1つの実施形態において、マイクはユーザから発話音を収集し、これらの音は、要素203として示されたユニコード等の文字符号化フォーマットで認識されたテキスト出力を順次生成する要素201として示された音声認識器システムにデジタル化及び提供される。このテキスト出力203は、次に、例えば図3に示された方法又は図5Aに示された方法の修正処理において使用されるそのような構文解析されたデータ構造の一例を提供する図7に関連して以下において更に説明される1つの実施形態においてトークンを使用して構文解析されたデータ構造である修正データ構造を作成するプリプロセッサである要素205に提供される。1つの実施形態において、トークンは、テキスト出力203における各単語を示すためにデータ構造において使用され、要素207におけるインタプリタの集合は、テキスト出力203における各単語を修正するか否かを判定するためにこれらのトークン又は単語上で動作する。1つの実施形態において、オプションの文法パーサは、図5Aに関連して以下において更に説明されるように、アプリケーションの集合から特定のアプリケーションを選択するために使用されるコマンドであるフレーズにおける単語を判定するために要素207に含まれる。要素207において使用されるインタプリタの集合の一例は、テキスト出力における単語と対応するデータベースにおける単語との間にマッチングが存在するかを判定するように対応するデータベースを検索するため又は単語を処理するために種々のアルゴリズムを使用するインタプリタの集合を含む図4に示される。
図8は、テキスト出力203における単語と図4に示された連絡先データベース415等の1つ以上のデータベースにおける単語との間にマッチングが存在するかを判定するためにインタプリタの集合の1つ以上のインタプリタにより使用されるアルゴリズムの一例を示す。これらの種々のアルゴリズムは、図4及び図8に関連して以下において更に説明される。要素211は、図6に示されたコンテキスト判定モジュール601等のコンテキスト判定モジュールである。要素211におけるこのコンテキスト判定モジュールからの出力は、テキスト出力203における単語が各インタプリタにより修正されるか否かを判定する場合にこれらのインタプリタがコンテキストを使用するために要素207において示されたインタプリタの集合のインタプリタのうちの1つ以上に提供される。
各インタプリタは、要素209におけるデータベース等の1つ以上のデータベースと対話するように構成又は設計される。これらのデータベースは、連絡先データベース又はアドレス帳データベース、電子メールデータベース、テキストメッセージングデータベース、例えばiTunesデータベース、あるいは曲又は映画のデータベース、あるいは曲と映画との組合せのメディアデータベース等を含む。これらのデータベースにおいて対話する他のデータベース及び対応するインタプリタは、本発明の1つの実施形態に更に含まれる。一般的な動作において、特定のデータベースと対話するように(且つ他のデータベースと対話しないように)設計されたインタプリタは、単語がその対応するデータベースにおける既存の単語にマッチングするか及びどの程度マッチングするかを判定するようにコマンドワード以外の各単語を処理する。例えば名インタプリタは、図8に示されたようなnグラムアルゴリズムを使用して、その単語をデータベース中を検索し、且つ次にデータベースにおける単語とインタプリタにより現在処理されている単語との間のマッチングレベルを判定するように設計された1つ以上のアルゴリズムを使用して修正が実行されるべきであるか否かを判定することにより、連絡先データベースにおいて名である単語のマッチングを検索する。1つの実施形態において、各インタプリタは、そのインタプリタが単語を修正できるかを判定するようにテキスト出力203におけるコマンドワード以外の全ての単語を処理する。更に各インタプリタは、マッチングレベル又は単語がデータベースにおいて見つけられた別の単語を用いて修正されるべきかを示すスコア又は信頼性のレベルを提供する。
1つの実施形態において、要素207において示されたインタプリタの集合は別の解釈の集合213を提供し、これらの別の解釈は、後に音声入力におけるコマンドの対象であるアプリケーションに提供されるマージされた解釈217を提供するためにインタプリタの結果をランク付け及びマージする要素215において示された制御装置により処理される。
1つの実施形態において、要素215における制御装置は、以下において更に説明されるように1つ以上のアルゴリズムを使用してこれらのデータベースの検索を実行すること及びこれらのデータベースにおけるマッチングを処理することにより順次1つ以上のデータベースと対話する図4に示されたインタプリタの集合と対話する図4に示された制御装置モジュール411である。図5Bに示された音声アシスタントアプリケーション511等の音声アシスタントアプリケーションは、APIに対して要素219として示された対象アプリケーションを呼び出し、これらの呼び出しのパラメータとしてコマンド及び1つの実施形態においてマージされた解釈217である修正されたトランスクリプションを提供する。
認識されたテキスト出力203等の認識されたテキスト出力における単語を修正する方法を図3に示す。図3の方法は、図2及び図4に示されたアーキテクチャを用いて実行され、図5Bに示された1つ以上のAPIを使用する。また、図3の方法は、認識されたテキスト出力203において検出されるコマンドに基づいてアプリケーションの集合からアプリケーションを選択する音声アシスタントアプリケーションを使用する。図3の方法は、音声認識システムが最初のトランスクリプションを生成する動作301において開始する。これは、図2に示された認識されたテキスト出力203である。動作301において使用された音声認識システムは、デジタル化された音声入力における単語を認識するために使用された従来の音響モデル及び言語モデルを含む音声認識器システム201である。動作303において、図3の方法を実行しているデータ処理システムは、最初のトランスクリプションに対して構文解析されたデータ構造を作成する。この構文解析されたデータ構造は、図3の修正処理において使用され、そのようなデータ構造の一例を以下において更に説明される図7に示す。動作305において、システムは、トランスクリプションにおけるコマンドを判定し、ユーザ及び/又はシステムコンテキストを更に判定する。コマンドは、最初にコマンドを発話するようにユーザに要求すること又はコマンドの場所、すなわちテキスト出力203等のテキスト出力におけるコマンドワード自体を判定するためにテキスト出力203等のテキスト出力を構文解析する文法パーサを使用することで判定される。
また、図3に示された実施形態において、動作305は、ユーザ及び/又はシステムコンテキストを判定することを更に含む。コンテキスト情報は、起動され且つ動作しているアプリケーション、並びに起動されず且つ動作していないアプリケーション、メディアプレーヤが曲又は映画等のメディアを再生しているか否かのリストを含み、近接センサ、方位センサ、加速度計及び他のセンサ等のセンサに基づくユーザ状態を更に含む。更にコンテキスト情報は、例えばBeatlesのアルバム「Abbey Road」を再生する等の前に認識されたテキストを含む(アプリケーションの集合のアプリケーション毎に)前の会話履歴を更に含む。1つの実施形態において、コンテキストは、前の会話において示されるアプリケーションドメインを含み、現在のアプリケーション状態が例えばyes又はno、あるいは取消し等のユーザからの確認を期待する。選択値(確認に対する)は、現在の会話コンテキストに基づいてシステムにより指定される。例えばユーザは、電子メールを友人に送出するようにシステムに要求する。メッセージを構成した後、システムは確認するようにユーザに要求する。この時点で、確認選択値は、「yes」、「取消し」及び「それを変更」で代入される。1つの実施形態において、コンテキスト情報は、ユーザの現在地、例えばユーザが本明細書において説明されたようなローカル検索を要求する場合に使用されるGPSの現在地を更に含む。コンテキスト情報は、ロケールコンテキスト及び/又は言語コンテキストを更に含む。例えば、入力言語コンテキストは、音声修正において支援するためにインタプリタの集合により使用される。1つの実施形態において、言語コンテキスト(1つの実施形態においてユーザの基本設定から判定される)が英語である場合、インタプリタは、テキストコンテキストにおける「yet」(音声認識システムからの最初のトランスクリプション)を「yes」に修正する。
動作307において、システムは、1つの実施形態においてトランスクリプション(例えば、認識されたテキスト出力203)が修正される必要があるか及び修正されてよいかを判定するためにインタプリタの集合の各インタプリタを実行する。1つの実施形態において、インタプリタの集合の全てのインタプリタは、動作307において実行される。別の実施形態において、トランスクリプションが現在実行しているアプリケーションに対してのみ修正される必要があるかを判定するために、現在実行しているアプリケーションに対するインタプリタのみが実行される。1つの実施形態において、各インタプリタは、図2の要素201における音声認識器システム等の音声認識器システムにより提供された認識されたテキスト出力における1つ以上の単語を修正できるかをそのアルゴリズムに基づいて自身で判断する。この動作は要素309として示される。インタプリタのうちで修正できるもの又は修正が必要ないと判断できるものがない場合、動作311において、認識されたテキスト出力203等の音声認識器システムにより提供された最初のトランスクリプションは、使用され且つ選択されたアプリケーションに提供される。一方、1つ以上の単語が修正可能であると判定されている場合、最初のトランスクリプション(例えば、認識されたテキスト出力203)及び修正された解釈を含む別の解釈の集合が提供される(313)。例えば、ユーザが連絡先データベースに「John」は有さないが「Jon」を有する場合、「Jon」という単語は、「John」という単語の別の解釈となる。各インタプリタは、例えば図4に示された制御装置モジュール411等の制御装置に提供する1つ以上の別の解釈に対するマッチングレベルを示すスコア又は信頼性のレベルを維持する。スコア又は信頼性のレベルは、それが最も高いマッチングする解釈を選択するために種々の解釈をランク付けする場合に使用される。スコア又は信頼性のレベルは、単語毎又はフレーズ(例えば、2つ又は3つの単語)毎に判定される。次に動作315において、制御装置モジュール又は他のモジュールは、1つの実施形態において各インタプリタにより提供された信頼スコア、あるいはマッチングスコア又はランキングスコアに基づいて重複していない解釈をマージしようとするマージ動作を実行する。修正されている最後のトランスクリプションであるマージされた解釈は、動作317において選択されたアプリケーションに提供される。1つの実施形態において、選択されたアプリケーションは、動作305において認識又は判定されたコマンドに基づいて選択される。
図4は、認識されたテキスト出力203等の最初のトランスクリプションにおける単語を修正するためにインタプリタの集合及び制御装置モジュールを使用するアーキテクチャの一例を示す。1つの実施形態において、各インタプリタは、アルゴリズムを適切に使用することにより1つ以上のデータベースのある特定のフィールドにおける単語を処理するように構成又は設計される。例えば、図4に示された実施形態において、インタプリタ401は、1つの実施形態において図8に示されたアルゴリズム等のnグラムアルゴリズムであるアルゴリズムAを使用して連絡先データベース415の名フィールドにおける単語を修正するように構成される。1つの実施形態において、インタプリタは、いくつかのアルゴリズム又は1つのアルゴリズムのみを採用する。アルゴリズムは、nグラムアルゴリズムに加え、2つのテキスト間の類似性を測定する編集距離、あるいはdouble metaphoneアルゴリズム又はsoudexアルゴリズム等の音声マッチングアルゴリズムを使用するファジィマッチングアルゴリズムを含む。また、接頭辞、接尾辞の部分トークンアルゴリズムが使用され、2つのテキスト間のマッチング又は類似性の度合いを判定する当技術分野において既知である他のアルゴリズムが更に使用される。1つの実施形態において、1つのインタプリタがアルゴリズムAを使用し、別のインタプリタがアルゴリズムAではなくアルゴリズムBを使用するように、種々のインタプリタは種々のアルゴリズムを使用する。1つの実施形態において、アルゴリズムは、対応するデータベースにおいてマッチングを見つけ且つデータベースを検索するように適合され、特に各インタプリタが訂正するように設計される特定のフィールドに対して適合される。インタプリタ403はアルゴリズムAを使用する姓インタプリタであり、インタプリタ405はアルゴリズムBを使用する姓名インタプリタである。また、図4に示されたインタプリタの集合は、アルゴリズムB及びアルゴリズムAとは異なるアルゴリズムCを使用する店舗名インタプリタ407を含む。インタプリタ401、403、405及び407の各々は、対応するフィールドの各々におけるマッチングを検索するためにデータベース414ではなく連絡先データベース415へのアクセスを有する。種々のフィールドに対して種々のアルゴリズムを使用することに加え、各インタプリタは、対応するデータベースを検索する場合に種々の検索アルゴリズムを採用する。図4に示されたインタプリタの集合は、例えば曲及び/又は映画のiTunesデータベース等のメディアデータベース414、並びに他のメディアにおいて1つ以上のフィールドを検索するように設計されるメディアプレーヤインタプリタ409を更に含む。
図4に示されたアーキテクチャにおける各インタプリタは、別の解釈の集合213等の1つ以上の別の解釈を制御装置モジュール411に提供する。例えば、名インタプリタ401は、発話コマンドにおいて名であると思われるものの2つの異なる別の解釈を提供し、これらの2つの異なる解釈は、それぞれ、解釈が正しいという信頼性又は確率の度合いを示すスコアリング又はランキングを含む。1つの実施形態において、スコア又はランキングはマッチングレベル又は類似性レベルに基づく。図8は、異なるスコアを含む2つの解釈の一例を示す。
図8は、マッチングのランキングに対するスコアを提供するためにnグラムアルゴリズムを使用する方法の一例を示す。この例において、認識されたテキスト出力203等の音声認識器システムからのテキストは、「cream」801という単語を含む。音声認識器システムからのこの単語は、ユーザのアドレス帳において見つけられた少なくとも2つの異なる単語803及び805と比較され、特に単語801は、図8に示されたように単語803及び805と比較される。アルゴリズムは、アルファベットの対をテキスト801と比較することでスコアを提供する。図8から分かるように、Kreamという名前は、アドレス帳において見つけられた他の名前、すなわちゼロのスコアを有する名前805より近いマッチングである(3のスコアを有するため)。
インタプリタの集合の各インタプリタは、要素211において示されたコンテキスト判定モジュール又は図6におけるコンテキスト判定モジュール601等のコンテキスト判定モジュールにより提供されたコンテキスト情報を使用する。コンテキストは、コマンドがアプリケーションの集合の1つ以上のアプリケーションに対して発話されるか、並びに必要に応じて単語自体に加えコマンド自体を示す前の会話履歴を含む。前の会話履歴603は、例えばタッチスクリーン又はキーボード上のユーザ入力等の前のユーザ入力を更に含むこの情報を提供する。コンテキスト判定モジュールは、前の会話履歴から、並びに起動され且つ実行しているアプリケーション、起動されていない、すなわち実行していないアプリケーション及びメディアが再生しているか等を示すインジケータを含むアプリケーションの状態605からもコンテキストを判定する。例えば、ユーザが事前にメディアの再生を開始させており、且つその状況においてメディアが再生している間に「stock」という単語がメディアプレーヤインタプリタ409により「stop」であると解釈されるため、メディアプレーヤインタプリタ409は、「stock」という単語の最初のトランスクリプションを「stop」に修正するためにメディアが再生している時のコンテキストインジケータを使用する。コンテキスト判定モジュールは、本明細書において説明されたような言語コンテキスト又はロケールコンテキストを判定する。コンテキスト判定モジュール601は、コンテキスト判定処理の一部として例えば方位センサ又は近接センサ、あるいは光センサ等のセンサからの入力を更に含む。更にコンテキスト判定モジュール601は、前のユーザ入力の履歴を含む。コンテキスト判定モジュール601は、コンテキストに関するこのような種々の情報を収集し、単語が発話コマンド入力において修正されるかに関する判断を行うことを支援するためにコンテキストを使用するインタプリタにそのような情報を提供する。
次に、本発明の一実施形態に係る特定の実現例を図7に関連して提供する。データ構造701は、トークン703を用いて認識されたテキスト出力における単語を示す。
音声認識の処理は、音声オーディオ録音を利用し、それを1つ以上のテキスト解釈にトランスクリプションする。最初のトランスクリプションはテキスト文字列705として示される。これらのトランスクリプションされたテキストは、1つの実施形態においてRecognitionと呼ばれる表のようなデータ構造に格納され、図7に示される。
Recognitionの基本構造はTokenである。Tokenは、トランスクリプションの原子単位を表す不変の文字列である。トランスクリプションが一連のToken703から構成される場合、各Tokenは、Phrase707と呼ばれる2次レベルのデータ構造にカプセル化される。Phraseは列メジャーデータ構造である。Phraseオブジェクトの順序付きリストはRecognitionを形成する。Phraseデータ構造の存在は、別のトランスクリプションを可能にするためのものである。
例えば、ユーザが「Call John Smith on mobile」と言う場合、音声アシスタントアプリケーションは、図7に示されたRecognitionを生成する。
音声修正の処理は、入力としてRecognitionオブジェクト(図7に示された)を利用し、元の認識のいずれかの部分が要求し且つ修正される場合に変形されたRecognitionオブジェクトを生成する。
Meta−Repairと呼ばれる内部データ構造は、音声修正処理を支援するために作成される。このデータ構造は、元のRecognitionオブジェクト(図7に示された)、Repairオブジェクト及び元のトランスクリプションに対するToken位置から構成される。
ここに図7に示されたデータ構造に対するToken位置ルックアップテーブルの一例を示す。
Pair<Start,End>:元の認識テキストに対する特定のトークン文字列の開始位置及び終了位置
「Call John Smith on Mobile」
Meta−RepairのToken Position List:
[0]:Pair<0,3>
[1]:Pair<5,8>
[2]:Pair<10,14>
[3]:Pair<16,17>
[4]:Pair<19,24>。
Meta−RepairのRepairオブジェクトは、音声修正手順により生成された別の解釈のリストから構成される。別の解釈を示すために使用されたデータ構造を修正解釈と呼ぶ。
修正解釈は、元の認識における部分文字列、並びにその部分文字列の開始位置及び終了位置に対する妥当な置換であるテキストから構成される。例えば、「Jon」が「John」と置換される場合、図7に示されたデータ構造に対する修正解釈は、以下のように示される。
修正解釈:
テキスト:「Jon」
開始:5
終了:8。
Meta−Repairオブジェクトは、解釈マージを実行するための情報を含む。1つの実施形態において元のトランスクリプションが全てのインタプリタを通過した後で及び生成された1つ以上の修正解釈がある場合、マージ論理が発生する。以下の擬似コードは、インタプリタの集合から重複していない解釈をマージするために使用されるマージ関数の一例を提供する。「INPUT:original::Recognition」を図7に示す。
FUNCTIONマージ
INPUT: original::Recognition
repair::Repair
OUTPUT:original::Recognition

BEGIN

IF repair.getRepairInterpretation() is EMPTY
RETURN original;
ELSE
String originalText=repair.getOriginalText();
List interpretations=repair.getRepairInterpretations();
List ranked=rank(originalText,interpretations);
List nonOverlap=findNonOverlapInterpretations(ranked);

FOR each RepairInterpretation i in nonOverlap
List<Phrase>phrases=findRepairPhrases(original,i)
List<Token>tokens=makeRepairTokens(i);
addTokensToPhraseHead(phrase,tokens);
END FOR

RETURN original;
END

FUNCTION rank
INPUT: originalText::String
interpretaions::List<RepairInterpretation>
OUTPUT: ranked::List<RepairInterpretation>

RETURN オブジェクトの収集上で全順序を課すカスタムJava Comparatorを使用してソートされた解釈リスト

/**
Collections.sort(sorted,new Comparator<Repair.Interpretation>(){

@Override
public int compare(Repair.Interpretation o 1,
Repair.Interpretations o2){
if (scoreInterpretaions(o1)>scoreInterpretation(o2)){
return −1;
} else if (scoreInterpretations(o1)<
scoreInterpretation(o2)){
return 1;
} else {
return 0;



private float scoreInterpretation(Repair.Interpretation itp){
float score=0;
if (itp.isPerfectMatch(getOriginalText())){
score=getOriginalText().length();

score+=(float)itp.getLength()/getOriginalText().length();
return score;

});
/**

END。
図5Aは、発話コマンドにおいて検出されるコマンドに基づいて発話コマンドの対象であると判定される適切なアプリケーションをシステムが選択できるようにする音声アシスタントアプリケーションを使用する本発明の1つの実施形態を示す。1つの実施形態において、音声アシスタントアプリケーションは、発話コマンドにおけるコマンドを検出することにより適切なアプリケーションを選択するために文法パーサを使用するか、あるいはシステムが発話入力における他の単語に対するコマンドである単語を判定できるように、ユーザは、全ての発話コマンドにおける最初の単語としてコマンドを発話する必要がある。本実施形態において、システムは、発話コマンドに基づいて特定のアプリケーションを選択することにより、アプリケーションをシステムの音声入力フォーカスを有する最前面のアプリケーションにするために、ユーザがコマンドを発話する前にアプリケーションを選択するように要求する。換言すると、本実施形態において、音声アシスタントアプリケーションは、アプリケーションに対して適切であるコマンドに基づいてアプリケーションの集合から1つのアプリケーションを選択する。動作501において、システムは、アプリケーションの集合の1つのアプリケーションに関する音声入力を受信する。アプリケーションは、実行中でも実行中でなくてもよい。1つの実施形態において、方法は、実行中のアプリケーションのみがアプリケーションの集合にあるが、別の実施形態において各アプリケーションが音声入力を受信する場合には実行中であるか否かに関係なく全てのアプリケーションがアプリケーションの集合にあるように構成される。動作503において、音声アシスタントアプリケーションは、音声入力におけるコマンドを判定し、判定されたコマンドに基づいて適切なアプリケーションを選択する。例えば、コマンドが「call」である場合、1つの実施形態における適切なアプリケーションは、音声入力(例えば、call mom at home)において特定された人物との通話を確立する電話ダイヤラである。コマンドは、動詞を使用するようにユーザに命令することで動詞であることが必要なコマンドの位置を特定するために文法パーサを使用することにより判定されるか、あるいはシステムは、一連の発話単語における固定の位置にコマンドを配置するようにユーザに要求する。1つの実施形態において、例えば、コマンドが「tell」という単語である場合、選択されたアプリケーションはテキストメッセージング(SMS)アプリケーションであり、コマンドが「play」又は「stop」という単語である場合、選択されたアプリケーションはメディアプレーヤアプリケーションである。
次に動作505において、インタプリタは、認識された音声入力における1つ以上の単語を修正するように実行される。アプリケーションがインタプリタを実行する前に動作503で選択される場合、音声入力を介して発話コマンドを受信できる全てのアプリケーションに対するシステムにおいて使用可能な全てのインタプリタを実行するのではなく、その特定のアプリケーションで動作するように設計されるインタプリタのみが実行される。動作505は、動作307に類似し、図6に示されたコンテキスト判定モジュールと組み合わせて図4に示されたアーキテクチャを使用する。1つの実施形態において、動作503で判定又は検出されるコマンドは繰り返されない。この場合、インタプリタは、インタプリタが対話する1つ以上のデータベースを検索する場合にテキスト入力におけるコマンドをストップワードとして解釈する。次に動作507において、音声アシスタントアプリケーションは、コマンドを動作503で判定された選択されたアプリケーションに渡し、修正されたトランスクリプション(インタプリタを実行し且つ別の解釈をマージする結果得られた)を選択されたアプリケーションに渡す。1つの実施形態において、音声アシスタントアプリケーションは、図5Bに示されたような1つ以上のAPI等のAPIを介して修正されたトランスクリプションと共にコマンドを渡す。
図5Bに示された音声アシスタントアプリケーション511は、図5Aの1つ以上の方法を実行する音声アシスタントアプリケーションと同一である。音声アシスタントアプリケーション511は、上述され且つ/あるいは図6に示されたコンテキスト情報等のコンテキスト情報を順次返送するオペレーティングシステム516に対してAPI514を介してコンテキスト呼び出しを実行することにより、コンテキストを判定する。コンテキスト情報は、実行中のアプリケーション及び以前にユーザ入力又は発話コマンドを受信したアプリケーションのリストを更に含む。音声アシスタントアプリケーション511は、オペレーティングシステム516に加えて、音声アシスタントアプリケーション511、並びにアプリケーション518及び520等のアプリケーションの集合の1つ以上のアプリケーションを含むソフトウェアスタックを示す図5Bに示されたシステム上で実行するソフトウェアアプリケーションである音声認識器システムを更に呼び出す。アプリケーション518及び520は、API512を介して音声アシスタントアプリケーションから渡されるコマンドを受信する。
以下は、1つの実施形態における音声アシスタントアプリケーションによる音声修正の3つの使用例である。
「snap−to−grid」音声ダイヤル。音声アシスタントアプリケーションにより、ユーザは、音声を使用してアドレス帳データベースにおける連絡先に通話できる。ユーザは、アドレス帳において「Marc Dickinson」と名前をつけられた連絡先を有し、「Mark」又は「Dick」と名前をつけられた連絡先は有さない。ユーザが「Call Marc Dickinson」と言う場合、音声認識は、入力を「Call Mark Dick son」として間違ってトランスクリプションする。アシスタントがデータベースにおいて「Mark Dick son」を見つけられないために動作を完了できないことをユーザに伝えるのではなく、音声修正は、より妥当な別のトランスクリプション、すなわち「Call Marc Dicknson」を生成するために連絡先の名前のスペリングを利用し且つファジィマッチングアルゴリズムを使用する。(2)ユーザの意図の曖昧性の除去。音声アシスタントアプリケーションにより、ユーザは、SMSメッセージを送出し且つ音声ダイヤル要求を行える。ユーザが「Tell my wife to pick up milk and fruits if she goes to Safeway after work」と言う場合、アシスタントは、自動的にユーザの妻に対してテキストメッセージを構成する。認識誤りのため、音声システムは、「tell」という動作語を「call」又は「tall」として間違ってトランスクリプションする可能性がある。1つの実施形態において「Call my wife to pick up milk and fruits if she goes to Safeway after work」又は「Tall my wife to pick up milk and fruits if she goes to Safeway after work」という要求がアシスタントにおけるいずれの動作可能なタスクともマッチングしないため、デフォルトの応答は、通常、「Sorry! I don’t know what you meant」である。音声修正は、コンテキストを使用して音声意図の曖昧性を除去することでこの問題を解決することを支援する。例えば、「tell」という単語と「tall」という単語との編集距離が短く、且つ音声ダイヤルコマンドが一般に対象人物トークンの後に長く実行する文字列を有さないことを知ることにより、インタプリタは、元のトランスクリプションを「Tell my wife to pick up milk and fruits if she plans to vist Safeway after work」として書き直す。(3)コマンドキーワード/システムキーワードの曖昧性の除去。音声システムは、短いキーワードの発音を間違ってトランスクリプションする場合がある。例えば、ユーザが「Stop」と言い且つ最初のトランスクリプションが「Stock」であり、ユーザが「Yes」と言い且つ最初のトランスクリプションが「Yet」である。音声修正は、1つ以上のコンテキストヒントに基づいて元のトランスクリプションテキストがより妥当でない解釈である場合に別のトランスクリプションを提供することにより、これらの問題を克服することを支援する。例えば、アシスタントがYES/NOの確認をユーザに促している場合、ユーザがフォローアップ応答として「Yet」と言う可能性は低い。最終的なトランスクリプションとして「Yet」を返送するのではなく、音声修正は、より妥当な音声入力としてそれを「Yes」で上書きする。同様の修正論理は、メディアプレーヤドメインに適用可能である。ユーザが単に曲が再生されることを要求しており且つ即座の音声トランスクリプションが「Stock」である場合、音声修正は、より妥当なコマンドトランスクリプションとしてそれを「Stop」で書き直す。
図9は、本発明の1つの実施形態と共に使用されるデータ処理システム900の一例を示す。例えば及び1つの実施形態において、システム900は、スマートフォン、タブレット(例えば、iPad)装置、ラップトップ又はエンターテイメントシステム等の携帯データ処理装置として実現される。図9に示されたデータ処理システム900は、1つ以上のマイクロプロセッサ又はチップ(集積回路)上のシステムである処理システム911を含み、システムは、処理システムにより実行するためのデータ及びプログラムを格納するメモリ901を更に含む。メモリ901は、図2に関連して説明されたソフトウェアコンポーネント等を格納し、半導体メモリ(例えば、フラッシュ、DRAM、SRAM等)の非一時的な機械可読記憶媒体のあらゆる既知の形態である。システム900は、例えばスピーカ及びマイクを介して音楽を再生するかあるいは電話機能性を提供するマイク及びスピーカを含む。マイクは、本明細書において説明された音声入力を受信し、その入力は、本明細書において説明されたように音声認識器システムにデジタル化及び提供される。
表示制御装置及び表示装置909は、ビジュアルユーザインタフェースをユーザに提供する。このインタフェースは、iPhone又はiPad上でOS Xオペレーティングシステムソフトウェア又はiOSソフトウェアを実行する場合にMacintoshコンピュータ上に示されたものに類似するグラフィカルユーザインタフェースを含む。システム900は、別のデータ処理システムと通信する1つ以上の無線送受信機903を更に備える。無線送受信機は、WLAN送受信機(例えば、WiFi)、赤外線送受信機、Bluetooth送受信機及び/又は無線携帯電話送受信機である。ある特定の実施形態において、不図示の更なる構成要素はシステム900の一部であってもよく、且つ図9に示されたより少ない構成要素はデータ処理システムにおいて更に使用されてもよいことが理解されるだろう。システム900は、別のデータ処理システムと通信する1つ以上の通信ポート917を更に含む。通信ポートは、USBポート、Firewireポート、Bluetoothインタフェース、ドッキングポート等である。
データ処理システム900は、ユーザが入力をシステムに提供できるように提供される1つ以上の入力装置913を更に備える。これらの入力装置は、表示装置909等の表示装置と重ねられ且つ一体化されるキーパッド又はキーボード、あるいはタッチパネル又はマルチタッチパネルである。データ処理システム900は、ドック用のコネクタであるオプションの入出力装置を更に備える。不図示の1つ以上のバスは、当技術分野において既知であるように種々の構成要素を相互接続するために使用されることが理解されるだろう。図9に示されたデータ処理システムは、ハンドヘルドコンピュータ又はパーソナルデジタルアシスタント(PDA)、PDAのような機能性を含む携帯電話、携帯電話を備えるハンドヘルドコンピュータ、iPod等のメディアプレーヤ、ゲーム装置又はエンターテイメント装置、あるいは1つの装置、組込み型装置又は他の消費者電子装置においてPDA及び携帯電話とを組み合わされたメディアプレーヤ等のこれらの装置の態様又は機能を組み合わせる装置である。他の実施形態において、データ処理システム900は、別の装置内のネットワークコンピュータ又は組込み型処理装置、あるいは図9に示されたものより少ない構成要素又はあるいは図9に示されたものより多い構成要素を有する他の種類のデータ処理システムである。
データ処理システム900は、必要に応じてオーディオI/O905におけるマイクにより受信されたユーザ音声をデジタル化及び格納するように設計された1つ以上のハードウェア装置を備える。
本発明の少なくともある特定の実施形態は、メディア、メディアを格納する記憶装置を提示するメディア処理システムを含み、且つアンテナシステム及びメディア処理システムと結合された無線周波数(RF)送受信機(例えば、携帯電話用のRF送受信機)を更に備える携帯音楽プレーヤ及び/又はビデオメディアプレーヤ等のデジタルメディアプレーヤの一部である。ある特定の実施形態において、リモート記憶装置上に格納されたメディアは、RF送受信機を介してメディアプレーヤに送信される。例えばメディアは、音楽又は他のオーディオ、静止画又は動画のうちの1つ以上である。
携帯メディアプレーヤの例は、双方とも参考として本明細書に取り入れられる公開された米国特許第7,345,671号公報及び米国特許出願公開第2004/0224638号において説明される。
1つ以上のアプリケーションプログラミングインタフェース(API)は、いくつかの実施形態において使用される。APIは、異なるプログラムコードコンポーネント又はハードウェアコンポーネント(以下において「API呼び出しコンポーネント」)が1つ以上の機能、方法、手順、データ構造、クラス及び/又はAPI実装コンポーネントにより提供された他のサービスにアクセスし且つそれらを使用できるようにするプログラムコードコンポーネント又はハードウェアコンポーネント(以下において「API実装コンポーネント」)により実現されたインタフェースである。APIは、API呼び出しコンポーネントとAPI実装コンポーネントとの間で渡される1つ以上のパラメータを規定する。
APIにより、API呼び出しコンポーネントの開発者(サードパーティ開発者である)は、API実装コンポーネントにより提供された特定の機能に影響を及ぼすことができる。1つのAPI呼び出しコンポーネント又は2つ以上のそのようなコンポーネントがある。APIは、アプリケーションからのサービスに対する要求を支援するためにコンピュータシステム又はプログラムライブラリが提供するソースコードインタフェースである。オペレーティングシステム(OS)は、OS上で動作するアプリケーションがこれらのAPIのうちの1つ以上を呼び出せるようにする多数のAPIを有し、サービス(例えば、プログラムライブラリ)は、サービスを使用するアプリケーションがこれらのAPIのうちの1つ以上を呼び出せるようにする多数のAPIを有する。APIは、アプリケーションが構築される場合に解釈又はコンパイルされるプログラミング言語に関して規定される。
いくつかの実施形態において、API実装コンポーネントは、それぞれがAPI実装コンポーネントにより実現された機能性の種々の態様にアクセスする種々の態様の異なるビュー又は種々の態様を含む異なるビューを提供する2つ以上のAPIを提供する。例えば、API実装コンポーネントの1つのAPIは、機能の最初の集合を提供し、サードパーティ開発者に示され、API実装コンポーネントの別のAPIは、隠蔽され(示されず)、機能の最初の集合の部分集合を提供し、機能の最初の集合にないテスト機能又はデバッグ機能等の機能の別の集合を更に提供する。他の実施形態において、API実装コンポーネントは、基礎となるAPI、すなわちAPI呼び出しコンポーネント及びAPI実装コンポーネントの双方を介して1つ以上の他のコンポーネントを自ら呼び出す。
APIは、API実装コンポーネントの特定の機能にアクセスし且つそれを使用する場合にAPI呼び出しコンポーネントが使用する言語及びパラメータを規定する。例えばAPI呼び出しコンポーネントは、APIにより示された1つ以上のAPI呼び出し(例えば機能又は方法の呼び出しにより具体化された)を介してAPI実装コンポーネントの特定の機能にアクセスし、API呼び出しを介してパラメータを使用してデータ及び制御の情報を渡す。API実装コンポーネントは、API呼び出しコンポーネントからのAPI呼び出しに応答してAPIを介して値を返送する。APIは、構文及びAPI呼び出しの結果(例えば、APIを呼び出す方法及びAPI呼び出しが実行するもの)を規定するが、API呼び出しがAPI呼び出しにより特定された機能を実行する方法は示さない。種々のAPI呼び出しは、呼び出し(API呼び出しコンポーネント)とAPI実装コンポーネントとの間の1つ以上のアプリケーションプログラミングインタフェースを介して転送される。API呼び出しを転送することは、機能呼び出し又は機能メッセージを発行すること、開始すること、呼び出すこと、受信すること、返送すること、あるいはそれらに応答することを含む。換言すると、転送することは、API呼び出しコンポーネント又はAPI実装コンポーネントのいずれかによる動作を説明する。APIの機能呼び出し又は他の呼び出しは、パラメータリスト又は他の構造を介して1つ以上のパラメータを送出又は受信する。パラメータは、APIを介して渡されるデータ又は他の項目を参照する機能又は方法、あるいは別の方法に対する定数、キー、データ構造、オブジェクト、オブジェクトクラス、変数、データタイプ、ポインタ、アレイ、リスト又はポインタである。
また、データタイプ又はデータクラスは、APIにより提供され、API実装コンポーネントにより実現される。従って、API呼び出しコンポーネントは、APIにおいて提供された定義を使用することでそのようなタイプ又はクラスの定数値を使用あるいはインスタンス化するために変数を宣言し、ポインタを使用する。
一般にAPIは、API実装コンポーネントにより提供されたサービス又はデータにアクセスするため、あるいはAPI実装コンポーネントにより提供された動作又は計算の性能を開始するために使用される。例として、API実装コンポーネント及びAPI呼び出しコンポーネントは、それぞれ、オペレーティングシステム、ライブラリ、デバイスドライバ、API、アプリケーションプログラム又は他のモジュールのうちのいずれか1つである(API実装コンポーネント及びAPI呼び出しコンポーネントは、同一の種類のモジュール又は互いに異なる種類のモジュールであることが理解されるべきである)。API実装コンポーネントは、場合によってはファームウェア、マイクロコード又は他のハードウェア論理において少なくとも部分的に具体化される。いくつかの実施形態において、APIにより、クライアントプログラムは、ソフトウェア開発キット(SDK)ライブラリにより提供されたサービスを使用できる。他の実施形態において、アプリケーション又は他のクライアントプログラムは、アプリケーションフレームワークにより提供されたAPIを使用する。これらの実施形態において、アプリケーション又はクライアントプログラムは、SDK及びAPIにより提供された機能又は方法に呼び出しを組み込むか、あるいはSDKにおいて規定され且つAPIにより提供されたデータタイプ又はデータオブジェクトを使用する。これらの実施形態において、アプリケーションフレームワークは、フレームワークにより規定された種々のイベントに応答するプログラムに対するメインイベントループを提供する。APIにより、アプリケーションは、アプリケーションフレームワークを使用してイベント及びイベントへの応答を特定できる。いくつかの実現例において、API呼び出しは、例えば入力の機能及び状態、出力の機能及び状態、処理機能、電源の状態、記憶装置の容量及び状態、通信機能等の態様に関連したものを含むハードウェア装置の機能又は状態をアプリケーションに対して報告し、APIは、ハードウェアコンポーネント上で部分的に実行するファームウェア、マイクロコード又は他の低レベル論理により部分的に実現される。
API呼び出しコンポーネントは、ネットワークを介してAPIによりAPI実装コンポーネントと通信するローカルコンポーネント(すなわち、API実装コンポーネントと同一のデータ処理システム上の)又はリモートコンポーネント(すなわち、API実装コンポーネントとは異なるデータ処理システム上の)である。API実装コンポーネントは、API呼び出しコンポーネントとしても動作し(すなわち、それは、異なるAPI実装コンポーネントにより示されたAPIに対するAPI呼び出しを実行し)、API呼び出しコンポーネントは、異なるAPI呼び出しコンポーネントに対して示されるAPIを実装することによりAPI実装コンポーネントとしても動作することが理解されるべきである。
APIは、種々のプログラミング言語で書かれた多数のAPI呼び出しコンポーネントがAPI実装コンポーネントと通信できるようにする(従って、APIは、API実装コンポーネントとAPI呼び出しコンポーネントとの間で呼び出し及び返送を変換する機能を含む)が、特定のプログラミング言語に関して実現される。1つの実施形態において、API呼び出しコンポーネントは、種々のプロバイダからのAPI、例えばOSプロバイダからのAPIの集合及びプラグインプロバイダからのAPIの集合、並びに別のプロバイダ(例えば、ソフトウェアライブラリのプロバイダ)からのAPIの別の集合又はAPIの別の集合のクリエータを呼び出す。
図11は、本発明のいくつかの実施形態において使用される例示的なAPIアーキテクチャを示すブロック図である。図11に示されるように、APIアーキテクチャ1100は、API1120を実装するAPI実装コンポーネント1110(例えば、オペレーティングシステム、ライブラリ、デバイスドライバ、API、アプリケーションプログラム、ソフトウェア又は他のモジュール)を含む。API1120は、API呼び出しコンポーネント1130により使用されるAPI実装コンポーネントの1つ以上の機能、方法、クラス、オブジェクト、プロトコル、データ構造、フォーマット及び/又は他の特徴を規定する。API1120は、API実装コンポーネントにおける機能がAPI呼び出しコンポーネントからパラメータを受信する方法及び機能がAPI呼び出しコンポーネントに結果を返送する方法を規定する少なくとも1つの呼び出し規約を規定する。API呼び出しコンポーネント1130(例えば、オペレーティングシステム、ライブラリ、デバイスドライバ、API、アプリケーションプログラム、ソフトウェア又は他のモジュール)は、API1120を介してAPI呼び出しを実行し、API1120により規定されるAPI実装コンポーネント1110の機能にアクセスし且つそれを使用する。API実装コンポーネント1110は、API呼び出しに応答してAPI1120を介してAPI呼び出しコンポーネント1130に値を返送する。
API実装コンポーネント1110は、API1120を介して規定されず且つAPI呼び出しコンポーネント1130に対して使用不可である更なる機能、方法、クラス、データ構造及び/又は他の特徴を含むことが理解されるだろう。API呼び出しコンポーネント1130は、API実装コンポーネント1110と同一のシステム上にあってもよいが、あるいはリモートで配置されてもよく且つネットワークを介してAPI1120を使用してAPI実装コンポーネント1110にアクセスすることが理解されるべきである。図11はAPI1120と対話する単一のAPI呼び出しコンポーネント1130を示すが、API呼び出しコンポーネント1130とは異なる言語(又は同一の言語)で書かれる他のAPI呼び出しコンポーネントはAPI1120を使用することが理解されるべきである。
API実装コンポーネント1110、API1120及びAPI呼び出しコンポーネント1130は、機械(例えば、コンピュータ又は他のデータ処理システム)により可読な有形形式で情報を格納するあらゆる機構を含む非一時的な機械可読記憶媒体に格納される。例えば機械可読媒体は、磁気ディスク、光ディスク、ランダムアクセスメモリ、読み出し専用メモリ、フラッシュメモリ素子等を含み、1つ以上のネットワークによりクライアント装置に結合されるローカル記憶媒体又はリモート装置上の記憶媒体である。
図10(「ソフトウェアスタック」において、例示的な一実施形態、アプリケーションは、いくつかのサービスAPIを使用するサービス1又はサービス2及びいくつかのOS APIを使用するオペレーティングシステム(OS)に対する呼び出しを実行する。サービス1及びサービス2は、いくつかのOS APIを使用してOSに対する呼び出しを実行する。
尚、サービス2は2つのAPIを有し、そのうちの一方(サービス2 API1)はアプリケーション1から呼び出しを受信し且つアプリケーション1に値を返送し、他方(サービス2 API2)はアプリケーション2から呼び出しを受信し且つアプリケーション2に値を返送する。サービス1(例えば、ソフトウェアライブラリである)は、OS API1に対する呼び出しを実行し且つOS API1から戻り値を受信し、サービス2(例えば、ソフトウェアライブラリである)は、OS API1及びOS API 2の双方に対する呼び出しを実行し且つOS API1及びOS API 2の双方から戻り値を受信する。アプリケーション2は、OS API2に対する呼び出しを実行し且つOS API2から戻り値を受信する。
明細書において「1つの実施形態」又は「一実施形態」を参照することは、実施形態と関連して説明された特定の機能、構造又は特徴が本発明の少なくとも1つの実施形態に含まれることを意味する。明細書の種々の箇所に「1つの実施形態において」というフレーズが示されることは、必ずしも同一の実施形態を全て参照することではない。
上述の明細書において、本発明の特定の例示的な実施形態を参照して本発明を説明した。以下の特許請求の範囲において説明されるような本発明のより広範な趣旨及び範囲から逸脱せずに、種々の変形が本発明に対して行われてもよいことが明らかとなるだろう。従って、明細書及び図面は、限定的な意味ではなく例示的な意味で考えられるべきである。

Claims (13)

  1. コンピュータで実行される方法であって、
    データ処理システムのユーザからの音声入力を受信するステップと、
    前記データ処理システムにおいて前記音声入力に対するコンテキストを判定するステップと、
    音声認識システムを通じて前記音声入力におけるテキストを認識し、該テキストを認識することによりテキスト出力を生成するステップと、
    それぞれが前記テキスト出力における単語を示す複数のトークンを有する構文解析されたデータ構造として前記テキスト出力を格納するステップと、
    それぞれが前記テキスト出力における特定の種類の誤りを修正し、1つ以上のデータベースを検索してデータベースにおける1つ以上の項目と各トークンとの間のマッチングを識別し、インタプリタがテキスト出力におけるトークンを修正できるかを前記識別したマッチング及び前記コンテキストから判定するように設計される前記インタプリタの集合により各トークンを処理するステップと、
    前記インタプリタの集合により生成された選択された結果をマージして前記テキスト出力の修正バージョンを示す修正された音声トランスクリプションを生成するステップと、
    前記修正された音声トランスクリプションにおけるコマンドに基づいて、アプリケーションの集合の中で該コマンドを実行するように構成される選択されたアプリケーションに前記修正された音声トランスクリプションを提供するステップと
    を含むことを特徴とする方法。
  2. 前記コンテキストは、前のユーザ入力の履歴を含み、
    前記1つ以上のデータベースは、名前、アドレス及び電話番号のうちの少なくとも1つを格納する連絡先データベースを含むことを特徴とする請求項1に記載の方法。
  3. 前記コンテキストは、会話履歴を含み、
    前記1つ以上のデータベースは、曲、タイトル及びアーティストのうちの少なくとも1つを格納するメディアデータベースを含み、
    前記インタプリタの集合に含まれる前記インタプリタは、可能なマッチングを評価する場合に少なくとも2つの単語の文字列を使用することを特徴とする請求項1又は2に記載の方法。
  4. 前記インタプリタの集合に含まれる第1のインタプリタは、単語を修正するかを判定するために第1のアルゴリズムを使用し、
    前記インタプリタの集合に含まれる第2のインタプリタは、単語を修正するかを判定するために第2のアルゴリズムを使用し、
    前記第1のアルゴリズムは、前記第2のアルゴリズムとは異なることを特徴とする請求項1乃至3の何れか1項に記載の方法。
  5. 前記インタプリタの集合に含まれる第3のインタプリタは、1つ以上のデータベースを検索するために第3のアルゴリズムを使用し、
    前記インタプリタの集合に含まれる第4のインタプリタは、1つ以上のデータベースを検索するために第4のアルゴリズムを使用し、
    前記第3のアルゴリズムは、前記第4のアルゴリズムとは異なることを特徴とする請求項1乃至4の何れか1項に記載の方法。
  6. 前記インタプリタの集合に含まれる前記インタプリタは、コマンドの修正を禁止することを特徴とする請求項1乃至5の何れか1項に記載の方法。
  7. 前記選択された結果のマージは、前記インタプリタの集合から重複していない結果のみをマージし、
    前記インタプリタの集合からの重複する結果は、ランク付けされた集合の中でランク付けされ、
    前記ランク付けされた集合の1つの結果は、選択されて、前記修正された音声トランスクリプションにマージされることを特徴とする請求項1乃至6の何れか1項に記載の方法。
  8. 各インタプリタが修正するように設計される特定の種類の誤りは、前記インタプリタによって検索される前記1つ以上のデータベースにおける1つ以上のフィールドに基づいて判定されることを特徴とする請求項1乃至7の何れか1項に記載の方法。
  9. 前記インタプリタの集合は、前記1つ以上のデータベースを検索し、前記テキスト出力における1つ以上の単語を修正するかを判定する場合に該テキスト出力における単語を1つ以上のデータベースにおける1つ以上の項目と比較することを特徴とする請求項1乃至8の何れか1項に記載の方法。
  10. 文法パーサは、前記テキスト出力から前記コマンドを判定することを特徴とする請求項1乃至9の何れか1項に記載の方法。
  11. 前記アプリケーションの集合は、
    (a)電話番号をダイヤルするために修正された音声トランスクリプションを使用する電話ダイヤラと、
    (b)曲又は他のコンテンツを再生するメディアプレーヤと、
    (c)テキストメッセージングアプリケーションと、
    (d)電子メールアプリケーションと、
    (e)カレンダアプリケーションと、
    (f)ローカル検索アプリケーションと、
    (g)テレビ会議アプリケーションと、
    (h)人物又はオブジェクトの位置決めアプリケーションと
    のうちの少なくとも2つを含むことを特徴とする請求項1乃至10の何れか1項に記載の方法。
  12. 請求項1乃至11の何れか1項に記載の方法の各ステップをデータ処理システムに実行させる、コンピュータで実行可能なプログラム命令を格納した、コンピュータで読取可能な記憶媒体。
  13. システムであって、
    1つ以上のプロセッサと、
    請求項1乃至11の何れか1項に記載の方法の各ステップを前記1つ以上のプロセッサに実行させる、コンピュータで実行可能なプログラム命令を格納したメモリと
    を備えることを特徴とするシステム。
JP2012214570A 2011-09-28 2012-09-27 コンテキスト情報を使用した音声認識修正 Pending JP2013073240A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/247,912 US8762156B2 (en) 2011-09-28 2011-09-28 Speech recognition repair using contextual information
US13/247,912 2011-09-28

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2014171991A Division JP2015018265A (ja) 2011-09-28 2014-08-26 コンテキスト情報を使用した音声認識修正

Publications (1)

Publication Number Publication Date
JP2013073240A true JP2013073240A (ja) 2013-04-22

Family

ID=47048983

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2012214570A Pending JP2013073240A (ja) 2011-09-28 2012-09-27 コンテキスト情報を使用した音声認識修正
JP2014171991A Pending JP2015018265A (ja) 2011-09-28 2014-08-26 コンテキスト情報を使用した音声認識修正

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2014171991A Pending JP2015018265A (ja) 2011-09-28 2014-08-26 コンテキスト情報を使用した音声認識修正

Country Status (6)

Country Link
US (2) US8762156B2 (ja)
EP (1) EP2587478A3 (ja)
JP (2) JP2013073240A (ja)
KR (2) KR101418163B1 (ja)
CN (2) CN105336326A (ja)
AU (2) AU2012227294B2 (ja)

Cited By (132)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016534616A (ja) * 2013-08-06 2016-11-04 アップル インコーポレイテッド リモート機器からの作動に基づくスマート応答の自動作動
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
JP2018040904A (ja) * 2016-09-06 2018-03-15 トヨタ自動車株式会社 音声認識装置および音声認識方法
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
WO2018135302A1 (ja) * 2017-01-18 2018-07-26 ソニー株式会社 情報処理装置および情報処理方法、並びにプログラム
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US10083690B2 (en) 2014-05-30 2018-09-25 Apple Inc. Better resolution when referencing to concepts
US10108612B2 (en) 2008-07-31 2018-10-23 Apple Inc. Mobile device having human language translation capability with positional feedback
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10311871B2 (en) 2015-03-08 2019-06-04 Apple Inc. Competing devices responding to voice triggers
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10332518B2 (en) 2017-05-09 2019-06-25 Apple Inc. User interface for correcting recognition errors
US10354652B2 (en) 2015-12-02 2019-07-16 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10381016B2 (en) 2008-01-03 2019-08-13 Apple Inc. Methods and apparatus for altering audio output signals
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
JP2019144265A (ja) * 2013-09-26 2019-08-29 グーグル エルエルシー 車両にナビゲーションデータを提供するためのシステムおよび方法
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10417344B2 (en) 2014-05-30 2019-09-17 Apple Inc. Exemplar-based natural language processing
US10417405B2 (en) 2011-03-21 2019-09-17 Apple Inc. Device access using voice authentication
US10431204B2 (en) 2014-09-11 2019-10-01 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10438595B2 (en) 2014-09-30 2019-10-08 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10453443B2 (en) 2014-09-30 2019-10-22 Apple Inc. Providing an indication of the suitability of speech recognition
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US10497365B2 (en) 2014-05-30 2019-12-03 Apple Inc. Multi-command single utterance input method
US10529332B2 (en) 2015-03-08 2020-01-07 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10580409B2 (en) 2016-06-11 2020-03-03 Apple Inc. Application integration with a digital assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10643611B2 (en) 2008-10-02 2020-05-05 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10657961B2 (en) 2013-06-08 2020-05-19 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10684703B2 (en) 2018-06-01 2020-06-16 Apple Inc. Attention aware virtual assistant dismissal
US10699717B2 (en) 2014-05-30 2020-06-30 Apple Inc. Intelligent assistant for home automation
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10714117B2 (en) 2013-02-07 2020-07-14 Apple Inc. Voice trigger for a digital assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US10748546B2 (en) 2017-05-16 2020-08-18 Apple Inc. Digital assistant services based on device capabilities
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10769385B2 (en) 2013-06-09 2020-09-08 Apple Inc. System and method for inferring user intent from speech inputs
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10789945B2 (en) 2017-05-12 2020-09-29 Apple Inc. Low-latency intelligent automated assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US10867596B2 (en) 2017-08-09 2020-12-15 Lenovo (Singapore) Pte. Ltd. Voice assistant system, server apparatus, device, voice assistant method therefor, and program to be executed by computer
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US10904611B2 (en) 2014-06-30 2021-01-26 Apple Inc. Intelligent automated assistant for TV user interactions
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10942703B2 (en) 2015-12-23 2021-03-09 Apple Inc. Proactive assistance based on dialog communication between devices
US10942702B2 (en) 2016-06-11 2021-03-09 Apple Inc. Intelligent device arbitration and control
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
JP2021073567A (ja) * 2018-04-11 2021-05-13 百度在線網絡技術(北京)有限公司 音声制御方法、端末機器、クラウドサーバ及びシステム
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US11023513B2 (en) 2007-12-20 2021-06-01 Apple Inc. Method and apparatus for searching using an active ontology
US11048473B2 (en) 2013-06-09 2021-06-29 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US11127397B2 (en) 2015-05-27 2021-09-21 Apple Inc. Device voice control
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US11231904B2 (en) 2015-03-06 2022-01-25 Apple Inc. Reducing response latency of intelligent automated assistants
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11314370B2 (en) 2013-12-06 2022-04-26 Apple Inc. Method for extracting salient dialog usage from live data
US11350253B2 (en) 2011-06-03 2022-05-31 Apple Inc. Active transport based notifications
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11495218B2 (en) 2018-06-01 2022-11-08 Apple Inc. Virtual assistant operation in multi-device environments
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context

Families Citing this family (237)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US6915262B2 (en) * 2000-11-30 2005-07-05 Telesector Resources Group, Inc. Methods and apparatus for performing speech recognition and using speech recognition results
US7693720B2 (en) 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
US10032452B1 (en) * 2016-12-30 2018-07-24 Google Llc Multimodal transmission of packetized data
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US8073681B2 (en) * 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US10496753B2 (en) * 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US9305548B2 (en) 2008-05-27 2016-04-05 Voicebox Technologies Corporation System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8463053B1 (en) 2008-08-08 2013-06-11 The Research Foundation Of State University Of New York Enhanced max margin learning on multimodal data mining in a multimedia database
US9390167B2 (en) 2010-07-29 2016-07-12 Soundhound, Inc. System and methods for continuous audio matching
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US9171541B2 (en) 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US9634855B2 (en) 2010-05-13 2017-04-25 Alexander Poltorak Electronic personal interactive device that determines topics of interest using a conversational agent
US9035163B1 (en) 2011-05-10 2015-05-19 Soundbound, Inc. System and method for targeting content based on identified audio and multimedia
DE102011079034A1 (de) 2011-07-12 2013-01-17 Siemens Aktiengesellschaft Ansteuerung eines technischen Systems
JP2013025299A (ja) * 2011-07-26 2013-02-04 Toshiba Corp 書き起こし支援システムおよび書き起こし支援方法
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8769624B2 (en) 2011-09-29 2014-07-01 Apple Inc. Access control utilizing indirect authentication
US9002322B2 (en) 2011-09-29 2015-04-07 Apple Inc. Authentication with secondary approver
US9620122B2 (en) * 2011-12-08 2017-04-11 Lenovo (Singapore) Pte. Ltd Hybrid speech recognition
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US10255914B2 (en) 2012-03-30 2019-04-09 Michael Boukadakis Digital concierge and method
US9361878B2 (en) * 2012-03-30 2016-06-07 Michael Boukadakis Computer-readable medium, system and method of providing domain-specific information
US9483459B1 (en) * 2012-03-31 2016-11-01 Google Inc. Natural language correction for speech input
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10776830B2 (en) 2012-05-23 2020-09-15 Google Llc Methods and systems for identifying new computers and providing matching services
US10152723B2 (en) 2012-05-23 2018-12-11 Google Llc Methods and systems for identifying new computers and providing matching services
KR20130135410A (ko) * 2012-05-31 2013-12-11 삼성전자주식회사 음성 인식 기능을 제공하는 방법 및 그 전자 장치
JP5819261B2 (ja) * 2012-06-19 2015-11-18 株式会社Nttドコモ 機能実行指示システム、機能実行指示方法及び機能実行指示プログラム
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US10957310B1 (en) 2012-07-23 2021-03-23 Soundhound, Inc. Integrated programming framework for speech and text understanding with meaning parsing
US9031848B2 (en) 2012-08-16 2015-05-12 Nuance Communications, Inc. User interface for searching a bundled service content data source
US9106957B2 (en) * 2012-08-16 2015-08-11 Nuance Communications, Inc. Method and apparatus for searching data sources for entertainment systems
US9497515B2 (en) 2012-08-16 2016-11-15 Nuance Communications, Inc. User interface for entertainment systems
US8799959B2 (en) 2012-08-16 2014-08-05 Hoi L. Young User interface for entertainment systems
US9026448B2 (en) 2012-08-16 2015-05-05 Nuance Communications, Inc. User interface for entertainment systems
JP6068901B2 (ja) * 2012-09-26 2017-01-25 京セラ株式会社 情報端末、音声操作プログラムおよび音声操作方法
US20140122084A1 (en) * 2012-10-25 2014-05-01 Nuance Communications, Inc. Data Search Service
WO2014209157A1 (en) 2013-06-27 2014-12-31 Obschestvo S Ogranichennoy Otvetstvennostiyu "Speaktoit" Generating dialog recommendations for chat information systems
US9171092B2 (en) * 2012-12-07 2015-10-27 Empire Technology Development Llc Personal assistant context building
CN103065630B (zh) * 2012-12-28 2015-01-07 科大讯飞股份有限公司 用户个性化信息语音识别方法及系统
US10735552B2 (en) 2013-01-31 2020-08-04 Google Llc Secondary transmissions of packetized data
US10650066B2 (en) 2013-01-31 2020-05-12 Google Llc Enhancing sitelinks with creative content
WO2014143776A2 (en) 2013-03-15 2014-09-18 Bodhi Technology Ventures Llc Providing remote interactions with host device using a wireless device
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US9633317B2 (en) * 2013-06-20 2017-04-25 Viv Labs, Inc. Dynamically evolving cognitive architecture system based on a natural language intent interpreter
US9519461B2 (en) 2013-06-20 2016-12-13 Viv Labs, Inc. Dynamically evolving cognitive architecture system based on third-party developers
US9594542B2 (en) 2013-06-20 2017-03-14 Viv Labs, Inc. Dynamically evolving cognitive architecture system based on training by third-party developers
US10474961B2 (en) 2013-06-20 2019-11-12 Viv Labs, Inc. Dynamically evolving cognitive architecture system based on prompting for additional user input
CN103354089B (zh) * 2013-06-25 2015-10-28 天津三星通信技术研究有限公司 一种语音通信管理方法及其装置
US20150058006A1 (en) * 2013-08-23 2015-02-26 Xerox Corporation Phonetic alignment for user-agent dialogue recognition
US9865255B2 (en) * 2013-08-29 2018-01-09 Panasonic Intellectual Property Corporation Of America Speech recognition method and speech recognition apparatus
US9361084B1 (en) 2013-11-14 2016-06-07 Google Inc. Methods and systems for installing and executing applications
US9507849B2 (en) 2013-11-28 2016-11-29 Soundhound, Inc. Method for combining a query and a communication command in a natural language computer system
US10811013B1 (en) * 2013-12-20 2020-10-20 Amazon Technologies, Inc. Intent-specific automatic speech recognition result generation
US11386886B2 (en) * 2014-01-28 2022-07-12 Lenovo (Singapore) Pte. Ltd. Adjusting speech recognition using contextual information
US9292488B2 (en) 2014-02-01 2016-03-22 Soundhound, Inc. Method for embedding voice mail in a spoken utterance using a natural language processing computer system
US11295730B1 (en) 2014-02-27 2022-04-05 Soundhound, Inc. Using phonetic variants in a local context to improve natural language understanding
CN103853463A (zh) * 2014-02-27 2014-06-11 珠海多玩信息技术有限公司 语音操控方法及装置
US9959744B2 (en) 2014-04-25 2018-05-01 Motorola Solutions, Inc. Method and system for providing alerts for radio communications
KR102282487B1 (ko) * 2014-05-08 2021-07-26 삼성전자주식회사 애플리케이션 실행 장치 및 방법
US9564123B1 (en) 2014-05-12 2017-02-07 Soundhound, Inc. Method and system for building an integrated user profile
US11343335B2 (en) 2014-05-29 2022-05-24 Apple Inc. Message processing by subscriber app prior to message forwarding
JP6328797B2 (ja) 2014-05-30 2018-05-23 アップル インコーポレイテッド 1つのデバイスの使用から別のデバイスの使用への移行
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9967401B2 (en) 2014-05-30 2018-05-08 Apple Inc. User interface for phone call routing among devices
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
EP3158691A4 (en) 2014-06-06 2018-03-28 Obschestvo S Ogranichennoy Otvetstvennostiyu "Speactoit" Proactive environment-based chat information system
CN104966513B (zh) * 2014-06-09 2018-09-04 腾讯科技(深圳)有限公司 语言命令处理方法和装置
US10659851B2 (en) * 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10339293B2 (en) 2014-08-15 2019-07-02 Apple Inc. Authenticated device used to unlock another device
CN105469789A (zh) * 2014-08-15 2016-04-06 中兴通讯股份有限公司 一种语音信息的处理方法及终端
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
KR20160027640A (ko) * 2014-09-02 2016-03-10 삼성전자주식회사 전자 장치 및 전자 장치에서의 개체명 인식 방법
US9953646B2 (en) 2014-09-02 2018-04-24 Belleau Technologies Method and system for dynamic speech recognition and tracking of prewritten script
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
CN107003996A (zh) 2014-09-16 2017-08-01 声钰科技 语音商务
WO2016044321A1 (en) 2014-09-16 2016-03-24 Min Tang Integration of domain information into state transitions of a finite state transducer for natural language processing
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
EP3201770B1 (en) * 2014-09-30 2020-06-03 Nuance Communications, Inc. Methods and apparatus for module arbitration
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
CN107003999B (zh) 2014-10-15 2020-08-21 声钰科技 对用户的在先自然语言输入的后续响应的系统和方法
US10203933B2 (en) 2014-11-06 2019-02-12 Microsoft Technology Licensing, Llc Context-based command surfacing
US9922098B2 (en) 2014-11-06 2018-03-20 Microsoft Technology Licensing, Llc Context-based search and relevancy generation
US9646611B2 (en) 2014-11-06 2017-05-09 Microsoft Technology Licensing, Llc Context-based actions
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
US10614799B2 (en) 2014-11-26 2020-04-07 Voicebox Technologies Corporation System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
JP6348831B2 (ja) * 2014-12-12 2018-06-27 クラリオン株式会社 音声入力補助装置、音声入力補助システムおよび音声入力方法
US10147421B2 (en) 2014-12-16 2018-12-04 Microcoft Technology Licensing, Llc Digital assistant voice input integration
CN105869632A (zh) * 2015-01-22 2016-08-17 北京三星通信技术研究有限公司 基于语音识别的文本修订方法和装置
WO2016117854A1 (ko) * 2015-01-22 2016-07-28 삼성전자 주식회사 음성 신호를 기초로 한 텍스트 편집 장치 및 텍스트 편집 방법
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9460713B1 (en) 2015-03-30 2016-10-04 Google Inc. Language model biasing modulation
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US9472196B1 (en) 2015-04-22 2016-10-18 Google Inc. Developer voice actions system
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US9576578B1 (en) * 2015-08-12 2017-02-21 Google Inc. Contextual improvement of voice query recognition
CN105183422B (zh) * 2015-08-31 2018-06-05 百度在线网络技术(北京)有限公司 语音控制应用程序的方法和装置
KR102420518B1 (ko) * 2015-09-09 2022-07-13 삼성전자주식회사 자연어 처리 시스템, 자연어 처리 장치, 자연어 처리 방법 및 컴퓨터 판독가능 기록매체
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
CN105512182B (zh) * 2015-11-25 2019-03-12 深圳Tcl数字技术有限公司 语音控制方法及智能电视
US20170177716A1 (en) * 2015-12-22 2017-06-22 Intel Corporation Technologies for semantic interpretation of user input by a dialogue manager
US10743101B2 (en) 2016-02-22 2020-08-11 Sonos, Inc. Content mixing
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9922648B2 (en) * 2016-03-01 2018-03-20 Google Llc Developer voice actions system
CN107193389A (zh) * 2016-03-14 2017-09-22 中兴通讯股份有限公司 一种实现输入的方法和装置
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10319371B2 (en) * 2016-05-04 2019-06-11 GM Global Technology Operations LLC Disambiguation of vehicle speech commands
KR102307976B1 (ko) 2016-05-10 2021-09-30 구글 엘엘씨 디바이스들 상의 보이스 어시스턴트에 대한 구현들
CN108604254B (zh) 2016-05-13 2022-04-12 谷歌有限责任公司 语音控制的隐藏字幕显示
JP6828741B2 (ja) * 2016-05-16 2021-02-10 ソニー株式会社 情報処理装置
DK179186B1 (en) 2016-05-19 2018-01-15 Apple Inc REMOTE AUTHORIZATION TO CONTINUE WITH AN ACTION
JP2017211430A (ja) 2016-05-23 2017-11-30 ソニー株式会社 情報処理装置および情報処理方法
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670622A1 (en) 2016-06-12 2018-02-12 Apple Inc User interfaces for transactions
EP3270374A1 (en) * 2016-07-13 2018-01-17 Tata Consultancy Services Limited Systems and methods for automatic repair of speech recognition engine output
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
WO2018023106A1 (en) 2016-07-29 2018-02-01 Erik SWART System and method of disambiguating natural language processing requests
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US10339925B1 (en) * 2016-09-26 2019-07-02 Amazon Technologies, Inc. Generation of automated message responses
US10217453B2 (en) * 2016-10-14 2019-02-26 Soundhound, Inc. Virtual assistant configured by selection of wake-up phrase
US9959864B1 (en) 2016-10-27 2018-05-01 Google Llc Location-based voice query recognition
US10276161B2 (en) * 2016-12-27 2019-04-30 Google Llc Contextual hotwords
US10593329B2 (en) 2016-12-30 2020-03-17 Google Llc Multimodal transmission of packetized data
US10708313B2 (en) 2016-12-30 2020-07-07 Google Llc Multimodal transmission of packetized data
US11100384B2 (en) 2017-02-14 2021-08-24 Microsoft Technology Licensing, Llc Intelligent device user interactions
US11010601B2 (en) 2017-02-14 2021-05-18 Microsoft Technology Licensing, Llc Intelligent assistant device communicating non-verbal cues
US10467509B2 (en) 2017-02-14 2019-11-05 Microsoft Technology Licensing, Llc Computationally-efficient human-identifying smart assistant computer
US10560656B2 (en) * 2017-03-19 2020-02-11 Apple Inc. Media message creation with automatic titling
KR102375800B1 (ko) 2017-04-28 2022-03-17 삼성전자주식회사 음성 인식 서비스를 제공하는 전자 장치 및 그 방법
US10992795B2 (en) 2017-05-16 2021-04-27 Apple Inc. Methods and interfaces for home media control
US11431836B2 (en) 2017-05-02 2022-08-30 Apple Inc. Methods and interfaces for initiating media playback
US11436417B2 (en) * 2017-05-15 2022-09-06 Google Llc Providing access to user-controlled resources by automated assistants
CN111343060B (zh) 2017-05-16 2022-02-11 苹果公司 用于家庭媒体控制的方法和界面
US20220279063A1 (en) 2017-05-16 2022-09-01 Apple Inc. Methods and interfaces for home media control
US11340925B2 (en) 2017-05-18 2022-05-24 Peloton Interactive Inc. Action recipes for a crowdsourced digital assistant system
US11043206B2 (en) 2017-05-18 2021-06-22 Aiqudo, Inc. Systems and methods for crowdsourced actions and commands
US11056105B2 (en) 2017-05-18 2021-07-06 Aiqudo, Inc Talk back from actions in applications
EP3635578A4 (en) * 2017-05-18 2021-08-25 Aiqudo, Inc. SYSTEMS AND PROCEDURES FOR CRWODSOURCING ACTIONS AND COMMANDS
CN107393544B (zh) * 2017-06-19 2019-03-05 维沃移动通信有限公司 一种语音信号修复方法及移动终端
US10607606B2 (en) 2017-06-19 2020-03-31 Lenovo (Singapore) Pte. Ltd. Systems and methods for execution of digital assistant
US20190354557A1 (en) * 2017-06-20 2019-11-21 Tom Kornblit System and Method For Providing Intelligent Customer Service
KR102383430B1 (ko) * 2017-06-21 2022-04-07 현대자동차주식회사 고속 음성 파일 처리 장치, 그를 포함한 시스템 및 그 방법
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10719507B2 (en) * 2017-09-21 2020-07-21 SayMosaic Inc. System and method for natural language processing
US10452695B2 (en) * 2017-09-22 2019-10-22 Oracle International Corporation Context-based virtual assistant implementation
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US10599645B2 (en) * 2017-10-06 2020-03-24 Soundhound, Inc. Bidirectional probabilistic natural language rewriting and selection
KR102445779B1 (ko) * 2017-11-07 2022-09-21 주식회사 엘지유플러스 대화형 서비스 장치 및 대화형 서비스 장치의 제어 방법
US20190146491A1 (en) * 2017-11-10 2019-05-16 GM Global Technology Operations LLC In-vehicle system to communicate with passengers
US10922357B1 (en) 2017-12-07 2021-02-16 Amazon Technologies, Inc. Automatically mapping natural language commands to service APIs
CN110021295B (zh) * 2018-01-07 2023-12-08 国际商业机器公司 用于识别由语音识别系统生成的错误转录的方法和系统
US11410075B2 (en) 2018-01-15 2022-08-09 Microsoft Technology Licensing, Llc Contextually-aware recommendations for assisting users with task completion
US10313514B1 (en) 2018-02-21 2019-06-04 Plantronics, Inc. Device registry for mediating communication sessions
US10777217B2 (en) * 2018-02-27 2020-09-15 At&T Intellectual Property I, L.P. Performance sensitive audio signal selection
WO2019168208A1 (ko) * 2018-02-27 2019-09-06 엘지전자 주식회사 이동 단말기 및 그 제어 방법
CN111819626A (zh) * 2018-03-07 2020-10-23 华为技术有限公司 一种语音交互的方法及装置
KR102617265B1 (ko) 2018-03-13 2023-12-26 삼성전자주식회사 사용자 음성 입력을 처리하는 장치
CN108520760B (zh) * 2018-03-27 2020-07-24 维沃移动通信有限公司 一种语音信号处理方法及终端
CN112055857A (zh) * 2018-05-02 2020-12-08 三星电子株式会社 上下文推荐
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
CN108922537B (zh) * 2018-05-28 2021-05-18 Oppo广东移动通信有限公司 音频识别方法、装置、终端、耳机及可读存储介质
US10811009B2 (en) * 2018-06-27 2020-10-20 International Business Machines Corporation Automatic skill routing in conversational computing frameworks
CN108806688A (zh) * 2018-07-16 2018-11-13 深圳Tcl数字技术有限公司 智能电视的语音控制方法、智能电视、系统及存储介质
EP3682345B1 (en) 2018-08-07 2021-11-24 Google LLC Assembling and evaluating automated assistant responses for privacy concerns
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) * 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10325597B1 (en) 2018-10-08 2019-06-18 Sorenson Ip Holdings, Llc Transcription of communications
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
CN109068011A (zh) * 2018-11-09 2018-12-21 长沙龙生光启新材料科技有限公司 一种智能移动终端及其控制方法
US10777186B1 (en) * 2018-11-13 2020-09-15 Amazon Technolgies, Inc. Streaming real-time automatic speech recognition service
US10573312B1 (en) 2018-12-04 2020-02-25 Sorenson Ip Holdings, Llc Transcription generation from multiple speech recognition systems
US10388272B1 (en) 2018-12-04 2019-08-20 Sorenson Ip Holdings, Llc Training speech recognition systems using word sequences
US11017778B1 (en) 2018-12-04 2021-05-25 Sorenson Ip Holdings, Llc Switching between speech recognition systems
US11170761B2 (en) 2018-12-04 2021-11-09 Sorenson Ip Holdings, Llc Training of speech recognition systems
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
CN109410923B (zh) * 2018-12-26 2022-06-10 中国联合网络通信集团有限公司 语音识别方法、装置、系统及存储介质
US11955120B1 (en) * 2019-01-31 2024-04-09 Alan AI, Inc. Systems and methods for integrating voice controls into applications
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
KR20240049648A (ko) 2019-05-31 2024-04-16 애플 인크. 오디오 미디어 제어를 위한 사용자 인터페이스
US11010121B2 (en) 2019-05-31 2021-05-18 Apple Inc. User interfaces for audio media control
US11477609B2 (en) 2019-06-01 2022-10-18 Apple Inc. User interfaces for location-related communications
US11481094B2 (en) 2019-06-01 2022-10-25 Apple Inc. User interfaces for location-related communications
CN112086096B (zh) * 2019-06-14 2024-04-05 北京京东尚科信息技术有限公司 数据处理方法、装置、系统、介质
CN112242142B (zh) * 2019-07-17 2024-01-30 北京搜狗科技发展有限公司 一种语音识别输入的方法及相关装置
KR20210042520A (ko) * 2019-10-10 2021-04-20 삼성전자주식회사 전자 장치 및 이의 제어 방법
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
CN111143535B (zh) * 2019-12-27 2021-08-10 北京百度网讯科技有限公司 用于生成对话模型的方法和装置
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
WO2021183681A1 (en) * 2020-03-10 2021-09-16 MeetKai, Inc. Parallel hypothetical reasoning to power a multi-lingual, multi-turn, multi-domain virtual assistant
KR20210130465A (ko) * 2020-04-22 2021-11-01 현대자동차주식회사 대화 시스템 및 그 제어 방법
US11810578B2 (en) 2020-05-11 2023-11-07 Apple Inc. Device arbitration for digital assistant-based intercom systems
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
CN111863009B (zh) * 2020-07-15 2022-07-26 思必驰科技股份有限公司 上下文信息预测模型的训练方法及系统
CN111883105B (zh) * 2020-07-15 2022-05-10 思必驰科技股份有限公司 用于视频场景的上下文信息预测模型的训练方法及系统
US11488604B2 (en) 2020-08-19 2022-11-01 Sorenson Ip Holdings, Llc Transcription of audio
US11829720B2 (en) 2020-09-01 2023-11-28 Apple Inc. Analysis and validation of language models
US11527237B1 (en) * 2020-09-18 2022-12-13 Amazon Technologies, Inc. User-system dialog expansion
US11392291B2 (en) 2020-09-25 2022-07-19 Apple Inc. Methods and interfaces for media control with dynamic feedback
US11967306B2 (en) 2021-04-14 2024-04-23 Honeywell International Inc. Contextual speech recognition methods and systems
US11847378B2 (en) 2021-06-06 2023-12-19 Apple Inc. User interfaces for audio routing
US20230117535A1 (en) * 2021-10-15 2023-04-20 Samsung Electronics Co., Ltd. Method and system for device feature analysis to improve user experience

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0863330A (ja) * 1994-08-17 1996-03-08 Fujitsu Ltd 音声入力装置
JP2004534268A (ja) * 2001-06-27 2004-11-11 テレローグ,インコーポレイティド 自動アテンダントによって使用される情報を前処理するシステムと方法
JP2005181386A (ja) * 2003-12-16 2005-07-07 Mitsubishi Electric Corp 音声対話処理装置及び音声対話処理方法並びにプログラム
JP2008097003A (ja) * 2006-10-12 2008-04-24 Qnx Software Systems (Wavemakers) Inc 自動音声認識システムに対する適応コンテキスト
JP2010535377A (ja) * 2007-08-01 2010-11-18 ジンジャー ソフトウェア、インコーポレイティッド インターネットコーパスを用いた、文脈依存言語の自動的な修正および改善
WO2011093025A1 (ja) * 2010-01-29 2011-08-04 日本電気株式会社 入力支援システム、方法、およびプログラム

Family Cites Families (600)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3828132A (en) 1970-10-30 1974-08-06 Bell Telephone Labor Inc Speech synthesis by concatenation of formant encoded words
US3704345A (en) 1971-03-19 1972-11-28 Bell Telephone Labor Inc Conversion of printed text into synthetic speech
US3979557A (en) 1974-07-03 1976-09-07 International Telephone And Telegraph Corporation Speech processor system for pitch period extraction using prediction filters
BG24190A1 (en) 1976-09-08 1978-01-10 Antonov Method of synthesis of speech and device for effecting same
JPS597120B2 (ja) 1978-11-24 1984-02-16 日本電気株式会社 音声分析装置
US4310721A (en) 1980-01-23 1982-01-12 The United States Of America As Represented By The Secretary Of The Army Half duplex integral vocoder modem system
US4348553A (en) 1980-07-02 1982-09-07 International Business Machines Corporation Parallel pattern verifier with dynamic time warping
DE3382806T2 (de) 1982-06-11 1996-11-14 Mitsubishi Electric Corp Vektorquantisierer
US4688195A (en) 1983-01-28 1987-08-18 Texas Instruments Incorporated Natural-language interface generating system
JPS603056A (ja) 1983-06-21 1985-01-09 Toshiba Corp 情報整理装置
DE3335358A1 (de) 1983-09-29 1985-04-11 Siemens AG, 1000 Berlin und 8000 München Verfahren zur bestimmung von sprachspektren fuer die automatische spracherkennung und sprachcodierung
US5164900A (en) 1983-11-14 1992-11-17 Colman Bernath Method and device for phonetically encoding Chinese textual data for data processing entry
US4726065A (en) 1984-01-26 1988-02-16 Horst Froessl Image manipulation by speech signals
US4955047A (en) 1984-03-26 1990-09-04 Dytel Corporation Automated attendant with direct inward system access
US4811243A (en) 1984-04-06 1989-03-07 Racine Marsh V Computer aided coordinate digitizing system
US4692941A (en) 1984-04-10 1987-09-08 First Byte Real-time text-to-speech conversion system
US4783807A (en) 1984-08-27 1988-11-08 John Marley System and method for sound recognition with feature selection synchronized to voice pitch
US4718094A (en) 1984-11-19 1988-01-05 International Business Machines Corp. Speech recognition system
US5165007A (en) 1985-02-01 1992-11-17 International Business Machines Corporation Feneme-based Markov models for words
US4944013A (en) 1985-04-03 1990-07-24 British Telecommunications Public Limited Company Multi-pulse speech coder
US4833712A (en) 1985-05-29 1989-05-23 International Business Machines Corporation Automatic generation of simple Markov model stunted baseforms for words in a vocabulary
US4819271A (en) 1985-05-29 1989-04-04 International Business Machines Corporation Constructing Markov model word baseforms from multiple utterances by concatenating model sequences for word segments
EP0218859A3 (en) 1985-10-11 1989-09-06 International Business Machines Corporation Signal processor communication interface
US4776016A (en) 1985-11-21 1988-10-04 Position Orientation Systems, Inc. Voice control system
JPH0833744B2 (ja) 1986-01-09 1996-03-29 株式会社東芝 音声合成装置
US4724542A (en) 1986-01-22 1988-02-09 International Business Machines Corporation Automatic reference adaptation during dynamic signature verification
US5057915A (en) 1986-03-10 1991-10-15 Kohorn H Von System and method for attracting shoppers to sales outlets
US5759101A (en) 1986-03-10 1998-06-02 Response Reward Systems L.C. Central and remote evaluation of responses of participatory broadcast audience with automatic crediting and couponing
US5032989A (en) 1986-03-19 1991-07-16 Realpro, Ltd. Real estate search and location system and method
DE3779351D1 (ja) 1986-03-28 1992-07-02 American Telephone And Telegraph Co., New York, N.Y., Us
US4903305A (en) 1986-05-12 1990-02-20 Dragon Systems, Inc. Method for representing word models for use in speech recognition
WO1988002516A1 (en) 1986-10-03 1988-04-07 British Telecommunications Public Limited Company Language translation system
AU592236B2 (en) 1986-10-16 1990-01-04 Mitsubishi Denki Kabushiki Kaisha Amplitude-adapted vector quantizer
US4829576A (en) 1986-10-21 1989-05-09 Dragon Systems, Inc. Voice recognition system
US4852168A (en) 1986-11-18 1989-07-25 Sprague Richard P Compression of stored waveforms for artificial speech
US4727354A (en) 1987-01-07 1988-02-23 Unisys Corporation System for selecting best fit vector code in vector quantization encoding
US4827520A (en) 1987-01-16 1989-05-02 Prince Corporation Voice actuated control system for use in a vehicle
US4965763A (en) 1987-03-03 1990-10-23 International Business Machines Corporation Computer method for automatic extraction of commonly specified information from business correspondence
US5644727A (en) 1987-04-15 1997-07-01 Proprietary Financial Products, Inc. System for the operation and management of one or more financial accounts through the use of a digital communication and computation system for exchange, investment and borrowing
EP0293259A3 (en) 1987-05-29 1990-03-07 Kabushiki Kaisha Toshiba Voice recognition system used in telephone apparatus
DE3723078A1 (de) 1987-07-11 1989-01-19 Philips Patentverwaltung Verfahren zur erkennung von zusammenhaengend gesprochenen woertern
US4974191A (en) 1987-07-31 1990-11-27 Syntellect Software Inc. Adaptive natural language computer interface system
CA1288516C (en) 1987-07-31 1991-09-03 Leendert M. Bijnagte Apparatus and method for communicating textual and image information between a host computer and a remote display terminal
US5022081A (en) 1987-10-01 1991-06-04 Sharp Kabushiki Kaisha Information recognition system
US4852173A (en) 1987-10-29 1989-07-25 International Business Machines Corporation Design and construction of a binary-tree system for language modelling
DE3876379T2 (de) 1987-10-30 1993-06-09 Ibm Automatische bestimmung von kennzeichen und markov-wortmodellen in einem spracherkennungssystem.
US5072452A (en) 1987-10-30 1991-12-10 International Business Machines Corporation Automatic determination of labels and Markov word models in a speech recognition system
US4914586A (en) 1987-11-06 1990-04-03 Xerox Corporation Garbage collector for hypermedia systems
US4992972A (en) 1987-11-18 1991-02-12 International Business Machines Corporation Flexible context searchable on-line information system with help files and modules for on-line computer system documentation
US5220657A (en) 1987-12-02 1993-06-15 Xerox Corporation Updating local copy of shared data in a collaborative system
US4984177A (en) 1988-02-05 1991-01-08 Advanced Products And Technologies, Inc. Voice language translator
CA1333420C (en) 1988-02-29 1994-12-06 Tokumichi Murakami Vector quantizer
US4914590A (en) 1988-05-18 1990-04-03 Emhart Industries, Inc. Natural language understanding system
FR2636163B1 (fr) 1988-09-02 1991-07-05 Hamon Christian Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde
US4839853A (en) 1988-09-15 1989-06-13 Bell Communications Research, Inc. Computer information retrieval using latent semantic structure
JPH0293597A (ja) 1988-09-30 1990-04-04 Nippon I B M Kk 音声認識装置
US4905163A (en) 1988-10-03 1990-02-27 Minnesota Mining & Manufacturing Company Intelligent optical navigator dynamic information presentation and navigation system
US5282265A (en) 1988-10-04 1994-01-25 Canon Kabushiki Kaisha Knowledge information processing system
DE3837590A1 (de) 1988-11-05 1990-05-10 Ant Nachrichtentech Verfahren zum reduzieren der datenrate von digitalen bilddaten
ATE102731T1 (de) 1988-11-23 1994-03-15 Digital Equipment Corp Namenaussprache durch einen synthetisator.
US5027406A (en) 1988-12-06 1991-06-25 Dragon Systems, Inc. Method for interactive speech recognition and training
US5127055A (en) 1988-12-30 1992-06-30 Kurzweil Applied Intelligence, Inc. Speech recognition apparatus & method having dynamic reference pattern adaptation
US5293448A (en) 1989-10-02 1994-03-08 Nippon Telegraph And Telephone Corporation Speech analysis-synthesis method and apparatus therefor
US5047614A (en) 1989-01-23 1991-09-10 Bianco James S Method and apparatus for computer-aided shopping
SE466029B (sv) 1989-03-06 1991-12-02 Ibm Svenska Ab Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem
JPH0782544B2 (ja) 1989-03-24 1995-09-06 インターナショナル・ビジネス・マシーンズ・コーポレーション マルチテンプレートを用いるdpマツチング方法及び装置
US4977598A (en) 1989-04-13 1990-12-11 Texas Instruments Incorporated Efficient pruning algorithm for hidden markov model speech recognition
US5197005A (en) 1989-05-01 1993-03-23 Intelligent Business Systems Database retrieval system having a natural language interface
US5010574A (en) 1989-06-13 1991-04-23 At&T Bell Laboratories Vector quantizer search arrangement
JP2940005B2 (ja) 1989-07-20 1999-08-25 日本電気株式会社 音声符号化装置
US5091945A (en) 1989-09-28 1992-02-25 At&T Bell Laboratories Source dependent channel coding with error protection
CA2027705C (en) 1989-10-17 1994-02-15 Masami Akamine Speech coding system utilizing a recursive computation technique for improvement in processing speed
US5020112A (en) 1989-10-31 1991-05-28 At&T Bell Laboratories Image recognition method using two-dimensional stochastic grammars
US5220639A (en) 1989-12-01 1993-06-15 National Science Council Mandarin speech input method for Chinese computers and a mandarin speech recognition machine
US5021971A (en) 1989-12-07 1991-06-04 Unisys Corporation Reflective binary encoder for vector quantization
US5179652A (en) 1989-12-13 1993-01-12 Anthony I. Rozmanith Method and apparatus for storing, transmitting and retrieving graphical and tabular data
CH681573A5 (en) 1990-02-13 1993-04-15 Astral Automatic teller arrangement involving bank computers - is operated by user data card carrying personal data, account information and transaction records
EP0443548B1 (en) 1990-02-22 2003-07-23 Nec Corporation Speech coder
US5301109A (en) 1990-06-11 1994-04-05 Bell Communications Research, Inc. Computerized cross-language document retrieval using latent semantic indexing
JP3266246B2 (ja) 1990-06-15 2002-03-18 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US5202952A (en) 1990-06-22 1993-04-13 Dragon Systems, Inc. Large-vocabulary continuous speech prefiltering and processing system
GB9017600D0 (en) 1990-08-10 1990-09-26 British Aerospace An assembly and method for binary tree-searched vector quanisation data compression processing
US5309359A (en) 1990-08-16 1994-05-03 Boris Katz Method and apparatus for generating and utlizing annotations to facilitate computer text retrieval
US5404295A (en) 1990-08-16 1995-04-04 Katz; Boris Method and apparatus for utilizing annotations to facilitate computer retrieval of database material
US5297170A (en) 1990-08-21 1994-03-22 Codex Corporation Lattice and trellis-coded quantization
US5400434A (en) 1990-09-04 1995-03-21 Matsushita Electric Industrial Co., Ltd. Voice source for synthetic speech system
US5216747A (en) 1990-09-20 1993-06-01 Digital Voice Systems, Inc. Voiced/unvoiced estimation of an acoustic signal
US5128672A (en) 1990-10-30 1992-07-07 Apple Computer, Inc. Dynamic predictive keyboard
US5317507A (en) 1990-11-07 1994-05-31 Gallant Stephen I Method for document retrieval and for word sense disambiguation using neural networks
US5325298A (en) 1990-11-07 1994-06-28 Hnc, Inc. Methods for generating or revising context vectors for a plurality of word stems
US5247579A (en) 1990-12-05 1993-09-21 Digital Voice Systems, Inc. Methods for speech transmission
US5345536A (en) 1990-12-21 1994-09-06 Matsushita Electric Industrial Co., Ltd. Method of speech recognition
US5127053A (en) 1990-12-24 1992-06-30 General Electric Company Low-complexity method for improving the performance of autocorrelation-based pitch detectors
US5133011A (en) 1990-12-26 1992-07-21 International Business Machines Corporation Method and apparatus for linear vocal control of cursor position
US5268990A (en) 1991-01-31 1993-12-07 Sri International Method for recognizing speech using linguistically-motivated hidden Markov models
GB9105367D0 (en) 1991-03-13 1991-04-24 Univ Strathclyde Computerised information-retrieval database systems
US5303406A (en) 1991-04-29 1994-04-12 Motorola, Inc. Noise squelch circuit with adaptive noise shaping
US5475587A (en) 1991-06-28 1995-12-12 Digital Equipment Corporation Method and apparatus for efficient morphological text analysis using a high-level language for compact specification of inflectional paradigms
US5293452A (en) 1991-07-01 1994-03-08 Texas Instruments Incorporated Voice log-in using spoken name input
US5687077A (en) 1991-07-31 1997-11-11 Universal Dynamics Limited Method and apparatus for adaptive control
US5199077A (en) 1991-09-19 1993-03-30 Xerox Corporation Wordspotting for voice editing and indexing
JP2662120B2 (ja) 1991-10-01 1997-10-08 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声認識装置および音声認識用処理ユニット
US5222146A (en) 1991-10-23 1993-06-22 International Business Machines Corporation Speech recognition apparatus having a speech coder outputting acoustic prototype ranks
KR940002854B1 (ko) 1991-11-06 1994-04-04 한국전기통신공사 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치
US5386494A (en) 1991-12-06 1995-01-31 Apple Computer, Inc. Method and apparatus for controlling a speech recognition function using a cursor control device
US5903454A (en) 1991-12-23 1999-05-11 Hoffberg; Linda Irene Human-factored interface corporating adaptive pattern recognition based controller apparatus
US6081750A (en) 1991-12-23 2000-06-27 Hoffberg; Steven Mark Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US5502790A (en) 1991-12-24 1996-03-26 Oki Electric Industry Co., Ltd. Speech recognition method and system using triphones, diphones, and phonemes
US5349645A (en) 1991-12-31 1994-09-20 Matsushita Electric Industrial Co., Ltd. Word hypothesizer for continuous speech decoding using stressed-vowel centered bidirectional tree searches
US5267345A (en) 1992-02-10 1993-11-30 International Business Machines Corporation Speech recognition apparatus which predicts word classes from context and words from word classes
EP0559349B1 (en) 1992-03-02 1999-01-07 AT&T Corp. Training method and apparatus for speech recognition
US6055514A (en) 1992-03-20 2000-04-25 Wren; Stephen Corey System for marketing foods and services utilizing computerized centraland remote facilities
US5317647A (en) 1992-04-07 1994-05-31 Apple Computer, Inc. Constrained attribute grammars for syntactic pattern recognition
US5412804A (en) 1992-04-30 1995-05-02 Oracle Corporation Extending the semantics of the outer join operator for un-nesting queries to a data base
US5293584A (en) 1992-05-21 1994-03-08 International Business Machines Corporation Speech recognition system for natural language translation
US5390281A (en) 1992-05-27 1995-02-14 Apple Computer, Inc. Method and apparatus for deducing user intent and providing computer implemented services
US5434777A (en) 1992-05-27 1995-07-18 Apple Computer, Inc. Method and apparatus for processing natural language
US5734789A (en) 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
US5333275A (en) 1992-06-23 1994-07-26 Wheatley Barbara J System and method for time aligning speech
US5325297A (en) 1992-06-25 1994-06-28 System Of Multiple-Colored Images For Internationally Listed Estates, Inc. Computer implemented method and system for storing and retrieving textual data and compressed image data
US5999908A (en) 1992-08-06 1999-12-07 Abelow; Daniel H. Customer-based product design module
US5412806A (en) 1992-08-20 1995-05-02 Hewlett-Packard Company Calibration of logical cost formulae for queries in a heterogeneous DBMS using synthetic database
GB9220404D0 (en) 1992-08-20 1992-11-11 Nat Security Agency Method of identifying,retrieving and sorting documents
US5333236A (en) 1992-09-10 1994-07-26 International Business Machines Corporation Speech recognizer having a speech coder for an acoustic match based on context-dependent speech-transition acoustic models
US5384893A (en) 1992-09-23 1995-01-24 Emerson & Stern Associates, Inc. Method and apparatus for speech synthesis based on prosodic analysis
FR2696036B1 (fr) 1992-09-24 1994-10-14 France Telecom Procédé de mesure de ressemblance entre échantillons sonores et dispositif de mise en Óoeuvre de ce procédé.
JPH0772840B2 (ja) 1992-09-29 1995-08-02 日本アイ・ビー・エム株式会社 音声モデルの構成方法、音声認識方法、音声認識装置及び音声モデルの訓練方法
US5758313A (en) 1992-10-16 1998-05-26 Mobile Information Systems, Inc. Method and apparatus for tracking vehicle location
US6092043A (en) * 1992-11-13 2000-07-18 Dragon Systems, Inc. Apparatuses and method for training and operating speech recognition systems
US5909666A (en) * 1992-11-13 1999-06-01 Dragon Systems, Inc. Speech recognition system which creates acoustic models by concatenating acoustic models of individual words
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US5412756A (en) 1992-12-22 1995-05-02 Mitsubishi Denki Kabushiki Kaisha Artificial intelligence software shell for plant operation simulation
US5390279A (en) 1992-12-31 1995-02-14 Apple Computer, Inc. Partitioning speech rules by context for speech recognition
US5384892A (en) 1992-12-31 1995-01-24 Apple Computer, Inc. Dynamic language model for speech recognition
US5613036A (en) 1992-12-31 1997-03-18 Apple Computer, Inc. Dynamic categories for a speech recognition system
US5734791A (en) 1992-12-31 1998-03-31 Apple Computer, Inc. Rapid tree-based method for vector quantization
US6311157B1 (en) 1992-12-31 2001-10-30 Apple Computer, Inc. Assigning meanings to utterances in a speech recognition system
US6122616A (en) 1993-01-21 2000-09-19 Apple Computer, Inc. Method and apparatus for diphone aliasing
US5864844A (en) 1993-02-18 1999-01-26 Apple Computer, Inc. System and method for enhancing a user interface with a computer based training tool
CA2091658A1 (en) 1993-03-15 1994-09-16 Matthew Lennig Method and apparatus for automation of directory assistance using speech recognition
US6055531A (en) 1993-03-24 2000-04-25 Engate Incorporated Down-line transcription system having context sensitive searching capability
US5536902A (en) 1993-04-14 1996-07-16 Yamaha Corporation Method of and apparatus for analyzing and synthesizing a sound by extracting and controlling a sound parameter
US5444823A (en) 1993-04-16 1995-08-22 Compaq Computer Corporation Intelligent search engine for associated on-line documentation having questionless case-based knowledge base
US5574823A (en) 1993-06-23 1996-11-12 Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Communications Frequency selective harmonic coding
US5515475A (en) 1993-06-24 1996-05-07 Northern Telecom Limited Speech recognition method using a two-pass search
JPH0756933A (ja) 1993-06-24 1995-03-03 Xerox Corp 文書検索方法
JP3685812B2 (ja) 1993-06-29 2005-08-24 ソニー株式会社 音声信号送受信装置
US5794207A (en) 1996-09-04 1998-08-11 Walker Asset Management Limited Partnership Method and apparatus for a cryptographically assisted commercial network system designed to facilitate buyer-driven conditional purchase offers
US5495604A (en) 1993-08-25 1996-02-27 Asymetrix Corporation Method and apparatus for the modeling and query of database structures using natural language-like constructs
US5619694A (en) 1993-08-26 1997-04-08 Nec Corporation Case database storage/retrieval system
US5940811A (en) 1993-08-27 1999-08-17 Affinity Technology Group, Inc. Closed loop financial transaction method and apparatus
US5377258A (en) 1993-08-30 1994-12-27 National Medical Research Council Method and apparatus for an automated and interactive behavioral guidance system
US5873056A (en) 1993-10-12 1999-02-16 The Syracuse University Natural language processing system for semantic vector representation which accounts for lexical ambiguity
US5578808A (en) 1993-12-22 1996-11-26 Datamark Services, Inc. Data card that can be used for transactions involving separate card issuers
WO1995017711A1 (en) 1993-12-23 1995-06-29 Diacom Technologies, Inc. Method and apparatus for implementing user feedback
US5621859A (en) 1994-01-19 1997-04-15 Bbn Corporation Single tree method for grammar directed, very large vocabulary speech recognizer
US5584024A (en) 1994-03-24 1996-12-10 Software Ag Interactive database query system and method for prohibiting the selection of semantically incorrect query parameters
US5642519A (en) 1994-04-29 1997-06-24 Sun Microsystems, Inc. Speech interpreter with a unified grammer compiler
EP0684607B1 (en) 1994-05-25 2001-03-14 Victor Company Of Japan, Limited Variable transfer rate data reproduction apparatus
US5493677A (en) 1994-06-08 1996-02-20 Systems Research & Applications Corporation Generation, archiving, and retrieval of digital images with evoked suggestion-set captions and natural language interface
US5675819A (en) 1994-06-16 1997-10-07 Xerox Corporation Document information retrieval using global word co-occurrence patterns
JPH0869470A (ja) 1994-06-21 1996-03-12 Canon Inc 自然言語処理装置及びその方法
US5948040A (en) 1994-06-24 1999-09-07 Delorme Publishing Co. Travel reservation information and planning system
US5682539A (en) 1994-09-29 1997-10-28 Conrad; Donovan Anticipated meaning natural language interface
US5715468A (en) 1994-09-30 1998-02-03 Budzinski; Robert Lucius Memory system for storing and retrieving experience and knowledge with natural language
GB2293667B (en) 1994-09-30 1998-05-27 Intermation Limited Database management system
US5845255A (en) 1994-10-28 1998-12-01 Advanced Health Med-E-Systems Corporation Prescription management system
US5577241A (en) 1994-12-07 1996-11-19 Excite, Inc. Information retrieval system and method with implementation extensible query architecture
US5748974A (en) 1994-12-13 1998-05-05 International Business Machines Corporation Multimodal natural language interface for cross-application tasks
US5794050A (en) 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
CN1183841A (zh) 1995-02-13 1998-06-03 英特特拉斯特技术公司 用于安全交易管理和电子权利保护的系统和方法
US5701400A (en) 1995-03-08 1997-12-23 Amado; Carlos Armando Method and apparatus for applying if-then-else rules to data sets in a relational data base and generating from the results of application of said rules a database of diagnostics linked to said data sets to aid executive analysis of financial data
US5749081A (en) 1995-04-06 1998-05-05 Firefly Network, Inc. System and method for recommending items to a user
US5642464A (en) 1995-05-03 1997-06-24 Northern Telecom Limited Methods and apparatus for noise conditioning in digital speech compression systems using linear predictive coding
US5664055A (en) 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US5710886A (en) 1995-06-16 1998-01-20 Sellectsoft, L.C. Electric couponing method and apparatus
JP3284832B2 (ja) 1995-06-22 2002-05-20 セイコーエプソン株式会社 音声認識対話処理方法および音声認識対話装置
US6038533A (en) 1995-07-07 2000-03-14 Lucent Technologies Inc. System and method for selecting training text
US6026388A (en) 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
JP3697748B2 (ja) 1995-08-21 2005-09-21 セイコーエプソン株式会社 端末、音声認識装置
US5712957A (en) 1995-09-08 1998-01-27 Carnegie Mellon University Locating and correcting erroneously recognized portions of utterances by rescoring based on two n-best lists
US6173261B1 (en) 1998-09-30 2001-01-09 At&T Corp Grammar fragment acquisition using syntactic and semantic clustering
US5790978A (en) 1995-09-15 1998-08-04 Lucent Technologies, Inc. System and method for determining pitch contours
US5737734A (en) 1995-09-15 1998-04-07 Infonautics Corporation Query word relevance adjustment in a search of an information retrieval system
US5884323A (en) 1995-10-13 1999-03-16 3Com Corporation Extendible method and apparatus for synchronizing files on two different computer systems
US5799276A (en) 1995-11-07 1998-08-25 Accent Incorporated Knowledge-based speech recognition system and methods having frame length computed based upon estimated pitch period of vocalic intervals
US6064959A (en) * 1997-03-28 2000-05-16 Dragon Systems, Inc. Error correction in speech recognition
US5794237A (en) 1995-11-13 1998-08-11 International Business Machines Corporation System and method for improving problem source identification in computer systems employing relevance feedback and statistical source ranking
US5706442A (en) 1995-12-20 1998-01-06 Block Financial Corporation System for on-line financial services using distributed objects
US6119101A (en) 1996-01-17 2000-09-12 Personal Agents, Inc. Intelligent agents for electronic commerce
US6125356A (en) 1996-01-18 2000-09-26 Rosefaire Development, Ltd. Portable sales presentation system with selective scripted seller prompts
US5987404A (en) 1996-01-29 1999-11-16 International Business Machines Corporation Statistical natural language understanding using hidden clumpings
US5729694A (en) 1996-02-06 1998-03-17 The Regents Of The University Of California Speech coding, reconstruction and recognition using acoustics and electromagnetic waves
US6076088A (en) 1996-02-09 2000-06-13 Paik; Woojin Information extraction system and method using concept relation concept (CRC) triples
US5835893A (en) 1996-02-15 1998-11-10 Atr Interpreting Telecommunications Research Labs Class-based word clustering for speech recognition using a three-level balanced hierarchical similarity
US5901287A (en) 1996-04-01 1999-05-04 The Sabre Group Inc. Information aggregation and synthesization system
US5867799A (en) 1996-04-04 1999-02-02 Lang; Andrew K. Information system and method for filtering a massive flow of information entities to meet user information classification needs
US5987140A (en) 1996-04-26 1999-11-16 Verifone, Inc. System, method and article of manufacture for secure network electronic payment and credit collection
US5963924A (en) 1996-04-26 1999-10-05 Verifone, Inc. System, method and article of manufacture for the use of payment instrument holders and payment instruments in network electronic commerce
US5913193A (en) 1996-04-30 1999-06-15 Microsoft Corporation Method and system of runtime acoustic unit selection for speech synthesis
US5857184A (en) 1996-05-03 1999-01-05 Walden Media, Inc. Language and method for creating, organizing, and retrieving data from a database
FR2748342B1 (fr) 1996-05-06 1998-07-17 France Telecom Procede et dispositif de filtrage par egalisation d'un signal de parole, mettant en oeuvre un modele statistique de ce signal
US5828999A (en) 1996-05-06 1998-10-27 Apple Computer, Inc. Method and system for deriving a large-span semantic language model for large-vocabulary recognition systems
US5826261A (en) 1996-05-10 1998-10-20 Spencer; Graham System and method for querying multiple, distributed databases by selective sharing of local relative significance information for terms related to the query
US6366883B1 (en) 1996-05-15 2002-04-02 Atr Interpreting Telecommunications Concatenation of speech segments by use of a speech synthesizer
US5727950A (en) 1996-05-22 1998-03-17 Netsage Corporation Agent based instruction system and method
US5966533A (en) 1996-06-11 1999-10-12 Excite, Inc. Method and system for dynamically synthesizing a computer program by differentially resolving atoms based on user context data
US5915249A (en) 1996-06-14 1999-06-22 Excite, Inc. System and method for accelerated query evaluation of very large full-text databases
US5987132A (en) 1996-06-17 1999-11-16 Verifone, Inc. System, method and article of manufacture for conditionally accepting a payment method utilizing an extensible, flexible architecture
US5825881A (en) 1996-06-28 1998-10-20 Allsoft Distributing Inc. Public network merchandising system
US6070147A (en) 1996-07-02 2000-05-30 Tecmark Services, Inc. Customer identification and marketing analysis systems
CN100371914C (zh) 1996-07-22 2008-02-27 Cyva研究公司 个人信息安全与交换的工具
US5862223A (en) 1996-07-24 1999-01-19 Walker Asset Management Limited Partnership Method and apparatus for a cryptographically-assisted commercial network system designed to facilitate and support expert-based commerce
EP0829811A1 (en) 1996-09-11 1998-03-18 Nippon Telegraph And Telephone Corporation Method and system for information retrieval
US6181935B1 (en) 1996-09-27 2001-01-30 Software.Com, Inc. Mobility extended telephone application programming interface and method of use
US5794182A (en) 1996-09-30 1998-08-11 Apple Computer, Inc. Linear predictive speech encoding systems with efficient combination pitch coefficients computation
US5721827A (en) 1996-10-02 1998-02-24 James Logan System for electrically distributing personalized information
US5913203A (en) 1996-10-03 1999-06-15 Jaesent Inc. System and method for pseudo cash transactions
US5930769A (en) 1996-10-07 1999-07-27 Rose; Andrea System and method for fashion shopping
US5836771A (en) 1996-12-02 1998-11-17 Ho; Chi Fai Learning method and system based on questioning
US6665639B2 (en) 1996-12-06 2003-12-16 Sensory, Inc. Speech recognition in consumer electronic products
US6078914A (en) 1996-12-09 2000-06-20 Open Text Corporation Natural language meta-search system and method
US5839106A (en) 1996-12-17 1998-11-17 Apple Computer, Inc. Large-vocabulary speech recognition using an integrated syntactic and semantic statistical language model
US5966126A (en) 1996-12-23 1999-10-12 Szabo; Andrew J. Graphic user interface for database system
US5932869A (en) 1996-12-27 1999-08-03 Graphic Technology, Inc. Promotional system with magnetic stripe and visual thermo-reversible print surfaced medium
JP3579204B2 (ja) 1997-01-17 2004-10-20 富士通株式会社 文書要約装置およびその方法
US5941944A (en) 1997-03-03 1999-08-24 Microsoft Corporation Method for providing a substitute for a requested inaccessible object by identifying substantially similar objects using weights corresponding to object features
US5930801A (en) 1997-03-07 1999-07-27 Xerox Corporation Shared-data environment in which each file has independent security properties
US6076051A (en) 1997-03-07 2000-06-13 Microsoft Corporation Information retrieval utilizing semantic representation of text
US5822743A (en) 1997-04-08 1998-10-13 1215627 Ontario Inc. Knowledge-based information retrieval system
US5970474A (en) 1997-04-24 1999-10-19 Sears, Roebuck And Co. Registry information system for shoppers
US5895464A (en) 1997-04-30 1999-04-20 Eastman Kodak Company Computer program product and a method for using natural language for the description, search and retrieval of multi-media objects
US6138098A (en) * 1997-06-30 2000-10-24 Lernout & Hauspie Speech Products N.V. Command parsing and rewrite system
US5860063A (en) 1997-07-11 1999-01-12 At&T Corp Automated meaningful phrase clustering
US5933822A (en) 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
US5974146A (en) 1997-07-30 1999-10-26 Huntington Bancshares Incorporated Real time bank-centric universal payment system
US5895466A (en) 1997-08-19 1999-04-20 At&T Corp Automated natural language understanding customer service system
US6081774A (en) 1997-08-22 2000-06-27 Novell, Inc. Natural language information retrieval system and method
US6404876B1 (en) 1997-09-25 2002-06-11 Gte Intelligent Network Services Incorporated System and method for voice activated dialing and routing under open access network control
US6023684A (en) 1997-10-01 2000-02-08 Security First Technologies, Inc. Three tier financial transaction system with cache memory
DE69712485T2 (de) 1997-10-23 2002-12-12 Sony Int Europe Gmbh Sprachschnittstelle für ein Hausnetzwerk
US6108627A (en) 1997-10-31 2000-08-22 Nortel Networks Corporation Automatic transcription tool
US5943670A (en) 1997-11-21 1999-08-24 International Business Machines Corporation System and method for categorizing objects in combined categories
US5960422A (en) 1997-11-26 1999-09-28 International Business Machines Corporation System and method for optimized source selection in an information retrieval system
US6026375A (en) 1997-12-05 2000-02-15 Nortel Networks Corporation Method and apparatus for processing orders from customers in a mobile environment
US6064960A (en) 1997-12-18 2000-05-16 Apple Computer, Inc. Method and apparatus for improved duration modeling of phonemes
US6094649A (en) 1997-12-22 2000-07-25 Partnet, Inc. Keyword searches of structured databases
US6173287B1 (en) 1998-03-11 2001-01-09 Digital Equipment Corporation Technique for ranking multimedia annotations of interest
US6195641B1 (en) 1998-03-27 2001-02-27 International Business Machines Corp. Network universal spoken language vocabulary
US6026393A (en) 1998-03-31 2000-02-15 Casebank Technologies Inc. Configuration knowledge as an aid to case retrieval
US6233559B1 (en) 1998-04-01 2001-05-15 Motorola, Inc. Speech control of multiple applications using applets
US6173279B1 (en) 1998-04-09 2001-01-09 At&T Corp. Method of using a natural language interface to retrieve information from one or more data resources
US6088731A (en) 1998-04-24 2000-07-11 Associative Computing, Inc. Intelligent assistant for use with a local computer and with the internet
US6029132A (en) 1998-04-30 2000-02-22 Matsushita Electric Industrial Co. Method for letter-to-sound in text-to-speech synthesis
US6016471A (en) 1998-04-29 2000-01-18 Matsushita Electric Industrial Co., Ltd. Method and apparatus using decision trees to generate and score multiple pronunciations for a spelled word
US6285786B1 (en) 1998-04-30 2001-09-04 Motorola, Inc. Text recognizer and method using non-cumulative character scoring in a forward search
US6144938A (en) 1998-05-01 2000-11-07 Sun Microsystems, Inc. Voice user interface with personality
US20070094222A1 (en) 1998-05-28 2007-04-26 Lawrence Au Method and system for using voice input for performing network functions
US7711672B2 (en) 1998-05-28 2010-05-04 Lawrence Au Semantic network methods to disambiguate natural language meaning
US6778970B2 (en) 1998-05-28 2004-08-17 Lawrence Au Topological methods to organize semantic network data flows for conversational applications
US6144958A (en) 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
US6105865A (en) 1998-07-17 2000-08-22 Hardesty; Laurence Daniel Financial transaction system with retirement saving benefit
US6434524B1 (en) 1998-09-09 2002-08-13 One Voice Technologies, Inc. Object interactive user interface using speech recognition and natural language processing
US6499013B1 (en) 1998-09-09 2002-12-24 One Voice Technologies, Inc. Interactive user interface using speech recognition and natural language processing
US6266637B1 (en) 1998-09-11 2001-07-24 International Business Machines Corporation Phrase splicing and variable substitution using a trainable speech synthesizer
DE29825146U1 (de) 1998-09-11 2005-08-18 Püllen, Rainer Teilnehmereinheit und System für einen Multimediadienst
US6792082B1 (en) 1998-09-11 2004-09-14 Comverse Ltd. Voice mail system with personal assistant provisioning
US6317831B1 (en) 1998-09-21 2001-11-13 Openwave Systems Inc. Method and apparatus for establishing a secure connection over a one-way data path
US6275824B1 (en) 1998-10-02 2001-08-14 Ncr Corporation System and method for managing data privacy in a database management system
US7137126B1 (en) 1998-10-02 2006-11-14 International Business Machines Corporation Conversational computing via conversational virtual machine
GB9821969D0 (en) 1998-10-08 1998-12-02 Canon Kk Apparatus and method for processing natural language
US6928614B1 (en) 1998-10-13 2005-08-09 Visteon Global Technologies, Inc. Mobile office with speech recognition
US6453292B2 (en) 1998-10-28 2002-09-17 International Business Machines Corporation Command boundary identifier for conversational natural language
US6208971B1 (en) 1998-10-30 2001-03-27 Apple Computer, Inc. Method and apparatus for command recognition using data-driven semantic inference
US6321092B1 (en) 1998-11-03 2001-11-20 Signal Soft Corporation Multiple input data management for wireless location-based applications
US6839669B1 (en) * 1998-11-05 2005-01-04 Scansoft, Inc. Performing actions identified in recognized speech
US6446076B1 (en) 1998-11-12 2002-09-03 Accenture Llp. Voice interactive web-based agent system responsive to a user location for prioritizing and formatting information
WO2000030069A2 (en) 1998-11-13 2000-05-25 Lernout & Hauspie Speech Products N.V. Speech synthesis using concatenation of speech waveforms
US6606599B2 (en) 1998-12-23 2003-08-12 Interactive Speech Technologies, Llc Method for integrating computing processes with an interface controlled by voice actuated grammars
US6246981B1 (en) 1998-11-25 2001-06-12 International Business Machines Corporation Natural language task-oriented dialog manager and method
US7082397B2 (en) 1998-12-01 2006-07-25 Nuance Communications, Inc. System for and method of creating and browsing a voice web
US6260024B1 (en) 1998-12-02 2001-07-10 Gary Shkedy Method and apparatus for facilitating buyer-driven purchase orders on a commercial network system
US7881936B2 (en) 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US6317707B1 (en) 1998-12-07 2001-11-13 At&T Corp. Automatic clustering of tokens from a corpus for grammar acquisition
US6308149B1 (en) 1998-12-16 2001-10-23 Xerox Corporation Grouping words with equivalent substrings by automatic clustering based on suffix relationships
US6523172B1 (en) 1998-12-17 2003-02-18 Evolutionary Technologies International, Inc. Parser translator system and method
US6460029B1 (en) 1998-12-23 2002-10-01 Microsoft Corporation System for improving search text
US7036128B1 (en) 1999-01-05 2006-04-25 Sri International Offices Using a community of distributed electronic agents to support a highly mobile, ambient computing environment
US6851115B1 (en) 1999-01-05 2005-02-01 Sri International Software-based architecture for communication and cooperation among distributed electronic agents
US6742021B1 (en) 1999-01-05 2004-05-25 Sri International, Inc. Navigating network-based electronic information using spoken input with multimodal error feedback
US6513063B1 (en) 1999-01-05 2003-01-28 Sri International Accessing network-based electronic information through scripted online interfaces using spoken input
US6757718B1 (en) 1999-01-05 2004-06-29 Sri International Mobile navigation of network-based electronic information using spoken input
US6523061B1 (en) 1999-01-05 2003-02-18 Sri International, Inc. System, method, and article of manufacture for agent-based navigation in a speech-based data navigation system
US7152070B1 (en) 1999-01-08 2006-12-19 The Regents Of The University Of California System and method for integrating and accessing multiple data sources within a data warehouse architecture
US6505183B1 (en) 1999-02-04 2003-01-07 Authoria, Inc. Human resource knowledge modeling and delivery system
US6317718B1 (en) 1999-02-26 2001-11-13 Accenture Properties (2) B.V. System, method and article of manufacture for location-based filtering for shopping agent in the physical world
GB9904662D0 (en) 1999-03-01 1999-04-21 Canon Kk Natural language search method and apparatus
US6356905B1 (en) 1999-03-05 2002-03-12 Accenture Llp System, method and article of manufacture for mobile communication utilizing an interface support framework
US6928404B1 (en) 1999-03-17 2005-08-09 International Business Machines Corporation System and methods for acoustic and language modeling for automatic speech recognition with large vocabularies
US6584464B1 (en) 1999-03-19 2003-06-24 Ask Jeeves, Inc. Grammar template query system
EP1088299A2 (en) 1999-03-26 2001-04-04 Scansoft, Inc. Client-server speech recognition
US6356854B1 (en) 1999-04-05 2002-03-12 Delphi Technologies, Inc. Holographic object position and type sensing system and method
US6631346B1 (en) 1999-04-07 2003-10-07 Matsushita Electric Industrial Co., Ltd. Method and apparatus for natural language parsing using multiple passes and tags
WO2000060435A2 (en) 1999-04-07 2000-10-12 Rensselaer Polytechnic Institute System and method for accessing personal information
US6647260B2 (en) 1999-04-09 2003-11-11 Openwave Systems Inc. Method and system facilitating web based provisioning of two-way mobile communications devices
US6711620B1 (en) * 1999-04-14 2004-03-23 Matsushita Electric Industrial Co. Event control device and digital broadcasting system
US6924828B1 (en) 1999-04-27 2005-08-02 Surfnotes Method and apparatus for improved information representation
US6697780B1 (en) 1999-04-30 2004-02-24 At&T Corp. Method and apparatus for rapid acoustic unit selection from a large speech corpus
EP1224569A4 (en) 1999-05-28 2005-08-10 Sehda Inc PHRASE BASED DIALOGUE MODELING WITH SPECIAL APPLICATION FOR GENERATING RECOGNITION GRAMMARK FOR LANGUAGE-CONTROLLED USER INTERFACE
US20020032564A1 (en) 2000-04-19 2002-03-14 Farzad Ehsani Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface
US6931384B1 (en) 1999-06-04 2005-08-16 Microsoft Corporation System and method providing utility-based decision making about clarification dialog given communicative uncertainty
US6598039B1 (en) 1999-06-08 2003-07-22 Albert-Inc. S.A. Natural language interface for searching database
US8065155B1 (en) 1999-06-10 2011-11-22 Gazdzinski Robert F Adaptive advertising apparatus and methods
US7093693B1 (en) 1999-06-10 2006-08-22 Gazdzinski Robert F Elevator access control system and method
US7711565B1 (en) 1999-06-10 2010-05-04 Gazdzinski Robert F “Smart” elevator system and method
US6615175B1 (en) 1999-06-10 2003-09-02 Robert F. Gazdzinski “Smart” elevator system and method
US6711585B1 (en) 1999-06-15 2004-03-23 Kanisa Inc. System and method for implementing a knowledge management system
JP3662780B2 (ja) * 1999-07-16 2005-06-22 日本電気株式会社 自然言語を用いた対話システム
JP3361291B2 (ja) 1999-07-23 2003-01-07 コナミ株式会社 音声合成方法、音声合成装置及び音声合成プログラムを記録したコンピュータ読み取り可能な媒体
US6421672B1 (en) 1999-07-27 2002-07-16 Verizon Services Corp. Apparatus for and method of disambiguation of directory listing searches utilizing multiple selectable secondary search keys
EP1079387A3 (en) 1999-08-26 2003-07-09 Matsushita Electric Industrial Co., Ltd. Mechanism for storing information about recorded television broadcasts
US6912499B1 (en) 1999-08-31 2005-06-28 Nortel Networks Limited Method and apparatus for training a multilingual speech model set
US6601234B1 (en) 1999-08-31 2003-07-29 Accenture Llp Attribute dictionary in a business logic services environment
US6697824B1 (en) 1999-08-31 2004-02-24 Accenture Llp Relationship management in an E-commerce application framework
US7127403B1 (en) 1999-09-13 2006-10-24 Microstrategy, Inc. System and method for personalizing an interactive voice broadcast of a voice service based on particulars of a request
US6601026B2 (en) 1999-09-17 2003-07-29 Discern Communications, Inc. Information retrieval by natural language querying
US6625583B1 (en) 1999-10-06 2003-09-23 Goldman, Sachs & Co. Handheld trading system interface
US6505175B1 (en) 1999-10-06 2003-01-07 Goldman, Sachs & Co. Order centric tracking system
US7020685B1 (en) 1999-10-08 2006-03-28 Openwave Systems Inc. Method and apparatus for providing internet content to SMS-based wireless devices
CA2387079C (en) 1999-10-19 2011-10-18 Sony Electronics Inc. Natural language interface control system
US6807574B1 (en) 1999-10-22 2004-10-19 Tellme Networks, Inc. Method and apparatus for content personalization over a telephone interface
JP2001125896A (ja) 1999-10-26 2001-05-11 Victor Co Of Japan Ltd 自然言語対話システム
US7310600B1 (en) 1999-10-28 2007-12-18 Canon Kabushiki Kaisha Language recognition using a similarity measure
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US6615172B1 (en) 1999-11-12 2003-09-02 Phoenix Solutions, Inc. Intelligent query engine for processing voice based queries
US7050977B1 (en) 1999-11-12 2006-05-23 Phoenix Solutions, Inc. Speech-enabled server for internet website and method
US6665640B1 (en) 1999-11-12 2003-12-16 Phoenix Solutions, Inc. Interactive speech based learning/training system formulating search queries based on natural language parsing of recognized user queries
US7392185B2 (en) 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US6633846B1 (en) 1999-11-12 2003-10-14 Phoenix Solutions, Inc. Distributed realtime speech recognition system
US9076448B2 (en) 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US6532446B1 (en) 1999-11-24 2003-03-11 Openwave Systems Inc. Server based speech recognition user interface for wireless devices
US6526382B1 (en) 1999-12-07 2003-02-25 Comverse, Inc. Language-oriented user interfaces for voice activated services
US6526395B1 (en) 1999-12-31 2003-02-25 Intel Corporation Application of personality models and interaction with synthetic characters in a computing system
US6556983B1 (en) 2000-01-12 2003-04-29 Microsoft Corporation Methods and apparatus for finding semantic information, such as usage logs, similar to a query using a pattern lattice data space
US6546388B1 (en) 2000-01-14 2003-04-08 International Business Machines Corporation Metadata search results ranking system
US6701294B1 (en) 2000-01-19 2004-03-02 Lucent Technologies, Inc. User interface for translating natural language inquiries into database queries and data presentations
US6829603B1 (en) 2000-02-02 2004-12-07 International Business Machines Corp. System, method and program product for interactive natural dialog
US6895558B1 (en) 2000-02-11 2005-05-17 Microsoft Corporation Multi-access mode electronic personal assistant
US6640098B1 (en) 2000-02-14 2003-10-28 Action Engine Corporation System for obtaining service-related information for local interactive wireless devices
AU2001243277A1 (en) 2000-02-25 2001-09-03 Synquiry Technologies, Ltd. Conceptual factoring and unification of graphs representing semantic models
US6449620B1 (en) 2000-03-02 2002-09-10 Nimble Technology, Inc. Method and apparatus for generating information pages using semi-structured data stored in a structured manner
US6895380B2 (en) 2000-03-02 2005-05-17 Electro Standards Laboratories Voice actuation with contextual learning for intelligent machine control
US6466654B1 (en) 2000-03-06 2002-10-15 Avaya Technology Corp. Personal virtual assistant with semantic tagging
WO2001067225A2 (en) 2000-03-06 2001-09-13 Kanisa Inc. A system and method for providing an intelligent multi-step dialog with a user
US6757362B1 (en) 2000-03-06 2004-06-29 Avaya Technology Corp. Personal virtual assistant
US6477488B1 (en) 2000-03-10 2002-11-05 Apple Computer, Inc. Method for dynamic context scope selection in hybrid n-gram+LSA language modeling
US6615220B1 (en) 2000-03-14 2003-09-02 Oracle International Corporation Method and mechanism for data consolidation
US6510417B1 (en) 2000-03-21 2003-01-21 America Online, Inc. System and method for voice access to internet-based information
GB2366009B (en) 2000-03-22 2004-07-21 Canon Kk Natural language machine interface
JP3728172B2 (ja) 2000-03-31 2005-12-21 キヤノン株式会社 音声合成方法および装置
US7177798B2 (en) 2000-04-07 2007-02-13 Rensselaer Polytechnic Institute Natural language interface using constrained intermediate dictionary of results
US6810379B1 (en) 2000-04-24 2004-10-26 Sensory, Inc. Client/server architecture for text-to-speech synthesis
WO2001084535A2 (en) * 2000-05-02 2001-11-08 Dragon Systems, Inc. Error correction in speech recognition
US6691111B2 (en) 2000-06-30 2004-02-10 Research In Motion Limited System and method for implementing a natural language user interface
US6684187B1 (en) 2000-06-30 2004-01-27 At&T Corp. Method and system for preselection of suitable units for concatenative speech
US6505158B1 (en) 2000-07-05 2003-01-07 At&T Corp. Synthesis-based pre-selection of suitable units for concatenative speech
JP3949356B2 (ja) 2000-07-12 2007-07-25 三菱電機株式会社 音声対話システム
US7139709B2 (en) 2000-07-20 2006-11-21 Microsoft Corporation Middleware layer between speech related applications and engines
JP2002041276A (ja) 2000-07-24 2002-02-08 Sony Corp 対話型操作支援システム及び対話型操作支援方法、並びに記憶媒体
US20060143007A1 (en) 2000-07-24 2006-06-29 Koh V E User interaction with voice information services
US7092928B1 (en) 2000-07-31 2006-08-15 Quantum Leap Research, Inc. Intelligent portal engine
US6778951B1 (en) 2000-08-09 2004-08-17 Concerto Software, Inc. Information retrieval method with natural language interface
US6766320B1 (en) 2000-08-24 2004-07-20 Microsoft Corporation Search engine with natural language-based robust parsing for user query and relevance feedback learning
DE10042944C2 (de) 2000-08-31 2003-03-13 Siemens Ag Graphem-Phonem-Konvertierung
AU2001290882A1 (en) 2000-09-15 2002-03-26 Lernout And Hauspie Speech Products N.V. Fast waveform synchronization for concatenation and time-scale modification of speech
US7216080B2 (en) 2000-09-29 2007-05-08 Mindfabric Holdings Llc Natural-language voice-activated personal assistant
US6832194B1 (en) 2000-10-26 2004-12-14 Sensory, Incorporated Audio recognition peripheral system
US7027974B1 (en) 2000-10-27 2006-04-11 Science Applications International Corporation Ontology-based parser for natural language processing
US7006969B2 (en) 2000-11-02 2006-02-28 At&T Corp. System and method of pattern recognition in very high-dimensional space
JP2004516516A (ja) 2000-12-18 2004-06-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 単語を認識するために発言を保存しボキャブラリーを選択する方法
US6937986B2 (en) 2000-12-28 2005-08-30 Comverse, Inc. Automatic dynamic speech recognition vocabulary based on external sources of information
AU2001255568A1 (en) 2000-12-29 2002-07-16 General Electric Company Method and system for identifying repeatedly malfunctioning equipment
US7249018B2 (en) * 2001-01-12 2007-07-24 International Business Machines Corporation System and method for relating syntax and semantics for a conversational speech application
US7257537B2 (en) 2001-01-12 2007-08-14 International Business Machines Corporation Method and apparatus for performing dialog management in a computer conversational interface
US6964023B2 (en) 2001-02-05 2005-11-08 International Business Machines Corporation System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input
US7290039B1 (en) 2001-02-27 2007-10-30 Microsoft Corporation Intent based processing
US20020123894A1 (en) 2001-03-01 2002-09-05 International Business Machines Corporation Processing speech recognition errors in an embedded speech recognition system
US6721728B2 (en) 2001-03-02 2004-04-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration System, method and apparatus for discovering phrases in a database
AU2002237495A1 (en) 2001-03-13 2002-09-24 Intelligate Ltd. Dynamic natural language understanding
US6996531B2 (en) 2001-03-30 2006-02-07 Comverse Ltd. Automated database assistance using a telephone for a speech based or text based multimedia communication mode
US6654740B2 (en) 2001-05-08 2003-11-25 Sunflare Co., Ltd. Probabilistic information retrieval based on differential latent semantic space
US7085722B2 (en) 2001-05-14 2006-08-01 Sony Computer Entertainment America Inc. System and method for menu-driven voice control of characters in a game environment
US6944594B2 (en) 2001-05-30 2005-09-13 Bellsouth Intellectual Property Corporation Multi-context conversational environment system and method
US20020194003A1 (en) 2001-06-05 2002-12-19 Mozer Todd F. Client-server security system and method
US20020198714A1 (en) 2001-06-26 2002-12-26 Guojun Zhou Statistical spoken dialog system
US7139722B2 (en) 2001-06-27 2006-11-21 Bellsouth Intellectual Property Corporation Location and time sensitive wireless calendaring
US6604059B2 (en) 2001-07-10 2003-08-05 Koninklijke Philips Electronics N.V. Predictive calendar
US7987151B2 (en) 2001-08-10 2011-07-26 General Dynamics Advanced Info Systems, Inc. Apparatus and method for problem solving using intelligent agents
US6813491B1 (en) 2001-08-31 2004-11-02 Openwave Systems Inc. Method and apparatus for adapting settings of wireless communication devices in accordance with user proximity
US7403938B2 (en) 2001-09-24 2008-07-22 Iac Search & Media, Inc. Natural language query processing
US6985865B1 (en) 2001-09-26 2006-01-10 Sprint Spectrum L.P. Method and system for enhanced response to voice commands in a voice command platform
US20050196732A1 (en) 2001-09-26 2005-09-08 Scientific Learning Corporation Method and apparatus for automated training of language learning skills
US6650735B2 (en) 2001-09-27 2003-11-18 Microsoft Corporation Integrated voice access to a variety of personal information services
US7324947B2 (en) 2001-10-03 2008-01-29 Promptu Systems Corporation Global speech user interface
US7167832B2 (en) 2001-10-15 2007-01-23 At&T Corp. Method for dialog management
US7345671B2 (en) 2001-10-22 2008-03-18 Apple Inc. Method and apparatus for use of rotational user inputs
GB2381409B (en) 2001-10-27 2004-04-28 Hewlett Packard Ltd Asynchronous access to synchronous voice services
NO316480B1 (no) 2001-11-15 2004-01-26 Forinnova As Fremgangsmåte og system for tekstuell granskning og oppdagelse
US20030101054A1 (en) 2001-11-27 2003-05-29 Ncc, Llc Integrated system and method for electronic speech recognition and transcription
TW541517B (en) 2001-12-25 2003-07-11 Univ Nat Cheng Kung Speech recognition system
US7197460B1 (en) 2002-04-23 2007-03-27 At&T Corp. System for handling frequently asked questions in a natural language dialog service
US6847966B1 (en) 2002-04-24 2005-01-25 Engenium Corporation Method and system for optimally searching a document database using a representative semantic space
US7546382B2 (en) 2002-05-28 2009-06-09 International Business Machines Corporation Methods and systems for authoring of mixed-initiative multi-modal interactions and related browsing mechanisms
US7398209B2 (en) 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7299033B2 (en) 2002-06-28 2007-11-20 Openwave Systems Inc. Domain-based management of distribution of digital content from multiple suppliers to multiple wireless services subscribers
US7233790B2 (en) 2002-06-28 2007-06-19 Openwave Systems, Inc. Device capability based discovery, packaging and provisioning of content for wireless mobile devices
US7693720B2 (en) 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
EP1604350A4 (en) * 2002-09-06 2007-11-21 Voice Signal Technologies Inc METHODS, SYSTEMS AND PROGRAMMING FOR REALIZING VOICE RECOGNITION
US7467087B1 (en) 2002-10-10 2008-12-16 Gillick Laurence S Training and using pronunciation guessers in speech recognition
US7783486B2 (en) 2002-11-22 2010-08-24 Roy Jonathan Rosser Response generator for mimicking human-computer natural language conversation
WO2004053836A1 (en) 2002-12-10 2004-06-24 Kirusa, Inc. Techniques for disambiguating speech input using multimodal interfaces
US7386449B2 (en) 2002-12-11 2008-06-10 Voice Enabling Systems Technology Inc. Knowledge-based flexible natural speech dialogue system
US7956766B2 (en) 2003-01-06 2011-06-07 Panasonic Corporation Apparatus operating system
DE602004011753T2 (de) * 2003-03-01 2009-02-05 Coifman, Robert E. Verfahren und Vorrichtung zum Verbessern der Transkriptionsgenauigkeit bei der Spracherkennung
US7809565B2 (en) 2003-03-01 2010-10-05 Coifman Robert E Method and apparatus for improving the transcription accuracy of speech recognition software
US7805299B2 (en) * 2004-03-01 2010-09-28 Coifman Robert E Method and apparatus for improving the transcription accuracy of speech recognition software
US7529671B2 (en) 2003-03-04 2009-05-05 Microsoft Corporation Block synchronous decoding
US6980949B2 (en) 2003-03-14 2005-12-27 Sonum Technologies, Inc. Natural language processor
US7496498B2 (en) 2003-03-24 2009-02-24 Microsoft Corporation Front-end architecture for a multi-lingual text-to-speech system
US7627343B2 (en) 2003-04-25 2009-12-01 Apple Inc. Media player system
US7421393B1 (en) 2004-03-01 2008-09-02 At&T Corp. System for developing a dialog manager using modular spoken-dialog components
US7200559B2 (en) 2003-05-29 2007-04-03 Microsoft Corporation Semantic object synchronous understanding implemented with speech application language tags
US7720683B1 (en) 2003-06-13 2010-05-18 Sensory, Inc. Method and apparatus of specifying and performing speech recognition operations
US7475010B2 (en) 2003-09-03 2009-01-06 Lingospot, Inc. Adaptive and scalable method for resolving natural language ambiguities
US7418392B1 (en) 2003-09-25 2008-08-26 Sensory, Inc. System and method for controlling the operation of a device by voice commands
US7155706B2 (en) 2003-10-24 2006-12-26 Microsoft Corporation Administrative tool environment
US7584092B2 (en) 2004-11-15 2009-09-01 Microsoft Corporation Unsupervised learning of paraphrase/translation alternations and selective application thereof
US7412385B2 (en) 2003-11-12 2008-08-12 Microsoft Corporation System for identifying paraphrases using machine translation
US7447630B2 (en) 2003-11-26 2008-11-04 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement
DE602004016681D1 (de) 2003-12-05 2008-10-30 Kenwood Corp Audioeinrichtungs-steuereinrichtung, audioeinrichtungs-steuerverfahren und programm
ES2312851T3 (es) 2003-12-16 2009-03-01 Loquendo Spa Procedimiento y sistema texto a voz y el programa informatico asociado.
US7427024B1 (en) 2003-12-17 2008-09-23 Gazdzinski Mark J Chattel management apparatus and methods
US7552055B2 (en) 2004-01-10 2009-06-23 Microsoft Corporation Dialog component re-use in recognition systems
WO2005071663A2 (en) 2004-01-16 2005-08-04 Scansoft, Inc. Corpus-based speech synthesis based on segment recombination
US20050165607A1 (en) 2004-01-22 2005-07-28 At&T Corp. System and method to disambiguate and clarify user intention in a spoken dialog system
EP1560200B8 (en) 2004-01-29 2009-08-05 Harman Becker Automotive Systems GmbH Method and system for spoken dialogue interface
US7505906B2 (en) * 2004-02-26 2009-03-17 At&T Intellectual Property, Ii System and method for augmenting spoken language understanding by correcting common errors in linguistic performance
KR100462292B1 (ko) 2004-02-26 2004-12-17 엔에이치엔(주) 중요도 정보를 반영한 검색 결과 리스트 제공 방법 및 그시스템
US7693715B2 (en) 2004-03-10 2010-04-06 Microsoft Corporation Generating large units of graphonemes with mutual information criterion for letter to sound conversion
US7409337B1 (en) 2004-03-30 2008-08-05 Microsoft Corporation Natural language processing interface
US7496512B2 (en) 2004-04-13 2009-02-24 Microsoft Corporation Refining of segmental boundaries in speech waveforms using contextual-dependent models
US8095364B2 (en) 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7720674B2 (en) 2004-06-29 2010-05-18 Sap Ag Systems and methods for processing natural language queries
US20060004570A1 (en) * 2004-06-30 2006-01-05 Microsoft Corporation Transcribing speech data with dialog context and/or recognition alternative information
TWI252049B (en) 2004-07-23 2006-03-21 Inventec Corp Sound control system and method
US7725318B2 (en) 2004-07-30 2010-05-25 Nice Systems Inc. System and method for improving the accuracy of audio searching
US7853574B2 (en) 2004-08-26 2010-12-14 International Business Machines Corporation Method of generating a context-inferenced search query and of sorting a result of the query
US7716056B2 (en) 2004-09-27 2010-05-11 Robert Bosch Corporation Method and system for interactive conversational dialogue for cognitively overloaded device users
US8107401B2 (en) 2004-09-30 2012-01-31 Avaya Inc. Method and apparatus for providing a virtual assistant to a communication participant
US7552046B2 (en) 2004-11-15 2009-06-23 Microsoft Corporation Unsupervised learning of paraphrase/translation alternations and selective application thereof
US7546235B2 (en) 2004-11-15 2009-06-09 Microsoft Corporation Unsupervised learning of paraphrase/translation alternations and selective application thereof
US7702500B2 (en) 2004-11-24 2010-04-20 Blaedow Karen R Method and apparatus for determining the meaning of natural language
CN1609859A (zh) 2004-11-26 2005-04-27 孙斌 搜索结果聚类的方法
US7376645B2 (en) 2004-11-29 2008-05-20 The Intellection Group, Inc. Multimodal natural language query system and architecture for processing voice and proximity-based queries
US20060122834A1 (en) 2004-12-03 2006-06-08 Bennett Ian M Emotion detection device & method for use in distributed systems
US8214214B2 (en) 2004-12-03 2012-07-03 Phoenix Solutions, Inc. Emotion detection device and method for use in distributed systems
US7636657B2 (en) 2004-12-09 2009-12-22 Microsoft Corporation Method and apparatus for automatic grammar generation from data entries
US7873654B2 (en) 2005-01-24 2011-01-18 The Intellection Group, Inc. Multimodal natural language query system for processing and analyzing voice and proximity-based queries
US7508373B2 (en) 2005-01-28 2009-03-24 Microsoft Corporation Form factor and input method for language input
GB0502259D0 (en) 2005-02-03 2005-03-09 British Telecomm Document searching tool and method
US7949533B2 (en) * 2005-02-04 2011-05-24 Vococollect, Inc. Methods and systems for assessing and improving the performance of a speech recognition system
EP1693829B1 (en) * 2005-02-21 2018-12-05 Harman Becker Automotive Systems GmbH Voice-controlled data system
US7676026B1 (en) 2005-03-08 2010-03-09 Baxtech Asia Pte Ltd Desktop telephony system
US7925525B2 (en) 2005-03-25 2011-04-12 Microsoft Corporation Smart reminders
WO2006129967A1 (en) 2005-05-30 2006-12-07 Daumsoft, Inc. Conversation system and method using conversational agent
US8041570B2 (en) 2005-05-31 2011-10-18 Robert Bosch Corporation Dialogue management using scripts
US8024195B2 (en) 2005-06-27 2011-09-20 Sensory, Inc. Systems and methods of performing speech recognition using historical information
US8396715B2 (en) * 2005-06-28 2013-03-12 Microsoft Corporation Confidence threshold tuning
US7826945B2 (en) 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US8271549B2 (en) 2005-08-05 2012-09-18 Intel Corporation System and method for automatically managing media content
US7620549B2 (en) * 2005-08-10 2009-11-17 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US7949529B2 (en) 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
US8265939B2 (en) 2005-08-31 2012-09-11 Nuance Communications, Inc. Hierarchical methods and apparatus for extracting user intent from spoken utterances
WO2007027989A2 (en) 2005-08-31 2007-03-08 Voicebox Technologies, Inc. Dynamic speech sharpening
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
JP4908094B2 (ja) 2005-09-30 2012-04-04 株式会社リコー 情報処理システム、情報処理方法及び情報処理プログラム
US7930168B2 (en) 2005-10-04 2011-04-19 Robert Bosch Gmbh Natural language processing of disfluent sentences
US8620667B2 (en) 2005-10-17 2013-12-31 Microsoft Corporation Flexible speech-activated command and control
US7707032B2 (en) 2005-10-20 2010-04-27 National Cheng Kung University Method and system for matching speech data
US20070106674A1 (en) 2005-11-10 2007-05-10 Purusharth Agrawal Field sales process facilitation systems and methods
US7822749B2 (en) 2005-11-28 2010-10-26 Commvault Systems, Inc. Systems and methods for classifying and transferring information in a storage network
KR100810500B1 (ko) 2005-12-08 2008-03-07 한국전자통신연구원 대화형 음성 인터페이스 시스템에서의 사용자 편의성증대 방법
DE102005061365A1 (de) 2005-12-21 2007-06-28 Siemens Ag Verfahren zur Ansteuerung zumindest einer ersten und zweiten Hintergrundapplikation über ein universelles Sprachdialogsystem
US7996228B2 (en) 2005-12-22 2011-08-09 Microsoft Corporation Voice initiated network operations
US7599918B2 (en) 2005-12-29 2009-10-06 Microsoft Corporation Dynamic search with implicit user intention mining
JP2007183864A (ja) 2006-01-10 2007-07-19 Fujitsu Ltd ファイル検索方法及びそのシステム
US20070174188A1 (en) 2006-01-25 2007-07-26 Fish Robert D Electronic marketplace that facilitates transactions between consolidated buyers and/or sellers
IL174107A0 (en) 2006-02-01 2006-08-01 Grois Dan Method and system for advertising by means of a search engine over a data network
KR100764174B1 (ko) 2006-03-03 2007-10-08 삼성전자주식회사 음성 대화 서비스 장치 및 방법
US7752152B2 (en) 2006-03-17 2010-07-06 Microsoft Corporation Using predictive user models for language modeling on a personal device with user behavior models based on statistical modeling
JP4734155B2 (ja) 2006-03-24 2011-07-27 株式会社東芝 音声認識装置、音声認識方法および音声認識プログラム
US7707027B2 (en) 2006-04-13 2010-04-27 Nuance Communications, Inc. Identification and rejection of meaningless input during natural language classification
US20070276651A1 (en) * 2006-05-23 2007-11-29 Motorola, Inc. Grammar adaptation through cooperative client and server based speech recognition
US8423347B2 (en) 2006-06-06 2013-04-16 Microsoft Corporation Natural language personal information management
US7523108B2 (en) 2006-06-07 2009-04-21 Platformation, Inc. Methods and apparatus for searching with awareness of geography and languages
US7483894B2 (en) 2006-06-07 2009-01-27 Platformation Technologies, Inc Methods and apparatus for entity search
US20100257160A1 (en) 2006-06-07 2010-10-07 Yu Cao Methods & apparatus for searching with awareness of different types of information
KR100776800B1 (ko) 2006-06-16 2007-11-19 한국전자통신연구원 지능형 가제트를 이용한 맞춤형 서비스 제공 방법 및시스템
US7548895B2 (en) 2006-06-30 2009-06-16 Microsoft Corporation Communication-prompted user assistance
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US8055502B2 (en) * 2006-11-28 2011-11-08 General Motors Llc Voice dialing using a rejection reference
US8600760B2 (en) * 2006-11-28 2013-12-03 General Motors Llc Correcting substitution errors during automatic speech recognition by accepting a second best when first best is confusable
US20080129520A1 (en) 2006-12-01 2008-06-05 Apple Computer, Inc. Electronic device with enhanced audio feedback
WO2008085742A2 (en) 2007-01-07 2008-07-17 Apple Inc. Portable multifunction device, method and graphical user interface for interacting with user input elements in displayed content
KR100883657B1 (ko) 2007-01-26 2009-02-18 삼성전자주식회사 음성 인식 기반의 음악 검색 방법 및 장치
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US7822608B2 (en) 2007-02-27 2010-10-26 Nuance Communications, Inc. Disambiguating a speech recognition grammar in a multimodal application
US20080221901A1 (en) 2007-03-07 2008-09-11 Joseph Cerra Mobile general search environment speech processing facility
US7801729B2 (en) 2007-03-13 2010-09-21 Sensory, Inc. Using multiple attributes to create a voice search playlist
US8219406B2 (en) 2007-03-15 2012-07-10 Microsoft Corporation Speech-centric multimodal user interface design in mobile technology
US7809610B2 (en) 2007-04-09 2010-10-05 Platformation, Inc. Methods and apparatus for freshness and completeness of information
US7983915B2 (en) 2007-04-30 2011-07-19 Sonic Foundry, Inc. Audio content search engine
US8055708B2 (en) 2007-06-01 2011-11-08 Microsoft Corporation Multimedia spaces
US8204238B2 (en) 2007-06-08 2012-06-19 Sensory, Inc Systems and methods of sonic communication
US8190627B2 (en) 2007-06-28 2012-05-29 Microsoft Corporation Machine assisted query formulation
US8019606B2 (en) 2007-06-29 2011-09-13 Microsoft Corporation Identification and selection of a software application via speech
JP2009036999A (ja) 2007-08-01 2009-02-19 Infocom Corp コンピュータによる対話方法、対話システム、コンピュータプログラムおよびコンピュータに読み取り可能な記憶媒体
KR101359715B1 (ko) 2007-08-24 2014-02-10 삼성전자주식회사 모바일 음성 웹 제공 방법 및 장치
WO2009029910A2 (en) 2007-08-31 2009-03-05 Proxpro, Inc. Situation-aware personal information management for a mobile device
US20090058823A1 (en) 2007-09-04 2009-03-05 Apple Inc. Virtual Keyboards in Multi-Language Environment
US8838760B2 (en) 2007-09-14 2014-09-16 Ricoh Co., Ltd. Workflow-enabled provider
KR100920267B1 (ko) 2007-09-17 2009-10-05 한국전자통신연구원 음성 대화 분석 시스템 및 그 방법
US8706476B2 (en) 2007-09-18 2014-04-22 Ariadne Genomics, Inc. Natural language processing method by analyzing primitive sentences, logical clauses, clause types and verbal blocks
KR100919225B1 (ko) * 2007-09-19 2009-09-28 한국전자통신연구원 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화오류 후처리 장치 및 방법
US8165886B1 (en) 2007-10-04 2012-04-24 Great Northern Research LLC Speech interface system and method for control and interaction with applications on a computing system
US8036901B2 (en) 2007-10-05 2011-10-11 Sensory, Incorporated Systems and methods of performing speech recognition using sensory inputs of human position
US20090112677A1 (en) 2007-10-24 2009-04-30 Rhett Randolph L Method for automatically developing suggested optimal work schedules from unsorted group and individual task lists
US7840447B2 (en) 2007-10-30 2010-11-23 Leonard Kleinrock Pricing and auctioning of bundled items among multiple sellers and buyers
US7983997B2 (en) 2007-11-02 2011-07-19 Florida Institute For Human And Machine Cognition, Inc. Interactive complex task teaching system that allows for natural language input, recognizes a user's intent, and automatically performs tasks in document object model (DOM) nodes
US8112280B2 (en) 2007-11-19 2012-02-07 Sensory, Inc. Systems and methods of performing speech recognition with barge-in for use in a bluetooth system
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US8219407B1 (en) 2007-12-27 2012-07-10 Great Northern Research, LLC Method for processing the output of a speech recognizer
US8099289B2 (en) 2008-02-13 2012-01-17 Sensory, Inc. Voice interface and search for electronic devices including bluetooth headsets and remote systems
US8958848B2 (en) 2008-04-08 2015-02-17 Lg Electronics Inc. Mobile terminal and menu control method thereof
US8666824B2 (en) 2008-04-23 2014-03-04 Dell Products L.P. Digital media content location and purchasing system
US8285344B2 (en) 2008-05-21 2012-10-09 DP Technlogies, Inc. Method and apparatus for adjusting audio for a user environment
US8589161B2 (en) 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8694355B2 (en) 2008-05-30 2014-04-08 Sri International Method and apparatus for automated assistance with task management
US8423288B2 (en) 2009-11-30 2013-04-16 Apple Inc. Dynamic alerts for calendar events
US8166019B1 (en) 2008-07-21 2012-04-24 Sprint Communications Company L.P. Providing suggested actions in response to textual communications
US9200913B2 (en) 2008-10-07 2015-12-01 Telecommunication Systems, Inc. User interface for predictive traffic
US8140328B2 (en) 2008-12-01 2012-03-20 At&T Intellectual Property I, L.P. User intention based on N-best list of recognition hypotheses for utterances in a dialog
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US8417526B2 (en) 2009-03-13 2013-04-09 Adacel, Inc. Speech recognition learning system and method
US9123341B2 (en) * 2009-03-18 2015-09-01 Robert Bosch Gmbh System and method for multi-modal input synchronization and disambiguation
US8805823B2 (en) 2009-04-14 2014-08-12 Sri International Content processing systems and methods
WO2010126321A2 (ko) 2009-04-30 2010-11-04 삼성전자주식회사 멀티 모달 정보를 이용하는 사용자 의도 추론 장치 및 방법
KR101581883B1 (ko) 2009-04-30 2016-01-11 삼성전자주식회사 모션 정보를 이용하는 음성 검출 장치 및 방법
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10540976B2 (en) 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
KR101562792B1 (ko) 2009-06-10 2015-10-23 삼성전자주식회사 목표 예측 인터페이스 제공 장치 및 그 방법
US8527278B2 (en) 2009-06-29 2013-09-03 Abraham Ben David Intelligent home automation
US20110047072A1 (en) 2009-08-07 2011-02-24 Visa U.S.A. Inc. Systems and Methods for Propensity Analysis and Validation
US8768313B2 (en) 2009-08-17 2014-07-01 Digimarc Corporation Methods and systems for image or audio recognition processing
JP2011045005A (ja) * 2009-08-24 2011-03-03 Fujitsu Toshiba Mobile Communications Ltd 携帯電話機
US9213558B2 (en) 2009-09-02 2015-12-15 Sri International Method and apparatus for tailoring the output of an intelligent automated assistant to a user
US8321527B2 (en) 2009-09-10 2012-11-27 Tribal Brands System and method for tracking user location and associated activity and responsively providing mobile device updates
KR20110036385A (ko) 2009-10-01 2011-04-07 삼성전자주식회사 사용자 의도 분석 장치 및 방법
US20110099507A1 (en) 2009-10-28 2011-04-28 Google Inc. Displaying a collection of interactive elements that trigger actions directed to an item
US9197736B2 (en) 2009-12-31 2015-11-24 Digimarc Corporation Intuitive computing methods and systems
US20120137367A1 (en) 2009-11-06 2012-05-31 Cataphora, Inc. Continuous anomaly detection based on behavior modeling and heterogeneous information analysis
US9171541B2 (en) 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
US9502025B2 (en) 2009-11-10 2016-11-22 Voicebox Technologies Corporation System and method for providing a natural language content dedication service
US8712759B2 (en) 2009-11-13 2014-04-29 Clausal Computing Oy Specializing disambiguation of a natural language expression
KR101960835B1 (ko) 2009-11-24 2019-03-21 삼성전자주식회사 대화 로봇을 이용한 일정 관리 시스템 및 그 방법
US8396888B2 (en) 2009-12-04 2013-03-12 Google Inc. Location-based searching using a search area that corresponds to a geographical location of a computing device
KR101622111B1 (ko) 2009-12-11 2016-05-18 삼성전자 주식회사 대화 시스템 및 그의 대화 방법
US20110161309A1 (en) 2009-12-29 2011-06-30 Lx1 Technology Limited Method Of Sorting The Result Set Of A Search Engine
US8494852B2 (en) 2010-01-05 2013-07-23 Google Inc. Word-level correction of speech input
US8334842B2 (en) 2010-01-15 2012-12-18 Microsoft Corporation Recognizing user intent in motion capture system
US8626511B2 (en) 2010-01-22 2014-01-07 Google Inc. Multi-dimensional disambiguation of voice commands
US20110218855A1 (en) 2010-03-03 2011-09-08 Platformation, Inc. Offering Promotions Based on Query Analysis
US8265928B2 (en) 2010-04-14 2012-09-11 Google Inc. Geotagged environmental audio for enhanced speech recognition accuracy
US20110279368A1 (en) 2010-05-12 2011-11-17 Microsoft Corporation Inferring user intent to engage a motion capture system
US8694313B2 (en) 2010-05-19 2014-04-08 Google Inc. Disambiguation of contact information using historical data
US8522283B2 (en) 2010-05-20 2013-08-27 Google Inc. Television remote control data transfer
US8468012B2 (en) 2010-05-26 2013-06-18 Google Inc. Acoustic model adaptation using geographic information
US20110306426A1 (en) 2010-06-10 2011-12-15 Microsoft Corporation Activity Participation Based On User Intent
US8234111B2 (en) 2010-06-14 2012-07-31 Google Inc. Speech and noise models for speech recognition
US8411874B2 (en) 2010-06-30 2013-04-02 Google Inc. Removing noise from audio
US8775156B2 (en) 2010-08-05 2014-07-08 Google Inc. Translating languages in response to device motion
US8359020B2 (en) 2010-08-06 2013-01-22 Google Inc. Automatically monitoring for voice input based on context
US8473289B2 (en) 2010-08-06 2013-06-25 Google Inc. Disambiguating input based on context
CN102074231A (zh) * 2010-12-30 2011-05-25 万音达有限公司 语音识别方法和语音识别系统
JP5670802B2 (ja) * 2011-03-31 2015-02-18 水ing株式会社 固形燃料製造方法、その装置、及び固形燃料
KR20140039194A (ko) 2011-04-25 2014-04-01 비비오, 인크. 지능형 개인용 타임라인 보조 시스템 및 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0863330A (ja) * 1994-08-17 1996-03-08 Fujitsu Ltd 音声入力装置
JP2004534268A (ja) * 2001-06-27 2004-11-11 テレローグ,インコーポレイティド 自動アテンダントによって使用される情報を前処理するシステムと方法
JP2005181386A (ja) * 2003-12-16 2005-07-07 Mitsubishi Electric Corp 音声対話処理装置及び音声対話処理方法並びにプログラム
JP2008097003A (ja) * 2006-10-12 2008-04-24 Qnx Software Systems (Wavemakers) Inc 自動音声認識システムに対する適応コンテキスト
JP2010535377A (ja) * 2007-08-01 2010-11-18 ジンジャー ソフトウェア、インコーポレイティッド インターネットコーパスを用いた、文脈依存言語の自動的な修正および改善
WO2011093025A1 (ja) * 2010-01-29 2011-08-04 日本電気株式会社 入力支援システム、方法、およびプログラム

Cited By (208)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US11928604B2 (en) 2005-09-08 2024-03-12 Apple Inc. Method and apparatus for building an intelligent automated assistant
US11979836B2 (en) 2007-04-03 2024-05-07 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11023513B2 (en) 2007-12-20 2021-06-01 Apple Inc. Method and apparatus for searching using an active ontology
US10381016B2 (en) 2008-01-03 2019-08-13 Apple Inc. Methods and apparatus for altering audio output signals
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US10108612B2 (en) 2008-07-31 2018-10-23 Apple Inc. Mobile device having human language translation capability with positional feedback
US11900936B2 (en) 2008-10-02 2024-02-13 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10643611B2 (en) 2008-10-02 2020-05-05 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10692504B2 (en) 2010-02-25 2020-06-23 Apple Inc. User profiling for voice input processing
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US10417405B2 (en) 2011-03-21 2019-09-17 Apple Inc. Device access using voice authentication
US11350253B2 (en) 2011-06-03 2022-05-31 Apple Inc. Active transport based notifications
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation
US11321116B2 (en) 2012-05-15 2022-05-03 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US10714117B2 (en) 2013-02-07 2020-07-14 Apple Inc. Voice trigger for a digital assistant
US11862186B2 (en) 2013-02-07 2024-01-02 Apple Inc. Voice trigger for a digital assistant
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US11636869B2 (en) 2013-02-07 2023-04-25 Apple Inc. Voice trigger for a digital assistant
US11557310B2 (en) 2013-02-07 2023-01-17 Apple Inc. Voice trigger for a digital assistant
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US10657961B2 (en) 2013-06-08 2020-05-19 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US11727219B2 (en) 2013-06-09 2023-08-15 Apple Inc. System and method for inferring user intent from speech inputs
US10769385B2 (en) 2013-06-09 2020-09-08 Apple Inc. System and method for inferring user intent from speech inputs
US11048473B2 (en) 2013-06-09 2021-06-29 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10791216B2 (en) 2013-08-06 2020-09-29 Apple Inc. Auto-activating smart responses based on activities from remote devices
JP2016534616A (ja) * 2013-08-06 2016-11-04 アップル インコーポレイテッド リモート機器からの作動に基づくスマート応答の自動作動
JP7005552B2 (ja) 2013-09-26 2022-01-21 グーグル エルエルシー 車両にナビゲーションデータを提供するためのシステムおよび方法
JP2019144265A (ja) * 2013-09-26 2019-08-29 グーグル エルエルシー 車両にナビゲーションデータを提供するためのシステムおよび方法
US11314370B2 (en) 2013-12-06 2022-04-26 Apple Inc. Method for extracting salient dialog usage from live data
US10497365B2 (en) 2014-05-30 2019-12-03 Apple Inc. Multi-command single utterance input method
US10417344B2 (en) 2014-05-30 2019-09-17 Apple Inc. Exemplar-based natural language processing
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US10878809B2 (en) 2014-05-30 2020-12-29 Apple Inc. Multi-command single utterance input method
US10083690B2 (en) 2014-05-30 2018-09-25 Apple Inc. Better resolution when referencing to concepts
US10657966B2 (en) 2014-05-30 2020-05-19 Apple Inc. Better resolution when referencing to concepts
US10714095B2 (en) 2014-05-30 2020-07-14 Apple Inc. Intelligent assistant for home automation
US11699448B2 (en) 2014-05-30 2023-07-11 Apple Inc. Intelligent assistant for home automation
US11810562B2 (en) 2014-05-30 2023-11-07 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11670289B2 (en) 2014-05-30 2023-06-06 Apple Inc. Multi-command single utterance input method
US10699717B2 (en) 2014-05-30 2020-06-30 Apple Inc. Intelligent assistant for home automation
US11838579B2 (en) 2014-06-30 2023-12-05 Apple Inc. Intelligent automated assistant for TV user interactions
US11516537B2 (en) 2014-06-30 2022-11-29 Apple Inc. Intelligent automated assistant for TV user interactions
US10904611B2 (en) 2014-06-30 2021-01-26 Apple Inc. Intelligent automated assistant for TV user interactions
US10431204B2 (en) 2014-09-11 2019-10-01 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10453443B2 (en) 2014-09-30 2019-10-22 Apple Inc. Providing an indication of the suitability of speech recognition
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10390213B2 (en) 2014-09-30 2019-08-20 Apple Inc. Social reminders
US10438595B2 (en) 2014-09-30 2019-10-08 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US11231904B2 (en) 2015-03-06 2022-01-25 Apple Inc. Reducing response latency of intelligent automated assistants
US10930282B2 (en) 2015-03-08 2021-02-23 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10529332B2 (en) 2015-03-08 2020-01-07 Apple Inc. Virtual assistant activation
US11842734B2 (en) 2015-03-08 2023-12-12 Apple Inc. Virtual assistant activation
US10311871B2 (en) 2015-03-08 2019-06-04 Apple Inc. Competing devices responding to voice triggers
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US11127397B2 (en) 2015-05-27 2021-09-21 Apple Inc. Device voice control
US10681212B2 (en) 2015-06-05 2020-06-09 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US11947873B2 (en) 2015-06-29 2024-04-02 Apple Inc. Virtual assistant for media playback
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11550542B2 (en) 2015-09-08 2023-01-10 Apple Inc. Zero latency digital assistant
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11954405B2 (en) 2015-09-08 2024-04-09 Apple Inc. Zero latency digital assistant
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US11809886B2 (en) 2015-11-06 2023-11-07 Apple Inc. Intelligent automated assistant in a messaging environment
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
US10354652B2 (en) 2015-12-02 2019-07-16 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10942703B2 (en) 2015-12-23 2021-03-09 Apple Inc. Proactive assistance based on dialog communication between devices
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11657820B2 (en) 2016-06-10 2023-05-23 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US10942702B2 (en) 2016-06-11 2021-03-09 Apple Inc. Intelligent device arbitration and control
US10580409B2 (en) 2016-06-11 2020-03-03 Apple Inc. Application integration with a digital assistant
US11809783B2 (en) 2016-06-11 2023-11-07 Apple Inc. Intelligent device arbitration and control
US11749275B2 (en) 2016-06-11 2023-09-05 Apple Inc. Application integration with a digital assistant
JP2018040904A (ja) * 2016-09-06 2018-03-15 トヨタ自動車株式会社 音声認識装置および音声認識方法
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10553215B2 (en) 2016-09-23 2020-02-04 Apple Inc. Intelligent automated assistant
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US11656884B2 (en) 2017-01-09 2023-05-23 Apple Inc. Application integration with a digital assistant
WO2018135302A1 (ja) * 2017-01-18 2018-07-26 ソニー株式会社 情報処理装置および情報処理方法、並びにプログラム
US11107469B2 (en) 2017-01-18 2021-08-31 Sony Corporation Information processing apparatus and information processing method
JP7107228B2 (ja) 2017-01-18 2022-07-27 ソニーグループ株式会社 情報処理装置および情報処理方法、並びにプログラム
JPWO2018135302A1 (ja) * 2017-01-18 2019-11-21 ソニー株式会社 情報処理装置および情報処理方法、並びにプログラム
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10332518B2 (en) 2017-05-09 2019-06-25 Apple Inc. User interface for correcting recognition errors
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11599331B2 (en) 2017-05-11 2023-03-07 Apple Inc. Maintaining privacy of personal information
US10847142B2 (en) 2017-05-11 2020-11-24 Apple Inc. Maintaining privacy of personal information
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
US11538469B2 (en) 2017-05-12 2022-12-27 Apple Inc. Low-latency intelligent automated assistant
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10789945B2 (en) 2017-05-12 2020-09-29 Apple Inc. Low-latency intelligent automated assistant
US11862151B2 (en) 2017-05-12 2024-01-02 Apple Inc. Low-latency intelligent automated assistant
US11837237B2 (en) 2017-05-12 2023-12-05 Apple Inc. User-specific acoustic models
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US11217255B2 (en) 2017-05-16 2022-01-04 Apple Inc. Far-field extension for digital assistant services
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10909171B2 (en) 2017-05-16 2021-02-02 Apple Inc. Intelligent automated assistant for media exploration
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US10748546B2 (en) 2017-05-16 2020-08-18 Apple Inc. Digital assistant services based on device capabilities
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US11675829B2 (en) 2017-05-16 2023-06-13 Apple Inc. Intelligent automated assistant for media exploration
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10867596B2 (en) 2017-08-09 2020-12-15 Lenovo (Singapore) Pte. Ltd. Voice assistant system, server apparatus, device, voice assistant method therefor, and program to be executed by computer
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US11710482B2 (en) 2018-03-26 2023-07-25 Apple Inc. Natural assistant interaction
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
JP2021073567A (ja) * 2018-04-11 2021-05-13 百度在線網絡技術(北京)有限公司 音声制御方法、端末機器、クラウドサーバ及びシステム
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11854539B2 (en) 2018-05-07 2023-12-26 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11907436B2 (en) 2018-05-07 2024-02-20 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11169616B2 (en) 2018-05-07 2021-11-09 Apple Inc. Raise to speak
US11900923B2 (en) 2018-05-07 2024-02-13 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11487364B2 (en) 2018-05-07 2022-11-01 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US10684703B2 (en) 2018-06-01 2020-06-16 Apple Inc. Attention aware virtual assistant dismissal
US11630525B2 (en) 2018-06-01 2023-04-18 Apple Inc. Attention aware virtual assistant dismissal
US11360577B2 (en) 2018-06-01 2022-06-14 Apple Inc. Attention aware virtual assistant dismissal
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US11009970B2 (en) 2018-06-01 2021-05-18 Apple Inc. Attention aware virtual assistant dismissal
US10720160B2 (en) 2018-06-01 2020-07-21 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11495218B2 (en) 2018-06-01 2022-11-08 Apple Inc. Virtual assistant operation in multi-device environments
US10984798B2 (en) 2018-06-01 2021-04-20 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11431642B2 (en) 2018-06-01 2022-08-30 Apple Inc. Variable latency device coordination
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance
US10944859B2 (en) 2018-06-03 2021-03-09 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11783815B2 (en) 2019-03-18 2023-10-10 Apple Inc. Multimodality in digital assistant systems
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11675491B2 (en) 2019-05-06 2023-06-13 Apple Inc. User configurable task triggers
US11705130B2 (en) 2019-05-06 2023-07-18 Apple Inc. Spoken notifications
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11888791B2 (en) 2019-05-21 2024-01-30 Apple Inc. Providing message response suggestions
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11360739B2 (en) 2019-05-31 2022-06-14 Apple Inc. User activity shortcut suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11924254B2 (en) 2020-05-11 2024-03-05 Apple Inc. Digital assistant hardware abstraction
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11750962B2 (en) 2020-07-21 2023-09-05 Apple Inc. User identification using headphones
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones

Also Published As

Publication number Publication date
AU2015210460A1 (en) 2015-09-03
KR20130034630A (ko) 2013-04-05
EP2587478A3 (en) 2014-05-28
CN103035240B (zh) 2015-11-25
KR20140047633A (ko) 2014-04-22
US8812316B1 (en) 2014-08-19
US8762156B2 (en) 2014-06-24
CN103035240A (zh) 2013-04-10
KR101418163B1 (ko) 2014-07-09
AU2015210460B2 (en) 2017-04-13
US20130080177A1 (en) 2013-03-28
JP2015018265A (ja) 2015-01-29
AU2012227294B2 (en) 2015-05-07
EP2587478A2 (en) 2013-05-01
CN105336326A (zh) 2016-02-17

Similar Documents

Publication Publication Date Title
AU2015210460B2 (en) Speech recognition repair using contextual information
US20200364411A1 (en) System and method for inferring user intent from speech inputs
US10847160B2 (en) Using two automated speech recognizers for speech recognition
US10089982B2 (en) Voice action biasing system
US9905228B2 (en) System and method of performing automatic speech recognition using local private data
JP6588637B2 (ja) 個別化されたエンティティ発音の学習
EP2994908B1 (en) Incremental speech input interface with real time feedback
KR101912058B1 (ko) 자연어 음성 서비스 환경에서 하이브리드 처리를 위한 시스템 및 방법
US8738375B2 (en) System and method for optimizing speech recognition and natural language parameters with user feedback
CN113948083A (zh) 基于用户反馈来改善自动语音识别
US8126715B2 (en) Facilitating multimodal interaction with grammar-based speech applications
US11582174B1 (en) Messaging content data storage
US11632345B1 (en) Message management for communal account
US11450325B1 (en) Natural language processing

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130902

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131129

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140428