JP2013073240A - コンテキスト情報を使用した音声認識修正 - Google Patents
コンテキスト情報を使用した音声認識修正 Download PDFInfo
- Publication number
- JP2013073240A JP2013073240A JP2012214570A JP2012214570A JP2013073240A JP 2013073240 A JP2013073240 A JP 2013073240A JP 2012214570 A JP2012214570 A JP 2012214570A JP 2012214570 A JP2012214570 A JP 2012214570A JP 2013073240 A JP2013073240 A JP 2013073240A
- Authority
- JP
- Japan
- Prior art keywords
- interpreters
- interpreter
- application
- api
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
Abstract
【課題】音声認識結果をコンテキスト情報を用いて修正
する方法を提供する。
【解決手段】音声制御システムは、発話コマンド及び関連付けられた単語(例えば、「call mom at home」)を認識し、選択されたアプリケーション(例えば、電話ダイヤラ)にコマンドを実行させることにより、コマンド(例えば、look up mom’s phone number at home and dial it to establish a telehone call)に基づいてスマートフォン等のデータ処理システムに動作を実行させる。音声制御システムは、音声認識システムから認識されたテキストを修正するためにインタプリタの集合を使用し、集合からの結果は、選択されたアプリケーションに提供される最終的に修正されたトランスクリプションにマージされる。
【選択図】図1
する方法を提供する。
【解決手段】音声制御システムは、発話コマンド及び関連付けられた単語(例えば、「call mom at home」)を認識し、選択されたアプリケーション(例えば、電話ダイヤラ)にコマンドを実行させることにより、コマンド(例えば、look up mom’s phone number at home and dial it to establish a telehone call)に基づいてスマートフォン等のデータ処理システムに動作を実行させる。音声制御システムは、音声認識システムから認識されたテキストを修正するためにインタプリタの集合を使用し、集合からの結果は、選択されたアプリケーションに提供される最終的に修正されたトランスクリプションにマージされる。
【選択図】図1
Description
本発明は、音声認識システム及び1つの実施形態においてデータ処理システムを制御するために使用される音声認識システムに関する。
多くの音声認識システムに関する共通の問題は精度である。ユーザは音声認識器に話しかけ、システムは認識したテキストで応答するが、音声認識器がユーザの単語を正しく認識しなかったために、認識されたテキストは多くの誤りを含むことが多々ある。
音声認識は、ユーザが電話でコマンド「call mom」を発話する等電話で音声ダイヤルを呼び出すために使用される。ユーザが「call mom」ではなく「call Tom」と発話したと音声認識器システムからのトランスクリプションエラーが発生したと判断する場合、データ処理システムを制御する音声を使用した結果、異常なシステム動作を招くことになる。トランスクリプションエラーは、例えばBluetooth(登録商標)ヘッドセットを介して高品質のオーディオ録音を入手できないというハードウェアの欠陥、不正確又は不完全な発音等のユーザエラー、あるいは背景雑音により発生する。音声認識システムの中には、音声認識システムを改善するためにコンテキストの使用を採用するものもある。特許文献1は、音声認識処理において支援するためにコンテキストを採用する音声認識システムの一例を提供する。
本発明の一実施形態は、発話コマンド及び関連付けられた単語(例えば、「call mom at home」)を認識する音声制御システムを提供し、選択されたアプリケーション(例えば、電話ダイヤラ)にコマンドを実行させることにより、コマンド及び関連付けられた単語(例えば、place a phone call to mom at home)に基づいてシステム(スマートフォンであってもよい)に動作を実行させる。1つの実施形態において、音声制御システムは、ユーザの音声から取得したデジタル化された入力からテキスト出力を生成するために、従来の音響モデル及び従来の言語モデルを含む音声認識器を使用する。音声制御システムは、1つの実施形態においてユーザが呼び出す音声アシスタントアプリケーションにより起動され、この音声アシスタントアプリケーションは、音声認識器からのテキスト出力を解釈及び修正し、修正されたテキスト出力をアプリケーションの集合の選択されたアプリケーションに提供し、例えばアプリケーションの集合は、電話アプリケーション(音声通話接続をダイヤル及び確立する)、メディアプレーヤアプリケーション(例えば、iTunes)、SMS(ショートメッセージサービス)「テキストメッセージ」アプリケーション、テレビ会議(例えば、「FaceTime」)アプリケーション又はチャットアプリケーション、友人等の個人を発見あるいはその場所を特定するアプリケーション及び他のアプリケーション等の1つ以上のアプリケーションを含む。
1つの実施形態において、音声アシスタントアプリケーションは、アプリケーションの集合が使用する特定の種類のテキストを解釈するようにそれぞれが設計されるインタプリタの集合を使用してテキスト出力を解釈する。例えば、名インタプリタは、アドレス帳データベース又は連絡先データベースにおける名(名フィールドにおける)を解釈するように設計され、姓インタプリタは、アドレス帳データベース又は連絡先データベースにおける姓(姓フィールドにおける)を解釈するように設計され、姓名インタプリタは、アドレス帳データベース又は連絡先データベースにおける姓名を解釈するように設計され、店舗名インタプリタは、アドレス帳データベース又は連絡先データベースにおける店舗名を解釈するように設計される。1つの実施形態において、これらのインタプリタは、テキスト出力における各単語を解釈するために種々のアルゴリズム又は処理を使用するように構成される。例えば、姓名インタプリタは、テキスト出力における単語をアドレス帳データベース又は連絡先データベースにおける単語と比較するためにファジィマッチング(編集距離類似性測定を用いた)アルゴリズムを使用するが、1つの実施形態においてテキスト出力における単語をアドレス帳データベース又は連絡先データベースにおける単語と比較するためにnグラムアルゴリズムを使用せず、名インタプリタは、テキスト出力における単語をアドレス帳データベース又は連絡先データベースにおける単語と比較するためにnグラムアルゴリズムを使用する。1つの実施形態において、更にこれらのインタプリタは、マッチングをアドレス帳データベース又は連絡先データベース中を検索する場合に種々の検索アルゴリズムを使用する。1つの実施形態において、各インタプリタは、単語を解釈する場合にコンテキスト(例えばコンテキストは、メディアプレーヤが曲を再生していることを示す)を更に使用する。1つの実施形態において、例えばコンテキストは、会話履歴(例えば、前に認識された音声)等のユーザ入力の履歴又はアプリケーションの集合のアプリケーションの状態を含む。集合の各インタプリタは、1つの実施形態においてテキスト出力における各単語を処理して単語を修正できるかを判定しようとし、各インタプリタは、1つの実施形態において各単語を修正できるかを自身で判断し、インタプリタは、単語を修正できるかを示すスコア又は信頼性のレベルを生成する。
1つの実施形態において、インタプリタの集合の制御装置は、結果として得られる修正された解釈をランク付けし、ランク付けを実行するために各インタプリタのスコア又は信頼性のレベルを使用し、且つランク付けされた解釈をマージすることにより、インタプリタの集合の結果を処理する。1つの実施形態において、1つのインタプリタからの出力のみが特定の単語を修正するために使用されるように、マージにより解釈における重複を回避しようとする。
1つの実施形態において、音声アシスタントアプリケーションは、単語の文字列における単語の位置に基づいて、あるいはコマンドを判定するために文法パーサを使用することにより、音声認識器システムからテキスト出力におけるコマンドを判定し、そのコマンドは、修正された音声トランスクリプションと共に、特定のアプリケーションが修正された音声トランスクリプションを使用してコマンドを実行するために、音声アシスタントアプリケーションによりアプリケーションの集合の特定のアプリケーションに渡される。本実施形態において、音声アシスタントアプリケーションは、コマンドに基づいて特定のアプリケーションを選択する。例えば、認識されたテキストにおける「call」コマンドにより、音声アシスタントアプリケーションは、APIを介して、修正された音声トランスクリプションと共に「call」コマンドを電話ダイヤラ又は電話アプリケーションに渡し、認識されたテキストにおける「stop」コマンドにより、音声アシスタントアプリケーションは、APIを介して、「stop」コマンドをメディアプレーヤ(例えば、iTunes)に渡して現在再生中の曲の再生を停止する。この例において、インタプリタの集合のメディアプレーヤインタプリタに提供されたコンテキストはメディアの状態を含む(例えばコンテキストは、認識された単語「stop」を含む音声入力が音声認識器システムにより受信された時にBeatlesの曲「Come Together」が現在再生中であるという状態を含む)。この例において、ユーザは、コマンドを発話する前に特定の所望のアプリケーションを選択する必要はない。ユーザは、最前面のアプリケーションである(且つ音声入力フォーカスを有する)音声アシスタントアプリケーションと話し、次に音声アシスタントアプリケーションは、コマンドに基づいてアプリケーションの集合の適切なアプリケーションを自動的に(ユーザがアプリケーションを直接指定せずに)選択し、APIを介して選択されたアプリケーションにコマンドを渡す。
一態様において、機械により実現される方法は、データ処理システムのユーザから音声入力を受信するステップと、データ処理システムにおいて音声入力に対するコンテキストを判定するステップと、音声認識システムを通じて前記音声入力におけるテキストを認識し、該テキストを認識することによりテキスト出力を生成するステップと、それぞれがテキスト出力における単語を示す複数のトークンを有する構文解析されたデータ構造としてテキスト出力を格納するステップと、それぞれがテキスト出力における特定の種類の誤りを修正し、1つ以上のデータベースを検索してデータベースにおける1つ以上の項目と各トークンとの間のマッチングを識別し、且つインタプリタがテキスト出力におけるトークンを修正できるかを識別したマッチング及びコンテキストから判定するように設計されるインタプリタの集合により各トークンを処理するステップと、インタプリタの集合により生成された選択された結果をマージしてテキスト出力の修正バージョンを示す修正された音声トランスクリプションを生成するステップと、修正された音声トランスクリプションにおけるコマンドに基づいてアプリケーションの集合のコマンドを実行するように構成される選択されたアプリケーションに修正された音声トランスクリプションを提供するステップとを備える。
いくつかの実施形態において、コンテキストは前のユーザ入力の履歴を含み、1つ以上のデータベースは、名前、アドレス及び電話番号のうちの少なくとも1つを格納する連絡先データベースを含む。
いくつかの実施形態において、コンテキストは会話履歴を含み、1つ以上のデータベースは、曲、タイトル及びアーティストのうちの少なくとも1つを格納するメディアデータベースを含み、インタプリタの集合に含まれるインタプリタは、可能なマッチングを評価する場合に少なくとも2つの単語の文字列を使用する。
いくつかの実施形態において、インタプリタの集合に含まれる第1のインタプリタは単語を修正するかを判定するために第1のアルゴリズムを使用し、インタプリタの集合に含まれる第2のインタプリタは単語を修正するかを判定するために第2のアルゴリズムを使用し、第1のアルゴリズムは第2のアルゴリズムとは異なる。
いくつかの実施形態において、インタプリタの集合に含まれる第3のインタプリタは1つ以上のデータベースを検索するために第3のアルゴリズムを使用し、インタプリタの集合に含まれる第4のインタプリタは1つ以上のデータベースを検索するために第4のアルゴリズムを使用し、第3のアルゴリズムは第4のアルゴリズムとは異なる。
いくつかの実施形態において、インタプリタの集合に含まれるインタプリタはコマンドの修正を禁止する。
いくつかの実施形態において、マージはインタプリタの集合から重複していない結果のみをマージし、インタプリタの集合からの重複結果はランク付けされた集合においてランク付けされ、ランク付けされた集合の1つの結果は選択されて修正された音声トランスクリプションにマージされる。
いくつかの実施形態において、各インタプリタが修正するように設計される特定の種類の誤りは、インタプリタにより検索される1つ以上のデータベースにおける1つ以上のフィールドに基づいて判定される。
いくつかの実施形態において、インタプリタの集合は、1つ以上のデータベースを検索し、テキスト出力における1つ以上の単語を修正するかを判定する場合にテキスト出力における単語を1つ以上のデータベースにおける1つ以上の項目と比較する。
いくつかの実施形態において、文法パーサは、テキスト出力からコマンドを判定する。
いくつかの実施形態において、アプリケーションの集合は、(a)電話番号をダイヤルするために修正された音声トランスクリプションを使用する電話ダイヤラ、(b)曲又は他のコンテンツを再生するメディアプレーヤ、(c)テキストメッセージングアプリケーション、(d)電子メールアプリケーション、(e)カレンダアプリケーション、(f)ローカル検索アプリケーション、(g)テレビ会議アプリケーション、あるいは(h)人物又はオブジェクトの位置決めアプリケーションのうちの少なくとも2つを含む。
いくつかの実施形態において、方法は上述の特徴のあらゆる組合せを含む。
一態様において、データ処理システムは、音声入力におけるテキストを認識し且つテキスト出力を生成するように動作可能な音声認識器と、音声入力に対するコンテキストを判定するように動作可能なコンテキスト判定モジュールと、音声入力を音声認識器に提供する音声認識器に結合されたマイクと、それぞれがテキスト出力における単語を示す複数のトークンを有する構文解析されたデータ構造としてテキスト出力を格納する記憶装置と、それぞれがテキスト出力における特定の種類の誤りを修正し、1つ以上のデータベースを検索してデータベースにおける1つ以上の項目と各トークンとの間のマッチングを識別し、且つインタプリタがテキスト出力におけるトークンを修正できるかを識別されたマッチング及びコンテキストから判定するように設計される音声認識器及びコンテキスト判定モジュールに結合されたインタプリタの集合と、インタプリタの集合により生成された選択された結果をマージしてテキスト出力の修正バージョンを示す修正された音声トランスクリプションを生成し、且つ修正された音声トランスクリプションにおけるコマンドに基づいてアプリケーションの集合のコマンドを実行するように構成される選択されたアプリケーションに修正された音声トランスクリプションを提供する制御装置とを備える。
いくつかの実施形態において、コンテキストは前のユーザ入力の履歴を含み、1つ以上のデータベースは、名前、アドレス及び電話番号のうちの少なくとも1つを格納する連絡先データベースを含む。
いくつかの実施形態において、コンテキストは会話履歴を含み、1つ以上のデータベースは、曲、タイトル及びアーティストのうちの少なくとも1つを格納するメディアを含み、インタプリタの集合のインタプリタは、可能なマッチングを評価する場合に少なくとも2つの単語の文字列を使用する。
いくつかの実施形態において、インタプリタの集合の第1のインタプリタは単語を修正するかを判定するために第1のアルゴリズムを使用し、インタプリタの集合の第2のインタプリタは単語を修正するかを判定するために第2のアルゴリズムを使用し、第1のアルゴリズムは第2のアルゴリズムとは異なる。
いくつかの実施形態において、インタプリタの集合の第3のインタプリタは1つ以上のデータベースを検索するために第3のアルゴリズムを使用し、インタプリタの集合の第4のインタプリタは1つ以上のデータベースを検索するために第4のアルゴリズムを使用し、第3のアルゴリズムは第4のアルゴリズムとは異なる。
いくつかの実施形態において、インタプリタの集合のインタプリタはコマンドを修正しようとしない。
いくつかの実施形態において、マージはインタプリタの集合から重複していない結果のみをマージし、インタプリタの集合からの重複結果はランク付けされた集合においてランク付けされ、ランク付けされた集合の1つの結果は選択されて修正された音声トランスクリプションにマージされる。
いくつかの実施形態において、各インタプリタが修正するように設計される特定の種類の誤りは、インタプリタにより検索される1つ以上のデータベースにおける1つ以上のフィールドに基づいて判定される。
いくつかの実施形態において、システムは、テキスト出力からコマンドを判定する文法パーサを更に含む。
いくつかの実施形態において、システムは上述の特徴のあらゆる組合せを含む。
本明細書において説明された実施形態は、非一時的な機械可読記憶媒体又は方法、あるいはデータ処理システムとして実現される。
上述の概要は、本発明の全ての態様の完全なリストを含まない。本発明は、先に概要を示された種々の態様の全ての適切な組合せ及び更に以下の発明を実施するための形態において開示される全ての適切な組合せから実施されると考えられる。
本発明は、例として示され、同一の図中符号が同様の要素を示す添付の図面において制限されない。
本発明の1つの実施形態に係る方法を示すフローチャートである。
本発明の1つの実施形態に係るソフトウェアモジュール及びデータ構造を含むアーキテクチャの一例を示す図である。
本発明の1つの実施形態に係る方法を示すフローチャートである。
制御装置モジュールが本発明の1つの実施形態に従ってインタプリタの集合からの修正された結果をランク付け及びマージするために使用される本発明の1つの実施形態に係るアーキテクチャの一例を示す図である。
本発明の1つの実施形態に係る方法を示すフローチャートである。
本明細書において説明される1つ以上の実施形態において採用される1つ以上のAPIを含むソフトウェアアーキテクチャを示す図である。
現在のコンテキストが音声認識システムにおいて判定及び使用される1つの実施形態に係るアーキテクチャを示す図である。
本明細書において説明される1つ以上の実施形態において修正処理で使用されるデータ構造の一例を示す図である。
インタプリタが音声認識システムにより認識されている特定の単語を修正するか否かを判定している場合に本明細書において説明されたインタプリタのうちの1つ以上により使用される特定のアルゴリズムの一例を示す図である。
本発明の1つの実施形態に係るデータ処理システムの一例を示す図である。
本発明のいくつかの実施形態において使用されるソフトウェアスタックの一例を示す図である。
本発明のいくつかの実施形態において使用される例示的なAPIアーキテクチャを示すブロック図である。
本発明の種々の実施形態及び態様は、以下において説明される詳細を参照して説明され、添付の図面は種々の実施形態を示す。以下の説明及び図面は、本発明を例示し、本発明を限定するものとして解釈されるべきではない。多くの特定の詳細は、本発明の種々の実施形態を完全に理解するために説明される。しかし、ある特定の例において、既知の詳細又は従来の詳細は、本発明の実施形態を簡潔に説明するために示されない。
明細書において「1つの実施形態」又は「一実施形態」を参照することは、実施形態と関連して説明された特定の機能、構造又は特徴が本発明の少なくとも1つの実施形態に含まれることを意味する。明細書の種々の箇所に「1つの実施形態において」というフレーズが示されることは、必ずしも同一の実施形態を全て参照することではない。後続する図示された処理は、ハードウェア(例えば、回路網、専用論理等)、ソフトウェア又は双方の組合せを含む処理論理により実行される。処理はいくつかの一連の動作に関して以下において説明されるが、説明される動作のうちのいくつかは異なる順序で実行されてもよいことが理解されるべきである。また、いくつかの動作は、順次ではなく並列に実行される。
本発明の1つの実施形態は、それぞれが音声認識器システムにより提供された認識されたテキストにおける特定の種類の誤りを修正するように設計又は構成されるインタプリタの集合を提供する。音声認識器システムは、音響モデル及び言語モデルの双方を含む従来のソフトウェアベースの音声認識システムであり、音声認識器システムにおいてこれらのモデルを組み合わせることにより、後にインタプリタの集合により修正されるテキスト出力を生成する。インタプリタは、特定のデータベース及びデータベースにおけるコンテンツ、並びにこれらのデータベースを使用する特定のアプリケーションを用いて動作するように構成される。1つの実施形態において、音声認識システムからインタプリタの集合を分離することにより(音声認識システムが出力を提供した後にインタプリタの集合が動作するように)、音声制御システムを設計するに当たりより大きな柔軟性を許す。特定のアプリケーション及び/又はこれらのデータベースのあらゆる変化は、基礎となる音声認識システムを変更する必要なく適切な対応するインタプリタの変化において反映される。例えばデータ処理システムは、従来の既製の音声認識システムを使用し、次にデータ処理システム上でアプリケーション又はアプリケーションの集合毎に発話コマンドに出現するコンテンツを含む特定のアプリケーション及び特定のデータベースに対して適合される適合されたインタプリタを提供する。例えば、「call John Smith on mobile」等のコマンドは、ユーザの連絡先データベース又はアドレス帳データベースに出現すると推定される単語を使用する。名のJohn及び姓のSmithは、データベースに出現すると推定される。更にデータベースは、電話番号のうちの1つがJohn Smithの移動電話番号であることを示すフィールド識別子を含むべきである。コマンド「call」が発話コマンドの最初にある必要があるか、あるいはデータ処理システムは、発話コマンドからコマンドの位置を判定するために文法パーサを使用する。連絡先データベース又は電話アプリケーションが変化する(例えば、コマンドが追加又は削除、あるいは変更される)場合、データベース及びアプリケーションに対するインタプリタは、音声認識システムを変更する必要なく(例えば、音声認識システムの言語モデルを変更する必要なく)変更される。例えばインタプリタは、対話するフィールド(データベースにおける)又はテキスト出力における単語(音声認識システムからの)をデータベースにおけるフィールドとマッチングするために使用されたアルゴリズムを変更すること、あるいはデータベースを検索するために使用された検索アルゴリズムを変更することにより変更される。
図1は、音響モデル及び言語モデルを使用するシステム等の音声認識器システムにより提供されているテキスト出力を修正するためにインタプリタの集合を使用する本発明の1つの実施形態に係る方法の一例を示す。方法は、音声制御システムが起動される動作10において開始する。例えば1つの実施形態において、ユーザは、ボタンを押下するか、ボタンを押下及び押下し続けるか、音声アシスタントアプリケーションを選択又は起動するか、あるいは単に常に動作する背景デーモンとして音声アシスタントアプリケーションを呼び出すデータ処理システムをonにする。音声制御システムは、起動された後に(例えば、音声アシスタントアプリケーションが最前面にあり且つ音声入力フォーカスを有する)音声入力を受信する(12)。1つの実施形態において、ユーザは、例えば「call John Smith on mobile」、「tell John Smith that I am in traffic and will be late for the meeting」、「play all songs by the Beatles」又は「tell my son to pick up milk if he goes to Safeway after school」等のコマンドを発話する。次に動作14において、従来の音声認識システム又は音声認識器は、ユニコード又はASCIIのフォーマット、あるいは符号化又は他の文字符号化におけるテキスト出力を生成するために音響モデル及び言語モデルの双方を採用する従来の音声認識システムを使用してデジタル化並びに処理されている発話入力において受信された単語を認識する。従来の音声制御システム又は音声認識システムは、更なる処理なしでこの時点で結果として得られる出力を使用する。本発明の少なくともいくつかの実施形態において、出力は、動作14により提供された音声認識器システムから認識されたテキスト出力における1つ以上の単語を修正するか否かを判定するために更に処理される。例えば、本発明の1つの実施形態において、動作16は、認識されたテキストにおける1つ以上の単語が修正されるか否かを判定するようにユニコード符号化における認識されたテキストを処理することにより実行される。1つの実施形態において、修正は、各インタプリタがデータベースのデータ構造の特定のフィールドの誤り等の特定の種類の誤りを修正するように設計又は構成されるインタプリタの集合により実行される。例えば、1つのインタプリタは、連絡先データベースの名の誤りを修正するように構成及び設計され、別のインタプリタは、連絡先データベースにおける店舗名の誤りを修正するように設計される。種々の処理アルゴリズム又は検索アルゴリズムを含む種々のアルゴリズムを使用して、各インタプリタが特定のフィールドの特定の種類の誤りを修正するように構成される方法を以下において更に説明する。動作16における処理の結果、修正されたテキストは、動作18において提供され、次にアプリケーションの集合内の1つのアプリケーションである特定のアプリケーションに実際のコマンドとして提供される。
1つの実施形態において、データ処理システムは、集合の2つのアプリケーション、例えば音声入力により制御される電話ダイヤラ及びiTunes等のメディアプレーヤを含む。別の実施形態において、アプリケーションの集合は、これらのアプリケーション、並びにテキストメッセージング(SMS、すなわちショートメッセージングサービス)アプリケーション、電子メールアプリケーション、カレンダアプリケーション、リマインダアプリケーション、ローカル検索アプリケーション、テレビ会議アプリケーション及び人物又は物体の位置決めアプリケーションを含む。ローカル検索アプリケーションは、ユーザがユーザの現在位置に地理的に近接する近くにある店舗又は近くにあるエンティティに関する情報を提供するようにデータ処理システムに命令するアプリケーションである。例えば、ローカル検索発話コマンドは、ユーザの現在地に基づいて近くにある中華料理屋をウェブブラウザ中を検索することを呼び出す「find a Chinese restaurant」である。あるいは、ローカル検索アプリケーションの場合、発話コマンドは「call DNJ Auto Repair」である。ユーザのシステムにおける連絡先データベースがDNJ Auto Repairに対するエントリを含まない場合、システムは、応答してユーザの現在地(例えば、GPS受信機により判定された場所)の近くにある領域においてDNJ Auto Repairとして既知である店舗に対するウェブ検索を呼び出す。
図2は、複数のソフトウェアモジュールからのデータベース及び出力等のデータ構造を更に含む図2に示された各ブロックを実現する複数のソフトウェアモジュール又はハードウェアサブシステムを含むデータ処理システムのアーキテクチャの一例を示す。1つの実施形態において、各要素201、205、207、211、215及び219は、図3に示される方法又は図5Aに示される方法、あるいは図3及び図5Aに示される方法の組合せを実行するために1つ以上のAPIを介して対話するソフトウェアモジュール又はソフトウェアアプリケーションとして実現される。図2に示されたアーキテクチャは、デジタル化された音声入力を音声認識器システム201に提供する音声アシスタントアプリケーションを更に含む。1つの実施形態において、音声アシスタントアプリケーションは、要素207として示されたインタプリタの集合及び要素215として示された制御装置を含み、要素205として示されたプリプロセッサとして動作する。更に音声アシスタントアプリケーションは、要素211として示されるコンテキスト判定モジュールを更に含む。
図2の要素201は、ユーザからデジタル化された発話コマンド又は発話入力における単語を認識するために音響モデル及び言語モデルの双方を採用する従来の音声認識器システムを含む。1つの実施形態において、マイクはユーザから発話音を収集し、これらの音は、要素203として示されたユニコード等の文字符号化フォーマットで認識されたテキスト出力を順次生成する要素201として示された音声認識器システムにデジタル化及び提供される。このテキスト出力203は、次に、例えば図3に示された方法又は図5Aに示された方法の修正処理において使用されるそのような構文解析されたデータ構造の一例を提供する図7に関連して以下において更に説明される1つの実施形態においてトークンを使用して構文解析されたデータ構造である修正データ構造を作成するプリプロセッサである要素205に提供される。1つの実施形態において、トークンは、テキスト出力203における各単語を示すためにデータ構造において使用され、要素207におけるインタプリタの集合は、テキスト出力203における各単語を修正するか否かを判定するためにこれらのトークン又は単語上で動作する。1つの実施形態において、オプションの文法パーサは、図5Aに関連して以下において更に説明されるように、アプリケーションの集合から特定のアプリケーションを選択するために使用されるコマンドであるフレーズにおける単語を判定するために要素207に含まれる。要素207において使用されるインタプリタの集合の一例は、テキスト出力における単語と対応するデータベースにおける単語との間にマッチングが存在するかを判定するように対応するデータベースを検索するため又は単語を処理するために種々のアルゴリズムを使用するインタプリタの集合を含む図4に示される。
図8は、テキスト出力203における単語と図4に示された連絡先データベース415等の1つ以上のデータベースにおける単語との間にマッチングが存在するかを判定するためにインタプリタの集合の1つ以上のインタプリタにより使用されるアルゴリズムの一例を示す。これらの種々のアルゴリズムは、図4及び図8に関連して以下において更に説明される。要素211は、図6に示されたコンテキスト判定モジュール601等のコンテキスト判定モジュールである。要素211におけるこのコンテキスト判定モジュールからの出力は、テキスト出力203における単語が各インタプリタにより修正されるか否かを判定する場合にこれらのインタプリタがコンテキストを使用するために要素207において示されたインタプリタの集合のインタプリタのうちの1つ以上に提供される。
各インタプリタは、要素209におけるデータベース等の1つ以上のデータベースと対話するように構成又は設計される。これらのデータベースは、連絡先データベース又はアドレス帳データベース、電子メールデータベース、テキストメッセージングデータベース、例えばiTunesデータベース、あるいは曲又は映画のデータベース、あるいは曲と映画との組合せのメディアデータベース等を含む。これらのデータベースにおいて対話する他のデータベース及び対応するインタプリタは、本発明の1つの実施形態に更に含まれる。一般的な動作において、特定のデータベースと対話するように(且つ他のデータベースと対話しないように)設計されたインタプリタは、単語がその対応するデータベースにおける既存の単語にマッチングするか及びどの程度マッチングするかを判定するようにコマンドワード以外の各単語を処理する。例えば名インタプリタは、図8に示されたようなnグラムアルゴリズムを使用して、その単語をデータベース中を検索し、且つ次にデータベースにおける単語とインタプリタにより現在処理されている単語との間のマッチングレベルを判定するように設計された1つ以上のアルゴリズムを使用して修正が実行されるべきであるか否かを判定することにより、連絡先データベースにおいて名である単語のマッチングを検索する。1つの実施形態において、各インタプリタは、そのインタプリタが単語を修正できるかを判定するようにテキスト出力203におけるコマンドワード以外の全ての単語を処理する。更に各インタプリタは、マッチングレベル又は単語がデータベースにおいて見つけられた別の単語を用いて修正されるべきかを示すスコア又は信頼性のレベルを提供する。
1つの実施形態において、要素207において示されたインタプリタの集合は別の解釈の集合213を提供し、これらの別の解釈は、後に音声入力におけるコマンドの対象であるアプリケーションに提供されるマージされた解釈217を提供するためにインタプリタの結果をランク付け及びマージする要素215において示された制御装置により処理される。
1つの実施形態において、要素215における制御装置は、以下において更に説明されるように1つ以上のアルゴリズムを使用してこれらのデータベースの検索を実行すること及びこれらのデータベースにおけるマッチングを処理することにより順次1つ以上のデータベースと対話する図4に示されたインタプリタの集合と対話する図4に示された制御装置モジュール411である。図5Bに示された音声アシスタントアプリケーション511等の音声アシスタントアプリケーションは、APIに対して要素219として示された対象アプリケーションを呼び出し、これらの呼び出しのパラメータとしてコマンド及び1つの実施形態においてマージされた解釈217である修正されたトランスクリプションを提供する。
認識されたテキスト出力203等の認識されたテキスト出力における単語を修正する方法を図3に示す。図3の方法は、図2及び図4に示されたアーキテクチャを用いて実行され、図5Bに示された1つ以上のAPIを使用する。また、図3の方法は、認識されたテキスト出力203において検出されるコマンドに基づいてアプリケーションの集合からアプリケーションを選択する音声アシスタントアプリケーションを使用する。図3の方法は、音声認識システムが最初のトランスクリプションを生成する動作301において開始する。これは、図2に示された認識されたテキスト出力203である。動作301において使用された音声認識システムは、デジタル化された音声入力における単語を認識するために使用された従来の音響モデル及び言語モデルを含む音声認識器システム201である。動作303において、図3の方法を実行しているデータ処理システムは、最初のトランスクリプションに対して構文解析されたデータ構造を作成する。この構文解析されたデータ構造は、図3の修正処理において使用され、そのようなデータ構造の一例を以下において更に説明される図7に示す。動作305において、システムは、トランスクリプションにおけるコマンドを判定し、ユーザ及び/又はシステムコンテキストを更に判定する。コマンドは、最初にコマンドを発話するようにユーザに要求すること又はコマンドの場所、すなわちテキスト出力203等のテキスト出力におけるコマンドワード自体を判定するためにテキスト出力203等のテキスト出力を構文解析する文法パーサを使用することで判定される。
また、図3に示された実施形態において、動作305は、ユーザ及び/又はシステムコンテキストを判定することを更に含む。コンテキスト情報は、起動され且つ動作しているアプリケーション、並びに起動されず且つ動作していないアプリケーション、メディアプレーヤが曲又は映画等のメディアを再生しているか否かのリストを含み、近接センサ、方位センサ、加速度計及び他のセンサ等のセンサに基づくユーザ状態を更に含む。更にコンテキスト情報は、例えばBeatlesのアルバム「Abbey Road」を再生する等の前に認識されたテキストを含む(アプリケーションの集合のアプリケーション毎に)前の会話履歴を更に含む。1つの実施形態において、コンテキストは、前の会話において示されるアプリケーションドメインを含み、現在のアプリケーション状態が例えばyes又はno、あるいは取消し等のユーザからの確認を期待する。選択値(確認に対する)は、現在の会話コンテキストに基づいてシステムにより指定される。例えばユーザは、電子メールを友人に送出するようにシステムに要求する。メッセージを構成した後、システムは確認するようにユーザに要求する。この時点で、確認選択値は、「yes」、「取消し」及び「それを変更」で代入される。1つの実施形態において、コンテキスト情報は、ユーザの現在地、例えばユーザが本明細書において説明されたようなローカル検索を要求する場合に使用されるGPSの現在地を更に含む。コンテキスト情報は、ロケールコンテキスト及び/又は言語コンテキストを更に含む。例えば、入力言語コンテキストは、音声修正において支援するためにインタプリタの集合により使用される。1つの実施形態において、言語コンテキスト(1つの実施形態においてユーザの基本設定から判定される)が英語である場合、インタプリタは、テキストコンテキストにおける「yet」(音声認識システムからの最初のトランスクリプション)を「yes」に修正する。
動作307において、システムは、1つの実施形態においてトランスクリプション(例えば、認識されたテキスト出力203)が修正される必要があるか及び修正されてよいかを判定するためにインタプリタの集合の各インタプリタを実行する。1つの実施形態において、インタプリタの集合の全てのインタプリタは、動作307において実行される。別の実施形態において、トランスクリプションが現在実行しているアプリケーションに対してのみ修正される必要があるかを判定するために、現在実行しているアプリケーションに対するインタプリタのみが実行される。1つの実施形態において、各インタプリタは、図2の要素201における音声認識器システム等の音声認識器システムにより提供された認識されたテキスト出力における1つ以上の単語を修正できるかをそのアルゴリズムに基づいて自身で判断する。この動作は要素309として示される。インタプリタのうちで修正できるもの又は修正が必要ないと判断できるものがない場合、動作311において、認識されたテキスト出力203等の音声認識器システムにより提供された最初のトランスクリプションは、使用され且つ選択されたアプリケーションに提供される。一方、1つ以上の単語が修正可能であると判定されている場合、最初のトランスクリプション(例えば、認識されたテキスト出力203)及び修正された解釈を含む別の解釈の集合が提供される(313)。例えば、ユーザが連絡先データベースに「John」は有さないが「Jon」を有する場合、「Jon」という単語は、「John」という単語の別の解釈となる。各インタプリタは、例えば図4に示された制御装置モジュール411等の制御装置に提供する1つ以上の別の解釈に対するマッチングレベルを示すスコア又は信頼性のレベルを維持する。スコア又は信頼性のレベルは、それが最も高いマッチングする解釈を選択するために種々の解釈をランク付けする場合に使用される。スコア又は信頼性のレベルは、単語毎又はフレーズ(例えば、2つ又は3つの単語)毎に判定される。次に動作315において、制御装置モジュール又は他のモジュールは、1つの実施形態において各インタプリタにより提供された信頼スコア、あるいはマッチングスコア又はランキングスコアに基づいて重複していない解釈をマージしようとするマージ動作を実行する。修正されている最後のトランスクリプションであるマージされた解釈は、動作317において選択されたアプリケーションに提供される。1つの実施形態において、選択されたアプリケーションは、動作305において認識又は判定されたコマンドに基づいて選択される。
図4は、認識されたテキスト出力203等の最初のトランスクリプションにおける単語を修正するためにインタプリタの集合及び制御装置モジュールを使用するアーキテクチャの一例を示す。1つの実施形態において、各インタプリタは、アルゴリズムを適切に使用することにより1つ以上のデータベースのある特定のフィールドにおける単語を処理するように構成又は設計される。例えば、図4に示された実施形態において、インタプリタ401は、1つの実施形態において図8に示されたアルゴリズム等のnグラムアルゴリズムであるアルゴリズムAを使用して連絡先データベース415の名フィールドにおける単語を修正するように構成される。1つの実施形態において、インタプリタは、いくつかのアルゴリズム又は1つのアルゴリズムのみを採用する。アルゴリズムは、nグラムアルゴリズムに加え、2つのテキスト間の類似性を測定する編集距離、あるいはdouble metaphoneアルゴリズム又はsoudexアルゴリズム等の音声マッチングアルゴリズムを使用するファジィマッチングアルゴリズムを含む。また、接頭辞、接尾辞の部分トークンアルゴリズムが使用され、2つのテキスト間のマッチング又は類似性の度合いを判定する当技術分野において既知である他のアルゴリズムが更に使用される。1つの実施形態において、1つのインタプリタがアルゴリズムAを使用し、別のインタプリタがアルゴリズムAではなくアルゴリズムBを使用するように、種々のインタプリタは種々のアルゴリズムを使用する。1つの実施形態において、アルゴリズムは、対応するデータベースにおいてマッチングを見つけ且つデータベースを検索するように適合され、特に各インタプリタが訂正するように設計される特定のフィールドに対して適合される。インタプリタ403はアルゴリズムAを使用する姓インタプリタであり、インタプリタ405はアルゴリズムBを使用する姓名インタプリタである。また、図4に示されたインタプリタの集合は、アルゴリズムB及びアルゴリズムAとは異なるアルゴリズムCを使用する店舗名インタプリタ407を含む。インタプリタ401、403、405及び407の各々は、対応するフィールドの各々におけるマッチングを検索するためにデータベース414ではなく連絡先データベース415へのアクセスを有する。種々のフィールドに対して種々のアルゴリズムを使用することに加え、各インタプリタは、対応するデータベースを検索する場合に種々の検索アルゴリズムを採用する。図4に示されたインタプリタの集合は、例えば曲及び/又は映画のiTunesデータベース等のメディアデータベース414、並びに他のメディアにおいて1つ以上のフィールドを検索するように設計されるメディアプレーヤインタプリタ409を更に含む。
図4に示されたアーキテクチャにおける各インタプリタは、別の解釈の集合213等の1つ以上の別の解釈を制御装置モジュール411に提供する。例えば、名インタプリタ401は、発話コマンドにおいて名であると思われるものの2つの異なる別の解釈を提供し、これらの2つの異なる解釈は、それぞれ、解釈が正しいという信頼性又は確率の度合いを示すスコアリング又はランキングを含む。1つの実施形態において、スコア又はランキングはマッチングレベル又は類似性レベルに基づく。図8は、異なるスコアを含む2つの解釈の一例を示す。
図8は、マッチングのランキングに対するスコアを提供するためにnグラムアルゴリズムを使用する方法の一例を示す。この例において、認識されたテキスト出力203等の音声認識器システムからのテキストは、「cream」801という単語を含む。音声認識器システムからのこの単語は、ユーザのアドレス帳において見つけられた少なくとも2つの異なる単語803及び805と比較され、特に単語801は、図8に示されたように単語803及び805と比較される。アルゴリズムは、アルファベットの対をテキスト801と比較することでスコアを提供する。図8から分かるように、Kreamという名前は、アドレス帳において見つけられた他の名前、すなわちゼロのスコアを有する名前805より近いマッチングである(3のスコアを有するため)。
インタプリタの集合の各インタプリタは、要素211において示されたコンテキスト判定モジュール又は図6におけるコンテキスト判定モジュール601等のコンテキスト判定モジュールにより提供されたコンテキスト情報を使用する。コンテキストは、コマンドがアプリケーションの集合の1つ以上のアプリケーションに対して発話されるか、並びに必要に応じて単語自体に加えコマンド自体を示す前の会話履歴を含む。前の会話履歴603は、例えばタッチスクリーン又はキーボード上のユーザ入力等の前のユーザ入力を更に含むこの情報を提供する。コンテキスト判定モジュールは、前の会話履歴から、並びに起動され且つ実行しているアプリケーション、起動されていない、すなわち実行していないアプリケーション及びメディアが再生しているか等を示すインジケータを含むアプリケーションの状態605からもコンテキストを判定する。例えば、ユーザが事前にメディアの再生を開始させており、且つその状況においてメディアが再生している間に「stock」という単語がメディアプレーヤインタプリタ409により「stop」であると解釈されるため、メディアプレーヤインタプリタ409は、「stock」という単語の最初のトランスクリプションを「stop」に修正するためにメディアが再生している時のコンテキストインジケータを使用する。コンテキスト判定モジュールは、本明細書において説明されたような言語コンテキスト又はロケールコンテキストを判定する。コンテキスト判定モジュール601は、コンテキスト判定処理の一部として例えば方位センサ又は近接センサ、あるいは光センサ等のセンサからの入力を更に含む。更にコンテキスト判定モジュール601は、前のユーザ入力の履歴を含む。コンテキスト判定モジュール601は、コンテキストに関するこのような種々の情報を収集し、単語が発話コマンド入力において修正されるかに関する判断を行うことを支援するためにコンテキストを使用するインタプリタにそのような情報を提供する。
次に、本発明の一実施形態に係る特定の実現例を図7に関連して提供する。データ構造701は、トークン703を用いて認識されたテキスト出力における単語を示す。
音声認識の処理は、音声オーディオ録音を利用し、それを1つ以上のテキスト解釈にトランスクリプションする。最初のトランスクリプションはテキスト文字列705として示される。これらのトランスクリプションされたテキストは、1つの実施形態においてRecognitionと呼ばれる表のようなデータ構造に格納され、図7に示される。
Recognitionの基本構造はTokenである。Tokenは、トランスクリプションの原子単位を表す不変の文字列である。トランスクリプションが一連のToken703から構成される場合、各Tokenは、Phrase707と呼ばれる2次レベルのデータ構造にカプセル化される。Phraseは列メジャーデータ構造である。Phraseオブジェクトの順序付きリストはRecognitionを形成する。Phraseデータ構造の存在は、別のトランスクリプションを可能にするためのものである。
例えば、ユーザが「Call John Smith on mobile」と言う場合、音声アシスタントアプリケーションは、図7に示されたRecognitionを生成する。
音声修正の処理は、入力としてRecognitionオブジェクト(図7に示された)を利用し、元の認識のいずれかの部分が要求し且つ修正される場合に変形されたRecognitionオブジェクトを生成する。
Meta−Repairと呼ばれる内部データ構造は、音声修正処理を支援するために作成される。このデータ構造は、元のRecognitionオブジェクト(図7に示された)、Repairオブジェクト及び元のトランスクリプションに対するToken位置から構成される。
ここに図7に示されたデータ構造に対するToken位置ルックアップテーブルの一例を示す。
Pair<Start,End>:元の認識テキストに対する特定のトークン文字列の開始位置及び終了位置
「Call John Smith on Mobile」
Meta−RepairのToken Position List:
[0]:Pair<0,3>
[1]:Pair<5,8>
[2]:Pair<10,14>
[3]:Pair<16,17>
[4]:Pair<19,24>。
「Call John Smith on Mobile」
Meta−RepairのToken Position List:
[0]:Pair<0,3>
[1]:Pair<5,8>
[2]:Pair<10,14>
[3]:Pair<16,17>
[4]:Pair<19,24>。
Meta−RepairのRepairオブジェクトは、音声修正手順により生成された別の解釈のリストから構成される。別の解釈を示すために使用されたデータ構造を修正解釈と呼ぶ。
修正解釈は、元の認識における部分文字列、並びにその部分文字列の開始位置及び終了位置に対する妥当な置換であるテキストから構成される。例えば、「Jon」が「John」と置換される場合、図7に示されたデータ構造に対する修正解釈は、以下のように示される。
修正解釈:
テキスト:「Jon」
開始:5
終了:8。
修正解釈:
テキスト:「Jon」
開始:5
終了:8。
Meta−Repairオブジェクトは、解釈マージを実行するための情報を含む。1つの実施形態において元のトランスクリプションが全てのインタプリタを通過した後で及び生成された1つ以上の修正解釈がある場合、マージ論理が発生する。以下の擬似コードは、インタプリタの集合から重複していない解釈をマージするために使用されるマージ関数の一例を提供する。「INPUT:original::Recognition」を図7に示す。
FUNCTIONマージ
INPUT: original::Recognition
repair::Repair
OUTPUT:original::Recognition
BEGIN
IF repair.getRepairInterpretation() is EMPTY
RETURN original;
ELSE
String originalText=repair.getOriginalText();
List interpretations=repair.getRepairInterpretations();
List ranked=rank(originalText,interpretations);
List nonOverlap=findNonOverlapInterpretations(ranked);
FOR each RepairInterpretation i in nonOverlap
List<Phrase>phrases=findRepairPhrases(original,i)
List<Token>tokens=makeRepairTokens(i);
addTokensToPhraseHead(phrase,tokens);
END FOR
RETURN original;
END
FUNCTION rank
INPUT: originalText::String
interpretaions::List<RepairInterpretation>
OUTPUT: ranked::List<RepairInterpretation>
RETURN オブジェクトの収集上で全順序を課すカスタムJava Comparatorを使用してソートされた解釈リスト
/**
Collections.sort(sorted,new Comparator<Repair.Interpretation>(){
@Override
public int compare(Repair.Interpretation o 1,
Repair.Interpretations o2){
if (scoreInterpretaions(o1)>scoreInterpretation(o2)){
return −1;
} else if (scoreInterpretations(o1)<
scoreInterpretation(o2)){
return 1;
} else {
return 0;
}
}
private float scoreInterpretation(Repair.Interpretation itp){
float score=0;
if (itp.isPerfectMatch(getOriginalText())){
score=getOriginalText().length();
}
score+=(float)itp.getLength()/getOriginalText().length();
return score;
}
});
/**
END。
FUNCTIONマージ
INPUT: original::Recognition
repair::Repair
OUTPUT:original::Recognition
BEGIN
IF repair.getRepairInterpretation() is EMPTY
RETURN original;
ELSE
String originalText=repair.getOriginalText();
List interpretations=repair.getRepairInterpretations();
List ranked=rank(originalText,interpretations);
List nonOverlap=findNonOverlapInterpretations(ranked);
FOR each RepairInterpretation i in nonOverlap
List<Phrase>phrases=findRepairPhrases(original,i)
List<Token>tokens=makeRepairTokens(i);
addTokensToPhraseHead(phrase,tokens);
END FOR
RETURN original;
END
FUNCTION rank
INPUT: originalText::String
interpretaions::List<RepairInterpretation>
OUTPUT: ranked::List<RepairInterpretation>
RETURN オブジェクトの収集上で全順序を課すカスタムJava Comparatorを使用してソートされた解釈リスト
/**
Collections.sort(sorted,new Comparator<Repair.Interpretation>(){
@Override
public int compare(Repair.Interpretation o 1,
Repair.Interpretations o2){
if (scoreInterpretaions(o1)>scoreInterpretation(o2)){
return −1;
} else if (scoreInterpretations(o1)<
scoreInterpretation(o2)){
return 1;
} else {
return 0;
}
}
private float scoreInterpretation(Repair.Interpretation itp){
float score=0;
if (itp.isPerfectMatch(getOriginalText())){
score=getOriginalText().length();
}
score+=(float)itp.getLength()/getOriginalText().length();
return score;
}
});
/**
END。
図5Aは、発話コマンドにおいて検出されるコマンドに基づいて発話コマンドの対象であると判定される適切なアプリケーションをシステムが選択できるようにする音声アシスタントアプリケーションを使用する本発明の1つの実施形態を示す。1つの実施形態において、音声アシスタントアプリケーションは、発話コマンドにおけるコマンドを検出することにより適切なアプリケーションを選択するために文法パーサを使用するか、あるいはシステムが発話入力における他の単語に対するコマンドである単語を判定できるように、ユーザは、全ての発話コマンドにおける最初の単語としてコマンドを発話する必要がある。本実施形態において、システムは、発話コマンドに基づいて特定のアプリケーションを選択することにより、アプリケーションをシステムの音声入力フォーカスを有する最前面のアプリケーションにするために、ユーザがコマンドを発話する前にアプリケーションを選択するように要求する。換言すると、本実施形態において、音声アシスタントアプリケーションは、アプリケーションに対して適切であるコマンドに基づいてアプリケーションの集合から1つのアプリケーションを選択する。動作501において、システムは、アプリケーションの集合の1つのアプリケーションに関する音声入力を受信する。アプリケーションは、実行中でも実行中でなくてもよい。1つの実施形態において、方法は、実行中のアプリケーションのみがアプリケーションの集合にあるが、別の実施形態において各アプリケーションが音声入力を受信する場合には実行中であるか否かに関係なく全てのアプリケーションがアプリケーションの集合にあるように構成される。動作503において、音声アシスタントアプリケーションは、音声入力におけるコマンドを判定し、判定されたコマンドに基づいて適切なアプリケーションを選択する。例えば、コマンドが「call」である場合、1つの実施形態における適切なアプリケーションは、音声入力(例えば、call mom at home)において特定された人物との通話を確立する電話ダイヤラである。コマンドは、動詞を使用するようにユーザに命令することで動詞であることが必要なコマンドの位置を特定するために文法パーサを使用することにより判定されるか、あるいはシステムは、一連の発話単語における固定の位置にコマンドを配置するようにユーザに要求する。1つの実施形態において、例えば、コマンドが「tell」という単語である場合、選択されたアプリケーションはテキストメッセージング(SMS)アプリケーションであり、コマンドが「play」又は「stop」という単語である場合、選択されたアプリケーションはメディアプレーヤアプリケーションである。
次に動作505において、インタプリタは、認識された音声入力における1つ以上の単語を修正するように実行される。アプリケーションがインタプリタを実行する前に動作503で選択される場合、音声入力を介して発話コマンドを受信できる全てのアプリケーションに対するシステムにおいて使用可能な全てのインタプリタを実行するのではなく、その特定のアプリケーションで動作するように設計されるインタプリタのみが実行される。動作505は、動作307に類似し、図6に示されたコンテキスト判定モジュールと組み合わせて図4に示されたアーキテクチャを使用する。1つの実施形態において、動作503で判定又は検出されるコマンドは繰り返されない。この場合、インタプリタは、インタプリタが対話する1つ以上のデータベースを検索する場合にテキスト入力におけるコマンドをストップワードとして解釈する。次に動作507において、音声アシスタントアプリケーションは、コマンドを動作503で判定された選択されたアプリケーションに渡し、修正されたトランスクリプション(インタプリタを実行し且つ別の解釈をマージする結果得られた)を選択されたアプリケーションに渡す。1つの実施形態において、音声アシスタントアプリケーションは、図5Bに示されたような1つ以上のAPI等のAPIを介して修正されたトランスクリプションと共にコマンドを渡す。
図5Bに示された音声アシスタントアプリケーション511は、図5Aの1つ以上の方法を実行する音声アシスタントアプリケーションと同一である。音声アシスタントアプリケーション511は、上述され且つ/あるいは図6に示されたコンテキスト情報等のコンテキスト情報を順次返送するオペレーティングシステム516に対してAPI514を介してコンテキスト呼び出しを実行することにより、コンテキストを判定する。コンテキスト情報は、実行中のアプリケーション及び以前にユーザ入力又は発話コマンドを受信したアプリケーションのリストを更に含む。音声アシスタントアプリケーション511は、オペレーティングシステム516に加えて、音声アシスタントアプリケーション511、並びにアプリケーション518及び520等のアプリケーションの集合の1つ以上のアプリケーションを含むソフトウェアスタックを示す図5Bに示されたシステム上で実行するソフトウェアアプリケーションである音声認識器システムを更に呼び出す。アプリケーション518及び520は、API512を介して音声アシスタントアプリケーションから渡されるコマンドを受信する。
以下は、1つの実施形態における音声アシスタントアプリケーションによる音声修正の3つの使用例である。
「snap−to−grid」音声ダイヤル。音声アシスタントアプリケーションにより、ユーザは、音声を使用してアドレス帳データベースにおける連絡先に通話できる。ユーザは、アドレス帳において「Marc Dickinson」と名前をつけられた連絡先を有し、「Mark」又は「Dick」と名前をつけられた連絡先は有さない。ユーザが「Call Marc Dickinson」と言う場合、音声認識は、入力を「Call Mark Dick son」として間違ってトランスクリプションする。アシスタントがデータベースにおいて「Mark Dick son」を見つけられないために動作を完了できないことをユーザに伝えるのではなく、音声修正は、より妥当な別のトランスクリプション、すなわち「Call Marc Dicknson」を生成するために連絡先の名前のスペリングを利用し且つファジィマッチングアルゴリズムを使用する。(2)ユーザの意図の曖昧性の除去。音声アシスタントアプリケーションにより、ユーザは、SMSメッセージを送出し且つ音声ダイヤル要求を行える。ユーザが「Tell my wife to pick up milk and fruits if she goes to Safeway after work」と言う場合、アシスタントは、自動的にユーザの妻に対してテキストメッセージを構成する。認識誤りのため、音声システムは、「tell」という動作語を「call」又は「tall」として間違ってトランスクリプションする可能性がある。1つの実施形態において「Call my wife to pick up milk and fruits if she goes to Safeway after work」又は「Tall my wife to pick up milk and fruits if she goes to Safeway after work」という要求がアシスタントにおけるいずれの動作可能なタスクともマッチングしないため、デフォルトの応答は、通常、「Sorry! I don’t know what you meant」である。音声修正は、コンテキストを使用して音声意図の曖昧性を除去することでこの問題を解決することを支援する。例えば、「tell」という単語と「tall」という単語との編集距離が短く、且つ音声ダイヤルコマンドが一般に対象人物トークンの後に長く実行する文字列を有さないことを知ることにより、インタプリタは、元のトランスクリプションを「Tell my wife to pick up milk and fruits if she plans to vist Safeway after work」として書き直す。(3)コマンドキーワード/システムキーワードの曖昧性の除去。音声システムは、短いキーワードの発音を間違ってトランスクリプションする場合がある。例えば、ユーザが「Stop」と言い且つ最初のトランスクリプションが「Stock」であり、ユーザが「Yes」と言い且つ最初のトランスクリプションが「Yet」である。音声修正は、1つ以上のコンテキストヒントに基づいて元のトランスクリプションテキストがより妥当でない解釈である場合に別のトランスクリプションを提供することにより、これらの問題を克服することを支援する。例えば、アシスタントがYES/NOの確認をユーザに促している場合、ユーザがフォローアップ応答として「Yet」と言う可能性は低い。最終的なトランスクリプションとして「Yet」を返送するのではなく、音声修正は、より妥当な音声入力としてそれを「Yes」で上書きする。同様の修正論理は、メディアプレーヤドメインに適用可能である。ユーザが単に曲が再生されることを要求しており且つ即座の音声トランスクリプションが「Stock」である場合、音声修正は、より妥当なコマンドトランスクリプションとしてそれを「Stop」で書き直す。
図9は、本発明の1つの実施形態と共に使用されるデータ処理システム900の一例を示す。例えば及び1つの実施形態において、システム900は、スマートフォン、タブレット(例えば、iPad)装置、ラップトップ又はエンターテイメントシステム等の携帯データ処理装置として実現される。図9に示されたデータ処理システム900は、1つ以上のマイクロプロセッサ又はチップ(集積回路)上のシステムである処理システム911を含み、システムは、処理システムにより実行するためのデータ及びプログラムを格納するメモリ901を更に含む。メモリ901は、図2に関連して説明されたソフトウェアコンポーネント等を格納し、半導体メモリ(例えば、フラッシュ、DRAM、SRAM等)の非一時的な機械可読記憶媒体のあらゆる既知の形態である。システム900は、例えばスピーカ及びマイクを介して音楽を再生するかあるいは電話機能性を提供するマイク及びスピーカを含む。マイクは、本明細書において説明された音声入力を受信し、その入力は、本明細書において説明されたように音声認識器システムにデジタル化及び提供される。
表示制御装置及び表示装置909は、ビジュアルユーザインタフェースをユーザに提供する。このインタフェースは、iPhone又はiPad上でOS Xオペレーティングシステムソフトウェア又はiOSソフトウェアを実行する場合にMacintoshコンピュータ上に示されたものに類似するグラフィカルユーザインタフェースを含む。システム900は、別のデータ処理システムと通信する1つ以上の無線送受信機903を更に備える。無線送受信機は、WLAN送受信機(例えば、WiFi)、赤外線送受信機、Bluetooth送受信機及び/又は無線携帯電話送受信機である。ある特定の実施形態において、不図示の更なる構成要素はシステム900の一部であってもよく、且つ図9に示されたより少ない構成要素はデータ処理システムにおいて更に使用されてもよいことが理解されるだろう。システム900は、別のデータ処理システムと通信する1つ以上の通信ポート917を更に含む。通信ポートは、USBポート、Firewireポート、Bluetoothインタフェース、ドッキングポート等である。
データ処理システム900は、ユーザが入力をシステムに提供できるように提供される1つ以上の入力装置913を更に備える。これらの入力装置は、表示装置909等の表示装置と重ねられ且つ一体化されるキーパッド又はキーボード、あるいはタッチパネル又はマルチタッチパネルである。データ処理システム900は、ドック用のコネクタであるオプションの入出力装置を更に備える。不図示の1つ以上のバスは、当技術分野において既知であるように種々の構成要素を相互接続するために使用されることが理解されるだろう。図9に示されたデータ処理システムは、ハンドヘルドコンピュータ又はパーソナルデジタルアシスタント(PDA)、PDAのような機能性を含む携帯電話、携帯電話を備えるハンドヘルドコンピュータ、iPod等のメディアプレーヤ、ゲーム装置又はエンターテイメント装置、あるいは1つの装置、組込み型装置又は他の消費者電子装置においてPDA及び携帯電話とを組み合わされたメディアプレーヤ等のこれらの装置の態様又は機能を組み合わせる装置である。他の実施形態において、データ処理システム900は、別の装置内のネットワークコンピュータ又は組込み型処理装置、あるいは図9に示されたものより少ない構成要素又はあるいは図9に示されたものより多い構成要素を有する他の種類のデータ処理システムである。
データ処理システム900は、必要に応じてオーディオI/O905におけるマイクにより受信されたユーザ音声をデジタル化及び格納するように設計された1つ以上のハードウェア装置を備える。
本発明の少なくともある特定の実施形態は、メディア、メディアを格納する記憶装置を提示するメディア処理システムを含み、且つアンテナシステム及びメディア処理システムと結合された無線周波数(RF)送受信機(例えば、携帯電話用のRF送受信機)を更に備える携帯音楽プレーヤ及び/又はビデオメディアプレーヤ等のデジタルメディアプレーヤの一部である。ある特定の実施形態において、リモート記憶装置上に格納されたメディアは、RF送受信機を介してメディアプレーヤに送信される。例えばメディアは、音楽又は他のオーディオ、静止画又は動画のうちの1つ以上である。
携帯メディアプレーヤの例は、双方とも参考として本明細書に取り入れられる公開された米国特許第7,345,671号公報及び米国特許出願公開第2004/0224638号において説明される。
1つ以上のアプリケーションプログラミングインタフェース(API)は、いくつかの実施形態において使用される。APIは、異なるプログラムコードコンポーネント又はハードウェアコンポーネント(以下において「API呼び出しコンポーネント」)が1つ以上の機能、方法、手順、データ構造、クラス及び/又はAPI実装コンポーネントにより提供された他のサービスにアクセスし且つそれらを使用できるようにするプログラムコードコンポーネント又はハードウェアコンポーネント(以下において「API実装コンポーネント」)により実現されたインタフェースである。APIは、API呼び出しコンポーネントとAPI実装コンポーネントとの間で渡される1つ以上のパラメータを規定する。
APIにより、API呼び出しコンポーネントの開発者(サードパーティ開発者である)は、API実装コンポーネントにより提供された特定の機能に影響を及ぼすことができる。1つのAPI呼び出しコンポーネント又は2つ以上のそのようなコンポーネントがある。APIは、アプリケーションからのサービスに対する要求を支援するためにコンピュータシステム又はプログラムライブラリが提供するソースコードインタフェースである。オペレーティングシステム(OS)は、OS上で動作するアプリケーションがこれらのAPIのうちの1つ以上を呼び出せるようにする多数のAPIを有し、サービス(例えば、プログラムライブラリ)は、サービスを使用するアプリケーションがこれらのAPIのうちの1つ以上を呼び出せるようにする多数のAPIを有する。APIは、アプリケーションが構築される場合に解釈又はコンパイルされるプログラミング言語に関して規定される。
いくつかの実施形態において、API実装コンポーネントは、それぞれがAPI実装コンポーネントにより実現された機能性の種々の態様にアクセスする種々の態様の異なるビュー又は種々の態様を含む異なるビューを提供する2つ以上のAPIを提供する。例えば、API実装コンポーネントの1つのAPIは、機能の最初の集合を提供し、サードパーティ開発者に示され、API実装コンポーネントの別のAPIは、隠蔽され(示されず)、機能の最初の集合の部分集合を提供し、機能の最初の集合にないテスト機能又はデバッグ機能等の機能の別の集合を更に提供する。他の実施形態において、API実装コンポーネントは、基礎となるAPI、すなわちAPI呼び出しコンポーネント及びAPI実装コンポーネントの双方を介して1つ以上の他のコンポーネントを自ら呼び出す。
APIは、API実装コンポーネントの特定の機能にアクセスし且つそれを使用する場合にAPI呼び出しコンポーネントが使用する言語及びパラメータを規定する。例えばAPI呼び出しコンポーネントは、APIにより示された1つ以上のAPI呼び出し(例えば機能又は方法の呼び出しにより具体化された)を介してAPI実装コンポーネントの特定の機能にアクセスし、API呼び出しを介してパラメータを使用してデータ及び制御の情報を渡す。API実装コンポーネントは、API呼び出しコンポーネントからのAPI呼び出しに応答してAPIを介して値を返送する。APIは、構文及びAPI呼び出しの結果(例えば、APIを呼び出す方法及びAPI呼び出しが実行するもの)を規定するが、API呼び出しがAPI呼び出しにより特定された機能を実行する方法は示さない。種々のAPI呼び出しは、呼び出し(API呼び出しコンポーネント)とAPI実装コンポーネントとの間の1つ以上のアプリケーションプログラミングインタフェースを介して転送される。API呼び出しを転送することは、機能呼び出し又は機能メッセージを発行すること、開始すること、呼び出すこと、受信すること、返送すること、あるいはそれらに応答することを含む。換言すると、転送することは、API呼び出しコンポーネント又はAPI実装コンポーネントのいずれかによる動作を説明する。APIの機能呼び出し又は他の呼び出しは、パラメータリスト又は他の構造を介して1つ以上のパラメータを送出又は受信する。パラメータは、APIを介して渡されるデータ又は他の項目を参照する機能又は方法、あるいは別の方法に対する定数、キー、データ構造、オブジェクト、オブジェクトクラス、変数、データタイプ、ポインタ、アレイ、リスト又はポインタである。
また、データタイプ又はデータクラスは、APIにより提供され、API実装コンポーネントにより実現される。従って、API呼び出しコンポーネントは、APIにおいて提供された定義を使用することでそのようなタイプ又はクラスの定数値を使用あるいはインスタンス化するために変数を宣言し、ポインタを使用する。
一般にAPIは、API実装コンポーネントにより提供されたサービス又はデータにアクセスするため、あるいはAPI実装コンポーネントにより提供された動作又は計算の性能を開始するために使用される。例として、API実装コンポーネント及びAPI呼び出しコンポーネントは、それぞれ、オペレーティングシステム、ライブラリ、デバイスドライバ、API、アプリケーションプログラム又は他のモジュールのうちのいずれか1つである(API実装コンポーネント及びAPI呼び出しコンポーネントは、同一の種類のモジュール又は互いに異なる種類のモジュールであることが理解されるべきである)。API実装コンポーネントは、場合によってはファームウェア、マイクロコード又は他のハードウェア論理において少なくとも部分的に具体化される。いくつかの実施形態において、APIにより、クライアントプログラムは、ソフトウェア開発キット(SDK)ライブラリにより提供されたサービスを使用できる。他の実施形態において、アプリケーション又は他のクライアントプログラムは、アプリケーションフレームワークにより提供されたAPIを使用する。これらの実施形態において、アプリケーション又はクライアントプログラムは、SDK及びAPIにより提供された機能又は方法に呼び出しを組み込むか、あるいはSDKにおいて規定され且つAPIにより提供されたデータタイプ又はデータオブジェクトを使用する。これらの実施形態において、アプリケーションフレームワークは、フレームワークにより規定された種々のイベントに応答するプログラムに対するメインイベントループを提供する。APIにより、アプリケーションは、アプリケーションフレームワークを使用してイベント及びイベントへの応答を特定できる。いくつかの実現例において、API呼び出しは、例えば入力の機能及び状態、出力の機能及び状態、処理機能、電源の状態、記憶装置の容量及び状態、通信機能等の態様に関連したものを含むハードウェア装置の機能又は状態をアプリケーションに対して報告し、APIは、ハードウェアコンポーネント上で部分的に実行するファームウェア、マイクロコード又は他の低レベル論理により部分的に実現される。
API呼び出しコンポーネントは、ネットワークを介してAPIによりAPI実装コンポーネントと通信するローカルコンポーネント(すなわち、API実装コンポーネントと同一のデータ処理システム上の)又はリモートコンポーネント(すなわち、API実装コンポーネントとは異なるデータ処理システム上の)である。API実装コンポーネントは、API呼び出しコンポーネントとしても動作し(すなわち、それは、異なるAPI実装コンポーネントにより示されたAPIに対するAPI呼び出しを実行し)、API呼び出しコンポーネントは、異なるAPI呼び出しコンポーネントに対して示されるAPIを実装することによりAPI実装コンポーネントとしても動作することが理解されるべきである。
APIは、種々のプログラミング言語で書かれた多数のAPI呼び出しコンポーネントがAPI実装コンポーネントと通信できるようにする(従って、APIは、API実装コンポーネントとAPI呼び出しコンポーネントとの間で呼び出し及び返送を変換する機能を含む)が、特定のプログラミング言語に関して実現される。1つの実施形態において、API呼び出しコンポーネントは、種々のプロバイダからのAPI、例えばOSプロバイダからのAPIの集合及びプラグインプロバイダからのAPIの集合、並びに別のプロバイダ(例えば、ソフトウェアライブラリのプロバイダ)からのAPIの別の集合又はAPIの別の集合のクリエータを呼び出す。
図11は、本発明のいくつかの実施形態において使用される例示的なAPIアーキテクチャを示すブロック図である。図11に示されるように、APIアーキテクチャ1100は、API1120を実装するAPI実装コンポーネント1110(例えば、オペレーティングシステム、ライブラリ、デバイスドライバ、API、アプリケーションプログラム、ソフトウェア又は他のモジュール)を含む。API1120は、API呼び出しコンポーネント1130により使用されるAPI実装コンポーネントの1つ以上の機能、方法、クラス、オブジェクト、プロトコル、データ構造、フォーマット及び/又は他の特徴を規定する。API1120は、API実装コンポーネントにおける機能がAPI呼び出しコンポーネントからパラメータを受信する方法及び機能がAPI呼び出しコンポーネントに結果を返送する方法を規定する少なくとも1つの呼び出し規約を規定する。API呼び出しコンポーネント1130(例えば、オペレーティングシステム、ライブラリ、デバイスドライバ、API、アプリケーションプログラム、ソフトウェア又は他のモジュール)は、API1120を介してAPI呼び出しを実行し、API1120により規定されるAPI実装コンポーネント1110の機能にアクセスし且つそれを使用する。API実装コンポーネント1110は、API呼び出しに応答してAPI1120を介してAPI呼び出しコンポーネント1130に値を返送する。
API実装コンポーネント1110は、API1120を介して規定されず且つAPI呼び出しコンポーネント1130に対して使用不可である更なる機能、方法、クラス、データ構造及び/又は他の特徴を含むことが理解されるだろう。API呼び出しコンポーネント1130は、API実装コンポーネント1110と同一のシステム上にあってもよいが、あるいはリモートで配置されてもよく且つネットワークを介してAPI1120を使用してAPI実装コンポーネント1110にアクセスすることが理解されるべきである。図11はAPI1120と対話する単一のAPI呼び出しコンポーネント1130を示すが、API呼び出しコンポーネント1130とは異なる言語(又は同一の言語)で書かれる他のAPI呼び出しコンポーネントはAPI1120を使用することが理解されるべきである。
API実装コンポーネント1110、API1120及びAPI呼び出しコンポーネント1130は、機械(例えば、コンピュータ又は他のデータ処理システム)により可読な有形形式で情報を格納するあらゆる機構を含む非一時的な機械可読記憶媒体に格納される。例えば機械可読媒体は、磁気ディスク、光ディスク、ランダムアクセスメモリ、読み出し専用メモリ、フラッシュメモリ素子等を含み、1つ以上のネットワークによりクライアント装置に結合されるローカル記憶媒体又はリモート装置上の記憶媒体である。
図10(「ソフトウェアスタック」において、例示的な一実施形態、アプリケーションは、いくつかのサービスAPIを使用するサービス1又はサービス2及びいくつかのOS APIを使用するオペレーティングシステム(OS)に対する呼び出しを実行する。サービス1及びサービス2は、いくつかのOS APIを使用してOSに対する呼び出しを実行する。
尚、サービス2は2つのAPIを有し、そのうちの一方(サービス2 API1)はアプリケーション1から呼び出しを受信し且つアプリケーション1に値を返送し、他方(サービス2 API2)はアプリケーション2から呼び出しを受信し且つアプリケーション2に値を返送する。サービス1(例えば、ソフトウェアライブラリである)は、OS API1に対する呼び出しを実行し且つOS API1から戻り値を受信し、サービス2(例えば、ソフトウェアライブラリである)は、OS API1及びOS API 2の双方に対する呼び出しを実行し且つOS API1及びOS API 2の双方から戻り値を受信する。アプリケーション2は、OS API2に対する呼び出しを実行し且つOS API2から戻り値を受信する。
明細書において「1つの実施形態」又は「一実施形態」を参照することは、実施形態と関連して説明された特定の機能、構造又は特徴が本発明の少なくとも1つの実施形態に含まれることを意味する。明細書の種々の箇所に「1つの実施形態において」というフレーズが示されることは、必ずしも同一の実施形態を全て参照することではない。
上述の明細書において、本発明の特定の例示的な実施形態を参照して本発明を説明した。以下の特許請求の範囲において説明されるような本発明のより広範な趣旨及び範囲から逸脱せずに、種々の変形が本発明に対して行われてもよいことが明らかとなるだろう。従って、明細書及び図面は、限定的な意味ではなく例示的な意味で考えられるべきである。
Claims (13)
- コンピュータで実行される方法であって、
データ処理システムのユーザからの音声入力を受信するステップと、
前記データ処理システムにおいて前記音声入力に対するコンテキストを判定するステップと、
音声認識システムを通じて前記音声入力におけるテキストを認識し、該テキストを認識することによりテキスト出力を生成するステップと、
それぞれが前記テキスト出力における単語を示す複数のトークンを有する構文解析されたデータ構造として前記テキスト出力を格納するステップと、
それぞれが前記テキスト出力における特定の種類の誤りを修正し、1つ以上のデータベースを検索してデータベースにおける1つ以上の項目と各トークンとの間のマッチングを識別し、インタプリタがテキスト出力におけるトークンを修正できるかを前記識別したマッチング及び前記コンテキストから判定するように設計される前記インタプリタの集合により各トークンを処理するステップと、
前記インタプリタの集合により生成された選択された結果をマージして前記テキスト出力の修正バージョンを示す修正された音声トランスクリプションを生成するステップと、
前記修正された音声トランスクリプションにおけるコマンドに基づいて、アプリケーションの集合の中で該コマンドを実行するように構成される選択されたアプリケーションに前記修正された音声トランスクリプションを提供するステップと
を含むことを特徴とする方法。 - 前記コンテキストは、前のユーザ入力の履歴を含み、
前記1つ以上のデータベースは、名前、アドレス及び電話番号のうちの少なくとも1つを格納する連絡先データベースを含むことを特徴とする請求項1に記載の方法。 - 前記コンテキストは、会話履歴を含み、
前記1つ以上のデータベースは、曲、タイトル及びアーティストのうちの少なくとも1つを格納するメディアデータベースを含み、
前記インタプリタの集合に含まれる前記インタプリタは、可能なマッチングを評価する場合に少なくとも2つの単語の文字列を使用することを特徴とする請求項1又は2に記載の方法。 - 前記インタプリタの集合に含まれる第1のインタプリタは、単語を修正するかを判定するために第1のアルゴリズムを使用し、
前記インタプリタの集合に含まれる第2のインタプリタは、単語を修正するかを判定するために第2のアルゴリズムを使用し、
前記第1のアルゴリズムは、前記第2のアルゴリズムとは異なることを特徴とする請求項1乃至3の何れか1項に記載の方法。 - 前記インタプリタの集合に含まれる第3のインタプリタは、1つ以上のデータベースを検索するために第3のアルゴリズムを使用し、
前記インタプリタの集合に含まれる第4のインタプリタは、1つ以上のデータベースを検索するために第4のアルゴリズムを使用し、
前記第3のアルゴリズムは、前記第4のアルゴリズムとは異なることを特徴とする請求項1乃至4の何れか1項に記載の方法。 - 前記インタプリタの集合に含まれる前記インタプリタは、コマンドの修正を禁止することを特徴とする請求項1乃至5の何れか1項に記載の方法。
- 前記選択された結果のマージは、前記インタプリタの集合から重複していない結果のみをマージし、
前記インタプリタの集合からの重複する結果は、ランク付けされた集合の中でランク付けされ、
前記ランク付けされた集合の1つの結果は、選択されて、前記修正された音声トランスクリプションにマージされることを特徴とする請求項1乃至6の何れか1項に記載の方法。 - 各インタプリタが修正するように設計される特定の種類の誤りは、前記インタプリタによって検索される前記1つ以上のデータベースにおける1つ以上のフィールドに基づいて判定されることを特徴とする請求項1乃至7の何れか1項に記載の方法。
- 前記インタプリタの集合は、前記1つ以上のデータベースを検索し、前記テキスト出力における1つ以上の単語を修正するかを判定する場合に該テキスト出力における単語を1つ以上のデータベースにおける1つ以上の項目と比較することを特徴とする請求項1乃至8の何れか1項に記載の方法。
- 文法パーサは、前記テキスト出力から前記コマンドを判定することを特徴とする請求項1乃至9の何れか1項に記載の方法。
- 前記アプリケーションの集合は、
(a)電話番号をダイヤルするために修正された音声トランスクリプションを使用する電話ダイヤラと、
(b)曲又は他のコンテンツを再生するメディアプレーヤと、
(c)テキストメッセージングアプリケーションと、
(d)電子メールアプリケーションと、
(e)カレンダアプリケーションと、
(f)ローカル検索アプリケーションと、
(g)テレビ会議アプリケーションと、
(h)人物又はオブジェクトの位置決めアプリケーションと
のうちの少なくとも2つを含むことを特徴とする請求項1乃至10の何れか1項に記載の方法。 - 請求項1乃至11の何れか1項に記載の方法の各ステップをデータ処理システムに実行させる、コンピュータで実行可能なプログラム命令を格納した、コンピュータで読取可能な記憶媒体。
- システムであって、
1つ以上のプロセッサと、
請求項1乃至11の何れか1項に記載の方法の各ステップを前記1つ以上のプロセッサに実行させる、コンピュータで実行可能なプログラム命令を格納したメモリと
を備えることを特徴とするシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/247,912 US8762156B2 (en) | 2011-09-28 | 2011-09-28 | Speech recognition repair using contextual information |
US13/247,912 | 2011-09-28 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014171991A Division JP2015018265A (ja) | 2011-09-28 | 2014-08-26 | コンテキスト情報を使用した音声認識修正 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013073240A true JP2013073240A (ja) | 2013-04-22 |
Family
ID=47048983
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012214570A Pending JP2013073240A (ja) | 2011-09-28 | 2012-09-27 | コンテキスト情報を使用した音声認識修正 |
JP2014171991A Pending JP2015018265A (ja) | 2011-09-28 | 2014-08-26 | コンテキスト情報を使用した音声認識修正 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014171991A Pending JP2015018265A (ja) | 2011-09-28 | 2014-08-26 | コンテキスト情報を使用した音声認識修正 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8762156B2 (ja) |
EP (1) | EP2587478A3 (ja) |
JP (2) | JP2013073240A (ja) |
KR (2) | KR101418163B1 (ja) |
CN (2) | CN105336326A (ja) |
AU (2) | AU2012227294B2 (ja) |
Cited By (132)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016534616A (ja) * | 2013-08-06 | 2016-11-04 | アップル インコーポレイテッド | リモート機器からの作動に基づくスマート応答の自動作動 |
US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
JP2018040904A (ja) * | 2016-09-06 | 2018-03-15 | トヨタ自動車株式会社 | 音声認識装置および音声認識方法 |
US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9971774B2 (en) | 2012-09-19 | 2018-05-15 | Apple Inc. | Voice-based media searching |
US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
WO2018135302A1 (ja) * | 2017-01-18 | 2018-07-26 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US10083690B2 (en) | 2014-05-30 | 2018-09-25 | Apple Inc. | Better resolution when referencing to concepts |
US10108612B2 (en) | 2008-07-31 | 2018-10-23 | Apple Inc. | Mobile device having human language translation capability with positional feedback |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10311871B2 (en) | 2015-03-08 | 2019-06-04 | Apple Inc. | Competing devices responding to voice triggers |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US10332518B2 (en) | 2017-05-09 | 2019-06-25 | Apple Inc. | User interface for correcting recognition errors |
US10354652B2 (en) | 2015-12-02 | 2019-07-16 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10356243B2 (en) | 2015-06-05 | 2019-07-16 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10381016B2 (en) | 2008-01-03 | 2019-08-13 | Apple Inc. | Methods and apparatus for altering audio output signals |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
JP2019144265A (ja) * | 2013-09-26 | 2019-08-29 | グーグル エルエルシー | 車両にナビゲーションデータを提供するためのシステムおよび方法 |
US10403283B1 (en) | 2018-06-01 | 2019-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10410637B2 (en) | 2017-05-12 | 2019-09-10 | Apple Inc. | User-specific acoustic models |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10417344B2 (en) | 2014-05-30 | 2019-09-17 | Apple Inc. | Exemplar-based natural language processing |
US10417405B2 (en) | 2011-03-21 | 2019-09-17 | Apple Inc. | Device access using voice authentication |
US10431204B2 (en) | 2014-09-11 | 2019-10-01 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10438595B2 (en) | 2014-09-30 | 2019-10-08 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10453443B2 (en) | 2014-09-30 | 2019-10-22 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10482874B2 (en) | 2017-05-15 | 2019-11-19 | Apple Inc. | Hierarchical belief states for digital assistants |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US10497365B2 (en) | 2014-05-30 | 2019-12-03 | Apple Inc. | Multi-command single utterance input method |
US10529332B2 (en) | 2015-03-08 | 2020-01-07 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US10580409B2 (en) | 2016-06-11 | 2020-03-03 | Apple Inc. | Application integration with a digital assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10643611B2 (en) | 2008-10-02 | 2020-05-05 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10657961B2 (en) | 2013-06-08 | 2020-05-19 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10684703B2 (en) | 2018-06-01 | 2020-06-16 | Apple Inc. | Attention aware virtual assistant dismissal |
US10699717B2 (en) | 2014-05-30 | 2020-06-30 | Apple Inc. | Intelligent assistant for home automation |
US10706841B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Task flow identification based on user intent |
US10714117B2 (en) | 2013-02-07 | 2020-07-14 | Apple Inc. | Voice trigger for a digital assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10741185B2 (en) | 2010-01-18 | 2020-08-11 | Apple Inc. | Intelligent automated assistant |
US10748546B2 (en) | 2017-05-16 | 2020-08-18 | Apple Inc. | Digital assistant services based on device capabilities |
US10755703B2 (en) | 2017-05-11 | 2020-08-25 | Apple Inc. | Offline personal assistant |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10769385B2 (en) | 2013-06-09 | 2020-09-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10789945B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Low-latency intelligent automated assistant |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10795541B2 (en) | 2009-06-05 | 2020-10-06 | Apple Inc. | Intelligent organization of tasks items |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US10867596B2 (en) | 2017-08-09 | 2020-12-15 | Lenovo (Singapore) Pte. Ltd. | Voice assistant system, server apparatus, device, voice assistant method therefor, and program to be executed by computer |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US10904611B2 (en) | 2014-06-30 | 2021-01-26 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10942703B2 (en) | 2015-12-23 | 2021-03-09 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10942702B2 (en) | 2016-06-11 | 2021-03-09 | Apple Inc. | Intelligent device arbitration and control |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
JP2021073567A (ja) * | 2018-04-11 | 2021-05-13 | 百度在線網絡技術(北京)有限公司 | 音声制御方法、端末機器、クラウドサーバ及びシステム |
US11010127B2 (en) | 2015-06-29 | 2021-05-18 | Apple Inc. | Virtual assistant for media playback |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US11023513B2 (en) | 2007-12-20 | 2021-06-01 | Apple Inc. | Method and apparatus for searching using an active ontology |
US11048473B2 (en) | 2013-06-09 | 2021-06-29 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US11070949B2 (en) | 2015-05-27 | 2021-07-20 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display |
US11069336B2 (en) | 2012-03-02 | 2021-07-20 | Apple Inc. | Systems and methods for name pronunciation |
US11069347B2 (en) | 2016-06-08 | 2021-07-20 | Apple Inc. | Intelligent automated assistant for media exploration |
US11080012B2 (en) | 2009-06-05 | 2021-08-03 | Apple Inc. | Interface for a virtual digital assistant |
US11120372B2 (en) | 2011-06-03 | 2021-09-14 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US11126400B2 (en) | 2015-09-08 | 2021-09-21 | Apple Inc. | Zero latency digital assistant |
US11127397B2 (en) | 2015-05-27 | 2021-09-21 | Apple Inc. | Device voice control |
US11133008B2 (en) | 2014-05-30 | 2021-09-28 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US11217251B2 (en) | 2019-05-06 | 2022-01-04 | Apple Inc. | Spoken notifications |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US11231904B2 (en) | 2015-03-06 | 2022-01-25 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US11237797B2 (en) | 2019-05-31 | 2022-02-01 | Apple Inc. | User activity shortcut suggestions |
US11269678B2 (en) | 2012-05-15 | 2022-03-08 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11314370B2 (en) | 2013-12-06 | 2022-04-26 | Apple Inc. | Method for extracting salient dialog usage from live data |
US11350253B2 (en) | 2011-06-03 | 2022-05-31 | Apple Inc. | Active transport based notifications |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US11388291B2 (en) | 2013-03-14 | 2022-07-12 | Apple Inc. | System and method for processing voicemail |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11468282B2 (en) | 2015-05-15 | 2022-10-11 | Apple Inc. | Virtual assistant in a communication session |
US11467802B2 (en) | 2017-05-11 | 2022-10-11 | Apple Inc. | Maintaining privacy of personal information |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11495218B2 (en) | 2018-06-01 | 2022-11-08 | Apple Inc. | Virtual assistant operation in multi-device environments |
US11500672B2 (en) | 2015-09-08 | 2022-11-15 | Apple Inc. | Distributed personal assistant |
US11526368B2 (en) | 2015-11-06 | 2022-12-13 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US11532306B2 (en) | 2017-05-16 | 2022-12-20 | Apple Inc. | Detecting a trigger of a digital assistant |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11657813B2 (en) | 2019-05-31 | 2023-05-23 | Apple Inc. | Voice identification in digital assistant systems |
US11671920B2 (en) | 2007-04-03 | 2023-06-06 | Apple Inc. | Method and system for operating a multifunction portable electronic device using voice-activation |
US11696060B2 (en) | 2020-07-21 | 2023-07-04 | Apple Inc. | User identification using headphones |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11765209B2 (en) | 2020-05-11 | 2023-09-19 | Apple Inc. | Digital assistant hardware abstraction |
US11790914B2 (en) | 2019-06-01 | 2023-10-17 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11798547B2 (en) | 2013-03-15 | 2023-10-24 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US11809483B2 (en) | 2015-09-08 | 2023-11-07 | Apple Inc. | Intelligent automated assistant for media search and playback |
US11838734B2 (en) | 2020-07-20 | 2023-12-05 | Apple Inc. | Multi-device audio adjustment coordination |
US11853536B2 (en) | 2015-09-08 | 2023-12-26 | Apple Inc. | Intelligent automated assistant in a media environment |
US11886805B2 (en) | 2015-11-09 | 2024-01-30 | Apple Inc. | Unconventional virtual assistant interactions |
US11914848B2 (en) | 2020-05-11 | 2024-02-27 | Apple Inc. | Providing relevant data items based on context |
Families Citing this family (237)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US6915262B2 (en) * | 2000-11-30 | 2005-07-05 | Telesector Resources Group, Inc. | Methods and apparatus for performing speech recognition and using speech recognition results |
US7693720B2 (en) | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
US10032452B1 (en) * | 2016-12-30 | 2018-07-24 | Google Llc | Multimodal transmission of packetized data |
US7640160B2 (en) | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US8073681B2 (en) * | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US10496753B2 (en) * | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8463053B1 (en) | 2008-08-08 | 2013-06-11 | The Research Foundation Of State University Of New York | Enhanced max margin learning on multimodal data mining in a multimedia database |
US9390167B2 (en) | 2010-07-29 | 2016-07-12 | Soundhound, Inc. | System and methods for continuous audio matching |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US9171541B2 (en) | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US9634855B2 (en) | 2010-05-13 | 2017-04-25 | Alexander Poltorak | Electronic personal interactive device that determines topics of interest using a conversational agent |
US9035163B1 (en) | 2011-05-10 | 2015-05-19 | Soundbound, Inc. | System and method for targeting content based on identified audio and multimedia |
DE102011079034A1 (de) | 2011-07-12 | 2013-01-17 | Siemens Aktiengesellschaft | Ansteuerung eines technischen Systems |
JP2013025299A (ja) * | 2011-07-26 | 2013-02-04 | Toshiba Corp | 書き起こし支援システムおよび書き起こし支援方法 |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8769624B2 (en) | 2011-09-29 | 2014-07-01 | Apple Inc. | Access control utilizing indirect authentication |
US9002322B2 (en) | 2011-09-29 | 2015-04-07 | Apple Inc. | Authentication with secondary approver |
US9620122B2 (en) * | 2011-12-08 | 2017-04-11 | Lenovo (Singapore) Pte. Ltd | Hybrid speech recognition |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US10255914B2 (en) | 2012-03-30 | 2019-04-09 | Michael Boukadakis | Digital concierge and method |
US9361878B2 (en) * | 2012-03-30 | 2016-06-07 | Michael Boukadakis | Computer-readable medium, system and method of providing domain-specific information |
US9483459B1 (en) * | 2012-03-31 | 2016-11-01 | Google Inc. | Natural language correction for speech input |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10776830B2 (en) | 2012-05-23 | 2020-09-15 | Google Llc | Methods and systems for identifying new computers and providing matching services |
US10152723B2 (en) | 2012-05-23 | 2018-12-11 | Google Llc | Methods and systems for identifying new computers and providing matching services |
KR20130135410A (ko) * | 2012-05-31 | 2013-12-11 | 삼성전자주식회사 | 음성 인식 기능을 제공하는 방법 및 그 전자 장치 |
JP5819261B2 (ja) * | 2012-06-19 | 2015-11-18 | 株式会社Nttドコモ | 機能実行指示システム、機能実行指示方法及び機能実行指示プログラム |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US10957310B1 (en) | 2012-07-23 | 2021-03-23 | Soundhound, Inc. | Integrated programming framework for speech and text understanding with meaning parsing |
US9031848B2 (en) | 2012-08-16 | 2015-05-12 | Nuance Communications, Inc. | User interface for searching a bundled service content data source |
US9106957B2 (en) * | 2012-08-16 | 2015-08-11 | Nuance Communications, Inc. | Method and apparatus for searching data sources for entertainment systems |
US9497515B2 (en) | 2012-08-16 | 2016-11-15 | Nuance Communications, Inc. | User interface for entertainment systems |
US8799959B2 (en) | 2012-08-16 | 2014-08-05 | Hoi L. Young | User interface for entertainment systems |
US9026448B2 (en) | 2012-08-16 | 2015-05-05 | Nuance Communications, Inc. | User interface for entertainment systems |
JP6068901B2 (ja) * | 2012-09-26 | 2017-01-25 | 京セラ株式会社 | 情報端末、音声操作プログラムおよび音声操作方法 |
US20140122084A1 (en) * | 2012-10-25 | 2014-05-01 | Nuance Communications, Inc. | Data Search Service |
WO2014209157A1 (en) | 2013-06-27 | 2014-12-31 | Obschestvo S Ogranichennoy Otvetstvennostiyu "Speaktoit" | Generating dialog recommendations for chat information systems |
US9171092B2 (en) * | 2012-12-07 | 2015-10-27 | Empire Technology Development Llc | Personal assistant context building |
CN103065630B (zh) * | 2012-12-28 | 2015-01-07 | 科大讯飞股份有限公司 | 用户个性化信息语音识别方法及系统 |
US10735552B2 (en) | 2013-01-31 | 2020-08-04 | Google Llc | Secondary transmissions of packetized data |
US10650066B2 (en) | 2013-01-31 | 2020-05-12 | Google Llc | Enhancing sitelinks with creative content |
WO2014143776A2 (en) | 2013-03-15 | 2014-09-18 | Bodhi Technology Ventures Llc | Providing remote interactions with host device using a wireless device |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
US9633317B2 (en) * | 2013-06-20 | 2017-04-25 | Viv Labs, Inc. | Dynamically evolving cognitive architecture system based on a natural language intent interpreter |
US9519461B2 (en) | 2013-06-20 | 2016-12-13 | Viv Labs, Inc. | Dynamically evolving cognitive architecture system based on third-party developers |
US9594542B2 (en) | 2013-06-20 | 2017-03-14 | Viv Labs, Inc. | Dynamically evolving cognitive architecture system based on training by third-party developers |
US10474961B2 (en) | 2013-06-20 | 2019-11-12 | Viv Labs, Inc. | Dynamically evolving cognitive architecture system based on prompting for additional user input |
CN103354089B (zh) * | 2013-06-25 | 2015-10-28 | 天津三星通信技术研究有限公司 | 一种语音通信管理方法及其装置 |
US20150058006A1 (en) * | 2013-08-23 | 2015-02-26 | Xerox Corporation | Phonetic alignment for user-agent dialogue recognition |
US9865255B2 (en) * | 2013-08-29 | 2018-01-09 | Panasonic Intellectual Property Corporation Of America | Speech recognition method and speech recognition apparatus |
US9361084B1 (en) | 2013-11-14 | 2016-06-07 | Google Inc. | Methods and systems for installing and executing applications |
US9507849B2 (en) | 2013-11-28 | 2016-11-29 | Soundhound, Inc. | Method for combining a query and a communication command in a natural language computer system |
US10811013B1 (en) * | 2013-12-20 | 2020-10-20 | Amazon Technologies, Inc. | Intent-specific automatic speech recognition result generation |
US11386886B2 (en) * | 2014-01-28 | 2022-07-12 | Lenovo (Singapore) Pte. Ltd. | Adjusting speech recognition using contextual information |
US9292488B2 (en) | 2014-02-01 | 2016-03-22 | Soundhound, Inc. | Method for embedding voice mail in a spoken utterance using a natural language processing computer system |
US11295730B1 (en) | 2014-02-27 | 2022-04-05 | Soundhound, Inc. | Using phonetic variants in a local context to improve natural language understanding |
CN103853463A (zh) * | 2014-02-27 | 2014-06-11 | 珠海多玩信息技术有限公司 | 语音操控方法及装置 |
US9959744B2 (en) | 2014-04-25 | 2018-05-01 | Motorola Solutions, Inc. | Method and system for providing alerts for radio communications |
KR102282487B1 (ko) * | 2014-05-08 | 2021-07-26 | 삼성전자주식회사 | 애플리케이션 실행 장치 및 방법 |
US9564123B1 (en) | 2014-05-12 | 2017-02-07 | Soundhound, Inc. | Method and system for building an integrated user profile |
US11343335B2 (en) | 2014-05-29 | 2022-05-24 | Apple Inc. | Message processing by subscriber app prior to message forwarding |
JP6328797B2 (ja) | 2014-05-30 | 2018-05-23 | アップル インコーポレイテッド | 1つのデバイスの使用から別のデバイスの使用への移行 |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9967401B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | User interface for phone call routing among devices |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
EP3158691A4 (en) | 2014-06-06 | 2018-03-28 | Obschestvo S Ogranichennoy Otvetstvennostiyu "Speactoit" | Proactive environment-based chat information system |
CN104966513B (zh) * | 2014-06-09 | 2018-09-04 | 腾讯科技(深圳)有限公司 | 语言命令处理方法和装置 |
US10659851B2 (en) * | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10339293B2 (en) | 2014-08-15 | 2019-07-02 | Apple Inc. | Authenticated device used to unlock another device |
CN105469789A (zh) * | 2014-08-15 | 2016-04-06 | 中兴通讯股份有限公司 | 一种语音信息的处理方法及终端 |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
KR20160027640A (ko) * | 2014-09-02 | 2016-03-10 | 삼성전자주식회사 | 전자 장치 및 전자 장치에서의 개체명 인식 방법 |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
CN107003996A (zh) | 2014-09-16 | 2017-08-01 | 声钰科技 | 语音商务 |
WO2016044321A1 (en) | 2014-09-16 | 2016-03-24 | Min Tang | Integration of domain information into state transitions of a finite state transducer for natural language processing |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
EP3201770B1 (en) * | 2014-09-30 | 2020-06-03 | Nuance Communications, Inc. | Methods and apparatus for module arbitration |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
CN107003999B (zh) | 2014-10-15 | 2020-08-21 | 声钰科技 | 对用户的在先自然语言输入的后续响应的系统和方法 |
US10203933B2 (en) | 2014-11-06 | 2019-02-12 | Microsoft Technology Licensing, Llc | Context-based command surfacing |
US9922098B2 (en) | 2014-11-06 | 2018-03-20 | Microsoft Technology Licensing, Llc | Context-based search and relevancy generation |
US9646611B2 (en) | 2014-11-06 | 2017-05-09 | Microsoft Technology Licensing, Llc | Context-based actions |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US10614799B2 (en) | 2014-11-26 | 2020-04-07 | Voicebox Technologies Corporation | System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
JP6348831B2 (ja) * | 2014-12-12 | 2018-06-27 | クラリオン株式会社 | 音声入力補助装置、音声入力補助システムおよび音声入力方法 |
US10147421B2 (en) | 2014-12-16 | 2018-12-04 | Microcoft Technology Licensing, Llc | Digital assistant voice input integration |
CN105869632A (zh) * | 2015-01-22 | 2016-08-17 | 北京三星通信技术研究有限公司 | 基于语音识别的文本修订方法和装置 |
WO2016117854A1 (ko) * | 2015-01-22 | 2016-07-28 | 삼성전자 주식회사 | 음성 신호를 기초로 한 텍스트 편집 장치 및 텍스트 편집 방법 |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9460713B1 (en) | 2015-03-30 | 2016-10-04 | Google Inc. | Language model biasing modulation |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US9472196B1 (en) | 2015-04-22 | 2016-10-18 | Google Inc. | Developer voice actions system |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US9576578B1 (en) * | 2015-08-12 | 2017-02-21 | Google Inc. | Contextual improvement of voice query recognition |
CN105183422B (zh) * | 2015-08-31 | 2018-06-05 | 百度在线网络技术(北京)有限公司 | 语音控制应用程序的方法和装置 |
KR102420518B1 (ko) * | 2015-09-09 | 2022-07-13 | 삼성전자주식회사 | 자연어 처리 시스템, 자연어 처리 장치, 자연어 처리 방법 및 컴퓨터 판독가능 기록매체 |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
CN105512182B (zh) * | 2015-11-25 | 2019-03-12 | 深圳Tcl数字技术有限公司 | 语音控制方法及智能电视 |
US20170177716A1 (en) * | 2015-12-22 | 2017-06-22 | Intel Corporation | Technologies for semantic interpretation of user input by a dialogue manager |
US10743101B2 (en) | 2016-02-22 | 2020-08-11 | Sonos, Inc. | Content mixing |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9922648B2 (en) * | 2016-03-01 | 2018-03-20 | Google Llc | Developer voice actions system |
CN107193389A (zh) * | 2016-03-14 | 2017-09-22 | 中兴通讯股份有限公司 | 一种实现输入的方法和装置 |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US10319371B2 (en) * | 2016-05-04 | 2019-06-11 | GM Global Technology Operations LLC | Disambiguation of vehicle speech commands |
KR102307976B1 (ko) | 2016-05-10 | 2021-09-30 | 구글 엘엘씨 | 디바이스들 상의 보이스 어시스턴트에 대한 구현들 |
CN108604254B (zh) | 2016-05-13 | 2022-04-12 | 谷歌有限责任公司 | 语音控制的隐藏字幕显示 |
JP6828741B2 (ja) * | 2016-05-16 | 2021-02-10 | ソニー株式会社 | 情報処理装置 |
DK179186B1 (en) | 2016-05-19 | 2018-01-15 | Apple Inc | REMOTE AUTHORIZATION TO CONTINUE WITH AN ACTION |
JP2017211430A (ja) | 2016-05-23 | 2017-11-30 | ソニー株式会社 | 情報処理装置および情報処理方法 |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670622A1 (en) | 2016-06-12 | 2018-02-12 | Apple Inc | User interfaces for transactions |
EP3270374A1 (en) * | 2016-07-13 | 2018-01-17 | Tata Consultancy Services Limited | Systems and methods for automatic repair of speech recognition engine output |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
WO2018023106A1 (en) | 2016-07-29 | 2018-02-01 | Erik SWART | System and method of disambiguating natural language processing requests |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10339925B1 (en) * | 2016-09-26 | 2019-07-02 | Amazon Technologies, Inc. | Generation of automated message responses |
US10217453B2 (en) * | 2016-10-14 | 2019-02-26 | Soundhound, Inc. | Virtual assistant configured by selection of wake-up phrase |
US9959864B1 (en) | 2016-10-27 | 2018-05-01 | Google Llc | Location-based voice query recognition |
US10276161B2 (en) * | 2016-12-27 | 2019-04-30 | Google Llc | Contextual hotwords |
US10593329B2 (en) | 2016-12-30 | 2020-03-17 | Google Llc | Multimodal transmission of packetized data |
US10708313B2 (en) | 2016-12-30 | 2020-07-07 | Google Llc | Multimodal transmission of packetized data |
US11100384B2 (en) | 2017-02-14 | 2021-08-24 | Microsoft Technology Licensing, Llc | Intelligent device user interactions |
US11010601B2 (en) | 2017-02-14 | 2021-05-18 | Microsoft Technology Licensing, Llc | Intelligent assistant device communicating non-verbal cues |
US10467509B2 (en) | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Computationally-efficient human-identifying smart assistant computer |
US10560656B2 (en) * | 2017-03-19 | 2020-02-11 | Apple Inc. | Media message creation with automatic titling |
KR102375800B1 (ko) | 2017-04-28 | 2022-03-17 | 삼성전자주식회사 | 음성 인식 서비스를 제공하는 전자 장치 및 그 방법 |
US10992795B2 (en) | 2017-05-16 | 2021-04-27 | Apple Inc. | Methods and interfaces for home media control |
US11431836B2 (en) | 2017-05-02 | 2022-08-30 | Apple Inc. | Methods and interfaces for initiating media playback |
US11436417B2 (en) * | 2017-05-15 | 2022-09-06 | Google Llc | Providing access to user-controlled resources by automated assistants |
CN111343060B (zh) | 2017-05-16 | 2022-02-11 | 苹果公司 | 用于家庭媒体控制的方法和界面 |
US20220279063A1 (en) | 2017-05-16 | 2022-09-01 | Apple Inc. | Methods and interfaces for home media control |
US11340925B2 (en) | 2017-05-18 | 2022-05-24 | Peloton Interactive Inc. | Action recipes for a crowdsourced digital assistant system |
US11043206B2 (en) | 2017-05-18 | 2021-06-22 | Aiqudo, Inc. | Systems and methods for crowdsourced actions and commands |
US11056105B2 (en) | 2017-05-18 | 2021-07-06 | Aiqudo, Inc | Talk back from actions in applications |
EP3635578A4 (en) * | 2017-05-18 | 2021-08-25 | Aiqudo, Inc. | SYSTEMS AND PROCEDURES FOR CRWODSOURCING ACTIONS AND COMMANDS |
CN107393544B (zh) * | 2017-06-19 | 2019-03-05 | 维沃移动通信有限公司 | 一种语音信号修复方法及移动终端 |
US10607606B2 (en) | 2017-06-19 | 2020-03-31 | Lenovo (Singapore) Pte. Ltd. | Systems and methods for execution of digital assistant |
US20190354557A1 (en) * | 2017-06-20 | 2019-11-21 | Tom Kornblit | System and Method For Providing Intelligent Customer Service |
KR102383430B1 (ko) * | 2017-06-21 | 2022-04-07 | 현대자동차주식회사 | 고속 음성 파일 처리 장치, 그를 포함한 시스템 및 그 방법 |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10719507B2 (en) * | 2017-09-21 | 2020-07-21 | SayMosaic Inc. | System and method for natural language processing |
US10452695B2 (en) * | 2017-09-22 | 2019-10-22 | Oracle International Corporation | Context-based virtual assistant implementation |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US10599645B2 (en) * | 2017-10-06 | 2020-03-24 | Soundhound, Inc. | Bidirectional probabilistic natural language rewriting and selection |
KR102445779B1 (ko) * | 2017-11-07 | 2022-09-21 | 주식회사 엘지유플러스 | 대화형 서비스 장치 및 대화형 서비스 장치의 제어 방법 |
US20190146491A1 (en) * | 2017-11-10 | 2019-05-16 | GM Global Technology Operations LLC | In-vehicle system to communicate with passengers |
US10922357B1 (en) | 2017-12-07 | 2021-02-16 | Amazon Technologies, Inc. | Automatically mapping natural language commands to service APIs |
CN110021295B (zh) * | 2018-01-07 | 2023-12-08 | 国际商业机器公司 | 用于识别由语音识别系统生成的错误转录的方法和系统 |
US11410075B2 (en) | 2018-01-15 | 2022-08-09 | Microsoft Technology Licensing, Llc | Contextually-aware recommendations for assisting users with task completion |
US10313514B1 (en) | 2018-02-21 | 2019-06-04 | Plantronics, Inc. | Device registry for mediating communication sessions |
US10777217B2 (en) * | 2018-02-27 | 2020-09-15 | At&T Intellectual Property I, L.P. | Performance sensitive audio signal selection |
WO2019168208A1 (ko) * | 2018-02-27 | 2019-09-06 | 엘지전자 주식회사 | 이동 단말기 및 그 제어 방법 |
CN111819626A (zh) * | 2018-03-07 | 2020-10-23 | 华为技术有限公司 | 一种语音交互的方法及装置 |
KR102617265B1 (ko) | 2018-03-13 | 2023-12-26 | 삼성전자주식회사 | 사용자 음성 입력을 처리하는 장치 |
CN108520760B (zh) * | 2018-03-27 | 2020-07-24 | 维沃移动通信有限公司 | 一种语音信号处理方法及终端 |
CN112055857A (zh) * | 2018-05-02 | 2020-12-08 | 三星电子株式会社 | 上下文推荐 |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
CN108922537B (zh) * | 2018-05-28 | 2021-05-18 | Oppo广东移动通信有限公司 | 音频识别方法、装置、终端、耳机及可读存储介质 |
US10811009B2 (en) * | 2018-06-27 | 2020-10-20 | International Business Machines Corporation | Automatic skill routing in conversational computing frameworks |
CN108806688A (zh) * | 2018-07-16 | 2018-11-13 | 深圳Tcl数字技术有限公司 | 智能电视的语音控制方法、智能电视、系统及存储介质 |
EP3682345B1 (en) | 2018-08-07 | 2021-11-24 | Google LLC | Assembling and evaluating automated assistant responses for privacy concerns |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) * | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10325597B1 (en) | 2018-10-08 | 2019-06-18 | Sorenson Ip Holdings, Llc | Transcription of communications |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
CN109068011A (zh) * | 2018-11-09 | 2018-12-21 | 长沙龙生光启新材料科技有限公司 | 一种智能移动终端及其控制方法 |
US10777186B1 (en) * | 2018-11-13 | 2020-09-15 | Amazon Technolgies, Inc. | Streaming real-time automatic speech recognition service |
US10573312B1 (en) | 2018-12-04 | 2020-02-25 | Sorenson Ip Holdings, Llc | Transcription generation from multiple speech recognition systems |
US10388272B1 (en) | 2018-12-04 | 2019-08-20 | Sorenson Ip Holdings, Llc | Training speech recognition systems using word sequences |
US11017778B1 (en) | 2018-12-04 | 2021-05-25 | Sorenson Ip Holdings, Llc | Switching between speech recognition systems |
US11170761B2 (en) | 2018-12-04 | 2021-11-09 | Sorenson Ip Holdings, Llc | Training of speech recognition systems |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
CN109410923B (zh) * | 2018-12-26 | 2022-06-10 | 中国联合网络通信集团有限公司 | 语音识别方法、装置、系统及存储介质 |
US11955120B1 (en) * | 2019-01-31 | 2024-04-09 | Alan AI, Inc. | Systems and methods for integrating voice controls into applications |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
KR20240049648A (ko) | 2019-05-31 | 2024-04-16 | 애플 인크. | 오디오 미디어 제어를 위한 사용자 인터페이스 |
US11010121B2 (en) | 2019-05-31 | 2021-05-18 | Apple Inc. | User interfaces for audio media control |
US11477609B2 (en) | 2019-06-01 | 2022-10-18 | Apple Inc. | User interfaces for location-related communications |
US11481094B2 (en) | 2019-06-01 | 2022-10-25 | Apple Inc. | User interfaces for location-related communications |
CN112086096B (zh) * | 2019-06-14 | 2024-04-05 | 北京京东尚科信息技术有限公司 | 数据处理方法、装置、系统、介质 |
CN112242142B (zh) * | 2019-07-17 | 2024-01-30 | 北京搜狗科技发展有限公司 | 一种语音识别输入的方法及相关装置 |
KR20210042520A (ko) * | 2019-10-10 | 2021-04-20 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
CN111143535B (zh) * | 2019-12-27 | 2021-08-10 | 北京百度网讯科技有限公司 | 用于生成对话模型的方法和装置 |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
WO2021183681A1 (en) * | 2020-03-10 | 2021-09-16 | MeetKai, Inc. | Parallel hypothetical reasoning to power a multi-lingual, multi-turn, multi-domain virtual assistant |
KR20210130465A (ko) * | 2020-04-22 | 2021-11-01 | 현대자동차주식회사 | 대화 시스템 및 그 제어 방법 |
US11810578B2 (en) | 2020-05-11 | 2023-11-07 | Apple Inc. | Device arbitration for digital assistant-based intercom systems |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
CN111863009B (zh) * | 2020-07-15 | 2022-07-26 | 思必驰科技股份有限公司 | 上下文信息预测模型的训练方法及系统 |
CN111883105B (zh) * | 2020-07-15 | 2022-05-10 | 思必驰科技股份有限公司 | 用于视频场景的上下文信息预测模型的训练方法及系统 |
US11488604B2 (en) | 2020-08-19 | 2022-11-01 | Sorenson Ip Holdings, Llc | Transcription of audio |
US11829720B2 (en) | 2020-09-01 | 2023-11-28 | Apple Inc. | Analysis and validation of language models |
US11527237B1 (en) * | 2020-09-18 | 2022-12-13 | Amazon Technologies, Inc. | User-system dialog expansion |
US11392291B2 (en) | 2020-09-25 | 2022-07-19 | Apple Inc. | Methods and interfaces for media control with dynamic feedback |
US11967306B2 (en) | 2021-04-14 | 2024-04-23 | Honeywell International Inc. | Contextual speech recognition methods and systems |
US11847378B2 (en) | 2021-06-06 | 2023-12-19 | Apple Inc. | User interfaces for audio routing |
US20230117535A1 (en) * | 2021-10-15 | 2023-04-20 | Samsung Electronics Co., Ltd. | Method and system for device feature analysis to improve user experience |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0863330A (ja) * | 1994-08-17 | 1996-03-08 | Fujitsu Ltd | 音声入力装置 |
JP2004534268A (ja) * | 2001-06-27 | 2004-11-11 | テレローグ,インコーポレイティド | 自動アテンダントによって使用される情報を前処理するシステムと方法 |
JP2005181386A (ja) * | 2003-12-16 | 2005-07-07 | Mitsubishi Electric Corp | 音声対話処理装置及び音声対話処理方法並びにプログラム |
JP2008097003A (ja) * | 2006-10-12 | 2008-04-24 | Qnx Software Systems (Wavemakers) Inc | 自動音声認識システムに対する適応コンテキスト |
JP2010535377A (ja) * | 2007-08-01 | 2010-11-18 | ジンジャー ソフトウェア、インコーポレイティッド | インターネットコーパスを用いた、文脈依存言語の自動的な修正および改善 |
WO2011093025A1 (ja) * | 2010-01-29 | 2011-08-04 | 日本電気株式会社 | 入力支援システム、方法、およびプログラム |
Family Cites Families (600)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3828132A (en) | 1970-10-30 | 1974-08-06 | Bell Telephone Labor Inc | Speech synthesis by concatenation of formant encoded words |
US3704345A (en) | 1971-03-19 | 1972-11-28 | Bell Telephone Labor Inc | Conversion of printed text into synthetic speech |
US3979557A (en) | 1974-07-03 | 1976-09-07 | International Telephone And Telegraph Corporation | Speech processor system for pitch period extraction using prediction filters |
BG24190A1 (en) | 1976-09-08 | 1978-01-10 | Antonov | Method of synthesis of speech and device for effecting same |
JPS597120B2 (ja) | 1978-11-24 | 1984-02-16 | 日本電気株式会社 | 音声分析装置 |
US4310721A (en) | 1980-01-23 | 1982-01-12 | The United States Of America As Represented By The Secretary Of The Army | Half duplex integral vocoder modem system |
US4348553A (en) | 1980-07-02 | 1982-09-07 | International Business Machines Corporation | Parallel pattern verifier with dynamic time warping |
DE3382806T2 (de) | 1982-06-11 | 1996-11-14 | Mitsubishi Electric Corp | Vektorquantisierer |
US4688195A (en) | 1983-01-28 | 1987-08-18 | Texas Instruments Incorporated | Natural-language interface generating system |
JPS603056A (ja) | 1983-06-21 | 1985-01-09 | Toshiba Corp | 情報整理装置 |
DE3335358A1 (de) | 1983-09-29 | 1985-04-11 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zur bestimmung von sprachspektren fuer die automatische spracherkennung und sprachcodierung |
US5164900A (en) | 1983-11-14 | 1992-11-17 | Colman Bernath | Method and device for phonetically encoding Chinese textual data for data processing entry |
US4726065A (en) | 1984-01-26 | 1988-02-16 | Horst Froessl | Image manipulation by speech signals |
US4955047A (en) | 1984-03-26 | 1990-09-04 | Dytel Corporation | Automated attendant with direct inward system access |
US4811243A (en) | 1984-04-06 | 1989-03-07 | Racine Marsh V | Computer aided coordinate digitizing system |
US4692941A (en) | 1984-04-10 | 1987-09-08 | First Byte | Real-time text-to-speech conversion system |
US4783807A (en) | 1984-08-27 | 1988-11-08 | John Marley | System and method for sound recognition with feature selection synchronized to voice pitch |
US4718094A (en) | 1984-11-19 | 1988-01-05 | International Business Machines Corp. | Speech recognition system |
US5165007A (en) | 1985-02-01 | 1992-11-17 | International Business Machines Corporation | Feneme-based Markov models for words |
US4944013A (en) | 1985-04-03 | 1990-07-24 | British Telecommunications Public Limited Company | Multi-pulse speech coder |
US4833712A (en) | 1985-05-29 | 1989-05-23 | International Business Machines Corporation | Automatic generation of simple Markov model stunted baseforms for words in a vocabulary |
US4819271A (en) | 1985-05-29 | 1989-04-04 | International Business Machines Corporation | Constructing Markov model word baseforms from multiple utterances by concatenating model sequences for word segments |
EP0218859A3 (en) | 1985-10-11 | 1989-09-06 | International Business Machines Corporation | Signal processor communication interface |
US4776016A (en) | 1985-11-21 | 1988-10-04 | Position Orientation Systems, Inc. | Voice control system |
JPH0833744B2 (ja) | 1986-01-09 | 1996-03-29 | 株式会社東芝 | 音声合成装置 |
US4724542A (en) | 1986-01-22 | 1988-02-09 | International Business Machines Corporation | Automatic reference adaptation during dynamic signature verification |
US5057915A (en) | 1986-03-10 | 1991-10-15 | Kohorn H Von | System and method for attracting shoppers to sales outlets |
US5759101A (en) | 1986-03-10 | 1998-06-02 | Response Reward Systems L.C. | Central and remote evaluation of responses of participatory broadcast audience with automatic crediting and couponing |
US5032989A (en) | 1986-03-19 | 1991-07-16 | Realpro, Ltd. | Real estate search and location system and method |
DE3779351D1 (ja) | 1986-03-28 | 1992-07-02 | American Telephone And Telegraph Co., New York, N.Y., Us | |
US4903305A (en) | 1986-05-12 | 1990-02-20 | Dragon Systems, Inc. | Method for representing word models for use in speech recognition |
WO1988002516A1 (en) | 1986-10-03 | 1988-04-07 | British Telecommunications Public Limited Company | Language translation system |
AU592236B2 (en) | 1986-10-16 | 1990-01-04 | Mitsubishi Denki Kabushiki Kaisha | Amplitude-adapted vector quantizer |
US4829576A (en) | 1986-10-21 | 1989-05-09 | Dragon Systems, Inc. | Voice recognition system |
US4852168A (en) | 1986-11-18 | 1989-07-25 | Sprague Richard P | Compression of stored waveforms for artificial speech |
US4727354A (en) | 1987-01-07 | 1988-02-23 | Unisys Corporation | System for selecting best fit vector code in vector quantization encoding |
US4827520A (en) | 1987-01-16 | 1989-05-02 | Prince Corporation | Voice actuated control system for use in a vehicle |
US4965763A (en) | 1987-03-03 | 1990-10-23 | International Business Machines Corporation | Computer method for automatic extraction of commonly specified information from business correspondence |
US5644727A (en) | 1987-04-15 | 1997-07-01 | Proprietary Financial Products, Inc. | System for the operation and management of one or more financial accounts through the use of a digital communication and computation system for exchange, investment and borrowing |
EP0293259A3 (en) | 1987-05-29 | 1990-03-07 | Kabushiki Kaisha Toshiba | Voice recognition system used in telephone apparatus |
DE3723078A1 (de) | 1987-07-11 | 1989-01-19 | Philips Patentverwaltung | Verfahren zur erkennung von zusammenhaengend gesprochenen woertern |
US4974191A (en) | 1987-07-31 | 1990-11-27 | Syntellect Software Inc. | Adaptive natural language computer interface system |
CA1288516C (en) | 1987-07-31 | 1991-09-03 | Leendert M. Bijnagte | Apparatus and method for communicating textual and image information between a host computer and a remote display terminal |
US5022081A (en) | 1987-10-01 | 1991-06-04 | Sharp Kabushiki Kaisha | Information recognition system |
US4852173A (en) | 1987-10-29 | 1989-07-25 | International Business Machines Corporation | Design and construction of a binary-tree system for language modelling |
DE3876379T2 (de) | 1987-10-30 | 1993-06-09 | Ibm | Automatische bestimmung von kennzeichen und markov-wortmodellen in einem spracherkennungssystem. |
US5072452A (en) | 1987-10-30 | 1991-12-10 | International Business Machines Corporation | Automatic determination of labels and Markov word models in a speech recognition system |
US4914586A (en) | 1987-11-06 | 1990-04-03 | Xerox Corporation | Garbage collector for hypermedia systems |
US4992972A (en) | 1987-11-18 | 1991-02-12 | International Business Machines Corporation | Flexible context searchable on-line information system with help files and modules for on-line computer system documentation |
US5220657A (en) | 1987-12-02 | 1993-06-15 | Xerox Corporation | Updating local copy of shared data in a collaborative system |
US4984177A (en) | 1988-02-05 | 1991-01-08 | Advanced Products And Technologies, Inc. | Voice language translator |
CA1333420C (en) | 1988-02-29 | 1994-12-06 | Tokumichi Murakami | Vector quantizer |
US4914590A (en) | 1988-05-18 | 1990-04-03 | Emhart Industries, Inc. | Natural language understanding system |
FR2636163B1 (fr) | 1988-09-02 | 1991-07-05 | Hamon Christian | Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde |
US4839853A (en) | 1988-09-15 | 1989-06-13 | Bell Communications Research, Inc. | Computer information retrieval using latent semantic structure |
JPH0293597A (ja) | 1988-09-30 | 1990-04-04 | Nippon I B M Kk | 音声認識装置 |
US4905163A (en) | 1988-10-03 | 1990-02-27 | Minnesota Mining & Manufacturing Company | Intelligent optical navigator dynamic information presentation and navigation system |
US5282265A (en) | 1988-10-04 | 1994-01-25 | Canon Kabushiki Kaisha | Knowledge information processing system |
DE3837590A1 (de) | 1988-11-05 | 1990-05-10 | Ant Nachrichtentech | Verfahren zum reduzieren der datenrate von digitalen bilddaten |
ATE102731T1 (de) | 1988-11-23 | 1994-03-15 | Digital Equipment Corp | Namenaussprache durch einen synthetisator. |
US5027406A (en) | 1988-12-06 | 1991-06-25 | Dragon Systems, Inc. | Method for interactive speech recognition and training |
US5127055A (en) | 1988-12-30 | 1992-06-30 | Kurzweil Applied Intelligence, Inc. | Speech recognition apparatus & method having dynamic reference pattern adaptation |
US5293448A (en) | 1989-10-02 | 1994-03-08 | Nippon Telegraph And Telephone Corporation | Speech analysis-synthesis method and apparatus therefor |
US5047614A (en) | 1989-01-23 | 1991-09-10 | Bianco James S | Method and apparatus for computer-aided shopping |
SE466029B (sv) | 1989-03-06 | 1991-12-02 | Ibm Svenska Ab | Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem |
JPH0782544B2 (ja) | 1989-03-24 | 1995-09-06 | インターナショナル・ビジネス・マシーンズ・コーポレーション | マルチテンプレートを用いるdpマツチング方法及び装置 |
US4977598A (en) | 1989-04-13 | 1990-12-11 | Texas Instruments Incorporated | Efficient pruning algorithm for hidden markov model speech recognition |
US5197005A (en) | 1989-05-01 | 1993-03-23 | Intelligent Business Systems | Database retrieval system having a natural language interface |
US5010574A (en) | 1989-06-13 | 1991-04-23 | At&T Bell Laboratories | Vector quantizer search arrangement |
JP2940005B2 (ja) | 1989-07-20 | 1999-08-25 | 日本電気株式会社 | 音声符号化装置 |
US5091945A (en) | 1989-09-28 | 1992-02-25 | At&T Bell Laboratories | Source dependent channel coding with error protection |
CA2027705C (en) | 1989-10-17 | 1994-02-15 | Masami Akamine | Speech coding system utilizing a recursive computation technique for improvement in processing speed |
US5020112A (en) | 1989-10-31 | 1991-05-28 | At&T Bell Laboratories | Image recognition method using two-dimensional stochastic grammars |
US5220639A (en) | 1989-12-01 | 1993-06-15 | National Science Council | Mandarin speech input method for Chinese computers and a mandarin speech recognition machine |
US5021971A (en) | 1989-12-07 | 1991-06-04 | Unisys Corporation | Reflective binary encoder for vector quantization |
US5179652A (en) | 1989-12-13 | 1993-01-12 | Anthony I. Rozmanith | Method and apparatus for storing, transmitting and retrieving graphical and tabular data |
CH681573A5 (en) | 1990-02-13 | 1993-04-15 | Astral | Automatic teller arrangement involving bank computers - is operated by user data card carrying personal data, account information and transaction records |
EP0443548B1 (en) | 1990-02-22 | 2003-07-23 | Nec Corporation | Speech coder |
US5301109A (en) | 1990-06-11 | 1994-04-05 | Bell Communications Research, Inc. | Computerized cross-language document retrieval using latent semantic indexing |
JP3266246B2 (ja) | 1990-06-15 | 2002-03-18 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 |
US5202952A (en) | 1990-06-22 | 1993-04-13 | Dragon Systems, Inc. | Large-vocabulary continuous speech prefiltering and processing system |
GB9017600D0 (en) | 1990-08-10 | 1990-09-26 | British Aerospace | An assembly and method for binary tree-searched vector quanisation data compression processing |
US5309359A (en) | 1990-08-16 | 1994-05-03 | Boris Katz | Method and apparatus for generating and utlizing annotations to facilitate computer text retrieval |
US5404295A (en) | 1990-08-16 | 1995-04-04 | Katz; Boris | Method and apparatus for utilizing annotations to facilitate computer retrieval of database material |
US5297170A (en) | 1990-08-21 | 1994-03-22 | Codex Corporation | Lattice and trellis-coded quantization |
US5400434A (en) | 1990-09-04 | 1995-03-21 | Matsushita Electric Industrial Co., Ltd. | Voice source for synthetic speech system |
US5216747A (en) | 1990-09-20 | 1993-06-01 | Digital Voice Systems, Inc. | Voiced/unvoiced estimation of an acoustic signal |
US5128672A (en) | 1990-10-30 | 1992-07-07 | Apple Computer, Inc. | Dynamic predictive keyboard |
US5317507A (en) | 1990-11-07 | 1994-05-31 | Gallant Stephen I | Method for document retrieval and for word sense disambiguation using neural networks |
US5325298A (en) | 1990-11-07 | 1994-06-28 | Hnc, Inc. | Methods for generating or revising context vectors for a plurality of word stems |
US5247579A (en) | 1990-12-05 | 1993-09-21 | Digital Voice Systems, Inc. | Methods for speech transmission |
US5345536A (en) | 1990-12-21 | 1994-09-06 | Matsushita Electric Industrial Co., Ltd. | Method of speech recognition |
US5127053A (en) | 1990-12-24 | 1992-06-30 | General Electric Company | Low-complexity method for improving the performance of autocorrelation-based pitch detectors |
US5133011A (en) | 1990-12-26 | 1992-07-21 | International Business Machines Corporation | Method and apparatus for linear vocal control of cursor position |
US5268990A (en) | 1991-01-31 | 1993-12-07 | Sri International | Method for recognizing speech using linguistically-motivated hidden Markov models |
GB9105367D0 (en) | 1991-03-13 | 1991-04-24 | Univ Strathclyde | Computerised information-retrieval database systems |
US5303406A (en) | 1991-04-29 | 1994-04-12 | Motorola, Inc. | Noise squelch circuit with adaptive noise shaping |
US5475587A (en) | 1991-06-28 | 1995-12-12 | Digital Equipment Corporation | Method and apparatus for efficient morphological text analysis using a high-level language for compact specification of inflectional paradigms |
US5293452A (en) | 1991-07-01 | 1994-03-08 | Texas Instruments Incorporated | Voice log-in using spoken name input |
US5687077A (en) | 1991-07-31 | 1997-11-11 | Universal Dynamics Limited | Method and apparatus for adaptive control |
US5199077A (en) | 1991-09-19 | 1993-03-30 | Xerox Corporation | Wordspotting for voice editing and indexing |
JP2662120B2 (ja) | 1991-10-01 | 1997-10-08 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声認識装置および音声認識用処理ユニット |
US5222146A (en) | 1991-10-23 | 1993-06-22 | International Business Machines Corporation | Speech recognition apparatus having a speech coder outputting acoustic prototype ranks |
KR940002854B1 (ko) | 1991-11-06 | 1994-04-04 | 한국전기통신공사 | 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치 |
US5386494A (en) | 1991-12-06 | 1995-01-31 | Apple Computer, Inc. | Method and apparatus for controlling a speech recognition function using a cursor control device |
US5903454A (en) | 1991-12-23 | 1999-05-11 | Hoffberg; Linda Irene | Human-factored interface corporating adaptive pattern recognition based controller apparatus |
US6081750A (en) | 1991-12-23 | 2000-06-27 | Hoffberg; Steven Mark | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
US5502790A (en) | 1991-12-24 | 1996-03-26 | Oki Electric Industry Co., Ltd. | Speech recognition method and system using triphones, diphones, and phonemes |
US5349645A (en) | 1991-12-31 | 1994-09-20 | Matsushita Electric Industrial Co., Ltd. | Word hypothesizer for continuous speech decoding using stressed-vowel centered bidirectional tree searches |
US5267345A (en) | 1992-02-10 | 1993-11-30 | International Business Machines Corporation | Speech recognition apparatus which predicts word classes from context and words from word classes |
EP0559349B1 (en) | 1992-03-02 | 1999-01-07 | AT&T Corp. | Training method and apparatus for speech recognition |
US6055514A (en) | 1992-03-20 | 2000-04-25 | Wren; Stephen Corey | System for marketing foods and services utilizing computerized centraland remote facilities |
US5317647A (en) | 1992-04-07 | 1994-05-31 | Apple Computer, Inc. | Constrained attribute grammars for syntactic pattern recognition |
US5412804A (en) | 1992-04-30 | 1995-05-02 | Oracle Corporation | Extending the semantics of the outer join operator for un-nesting queries to a data base |
US5293584A (en) | 1992-05-21 | 1994-03-08 | International Business Machines Corporation | Speech recognition system for natural language translation |
US5390281A (en) | 1992-05-27 | 1995-02-14 | Apple Computer, Inc. | Method and apparatus for deducing user intent and providing computer implemented services |
US5434777A (en) | 1992-05-27 | 1995-07-18 | Apple Computer, Inc. | Method and apparatus for processing natural language |
US5734789A (en) | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US5333275A (en) | 1992-06-23 | 1994-07-26 | Wheatley Barbara J | System and method for time aligning speech |
US5325297A (en) | 1992-06-25 | 1994-06-28 | System Of Multiple-Colored Images For Internationally Listed Estates, Inc. | Computer implemented method and system for storing and retrieving textual data and compressed image data |
US5999908A (en) | 1992-08-06 | 1999-12-07 | Abelow; Daniel H. | Customer-based product design module |
US5412806A (en) | 1992-08-20 | 1995-05-02 | Hewlett-Packard Company | Calibration of logical cost formulae for queries in a heterogeneous DBMS using synthetic database |
GB9220404D0 (en) | 1992-08-20 | 1992-11-11 | Nat Security Agency | Method of identifying,retrieving and sorting documents |
US5333236A (en) | 1992-09-10 | 1994-07-26 | International Business Machines Corporation | Speech recognizer having a speech coder for an acoustic match based on context-dependent speech-transition acoustic models |
US5384893A (en) | 1992-09-23 | 1995-01-24 | Emerson & Stern Associates, Inc. | Method and apparatus for speech synthesis based on prosodic analysis |
FR2696036B1 (fr) | 1992-09-24 | 1994-10-14 | France Telecom | Procédé de mesure de ressemblance entre échantillons sonores et dispositif de mise en Óoeuvre de ce procédé. |
JPH0772840B2 (ja) | 1992-09-29 | 1995-08-02 | 日本アイ・ビー・エム株式会社 | 音声モデルの構成方法、音声認識方法、音声認識装置及び音声モデルの訓練方法 |
US5758313A (en) | 1992-10-16 | 1998-05-26 | Mobile Information Systems, Inc. | Method and apparatus for tracking vehicle location |
US6092043A (en) * | 1992-11-13 | 2000-07-18 | Dragon Systems, Inc. | Apparatuses and method for training and operating speech recognition systems |
US5909666A (en) * | 1992-11-13 | 1999-06-01 | Dragon Systems, Inc. | Speech recognition system which creates acoustic models by concatenating acoustic models of individual words |
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
US5412756A (en) | 1992-12-22 | 1995-05-02 | Mitsubishi Denki Kabushiki Kaisha | Artificial intelligence software shell for plant operation simulation |
US5390279A (en) | 1992-12-31 | 1995-02-14 | Apple Computer, Inc. | Partitioning speech rules by context for speech recognition |
US5384892A (en) | 1992-12-31 | 1995-01-24 | Apple Computer, Inc. | Dynamic language model for speech recognition |
US5613036A (en) | 1992-12-31 | 1997-03-18 | Apple Computer, Inc. | Dynamic categories for a speech recognition system |
US5734791A (en) | 1992-12-31 | 1998-03-31 | Apple Computer, Inc. | Rapid tree-based method for vector quantization |
US6311157B1 (en) | 1992-12-31 | 2001-10-30 | Apple Computer, Inc. | Assigning meanings to utterances in a speech recognition system |
US6122616A (en) | 1993-01-21 | 2000-09-19 | Apple Computer, Inc. | Method and apparatus for diphone aliasing |
US5864844A (en) | 1993-02-18 | 1999-01-26 | Apple Computer, Inc. | System and method for enhancing a user interface with a computer based training tool |
CA2091658A1 (en) | 1993-03-15 | 1994-09-16 | Matthew Lennig | Method and apparatus for automation of directory assistance using speech recognition |
US6055531A (en) | 1993-03-24 | 2000-04-25 | Engate Incorporated | Down-line transcription system having context sensitive searching capability |
US5536902A (en) | 1993-04-14 | 1996-07-16 | Yamaha Corporation | Method of and apparatus for analyzing and synthesizing a sound by extracting and controlling a sound parameter |
US5444823A (en) | 1993-04-16 | 1995-08-22 | Compaq Computer Corporation | Intelligent search engine for associated on-line documentation having questionless case-based knowledge base |
US5574823A (en) | 1993-06-23 | 1996-11-12 | Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Communications | Frequency selective harmonic coding |
US5515475A (en) | 1993-06-24 | 1996-05-07 | Northern Telecom Limited | Speech recognition method using a two-pass search |
JPH0756933A (ja) | 1993-06-24 | 1995-03-03 | Xerox Corp | 文書検索方法 |
JP3685812B2 (ja) | 1993-06-29 | 2005-08-24 | ソニー株式会社 | 音声信号送受信装置 |
US5794207A (en) | 1996-09-04 | 1998-08-11 | Walker Asset Management Limited Partnership | Method and apparatus for a cryptographically assisted commercial network system designed to facilitate buyer-driven conditional purchase offers |
US5495604A (en) | 1993-08-25 | 1996-02-27 | Asymetrix Corporation | Method and apparatus for the modeling and query of database structures using natural language-like constructs |
US5619694A (en) | 1993-08-26 | 1997-04-08 | Nec Corporation | Case database storage/retrieval system |
US5940811A (en) | 1993-08-27 | 1999-08-17 | Affinity Technology Group, Inc. | Closed loop financial transaction method and apparatus |
US5377258A (en) | 1993-08-30 | 1994-12-27 | National Medical Research Council | Method and apparatus for an automated and interactive behavioral guidance system |
US5873056A (en) | 1993-10-12 | 1999-02-16 | The Syracuse University | Natural language processing system for semantic vector representation which accounts for lexical ambiguity |
US5578808A (en) | 1993-12-22 | 1996-11-26 | Datamark Services, Inc. | Data card that can be used for transactions involving separate card issuers |
WO1995017711A1 (en) | 1993-12-23 | 1995-06-29 | Diacom Technologies, Inc. | Method and apparatus for implementing user feedback |
US5621859A (en) | 1994-01-19 | 1997-04-15 | Bbn Corporation | Single tree method for grammar directed, very large vocabulary speech recognizer |
US5584024A (en) | 1994-03-24 | 1996-12-10 | Software Ag | Interactive database query system and method for prohibiting the selection of semantically incorrect query parameters |
US5642519A (en) | 1994-04-29 | 1997-06-24 | Sun Microsystems, Inc. | Speech interpreter with a unified grammer compiler |
EP0684607B1 (en) | 1994-05-25 | 2001-03-14 | Victor Company Of Japan, Limited | Variable transfer rate data reproduction apparatus |
US5493677A (en) | 1994-06-08 | 1996-02-20 | Systems Research & Applications Corporation | Generation, archiving, and retrieval of digital images with evoked suggestion-set captions and natural language interface |
US5675819A (en) | 1994-06-16 | 1997-10-07 | Xerox Corporation | Document information retrieval using global word co-occurrence patterns |
JPH0869470A (ja) | 1994-06-21 | 1996-03-12 | Canon Inc | 自然言語処理装置及びその方法 |
US5948040A (en) | 1994-06-24 | 1999-09-07 | Delorme Publishing Co. | Travel reservation information and planning system |
US5682539A (en) | 1994-09-29 | 1997-10-28 | Conrad; Donovan | Anticipated meaning natural language interface |
US5715468A (en) | 1994-09-30 | 1998-02-03 | Budzinski; Robert Lucius | Memory system for storing and retrieving experience and knowledge with natural language |
GB2293667B (en) | 1994-09-30 | 1998-05-27 | Intermation Limited | Database management system |
US5845255A (en) | 1994-10-28 | 1998-12-01 | Advanced Health Med-E-Systems Corporation | Prescription management system |
US5577241A (en) | 1994-12-07 | 1996-11-19 | Excite, Inc. | Information retrieval system and method with implementation extensible query architecture |
US5748974A (en) | 1994-12-13 | 1998-05-05 | International Business Machines Corporation | Multimodal natural language interface for cross-application tasks |
US5794050A (en) | 1995-01-04 | 1998-08-11 | Intelligent Text Processing, Inc. | Natural language understanding system |
CN1183841A (zh) | 1995-02-13 | 1998-06-03 | 英特特拉斯特技术公司 | 用于安全交易管理和电子权利保护的系统和方法 |
US5701400A (en) | 1995-03-08 | 1997-12-23 | Amado; Carlos Armando | Method and apparatus for applying if-then-else rules to data sets in a relational data base and generating from the results of application of said rules a database of diagnostics linked to said data sets to aid executive analysis of financial data |
US5749081A (en) | 1995-04-06 | 1998-05-05 | Firefly Network, Inc. | System and method for recommending items to a user |
US5642464A (en) | 1995-05-03 | 1997-06-24 | Northern Telecom Limited | Methods and apparatus for noise conditioning in digital speech compression systems using linear predictive coding |
US5664055A (en) | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
US5710886A (en) | 1995-06-16 | 1998-01-20 | Sellectsoft, L.C. | Electric couponing method and apparatus |
JP3284832B2 (ja) | 1995-06-22 | 2002-05-20 | セイコーエプソン株式会社 | 音声認識対話処理方法および音声認識対話装置 |
US6038533A (en) | 1995-07-07 | 2000-03-14 | Lucent Technologies Inc. | System and method for selecting training text |
US6026388A (en) | 1995-08-16 | 2000-02-15 | Textwise, Llc | User interface and other enhancements for natural language information retrieval system and method |
JP3697748B2 (ja) | 1995-08-21 | 2005-09-21 | セイコーエプソン株式会社 | 端末、音声認識装置 |
US5712957A (en) | 1995-09-08 | 1998-01-27 | Carnegie Mellon University | Locating and correcting erroneously recognized portions of utterances by rescoring based on two n-best lists |
US6173261B1 (en) | 1998-09-30 | 2001-01-09 | At&T Corp | Grammar fragment acquisition using syntactic and semantic clustering |
US5790978A (en) | 1995-09-15 | 1998-08-04 | Lucent Technologies, Inc. | System and method for determining pitch contours |
US5737734A (en) | 1995-09-15 | 1998-04-07 | Infonautics Corporation | Query word relevance adjustment in a search of an information retrieval system |
US5884323A (en) | 1995-10-13 | 1999-03-16 | 3Com Corporation | Extendible method and apparatus for synchronizing files on two different computer systems |
US5799276A (en) | 1995-11-07 | 1998-08-25 | Accent Incorporated | Knowledge-based speech recognition system and methods having frame length computed based upon estimated pitch period of vocalic intervals |
US6064959A (en) * | 1997-03-28 | 2000-05-16 | Dragon Systems, Inc. | Error correction in speech recognition |
US5794237A (en) | 1995-11-13 | 1998-08-11 | International Business Machines Corporation | System and method for improving problem source identification in computer systems employing relevance feedback and statistical source ranking |
US5706442A (en) | 1995-12-20 | 1998-01-06 | Block Financial Corporation | System for on-line financial services using distributed objects |
US6119101A (en) | 1996-01-17 | 2000-09-12 | Personal Agents, Inc. | Intelligent agents for electronic commerce |
US6125356A (en) | 1996-01-18 | 2000-09-26 | Rosefaire Development, Ltd. | Portable sales presentation system with selective scripted seller prompts |
US5987404A (en) | 1996-01-29 | 1999-11-16 | International Business Machines Corporation | Statistical natural language understanding using hidden clumpings |
US5729694A (en) | 1996-02-06 | 1998-03-17 | The Regents Of The University Of California | Speech coding, reconstruction and recognition using acoustics and electromagnetic waves |
US6076088A (en) | 1996-02-09 | 2000-06-13 | Paik; Woojin | Information extraction system and method using concept relation concept (CRC) triples |
US5835893A (en) | 1996-02-15 | 1998-11-10 | Atr Interpreting Telecommunications Research Labs | Class-based word clustering for speech recognition using a three-level balanced hierarchical similarity |
US5901287A (en) | 1996-04-01 | 1999-05-04 | The Sabre Group Inc. | Information aggregation and synthesization system |
US5867799A (en) | 1996-04-04 | 1999-02-02 | Lang; Andrew K. | Information system and method for filtering a massive flow of information entities to meet user information classification needs |
US5987140A (en) | 1996-04-26 | 1999-11-16 | Verifone, Inc. | System, method and article of manufacture for secure network electronic payment and credit collection |
US5963924A (en) | 1996-04-26 | 1999-10-05 | Verifone, Inc. | System, method and article of manufacture for the use of payment instrument holders and payment instruments in network electronic commerce |
US5913193A (en) | 1996-04-30 | 1999-06-15 | Microsoft Corporation | Method and system of runtime acoustic unit selection for speech synthesis |
US5857184A (en) | 1996-05-03 | 1999-01-05 | Walden Media, Inc. | Language and method for creating, organizing, and retrieving data from a database |
FR2748342B1 (fr) | 1996-05-06 | 1998-07-17 | France Telecom | Procede et dispositif de filtrage par egalisation d'un signal de parole, mettant en oeuvre un modele statistique de ce signal |
US5828999A (en) | 1996-05-06 | 1998-10-27 | Apple Computer, Inc. | Method and system for deriving a large-span semantic language model for large-vocabulary recognition systems |
US5826261A (en) | 1996-05-10 | 1998-10-20 | Spencer; Graham | System and method for querying multiple, distributed databases by selective sharing of local relative significance information for terms related to the query |
US6366883B1 (en) | 1996-05-15 | 2002-04-02 | Atr Interpreting Telecommunications | Concatenation of speech segments by use of a speech synthesizer |
US5727950A (en) | 1996-05-22 | 1998-03-17 | Netsage Corporation | Agent based instruction system and method |
US5966533A (en) | 1996-06-11 | 1999-10-12 | Excite, Inc. | Method and system for dynamically synthesizing a computer program by differentially resolving atoms based on user context data |
US5915249A (en) | 1996-06-14 | 1999-06-22 | Excite, Inc. | System and method for accelerated query evaluation of very large full-text databases |
US5987132A (en) | 1996-06-17 | 1999-11-16 | Verifone, Inc. | System, method and article of manufacture for conditionally accepting a payment method utilizing an extensible, flexible architecture |
US5825881A (en) | 1996-06-28 | 1998-10-20 | Allsoft Distributing Inc. | Public network merchandising system |
US6070147A (en) | 1996-07-02 | 2000-05-30 | Tecmark Services, Inc. | Customer identification and marketing analysis systems |
CN100371914C (zh) | 1996-07-22 | 2008-02-27 | Cyva研究公司 | 个人信息安全与交换的工具 |
US5862223A (en) | 1996-07-24 | 1999-01-19 | Walker Asset Management Limited Partnership | Method and apparatus for a cryptographically-assisted commercial network system designed to facilitate and support expert-based commerce |
EP0829811A1 (en) | 1996-09-11 | 1998-03-18 | Nippon Telegraph And Telephone Corporation | Method and system for information retrieval |
US6181935B1 (en) | 1996-09-27 | 2001-01-30 | Software.Com, Inc. | Mobility extended telephone application programming interface and method of use |
US5794182A (en) | 1996-09-30 | 1998-08-11 | Apple Computer, Inc. | Linear predictive speech encoding systems with efficient combination pitch coefficients computation |
US5721827A (en) | 1996-10-02 | 1998-02-24 | James Logan | System for electrically distributing personalized information |
US5913203A (en) | 1996-10-03 | 1999-06-15 | Jaesent Inc. | System and method for pseudo cash transactions |
US5930769A (en) | 1996-10-07 | 1999-07-27 | Rose; Andrea | System and method for fashion shopping |
US5836771A (en) | 1996-12-02 | 1998-11-17 | Ho; Chi Fai | Learning method and system based on questioning |
US6665639B2 (en) | 1996-12-06 | 2003-12-16 | Sensory, Inc. | Speech recognition in consumer electronic products |
US6078914A (en) | 1996-12-09 | 2000-06-20 | Open Text Corporation | Natural language meta-search system and method |
US5839106A (en) | 1996-12-17 | 1998-11-17 | Apple Computer, Inc. | Large-vocabulary speech recognition using an integrated syntactic and semantic statistical language model |
US5966126A (en) | 1996-12-23 | 1999-10-12 | Szabo; Andrew J. | Graphic user interface for database system |
US5932869A (en) | 1996-12-27 | 1999-08-03 | Graphic Technology, Inc. | Promotional system with magnetic stripe and visual thermo-reversible print surfaced medium |
JP3579204B2 (ja) | 1997-01-17 | 2004-10-20 | 富士通株式会社 | 文書要約装置およびその方法 |
US5941944A (en) | 1997-03-03 | 1999-08-24 | Microsoft Corporation | Method for providing a substitute for a requested inaccessible object by identifying substantially similar objects using weights corresponding to object features |
US5930801A (en) | 1997-03-07 | 1999-07-27 | Xerox Corporation | Shared-data environment in which each file has independent security properties |
US6076051A (en) | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
US5822743A (en) | 1997-04-08 | 1998-10-13 | 1215627 Ontario Inc. | Knowledge-based information retrieval system |
US5970474A (en) | 1997-04-24 | 1999-10-19 | Sears, Roebuck And Co. | Registry information system for shoppers |
US5895464A (en) | 1997-04-30 | 1999-04-20 | Eastman Kodak Company | Computer program product and a method for using natural language for the description, search and retrieval of multi-media objects |
US6138098A (en) * | 1997-06-30 | 2000-10-24 | Lernout & Hauspie Speech Products N.V. | Command parsing and rewrite system |
US5860063A (en) | 1997-07-11 | 1999-01-12 | At&T Corp | Automated meaningful phrase clustering |
US5933822A (en) | 1997-07-22 | 1999-08-03 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
US5974146A (en) | 1997-07-30 | 1999-10-26 | Huntington Bancshares Incorporated | Real time bank-centric universal payment system |
US5895466A (en) | 1997-08-19 | 1999-04-20 | At&T Corp | Automated natural language understanding customer service system |
US6081774A (en) | 1997-08-22 | 2000-06-27 | Novell, Inc. | Natural language information retrieval system and method |
US6404876B1 (en) | 1997-09-25 | 2002-06-11 | Gte Intelligent Network Services Incorporated | System and method for voice activated dialing and routing under open access network control |
US6023684A (en) | 1997-10-01 | 2000-02-08 | Security First Technologies, Inc. | Three tier financial transaction system with cache memory |
DE69712485T2 (de) | 1997-10-23 | 2002-12-12 | Sony Int Europe Gmbh | Sprachschnittstelle für ein Hausnetzwerk |
US6108627A (en) | 1997-10-31 | 2000-08-22 | Nortel Networks Corporation | Automatic transcription tool |
US5943670A (en) | 1997-11-21 | 1999-08-24 | International Business Machines Corporation | System and method for categorizing objects in combined categories |
US5960422A (en) | 1997-11-26 | 1999-09-28 | International Business Machines Corporation | System and method for optimized source selection in an information retrieval system |
US6026375A (en) | 1997-12-05 | 2000-02-15 | Nortel Networks Corporation | Method and apparatus for processing orders from customers in a mobile environment |
US6064960A (en) | 1997-12-18 | 2000-05-16 | Apple Computer, Inc. | Method and apparatus for improved duration modeling of phonemes |
US6094649A (en) | 1997-12-22 | 2000-07-25 | Partnet, Inc. | Keyword searches of structured databases |
US6173287B1 (en) | 1998-03-11 | 2001-01-09 | Digital Equipment Corporation | Technique for ranking multimedia annotations of interest |
US6195641B1 (en) | 1998-03-27 | 2001-02-27 | International Business Machines Corp. | Network universal spoken language vocabulary |
US6026393A (en) | 1998-03-31 | 2000-02-15 | Casebank Technologies Inc. | Configuration knowledge as an aid to case retrieval |
US6233559B1 (en) | 1998-04-01 | 2001-05-15 | Motorola, Inc. | Speech control of multiple applications using applets |
US6173279B1 (en) | 1998-04-09 | 2001-01-09 | At&T Corp. | Method of using a natural language interface to retrieve information from one or more data resources |
US6088731A (en) | 1998-04-24 | 2000-07-11 | Associative Computing, Inc. | Intelligent assistant for use with a local computer and with the internet |
US6029132A (en) | 1998-04-30 | 2000-02-22 | Matsushita Electric Industrial Co. | Method for letter-to-sound in text-to-speech synthesis |
US6016471A (en) | 1998-04-29 | 2000-01-18 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus using decision trees to generate and score multiple pronunciations for a spelled word |
US6285786B1 (en) | 1998-04-30 | 2001-09-04 | Motorola, Inc. | Text recognizer and method using non-cumulative character scoring in a forward search |
US6144938A (en) | 1998-05-01 | 2000-11-07 | Sun Microsystems, Inc. | Voice user interface with personality |
US20070094222A1 (en) | 1998-05-28 | 2007-04-26 | Lawrence Au | Method and system for using voice input for performing network functions |
US7711672B2 (en) | 1998-05-28 | 2010-05-04 | Lawrence Au | Semantic network methods to disambiguate natural language meaning |
US6778970B2 (en) | 1998-05-28 | 2004-08-17 | Lawrence Au | Topological methods to organize semantic network data flows for conversational applications |
US6144958A (en) | 1998-07-15 | 2000-11-07 | Amazon.Com, Inc. | System and method for correcting spelling errors in search queries |
US6105865A (en) | 1998-07-17 | 2000-08-22 | Hardesty; Laurence Daniel | Financial transaction system with retirement saving benefit |
US6434524B1 (en) | 1998-09-09 | 2002-08-13 | One Voice Technologies, Inc. | Object interactive user interface using speech recognition and natural language processing |
US6499013B1 (en) | 1998-09-09 | 2002-12-24 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
US6266637B1 (en) | 1998-09-11 | 2001-07-24 | International Business Machines Corporation | Phrase splicing and variable substitution using a trainable speech synthesizer |
DE29825146U1 (de) | 1998-09-11 | 2005-08-18 | Püllen, Rainer | Teilnehmereinheit und System für einen Multimediadienst |
US6792082B1 (en) | 1998-09-11 | 2004-09-14 | Comverse Ltd. | Voice mail system with personal assistant provisioning |
US6317831B1 (en) | 1998-09-21 | 2001-11-13 | Openwave Systems Inc. | Method and apparatus for establishing a secure connection over a one-way data path |
US6275824B1 (en) | 1998-10-02 | 2001-08-14 | Ncr Corporation | System and method for managing data privacy in a database management system |
US7137126B1 (en) | 1998-10-02 | 2006-11-14 | International Business Machines Corporation | Conversational computing via conversational virtual machine |
GB9821969D0 (en) | 1998-10-08 | 1998-12-02 | Canon Kk | Apparatus and method for processing natural language |
US6928614B1 (en) | 1998-10-13 | 2005-08-09 | Visteon Global Technologies, Inc. | Mobile office with speech recognition |
US6453292B2 (en) | 1998-10-28 | 2002-09-17 | International Business Machines Corporation | Command boundary identifier for conversational natural language |
US6208971B1 (en) | 1998-10-30 | 2001-03-27 | Apple Computer, Inc. | Method and apparatus for command recognition using data-driven semantic inference |
US6321092B1 (en) | 1998-11-03 | 2001-11-20 | Signal Soft Corporation | Multiple input data management for wireless location-based applications |
US6839669B1 (en) * | 1998-11-05 | 2005-01-04 | Scansoft, Inc. | Performing actions identified in recognized speech |
US6446076B1 (en) | 1998-11-12 | 2002-09-03 | Accenture Llp. | Voice interactive web-based agent system responsive to a user location for prioritizing and formatting information |
WO2000030069A2 (en) | 1998-11-13 | 2000-05-25 | Lernout & Hauspie Speech Products N.V. | Speech synthesis using concatenation of speech waveforms |
US6606599B2 (en) | 1998-12-23 | 2003-08-12 | Interactive Speech Technologies, Llc | Method for integrating computing processes with an interface controlled by voice actuated grammars |
US6246981B1 (en) | 1998-11-25 | 2001-06-12 | International Business Machines Corporation | Natural language task-oriented dialog manager and method |
US7082397B2 (en) | 1998-12-01 | 2006-07-25 | Nuance Communications, Inc. | System for and method of creating and browsing a voice web |
US6260024B1 (en) | 1998-12-02 | 2001-07-10 | Gary Shkedy | Method and apparatus for facilitating buyer-driven purchase orders on a commercial network system |
US7881936B2 (en) | 1998-12-04 | 2011-02-01 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
US6317707B1 (en) | 1998-12-07 | 2001-11-13 | At&T Corp. | Automatic clustering of tokens from a corpus for grammar acquisition |
US6308149B1 (en) | 1998-12-16 | 2001-10-23 | Xerox Corporation | Grouping words with equivalent substrings by automatic clustering based on suffix relationships |
US6523172B1 (en) | 1998-12-17 | 2003-02-18 | Evolutionary Technologies International, Inc. | Parser translator system and method |
US6460029B1 (en) | 1998-12-23 | 2002-10-01 | Microsoft Corporation | System for improving search text |
US7036128B1 (en) | 1999-01-05 | 2006-04-25 | Sri International Offices | Using a community of distributed electronic agents to support a highly mobile, ambient computing environment |
US6851115B1 (en) | 1999-01-05 | 2005-02-01 | Sri International | Software-based architecture for communication and cooperation among distributed electronic agents |
US6742021B1 (en) | 1999-01-05 | 2004-05-25 | Sri International, Inc. | Navigating network-based electronic information using spoken input with multimodal error feedback |
US6513063B1 (en) | 1999-01-05 | 2003-01-28 | Sri International | Accessing network-based electronic information through scripted online interfaces using spoken input |
US6757718B1 (en) | 1999-01-05 | 2004-06-29 | Sri International | Mobile navigation of network-based electronic information using spoken input |
US6523061B1 (en) | 1999-01-05 | 2003-02-18 | Sri International, Inc. | System, method, and article of manufacture for agent-based navigation in a speech-based data navigation system |
US7152070B1 (en) | 1999-01-08 | 2006-12-19 | The Regents Of The University Of California | System and method for integrating and accessing multiple data sources within a data warehouse architecture |
US6505183B1 (en) | 1999-02-04 | 2003-01-07 | Authoria, Inc. | Human resource knowledge modeling and delivery system |
US6317718B1 (en) | 1999-02-26 | 2001-11-13 | Accenture Properties (2) B.V. | System, method and article of manufacture for location-based filtering for shopping agent in the physical world |
GB9904662D0 (en) | 1999-03-01 | 1999-04-21 | Canon Kk | Natural language search method and apparatus |
US6356905B1 (en) | 1999-03-05 | 2002-03-12 | Accenture Llp | System, method and article of manufacture for mobile communication utilizing an interface support framework |
US6928404B1 (en) | 1999-03-17 | 2005-08-09 | International Business Machines Corporation | System and methods for acoustic and language modeling for automatic speech recognition with large vocabularies |
US6584464B1 (en) | 1999-03-19 | 2003-06-24 | Ask Jeeves, Inc. | Grammar template query system |
EP1088299A2 (en) | 1999-03-26 | 2001-04-04 | Scansoft, Inc. | Client-server speech recognition |
US6356854B1 (en) | 1999-04-05 | 2002-03-12 | Delphi Technologies, Inc. | Holographic object position and type sensing system and method |
US6631346B1 (en) | 1999-04-07 | 2003-10-07 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for natural language parsing using multiple passes and tags |
WO2000060435A2 (en) | 1999-04-07 | 2000-10-12 | Rensselaer Polytechnic Institute | System and method for accessing personal information |
US6647260B2 (en) | 1999-04-09 | 2003-11-11 | Openwave Systems Inc. | Method and system facilitating web based provisioning of two-way mobile communications devices |
US6711620B1 (en) * | 1999-04-14 | 2004-03-23 | Matsushita Electric Industrial Co. | Event control device and digital broadcasting system |
US6924828B1 (en) | 1999-04-27 | 2005-08-02 | Surfnotes | Method and apparatus for improved information representation |
US6697780B1 (en) | 1999-04-30 | 2004-02-24 | At&T Corp. | Method and apparatus for rapid acoustic unit selection from a large speech corpus |
EP1224569A4 (en) | 1999-05-28 | 2005-08-10 | Sehda Inc | PHRASE BASED DIALOGUE MODELING WITH SPECIAL APPLICATION FOR GENERATING RECOGNITION GRAMMARK FOR LANGUAGE-CONTROLLED USER INTERFACE |
US20020032564A1 (en) | 2000-04-19 | 2002-03-14 | Farzad Ehsani | Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface |
US6931384B1 (en) | 1999-06-04 | 2005-08-16 | Microsoft Corporation | System and method providing utility-based decision making about clarification dialog given communicative uncertainty |
US6598039B1 (en) | 1999-06-08 | 2003-07-22 | Albert-Inc. S.A. | Natural language interface for searching database |
US8065155B1 (en) | 1999-06-10 | 2011-11-22 | Gazdzinski Robert F | Adaptive advertising apparatus and methods |
US7093693B1 (en) | 1999-06-10 | 2006-08-22 | Gazdzinski Robert F | Elevator access control system and method |
US7711565B1 (en) | 1999-06-10 | 2010-05-04 | Gazdzinski Robert F | “Smart” elevator system and method |
US6615175B1 (en) | 1999-06-10 | 2003-09-02 | Robert F. Gazdzinski | “Smart” elevator system and method |
US6711585B1 (en) | 1999-06-15 | 2004-03-23 | Kanisa Inc. | System and method for implementing a knowledge management system |
JP3662780B2 (ja) * | 1999-07-16 | 2005-06-22 | 日本電気株式会社 | 自然言語を用いた対話システム |
JP3361291B2 (ja) | 1999-07-23 | 2003-01-07 | コナミ株式会社 | 音声合成方法、音声合成装置及び音声合成プログラムを記録したコンピュータ読み取り可能な媒体 |
US6421672B1 (en) | 1999-07-27 | 2002-07-16 | Verizon Services Corp. | Apparatus for and method of disambiguation of directory listing searches utilizing multiple selectable secondary search keys |
EP1079387A3 (en) | 1999-08-26 | 2003-07-09 | Matsushita Electric Industrial Co., Ltd. | Mechanism for storing information about recorded television broadcasts |
US6912499B1 (en) | 1999-08-31 | 2005-06-28 | Nortel Networks Limited | Method and apparatus for training a multilingual speech model set |
US6601234B1 (en) | 1999-08-31 | 2003-07-29 | Accenture Llp | Attribute dictionary in a business logic services environment |
US6697824B1 (en) | 1999-08-31 | 2004-02-24 | Accenture Llp | Relationship management in an E-commerce application framework |
US7127403B1 (en) | 1999-09-13 | 2006-10-24 | Microstrategy, Inc. | System and method for personalizing an interactive voice broadcast of a voice service based on particulars of a request |
US6601026B2 (en) | 1999-09-17 | 2003-07-29 | Discern Communications, Inc. | Information retrieval by natural language querying |
US6625583B1 (en) | 1999-10-06 | 2003-09-23 | Goldman, Sachs & Co. | Handheld trading system interface |
US6505175B1 (en) | 1999-10-06 | 2003-01-07 | Goldman, Sachs & Co. | Order centric tracking system |
US7020685B1 (en) | 1999-10-08 | 2006-03-28 | Openwave Systems Inc. | Method and apparatus for providing internet content to SMS-based wireless devices |
CA2387079C (en) | 1999-10-19 | 2011-10-18 | Sony Electronics Inc. | Natural language interface control system |
US6807574B1 (en) | 1999-10-22 | 2004-10-19 | Tellme Networks, Inc. | Method and apparatus for content personalization over a telephone interface |
JP2001125896A (ja) | 1999-10-26 | 2001-05-11 | Victor Co Of Japan Ltd | 自然言語対話システム |
US7310600B1 (en) | 1999-10-28 | 2007-12-18 | Canon Kabushiki Kaisha | Language recognition using a similarity measure |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6615172B1 (en) | 1999-11-12 | 2003-09-02 | Phoenix Solutions, Inc. | Intelligent query engine for processing voice based queries |
US7050977B1 (en) | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
US6665640B1 (en) | 1999-11-12 | 2003-12-16 | Phoenix Solutions, Inc. | Interactive speech based learning/training system formulating search queries based on natural language parsing of recognized user queries |
US7392185B2 (en) | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US6633846B1 (en) | 1999-11-12 | 2003-10-14 | Phoenix Solutions, Inc. | Distributed realtime speech recognition system |
US9076448B2 (en) | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
US6532446B1 (en) | 1999-11-24 | 2003-03-11 | Openwave Systems Inc. | Server based speech recognition user interface for wireless devices |
US6526382B1 (en) | 1999-12-07 | 2003-02-25 | Comverse, Inc. | Language-oriented user interfaces for voice activated services |
US6526395B1 (en) | 1999-12-31 | 2003-02-25 | Intel Corporation | Application of personality models and interaction with synthetic characters in a computing system |
US6556983B1 (en) | 2000-01-12 | 2003-04-29 | Microsoft Corporation | Methods and apparatus for finding semantic information, such as usage logs, similar to a query using a pattern lattice data space |
US6546388B1 (en) | 2000-01-14 | 2003-04-08 | International Business Machines Corporation | Metadata search results ranking system |
US6701294B1 (en) | 2000-01-19 | 2004-03-02 | Lucent Technologies, Inc. | User interface for translating natural language inquiries into database queries and data presentations |
US6829603B1 (en) | 2000-02-02 | 2004-12-07 | International Business Machines Corp. | System, method and program product for interactive natural dialog |
US6895558B1 (en) | 2000-02-11 | 2005-05-17 | Microsoft Corporation | Multi-access mode electronic personal assistant |
US6640098B1 (en) | 2000-02-14 | 2003-10-28 | Action Engine Corporation | System for obtaining service-related information for local interactive wireless devices |
AU2001243277A1 (en) | 2000-02-25 | 2001-09-03 | Synquiry Technologies, Ltd. | Conceptual factoring and unification of graphs representing semantic models |
US6449620B1 (en) | 2000-03-02 | 2002-09-10 | Nimble Technology, Inc. | Method and apparatus for generating information pages using semi-structured data stored in a structured manner |
US6895380B2 (en) | 2000-03-02 | 2005-05-17 | Electro Standards Laboratories | Voice actuation with contextual learning for intelligent machine control |
US6466654B1 (en) | 2000-03-06 | 2002-10-15 | Avaya Technology Corp. | Personal virtual assistant with semantic tagging |
WO2001067225A2 (en) | 2000-03-06 | 2001-09-13 | Kanisa Inc. | A system and method for providing an intelligent multi-step dialog with a user |
US6757362B1 (en) | 2000-03-06 | 2004-06-29 | Avaya Technology Corp. | Personal virtual assistant |
US6477488B1 (en) | 2000-03-10 | 2002-11-05 | Apple Computer, Inc. | Method for dynamic context scope selection in hybrid n-gram+LSA language modeling |
US6615220B1 (en) | 2000-03-14 | 2003-09-02 | Oracle International Corporation | Method and mechanism for data consolidation |
US6510417B1 (en) | 2000-03-21 | 2003-01-21 | America Online, Inc. | System and method for voice access to internet-based information |
GB2366009B (en) | 2000-03-22 | 2004-07-21 | Canon Kk | Natural language machine interface |
JP3728172B2 (ja) | 2000-03-31 | 2005-12-21 | キヤノン株式会社 | 音声合成方法および装置 |
US7177798B2 (en) | 2000-04-07 | 2007-02-13 | Rensselaer Polytechnic Institute | Natural language interface using constrained intermediate dictionary of results |
US6810379B1 (en) | 2000-04-24 | 2004-10-26 | Sensory, Inc. | Client/server architecture for text-to-speech synthesis |
WO2001084535A2 (en) * | 2000-05-02 | 2001-11-08 | Dragon Systems, Inc. | Error correction in speech recognition |
US6691111B2 (en) | 2000-06-30 | 2004-02-10 | Research In Motion Limited | System and method for implementing a natural language user interface |
US6684187B1 (en) | 2000-06-30 | 2004-01-27 | At&T Corp. | Method and system for preselection of suitable units for concatenative speech |
US6505158B1 (en) | 2000-07-05 | 2003-01-07 | At&T Corp. | Synthesis-based pre-selection of suitable units for concatenative speech |
JP3949356B2 (ja) | 2000-07-12 | 2007-07-25 | 三菱電機株式会社 | 音声対話システム |
US7139709B2 (en) | 2000-07-20 | 2006-11-21 | Microsoft Corporation | Middleware layer between speech related applications and engines |
JP2002041276A (ja) | 2000-07-24 | 2002-02-08 | Sony Corp | 対話型操作支援システム及び対話型操作支援方法、並びに記憶媒体 |
US20060143007A1 (en) | 2000-07-24 | 2006-06-29 | Koh V E | User interaction with voice information services |
US7092928B1 (en) | 2000-07-31 | 2006-08-15 | Quantum Leap Research, Inc. | Intelligent portal engine |
US6778951B1 (en) | 2000-08-09 | 2004-08-17 | Concerto Software, Inc. | Information retrieval method with natural language interface |
US6766320B1 (en) | 2000-08-24 | 2004-07-20 | Microsoft Corporation | Search engine with natural language-based robust parsing for user query and relevance feedback learning |
DE10042944C2 (de) | 2000-08-31 | 2003-03-13 | Siemens Ag | Graphem-Phonem-Konvertierung |
AU2001290882A1 (en) | 2000-09-15 | 2002-03-26 | Lernout And Hauspie Speech Products N.V. | Fast waveform synchronization for concatenation and time-scale modification of speech |
US7216080B2 (en) | 2000-09-29 | 2007-05-08 | Mindfabric Holdings Llc | Natural-language voice-activated personal assistant |
US6832194B1 (en) | 2000-10-26 | 2004-12-14 | Sensory, Incorporated | Audio recognition peripheral system |
US7027974B1 (en) | 2000-10-27 | 2006-04-11 | Science Applications International Corporation | Ontology-based parser for natural language processing |
US7006969B2 (en) | 2000-11-02 | 2006-02-28 | At&T Corp. | System and method of pattern recognition in very high-dimensional space |
JP2004516516A (ja) | 2000-12-18 | 2004-06-03 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 単語を認識するために発言を保存しボキャブラリーを選択する方法 |
US6937986B2 (en) | 2000-12-28 | 2005-08-30 | Comverse, Inc. | Automatic dynamic speech recognition vocabulary based on external sources of information |
AU2001255568A1 (en) | 2000-12-29 | 2002-07-16 | General Electric Company | Method and system for identifying repeatedly malfunctioning equipment |
US7249018B2 (en) * | 2001-01-12 | 2007-07-24 | International Business Machines Corporation | System and method for relating syntax and semantics for a conversational speech application |
US7257537B2 (en) | 2001-01-12 | 2007-08-14 | International Business Machines Corporation | Method and apparatus for performing dialog management in a computer conversational interface |
US6964023B2 (en) | 2001-02-05 | 2005-11-08 | International Business Machines Corporation | System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input |
US7290039B1 (en) | 2001-02-27 | 2007-10-30 | Microsoft Corporation | Intent based processing |
US20020123894A1 (en) | 2001-03-01 | 2002-09-05 | International Business Machines Corporation | Processing speech recognition errors in an embedded speech recognition system |
US6721728B2 (en) | 2001-03-02 | 2004-04-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | System, method and apparatus for discovering phrases in a database |
AU2002237495A1 (en) | 2001-03-13 | 2002-09-24 | Intelligate Ltd. | Dynamic natural language understanding |
US6996531B2 (en) | 2001-03-30 | 2006-02-07 | Comverse Ltd. | Automated database assistance using a telephone for a speech based or text based multimedia communication mode |
US6654740B2 (en) | 2001-05-08 | 2003-11-25 | Sunflare Co., Ltd. | Probabilistic information retrieval based on differential latent semantic space |
US7085722B2 (en) | 2001-05-14 | 2006-08-01 | Sony Computer Entertainment America Inc. | System and method for menu-driven voice control of characters in a game environment |
US6944594B2 (en) | 2001-05-30 | 2005-09-13 | Bellsouth Intellectual Property Corporation | Multi-context conversational environment system and method |
US20020194003A1 (en) | 2001-06-05 | 2002-12-19 | Mozer Todd F. | Client-server security system and method |
US20020198714A1 (en) | 2001-06-26 | 2002-12-26 | Guojun Zhou | Statistical spoken dialog system |
US7139722B2 (en) | 2001-06-27 | 2006-11-21 | Bellsouth Intellectual Property Corporation | Location and time sensitive wireless calendaring |
US6604059B2 (en) | 2001-07-10 | 2003-08-05 | Koninklijke Philips Electronics N.V. | Predictive calendar |
US7987151B2 (en) | 2001-08-10 | 2011-07-26 | General Dynamics Advanced Info Systems, Inc. | Apparatus and method for problem solving using intelligent agents |
US6813491B1 (en) | 2001-08-31 | 2004-11-02 | Openwave Systems Inc. | Method and apparatus for adapting settings of wireless communication devices in accordance with user proximity |
US7403938B2 (en) | 2001-09-24 | 2008-07-22 | Iac Search & Media, Inc. | Natural language query processing |
US6985865B1 (en) | 2001-09-26 | 2006-01-10 | Sprint Spectrum L.P. | Method and system for enhanced response to voice commands in a voice command platform |
US20050196732A1 (en) | 2001-09-26 | 2005-09-08 | Scientific Learning Corporation | Method and apparatus for automated training of language learning skills |
US6650735B2 (en) | 2001-09-27 | 2003-11-18 | Microsoft Corporation | Integrated voice access to a variety of personal information services |
US7324947B2 (en) | 2001-10-03 | 2008-01-29 | Promptu Systems Corporation | Global speech user interface |
US7167832B2 (en) | 2001-10-15 | 2007-01-23 | At&T Corp. | Method for dialog management |
US7345671B2 (en) | 2001-10-22 | 2008-03-18 | Apple Inc. | Method and apparatus for use of rotational user inputs |
GB2381409B (en) | 2001-10-27 | 2004-04-28 | Hewlett Packard Ltd | Asynchronous access to synchronous voice services |
NO316480B1 (no) | 2001-11-15 | 2004-01-26 | Forinnova As | Fremgangsmåte og system for tekstuell granskning og oppdagelse |
US20030101054A1 (en) | 2001-11-27 | 2003-05-29 | Ncc, Llc | Integrated system and method for electronic speech recognition and transcription |
TW541517B (en) | 2001-12-25 | 2003-07-11 | Univ Nat Cheng Kung | Speech recognition system |
US7197460B1 (en) | 2002-04-23 | 2007-03-27 | At&T Corp. | System for handling frequently asked questions in a natural language dialog service |
US6847966B1 (en) | 2002-04-24 | 2005-01-25 | Engenium Corporation | Method and system for optimally searching a document database using a representative semantic space |
US7546382B2 (en) | 2002-05-28 | 2009-06-09 | International Business Machines Corporation | Methods and systems for authoring of mixed-initiative multi-modal interactions and related browsing mechanisms |
US7398209B2 (en) | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7299033B2 (en) | 2002-06-28 | 2007-11-20 | Openwave Systems Inc. | Domain-based management of distribution of digital content from multiple suppliers to multiple wireless services subscribers |
US7233790B2 (en) | 2002-06-28 | 2007-06-19 | Openwave Systems, Inc. | Device capability based discovery, packaging and provisioning of content for wireless mobile devices |
US7693720B2 (en) | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
EP1604350A4 (en) * | 2002-09-06 | 2007-11-21 | Voice Signal Technologies Inc | METHODS, SYSTEMS AND PROGRAMMING FOR REALIZING VOICE RECOGNITION |
US7467087B1 (en) | 2002-10-10 | 2008-12-16 | Gillick Laurence S | Training and using pronunciation guessers in speech recognition |
US7783486B2 (en) | 2002-11-22 | 2010-08-24 | Roy Jonathan Rosser | Response generator for mimicking human-computer natural language conversation |
WO2004053836A1 (en) | 2002-12-10 | 2004-06-24 | Kirusa, Inc. | Techniques for disambiguating speech input using multimodal interfaces |
US7386449B2 (en) | 2002-12-11 | 2008-06-10 | Voice Enabling Systems Technology Inc. | Knowledge-based flexible natural speech dialogue system |
US7956766B2 (en) | 2003-01-06 | 2011-06-07 | Panasonic Corporation | Apparatus operating system |
DE602004011753T2 (de) * | 2003-03-01 | 2009-02-05 | Coifman, Robert E. | Verfahren und Vorrichtung zum Verbessern der Transkriptionsgenauigkeit bei der Spracherkennung |
US7809565B2 (en) | 2003-03-01 | 2010-10-05 | Coifman Robert E | Method and apparatus for improving the transcription accuracy of speech recognition software |
US7805299B2 (en) * | 2004-03-01 | 2010-09-28 | Coifman Robert E | Method and apparatus for improving the transcription accuracy of speech recognition software |
US7529671B2 (en) | 2003-03-04 | 2009-05-05 | Microsoft Corporation | Block synchronous decoding |
US6980949B2 (en) | 2003-03-14 | 2005-12-27 | Sonum Technologies, Inc. | Natural language processor |
US7496498B2 (en) | 2003-03-24 | 2009-02-24 | Microsoft Corporation | Front-end architecture for a multi-lingual text-to-speech system |
US7627343B2 (en) | 2003-04-25 | 2009-12-01 | Apple Inc. | Media player system |
US7421393B1 (en) | 2004-03-01 | 2008-09-02 | At&T Corp. | System for developing a dialog manager using modular spoken-dialog components |
US7200559B2 (en) | 2003-05-29 | 2007-04-03 | Microsoft Corporation | Semantic object synchronous understanding implemented with speech application language tags |
US7720683B1 (en) | 2003-06-13 | 2010-05-18 | Sensory, Inc. | Method and apparatus of specifying and performing speech recognition operations |
US7475010B2 (en) | 2003-09-03 | 2009-01-06 | Lingospot, Inc. | Adaptive and scalable method for resolving natural language ambiguities |
US7418392B1 (en) | 2003-09-25 | 2008-08-26 | Sensory, Inc. | System and method for controlling the operation of a device by voice commands |
US7155706B2 (en) | 2003-10-24 | 2006-12-26 | Microsoft Corporation | Administrative tool environment |
US7584092B2 (en) | 2004-11-15 | 2009-09-01 | Microsoft Corporation | Unsupervised learning of paraphrase/translation alternations and selective application thereof |
US7412385B2 (en) | 2003-11-12 | 2008-08-12 | Microsoft Corporation | System for identifying paraphrases using machine translation |
US7447630B2 (en) | 2003-11-26 | 2008-11-04 | Microsoft Corporation | Method and apparatus for multi-sensory speech enhancement |
DE602004016681D1 (de) | 2003-12-05 | 2008-10-30 | Kenwood Corp | Audioeinrichtungs-steuereinrichtung, audioeinrichtungs-steuerverfahren und programm |
ES2312851T3 (es) | 2003-12-16 | 2009-03-01 | Loquendo Spa | Procedimiento y sistema texto a voz y el programa informatico asociado. |
US7427024B1 (en) | 2003-12-17 | 2008-09-23 | Gazdzinski Mark J | Chattel management apparatus and methods |
US7552055B2 (en) | 2004-01-10 | 2009-06-23 | Microsoft Corporation | Dialog component re-use in recognition systems |
WO2005071663A2 (en) | 2004-01-16 | 2005-08-04 | Scansoft, Inc. | Corpus-based speech synthesis based on segment recombination |
US20050165607A1 (en) | 2004-01-22 | 2005-07-28 | At&T Corp. | System and method to disambiguate and clarify user intention in a spoken dialog system |
EP1560200B8 (en) | 2004-01-29 | 2009-08-05 | Harman Becker Automotive Systems GmbH | Method and system for spoken dialogue interface |
US7505906B2 (en) * | 2004-02-26 | 2009-03-17 | At&T Intellectual Property, Ii | System and method for augmenting spoken language understanding by correcting common errors in linguistic performance |
KR100462292B1 (ko) | 2004-02-26 | 2004-12-17 | 엔에이치엔(주) | 중요도 정보를 반영한 검색 결과 리스트 제공 방법 및 그시스템 |
US7693715B2 (en) | 2004-03-10 | 2010-04-06 | Microsoft Corporation | Generating large units of graphonemes with mutual information criterion for letter to sound conversion |
US7409337B1 (en) | 2004-03-30 | 2008-08-05 | Microsoft Corporation | Natural language processing interface |
US7496512B2 (en) | 2004-04-13 | 2009-02-24 | Microsoft Corporation | Refining of segmental boundaries in speech waveforms using contextual-dependent models |
US8095364B2 (en) | 2004-06-02 | 2012-01-10 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
US7720674B2 (en) | 2004-06-29 | 2010-05-18 | Sap Ag | Systems and methods for processing natural language queries |
US20060004570A1 (en) * | 2004-06-30 | 2006-01-05 | Microsoft Corporation | Transcribing speech data with dialog context and/or recognition alternative information |
TWI252049B (en) | 2004-07-23 | 2006-03-21 | Inventec Corp | Sound control system and method |
US7725318B2 (en) | 2004-07-30 | 2010-05-25 | Nice Systems Inc. | System and method for improving the accuracy of audio searching |
US7853574B2 (en) | 2004-08-26 | 2010-12-14 | International Business Machines Corporation | Method of generating a context-inferenced search query and of sorting a result of the query |
US7716056B2 (en) | 2004-09-27 | 2010-05-11 | Robert Bosch Corporation | Method and system for interactive conversational dialogue for cognitively overloaded device users |
US8107401B2 (en) | 2004-09-30 | 2012-01-31 | Avaya Inc. | Method and apparatus for providing a virtual assistant to a communication participant |
US7552046B2 (en) | 2004-11-15 | 2009-06-23 | Microsoft Corporation | Unsupervised learning of paraphrase/translation alternations and selective application thereof |
US7546235B2 (en) | 2004-11-15 | 2009-06-09 | Microsoft Corporation | Unsupervised learning of paraphrase/translation alternations and selective application thereof |
US7702500B2 (en) | 2004-11-24 | 2010-04-20 | Blaedow Karen R | Method and apparatus for determining the meaning of natural language |
CN1609859A (zh) | 2004-11-26 | 2005-04-27 | 孙斌 | 搜索结果聚类的方法 |
US7376645B2 (en) | 2004-11-29 | 2008-05-20 | The Intellection Group, Inc. | Multimodal natural language query system and architecture for processing voice and proximity-based queries |
US20060122834A1 (en) | 2004-12-03 | 2006-06-08 | Bennett Ian M | Emotion detection device & method for use in distributed systems |
US8214214B2 (en) | 2004-12-03 | 2012-07-03 | Phoenix Solutions, Inc. | Emotion detection device and method for use in distributed systems |
US7636657B2 (en) | 2004-12-09 | 2009-12-22 | Microsoft Corporation | Method and apparatus for automatic grammar generation from data entries |
US7873654B2 (en) | 2005-01-24 | 2011-01-18 | The Intellection Group, Inc. | Multimodal natural language query system for processing and analyzing voice and proximity-based queries |
US7508373B2 (en) | 2005-01-28 | 2009-03-24 | Microsoft Corporation | Form factor and input method for language input |
GB0502259D0 (en) | 2005-02-03 | 2005-03-09 | British Telecomm | Document searching tool and method |
US7949533B2 (en) * | 2005-02-04 | 2011-05-24 | Vococollect, Inc. | Methods and systems for assessing and improving the performance of a speech recognition system |
EP1693829B1 (en) * | 2005-02-21 | 2018-12-05 | Harman Becker Automotive Systems GmbH | Voice-controlled data system |
US7676026B1 (en) | 2005-03-08 | 2010-03-09 | Baxtech Asia Pte Ltd | Desktop telephony system |
US7925525B2 (en) | 2005-03-25 | 2011-04-12 | Microsoft Corporation | Smart reminders |
WO2006129967A1 (en) | 2005-05-30 | 2006-12-07 | Daumsoft, Inc. | Conversation system and method using conversational agent |
US8041570B2 (en) | 2005-05-31 | 2011-10-18 | Robert Bosch Corporation | Dialogue management using scripts |
US8024195B2 (en) | 2005-06-27 | 2011-09-20 | Sensory, Inc. | Systems and methods of performing speech recognition using historical information |
US8396715B2 (en) * | 2005-06-28 | 2013-03-12 | Microsoft Corporation | Confidence threshold tuning |
US7826945B2 (en) | 2005-07-01 | 2010-11-02 | You Zhang | Automobile speech-recognition interface |
US7640160B2 (en) | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US8271549B2 (en) | 2005-08-05 | 2012-09-18 | Intel Corporation | System and method for automatically managing media content |
US7620549B2 (en) * | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US7949529B2 (en) | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
US8265939B2 (en) | 2005-08-31 | 2012-09-11 | Nuance Communications, Inc. | Hierarchical methods and apparatus for extracting user intent from spoken utterances |
WO2007027989A2 (en) | 2005-08-31 | 2007-03-08 | Voicebox Technologies, Inc. | Dynamic speech sharpening |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
JP4908094B2 (ja) | 2005-09-30 | 2012-04-04 | 株式会社リコー | 情報処理システム、情報処理方法及び情報処理プログラム |
US7930168B2 (en) | 2005-10-04 | 2011-04-19 | Robert Bosch Gmbh | Natural language processing of disfluent sentences |
US8620667B2 (en) | 2005-10-17 | 2013-12-31 | Microsoft Corporation | Flexible speech-activated command and control |
US7707032B2 (en) | 2005-10-20 | 2010-04-27 | National Cheng Kung University | Method and system for matching speech data |
US20070106674A1 (en) | 2005-11-10 | 2007-05-10 | Purusharth Agrawal | Field sales process facilitation systems and methods |
US7822749B2 (en) | 2005-11-28 | 2010-10-26 | Commvault Systems, Inc. | Systems and methods for classifying and transferring information in a storage network |
KR100810500B1 (ko) | 2005-12-08 | 2008-03-07 | 한국전자통신연구원 | 대화형 음성 인터페이스 시스템에서의 사용자 편의성증대 방법 |
DE102005061365A1 (de) | 2005-12-21 | 2007-06-28 | Siemens Ag | Verfahren zur Ansteuerung zumindest einer ersten und zweiten Hintergrundapplikation über ein universelles Sprachdialogsystem |
US7996228B2 (en) | 2005-12-22 | 2011-08-09 | Microsoft Corporation | Voice initiated network operations |
US7599918B2 (en) | 2005-12-29 | 2009-10-06 | Microsoft Corporation | Dynamic search with implicit user intention mining |
JP2007183864A (ja) | 2006-01-10 | 2007-07-19 | Fujitsu Ltd | ファイル検索方法及びそのシステム |
US20070174188A1 (en) | 2006-01-25 | 2007-07-26 | Fish Robert D | Electronic marketplace that facilitates transactions between consolidated buyers and/or sellers |
IL174107A0 (en) | 2006-02-01 | 2006-08-01 | Grois Dan | Method and system for advertising by means of a search engine over a data network |
KR100764174B1 (ko) | 2006-03-03 | 2007-10-08 | 삼성전자주식회사 | 음성 대화 서비스 장치 및 방법 |
US7752152B2 (en) | 2006-03-17 | 2010-07-06 | Microsoft Corporation | Using predictive user models for language modeling on a personal device with user behavior models based on statistical modeling |
JP4734155B2 (ja) | 2006-03-24 | 2011-07-27 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識プログラム |
US7707027B2 (en) | 2006-04-13 | 2010-04-27 | Nuance Communications, Inc. | Identification and rejection of meaningless input during natural language classification |
US20070276651A1 (en) * | 2006-05-23 | 2007-11-29 | Motorola, Inc. | Grammar adaptation through cooperative client and server based speech recognition |
US8423347B2 (en) | 2006-06-06 | 2013-04-16 | Microsoft Corporation | Natural language personal information management |
US7523108B2 (en) | 2006-06-07 | 2009-04-21 | Platformation, Inc. | Methods and apparatus for searching with awareness of geography and languages |
US7483894B2 (en) | 2006-06-07 | 2009-01-27 | Platformation Technologies, Inc | Methods and apparatus for entity search |
US20100257160A1 (en) | 2006-06-07 | 2010-10-07 | Yu Cao | Methods & apparatus for searching with awareness of different types of information |
KR100776800B1 (ko) | 2006-06-16 | 2007-11-19 | 한국전자통신연구원 | 지능형 가제트를 이용한 맞춤형 서비스 제공 방법 및시스템 |
US7548895B2 (en) | 2006-06-30 | 2009-06-16 | Microsoft Corporation | Communication-prompted user assistance |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US8055502B2 (en) * | 2006-11-28 | 2011-11-08 | General Motors Llc | Voice dialing using a rejection reference |
US8600760B2 (en) * | 2006-11-28 | 2013-12-03 | General Motors Llc | Correcting substitution errors during automatic speech recognition by accepting a second best when first best is confusable |
US20080129520A1 (en) | 2006-12-01 | 2008-06-05 | Apple Computer, Inc. | Electronic device with enhanced audio feedback |
WO2008085742A2 (en) | 2007-01-07 | 2008-07-17 | Apple Inc. | Portable multifunction device, method and graphical user interface for interacting with user input elements in displayed content |
KR100883657B1 (ko) | 2007-01-26 | 2009-02-18 | 삼성전자주식회사 | 음성 인식 기반의 음악 검색 방법 및 장치 |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US7822608B2 (en) | 2007-02-27 | 2010-10-26 | Nuance Communications, Inc. | Disambiguating a speech recognition grammar in a multimodal application |
US20080221901A1 (en) | 2007-03-07 | 2008-09-11 | Joseph Cerra | Mobile general search environment speech processing facility |
US7801729B2 (en) | 2007-03-13 | 2010-09-21 | Sensory, Inc. | Using multiple attributes to create a voice search playlist |
US8219406B2 (en) | 2007-03-15 | 2012-07-10 | Microsoft Corporation | Speech-centric multimodal user interface design in mobile technology |
US7809610B2 (en) | 2007-04-09 | 2010-10-05 | Platformation, Inc. | Methods and apparatus for freshness and completeness of information |
US7983915B2 (en) | 2007-04-30 | 2011-07-19 | Sonic Foundry, Inc. | Audio content search engine |
US8055708B2 (en) | 2007-06-01 | 2011-11-08 | Microsoft Corporation | Multimedia spaces |
US8204238B2 (en) | 2007-06-08 | 2012-06-19 | Sensory, Inc | Systems and methods of sonic communication |
US8190627B2 (en) | 2007-06-28 | 2012-05-29 | Microsoft Corporation | Machine assisted query formulation |
US8019606B2 (en) | 2007-06-29 | 2011-09-13 | Microsoft Corporation | Identification and selection of a software application via speech |
JP2009036999A (ja) | 2007-08-01 | 2009-02-19 | Infocom Corp | コンピュータによる対話方法、対話システム、コンピュータプログラムおよびコンピュータに読み取り可能な記憶媒体 |
KR101359715B1 (ko) | 2007-08-24 | 2014-02-10 | 삼성전자주식회사 | 모바일 음성 웹 제공 방법 및 장치 |
WO2009029910A2 (en) | 2007-08-31 | 2009-03-05 | Proxpro, Inc. | Situation-aware personal information management for a mobile device |
US20090058823A1 (en) | 2007-09-04 | 2009-03-05 | Apple Inc. | Virtual Keyboards in Multi-Language Environment |
US8838760B2 (en) | 2007-09-14 | 2014-09-16 | Ricoh Co., Ltd. | Workflow-enabled provider |
KR100920267B1 (ko) | 2007-09-17 | 2009-10-05 | 한국전자통신연구원 | 음성 대화 분석 시스템 및 그 방법 |
US8706476B2 (en) | 2007-09-18 | 2014-04-22 | Ariadne Genomics, Inc. | Natural language processing method by analyzing primitive sentences, logical clauses, clause types and verbal blocks |
KR100919225B1 (ko) * | 2007-09-19 | 2009-09-28 | 한국전자통신연구원 | 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화오류 후처리 장치 및 방법 |
US8165886B1 (en) | 2007-10-04 | 2012-04-24 | Great Northern Research LLC | Speech interface system and method for control and interaction with applications on a computing system |
US8036901B2 (en) | 2007-10-05 | 2011-10-11 | Sensory, Incorporated | Systems and methods of performing speech recognition using sensory inputs of human position |
US20090112677A1 (en) | 2007-10-24 | 2009-04-30 | Rhett Randolph L | Method for automatically developing suggested optimal work schedules from unsorted group and individual task lists |
US7840447B2 (en) | 2007-10-30 | 2010-11-23 | Leonard Kleinrock | Pricing and auctioning of bundled items among multiple sellers and buyers |
US7983997B2 (en) | 2007-11-02 | 2011-07-19 | Florida Institute For Human And Machine Cognition, Inc. | Interactive complex task teaching system that allows for natural language input, recognizes a user's intent, and automatically performs tasks in document object model (DOM) nodes |
US8112280B2 (en) | 2007-11-19 | 2012-02-07 | Sensory, Inc. | Systems and methods of performing speech recognition with barge-in for use in a bluetooth system |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US8219407B1 (en) | 2007-12-27 | 2012-07-10 | Great Northern Research, LLC | Method for processing the output of a speech recognizer |
US8099289B2 (en) | 2008-02-13 | 2012-01-17 | Sensory, Inc. | Voice interface and search for electronic devices including bluetooth headsets and remote systems |
US8958848B2 (en) | 2008-04-08 | 2015-02-17 | Lg Electronics Inc. | Mobile terminal and menu control method thereof |
US8666824B2 (en) | 2008-04-23 | 2014-03-04 | Dell Products L.P. | Digital media content location and purchasing system |
US8285344B2 (en) | 2008-05-21 | 2012-10-09 | DP Technlogies, Inc. | Method and apparatus for adjusting audio for a user environment |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8694355B2 (en) | 2008-05-30 | 2014-04-08 | Sri International | Method and apparatus for automated assistance with task management |
US8423288B2 (en) | 2009-11-30 | 2013-04-16 | Apple Inc. | Dynamic alerts for calendar events |
US8166019B1 (en) | 2008-07-21 | 2012-04-24 | Sprint Communications Company L.P. | Providing suggested actions in response to textual communications |
US9200913B2 (en) | 2008-10-07 | 2015-12-01 | Telecommunication Systems, Inc. | User interface for predictive traffic |
US8140328B2 (en) | 2008-12-01 | 2012-03-20 | At&T Intellectual Property I, L.P. | User intention based on N-best list of recognition hypotheses for utterances in a dialog |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US8417526B2 (en) | 2009-03-13 | 2013-04-09 | Adacel, Inc. | Speech recognition learning system and method |
US9123341B2 (en) * | 2009-03-18 | 2015-09-01 | Robert Bosch Gmbh | System and method for multi-modal input synchronization and disambiguation |
US8805823B2 (en) | 2009-04-14 | 2014-08-12 | Sri International | Content processing systems and methods |
WO2010126321A2 (ko) | 2009-04-30 | 2010-11-04 | 삼성전자주식회사 | 멀티 모달 정보를 이용하는 사용자 의도 추론 장치 및 방법 |
KR101581883B1 (ko) | 2009-04-30 | 2016-01-11 | 삼성전자주식회사 | 모션 정보를 이용하는 음성 검출 장치 및 방법 |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
KR101562792B1 (ko) | 2009-06-10 | 2015-10-23 | 삼성전자주식회사 | 목표 예측 인터페이스 제공 장치 및 그 방법 |
US8527278B2 (en) | 2009-06-29 | 2013-09-03 | Abraham Ben David | Intelligent home automation |
US20110047072A1 (en) | 2009-08-07 | 2011-02-24 | Visa U.S.A. Inc. | Systems and Methods for Propensity Analysis and Validation |
US8768313B2 (en) | 2009-08-17 | 2014-07-01 | Digimarc Corporation | Methods and systems for image or audio recognition processing |
JP2011045005A (ja) * | 2009-08-24 | 2011-03-03 | Fujitsu Toshiba Mobile Communications Ltd | 携帯電話機 |
US9213558B2 (en) | 2009-09-02 | 2015-12-15 | Sri International | Method and apparatus for tailoring the output of an intelligent automated assistant to a user |
US8321527B2 (en) | 2009-09-10 | 2012-11-27 | Tribal Brands | System and method for tracking user location and associated activity and responsively providing mobile device updates |
KR20110036385A (ko) | 2009-10-01 | 2011-04-07 | 삼성전자주식회사 | 사용자 의도 분석 장치 및 방법 |
US20110099507A1 (en) | 2009-10-28 | 2011-04-28 | Google Inc. | Displaying a collection of interactive elements that trigger actions directed to an item |
US9197736B2 (en) | 2009-12-31 | 2015-11-24 | Digimarc Corporation | Intuitive computing methods and systems |
US20120137367A1 (en) | 2009-11-06 | 2012-05-31 | Cataphora, Inc. | Continuous anomaly detection based on behavior modeling and heterogeneous information analysis |
US9171541B2 (en) | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
US9502025B2 (en) | 2009-11-10 | 2016-11-22 | Voicebox Technologies Corporation | System and method for providing a natural language content dedication service |
US8712759B2 (en) | 2009-11-13 | 2014-04-29 | Clausal Computing Oy | Specializing disambiguation of a natural language expression |
KR101960835B1 (ko) | 2009-11-24 | 2019-03-21 | 삼성전자주식회사 | 대화 로봇을 이용한 일정 관리 시스템 및 그 방법 |
US8396888B2 (en) | 2009-12-04 | 2013-03-12 | Google Inc. | Location-based searching using a search area that corresponds to a geographical location of a computing device |
KR101622111B1 (ko) | 2009-12-11 | 2016-05-18 | 삼성전자 주식회사 | 대화 시스템 및 그의 대화 방법 |
US20110161309A1 (en) | 2009-12-29 | 2011-06-30 | Lx1 Technology Limited | Method Of Sorting The Result Set Of A Search Engine |
US8494852B2 (en) | 2010-01-05 | 2013-07-23 | Google Inc. | Word-level correction of speech input |
US8334842B2 (en) | 2010-01-15 | 2012-12-18 | Microsoft Corporation | Recognizing user intent in motion capture system |
US8626511B2 (en) | 2010-01-22 | 2014-01-07 | Google Inc. | Multi-dimensional disambiguation of voice commands |
US20110218855A1 (en) | 2010-03-03 | 2011-09-08 | Platformation, Inc. | Offering Promotions Based on Query Analysis |
US8265928B2 (en) | 2010-04-14 | 2012-09-11 | Google Inc. | Geotagged environmental audio for enhanced speech recognition accuracy |
US20110279368A1 (en) | 2010-05-12 | 2011-11-17 | Microsoft Corporation | Inferring user intent to engage a motion capture system |
US8694313B2 (en) | 2010-05-19 | 2014-04-08 | Google Inc. | Disambiguation of contact information using historical data |
US8522283B2 (en) | 2010-05-20 | 2013-08-27 | Google Inc. | Television remote control data transfer |
US8468012B2 (en) | 2010-05-26 | 2013-06-18 | Google Inc. | Acoustic model adaptation using geographic information |
US20110306426A1 (en) | 2010-06-10 | 2011-12-15 | Microsoft Corporation | Activity Participation Based On User Intent |
US8234111B2 (en) | 2010-06-14 | 2012-07-31 | Google Inc. | Speech and noise models for speech recognition |
US8411874B2 (en) | 2010-06-30 | 2013-04-02 | Google Inc. | Removing noise from audio |
US8775156B2 (en) | 2010-08-05 | 2014-07-08 | Google Inc. | Translating languages in response to device motion |
US8359020B2 (en) | 2010-08-06 | 2013-01-22 | Google Inc. | Automatically monitoring for voice input based on context |
US8473289B2 (en) | 2010-08-06 | 2013-06-25 | Google Inc. | Disambiguating input based on context |
CN102074231A (zh) * | 2010-12-30 | 2011-05-25 | 万音达有限公司 | 语音识别方法和语音识别系统 |
JP5670802B2 (ja) * | 2011-03-31 | 2015-02-18 | 水ing株式会社 | 固形燃料製造方法、その装置、及び固形燃料 |
KR20140039194A (ko) | 2011-04-25 | 2014-04-01 | 비비오, 인크. | 지능형 개인용 타임라인 보조 시스템 및 방법 |
-
2011
- 2011-09-28 US US13/247,912 patent/US8762156B2/en not_active Expired - Fee Related
-
2012
- 2012-09-24 AU AU2012227294A patent/AU2012227294B2/en not_active Ceased
- 2012-09-26 EP EP20120186113 patent/EP2587478A3/en not_active Ceased
- 2012-09-27 KR KR1020120108099A patent/KR101418163B1/ko not_active IP Right Cessation
- 2012-09-27 JP JP2012214570A patent/JP2013073240A/ja active Pending
- 2012-09-28 CN CN201510922714.2A patent/CN105336326A/zh active Pending
- 2012-09-28 CN CN201210369739.0A patent/CN103035240B/zh not_active Expired - Fee Related
-
2014
- 2014-03-21 KR KR1020140033255A patent/KR20140047633A/ko not_active Application Discontinuation
- 2014-06-05 US US14/297,473 patent/US8812316B1/en not_active Expired - Fee Related
- 2014-08-26 JP JP2014171991A patent/JP2015018265A/ja active Pending
-
2015
- 2015-08-07 AU AU2015210460A patent/AU2015210460B2/en not_active Ceased
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0863330A (ja) * | 1994-08-17 | 1996-03-08 | Fujitsu Ltd | 音声入力装置 |
JP2004534268A (ja) * | 2001-06-27 | 2004-11-11 | テレローグ,インコーポレイティド | 自動アテンダントによって使用される情報を前処理するシステムと方法 |
JP2005181386A (ja) * | 2003-12-16 | 2005-07-07 | Mitsubishi Electric Corp | 音声対話処理装置及び音声対話処理方法並びにプログラム |
JP2008097003A (ja) * | 2006-10-12 | 2008-04-24 | Qnx Software Systems (Wavemakers) Inc | 自動音声認識システムに対する適応コンテキスト |
JP2010535377A (ja) * | 2007-08-01 | 2010-11-18 | ジンジャー ソフトウェア、インコーポレイティッド | インターネットコーパスを用いた、文脈依存言語の自動的な修正および改善 |
WO2011093025A1 (ja) * | 2010-01-29 | 2011-08-04 | 日本電気株式会社 | 入力支援システム、方法、およびプログラム |
Cited By (208)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US11928604B2 (en) | 2005-09-08 | 2024-03-12 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US11979836B2 (en) | 2007-04-03 | 2024-05-07 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US11671920B2 (en) | 2007-04-03 | 2023-06-06 | Apple Inc. | Method and system for operating a multifunction portable electronic device using voice-activation |
US11023513B2 (en) | 2007-12-20 | 2021-06-01 | Apple Inc. | Method and apparatus for searching using an active ontology |
US10381016B2 (en) | 2008-01-03 | 2019-08-13 | Apple Inc. | Methods and apparatus for altering audio output signals |
US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
US10108612B2 (en) | 2008-07-31 | 2018-10-23 | Apple Inc. | Mobile device having human language translation capability with positional feedback |
US11900936B2 (en) | 2008-10-02 | 2024-02-13 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US11348582B2 (en) | 2008-10-02 | 2022-05-31 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10643611B2 (en) | 2008-10-02 | 2020-05-05 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US11080012B2 (en) | 2009-06-05 | 2021-08-03 | Apple Inc. | Interface for a virtual digital assistant |
US10795541B2 (en) | 2009-06-05 | 2020-10-06 | Apple Inc. | Intelligent organization of tasks items |
US10741185B2 (en) | 2010-01-18 | 2020-08-11 | Apple Inc. | Intelligent automated assistant |
US11423886B2 (en) | 2010-01-18 | 2022-08-23 | Apple Inc. | Task flow identification based on user intent |
US10706841B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Task flow identification based on user intent |
US10692504B2 (en) | 2010-02-25 | 2020-06-23 | Apple Inc. | User profiling for voice input processing |
US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
US10417405B2 (en) | 2011-03-21 | 2019-09-17 | Apple Inc. | Device access using voice authentication |
US11350253B2 (en) | 2011-06-03 | 2022-05-31 | Apple Inc. | Active transport based notifications |
US11120372B2 (en) | 2011-06-03 | 2021-09-14 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US11069336B2 (en) | 2012-03-02 | 2021-07-20 | Apple Inc. | Systems and methods for name pronunciation |
US11321116B2 (en) | 2012-05-15 | 2022-05-03 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US11269678B2 (en) | 2012-05-15 | 2022-03-08 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US9971774B2 (en) | 2012-09-19 | 2018-05-15 | Apple Inc. | Voice-based media searching |
US10714117B2 (en) | 2013-02-07 | 2020-07-14 | Apple Inc. | Voice trigger for a digital assistant |
US11862186B2 (en) | 2013-02-07 | 2024-01-02 | Apple Inc. | Voice trigger for a digital assistant |
US10978090B2 (en) | 2013-02-07 | 2021-04-13 | Apple Inc. | Voice trigger for a digital assistant |
US11636869B2 (en) | 2013-02-07 | 2023-04-25 | Apple Inc. | Voice trigger for a digital assistant |
US11557310B2 (en) | 2013-02-07 | 2023-01-17 | Apple Inc. | Voice trigger for a digital assistant |
US11388291B2 (en) | 2013-03-14 | 2022-07-12 | Apple Inc. | System and method for processing voicemail |
US11798547B2 (en) | 2013-03-15 | 2023-10-24 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US10657961B2 (en) | 2013-06-08 | 2020-05-19 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US11727219B2 (en) | 2013-06-09 | 2023-08-15 | Apple Inc. | System and method for inferring user intent from speech inputs |
US10769385B2 (en) | 2013-06-09 | 2020-09-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US11048473B2 (en) | 2013-06-09 | 2021-06-29 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US10791216B2 (en) | 2013-08-06 | 2020-09-29 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
JP2016534616A (ja) * | 2013-08-06 | 2016-11-04 | アップル インコーポレイテッド | リモート機器からの作動に基づくスマート応答の自動作動 |
JP7005552B2 (ja) | 2013-09-26 | 2022-01-21 | グーグル エルエルシー | 車両にナビゲーションデータを提供するためのシステムおよび方法 |
JP2019144265A (ja) * | 2013-09-26 | 2019-08-29 | グーグル エルエルシー | 車両にナビゲーションデータを提供するためのシステムおよび方法 |
US11314370B2 (en) | 2013-12-06 | 2022-04-26 | Apple Inc. | Method for extracting salient dialog usage from live data |
US10497365B2 (en) | 2014-05-30 | 2019-12-03 | Apple Inc. | Multi-command single utterance input method |
US10417344B2 (en) | 2014-05-30 | 2019-09-17 | Apple Inc. | Exemplar-based natural language processing |
US11257504B2 (en) | 2014-05-30 | 2022-02-22 | Apple Inc. | Intelligent assistant for home automation |
US10878809B2 (en) | 2014-05-30 | 2020-12-29 | Apple Inc. | Multi-command single utterance input method |
US10083690B2 (en) | 2014-05-30 | 2018-09-25 | Apple Inc. | Better resolution when referencing to concepts |
US10657966B2 (en) | 2014-05-30 | 2020-05-19 | Apple Inc. | Better resolution when referencing to concepts |
US10714095B2 (en) | 2014-05-30 | 2020-07-14 | Apple Inc. | Intelligent assistant for home automation |
US11699448B2 (en) | 2014-05-30 | 2023-07-11 | Apple Inc. | Intelligent assistant for home automation |
US11810562B2 (en) | 2014-05-30 | 2023-11-07 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US11133008B2 (en) | 2014-05-30 | 2021-09-28 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US11670289B2 (en) | 2014-05-30 | 2023-06-06 | Apple Inc. | Multi-command single utterance input method |
US10699717B2 (en) | 2014-05-30 | 2020-06-30 | Apple Inc. | Intelligent assistant for home automation |
US11838579B2 (en) | 2014-06-30 | 2023-12-05 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US11516537B2 (en) | 2014-06-30 | 2022-11-29 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10904611B2 (en) | 2014-06-30 | 2021-01-26 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10431204B2 (en) | 2014-09-11 | 2019-10-01 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10453443B2 (en) | 2014-09-30 | 2019-10-22 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
US10390213B2 (en) | 2014-09-30 | 2019-08-20 | Apple Inc. | Social reminders |
US10438595B2 (en) | 2014-09-30 | 2019-10-08 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US11231904B2 (en) | 2015-03-06 | 2022-01-25 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US10930282B2 (en) | 2015-03-08 | 2021-02-23 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US10529332B2 (en) | 2015-03-08 | 2020-01-07 | Apple Inc. | Virtual assistant activation |
US11842734B2 (en) | 2015-03-08 | 2023-12-12 | Apple Inc. | Virtual assistant activation |
US10311871B2 (en) | 2015-03-08 | 2019-06-04 | Apple Inc. | Competing devices responding to voice triggers |
US11087759B2 (en) | 2015-03-08 | 2021-08-10 | Apple Inc. | Virtual assistant activation |
US11468282B2 (en) | 2015-05-15 | 2022-10-11 | Apple Inc. | Virtual assistant in a communication session |
US11070949B2 (en) | 2015-05-27 | 2021-07-20 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display |
US11127397B2 (en) | 2015-05-27 | 2021-09-21 | Apple Inc. | Device voice control |
US10681212B2 (en) | 2015-06-05 | 2020-06-09 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10356243B2 (en) | 2015-06-05 | 2019-07-16 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US11947873B2 (en) | 2015-06-29 | 2024-04-02 | Apple Inc. | Virtual assistant for media playback |
US11010127B2 (en) | 2015-06-29 | 2021-05-18 | Apple Inc. | Virtual assistant for media playback |
US11126400B2 (en) | 2015-09-08 | 2021-09-21 | Apple Inc. | Zero latency digital assistant |
US11809483B2 (en) | 2015-09-08 | 2023-11-07 | Apple Inc. | Intelligent automated assistant for media search and playback |
US11500672B2 (en) | 2015-09-08 | 2022-11-15 | Apple Inc. | Distributed personal assistant |
US11550542B2 (en) | 2015-09-08 | 2023-01-10 | Apple Inc. | Zero latency digital assistant |
US11853536B2 (en) | 2015-09-08 | 2023-12-26 | Apple Inc. | Intelligent automated assistant in a media environment |
US11954405B2 (en) | 2015-09-08 | 2024-04-09 | Apple Inc. | Zero latency digital assistant |
US11526368B2 (en) | 2015-11-06 | 2022-12-13 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US11809886B2 (en) | 2015-11-06 | 2023-11-07 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US11886805B2 (en) | 2015-11-09 | 2024-01-30 | Apple Inc. | Unconventional virtual assistant interactions |
US10354652B2 (en) | 2015-12-02 | 2019-07-16 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10942703B2 (en) | 2015-12-23 | 2021-03-09 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US11069347B2 (en) | 2016-06-08 | 2021-07-20 | Apple Inc. | Intelligent automated assistant for media exploration |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US11657820B2 (en) | 2016-06-10 | 2023-05-23 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US11037565B2 (en) | 2016-06-10 | 2021-06-15 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US11152002B2 (en) | 2016-06-11 | 2021-10-19 | Apple Inc. | Application integration with a digital assistant |
US10942702B2 (en) | 2016-06-11 | 2021-03-09 | Apple Inc. | Intelligent device arbitration and control |
US10580409B2 (en) | 2016-06-11 | 2020-03-03 | Apple Inc. | Application integration with a digital assistant |
US11809783B2 (en) | 2016-06-11 | 2023-11-07 | Apple Inc. | Intelligent device arbitration and control |
US11749275B2 (en) | 2016-06-11 | 2023-09-05 | Apple Inc. | Application integration with a digital assistant |
JP2018040904A (ja) * | 2016-09-06 | 2018-03-15 | トヨタ自動車株式会社 | 音声認識装置および音声認識方法 |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10553215B2 (en) | 2016-09-23 | 2020-02-04 | Apple Inc. | Intelligent automated assistant |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US11656884B2 (en) | 2017-01-09 | 2023-05-23 | Apple Inc. | Application integration with a digital assistant |
WO2018135302A1 (ja) * | 2017-01-18 | 2018-07-26 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
US11107469B2 (en) | 2017-01-18 | 2021-08-31 | Sony Corporation | Information processing apparatus and information processing method |
JP7107228B2 (ja) | 2017-01-18 | 2022-07-27 | ソニーグループ株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
JPWO2018135302A1 (ja) * | 2017-01-18 | 2019-11-21 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10332518B2 (en) | 2017-05-09 | 2019-06-25 | Apple Inc. | User interface for correcting recognition errors |
US10741181B2 (en) | 2017-05-09 | 2020-08-11 | Apple Inc. | User interface for correcting recognition errors |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US11467802B2 (en) | 2017-05-11 | 2022-10-11 | Apple Inc. | Maintaining privacy of personal information |
US11599331B2 (en) | 2017-05-11 | 2023-03-07 | Apple Inc. | Maintaining privacy of personal information |
US10847142B2 (en) | 2017-05-11 | 2020-11-24 | Apple Inc. | Maintaining privacy of personal information |
US10755703B2 (en) | 2017-05-11 | 2020-08-25 | Apple Inc. | Offline personal assistant |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US11405466B2 (en) | 2017-05-12 | 2022-08-02 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US11380310B2 (en) | 2017-05-12 | 2022-07-05 | Apple Inc. | Low-latency intelligent automated assistant |
US11538469B2 (en) | 2017-05-12 | 2022-12-27 | Apple Inc. | Low-latency intelligent automated assistant |
US11580990B2 (en) | 2017-05-12 | 2023-02-14 | Apple Inc. | User-specific acoustic models |
US10410637B2 (en) | 2017-05-12 | 2019-09-10 | Apple Inc. | User-specific acoustic models |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10789945B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Low-latency intelligent automated assistant |
US11862151B2 (en) | 2017-05-12 | 2024-01-02 | Apple Inc. | Low-latency intelligent automated assistant |
US11837237B2 (en) | 2017-05-12 | 2023-12-05 | Apple Inc. | User-specific acoustic models |
US10482874B2 (en) | 2017-05-15 | 2019-11-19 | Apple Inc. | Hierarchical belief states for digital assistants |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US11217255B2 (en) | 2017-05-16 | 2022-01-04 | Apple Inc. | Far-field extension for digital assistant services |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10909171B2 (en) | 2017-05-16 | 2021-02-02 | Apple Inc. | Intelligent automated assistant for media exploration |
US11532306B2 (en) | 2017-05-16 | 2022-12-20 | Apple Inc. | Detecting a trigger of a digital assistant |
US10748546B2 (en) | 2017-05-16 | 2020-08-18 | Apple Inc. | Digital assistant services based on device capabilities |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US11675829B2 (en) | 2017-05-16 | 2023-06-13 | Apple Inc. | Intelligent automated assistant for media exploration |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10867596B2 (en) | 2017-08-09 | 2020-12-15 | Lenovo (Singapore) Pte. Ltd. | Voice assistant system, server apparatus, device, voice assistant method therefor, and program to be executed by computer |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US11710482B2 (en) | 2018-03-26 | 2023-07-25 | Apple Inc. | Natural assistant interaction |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
JP2021073567A (ja) * | 2018-04-11 | 2021-05-13 | 百度在線網絡技術(北京)有限公司 | 音声制御方法、端末機器、クラウドサーバ及びシステム |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11854539B2 (en) | 2018-05-07 | 2023-12-26 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11907436B2 (en) | 2018-05-07 | 2024-02-20 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11169616B2 (en) | 2018-05-07 | 2021-11-09 | Apple Inc. | Raise to speak |
US11900923B2 (en) | 2018-05-07 | 2024-02-13 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11487364B2 (en) | 2018-05-07 | 2022-11-01 | Apple Inc. | Raise to speak |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US10684703B2 (en) | 2018-06-01 | 2020-06-16 | Apple Inc. | Attention aware virtual assistant dismissal |
US11630525B2 (en) | 2018-06-01 | 2023-04-18 | Apple Inc. | Attention aware virtual assistant dismissal |
US11360577B2 (en) | 2018-06-01 | 2022-06-14 | Apple Inc. | Attention aware virtual assistant dismissal |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US11009970B2 (en) | 2018-06-01 | 2021-05-18 | Apple Inc. | Attention aware virtual assistant dismissal |
US10720160B2 (en) | 2018-06-01 | 2020-07-21 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10403283B1 (en) | 2018-06-01 | 2019-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11495218B2 (en) | 2018-06-01 | 2022-11-08 | Apple Inc. | Virtual assistant operation in multi-device environments |
US10984798B2 (en) | 2018-06-01 | 2021-04-20 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11431642B2 (en) | 2018-06-01 | 2022-08-30 | Apple Inc. | Variable latency device coordination |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US10504518B1 (en) | 2018-06-03 | 2019-12-10 | Apple Inc. | Accelerated task performance |
US10944859B2 (en) | 2018-06-03 | 2021-03-09 | Apple Inc. | Accelerated task performance |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11893992B2 (en) | 2018-09-28 | 2024-02-06 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11783815B2 (en) | 2019-03-18 | 2023-10-10 | Apple Inc. | Multimodality in digital assistant systems |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11217251B2 (en) | 2019-05-06 | 2022-01-04 | Apple Inc. | Spoken notifications |
US11675491B2 (en) | 2019-05-06 | 2023-06-13 | Apple Inc. | User configurable task triggers |
US11705130B2 (en) | 2019-05-06 | 2023-07-18 | Apple Inc. | Spoken notifications |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11888791B2 (en) | 2019-05-21 | 2024-01-30 | Apple Inc. | Providing message response suggestions |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11657813B2 (en) | 2019-05-31 | 2023-05-23 | Apple Inc. | Voice identification in digital assistant systems |
US11360739B2 (en) | 2019-05-31 | 2022-06-14 | Apple Inc. | User activity shortcut suggestions |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11237797B2 (en) | 2019-05-31 | 2022-02-01 | Apple Inc. | User activity shortcut suggestions |
US11790914B2 (en) | 2019-06-01 | 2023-10-17 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11914848B2 (en) | 2020-05-11 | 2024-02-27 | Apple Inc. | Providing relevant data items based on context |
US11924254B2 (en) | 2020-05-11 | 2024-03-05 | Apple Inc. | Digital assistant hardware abstraction |
US11765209B2 (en) | 2020-05-11 | 2023-09-19 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11838734B2 (en) | 2020-07-20 | 2023-12-05 | Apple Inc. | Multi-device audio adjustment coordination |
US11750962B2 (en) | 2020-07-21 | 2023-09-05 | Apple Inc. | User identification using headphones |
US11696060B2 (en) | 2020-07-21 | 2023-07-04 | Apple Inc. | User identification using headphones |
Also Published As
Publication number | Publication date |
---|---|
AU2015210460A1 (en) | 2015-09-03 |
KR20130034630A (ko) | 2013-04-05 |
EP2587478A3 (en) | 2014-05-28 |
CN103035240B (zh) | 2015-11-25 |
KR20140047633A (ko) | 2014-04-22 |
US8812316B1 (en) | 2014-08-19 |
US8762156B2 (en) | 2014-06-24 |
CN103035240A (zh) | 2013-04-10 |
KR101418163B1 (ko) | 2014-07-09 |
AU2015210460B2 (en) | 2017-04-13 |
US20130080177A1 (en) | 2013-03-28 |
JP2015018265A (ja) | 2015-01-29 |
AU2012227294B2 (en) | 2015-05-07 |
EP2587478A2 (en) | 2013-05-01 |
CN105336326A (zh) | 2016-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2015210460B2 (en) | Speech recognition repair using contextual information | |
US20200364411A1 (en) | System and method for inferring user intent from speech inputs | |
US10847160B2 (en) | Using two automated speech recognizers for speech recognition | |
US10089982B2 (en) | Voice action biasing system | |
US9905228B2 (en) | System and method of performing automatic speech recognition using local private data | |
JP6588637B2 (ja) | 個別化されたエンティティ発音の学習 | |
EP2994908B1 (en) | Incremental speech input interface with real time feedback | |
KR101912058B1 (ko) | 자연어 음성 서비스 환경에서 하이브리드 처리를 위한 시스템 및 방법 | |
US8738375B2 (en) | System and method for optimizing speech recognition and natural language parameters with user feedback | |
CN113948083A (zh) | 基于用户反馈来改善自动语音识别 | |
US8126715B2 (en) | Facilitating multimodal interaction with grammar-based speech applications | |
US11582174B1 (en) | Messaging content data storage | |
US11632345B1 (en) | Message management for communal account | |
US11450325B1 (en) | Natural language processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130821 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130902 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131129 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140428 |