JP2017507352A - 発話者の検証のための動的な閾値 - Google Patents
発話者の検証のための動的な閾値 Download PDFInfo
- Publication number
- JP2017507352A JP2017507352A JP2016549233A JP2016549233A JP2017507352A JP 2017507352 A JP2017507352 A JP 2017507352A JP 2016549233 A JP2016549233 A JP 2016549233A JP 2016549233 A JP2016549233 A JP 2016549233A JP 2017507352 A JP2017507352 A JP 2017507352A
- Authority
- JP
- Japan
- Prior art keywords
- speaker verification
- data set
- data
- ambient
- selecting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012795 verification Methods 0.000 title claims abstract description 185
- 238000000034 method Methods 0.000 claims abstract description 35
- 230000009471 action Effects 0.000 claims description 10
- 230000005236 sound signal Effects 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 abstract description 18
- 230000015654 memory Effects 0.000 description 44
- 238000004891 communication Methods 0.000 description 24
- 238000012545 processing Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 14
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013432 robust analysis Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/14—Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/20—Pattern transformations or operations aimed at increasing system robustness, e.g. against channel noise or different working conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/08—Use of distortion metrics or a particular distance between probe pattern and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/12—Score normalisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/38—Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections
- H04M3/382—Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections using authorisation codes or passwords
- H04M3/385—Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections using authorisation codes or passwords using speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Computational Linguistics (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
- Debugging And Monitoring (AREA)
Abstract
Description
本出願は、2014年6月24日に出願した米国特許出願第62/016,384号および2014年7月25日に出願した米国特許出願第14/340,720号の優先権を主張するものであり、これらの特許出願の内容は、参照により組み込まれる。
102 ユーザ
104 発話
106 コンピューティングデバイス
108 周辺環境
110 バッファリングされた音声
112 エンドポインタ
114 話以外の音声
116 話の音声
118 ホットワーダ
120 発話者検証モジュール
122 発話者検証信頼性スコア
124 スコアラ
125 周囲状況ディテクタ
126 周囲状況データ
128 閾値
130 データセット
132 サンプルクラスタラ
134 その他のユーザ
136 第2の発話者検証モジュール
138 正確性フィードバックモジュール
140 データセットクラスタ
142 データセットクラスタ
144 データセットクラスタ
146 閾値セレクタ
148 選択基準
150 発話者検証閾値テーブル
152 その他のコンピューティングデバイス
160 サーバ
200 プロセス
300 コンピューティングデバイス
302 プロセッサ
304 メモリ
306 ストレージデバイス
308 高速インターフェース
310 高速拡張ポート
312 低速インターフェース
314 低速拡張ポート
316 ディスプレイ
320 サーバ
322 ラップトップコンピュータ
324 ラックサーバシステム
350 モバイルコンピューティングデバイス
352 プロセッサ
354 ディスプレイ
356 ディスプレイインターフェース
358 制御インターフェース
364 メモリ
366 通信インターフェース
368 トランシーバ
370 GPS(全地球測位システム)受信機モジュール
372 拡張インターフェース
374 拡張メモリ
380 セルラー電話
382 スマートフォン
Claims (20)
- コンピュータによって実施される方法であって、
ホットワードの複数の発話の各々に関して、少なくとも(i)前記発話に関連する発話者検証信頼性スコアおよび(ii)前記発話に関連する周囲状況データを含むデータセットを受け取るステップと、
特定の周囲の状況に関連する前記データセットのサブセットを前記データセットの中から選択するステップと、
1つまたは複数の選択基準に基づいて前記データセットのサブセットの中から特定のデータセットを選択するステップと、
前記特定のデータセットに含まれる前記発話者検証信頼性スコアを、前記特定の周囲の状況のための発話者検証閾値として選択するステップと、
前記特定の周囲の状況に関連する発話の発話者の検証を実行する際に使用するための前記発話者検証閾値を提供するステップとを含む、方法。 - 前記周囲状況データが、前記発話の受け取りの直前に検出された雑音の量を明らかにする請求項1に記載の方法。
- 前記周囲状況データが、前記発話の大きさを明らかにする請求項1に記載の方法。
- 前記周囲状況データが、前記発話を符号化する音声信号の大きさの信号対雑音比を明らかにする請求項1に記載の方法。
- 前記1つまたは複数の選択基準が、経験的に定義された棄却率である請求項1に記載の方法。
- 前記発話に関連するトリガ後正確性インジケータによって前記データセットにラベル付けするステップを含む請求項1に記載の方法。
- 異なる第2の発話者検証信頼性スコアによって前記データセットにラベル付けするステップを含む請求項1に記載の方法。
- 前記データセットが、それぞれ、前記発話を符号化する音声信号をさらに含む請求項1に記載の方法。
- 特定の周囲の状況に関連する前記データセットのサブセットを前記データセットの中から選択するステップが、
周囲状況データの範囲を決定するステップと、
前記周囲状況データの範囲内の前記発話に関連する前記周囲状況データを含む前記データセットのサブセットを選択するステップとを含む請求項1に記載の方法。 - 1つまたは複数の選択基準に基づいて前記データセットのサブセットの中から特定のデータセットを選択するステップが、
前記1つまたは複数の選択基準に基づいて閾値を決定するステップと、
前記データセットのサブセット内のその他のデータセット未満だけ前記閾値を満たす前記特定のデータセットを前記データセットのサブセットの中から特定するステップとを含む請求項1に記載の方法。 - それぞれの特定の周囲の状況にそれぞれが関連する前記データセットの複数のサブセットを前記データセットの中から選択するステップと、
前記1つまたは複数の選択基準に基づいて、複数の特定のデータセットを選択するステップであって、それぞれの特定のデータセットが、前記データセットのそれぞれのサブセットの中からのものである、ステップと、
それぞれの特定のデータセットに含まれる複数の発話者検証信頼性スコアを、複数の発話者検証閾値として選択するステップであって、前記発話者検証閾値の各々が、前記それぞれの特定の周囲の状況のためのものである、ステップと、
前記それぞれの特定の周囲の状況に関連する発話の発話者の検証を実行する際に使用するための前記複数の発話者検証閾値を提供するステップとを含む請求項1に記載の方法。 - それぞれのユーザにそれぞれが関連する前記データセットの複数のサブセットを前記データセットの中から選択するステップと、
前記1つまたは複数の選択基準に基づいて、複数の特定のデータセットを選択するステップであって、それぞれの特定のデータセットが、前記データセットのそれぞれのサブセットの中からのものである、ステップと、
それぞれの特定のデータセットに含まれる複数の発話者検証信頼性スコアを、複数の発話者検証閾値として選択するステップであって、前記発話者検証閾値の各々が、前記それぞれのユーザのためのものである、ステップと、
前記それぞれのユーザに関連する発話の発話者の検証を実行する際に使用するための前記複数の発話者検証閾値を提供するステップとを含む請求項1に記載の方法。 - 前記特定の周囲の状況に関連する発話の発話者の検証を実行する際に使用するための前記発話者検証閾値を提供するステップが、
周囲状況データの範囲および前記周囲状況データの範囲のための発話者検証閾値をユーザデバイスに提供するステップを含む請求項1に記載の方法。 - 1つまたは複数のコンピュータと、前記1つまたは複数のコンピュータによって実行されるときに前記1つまたは複数のコンピュータに
ホットワードの複数の発話の各々に関して、少なくとも(i)前記発話に関連する発話者検証信頼性スコアおよび(ii)前記発話に関連する周囲状況データを含むデータセットを受け取ること、
特定の周囲の状況に関連する前記データセットのサブセットを前記データセットの中から選択すること、
1つまたは複数の選択基準に基づいて前記データセットのサブセットの中から特定のデータセットを選択すること、
前記特定のデータセットに含まれる前記発話者検証信頼性スコアを、前記特定の周囲の状況のための発話者検証閾値として選択すること、ならびに
前記特定の周囲の状況に関連する発話の発話者の検証を実行する際に使用するための前記発話者検証閾値を提供することを含む動作を実行させるように動作可能である命令を記憶する1つまたは複数のストレージデバイスとを含むシステム。 - 特定の周囲の状況に関連する前記データセットのサブセットを前記データセットの中から選択することが、
周囲状況データの範囲を決定することと、
前記周囲状況データの範囲内の前記発話に関連する前記周囲状況データを含む前記データセットのサブセットを選択することとを含む請求項14に記載のシステム。 - 1つまたは複数の選択基準に基づいてデータセットの前記サブセットの中から特定のデータセットを選択することが、
前記1つまたは複数の選択基準に基づいて閾値を決定することと、
前記データセットのサブセット内のその他のデータセット未満だけ前記閾値を満たす前記特定のデータセットを前記データセットのサブセットの中から特定することとを含む請求項14に記載のシステム。 - 前記動作が、
それぞれの特定の周囲の状況にそれぞれが関連する前記データセットの複数のサブセットを前記データセットの中から選択することと、
前記1つまたは複数の選択基準に基づいて、複数の特定のデータセットを選択することであって、それぞれの特定のデータセットが、前記データセットのそれぞれのサブセットの中からのものである、選択することと、
それぞれの特定のデータセットに含まれる複数の発話者検証信頼性スコアを、複数の発話者検証閾値として選択することであって、前記発話者検証閾値の各々が、前記それぞれの特定の周囲の状況のためのものである、選択することと、
前記それぞれの特定の周囲の状況に関連する発話の発話者の検証を実行する際に使用するための前記複数の発話者検証閾値を提供することとをさらに含む請求項14に記載のシステム。 - 前記動作が、
それぞれのユーザにそれぞれが関連する前記データセットの複数のサブセットを前記データセットの中から選択することと、
前記1つまたは複数の選択基準に基づいて、複数の特定のデータセットを選択することであって、それぞれの特定のデータセットが、前記データセットのそれぞれのサブセットの中からのものである、選択することと、
それぞれの特定のデータセットに含まれる複数の発話者検証信頼性スコアを、複数の発話者検証閾値として選択することであって、前記発話者検証閾値の各々が、前記それぞれのユーザのためのものである、選択することと、
前記それぞれのユーザに関連する発話の発話者の検証を実行する際に使用するための前記複数の発話者検証閾値を提供することとをさらに含む請求項14に記載のシステム。 - 前記特定の周囲の状況に関連する発話の発話者の検証を実行する際に使用するための前記発話者検証閾値を提供することが、
周囲状況データの範囲および前記周囲状況データの範囲のための発話者検証閾値をユーザデバイスに提供することを含む請求項14に記載のシステム。 - 1つまたは複数のコンピュータによって実行され得る命令を含むソフトウェアを記憶するコンピュータ可読記憶媒体であって、前記命令が、そのように実行されると、前記1つまたは複数のコンピュータに
ホットワードの複数の発話の各々に関して、少なくとも(i)前記発話に関連する発話者検証信頼性スコアおよび(ii)前記発話に関連する周囲状況データを含むデータセットを受け取ることと、
特定の周囲の状況に関連する前記データセットのサブセットを前記データセットの中から選択することと、
1つまたは複数の選択基準に基づいて前記データセットのサブセットの中から特定のデータセットを選択することと、
前記特定のデータセットに含まれる前記発話者検証信頼性スコアを、前記特定の周囲の状況のための発話者検証閾値として選択することと、
前記特定の周囲の状況に関連する発話の発話者の検証を実行する際に使用するための前記発話者検証閾値を提供することとを含む動作を実行させる、コンピュータ可読記憶媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462016384P | 2014-06-24 | 2014-06-24 | |
US62/016,384 | 2014-06-24 | ||
US14/340,720 | 2014-07-25 | ||
US14/340,720 US9384738B2 (en) | 2014-06-24 | 2014-07-25 | Dynamic threshold for speaker verification |
PCT/US2015/028859 WO2015199813A1 (en) | 2014-06-24 | 2015-05-01 | Dynamic threshold for speaker verification |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016151822A Division JP6474762B2 (ja) | 2014-06-24 | 2016-08-02 | 発話者の検証のための動的な閾値 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017507352A true JP2017507352A (ja) | 2017-03-16 |
JP6474827B2 JP6474827B2 (ja) | 2019-02-27 |
Family
ID=54870212
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016549233A Active JP6474827B2 (ja) | 2014-06-24 | 2015-05-01 | 発話者の検証のための動的な閾値 |
JP2016151822A Active JP6474762B2 (ja) | 2014-06-24 | 2016-08-02 | 発話者の検証のための動的な閾値 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016151822A Active JP6474762B2 (ja) | 2014-06-24 | 2016-08-02 | 発話者の検証のための動的な閾値 |
Country Status (6)
Country | Link |
---|---|
US (4) | US9384738B2 (ja) |
EP (4) | EP3537434B1 (ja) |
JP (2) | JP6474827B2 (ja) |
KR (4) | KR101824158B1 (ja) |
CN (2) | CN105960628B (ja) |
WO (1) | WO2015199813A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020112778A (ja) * | 2019-01-11 | 2020-07-27 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 音声対話設備のウェイクアップ方法、装置、設備及び記憶媒体 |
Families Citing this family (196)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
LT4913B (lt) | 2000-06-15 | 2002-05-27 | G. Uždavinio Įmonė "Žara" | Grūdų produkto receptūrinė kompozicija |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
DE212014000045U1 (de) | 2013-02-07 | 2015-09-24 | Apple Inc. | Sprach-Trigger für einen digitalen Assistenten |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10541997B2 (en) | 2016-12-30 | 2020-01-21 | Google Llc | Authentication of packetized audio signals |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US10719591B1 (en) | 2013-03-15 | 2020-07-21 | Google Llc | Authentication of audio-based input signals |
US11064250B2 (en) | 2013-03-15 | 2021-07-13 | Google Llc | Presence and authentication for media measurement |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
AU2014278592B2 (en) | 2013-06-09 | 2017-09-07 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
WO2015020942A1 (en) | 2013-08-06 | 2015-02-12 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
AU2015266863B2 (en) | 2014-05-30 | 2018-03-15 | Apple Inc. | Multi-command single utterance input method |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US11942095B2 (en) * | 2014-07-18 | 2024-03-26 | Google Llc | Speaker verification using co-location information |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US9542941B1 (en) * | 2015-10-01 | 2017-01-10 | Lenovo (Singapore) Pte. Ltd. | Situationally suspending wakeup word to enable voice command input |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10311219B2 (en) * | 2016-06-07 | 2019-06-04 | Vocalzoom Systems Ltd. | Device, system, and method of user authentication utilizing an optical microphone |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10438583B2 (en) * | 2016-07-20 | 2019-10-08 | Lenovo (Singapore) Pte. Ltd. | Natural language voice assistant |
US10621992B2 (en) * | 2016-07-22 | 2020-04-14 | Lenovo (Singapore) Pte. Ltd. | Activating voice assistant based on at least one of user proximity and context |
GB2552723A (en) * | 2016-08-03 | 2018-02-07 | Cirrus Logic Int Semiconductor Ltd | Speaker recognition |
GB2552722A (en) * | 2016-08-03 | 2018-02-07 | Cirrus Logic Int Semiconductor Ltd | Speaker recognition |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
GB2555661A (en) * | 2016-11-07 | 2018-05-09 | Cirrus Logic Int Semiconductor Ltd | Methods and apparatus for biometric authentication in an electronic device |
FR3058558B1 (fr) | 2016-11-07 | 2020-01-10 | Pw Group | Procede et systeme d'authentification par biometrie vocale d'un utilisateur |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
KR102653450B1 (ko) * | 2017-01-09 | 2024-04-02 | 삼성전자주식회사 | 전자 장치의 입력 음성에 대한 응답 방법 및 그 전자 장치 |
US10878831B2 (en) | 2017-01-12 | 2020-12-29 | Qualcomm Incorporated | Characteristic-based speech codebook selection |
US11010601B2 (en) | 2017-02-14 | 2021-05-18 | Microsoft Technology Licensing, Llc | Intelligent assistant device communicating non-verbal cues |
US10467509B2 (en) | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Computationally-efficient human-identifying smart assistant computer |
US11100384B2 (en) | 2017-02-14 | 2021-08-24 | Microsoft Technology Licensing, Llc | Intelligent device user interactions |
EP4293661A3 (en) * | 2017-04-20 | 2024-02-21 | Google LLC | Multi-user authentication on a device |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10664533B2 (en) | 2017-05-24 | 2020-05-26 | Lenovo (Singapore) Pte. Ltd. | Systems and methods to determine response cue for digital assistant based on context |
KR102371313B1 (ko) * | 2017-05-29 | 2022-03-08 | 삼성전자주식회사 | 사용자 발화를 처리하는 전자 장치 및 그 전자 장치의 제어 방법 |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
WO2019002831A1 (en) | 2017-06-27 | 2019-01-03 | Cirrus Logic International Semiconductor Limited | REPRODUCTIVE ATTACK DETECTION |
GB201713697D0 (en) | 2017-06-28 | 2017-10-11 | Cirrus Logic Int Semiconductor Ltd | Magnetic detection of replay attack |
GB2563953A (en) | 2017-06-28 | 2019-01-02 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201801526D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
GB201801532D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for audio playback |
GB201801528D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
GB201801530D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
GB201801527D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
CN109427336B (zh) * | 2017-09-01 | 2020-06-16 | 华为技术有限公司 | 语音对象识别方法及装置 |
KR102087202B1 (ko) * | 2017-09-13 | 2020-03-10 | (주)파워보이스 | 인공 지능 비서 서비스 제공 방법, 및 이에 사용되는 음성 인식 장비 |
US10896673B1 (en) * | 2017-09-21 | 2021-01-19 | Wells Fargo Bank, N.A. | Authentication of impaired voices |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
GB2567503A (en) | 2017-10-13 | 2019-04-17 | Cirrus Logic Int Semiconductor Ltd | Analysing speech signals |
GB201801661D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic International Uk Ltd | Detection of liveness |
GB201801663D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
GB201801874D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Improving robustness of speech processing system against ultrasound and dolphin attacks |
GB201803570D0 (en) | 2017-10-13 | 2018-04-18 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201804843D0 (en) | 2017-11-14 | 2018-05-09 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201801664D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
CN108305615B (zh) * | 2017-10-23 | 2020-06-16 | 腾讯科技(深圳)有限公司 | 一种对象识别方法及其设备、存储介质、终端 |
CN108064007A (zh) * | 2017-11-07 | 2018-05-22 | 苏宁云商集团股份有限公司 | 用于智能音箱的增强人声识别的方法及微控制器和智能音箱 |
GB201801659D0 (en) | 2017-11-14 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of loudspeaker playback |
US10157611B1 (en) * | 2017-11-29 | 2018-12-18 | Nuance Communications, Inc. | System and method for speech enhancement in multisource environments |
US10102858B1 (en) | 2017-11-29 | 2018-10-16 | International Business Machines Corporation | Dynamically changing audio keywords |
US10482878B2 (en) * | 2017-11-29 | 2019-11-19 | Nuance Communications, Inc. | System and method for speech enhancement in multisource environments |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US11475899B2 (en) | 2018-01-23 | 2022-10-18 | Cirrus Logic, Inc. | Speaker identification |
US11735189B2 (en) | 2018-01-23 | 2023-08-22 | Cirrus Logic, Inc. | Speaker identification |
GB2583420B (en) * | 2018-01-23 | 2022-09-14 | Cirrus Logic Int Semiconductor Ltd | Speaker identification |
US11264037B2 (en) | 2018-01-23 | 2022-03-01 | Cirrus Logic, Inc. | Speaker identification |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
KR102585231B1 (ko) * | 2018-02-02 | 2023-10-05 | 삼성전자주식회사 | 화자 인식을 수행하기 위한 음성 신호 처리 방법 및 그에 따른 전자 장치 |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
KR102550598B1 (ko) * | 2018-03-21 | 2023-07-04 | 현대모비스 주식회사 | 음성 화자 인식 장치 및 그 방법 |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
KR102531654B1 (ko) | 2018-05-04 | 2023-05-11 | 삼성전자주식회사 | 음성 입력 인증 디바이스 및 그 방법 |
WO2019212221A1 (ko) * | 2018-05-04 | 2019-11-07 | 삼성전자 주식회사 | 음성 입력 인증 디바이스 및 그 방법 |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
CN108735221A (zh) * | 2018-05-28 | 2018-11-02 | 深圳市街角电子商务有限公司 | 一种基于深度学习的说话人识别系统及识别方法 |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US10944859B2 (en) | 2018-06-03 | 2021-03-09 | Apple Inc. | Accelerated task performance |
CN110634489B (zh) * | 2018-06-25 | 2022-01-14 | 科大讯飞股份有限公司 | 一种声纹确认方法、装置、设备及可读存储介质 |
US10692490B2 (en) | 2018-07-31 | 2020-06-23 | Cirrus Logic, Inc. | Detection of replay attack |
US10915614B2 (en) | 2018-08-31 | 2021-02-09 | Cirrus Logic, Inc. | Biometric authentication |
KR102621881B1 (ko) * | 2018-09-05 | 2024-01-05 | 주식회사 케이티 | 상담사와 상담하는 화자를 인증하는 서버 및 방법 |
US11037574B2 (en) | 2018-09-05 | 2021-06-15 | Cirrus Logic, Inc. | Speaker recognition and speaker change detection |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
KR102622350B1 (ko) * | 2018-10-12 | 2024-01-09 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
KR102623246B1 (ko) * | 2018-10-12 | 2024-01-11 | 삼성전자주식회사 | 전자 장치, 전자 장치의 제어 방법 및 컴퓨터 판독 가능 매체. |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
KR102655628B1 (ko) * | 2018-11-22 | 2024-04-09 | 삼성전자주식회사 | 발화의 음성 데이터를 처리하는 방법 및 장치 |
KR20200066149A (ko) * | 2018-11-30 | 2020-06-09 | 삼성전자주식회사 | 사용자 인증 방법 및 장치 |
WO2020111880A1 (en) | 2018-11-30 | 2020-06-04 | Samsung Electronics Co., Ltd. | User authentication method and apparatus |
US11232788B2 (en) * | 2018-12-10 | 2022-01-25 | Amazon Technologies, Inc. | Wakeword detection |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
WO2020213996A1 (en) * | 2019-04-17 | 2020-10-22 | Samsung Electronics Co., Ltd. | Method and apparatus for interrupt detection |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11488608B2 (en) * | 2019-12-16 | 2022-11-01 | Sigma Technologies Global Llc | Method and system to estimate speaker characteristics on-the-fly for unknown speaker with high accuracy and low latency |
US11526688B2 (en) * | 2020-04-16 | 2022-12-13 | International Business Machines Corporation | Discovering ranked domain relevant terms using knowledge |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11664033B2 (en) * | 2020-06-15 | 2023-05-30 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
CN111508503B (zh) * | 2020-06-16 | 2020-10-20 | 北京爱数智慧科技有限公司 | 一种识别同一说话人的方法和装置 |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11521604B2 (en) | 2020-09-03 | 2022-12-06 | Google Llc | User mediation for hotword/keyword detection |
KR20220111574A (ko) | 2021-02-02 | 2022-08-09 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
CN112951247A (zh) * | 2021-03-23 | 2021-06-11 | 上海掌数科技有限公司 | 一种基于应用场景进行声纹快速验证的方法及其应用 |
CN113160822B (zh) * | 2021-04-30 | 2023-05-30 | 北京百度网讯科技有限公司 | 语音识别处理方法、装置、电子设备以及存储介质 |
CN114203178B (zh) * | 2021-12-10 | 2022-09-20 | 镁佳(北京)科技有限公司 | 一种智能语音系统拒识方法、装置及计算机设备 |
US11861521B2 (en) | 2021-12-21 | 2024-01-02 | PolyAI Limited | System and method for identification and verification |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01321499A (ja) * | 1988-06-23 | 1989-12-27 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JPH09127973A (ja) * | 1995-10-31 | 1997-05-16 | Ricoh Co Ltd | 話者認識システムおよび話者認識方法 |
JPH10260693A (ja) * | 1997-02-03 | 1998-09-29 | Philips Electron Nv | 音声認識方法及び装置 |
JP2008070597A (ja) * | 2006-09-14 | 2008-03-27 | Yamaha Corp | 音声認証装置、音声認証方法およびプログラム |
Family Cites Families (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9021489D0 (en) | 1990-10-03 | 1990-11-14 | Ensigma Ltd | Methods and apparatus for verifying the originator of a sequence of operations |
US6081782A (en) | 1993-12-29 | 2000-06-27 | Lucent Technologies Inc. | Voice command control and verification system |
US5893057A (en) | 1995-10-24 | 1999-04-06 | Ricoh Company Ltd. | Voice-based verification and identification methods and systems |
US6073101A (en) | 1996-02-02 | 2000-06-06 | International Business Machines Corporation | Text independent speaker recognition for transparent command ambiguity resolution and continuous access control |
US6847717B1 (en) * | 1997-05-27 | 2005-01-25 | Jbc Knowledge Ventures, L.P. | Method of accessing a dial-up service |
US6107935A (en) | 1998-02-11 | 2000-08-22 | International Business Machines Corporation | Systems and methods for access filtering employing relaxed recognition constraints |
WO1999045530A1 (en) * | 1998-03-03 | 1999-09-10 | Lernout & Hauspie Speech Products N.V. | Multi-resolution system and method for speaker verification |
US6253179B1 (en) | 1999-01-29 | 2001-06-26 | International Business Machines Corporation | Method and apparatus for multi-environment speaker verification |
DE10000973A1 (de) | 2000-01-06 | 2001-07-12 | Deutsche Telekom Ag | Verfahren zur sprachgesteuerten Identifizierung des Nutzers eines Telekommunikationsanschlusses im Telekommunikationsnetz beim Dialog mit einem sprachgesteuerten Dialogsystem |
JP3849841B2 (ja) * | 2000-03-15 | 2006-11-22 | オムロン株式会社 | 話者認識装置 |
JP2001319045A (ja) | 2000-05-11 | 2001-11-16 | Matsushita Electric Works Ltd | 音声マンマシンインタフェースを用いたホームエージェントシステム、及びプログラム記録媒体 |
US6735562B1 (en) | 2000-06-05 | 2004-05-11 | Motorola, Inc. | Method for estimating a confidence measure for a speech recognition system |
US20040190688A1 (en) * | 2003-03-31 | 2004-09-30 | Timmins Timothy A. | Communications methods and systems using voiceprints |
US6973426B1 (en) | 2000-12-29 | 2005-12-06 | Cisco Technology, Inc. | Method and apparatus for performing speaker verification based on speaker independent recognition of commands |
US6804647B1 (en) * | 2001-03-13 | 2004-10-12 | Nuance Communications | Method and system for on-line unsupervised adaptation in speaker verification |
JP2002329118A (ja) * | 2001-04-26 | 2002-11-15 | Ricoh Co Ltd | 経営者向け情報提供方法、サーバ装置、およびプログラム |
CN1236423C (zh) | 2001-05-10 | 2006-01-11 | 皇家菲利浦电子有限公司 | 说话人声音的后台学习 |
US20020178004A1 (en) * | 2001-05-23 | 2002-11-28 | Chienchung Chang | Method and apparatus for voice recognition |
EP1262954A1 (en) * | 2001-05-30 | 2002-12-04 | Telefonaktiebolaget L M Ericsson (Publ) | Method and apparatus for verbal entry of digits or commands |
JP3826032B2 (ja) | 2001-12-28 | 2006-09-27 | 株式会社東芝 | 音声認識装置、音声認識方法及び音声認識プログラム |
US7203652B1 (en) | 2002-02-21 | 2007-04-10 | Nuance Communications | Method and system for improving robustness in a speech system |
US7113169B2 (en) * | 2002-03-18 | 2006-09-26 | The United States Of America As Represented By The Secretary Of The Air Force | Apparatus and method for a multiple-user interface to interactive information displays |
US7079007B2 (en) | 2002-04-19 | 2006-07-18 | Cross Match Technologies, Inc. | Systems and methods utilizing biometric data |
US7457745B2 (en) | 2002-12-03 | 2008-11-25 | Hrl Laboratories, Llc | Method and apparatus for fast on-line automatic speaker/environment adaptation for speech/speaker recognition in the presence of changing environments |
US7415410B2 (en) | 2002-12-26 | 2008-08-19 | Motorola, Inc. | Identification apparatus and method for receiving and processing audible commands |
US7933226B2 (en) | 2003-10-22 | 2011-04-26 | Palo Alto Research Center Incorporated | System and method for providing communication channels that each comprise at least one property dynamically changeable during social interactions |
US8005668B2 (en) | 2004-09-22 | 2011-08-23 | General Motors Llc | Adaptive confidence thresholds in telematics system speech recognition |
KR100679044B1 (ko) * | 2005-03-07 | 2007-02-06 | 삼성전자주식회사 | 사용자 적응형 음성 인식 방법 및 장치 |
JP2007052496A (ja) * | 2005-08-15 | 2007-03-01 | Advanced Media Inc | ユーザ認証システム及びユーザ認証方法 |
JP4556028B2 (ja) * | 2005-11-04 | 2010-10-06 | 株式会社国際電気通信基礎技術研究所 | 発話主体同定装置及びコンピュータプログラム |
US7545962B2 (en) | 2005-12-22 | 2009-06-09 | Daon Holdings Limited | Biometric authentication system |
US7539616B2 (en) * | 2006-02-20 | 2009-05-26 | Microsoft Corporation | Speaker authentication using adapted background models |
JP2008058452A (ja) * | 2006-08-30 | 2008-03-13 | Pioneer Electronic Corp | 音声情報認証装置及び音声情報認証方法 |
US7949536B2 (en) | 2006-08-31 | 2011-05-24 | Microsoft Corporation | Intelligent speech recognition of incomplete phrases |
TWI342010B (en) * | 2006-12-13 | 2011-05-11 | Delta Electronics Inc | Speech recognition method and system with intelligent classification and adjustment |
US8050919B2 (en) | 2007-06-29 | 2011-11-01 | Microsoft Corporation | Speaker recognition via voice sample based on multiple nearest neighbor classifiers |
US8060366B1 (en) | 2007-07-17 | 2011-11-15 | West Corporation | System, method, and computer-readable medium for verbal control of a conference call |
CN101441869A (zh) * | 2007-11-21 | 2009-05-27 | 联想(北京)有限公司 | 语音识别终端用户身份的方法及终端 |
JP2010109618A (ja) * | 2008-10-29 | 2010-05-13 | Ntt Communications Kk | 認証装置、認証方法、及びプログラム |
TWI421857B (zh) | 2009-12-29 | 2014-01-01 | Ind Tech Res Inst | 產生詞語確認臨界值的裝置、方法與語音辨識、詞語確認系統 |
US8311820B2 (en) | 2010-01-28 | 2012-11-13 | Hewlett-Packard Development Company, L.P. | Speech recognition based on noise level |
US8265928B2 (en) * | 2010-04-14 | 2012-09-11 | Google Inc. | Geotagged environmental audio for enhanced speech recognition accuracy |
US20110320201A1 (en) * | 2010-06-24 | 2011-12-29 | Kaufman John D | Sound verification system using templates |
US8639508B2 (en) | 2011-02-14 | 2014-01-28 | General Motors Llc | User-specific confidence thresholds for speech recognition |
CN102142254A (zh) * | 2011-03-25 | 2011-08-03 | 北京得意音通技术有限责任公司 | 基于声纹识别和语音识别的防录音假冒的身份确认方法 |
ES2605779T3 (es) | 2012-09-28 | 2017-03-16 | Agnitio S.L. | Reconocimiento de orador |
CN103065631B (zh) * | 2013-01-24 | 2015-07-29 | 华为终端有限公司 | 一种语音识别的方法、装置 |
TWI601032B (zh) | 2013-08-02 | 2017-10-01 | 晨星半導體股份有限公司 | 應用於聲控裝置的控制器與相關方法 |
US9343068B2 (en) * | 2013-09-16 | 2016-05-17 | Qualcomm Incorporated | Method and apparatus for controlling access to applications having different security levels |
US8775191B1 (en) * | 2013-11-13 | 2014-07-08 | Google Inc. | Efficient utterance-specific endpointer triggering for always-on hotwording |
US10248771B1 (en) | 2014-01-24 | 2019-04-02 | Microstrategy Incorporated | Performing biometrics operations in uncontrolled environments |
US9589564B2 (en) * | 2014-02-05 | 2017-03-07 | Google Inc. | Multiple speech locale-specific hotword classifiers for selection of a speech locale |
-
2014
- 2014-07-25 US US14/340,720 patent/US9384738B2/en active Active
-
2015
- 2015-05-01 KR KR1020167021187A patent/KR101824158B1/ko active IP Right Grant
- 2015-05-01 EP EP18213656.4A patent/EP3537434B1/en active Active
- 2015-05-01 CN CN201580006803.0A patent/CN105960628B/zh active Active
- 2015-05-01 EP EP15722860.2A patent/EP3100261B1/en active Active
- 2015-05-01 WO PCT/US2015/028859 patent/WO2015199813A1/en active Application Filing
- 2015-05-01 KR KR1020167020986A patent/KR101824157B1/ko active IP Right Grant
- 2015-05-01 EP EP16190433.9A patent/EP3154055B1/en active Active
- 2015-05-01 EP EP21193230.6A patent/EP3937166A1/en active Pending
- 2015-05-01 CN CN201910004262.8A patent/CN110060694B/zh active Active
- 2015-05-01 KR KR1020187002192A patent/KR20180014176A/ko not_active IP Right Cessation
- 2015-05-01 KR KR1020187002191A patent/KR20180011361A/ko not_active IP Right Cessation
- 2015-05-01 JP JP2016549233A patent/JP6474827B2/ja active Active
-
2016
- 2016-06-21 US US15/188,047 patent/US9502039B2/en active Active
- 2016-08-02 JP JP2016151822A patent/JP6474762B2/ja active Active
- 2016-11-03 US US15/342,388 patent/US9679569B2/en active Active
-
2017
- 2017-05-19 US US15/599,578 patent/US9972323B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01321499A (ja) * | 1988-06-23 | 1989-12-27 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JPH09127973A (ja) * | 1995-10-31 | 1997-05-16 | Ricoh Co Ltd | 話者認識システムおよび話者認識方法 |
JPH10260693A (ja) * | 1997-02-03 | 1998-09-29 | Philips Electron Nv | 音声認識方法及び装置 |
JP2008070597A (ja) * | 2006-09-14 | 2008-03-27 | Yamaha Corp | 音声認証装置、音声認証方法およびプログラム |
Non-Patent Citations (1)
Title |
---|
渡辺 隆夫 TAKAO WATANABE: "音節認識を用いたゆう度補正による未知発話のリジェクション Unknown Utterance Rejection Using Likeliho", 電子情報通信学会論文誌 (J75−D−II) 第12号 THE TRANSACTIONS OF THE INSTITUTE OF ELECTRO, vol. 第J75-D-II巻, JPN6017035160, 25 December 1992 (1992-12-25), JP, pages 2002 - 2009 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020112778A (ja) * | 2019-01-11 | 2020-07-27 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 音声対話設備のウェイクアップ方法、装置、設備及び記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2017068243A (ja) | 2017-04-06 |
EP3154055A2 (en) | 2017-04-12 |
EP3537434A1 (en) | 2019-09-11 |
KR101824158B1 (ko) | 2018-02-01 |
KR20180014176A (ko) | 2018-02-07 |
KR20170012188A (ko) | 2017-02-02 |
US9502039B2 (en) | 2016-11-22 |
KR20180011361A (ko) | 2018-01-31 |
US20150371639A1 (en) | 2015-12-24 |
KR101824157B1 (ko) | 2018-02-01 |
US9679569B2 (en) | 2017-06-13 |
EP3154055B1 (en) | 2020-02-26 |
EP3100261A1 (en) | 2016-12-07 |
EP3537434B1 (en) | 2021-09-15 |
EP3100261B1 (en) | 2018-12-26 |
JP6474827B2 (ja) | 2019-02-27 |
JP6474762B2 (ja) | 2019-02-27 |
US20170103759A1 (en) | 2017-04-13 |
CN105960628A (zh) | 2016-09-21 |
KR20160105496A (ko) | 2016-09-06 |
WO2015199813A1 (en) | 2015-12-30 |
US20160300575A1 (en) | 2016-10-13 |
EP3154055A3 (en) | 2017-06-21 |
US20170345430A1 (en) | 2017-11-30 |
US9384738B2 (en) | 2016-07-05 |
CN110060694A (zh) | 2019-07-26 |
CN110060694B (zh) | 2021-03-23 |
US9972323B2 (en) | 2018-05-15 |
EP3937166A1 (en) | 2022-01-12 |
CN105960628B (zh) | 2019-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6474762B2 (ja) | 発話者の検証のための動的な閾値 | |
US12094472B2 (en) | Server side hotwording | |
JP6630765B2 (ja) | 個別化されたホットワード検出モデル | |
JP7384877B2 (ja) | コロケーション情報を使用した話者照合 | |
US11942095B2 (en) | Speaker verification using co-location information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170828 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170915 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180409 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180706 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6474827 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |