JP6208313B2 - 動的に生成された句を使用するセグメントベースの話者検証 - Google Patents
動的に生成された句を使用するセグメントベースの話者検証 Download PDFInfo
- Publication number
- JP6208313B2 JP6208313B2 JP2016208467A JP2016208467A JP6208313B2 JP 6208313 B2 JP6208313 B2 JP 6208313B2 JP 2016208467 A JP2016208467 A JP 2016208467A JP 2016208467 A JP2016208467 A JP 2016208467A JP 6208313 B2 JP6208313 B2 JP 6208313B2
- Authority
- JP
- Japan
- Prior art keywords
- target user
- acoustic features
- verification phrase
- acoustic
- speaker identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012795 verification Methods 0.000 title claims description 168
- 238000000034 method Methods 0.000 claims description 39
- 230000004044 response Effects 0.000 claims description 24
- 238000012549 training Methods 0.000 description 63
- 230000008569 process Effects 0.000 description 25
- 235000014571 nuts Nutrition 0.000 description 24
- 235000017060 Arachis glabrata Nutrition 0.000 description 13
- 241001553178 Arachis glabrata Species 0.000 description 13
- 235000010777 Arachis hypogaea Nutrition 0.000 description 13
- 235000018262 Arachis monticola Nutrition 0.000 description 13
- 235000020232 peanut Nutrition 0.000 description 13
- 238000004590 computer program Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 230000009471 action Effects 0.000 description 8
- 239000003999 initiator Substances 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 235000012489 doughnuts Nutrition 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 235000014036 Castanea Nutrition 0.000 description 1
- 241001070941 Castanea Species 0.000 description 1
- 241000282881 Orycteropodidae Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 235000021400 peanut butter Nutrition 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/14—Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/20—Pattern transformations or operations aimed at increasing system robustness, e.g. against channel noise or different working conditions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Electrically Operated Instructional Devices (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- User Interface Of Digital Computer (AREA)
Description
210 登録インターフェース
220 ユーザ
230 音響データ
304 話者検証イニシエータ
310 部分語アイデンティファイア
320 検証句オブテイナ
330 候補句
340 検証インターフェース
410 部分語に関する音響データ
420 部分語コンパレータ
430 話者クラシファイア
440 ウェルカムインターフェース
Claims (20)
- 話者識別検証句を提供するステップと、
前記話者識別検証句を発話する候補ユーザを表すオーディオデータを取得するステップと、
前記話者識別検証句に関連付けられた複数の部分語のそれぞれに対して、前記話者識別検証句を発話する前記候補ユーザを表す前記オーディオデータから導出されたサンプル音響特徴を取得するステップと、
前記話者識別検証句に関連付けられた前記複数の部分語のそれぞれに対して、(i)ターゲットユーザのための音響特徴のコレクション内に記憶され、(ii)前記部分語を含む1つまたは複数の単語を発話する前記ターゲットユーザのオーディオデータから導出される、参照音響特徴を取得するステップと、
前記話者識別検証句に関連付けられた前記複数の部分語のそれぞれに対して、前記サンプル音響特徴が前記参照音響特徴に関連付けられていると決定するステップと、
前記サンプル音響特徴が前記参照音響特徴に関連付けられていると決定することに応答して、前記候補ユーザを前記ターゲットユーザとして識別するステップと、
前記話者識別検証句に関連付けられた1つまたは複数の他の部分語のそれぞれに対して、(i)前記ターゲットユーザのための音響特徴の前記コレクション内にまだ記憶されておらず、(ii)前記話者識別検証句を発話する前記候補ユーザを表す前記オーディオデータから導出される、他の音響特徴を取得するステップと、
前記候補ユーザを前記ターゲットユーザとして識別することに応答して、1つまたは複数の前記他の音響特徴を前記ターゲットユーザのための音響特徴の前記コレクション内に記憶するステップと、
前記ターゲットユーザのための音響特徴の前記コレクション内に記憶された前記1つまたは複数の他の音響特徴のうちの少なくとも1つを使用して、前記ターゲットユーザのための音響特徴の前記コレクション内に記憶された前記1つまたは複数の前記他の音響特徴のうちの前記少なくとも1つに対応する1つまたは複数の部分語を含む次の発声を発話するユーザの身元を検証するステップとを備えるコンピュータ実施方法。 - 前記候補ユーザを前記ターゲットユーザとして識別することに応答して、1つまたは複数の前記他の音響特徴を前記ターゲットユーザのための音響特徴の前記コレクション内に記憶するステップは、
前記話者識別検証句を発話する前記候補ユーザを表す前記オーディオデータから導出された前記サンプル音響特徴が前記参照音響特徴に関連付けられていると決定することに基づいて前記候補ユーザを前記ターゲットユーザとして識別することに応答して、前記ターゲットユーザのための音響特徴の前記コレクション内に、前記話者識別検証句を発話する前記候補ユーザを表す前記オーディオデータから導出された1つまたは複数の前記他の音響特徴を記憶するステップを備える請求項1に記載の方法。 - 前記話者識別検証句は前記複数の部分語および前記1つまたは複数の他の部分語を備える請求項1に記載の方法。
- 前記候補ユーザを前記ターゲットユーザとして識別することに応答して、前記1つまたは複数の前記音響特徴によって前記ターゲットユーザのための音響特徴の前記コレクションを更新するステップを備える請求項1に記載の方法。
- 前記1つまたは複数の前記音響特徴によって前記ターゲットユーザのための音響特徴の前記コレクションを更新するステップは、前記1つまたは複数の前記音響特徴を前記ターゲットユーザのための音響特徴の前記コレクション内に記憶するステップを備える請求項4に記載の方法。
- 前記話者識別検証句に関連付けられた前記複数の部分語のそれぞれに対して、前記サンプル音響特徴が前記参照音響特徴に関連付けられていると決定するステップは、
前記話者識別検証句に関連付けられた前記複数の部分語のそれぞれに対して、前記サンプル音響特徴と前記参照音響特徴との間の距離を決定するステップと、
少なくとも前記距離に基づいて、前記話者識別検証句に関連付けられた前記複数の部分語のそれぞれに対して、前記サンプル音響特徴が前記参照音響特徴に関連付けられていると決定するステップとを備える請求項1に記載の方法。 - 少なくとも前記距離に基づいて、前記話者識別検証句に関連付けられた前記複数の部分語のそれぞれに対して、前記サンプル音響特徴が前記参照音響特徴に関連付けられていると決定するステップは、
前記部分語の音弁別性を決定するステップと、
少なくとも前記距離および前記音弁別性に基づいて、前記サンプル音響特徴が前記参照音響特徴に関連付けられていると決定するステップとを備える請求項6に記載の方法。 - 前記話者識別検証句に関連付けられた前記1つまたは複数の他の部分語のそれぞれに対して、前記サンプル音響特徴が前記参照音響特徴に関連付けられていないと決定するステップを備える請求項1に記載の方法。
- 前記ターゲットユーザのための音響特徴の前記コレクション内に記憶された前記1つまたは複数の他の音響特徴のうちの少なくとも1つを使用して、前記ターゲットユーザのための音響特徴の前記コレクション内に記憶された前記1つまたは複数の前記他の音響特徴のうちの前記少なくとも1つに対応する1つまたは複数の部分語を含む前記次の発声を発話する前記ユーザの前記身元を検証することに応答して、前記次の発声を発話する前記ユーザが前記ターゲットユーザとして検証されるかどうかの指標を提供するステップを備える請求項1に記載の方法。
- 1つまたは複数のコンピュータと、
命令を記憶している1つまたは複数のストレージデバイスとを備えるシステムであって、前記命令は、前記1つまたは複数のコンピュータによって実行されると、前記1つまたは複数のコンピュータに、
話者識別検証句を提供することと、
前記話者識別検証句を発話する候補ユーザを表すオーディオデータを取得することと、
前記話者識別検証句に関連付けられた複数の部分語のそれぞれに対して、前記話者識別検証句を発話する前記候補ユーザを表す前記オーディオデータから導出されたサンプル音響特徴を取得することと、
前記話者識別検証句に関連付けられた前記複数の部分語のそれぞれに対して、(i)ターゲットユーザのための音響特徴のコレクション内に記憶され、(ii)前記部分語を含む1つまたは複数の単語を発話する前記ターゲットユーザのオーディオデータから導出される、参照音響特徴を取得することと、
前記話者識別検証句に関連付けられた前記複数の部分語のそれぞれに対して、前記サンプル音響特徴が前記参照音響特徴に関連付けられていると決定することと、
前記サンプル音響特徴が前記参照音響特徴に関連付けられていると決定することに応答して、前記候補ユーザを前記ターゲットユーザとして識別することと、
前記話者識別検証句に関連付けられた1つまたは複数の他の部分語のそれぞれに対して、(i)前記ターゲットユーザのための音響特徴の前記コレクション内にまだ記憶されておらず、(ii)前記話者識別検証句を発話する前記候補ユーザを表す前記オーディオデータから導出される、他の音響特徴を取得することと、
前記候補ユーザを前記ターゲットユーザとして識別することに応答して、1つまたは複数の前記他の音響特徴を前記ターゲットユーザのための音響特徴の前記コレクション内に記憶することと、
前記ターゲットユーザのための音響特徴の前記コレクション内に記憶された前記1つまたは複数の他の音響特徴のうちの少なくとも1つを使用して、前記ターゲットユーザのための音響特徴の前記コレクション内に記憶された前記1つまたは複数の前記他の音響特徴のうちの前記少なくとも1つに対応する1つまたは複数の部分語を含む次の発声を発話するユーザの身元を検証することとを備える動作を実行させるように動作可能であるシステム。 - 前記動作は、前記候補ユーザを前記ターゲットユーザとして識別することに応答して、前記1つまたは複数の前記音響特徴によって前記ターゲットユーザのための音響特徴の前記コレクションを更新することを備える請求項10に記載のシステム。
- 前記1つまたは複数の前記音響特徴によって前記ターゲットユーザのための音響特徴の前記コレクションを更新することは、前記1つまたは複数の前記音響特徴を前記ターゲットユーザのための音響特徴の前記コレクション内に記憶することを備える請求項11に記載のシステム。
- 前記話者識別検証句に関連付けられた前記複数の部分語のそれぞれに対して、前記サンプル音響特徴が前記参照音響特徴に関連付けられていると決定することは、
前記話者識別検証句に関連付けられた前記複数の部分語のそれぞれに対して、前記サンプル音響特徴と前記参照音響特徴との間の距離を決定することと、
少なくとも前記距離に基づいて、前記話者識別検証句に関連付けられた前記複数の部分語のそれぞれに対して、前記サンプル音響特徴が前記参照音響特徴に関連付けられていると決定することとを備える請求項10に記載のシステム。 - 少なくとも前記距離に基づいて、前記話者識別検証句に関連付けられた前記複数の部分語のそれぞれに対して、前記サンプル音響特徴が前記参照音響特徴に関連付けられていると決定することは、
前記部分語の音弁別性を決定することと、
少なくとも前記距離および前記音弁別性に基づいて、前記サンプル音響特徴が前記参照音響特徴に関連付けられていると決定することとを備える請求項13に記載のシステム。 - 前記動作は、前記話者識別検証句に関連付けられた前記1つまたは複数の他の部分語のそれぞれに対して、前記サンプル音響特徴が前記参照音響特徴に関連付けられていないと決定することを備える請求項10に記載のシステム。
- 前記話者識別検証句は前記複数の部分語および前記1つまたは複数の他の部分語を備える請求項10に記載のシステム。
- 1つまたは複数のコンピュータによって実行可能な命令を備えるソフトウェアを記憶している非一時的コンピュータ可読媒体であって、前記命令は、そのような実行時に、前記1つまたは複数のコンピュータに、
話者識別検証句を提供することと、
前記話者識別検証句を発話する候補ユーザを表すオーディオデータを取得することと、
前記話者識別検証句に関連付けられた複数の部分語のそれぞれに対して、前記話者識別検証句を発話する前記候補ユーザを表す前記オーディオデータから導出されたサンプル音響特徴を取得することと、
前記話者識別検証句に関連付けられた前記複数の部分語のそれぞれに対して、(i)ターゲットユーザのための音響特徴のコレクション内に記憶され、(ii)前記部分語を含む1つまたは複数の単語を発話する前記ターゲットユーザのオーディオデータから導出される、参照音響特徴を取得することと、
前記話者識別検証句に関連付けられた前記複数の部分語のそれぞれに対して、前記サンプル音響特徴が前記参照音響特徴に関連付けられていると決定することと、
前記サンプル音響特徴が前記参照音響特徴に関連付けられていると決定することに応答して、前記候補ユーザを前記ターゲットユーザとして識別することと、
前記話者識別検証句に関連付けられた1つまたは複数の他の部分語のそれぞれに対して、(i)前記ターゲットユーザのための音響特徴の前記コレクション内にまだ記憶されておらず、(ii)前記話者識別検証句を発話する前記候補ユーザを表す前記オーディオデータから導出される、他の音響特徴を取得することと、
前記候補ユーザを前記ターゲットユーザとして識別することに応答して、1つまたは複数の前記他の音響特徴を前記ターゲットユーザのための音響特徴の前記コレクション内に記憶することと、
前記ターゲットユーザのための音響特徴の前記コレクション内に記憶された前記1つまたは複数の他の音響特徴のうちの少なくとも1つを使用して、前記ターゲットユーザのための音響特徴の前記コレクション内に記憶された前記1つまたは複数の前記他の音響特徴のうちの前記少なくとも1つに対応する1つまたは複数の部分語を含む次の発声を発話するユーザの身元を検証することとを備える動作を実行させる非一時的コンピュータ可読媒体。 - 前記動作は、前記候補ユーザを前記ターゲットユーザとして識別することに応答して、前記1つまたは複数の前記音響特徴によって前記ターゲットユーザのための音響特徴の前記コレクションを更新することを備える請求項17に記載の媒体。
- 前記1つまたは複数の前記音響特徴によって前記ターゲットユーザのための音響特徴の前記コレクションを更新することは、前記1つまたは複数の前記音響特徴を前記ターゲットユーザのための音響特徴の前記コレクション内に記憶することを備える請求項18に記載の媒体。
- 前記話者識別検証句は前記複数の部分語および前記1つまたは複数の他の部分語を備える請求項17に記載の媒体。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/242,098 | 2014-04-01 | ||
US14/242,098 US8812320B1 (en) | 2014-04-01 | 2014-04-01 | Segment-based speaker verification using dynamically generated phrases |
US14/447,115 US9424846B2 (en) | 2014-04-01 | 2014-07-30 | Segment-based speaker verification using dynamically generated phrases |
US14/447,115 | 2014-07-30 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016551220A Division JP6208375B2 (ja) | 2014-04-01 | 2015-03-27 | 動的に生成された句を使用するセグメントベースの話者検証 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017049600A JP2017049600A (ja) | 2017-03-09 |
JP6208313B2 true JP6208313B2 (ja) | 2017-10-04 |
Family
ID=51301789
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016551220A Active JP6208375B2 (ja) | 2014-04-01 | 2015-03-27 | 動的に生成された句を使用するセグメントベースの話者検証 |
JP2016208467A Active JP6208313B2 (ja) | 2014-04-01 | 2016-10-25 | 動的に生成された句を使用するセグメントベースの話者検証 |
JP2016208468A Active JP6258438B2 (ja) | 2014-04-01 | 2016-10-25 | 動的に生成された句を使用するセグメントベースの話者検証 |
JP2017233255A Active JP6586149B2 (ja) | 2014-04-01 | 2017-12-05 | 動的に生成された句を使用するセグメントベースの話者検証 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016551220A Active JP6208375B2 (ja) | 2014-04-01 | 2015-03-27 | 動的に生成された句を使用するセグメントベースの話者検証 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016208468A Active JP6258438B2 (ja) | 2014-04-01 | 2016-10-25 | 動的に生成された句を使用するセグメントベースの話者検証 |
JP2017233255A Active JP6586149B2 (ja) | 2014-04-01 | 2017-12-05 | 動的に生成された句を使用するセグメントベースの話者検証 |
Country Status (6)
Country | Link |
---|---|
US (7) | US8812320B1 (ja) |
EP (5) | EP3664082B1 (ja) |
JP (4) | JP6208375B2 (ja) |
KR (5) | KR101763089B1 (ja) |
CN (2) | CN110827833B (ja) |
WO (1) | WO2015153351A1 (ja) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9020423B2 (en) * | 2008-07-20 | 2015-04-28 | Samsung Electronics Co., Ltd | Method and system for managing multiple applications in near field communication |
US8812320B1 (en) | 2014-04-01 | 2014-08-19 | Google Inc. | Segment-based speaker verification using dynamically generated phrases |
US9986075B2 (en) * | 2014-06-04 | 2018-05-29 | Qualcomm Incorporated | Mobile device including a substantially centrally located earpiece |
CN105357006A (zh) * | 2014-08-20 | 2016-02-24 | 中兴通讯股份有限公司 | 一种基于声纹特征进行安全认证的方法及设备 |
CN105575391B (zh) * | 2014-10-10 | 2020-04-03 | 阿里巴巴集团控股有限公司 | 声纹信息管理方法、装置以及身份认证方法、系统 |
US9723406B2 (en) | 2015-01-21 | 2017-08-01 | Qualcomm Incorporated | System and method for changing a channel configuration of a set of audio output devices |
US9578418B2 (en) * | 2015-01-21 | 2017-02-21 | Qualcomm Incorporated | System and method for controlling output of multiple audio output devices |
US9978374B2 (en) * | 2015-09-04 | 2018-05-22 | Google Llc | Neural networks for speaker verification |
US10373612B2 (en) | 2016-03-21 | 2019-08-06 | Amazon Technologies, Inc. | Anchored speech detection and speech recognition |
CN105933323B (zh) * | 2016-06-01 | 2019-05-31 | 百度在线网络技术(北京)有限公司 | 声纹注册、认证方法及装置 |
GB2552723A (en) * | 2016-08-03 | 2018-02-07 | Cirrus Logic Int Semiconductor Ltd | Speaker recognition |
CN106209604A (zh) * | 2016-08-26 | 2016-12-07 | 北京小米移动软件有限公司 | 添加好友的方法及装置 |
CN107886955B (zh) * | 2016-09-29 | 2021-10-26 | 百度在线网络技术(北京)有限公司 | 一种语音会话样本的身份识别方法、装置及设备 |
US10490195B1 (en) * | 2017-09-26 | 2019-11-26 | Amazon Technologies, Inc. | Using system command utterances to generate a speaker profile |
KR102595184B1 (ko) * | 2018-05-25 | 2023-10-30 | 삼성전자주식회사 | 전자 장치, 전자 장치의 제어 방법 및 컴퓨터 판독 가능 매체 |
CN109448725A (zh) * | 2019-01-11 | 2019-03-08 | 百度在线网络技术(北京)有限公司 | 一种语音交互设备唤醒方法、装置、设备及存储介质 |
US10923111B1 (en) | 2019-03-28 | 2021-02-16 | Amazon Technologies, Inc. | Speech detection and speech recognition |
KR20200129346A (ko) * | 2019-05-08 | 2020-11-18 | 삼성전자주식회사 | 디스플레이 장치 및 이의 제어 방법 |
CN110808053B (zh) * | 2019-10-09 | 2022-05-03 | 深圳市声扬科技有限公司 | 一种驾驶员身份验证方法、装置及电子设备 |
US11315575B1 (en) * | 2020-10-13 | 2022-04-26 | Google Llc | Automatic generation and/or use of text-dependent speaker verification features |
CN118251721A (zh) * | 2021-11-16 | 2024-06-25 | 谷歌有限责任公司 | 经由说话者标识验证的共享助手简档 |
WO2024029875A1 (ko) * | 2022-08-05 | 2024-02-08 | 삼성전자주식회사 | 전자 장치, 지능형 서버, 및 화자 적응형 음성 인식 방법 |
CN115604008A (zh) * | 2022-10-17 | 2023-01-13 | 支付宝(杭州)信息技术有限公司(Cn) | 职业身份验证方法和系统 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3812320A (en) | 1971-01-13 | 1974-05-21 | Pad B Co Inc | Heated ground cover for the dissipation of moisture |
US5088097A (en) | 1990-04-04 | 1992-02-11 | Canon Kabushiki Kaisha | Semiconductor laser element capable of changing emission wavelength, and method of driving the same |
CA2105034C (en) * | 1992-10-09 | 1997-12-30 | Biing-Hwang Juang | Speaker verification with cohort normalized scoring |
KR950003389A (ko) * | 1993-07-20 | 1995-02-16 | 하기주 | 자동차 문손잡이 구조물용 폴리아미드 수지조성물 |
US6081782A (en) * | 1993-12-29 | 2000-06-27 | Lucent Technologies Inc. | Voice command control and verification system |
JPH1020883A (ja) * | 1996-07-02 | 1998-01-23 | Fujitsu Ltd | ユーザ認証装置 |
US5797123A (en) * | 1996-10-01 | 1998-08-18 | Lucent Technologies Inc. | Method of key-phase detection and verification for flexible speech understanding |
WO1998022936A1 (en) * | 1996-11-22 | 1998-05-28 | T-Netix, Inc. | Subword-based speaker verification using multiple classifier fusion, with channel, fusion, model, and threshold adaptation |
AU2850399A (en) * | 1998-03-03 | 1999-09-20 | Lernout & Hauspie Speech Products N.V. | Multi-resolution system and method for speaker verification |
US6141644A (en) | 1998-09-04 | 2000-10-31 | Matsushita Electric Industrial Co., Ltd. | Speaker verification and speaker identification based on eigenvoices |
DE69942843D1 (de) | 1999-08-03 | 2010-11-18 | Fujitsu Ltd | Schaltung zum steuern eines halbleiterlasers und steuerungsverfahren |
KR20010019772A (ko) * | 1999-08-30 | 2001-03-15 | 강선미 | 음성비밀단어를 이용한 사용자 인증 시스템 및 방법 |
DE19952049A1 (de) | 1999-10-28 | 2001-05-10 | Siemens Ag | Verfahren und Anordnung zur Verifikation eines Sprechers anhand eines Rechners |
US8812319B2 (en) | 2001-01-31 | 2014-08-19 | Ibiometrics, Inc. | Dynamic pass phrase security system (DPSS) |
JP2003302999A (ja) * | 2002-04-11 | 2003-10-24 | Advanced Media Inc | 音声による個人認証システム |
JP4463526B2 (ja) * | 2003-10-24 | 2010-05-19 | 株式会社ユニバーサルエンターテインメント | 声紋認証システム |
US7660487B2 (en) | 2003-12-10 | 2010-02-09 | Sony Corporation | Image processing method and apparatus with image resolution conversion related to relative movement detection |
US20060293898A1 (en) * | 2005-06-22 | 2006-12-28 | Microsoft Corporation | Speech recognition system for secure information |
CN1963917A (zh) * | 2005-11-11 | 2007-05-16 | 株式会社东芝 | 评价语音的分辨力、说话人认证的注册和验证方法及装置 |
US8265341B2 (en) * | 2010-01-25 | 2012-09-11 | Microsoft Corporation | Voice-body identity correlation |
US9318114B2 (en) | 2010-11-24 | 2016-04-19 | At&T Intellectual Property I, L.P. | System and method for generating challenge utterances for speaker verification |
CN103221996B (zh) | 2010-12-10 | 2015-09-30 | 松下电器(美国)知识产权公司 | 用于验证说话人的口令建模的设备和方法、以及说话人验证系统 |
US9262612B2 (en) * | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
CN102801530B (zh) * | 2012-09-04 | 2015-08-26 | 飞天诚信科技股份有限公司 | 一种基于声音传输的认证方法 |
US9230550B2 (en) * | 2013-01-10 | 2016-01-05 | Sensory, Incorporated | Speaker verification and identification using artificial neural network-based sub-phonetic unit discrimination |
US20140341593A1 (en) | 2013-05-16 | 2014-11-20 | Alcatel-Lucent Usa Inc. | Method And Apparatus For Optical Transmission In A Communication Network |
US20150063812A1 (en) | 2013-08-27 | 2015-03-05 | Calix, Inc. | Compensator for wavelength drift due to variable laser injection current and temperature in a directly modulated burst mode laser |
EP3044888B1 (en) | 2013-10-14 | 2018-09-19 | Huawei Technologies Co., Ltd. | Wavelength stabilizer for twdm-pon burst mode dbr laser |
US8812320B1 (en) * | 2014-04-01 | 2014-08-19 | Google Inc. | Segment-based speaker verification using dynamically generated phrases |
US9542948B2 (en) * | 2014-04-09 | 2017-01-10 | Google Inc. | Text-dependent speaker identification |
-
2014
- 2014-04-01 US US14/242,098 patent/US8812320B1/en active Active
- 2014-07-30 US US14/447,115 patent/US9424846B2/en active Active
-
2015
- 2015-03-27 KR KR1020167022023A patent/KR101763089B1/ko active IP Right Grant
- 2015-03-27 KR KR1020217027875A patent/KR102491993B1/ko active IP Right Grant
- 2015-03-27 WO PCT/US2015/023045 patent/WO2015153351A1/en active Application Filing
- 2015-03-27 KR KR1020167022325A patent/KR102167657B1/ko active IP Right Grant
- 2015-03-27 CN CN201911099048.1A patent/CN110827833B/zh active Active
- 2015-03-27 EP EP19214267.7A patent/EP3664082B1/en active Active
- 2015-03-27 EP EP15716937.6A patent/EP3090428B1/en active Active
- 2015-03-27 EP EP16182982.5A patent/EP3154056B1/en active Active
- 2015-03-27 EP EP18180247.1A patent/EP3401906B1/en active Active
- 2015-03-27 KR KR1020177020114A patent/KR101874274B1/ko active IP Right Grant
- 2015-03-27 CN CN201580008577.XA patent/CN106030702B/zh active Active
- 2015-03-27 JP JP2016551220A patent/JP6208375B2/ja active Active
- 2015-03-27 KR KR1020207029347A patent/KR102298583B1/ko active IP Right Grant
- 2015-03-27 EP EP18175789.9A patent/EP3392880B1/en active Active
-
2016
- 2016-06-24 US US15/191,886 patent/US9741348B2/en active Active
- 2016-10-25 JP JP2016208467A patent/JP6208313B2/ja active Active
- 2016-10-25 JP JP2016208468A patent/JP6258438B2/ja active Active
-
2017
- 2017-08-04 US US15/669,701 patent/US10037760B2/en active Active
- 2017-12-05 JP JP2017233255A patent/JP6586149B2/ja active Active
-
2018
- 2018-06-25 US US16/017,690 patent/US10504524B2/en not_active Expired - Fee Related
-
2019
- 2019-11-06 US US16/675,420 patent/US11056120B2/en active Active
-
2021
- 2021-06-10 US US17/303,928 patent/US11568879B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6586149B2 (ja) | 動的に生成された句を使用するセグメントベースの話者検証 | |
US9542948B2 (en) | Text-dependent speaker identification | |
JP6158348B2 (ja) | 人工ニューラル・ネットワーク・ベースのサブ音素単位区別を用いた話者照合および同定 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20170309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170317 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170807 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170906 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6208313 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |