JP6912605B2 - 声識別特徴最適化および動的登録方法、クライアント、ならびにサーバ - Google Patents
声識別特徴最適化および動的登録方法、クライアント、ならびにサーバ Download PDFInfo
- Publication number
- JP6912605B2 JP6912605B2 JP2019569451A JP2019569451A JP6912605B2 JP 6912605 B2 JP6912605 B2 JP 6912605B2 JP 2019569451 A JP2019569451 A JP 2019569451A JP 2019569451 A JP2019569451 A JP 2019569451A JP 6912605 B2 JP6912605 B2 JP 6912605B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- feature
- features
- unrelated
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 111
- 238000005457 optimization Methods 0.000 title description 5
- 230000004044 response Effects 0.000 claims description 67
- 238000003860 storage Methods 0.000 claims description 19
- 230000004913 activation Effects 0.000 claims description 14
- 238000012544 monitoring process Methods 0.000 claims 4
- 230000015654 memory Effects 0.000 description 37
- 230000008569 process Effects 0.000 description 23
- 238000004891 communication Methods 0.000 description 17
- 239000000284 extract Substances 0.000 description 17
- 230000006870 function Effects 0.000 description 15
- 238000012545 processing Methods 0.000 description 15
- 239000013598 vector Substances 0.000 description 12
- 238000001514 detection method Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012423 maintenance Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000001976 improved effect Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000009467 reduction Effects 0.000 description 3
- 239000004984 smart glass Substances 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 206010037660 Pyrexia Diseases 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 102000015779 HDL Lipoproteins Human genes 0.000 description 1
- 108010010234 HDL Lipoproteins Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241001657948 Midea Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004549 pulsed laser deposition Methods 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
- H04L63/0861—Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/08—Use of distortion metrics or a particular distance between probe pattern and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computer Security & Cryptography (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Signal Processing (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Telephonic Communication Services (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephone Function (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
本出願は、2017年6月16日に出願された中国特許出願第201710461578.0号に基づくものであり、その出願による優先権を主張し、参照によりその出願全体が本明細書に組み込まれる。
Claims (17)
- 音声データを取得し、前記音声データの音声特徴を抽出することと、
プリセット・マッチングしきい値を上回る前記音声特徴との類似性を有する声識別特徴が、関連付けられた特徴ライブラリ内に存在するかどうかを決定することと、
前記声識別特徴が前記関連付けられた特徴ライブラリ内に存在すると決定することに応答して、前記音声特徴を使用することにより、前記声識別特徴を更新することと、
前記声識別特徴が前記関連付けられた特徴ライブラリ内に存在しないと決定することに応答して、前記声識別特徴を更新するための音声の数がプリセットしきい値に達するかどうかを決定することと、
前記声識別特徴を更新するための前記音声の前記数が前記プリセットしきい値に達すると決定することに応答して、ユーザ情報を前記声識別特徴と関連付けることと
を含む、声識別方法。 - 前記音声特徴を使用することにより、前記声識別特徴を前記更新することが、
前記音声特徴および前記声識別特徴に従って第1の識別特徴を生成することと、
前記声識別特徴を前記第1の識別特徴と置き換えて、前記関連付けられた特徴ライブラリに前記第1の識別特徴を格納することと、を含む、請求項1に記載の方法。 - 前記声識別特徴が前記関連付けられた特徴ライブラリ内に存在すると決定することに応答して、前記音声特徴を使用することにより、前記声識別特徴を更新することが、
前記プリセット・マッチングしきい値を上回る前記音声特徴との類似性を有する関連付けられたユーザ情報の複数の前記声識別特徴が前記関連付けられた特徴ライブラリ内に存在すると決定することに応答して、前記音声特徴を使用することにより、前記音声特徴と最も高い類似性を有する前記関連付けられたユーザ情報の前記声識別特徴を更新することを含む、請求項1に記載の方法。 - 前記音声データが、ユーザによって話された起動キーワードの音声記録を含む、請求項1に記載の方法。
- 前記声識別特徴が前記関連付けられた特徴ライブラリ内に存在しないと決定することに応答して、前記プリセット・マッチングしきい値を上回る前記音声特徴との類似性を有する前記声識別特徴が、関連付けられていない特徴ライブラリ内に存在するかどうかを決定するために、前記関連付けられていない特徴ライブラリを検索することをさらに含み、前記関連付けられた特徴ライブラリが、関連付けられたユーザ情報の声識別特徴を格納し、前記関連付けられていない特徴ライブラリが、関連付けられていないユーザ情報の声識別特徴を格納する、請求項1に記載の方法。
- 前記関連付けられた特徴ライブラリが、前記関連付けられたユーザ情報の前記声識別特徴と関連付けられたユーザ情報をさらに格納し、
前記関連付けられていない特徴ライブラリが、前記関連付けられていないユーザ情報の前記声識別特徴を更新するための音声の数をさらに格納する、請求項5に記載の方法。 - 前記プリセット・マッチングしきい値を上回る前記音声特徴との類似性を有する前記声識別特徴が、前記関連付けられていない特徴ライブラリ内に存在すると決定することに応答して、前記音声特徴を使用することにより、前記声識別特徴を更新することと、
前記プリセット・マッチングしきい値を上回る前記音声特徴との類似性を有する前記声識別特徴が、前記関連付けられていない特徴ライブラリ内に存在しないと決定することに応答して、前記音声特徴を前記声識別特徴として、前記関連付けられていない特徴ライブラリに追加することと、をさらに含む、請求項5に記載の方法。 - 前記関連付けられていないユーザ情報の前記声識別特徴の数がプリセット数を超えるかどうかをモニタすることと、
前記関連付けられていないユーザ情報の前記声識別特徴の前記数が前記プリセット数を超えると決定することに応答して、前記1つまたは複数の声識別特徴を更新するための最小量の音声データを有する前記関連付けられていないユーザ情報の前記声識別特徴のうちの1つまたは複数を削除することと、をさらに含む、請求項7に記載の方法。 - 前記関連付けられていないユーザ情報の前記声識別特徴の数がプリセット数を超えるかどうかをモニタすることと、
前記関連付けられていないユーザ情報の前記声識別特徴の前記数が前記プリセット数を超えると決定することに応答して、最も古い更新時間を有する前記関連付けられていないユーザ情報の前記声識別特徴のうちの1つまたは複数を削除することと、をさらに含む、請求項7に記載の方法。 - 前記関連付けられていないユーザ情報の前記声識別特徴の数がプリセット数を超えるかどうかをモニタすることと、
前記関連付けられていないユーザ情報の前記声識別特徴の前記数が前記プリセット数を超えないと決定することに応答して、前記関連付けられていないユーザ情報の前記声識別特徴のいずれかを更新するための音声の数が、プリセットしきい値に達するかどうかを決定するために、前記関連付けられていない特徴ライブラリを検索することと、
前記関連付けられていないユーザ情報の第1の声識別特徴を更新するための音声の数がプリセットしきい値に達すると決定することに応答して、前記第1の声識別特徴を前記関連付けられた特徴ライブラリ内の前記声識別特徴と比較することと、
前記第1の声識別特徴が前記関連付けられた特徴ライブラリ内の前記声識別特徴に似ていないと決定することに応答して、前記第1の声識別特徴を前記関連付けられた特徴ライブラリおよび前記音声データに対応するユーザの記録情報に追加することと、
前記第1の声識別特徴が前記関連付けられた特徴ライブラリ内の第2の声識別特徴に類似すると決定することに応答して、前記第1の声識別特徴を使用することにより、前記第2の声識別特徴を更新することと、をさらに含む、請求項7に記載の方法。 - 命令を格納する非一時的なコンピュータ可読記憶媒体であって、前記命令が、プロセッサによって実行されるとき、前記プロセッサに声識別方法を実施させ、前記方法が、
音声データの音声特徴を抽出することと、
プリセット・マッチングしきい値を上回る前記音声特徴との類似性を有する声識別特徴が、関連付けられた特徴ライブラリ内に存在するかどうかを決定することと、
前記声識別特徴が前記関連付けられた特徴ライブラリ内に存在すると決定することに応答して、前記音声特徴を使用することにより、前記声識別特徴を更新することと、
前記声識別特徴が前記関連付けられた特徴ライブラリ内に存在しないと決定することに応答して、前記プリセット・マッチングしきい値を上回る前記音声特徴との類似性を有する前記声識別特徴が、関連付けられていない特徴ライブラリ内に存在するかどうかを決定するために、前記関連付けられていない特徴ライブラリを検索すること
を含み、前記関連付けられた特徴ライブラリが、関連付けられたユーザ情報の声識別特徴を格納し、前記関連付けられていない特徴ライブラリが、関連付けられていないユーザ情報の声識別特徴を格納する、非一時的なコンピュータ可読記憶媒体。 - 前記声識別特徴が前記関連付けられた特徴ライブラリ内に存在すると決定することに応答して、前記音声特徴を使用することにより、前記声識別特徴を更新することが、
前記プリセット・マッチングしきい値を上回る前記音声特徴との類似性を有する関連付けられたユーザ情報の複数の前記声識別特徴が前記関連付けられた特徴ライブラリ内に存在すると決定することに応答して、前記音声特徴を使用することにより、前記音声特徴と最も高い類似性を有する前記関連付けられたユーザ情報の前記声識別特徴を更新することを含む、請求項11に記載の非一時的なコンピュータ可読記憶媒体。 - 前記方法が、
前記プリセット・マッチングしきい値を上回る前記音声特徴との類似性を有する前記声識別特徴が、前記関連付けられていない特徴ライブラリ内に存在すると決定することに応答して、前記音声特徴を使用することにより、前記声識別特徴を更新することと、
前記プリセット・マッチングしきい値を上回る前記音声特徴との類似性を有する前記声識別特徴が、前記関連付けられていない特徴ライブラリ内に存在しないと決定することに応答して、前記音声特徴を前記声識別特徴として、前記関連付けられていない特徴ライブラリに追加することと、をさらに含む、請求項11に記載の非一時的なコンピュータ可読記憶媒体。 - 前記方法が、
前記関連付けられていないユーザ情報の前記声識別特徴の数がプリセット数を超えるかどうかをモニタすることと、
前記関連付けられていないユーザ情報の前記声識別特徴の前記数が前記プリセット数を超えないと決定することに応答して、前記関連付けられていないユーザ情報の前記声識別特徴のいずれかを更新するための音声の数が、プリセットしきい値に達するかどうかを決定するために、前記関連付けられていない特徴ライブラリを検索することと、
前記関連付けられていないユーザ情報の第1の声識別特徴を更新するための音声の数がプリセットしきい値に達すると決定することに応答して、前記第1の声識別特徴を前記関連付けられた特徴ライブラリ内の前記声識別特徴と比較することと、
前記第1の声識別特徴が前記関連付けられた特徴ライブラリ内の前記声識別特徴に似ていないと決定することに応答して、前記第1の声識別特徴を前記関連付けられた特徴ライブラリおよび前記音声データに対応するユーザの記録情報に追加することと、
前記第1の声識別特徴が前記関連付けられた特徴ライブラリ内の第2の声識別特徴に類似すると決定することに応答して、前記第1の声識別特徴を使用することにより、前記第2の声識別特徴を更新することと、をさらに含む、請求項13に記載の非一時的なコンピュータ可読記憶媒体。 - 音声データを取得するように構成されたマイクロフォンと、
プロセッサ、および命令を格納する非一時的なコンピュータ可読記憶媒体と、を備える、声識別システムであって、前記命令が、前記プロセッサによって実行されるとき、前記システムに声識別方法を実施させ、前記方法が、
前記音声データの音声特徴を抽出することと、
プリセット・マッチングしきい値を上回る前記音声特徴との類似性を有する声識別特徴が、関連付けられた特徴ライブラリ内に存在するかどうかを決定することと、
前記声識別特徴が前記関連付けられた特徴ライブラリ内に存在すると決定することに応答して、前記音声特徴を使用することにより、前記声識別特徴を更新することと、
前記声識別特徴が前記関連付けられた特徴ライブラリ内に存在しないと決定することに応答して、前記プリセット・マッチングしきい値を上回る前記音声特徴との類似性を有する前記声識別特徴が、関連付けられていない特徴ライブラリ内に存在するかどうかを決定するために、前記関連付けられていない特徴ライブラリを検索すること
を含み、前記関連付けられた特徴ライブラリが、関連付けられたユーザ情報の声識別特徴を格納し、前記関連付けられていない特徴ライブラリが、関連付けられていないユーザ情報の声識別特徴を格納する、声識別システム。 - 前記声識別特徴が前記関連付けられた特徴ライブラリ内に存在すると決定することに応答して、前記音声特徴を使用することにより、前記声識別特徴を更新することが、
前記プリセット・マッチングしきい値を上回る前記音声特徴との類似性を有する関連付けられたユーザ情報の複数の前記声識別特徴が、前記関連付けられた特徴ライブラリ内に存在すると決定することに応答して、前記音声特徴を使用することにより、前記音声特徴と最も高い類似性を有する前記関連付けられたユーザ情報の前記声識別特徴を更新することを含む、請求項15に記載の声識別システム。 - 前記方法が、
前記プリセット・マッチングしきい値を上回る前記音声特徴との類似性を有する前記声識別特徴が、前記関連付けられていない特徴ライブラリ内に存在すると決定することに応答して、前記音声特徴を使用することにより、前記声識別特徴を更新することと、
前記プリセット・マッチングしきい値を上回る前記音声特徴との類似性を有する前記声識別特徴が前記関連付けられていない特徴ライブラリ内に存在しないと決定することに応答して、前記音声特徴を前記声識別特徴として、前記関連付けられていない特徴ライブラリに追加することと、をさらに含む、請求項15に記載の声識別システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710461578.0A CN109147770B (zh) | 2017-06-16 | 2017-06-16 | 声音识别特征的优化、动态注册方法、客户端和服务器 |
CN201710461578.0 | 2017-06-16 | ||
PCT/US2018/037591 WO2018232148A1 (en) | 2017-06-16 | 2018-06-14 | Voice identification feature optimization and dynamic registration methods, client, and server |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020523643A JP2020523643A (ja) | 2020-08-06 |
JP6912605B2 true JP6912605B2 (ja) | 2021-08-04 |
Family
ID=64658228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019569451A Active JP6912605B2 (ja) | 2017-06-16 | 2018-06-14 | 声識別特徴最適化および動的登録方法、クライアント、ならびにサーバ |
Country Status (6)
Country | Link |
---|---|
US (1) | US11011177B2 (ja) |
EP (1) | EP3610396B1 (ja) |
JP (1) | JP6912605B2 (ja) |
CN (1) | CN109147770B (ja) |
TW (1) | TW201905895A (ja) |
WO (1) | WO2018232148A1 (ja) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109146450A (zh) * | 2017-06-16 | 2019-01-04 | 阿里巴巴集团控股有限公司 | 支付方法、客户端、电子设备、存储介质和服务器 |
US10592649B2 (en) | 2017-08-09 | 2020-03-17 | Nice Ltd. | Authentication via a dynamic passphrase |
EP3698358A1 (en) * | 2017-10-18 | 2020-08-26 | Soapbox Labs Ltd. | Methods and systems for processing audio signals containing speech data |
US11010461B2 (en) * | 2017-12-22 | 2021-05-18 | Vmware, Inc. | Generating sensor-based identifier |
EP3905007A1 (en) * | 2018-10-15 | 2021-11-03 | Orcam Technologies Ltd. | Hearing aid systems and methods |
US11004454B1 (en) * | 2018-11-06 | 2021-05-11 | Amazon Technologies, Inc. | Voice profile updating |
CN109857726B (zh) * | 2019-02-27 | 2023-05-12 | 深信服科技股份有限公司 | 一种应用特征库维护方法、装置、电子设备及存储介质 |
CN109994117A (zh) * | 2019-04-09 | 2019-07-09 | 昆山古鳌电子机械有限公司 | 一种电子签名系统 |
CN110163617B (zh) * | 2019-05-29 | 2022-12-13 | 四川长虹电器股份有限公司 | 一种支持基于声纹的电视购物支付方法 |
US11295754B2 (en) | 2019-07-30 | 2022-04-05 | Apple Inc. | Audio bandwidth reduction |
CN110797017A (zh) * | 2019-07-30 | 2020-02-14 | 深圳市南和移动通信科技股份有限公司 | 语音呼救方法、智能音箱以及存储介质 |
CN110704822A (zh) * | 2019-08-30 | 2020-01-17 | 深圳市声扬科技有限公司 | 提高用户身份验证安全性的方法、装置、服务器及系统 |
CN110688640A (zh) * | 2019-09-03 | 2020-01-14 | 深圳市声扬科技有限公司 | 一种基于声纹识别的数据处理方法、装置、系统及服务器 |
US11374976B2 (en) | 2019-10-15 | 2022-06-28 | Bank Of America Corporation | System for authentication of resource actions based on multi-channel input |
CN112735455A (zh) * | 2019-10-28 | 2021-04-30 | 阿里巴巴集团控股有限公司 | 声音信息的处理方法和装置 |
CN110992962B (zh) * | 2019-12-04 | 2021-01-22 | 珠海格力电器股份有限公司 | 语音设备的唤醒调整方法、装置、语音设备及存储介质 |
CN110930986B (zh) * | 2019-12-06 | 2022-05-17 | 北京明略软件系统有限公司 | 语音处理方法、装置、电子设备及存储介质 |
US11461417B2 (en) * | 2020-03-05 | 2022-10-04 | Kore.Ai, Inc. | Methods for managing automated discovery and knowledge sharing in one or more networks and devices thereof |
CN111402899B (zh) * | 2020-03-25 | 2023-10-13 | 中国工商银行股份有限公司 | 跨信道声纹识别方法及装置 |
WO2021211836A1 (en) * | 2020-04-15 | 2021-10-21 | Pindrop Security, Inc. | Passive and continuous multi-speaker voice biometrics |
CN111667840A (zh) * | 2020-06-11 | 2020-09-15 | 刘娴 | 基于声纹识别的机器人知识图谱节点更新方法 |
CN111816174A (zh) * | 2020-06-24 | 2020-10-23 | 北京小米松果电子有限公司 | 语音识别方法、装置及计算机可读存储介质 |
CN112243061A (zh) * | 2020-11-03 | 2021-01-19 | 珠海格力电器股份有限公司 | 一种移动终端的通信方法以及移动终端 |
TWI815064B (zh) * | 2020-11-27 | 2023-09-11 | 臺灣銀行股份有限公司 | 動態身分驗證方法 |
CN113241080A (zh) * | 2021-06-10 | 2021-08-10 | 思必驰科技股份有限公司 | 自动注册声纹识别方法和装置 |
Family Cites Families (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6016476A (en) | 1997-08-11 | 2000-01-18 | International Business Machines Corporation | Portable information and transaction processing system and method utilizing biometric authorization and digital certificate security |
US6213391B1 (en) | 1997-09-10 | 2001-04-10 | William H. Lewis | Portable system for personal identification based upon distinctive characteristics of the user |
US6321195B1 (en) * | 1998-04-28 | 2001-11-20 | Lg Electronics Inc. | Speech recognition method |
IL129451A (en) | 1999-04-15 | 2004-05-12 | Eli Talmor | System and method for authentication of a speaker |
KR100297833B1 (ko) * | 1999-07-07 | 2001-11-01 | 윤종용 | 비고정 연속 숫자음을 이용한 화자 검증 시스템 및 그 방법 |
US7130800B1 (en) | 2001-09-20 | 2006-10-31 | West Corporation | Third party verification system |
US6748356B1 (en) * | 2000-06-07 | 2004-06-08 | International Business Machines Corporation | Methods and apparatus for identifying unknown speakers using a hierarchical tree structure |
US6601762B2 (en) | 2001-06-15 | 2003-08-05 | Koninklijke Philips Electronics N.V. | Point-of-sale (POS) voice authentication transaction system |
US7953219B2 (en) * | 2001-07-19 | 2011-05-31 | Nice Systems, Ltd. | Method apparatus and system for capturing and analyzing interaction based content |
US7158776B1 (en) | 2001-09-18 | 2007-01-02 | Cisco Technology, Inc. | Techniques for voice-based user authentication for mobile access to network services |
US7240007B2 (en) | 2001-12-13 | 2007-07-03 | Matsushita Electric Industrial Co., Ltd. | Speaker authentication by fusion of voiceprint match attempt results with additional information |
JP2003255991A (ja) | 2002-03-06 | 2003-09-10 | Sony Corp | 対話制御システム、対話制御方法及びロボット装置 |
US7292543B2 (en) * | 2002-04-17 | 2007-11-06 | Texas Instruments Incorporated | Speaker tracking on a multi-core in a packet based conferencing system |
US7333798B2 (en) | 2002-08-08 | 2008-02-19 | Value Added Communications, Inc. | Telecommunication call management and monitoring system |
US7212613B2 (en) | 2003-09-18 | 2007-05-01 | International Business Machines Corporation | System and method for telephonic voice authentication |
GB2407681B (en) | 2003-10-29 | 2007-02-28 | Vecommerce Ltd | Voice recognition system and method |
WO2006087799A1 (ja) | 2005-02-18 | 2006-08-24 | Fujitsu Limited | 音声認証システム |
US20070280436A1 (en) | 2006-04-14 | 2007-12-06 | Anthony Rajakumar | Method and System to Seed a Voice Database |
US20060248019A1 (en) | 2005-04-21 | 2006-11-02 | Anthony Rajakumar | Method and system to detect fraud using voice data |
US8924285B2 (en) | 2005-04-21 | 2014-12-30 | Verint Americas Inc. | Building whitelists comprising voiceprints not associated with fraud and screening calls using a combination of a whitelist and blacklist |
US7536304B2 (en) | 2005-05-27 | 2009-05-19 | Porticus, Inc. | Method and system for bio-metric voice print authentication |
US20070219801A1 (en) * | 2006-03-14 | 2007-09-20 | Prabha Sundaram | System, method and computer program product for updating a biometric model based on changes in a biometric feature of a user |
US8682652B2 (en) | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
CN101636784B (zh) | 2007-03-20 | 2011-12-28 | 富士通株式会社 | 语音识别系统及语音识别方法 |
JP4847581B2 (ja) * | 2007-03-30 | 2011-12-28 | パイオニア株式会社 | 話者認識装置、音響モデル更新方法及び音響モデル更新処理プログラム |
US8380503B2 (en) | 2008-06-23 | 2013-02-19 | John Nicholas and Kristin Gross Trust | System and method for generating challenge items for CAPTCHAs |
US8412525B2 (en) | 2009-04-30 | 2013-04-02 | Microsoft Corporation | Noise robust speech classifier ensemble |
CN102498514B (zh) | 2009-08-04 | 2014-06-18 | 诺基亚公司 | 用于音频信号分类的方法和装置 |
US8620666B1 (en) * | 2009-08-07 | 2013-12-31 | West Corporation | System, method, and computer-readable medium that facilitate voice biometrics user authentication |
ES2371619B1 (es) | 2009-10-08 | 2012-08-08 | Telefónica, S.A. | Procedimiento de detección de segmentos de voz. |
US8606579B2 (en) * | 2010-05-24 | 2013-12-10 | Microsoft Corporation | Voice print identification for identifying speakers |
CN102543084A (zh) * | 2010-12-29 | 2012-07-04 | 盛乐信息技术(上海)有限公司 | 在线声纹认证系统及其实现方法 |
US9225701B2 (en) * | 2011-04-18 | 2015-12-29 | Intelmate Llc | Secure communication systems and methods |
US20130232073A1 (en) * | 2012-03-05 | 2013-09-05 | John F. Sheets | Authentication Using Biometric Technology Through a Consumer Device |
CN102760434A (zh) * | 2012-07-09 | 2012-10-31 | 华为终端有限公司 | 一种声纹特征模型更新方法及终端 |
US9704486B2 (en) | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
CN104036780B (zh) * | 2013-03-05 | 2017-05-24 | 阿里巴巴集团控股有限公司 | 一种人机识别方法及系统 |
US9871606B1 (en) * | 2013-05-13 | 2018-01-16 | Twitter, Inc. | Identification of concurrently broadcast time-based media |
US20140343943A1 (en) * | 2013-05-14 | 2014-11-20 | Saudi Arabian Oil Company | Systems, Computer Medium and Computer-Implemented Methods for Authenticating Users Using Voice Streams |
US10235509B2 (en) * | 2013-08-22 | 2019-03-19 | Staton Techiya, Llc | Methods and systems for a voice ID verification database and service in social networking and commercial business transactions |
WO2015060867A1 (en) * | 2013-10-25 | 2015-04-30 | Intel Corporation | Techniques for preventing voice replay attacks |
US9564128B2 (en) | 2013-12-09 | 2017-02-07 | Qualcomm Incorporated | Controlling a speech recognition process of a computing device |
JP6377921B2 (ja) | 2014-03-13 | 2018-08-22 | 綜合警備保障株式会社 | 話者認識装置、話者認識方法及び話者認識プログラム |
US10127911B2 (en) * | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9704488B2 (en) * | 2015-03-20 | 2017-07-11 | Microsoft Technology Licensing, Llc | Communicating metadata that identifies a current speaker |
TWI579828B (zh) * | 2015-06-01 | 2017-04-21 | 鴻海精密工業股份有限公司 | 語音辨識裝置及方法 |
US10529328B2 (en) * | 2015-06-22 | 2020-01-07 | Carnegie Mellon University | Processing speech signals in voice-based profiling |
US10129314B2 (en) * | 2015-08-18 | 2018-11-13 | Pandora Media, Inc. | Media feature determination for internet-based media streaming |
US20170075652A1 (en) * | 2015-09-14 | 2017-03-16 | Kabushiki Kaisha Toshiba | Electronic device and method |
US10236017B1 (en) * | 2015-09-29 | 2019-03-19 | Amazon Technologies, Inc. | Goal segmentation in speech dialogs |
US20170318013A1 (en) * | 2016-04-29 | 2017-11-02 | Yen4Ken, Inc. | Method and system for voice-based user authentication and content evaluation |
US10152969B2 (en) * | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US10553218B2 (en) * | 2016-09-19 | 2020-02-04 | Pindrop Security, Inc. | Dimensionality reduction of baum-welch statistics for speaker recognition |
CN106782564B (zh) * | 2016-11-18 | 2018-09-11 | 百度在线网络技术(北京)有限公司 | 用于处理语音数据的方法和装置 |
CN106790054A (zh) * | 2016-12-20 | 2017-05-31 | 四川长虹电器股份有限公司 | 基于人脸识别和声纹识别的交互式认证系统及方法 |
CN106683680B (zh) * | 2017-03-10 | 2022-03-25 | 百度在线网络技术(北京)有限公司 | 说话人识别方法及装置、计算机设备及计算机可读介质 |
JP6928865B2 (ja) * | 2017-03-16 | 2021-09-01 | パナソニックIpマネジメント株式会社 | 能動型騒音低減装置及び能動型騒音低減方法 |
-
2017
- 2017-06-16 CN CN201710461578.0A patent/CN109147770B/zh active Active
-
2018
- 2018-02-27 TW TW107106545A patent/TW201905895A/zh unknown
- 2018-06-14 JP JP2019569451A patent/JP6912605B2/ja active Active
- 2018-06-14 EP EP18817311.6A patent/EP3610396B1/en active Active
- 2018-06-14 WO PCT/US2018/037591 patent/WO2018232148A1/en unknown
- 2018-06-14 US US16/008,828 patent/US11011177B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11011177B2 (en) | 2021-05-18 |
EP3610396A1 (en) | 2020-02-19 |
CN109147770A (zh) | 2019-01-04 |
EP3610396B1 (en) | 2023-12-06 |
EP3610396A4 (en) | 2020-04-22 |
JP2020523643A (ja) | 2020-08-06 |
CN109147770B (zh) | 2023-07-28 |
WO2018232148A1 (en) | 2018-12-20 |
TW201905895A (zh) | 2019-02-01 |
US20180366125A1 (en) | 2018-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6912605B2 (ja) | 声識別特徴最適化および動的登録方法、クライアント、ならびにサーバ | |
US10777206B2 (en) | Voiceprint update method, client, and electronic device | |
US20230127314A1 (en) | Payment method, client, electronic device, storage medium, and server | |
US10832686B2 (en) | Method and apparatus for pushing information | |
CN110288985B (zh) | 语音数据处理方法、装置、电子设备及存储介质 | |
CN109215643B (zh) | 一种交互方法、电子设备及服务器 | |
JP6335139B2 (ja) | 手動始点/終点指定及びトリガフレーズの必要性の低減 | |
CN107481720B (zh) | 一种显式声纹识别方法及装置 | |
US20200342866A1 (en) | Dynamic and/or context-specific hot words to invoke automated assistant | |
US11687526B1 (en) | Identifying user content | |
WO2020238209A1 (zh) | 音频处理的方法、系统及相关设备 | |
US20190378024A1 (en) | Systems to augment conversations with relevant information or automation using proactive bots | |
US10108707B1 (en) | Data ingestion pipeline | |
US11004449B2 (en) | Vocal utterance based item inventory actions | |
CN109994106B (zh) | 一种语音处理方法及设备 | |
JP2022087815A (ja) | 相互接続された音声検証システムの使用を通して相互運用性を達成するためのシステム、方法、およびプログラム | |
CN112767916A (zh) | 智能语音设备的语音交互方法、装置、设备、介质及产品 | |
KR20200005476A (ko) | 소급 소리 식별 시스템 | |
KR102226427B1 (ko) | 호칭 결정 장치, 이를 포함하는 대화 서비스 제공 시스템, 호칭 결정을 위한 단말 장치 및 호칭 결정 방법 | |
TWI714090B (zh) | 機器人電話行銷系統及其計算機裝置與回應訊息產生方法 | |
JP2017161644A (ja) | 音声処理システムおよび音声処理方法 | |
CN114220430A (zh) | 多音区语音交互方法、装置、设备以及存储介质 | |
CN117807195A (zh) | 显示设备及实体召回方法 | |
JP2015018491A (ja) | 情報処理装置及び方法 | |
WO2019039352A1 (ja) | 情報処理装置、制御方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210608 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210708 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6912605 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |