JP2018527609A - ユーザ声紋モデルを構築するための方法、装置、及びシステム - Google Patents
ユーザ声紋モデルを構築するための方法、装置、及びシステム Download PDFInfo
- Publication number
- JP2018527609A JP2018527609A JP2018503211A JP2018503211A JP2018527609A JP 2018527609 A JP2018527609 A JP 2018527609A JP 2018503211 A JP2018503211 A JP 2018503211A JP 2018503211 A JP2018503211 A JP 2018503211A JP 2018527609 A JP2018527609 A JP 2018527609A
- Authority
- JP
- Japan
- Prior art keywords
- user
- voiceprint
- preset keyword
- information
- voiceprint model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000010276 construction Methods 0.000 claims abstract description 8
- 238000012795 verification Methods 0.000 claims description 74
- 238000000605 extraction Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 13
- 230000001419 dependent effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000000554 iris Anatomy 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/14—Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/40—Network security protocols
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Security & Cryptography (AREA)
- Game Theory and Decision Science (AREA)
- Business, Economics & Management (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
- Telephone Function (AREA)
Abstract
【選択図】図1
Description
ステップS101:ユーザによって入力される音声情報を受信する;
ステップS102:モデリング要件を満たすプリセットキーワードが音声情報に含まれて搬送されているかどうかを判断する;
ステップS103:判断結果が肯定である場合、モデリング要件を満たすプリセットキーワードに対応する音声分節を、音声情報から取り込む;そして、
ステップS104:ユーザの声紋モデルを、音声分節を用いて構築する。
理論的には、本願の解決策は、音声入力、音声制御、及び電話メッセージ等のユーザの音声を収集できる何れのシナリオにも実施できる。明らかではあるが、実際の適用中に、以下の要因を更に考慮する必要がある。すなわち、シナリオは声紋認識要件を有するかどうか、現在話しているユーザの身元を判断できるかどうか、ユーザの音声の長さ(計算の複雑さに関わる)、キーワードを含んで搬送する音声分節を効果的に収集できるかどうか(収集効率に関わる)等。
人間の言語は全て一連の連続した音節から成り、連続する音情報は音節ストリームと称される。音響学の観点から、音節ストリームは独立したいくつかの音節に分割されてもよい。加えて、各発音音節はその固定音響特徴を有する。音声認識技術は、2つの態様に基づく音響モデルを確立し、斯くして、音節ストリーム上の単語分割を実施する。しかし、本願において、その技術を直接的に利用してユーザ音声情報に関する認識を実施してもよく、特定の解決策は以下のステップを含む。
音響モデルを用いることによって音声情報を分割して少なくとも1つの音声分節を取得するステップ;及び、
取得した音声分節又はそれらの組み合わせがモデリング要件を満たすプリセットキーワードの音響特徴に一致するかどうかを判断し、肯定の場合、モデリング要件を満たすプリセットキーワードが音声情報に含まれて搬送されていると判断するステップ。
テキスト単語分割は自然言語処理技術の分野に属する。純粋な音響学レベルでの単語分割と比較して、テキスト単語分割技術はより成熟しており、より良好な実際の効果がある。加えて、同じ発音は多数の種類のテキストに対応してもよく、そのため、マッチングの間にテキストの内容を直接比較することによってよりよい効果を達成できることが分かる。本願において、ユーザ音声情報の認識は、音声認識技術とテキスト単語分割技術と組み合わせを直接用いることによって実施されてもよい。特定の解決策は以下のステップを含む。
音声情報に関する音声認識を行って対応するテキスト情報を取得するステップ;
言語モデルを用いることによってテキスト情報を分割して少なくとも1つのテキスト分節を取得するステップ;及び、
取得したテキスト分節又はそれらの組み合わせがモデリング要件を満たすプリセットキーワードのテキスト内容と一致するかどうかを判断し、肯定の場合、モデリング要件を満たすプリセットキーワードが音声情報に含まれて搬送されていると判断するステップ。
加えて、上記の方法は、更に、初回の声紋情報登録への適用に加え、声紋モデルの更新にも適用できる。特定の更新ストラテジは、以下の2つの観点から考慮することができる。
声紋モデルを構築する上記の手順は多数のデフォルトキーワードをサポートしており、ユーザは音声対話中に必ずしも全てのキーワードを話せるとは限らない。しかし、ユーザの音声対話は普通の行動であるので、声紋モデルの構築を初回に完了した後、ユーザの音声情報は、ユーザとの対話の後続の手順において再度収集することができる。新規に収集された音声情報が以前のモデルに含まれていないキーワードを含んでいた場合、新しいキーワードを利用して既存の声紋モデルを補完してもよい。
生体認識技術と機械学習技術は密接に関係している。多くの適用シナリオにおいて、モデルは、一般に、サンプルを複数回収集することによって訓練され、それによって、認識の精度及び失敗の許容範囲等の多くの態様における性能を高めている。本願の解決策のために、声紋モデルの訓練は、同じキーワードに対する同じユーザの音声情報を複数回収集することによって行ってもよい。
ステップS201:ユーザによって入力された音声情報を受信する。
ステップS202:検証要件を満たすプリセットキーワードが音声情報に含まれて搬送されているかどうかを判断する。
ステップS203:判断結果が肯定である場合、検証要件を満たすプリセットキーワードに対応する音声分節を音声情報から取り込む。
ステップS204:音声分節の声紋特徴を抽出する。
ステップS205:ユーザの身元を、ユーザの声紋特徴と予め構築された声紋モデルとを用いて検証する。
ステップS201乃至ステップS203は技術的実施という点でステップS101乃至ステップS103と基本的に全く同じであり、その違いは適用シナリオが異なるという点のみにある。ステップS204乃至ステップS205は通常の声紋検証ステップであり、詳細には説明しない。本願の解決策と従来の声紋検証解決策との間の相違は明確に以下の通りである。
ユーザによって入力される音声情報を受信するよう構成された音声情報受信モジュール110と;
モデリング要件を満たすプリセットキーワードが音声情報に含まれて搬送されているかどうかを判断するように構成されるモデリングキーワード判断モジュール120と;
判断結果が肯定である場合、音声情報から、モデリング要件を満たすプリセットキーワードに対応する音声分節を取り込むよう構成される音声分節取込モジュール130と;
音声分節を用いることによってユーザのための声紋モデルを構築するよう構成される声紋モデル構築モジュール140とを含んでもよい。
ユーザの声紋モデルが既に現時点で存在している場合、声紋モデルに含まれていないプリセットキーワードが音声情報に含まれて搬送されているかどうかを判断する;
又は、
ユーザの声紋モデルが既に現時点で存在している場合、声紋モデル内に既に含まれているプリセットキーワードが音声情報に含まれて搬送されているかどうかを判断するように構成されてもよい。
本願の特定の実施の形態によれば、声紋モデル構築モジュール140は、特に、
ユーザの声紋モデルが既に現時点で存在している場合、音声分節を用いることによって声紋モデルを更新するように構成されてもよい。
音響モデルを用いることによって音声情報を分割して少なくとも1つの音声分節を取得し;
取得した音声分節又はそれらの組み合わせがモデリング要件を満たすプリセットキーワードの音響特徴に一致するかどうかを判断し、肯定の場合、モデリング要件を満たすプリセットキーワードが音声情報内に含まれて搬送されていることを判断する、よう構成されてもよい。
又は、
モデリングキーワード判断モジュール120は、更に、具体的には、
音声情報に関する音声認識を行って対応するテキスト情報を取得し;
言語モデルを用いることによってテキスト情報を分割して少なくとも1つのテキスト分節を取得し;
取得したテキスト分節又はそれらの組み合わせがモデリング要件を満たすプリセットキーワードのテキスト内容と一致するかどうかを判断し、肯定の場合、モデリング要件を満たすプリセットキーワードが音声情報内に含まれて搬送されていることを判断する、ように構成されてもよい。
ユーザによって入力される音声情報を受信するよう構成された音声情報受信モジュール210と;
検証要件を満たすプリセットキーワードが音声情報に含まれて搬送されているかどうかを判断するよう構成された検証キーワード判断モジュール220と;
判断結果が肯定である場合、音声情報から、検証要件を満たすプリセットキーワードに対応する音声分節を取り込むよう構成された音声分節取込モジュール230と;
音声分節の声紋特徴を抽出するよう構成された声紋特徴抽出モジュール250と;
ユーザの声紋特徴と予め構築された声紋モデルとを用いることによってユーザの身元を検証するよう構成された検証モジュール260とを含んでいてもよい。
音声情報受信モジュール110と、音声情報受信モジュール210;
音声分節取込モジュール130と、音声分節取込モジュール230;
そして、検証キーワード判断モジュール120と検証キーワード判断モジュール220との間の相違は、単に、判断を行うルールが異なる点にある。したがって、実際の適用中、これらの同一又は類似モジュールは、図5に示すように、システム内で完全に多重化されてもよい。
キーワード判断モジュール320は、検証キーワード判断モジュール120と検証キーワード判断モジュール220との機能を統合している。
音声分節取込モジュール330は、音声分節取込モジュール130と音声分節取込モジュール230との機能を統合している。
声紋モデル構築モジュール340、声紋特徴抽出モジュール350、及び検証モジュール360の機能は、それぞれ、上記の装置において同じ名称のモジュールの機能と全く同じである。
Claims (14)
- ユーザによって入力される音声情報を受信するステップと;
モデリング要件を満たすプリセットキーワードが前記音声情報に含まれて搬送されているかどうかを判断するステップと;
前記判断結果が肯定である場合、前記音声情報から、モデリング要件を満たす前記プリセットキーワードに対応する音声分節を取り込むステップと;
前記音声分節を用いることによって前記ユーザのための声紋モデルを構築するステップとを備える:
ユーザ声紋モデルを構築するための方法。 - モデリング要件を満たすプリセットキーワードが前記音声情報に含まれて搬送されているかどうかを判断する前記ステップは、
前記ユーザの前記声紋モデルが既に現時点で存在している場合、前記声紋モデルに含まれていないプリセットキーワードが前記音声情報に含まれて搬送されているかどうかを判断するステップ、又は、
前記ユーザの前記声紋モデルが既に現時点で存在している場合、前記声紋モデルに既に含まれているプリセットキーワードが前記音声情報に含まれて搬送されているかどうかを判断するステップを備える:
請求項1に記載の方法。 - 前記音声分節を用いることによって前記ユーザのための声紋モデルを構築する前記ステップは、
前記ユーザの前記声紋モデルが既に現時点で存在している場合、前記音声分節を用いることによって前記声紋モデルを更新するステップを備える:
請求項1又は請求項2に記載の方法。 - モデリング要件を満たすプリセットキーワードが前記音声情報に含まれて搬送されているかどうかを判断する前記ステップは、
音響モデルを用いることによって前記音声情報を分割して少なくとも1つの音声分節を取得するステップと;
前記取得した音声分節又はそれらの組み合わせがモデリング要件を満たす前記プリセットキーワードの音響特徴に一致するかどうかを判断し、肯定の場合、モデリング要件を満たす前記プリセットキーワードが前記音声情報に含まれて搬送されていることを判断するステップとを備える:
請求項1に記載の方法。 - モデリング要件を満たすプリセットキーワードが前記音声情報に含まれて搬送されているかどうかを判断する前記ステップは、
前記音声情報に関する音声認識を行って、対応するテキスト情報を取得するステップと;
言語モデルを用いることによって前記テキスト情報を分割して少なくとも1つのテキスト分節を取得するステップと;
前記取得したテキスト分節又はそれらの組み合わせがモデリング要件を満たす前記プリセットキーワードの前記テキスト内容と一致するかどうかを判断し、肯定の場合、モデリング要件を満たす前記プリセットキーワードが前記音声情報に含まれて搬送されていることを判断するステップとを備える:
請求項1に記載の方法。 - ユーザによって入力される音声情報を受信するステップと;
検証要件を満たすプリセットキーワードが前記音声情報に含まれて搬送されているかどうかを判断するステップと;
前記判断結果が肯定である場合、前記音声情報から、検証要件を満たす前記プリセットキーワードに対応する音声分節を取り込むステップと;
前記音声分節の声紋特徴を抽出するステップと;
前記ユーザの前記声紋特徴と予め構築された声紋モデルとを用いることによって前記ユーザの前記身元を検証するステップとを備える:
声紋に基づくユーザ身元検証方法。 - 前記ユーザの前記声紋モデルに含まれていないプリセットキーワードが前記音声情報に含まれて搬送されているかどうかを判断するステップと;
前記判断結果が肯定である場合、前記音声情報から、前記含まれていないプリセットキーワードに対応する音声分節を取り込むステップと;
前記含まれていない前記プリセットキーワードに対応する前記音声分節を用いることによって前記ユーザの前記声紋モデルを更新するステップとを更に備える:
請求項6に記載の方法。 - ユーザによって入力される音声情報を受信するよう構成された音声情報受信モジュールと;
モデリング要件を満たすプリセットキーワードが前記音声情報に含まれて搬送されているかどうかを判断するよう構成されたモデリングキーワード判断モジュールと;
前記判断結果が肯定である場合、前記音声情報から、モデリング要件を満たす前記プリセットキーワードに対応する音声分節を取り込むよう構成された音声分節取込モジュールと;
前記音声分節を用いることによって前記ユーザのための声紋モデルを構築するよう構成された声紋モデル構築モジュールとを備える:
ユーザ声紋モデルを構築するための装置。 - 前記モデリングキーワード判断モジュールは、具体的には、
前記ユーザの前記声紋モデルが既に現時点で存在している場合、前記声紋モデルに含まれていないプリセットキーワードが前記音声情報に含まれて搬送されているかどうかを判断する;又は、
前記ユーザの前記声紋モデルが既に現時点で存在している場合、前記声紋モデルに既に含まれているプリセットキーワードが前記音声情報に含まれて搬送されているかどうかを判断するように構成された:
請求項8に記載の装置。 - 前記声紋モデル構築モジュールは、具体的には、
前記ユーザの前記声紋モデルが既に現時点で存在している場合、前記音声分節を用いることによって前記声紋モデルを更新するよう構成された:
請求項8又は請求項9に記載の装置。 - 前記モデリングキーワード判断モジュールは、具体的には、
音響モデルを用いることによって前記音声情報を分割して少なくとも1つの音声分節を取得し;
前記取得した音声分節又はそれらの組み合わせがモデリング要件を満たす前記プリセットキーワードの前記音響特徴に一致するかどうかを判断し、肯定の場合、モデリング要件を満たす前記プリセットキーワードが前記音声情報に含まれて搬送されていることを判断するように構成された;
請求項8に記載の装置。 - 前記モデリングキーワード判断モジュールは、具体的には、
前記音声情報に関する音声認識を行って、対応するテキスト情報を取得し;
言語モデルを用いることによって前記テキスト情報を分割して少なくとも1つのテキスト分節を取得し;
前記取得したテキスト分節又はそれらの組み合わせがモデリング要件を満たす前記プリセットキーワードの前記テキスト内容と一致するかどうかを判断し、肯定の場合、モデリング要件を満たす前記プリセットキーワードが前記音声情報に含まれて搬送されていることを判断するように構成された:
請求項8に記載の装置。 - ユーザによって入力される音声情報を受信するよう構成された音声情報受信モジュールと;
検証要件を満たすプリセットキーワードが前記音声情報に含まれて搬送されているかどうかを判断するよう構成された検証キーワード判断モジュールと;
前記判断結果が肯定である場合、前記音声情報から、検証要件を満たす前記プリセットキーワードに対応する音声分節を取り込むよう構成された音声分節取込モジュールと;
前記音声分節の声紋特徴を抽出するよう構成された声紋特徴抽出モジュールと;
前記ユーザの前記声紋特徴及び予め構築された声紋モデルを用いることによって前記ユーザの前記身元を検証するよう構成された検証モジュールとを備える:
声紋に基づくユーザ身元検証装置。 - 前記システムは、請求項8乃至請求項12のいずれか一項に記載のユーザ声紋モデルを構築するための前記装置と、請求項13に記載の前記ユーザ身元検証装置とを備える:
声紋に基づくユーザ身元検証システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510438382.0 | 2015-07-23 | ||
CN201510438382.0A CN106373575B (zh) | 2015-07-23 | 2015-07-23 | 一种用户声纹模型构建方法、装置及系统 |
PCT/CN2016/089962 WO2017012496A1 (zh) | 2015-07-23 | 2016-07-14 | 一种用户声纹模型构建方法、装置及系统 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018527609A true JP2018527609A (ja) | 2018-09-20 |
JP2018527609A5 JP2018527609A5 (ja) | 2019-08-22 |
JP6859522B2 JP6859522B2 (ja) | 2021-04-14 |
Family
ID=57833756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018503211A Active JP6859522B2 (ja) | 2015-07-23 | 2016-07-14 | ユーザ声紋モデルを構築するための方法、装置、及びシステム |
Country Status (9)
Country | Link |
---|---|
US (2) | US10714094B2 (ja) |
EP (1) | EP3327720B1 (ja) |
JP (1) | JP6859522B2 (ja) |
KR (1) | KR102250460B1 (ja) |
CN (1) | CN106373575B (ja) |
ES (1) | ES2880006T3 (ja) |
PL (1) | PL3327720T3 (ja) |
SG (1) | SG11201800297WA (ja) |
WO (1) | WO2017012496A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7457207B2 (ja) | 2020-10-13 | 2024-03-27 | グーグル エルエルシー | テキスト依存型話者検証機能の自動生成および/または使用 |
Families Citing this family (93)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
CN113470640B (zh) | 2013-02-07 | 2022-04-26 | 苹果公司 | 数字助理的语音触发器 |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
WO2015020942A1 (en) | 2013-08-06 | 2015-02-12 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
EP3480811A1 (en) | 2014-05-30 | 2019-05-08 | Apple Inc. | Multi-command single utterance input method |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
CN104616655B (zh) * | 2015-02-05 | 2018-01-16 | 北京得意音通技术有限责任公司 | 声纹模型自动重建的方法和装置 |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
CN106373575B (zh) * | 2015-07-23 | 2020-07-21 | 阿里巴巴集团控股有限公司 | 一种用户声纹模型构建方法、装置及系统 |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
WO2018108263A1 (en) | 2016-12-14 | 2018-06-21 | Telefonaktiebolaget Lm Ericsson (Publ) | Authenticating a user subvocalizing a displayed text |
KR102640423B1 (ko) | 2017-01-31 | 2024-02-26 | 삼성전자주식회사 | 음성 입력 처리 방법, 이를 지원하는 전자 장치, 및 시스템 |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
CN107590374A (zh) * | 2017-07-31 | 2018-01-16 | 捷开通讯(深圳)有限公司 | 语音助手权限的控制方法、智能终端及存储装置 |
US10592649B2 (en) * | 2017-08-09 | 2020-03-17 | Nice Ltd. | Authentication via a dynamic passphrase |
US10789959B2 (en) * | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
CN108665901B (zh) * | 2018-05-04 | 2020-06-30 | 广州国音科技有限公司 | 一种音素/音节提取方法及装置 |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
WO2020000427A1 (zh) * | 2018-06-29 | 2020-01-02 | 华为技术有限公司 | 一种语音控制方法、可穿戴设备及终端 |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
CN109065058B (zh) * | 2018-09-30 | 2024-03-15 | 合肥鑫晟光电科技有限公司 | 语音通信方法、装置及系统 |
CN109599116B (zh) * | 2018-10-08 | 2022-11-04 | 中国平安财产保险股份有限公司 | 基于语音识别的监管保险理赔的方法、装置和计算机设备 |
US20200201970A1 (en) * | 2018-12-20 | 2020-06-25 | Cirrus Logic International Semiconductor Ltd. | Biometric user recognition |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
CN111833882A (zh) * | 2019-03-28 | 2020-10-27 | 阿里巴巴集团控股有限公司 | 声纹信息管理方法、装置、系统及计算设备、存储介质 |
US11398239B1 (en) | 2019-03-31 | 2022-07-26 | Medallia, Inc. | ASR-enhanced speech compression |
US11227606B1 (en) * | 2019-03-31 | 2022-01-18 | Medallia, Inc. | Compact, verifiable record of an audio communication and method for making same |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
CN110671792A (zh) * | 2019-05-08 | 2020-01-10 | 青岛海尔空调器有限总公司 | 用于控制出风风量和出音音量的方法、装置和空调室内机 |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
CN110298150B (zh) * | 2019-05-29 | 2021-11-26 | 上海拍拍贷金融信息服务有限公司 | 一种基于语音识别的身份验证方法及系统 |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
CN110570869B (zh) * | 2019-08-09 | 2022-01-14 | 科大讯飞股份有限公司 | 一种声纹识别方法、装置、设备及存储介质 |
US10839060B1 (en) * | 2019-08-27 | 2020-11-17 | Capital One Services, Llc | Techniques for multi-voice speech recognition commands |
CN110491393B (zh) * | 2019-08-30 | 2022-04-22 | 科大讯飞股份有限公司 | 声纹表征模型的训练方法及相关装置 |
CN110738998A (zh) * | 2019-09-11 | 2020-01-31 | 深圳壹账通智能科技有限公司 | 基于语音的个人信用评估方法、装置、终端及存储介质 |
CN110753254A (zh) * | 2019-10-30 | 2020-02-04 | 四川长虹电器股份有限公司 | 应用于智能语音电视声纹支付的声纹注册方法 |
CN110991498A (zh) * | 2019-11-18 | 2020-04-10 | 有时数联科技(北京)有限公司 | 一种基于算法模型的识别方法、装置及系统 |
CN111048100B (zh) * | 2019-11-21 | 2023-09-08 | 深圳市东进银通电子有限公司 | 一种大数据并行化声纹辨认系统和方法 |
CN113112997A (zh) * | 2019-12-25 | 2021-07-13 | 华为技术有限公司 | 数据采集的方法及装置 |
CN111063360B (zh) * | 2020-01-21 | 2022-08-19 | 北京爱数智慧科技有限公司 | 一种声纹库的生成方法和装置 |
CN111341326B (zh) * | 2020-02-18 | 2023-04-18 | RealMe重庆移动通信有限公司 | 语音处理方法及相关产品 |
CN111524521B (zh) * | 2020-04-22 | 2023-08-08 | 北京小米松果电子有限公司 | 声纹提取模型训练方法和声纹识别方法、及其装置和介质 |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11183193B1 (en) | 2020-05-11 | 2021-11-23 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
CN111653283B (zh) * | 2020-06-28 | 2024-03-01 | 讯飞智元信息科技有限公司 | 一种跨场景声纹比对方法、装置、设备及存储介质 |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
CN112242137B (zh) * | 2020-10-15 | 2024-05-17 | 上海依图网络科技有限公司 | 一种人声分离模型的训练以及人声分离方法和装置 |
US11522994B2 (en) | 2020-11-23 | 2022-12-06 | Bank Of America Corporation | Voice analysis platform for voiceprint tracking and anomaly detection |
CN112417532A (zh) * | 2020-12-08 | 2021-02-26 | 浙江百应科技有限公司 | 一种支持语音和隐私输入的智能ai信息查询方法 |
CN116711006A (zh) | 2021-02-23 | 2023-09-05 | 三星电子株式会社 | 电子装置及其控制方法 |
CN112908339B (zh) * | 2021-03-18 | 2022-11-04 | 龙马智芯(珠海横琴)科技有限公司 | 一种会议环节定位方法、装置、定位设备及可读存储介质 |
TWI755328B (zh) * | 2021-05-24 | 2022-02-11 | 中華電信股份有限公司 | 孩童聲音偵測系統、方法及電腦可讀媒介 |
CN113488042B (zh) * | 2021-06-29 | 2022-12-13 | 荣耀终端有限公司 | 一种语音控制方法及电子设备 |
WO2024106830A1 (ko) * | 2022-11-17 | 2024-05-23 | 삼성전자 주식회사 | 폰북 기반의 성문 운용 방법 및 이를 지원하는 전자 장치 |
CN116229987B (zh) * | 2022-12-13 | 2023-11-21 | 广东保伦电子股份有限公司 | 一种校园语音识别的方法、装置及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003076390A (ja) * | 2001-08-31 | 2003-03-14 | Fujitsu Ltd | 話者認証システム及び方法 |
JP2003302999A (ja) * | 2002-04-11 | 2003-10-24 | Advanced Media Inc | 音声による個人認証システム |
WO2008111190A1 (ja) * | 2007-03-14 | 2008-09-18 | Pioneer Corporation | 音響モデル登録装置、話者認識装置、音響モデル登録方法及び音響モデル登録処理プログラム |
JP2010237323A (ja) * | 2009-03-30 | 2010-10-21 | Toshiba Corp | 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法 |
JP2011090483A (ja) * | 2009-10-22 | 2011-05-06 | Fujitsu Ltd | 情報処理装置およびプログラム |
CN102238189A (zh) * | 2011-08-01 | 2011-11-09 | 安徽科大讯飞信息科技股份有限公司 | 声纹密码认证方法及系统 |
JP2013235117A (ja) * | 2012-05-08 | 2013-11-21 | Yahoo Japan Corp | 単語分割装置、及び単語分割方法 |
CN103971700A (zh) * | 2013-08-01 | 2014-08-06 | 哈尔滨理工大学 | 语音监控方法及装置 |
JP2014145932A (ja) * | 2013-01-29 | 2014-08-14 | Sogo Keibi Hosho Co Ltd | 話者認識装置、話者認識方法及び話者認識プログラム |
JP2016538658A (ja) * | 2013-09-16 | 2016-12-08 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | アプリケーションへのアクセスを制御するための方法および装置 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5913192A (en) * | 1997-08-22 | 1999-06-15 | At&T Corp | Speaker identification with user-selected password phrases |
JPH11291799A (ja) | 1998-04-09 | 1999-10-26 | Combi Corp | チャイルドシート |
US6691089B1 (en) * | 1999-09-30 | 2004-02-10 | Mindspeed Technologies Inc. | User configurable levels of security for a speaker verification system |
US7222072B2 (en) * | 2003-02-13 | 2007-05-22 | Sbc Properties, L.P. | Bio-phonetic multi-phrase speaker identity verification |
US20060229879A1 (en) * | 2005-04-06 | 2006-10-12 | Top Digital Co., Ltd. | Voiceprint identification system for e-commerce |
CN101051463B (zh) * | 2006-04-06 | 2012-07-11 | 株式会社东芝 | 说话人认证的验证方法及装置 |
CN101465123B (zh) * | 2007-12-20 | 2011-07-06 | 株式会社东芝 | 说话人认证的验证方法和装置以及说话人认证系统 |
CN102737634A (zh) * | 2012-05-29 | 2012-10-17 | 百度在线网络技术(北京)有限公司 | 一种基于语音的认证方法及装置 |
CN102760434A (zh) * | 2012-07-09 | 2012-10-31 | 华为终端有限公司 | 一种声纹特征模型更新方法及终端 |
US9711148B1 (en) * | 2013-07-18 | 2017-07-18 | Google Inc. | Dual model speaker identification |
CN104765996B (zh) * | 2014-01-06 | 2018-04-27 | 讯飞智元信息科技有限公司 | 声纹密码认证方法及系统 |
CN104901926A (zh) * | 2014-03-06 | 2015-09-09 | 武汉元宝创意科技有限公司 | 基于声纹特征的远程认证支付的系统与方法 |
US20150302856A1 (en) * | 2014-04-17 | 2015-10-22 | Qualcomm Incorporated | Method and apparatus for performing function by speech input |
US10008208B2 (en) * | 2014-09-18 | 2018-06-26 | Nuance Communications, Inc. | Method and apparatus for performing speaker recognition |
CN104202486A (zh) * | 2014-09-26 | 2014-12-10 | 上海华勤通讯技术有限公司 | 移动终端及其屏幕解锁方法 |
US9721571B2 (en) * | 2015-06-14 | 2017-08-01 | Nice Ltd. | System and method for voice print generation |
CN106373575B (zh) * | 2015-07-23 | 2020-07-21 | 阿里巴巴集团控股有限公司 | 一种用户声纹模型构建方法、装置及系统 |
CN105930892A (zh) | 2016-04-22 | 2016-09-07 | 深圳活悦网络科技有限公司 | 一种可变logo二维码防伪方法及系统 |
CN107103480A (zh) | 2017-05-18 | 2017-08-29 | 电子科技大学 | 基于主权区块链的供应链管理方法 |
CN107657463A (zh) | 2017-09-29 | 2018-02-02 | 北京京东尚科信息技术有限公司 | 物品溯源平台和方法及装置 |
-
2015
- 2015-07-23 CN CN201510438382.0A patent/CN106373575B/zh active Active
-
2016
- 2016-07-14 SG SG11201800297WA patent/SG11201800297WA/en unknown
- 2016-07-14 EP EP16827187.2A patent/EP3327720B1/en active Active
- 2016-07-14 WO PCT/CN2016/089962 patent/WO2017012496A1/zh active Application Filing
- 2016-07-14 JP JP2018503211A patent/JP6859522B2/ja active Active
- 2016-07-14 ES ES16827187T patent/ES2880006T3/es active Active
- 2016-07-14 PL PL16827187T patent/PL3327720T3/pl unknown
- 2016-07-14 KR KR1020187005014A patent/KR102250460B1/ko active IP Right Grant
-
2018
- 2018-01-12 US US15/870,048 patent/US10714094B2/en active Active
-
2020
- 2020-06-19 US US16/906,829 patent/US11043223B2/en active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003076390A (ja) * | 2001-08-31 | 2003-03-14 | Fujitsu Ltd | 話者認証システム及び方法 |
JP2003302999A (ja) * | 2002-04-11 | 2003-10-24 | Advanced Media Inc | 音声による個人認証システム |
WO2008111190A1 (ja) * | 2007-03-14 | 2008-09-18 | Pioneer Corporation | 音響モデル登録装置、話者認識装置、音響モデル登録方法及び音響モデル登録処理プログラム |
JP2010237323A (ja) * | 2009-03-30 | 2010-10-21 | Toshiba Corp | 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法 |
JP2011090483A (ja) * | 2009-10-22 | 2011-05-06 | Fujitsu Ltd | 情報処理装置およびプログラム |
CN102238189A (zh) * | 2011-08-01 | 2011-11-09 | 安徽科大讯飞信息科技股份有限公司 | 声纹密码认证方法及系统 |
JP2013235117A (ja) * | 2012-05-08 | 2013-11-21 | Yahoo Japan Corp | 単語分割装置、及び単語分割方法 |
JP2014145932A (ja) * | 2013-01-29 | 2014-08-14 | Sogo Keibi Hosho Co Ltd | 話者認識装置、話者認識方法及び話者認識プログラム |
CN103971700A (zh) * | 2013-08-01 | 2014-08-06 | 哈尔滨理工大学 | 语音监控方法及装置 |
JP2016538658A (ja) * | 2013-09-16 | 2016-12-08 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | アプリケーションへのアクセスを制御するための方法および装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7457207B2 (ja) | 2020-10-13 | 2024-03-27 | グーグル エルエルシー | テキスト依存型話者検証機能の自動生成および/または使用 |
US11984128B2 (en) | 2020-10-13 | 2024-05-14 | Google Llc | Automatic generation and/or use of text-dependent speaker verification features |
Also Published As
Publication number | Publication date |
---|---|
PL3327720T3 (pl) | 2021-10-25 |
EP3327720B1 (en) | 2021-05-05 |
US20200321010A1 (en) | 2020-10-08 |
JP6859522B2 (ja) | 2021-04-14 |
US11043223B2 (en) | 2021-06-22 |
SG11201800297WA (en) | 2018-02-27 |
ES2880006T3 (es) | 2021-11-23 |
KR20180034507A (ko) | 2018-04-04 |
EP3327720A4 (en) | 2019-04-03 |
CN106373575A (zh) | 2017-02-01 |
US10714094B2 (en) | 2020-07-14 |
WO2017012496A1 (zh) | 2017-01-26 |
CN106373575B (zh) | 2020-07-21 |
EP3327720A1 (en) | 2018-05-30 |
KR102250460B1 (ko) | 2021-05-13 |
US20180137865A1 (en) | 2018-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6859522B2 (ja) | ユーザ声紋モデルを構築するための方法、装置、及びシステム | |
US10476872B2 (en) | Joint speaker authentication and key phrase identification | |
WO2017197953A1 (zh) | 基于声纹的身份识别方法及装置 | |
JP6394709B2 (ja) | 話者識別装置および話者識別用の登録音声の特徴量登録方法 | |
US7386448B1 (en) | Biometric voice authentication | |
US8812319B2 (en) | Dynamic pass phrase security system (DPSS) | |
Larcher et al. | The RSR2015: Database for text-dependent speaker verification using multiple pass-phrases | |
WO2020211354A1 (zh) | 基于说话内容的说话者身份识别方法、装置及存储介质 | |
US11948582B2 (en) | Systems and methods for speaker verification | |
US8010367B2 (en) | Spoken free-form passwords for light-weight speaker verification using standard speech recognition engines | |
KR100655491B1 (ko) | 음성인식 시스템에서의 2단계 발화 검증 방법 및 장치 | |
KR102097710B1 (ko) | 대화 분리 장치 및 이에서의 대화 분리 방법 | |
KR20180050365A (ko) | 화자 검증 | |
WO2017206375A1 (zh) | 声纹注册、认证方法及装置 | |
KR20190082900A (ko) | 음성 인식 방법, 전자 디바이스, 및 컴퓨터 저장 매체 | |
CN104064189A (zh) | 一种声纹动态口令的建模和验证方法 | |
US10909991B2 (en) | System for text-dependent speaker recognition and method thereof | |
WO2020192890A1 (en) | Systems and methods for speaker verification | |
JP7339116B2 (ja) | 音声認証装置、音声認証システム、および音声認証方法 | |
EP1164576B1 (en) | Speaker authentication method and system from speech models | |
CN112992155A (zh) | 一种基于残差神经网络的远场语音说话人识别方法及装置 | |
US10628567B2 (en) | User authentication using prompted text | |
CN105575385A (zh) | 语音密码设置系统及方法、语音密码验证系统及方法 | |
Das et al. | Comparison of DTW score and warping path for text dependent speaker verification system | |
Tanwar et al. | An approach to ensure security using voice authentication system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190710 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190710 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20200605 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200820 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200907 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201221 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20201228 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6859522 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |