JP4802135B2 - 話者認証登録及び確認方法並びに装置 - Google Patents
話者認証登録及び確認方法並びに装置 Download PDFInfo
- Publication number
- JP4802135B2 JP4802135B2 JP2007099947A JP2007099947A JP4802135B2 JP 4802135 B2 JP4802135 B2 JP 4802135B2 JP 2007099947 A JP2007099947 A JP 2007099947A JP 2007099947 A JP2007099947 A JP 2007099947A JP 4802135 B2 JP4802135 B2 JP 4802135B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- speaker
- registration
- registered
- acoustic feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 60
- 238000012790 confirmation Methods 0.000 title claims description 33
- 238000001228 spectrum Methods 0.000 claims description 72
- 239000013598 vector Substances 0.000 claims description 71
- 238000001914 filtration Methods 0.000 claims description 16
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000012795 verification Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 description 11
- 238000007781 pre-processing Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229940034880 tencon Drugs 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Description
前述の話者認証確認装置とを備えるシステムが提供される。
但し、結果多項式P(z)と(z)は、z=+1におけるP(z)の乗根、およびz=−1におけるQ(z)の乗根と、それぞれ、対称と逆対称である。PとQの残りの乗根は、すべて、Z領域内の単位円上にあり、これらは、共役対として生じる。各乗根の角度、{oi,i=1,2,...,M}を線スペクトル対(LSP)という。
Claims (10)
- 話者認証の登録の方法であって、
話者の登録発声から音響的特徴ベクトルシーケンスを抽出することと、
前記音響的特徴ベクトルシーケンスを使って話者テンプレートを生成することと、
を備え、
音響的特徴ベクトルシーケンスを抽出する前記ステップは、
前記登録発声に基づいて、前記登録発声のスペクトルにおけるフォルマントの位置とエネルギーをフィルタリングする、前記話者の前記登録発声のためのフィルタバンクを生成することと、
前記生成されたフィルタバンクによって前記登録発声の前記スペクトルをフィルタリングすることと、
前記フィルタリングされた登録発声から前記音響的特徴ベクトルシーケンスを生成することと、
を備える話者認証登録方法。 - 前記登録発声のためのフィルタバンクを生成する前記ステップは、
前記登録発声中の各フレームをLPC解析して、前記フレームのLPC係数ベクトルを取得することと、
前記取得された各フレームのLPC係数ベクトルをLSP解析して、前記フレームの線スペクトル対(LSP)を取得することと、
前記登録発声中の全フレームの前記LSPを、前記登録発声のための前記フィルタバンクとして組み合わせることと、
を備える、請求項1に記載の話者認証登録方法。 - 前記登録発声のためのフィルタバンクを生成する前記ステップは、
フォルマント推定法を使って前記登録発声中の各フレームを解析することによって、前記フレームのフォルマント位置ベクトルを取得することと、
前記登録発声中の全フレームの前記フォルマント位置ベクトルを、前記フィルタバンクとして組み合わせることと、
を備える、請求項1に記載の話者認証登録方法。 - 前記登録発声の前記スペクトルをフィルタリングする前記ステップは、
前記登録発声中の各フレームを高速フーリエ変換して、前記フレームのフレームスペクトルを取得することと、
前記フィルタバンクを用いて各フレームの前記フレームスペクトルをフィルタリングすることと、
を備える、請求項1に記載の話者認証登録方法。 - 話者の登録発声から音響的特徴ベクトルシーケンスを抽出する前記ステップは、
話者の複数の登録発声から複数の音響的特徴ベクトルシーケンスを抽出することを備え、
話者テンプレートを生成する前記ステップは、
抽出された前記複数の音響的特徴ベクトルシーケンスをマージして前記話者テンプレートを生成することを備える、請求項1に記載の話者認証登録方法。 - 前記各登録発声に関して、前記登録発声の前記スペクトルをフィルタリングするためにフィルタバンクが生成され、
前記方法は、前記話者の前記複数の登録発声のために個々に生成された複数のフィルタバンクをマージすることをさらに備える、請求項5に記載の話者認証登録方法。 - 話者認証の確認の方法であって、
入力発声から音響的特徴ベクトルシーケンスを抽出することと、
話者テンプレートと、前記抽出された音響的特徴ベクトルシーケンスに基づいて、前記入力発声が、話者によって発話された登録済みパスワードの発声であるかどうか判定することと、
を備え、
前記話者テンプレートは、請求項1から6のいずれか1項に記載の話者認証登録方法を使って生成され、
入力発声から音響的特徴ベクトルシーケンスを抽出する前記ステップは、
登録時に前記話者の登録発声のために生成されるフィルタバンクを使って前記入力発声のスペクトルをフィルタリングすることと、
前記フィルタリングされた入力発声から前記音響的特徴ベクトルシーケンスを生成することと、
を備える方法。 - 話者認証の登録の装置であって、
話者によって発話されるパスワードを含む登録発声を入力するように構成された発声入力ユニットと、
前記登録発声から音響的特徴ベクトルシーケンスを抽出するように構成された音響的特徴抽出器と、
前記音響的特徴ベクトルシーケンスを使って話者テンプレートを生成するように構成されたテンプレート生成器と、
を備え、
前記音響的特徴抽出器は、
前記登録発声の各フレームをLPC解析して、フレームの線形予測係数ベクトルを取得するように構成されたLPC解析器と、
前記LPC解析器によって生成されるフレームの線形予測係数ベクトルに基づいて、各フレームの線スペクトル対を計算し、全フレームの線スペクトル対が、登録発声のためのフィルタバンクとしての、線スペクトル対グループを形成するように構成されたフィルタバンク生成器と、
前記登録発声のための前記生成されるフィルタバンクを用いて、前記登録発声のスペクトルをフィルタリングするように構成されたフィルタリングユニットと、
を備える、話者認証登録装置。 - 話者認証の確認の装置であって、
発声を入力するように構成された発声入力ユニットと、
前記入力発声から音響的特徴ベクトルシーケンスを抽出するように構成された音響的特徴抽出器と、
請求項1から6のいずれか1項に記載の話者認証の登録の方法を使って生成される登録済みの話者テンプレートを、前記抽出される音響的特徴ベクトルシーケンスと比較することによって、前記入力発声が、話者によって発話された登録済みパスワードの発声であるかどうか判定するように構成された判定ユニットと、
を備え、
前記音響的特徴抽出器は、
登録時に前記話者の登録発声のために生成されるフィルタバンクを使って前記入力発声のスペクトルをフィルタリングするように構成されたフィルタリングユニットを備える話者認証確認装置。 - 話者認証のシステムであって、
請求項8項に記載の話者認証登録装置と、
請求項9に記載の話者認証確認装置と、
を備えるシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200610073144.5 | 2006-04-06 | ||
CNA2006100731445A CN101051464A (zh) | 2006-04-06 | 2006-04-06 | 说话人认证的注册和验证方法及装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2007279743A JP2007279743A (ja) | 2007-10-25 |
JP2007279743A5 JP2007279743A5 (ja) | 2009-07-02 |
JP4802135B2 true JP4802135B2 (ja) | 2011-10-26 |
Family
ID=38576542
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007099947A Expired - Fee Related JP4802135B2 (ja) | 2006-04-06 | 2007-04-06 | 話者認証登録及び確認方法並びに装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7877254B2 (ja) |
JP (1) | JP4802135B2 (ja) |
CN (1) | CN101051464A (ja) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1953052B (zh) * | 2005-10-20 | 2010-09-08 | 株式会社东芝 | 训练时长预测模型、时长预测和语音合成的方法及装置 |
CN101051459A (zh) * | 2006-04-06 | 2007-10-10 | 株式会社东芝 | 基频和停顿预测及语音合成的方法和装置 |
US20080243503A1 (en) * | 2007-03-30 | 2008-10-02 | Microsoft Corporation | Minimum divergence based discriminative training for pattern recognition |
CN101465123B (zh) * | 2007-12-20 | 2011-07-06 | 株式会社东芝 | 说话人认证的验证方法和装置以及说话人认证系统 |
WO2010019831A1 (en) | 2008-08-14 | 2010-02-18 | 21Ct, Inc. | Hidden markov model for speech processing with training method |
WO2010066269A1 (en) * | 2008-12-10 | 2010-06-17 | Agnitio, S.L. | Method for verifying the identify of a speaker and related computer readable medium and computer |
US8732350B2 (en) * | 2008-12-19 | 2014-05-20 | Nvidia Corporation | Method and system for improving direct memory access offload |
US9208108B2 (en) * | 2008-12-19 | 2015-12-08 | Nvidia Corporation | Method and system for improved flash controller commands selection |
US8694750B2 (en) * | 2008-12-19 | 2014-04-08 | Nvidia Corporation | Method and system for data structure management |
FR2940498B1 (fr) * | 2008-12-23 | 2011-04-15 | Thales Sa | Procede et systeme pour authentifier un utilisateur et/ou une donnee cryptographique |
US8683293B2 (en) * | 2009-12-16 | 2014-03-25 | Nvidia Corporation | Method and system for fast two bit error correction |
US20110161553A1 (en) * | 2009-12-30 | 2011-06-30 | Nvidia Corporation | Memory device wear-leveling techniques |
US9594675B2 (en) * | 2009-12-31 | 2017-03-14 | Nvidia Corporation | Virtualization of chip enables |
US20110320201A1 (en) * | 2010-06-24 | 2011-12-29 | Kaufman John D | Sound verification system using templates |
US9465728B2 (en) | 2010-11-03 | 2016-10-11 | Nvidia Corporation | Memory controller adaptable to multiple memory devices |
US10235509B2 (en) | 2013-08-22 | 2019-03-19 | Staton Techiya, Llc | Methods and systems for a voice ID verification database and service in social networking and commercial business transactions |
CN103594091B (zh) * | 2013-11-15 | 2017-06-30 | 努比亚技术有限公司 | 一种移动终端及其语音信号处理方法 |
US9646613B2 (en) | 2013-11-29 | 2017-05-09 | Daon Holdings Limited | Methods and systems for splitting a digital signal |
CN104320255A (zh) * | 2014-09-30 | 2015-01-28 | 百度在线网络技术(北京)有限公司 | 生成账户认证数据的方法、账户认证的方法以及装置 |
CN104990553A (zh) * | 2014-12-23 | 2015-10-21 | 上海安悦四维信息技术有限公司 | 一种手持车机C-Pad智能导航系统及工作方法 |
CN105575385A (zh) * | 2015-12-16 | 2016-05-11 | 中国建设银行股份有限公司 | 语音密码设置系统及方法、语音密码验证系统及方法 |
US10614813B2 (en) * | 2016-11-04 | 2020-04-07 | Intellisist, Inc. | System and method for performing caller identity verification using multi-step voice analysis |
JP7048619B2 (ja) * | 2016-12-29 | 2022-04-05 | サムスン エレクトロニクス カンパニー リミテッド | 共振器を利用した話者認識方法及びその装置 |
CN107195028B (zh) * | 2017-04-27 | 2018-07-06 | 深圳昌恩智能股份有限公司 | 一种高精度无线语音识别门禁系统 |
CN111345016A (zh) * | 2017-09-13 | 2020-06-26 | 深圳传音通讯有限公司 | 一种智能终端的启动控制方法及启动控制系统 |
CN107945787A (zh) * | 2017-11-21 | 2018-04-20 | 上海电机学院 | 一种基于虚拟仪器技术的声控登陆管理系统及方法 |
CN109872721A (zh) * | 2017-12-05 | 2019-06-11 | 富士通株式会社 | 语音认证方法、信息处理设备以及存储介质 |
CN109003364A (zh) * | 2018-07-04 | 2018-12-14 | 深圳市益鑫智能科技有限公司 | 一种基于语音识别的智能家居门禁系统 |
CN110322887B (zh) * | 2019-04-28 | 2021-10-15 | 武汉大晟极科技有限公司 | 一种多类型音频信号能量特征提取方法 |
CN110838294B (zh) * | 2019-11-11 | 2022-03-04 | 效生软件科技(上海)有限公司 | 一种语音验证方法、装置、计算机设备及存储介质 |
CN111128198B (zh) * | 2019-12-25 | 2022-10-28 | 厦门快商通科技股份有限公司 | 一种声纹识别方法、装置、存储介质、服务器及系统 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4133976A (en) | 1978-04-07 | 1979-01-09 | Bell Telephone Laboratories, Incorporated | Predictive speech signal coding with reduced noise effects |
GB2140256A (en) | 1983-04-08 | 1984-11-21 | Brock Nannestad George | A procedure and apparatus for corrected reproduction of acoustic recordings |
JPS61278899A (ja) * | 1985-06-05 | 1986-12-09 | 株式会社東芝 | 話者照合用フイルタ |
EP0248593A1 (en) * | 1986-06-06 | 1987-12-09 | Speech Systems, Inc. | Preprocessing system for speech recognition |
JPS63106699A (ja) * | 1986-10-23 | 1988-05-11 | 松下電器産業株式会社 | ホルマント抽出装置 |
US5548647A (en) * | 1987-04-03 | 1996-08-20 | Texas Instruments Incorporated | Fixed text speaker verification method and apparatus |
JPH02232698A (ja) * | 1989-03-06 | 1990-09-14 | Sony Corp | 音声認識装置 |
JPH0598859A (ja) * | 1991-10-07 | 1993-04-20 | Yuhshin Co Ltd | 音声照合装置 |
JPH05134697A (ja) * | 1991-11-14 | 1993-05-28 | Oki Electric Ind Co Ltd | 音声認識装置 |
US5522012A (en) * | 1994-02-28 | 1996-05-28 | Rutgers University | Speaker identification and verification system |
JP3550871B2 (ja) * | 1996-04-26 | 2004-08-04 | 松下電工株式会社 | 音声認識方法及び装置 |
JPH1097274A (ja) * | 1996-09-24 | 1998-04-14 | Kokusai Denshin Denwa Co Ltd <Kdd> | 話者認識方法及び装置 |
JP3402100B2 (ja) | 1996-12-27 | 2003-04-28 | カシオ計算機株式会社 | 音声制御ホスト装置 |
FR2762464B1 (fr) | 1997-04-16 | 1999-06-25 | France Telecom | Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere" |
US5940791A (en) * | 1997-05-09 | 1999-08-17 | Washington University | Method and apparatus for speech analysis and synthesis using lattice ladder notch filters |
US6400310B1 (en) * | 1998-10-22 | 2002-06-04 | Washington University | Method and apparatus for a tunable high-resolution spectral estimator |
US6195632B1 (en) | 1998-11-25 | 2001-02-27 | Matsushita Electric Industrial Co., Ltd. | Extracting formant-based source-filter data for coding and synthesis employing cost function and inverse filtering |
US6978238B2 (en) | 1999-07-12 | 2005-12-20 | Charles Schwab & Co., Inc. | Method and system for identifying a user by voice |
US20030018471A1 (en) * | 1999-10-26 | 2003-01-23 | Yan Ming Cheng | Mel-frequency domain based audible noise filter and method |
KR20050049103A (ko) | 2003-11-21 | 2005-05-25 | 삼성전자주식회사 | 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치 |
US7536304B2 (en) * | 2005-05-27 | 2009-05-19 | Porticus, Inc. | Method and system for bio-metric voice print authentication |
US7778831B2 (en) * | 2006-02-21 | 2010-08-17 | Sony Computer Entertainment Inc. | Voice recognition with dynamic filter bank adjustment based on speaker categorization determined from runtime pitch |
-
2006
- 2006-04-06 CN CNA2006100731445A patent/CN101051464A/zh active Pending
-
2007
- 2007-03-28 US US11/692,397 patent/US7877254B2/en not_active Expired - Fee Related
- 2007-04-06 JP JP2007099947A patent/JP4802135B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20070239451A1 (en) | 2007-10-11 |
CN101051464A (zh) | 2007-10-10 |
US7877254B2 (en) | 2011-01-25 |
JP2007279743A (ja) | 2007-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4802135B2 (ja) | 話者認証登録及び確認方法並びに装置 | |
Togneri et al. | An overview of speaker identification: Accuracy and robustness issues | |
Dhingra et al. | Isolated speech recognition using MFCC and DTW | |
Kumar et al. | Design of an automatic speaker recognition system using MFCC, vector quantization and LBG algorithm | |
Senthil Raja et al. | Speaker recognition under stressed condition | |
Sapijaszko et al. | An overview of recent window based feature extraction algorithms for speaker recognition | |
Maazouzi et al. | MFCC and similarity measurements for speaker identification systems | |
Nijhawan et al. | A new design approach for speaker recognition using MFCC and VAD | |
Omer | Joint MFCC-and-vector quantization based text-independent speaker recognition system | |
CN113241059B (zh) | 语音唤醒方法、装置、设备及存储介质 | |
Bhukya et al. | End point detection using speech-specific knowledge for text-dependent speaker verification | |
Wang et al. | Robust Text-independent Speaker Identification in a Time-varying Noisy Environment. | |
Kumar et al. | Effective preprocessing of speech and acoustic features extraction for spoken language identification | |
Nair et al. | A reliable speaker verification system based on LPCC and DTW | |
Ouzounov | Cepstral features and text-dependent speaker identification–A comparative study | |
Jagtap et al. | Speaker verification using Gaussian mixture model | |
Lipeika | Optimization of formant feature based speech recognition | |
Xiao et al. | Inventory based speech enhancement for speaker dedicated speech communication systems | |
Krishnamoorthy et al. | Application of combined temporal and spectral processing methods for speaker recognition under noisy, reverberant or multi-speaker environments | |
Mousa | MareText independent speaker identification based on K-mean algorithm | |
Chaudhary | Short-term spectral feature extraction and their fusion in text independent speaker recognition: A review | |
Upadhyay et al. | Analysis of different classifier using feature extraction in speaker identification and verification under adverse acoustic condition for different scenario | |
Thakur et al. | Speaker Authentication Using GMM-UBM | |
Sangwan | Feature Extraction for Speaker Recognition: A Systematic Study | |
Sarangi et al. | Gaussian Filter Based Data-Driven Cepstral Features for Robust Speaker Verification System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090519 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090519 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110301 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110712 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110808 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140812 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140812 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |