JP2008070597A - 音声認証装置、音声認証方法およびプログラム - Google Patents
音声認証装置、音声認証方法およびプログラム Download PDFInfo
- Publication number
- JP2008070597A JP2008070597A JP2006249161A JP2006249161A JP2008070597A JP 2008070597 A JP2008070597 A JP 2008070597A JP 2006249161 A JP2006249161 A JP 2006249161A JP 2006249161 A JP2006249161 A JP 2006249161A JP 2008070597 A JP2008070597 A JP 2008070597A
- Authority
- JP
- Japan
- Prior art keywords
- authentication
- voice
- noise
- threshold value
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】特性分析部20は、認証時に被認証者の周囲に発生する認証時雑音の特性を分析する。閾値設定部50は、特性分析部20が分析した認証時雑音の特性に応じて閾値THを設定する。認証部40は、予め登録された登録音声と被認証者から採取された認証音声との特徴量の距離DISTを算定し、距離DISTと閾値設定部50が設定した閾値THとの比較の結果に応じて被認証者を認証する。閾値設定部50は、登録音声の登録時に発生する登録時雑音と登録音声との音量比EN_SNに対し、音量被EN_SNと認証時雑音および認証音声の音量比V_SNとの差分値DIF_SNに応じた直線に沿って閾値THが変化するように閾値を設定する。
【選択図】図1
Description
図1は、本発明のひとつの形態に係る音声認証装置の構成を示すブロック図である。音声認証装置100は、被認証者が特定の言葉を発声したときの音声に基づいて被認証者の正当性(予め登録された正規の利用者であるか否か)を判定する装置であり、携帯電話機や情報処理装置など各種の電子機器に搭載される。図1に図示された特性分析部20や認証部40や閾値設定部50は、例えばCPUなどの演算処理装置がプログラムを実行することで実現されてもよいし、DSPなどのハードウェア回路によって実現されてもよい。
次に、認証時において閾値設定部50が閾値THを設定する処理を中心に音声認証装置100の動作を説明する。閾値設定部50は、認証の必要な時期が到来するたびに図3の処理を実行する。認証が必要な時機としては、例えば、音声認証装置100を搭載した電子機器が電源の投入を契機として動作を開始する時機や、電子機器が所定の動作(例えば特定の情報に対するアクセス)を開始する時機がある。認証が開始すると、被認証者は、操作部10を操作することで発声の開始を指示したうえで入力部15に対して所定の言葉を発声する。雑音分析部25は、操作部10への操作の時機を終点とする検出区間Pの音響信号Sから周波数特性V_NOISE_FCおよび雑音レベルV_NOISE_LEVELを特定するとともに、これに続く発声区間P2の音響信号Sから発声レベルV_SPEECH_LEVELおよび発声長V_SPEECH_LENを特定する。
EN_SN=log(EN_SPEECH_LEVEL/EN_NOISE_LEVEL) ……(1)
V_SN=log(V_SPEECH_LEVEL/V_NOISE_LEVEL) ……(2)
以上の形態には様々な変形を加えることができる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の各態様を適宜に組み合わせてもよい。
以上の形態においては記憶部35に格納されたテーブルが利用される構成を例示したが、所定の演算式を利用した演算処理によって閾値THの初期値や補正値A1およびA2が選定される構成としてもよい。例えば、音量比差分値DIF_SNに応じた直線(音量比EN_SNと閾値THとの関係を定義する図4の各直線)を表わす複数の数式が記憶部35に格納され、初期値設定部52は、ステップS12で算定された音量比差分値DIF_SNに応じた数式にステップS10で算定された音量比EN_SNを代入することで閾値THを演算する。また、相関値NOISE_DIFと補正値A1との関係を表わす数式に基づいて補正部54が補正値A1を算定する構成や、発声長EN_SPEECH_LENと補正値A2との関係を表わす数式に基づいて補正部56が補正値A2を算定する構成も採用される。
閾値THの補正の程度を決定する変数は相関値NOISE_DIFや発声長EN_SPEECH_LENに限定されない。例えば、発声長EN_SPEECH_LENに応じて閾値THを補正する構成に代えて、またはこの構成とともに、認証音声の発声長V_SPEECH_LENに応じて閾値THを補正する構成や、発声長EN_SPEECH_LENと発声長V_SPEECH_LENとの平均値に応じて閾値THを補正する構成を採用してもよい。例えば、発声長EN_SPEECH_LENと補正値A2との関係と同様に、発声長V_SPEECH_LENが長いほど閾値THが低下するように閾値THが補正される。
閾値THと各変数との関係が可変である構成も採用される。例えば、操作部10の操作に応じてテーブルを更新することで音量比EN_SNや音量比差分値DIF_SNと閾値THの初期値との関係が変更される構成としてもよい。同様に、各変数と閾値THに対する補正の程度との関係が可変である構成も採用される。例えば、相関値NOISE_DIFに対応した補正値A1や発声長EN_SPEECH_LENに応じた補正値A2は操作部10に対する操作に応じて変更され得る。これらの構成によれば、利用者の要求に応じた認証を実現することが可能となる。また、変形例1に例示したように数式の演算によって閾値THや補正値(A1,A2)が算定される構成においては、数式の内容(例えば各変数の係数)が操作部10に対する操作に応じて変更されるようにしてもよい。
以上の形態においては登録音声と認証音声との距離DISTが認証に利用される構成を例示したが、双方の音声の類似度の指標となる数値は距離DISTに限定されない。例えば、登録音声と認証音声とで特性が接近するほど数値が増加する性質の変数(指標値)に基づいて認証が実行される構成も採用される。この構成においては、各変数に対する閾値THの大小の関係が以上の形態とは逆転する。すなわち、例えば図4とは逆に、音量比EN_SNが増加するほど閾値THが減少するように閾値THが設定される。
以上の形態においては音量比EN_SNに応じて閾値THが直線的に変化する場合を例示したが、音量比EN_SNと閾値THとの関係は適宜に変更される。例えば、音量比EN_SNと閾値THとが音量比差分値DIF_SNに応じた曲線の関係を満たすように(すなわち、音量比EN_SNに対し、音量比差分値DIF_SNに応じた曲線に沿って閾値THが変化するように)、音量比EN_SNと音量比差分値DIF_SNとに応じて閾値THが特定される構成も採用される。以上のように、本発明の好適な態様においては、音量比EN_SNと閾値THとが認証時雑音に応じて異なる関係(典型的には音量比差分値DIF_SNに応じた直線的または曲線的な関係)となるように閾値THが設定されれば足り、ひとつの音量比差分値DIF_SNに対応した音量比EN_SNと閾値THとの具体的な関係は、例えば各変数の関係を導出するための試験の結果やこの結果に対する統計的な処理の如何に応じて適宜に変更される。
以上の形態においては正当な利用者と他人との区別に音声認証装置100が利用される場合を例示したが、正当な利用者の発声に基づいて事前に登録されたパスワードと認証音声から特定されるパスワードとの合致を判定する音声パスワード認証にも以上の形態に係る音声認証装置100を利用することが可能である。
Claims (8)
- 認証時に被認証者の周囲に発生する認証時雑音の特性を分析する特性分析手段と、
前記特性分析手段が分析した認証時雑音の特性に応じて閾値を設定する閾値設定手段と、
予め登録された登録音声と被認証者から採取された認証音声との特徴量の類否を示す指標値と前記閾値設定手段が設定した閾値との比較の結果に応じて当該被認証者を認証する認証手段と
を具備する音声認証装置。 - 前記閾値設定手段は、前記登録音声の登録時に発生する登録時雑音および前記登録音声の音量比と閾値とが前記認証時雑音に応じた関係を満たすように、前記閾値を設定する
請求項1に記載の音声認証装置。 - 前記閾値設定手段は、前記登録時雑音と前記登録音声との音量比に対し、前記認証時雑音に応じた直線または曲線に沿って閾値が変化するように、前記閾値を設定する
請求項2に記載の音声認証装置。 - 前記閾値設定手段は、前記登録時雑音と前記登録音声との音量比に対し、前記認証時雑音および前記認証音声の音量比と前記登録時雑音および前記登録音声の音量比との相違に応じた直線または曲線に沿って閾値が変化するように、前記閾値を設定する
請求項3に記載の音声認証装置。 - 前記閾値設定手段は、前記認証時雑音と前記登録時雑音との相違に応じて閾値を補正する補正手段を含む
請求項2から請求項4の何れかに記載の音声認証装置。 - 前記閾値設定手段は、前記認証音声または前記登録音声の時間長に応じて閾値を補正する補正手段を含む
請求項2から請求項5の何れかに記載の音声認証装置。 - 認証時に被認証者の周囲に発生する認証時雑音の特性を分析し、
前記分析した認証時雑音の特性に応じて閾値を設定し、
予め登録された登録音声と被認証者から採取された認証音声との特徴量の類否を示す指標値と前記設定した閾値との比較の結果に応じて当該被認証者を認証する
音声認証方法。 - コンピュータに、
認証時に被認証者の周囲に発生する認証時雑音の特性を分析する特性分析処理と、
前記特性分析処理で分析した認証時雑音の特性に応じて閾値を設定する閾値設定処理と、
予め登録された登録音声と被認証者から採取された認証音声との特徴量の類否を示す指標値と前記閾値設定処理で設定した閾値との比較の結果に応じて当該被認証者を認証する認証処理と
を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006249161A JP5151103B2 (ja) | 2006-09-14 | 2006-09-14 | 音声認証装置、音声認証方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006249161A JP5151103B2 (ja) | 2006-09-14 | 2006-09-14 | 音声認証装置、音声認証方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008070597A true JP2008070597A (ja) | 2008-03-27 |
JP5151103B2 JP5151103B2 (ja) | 2013-02-27 |
Family
ID=39292232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006249161A Expired - Fee Related JP5151103B2 (ja) | 2006-09-14 | 2006-09-14 | 音声認証装置、音声認証方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5151103B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017507352A (ja) * | 2014-06-24 | 2017-03-16 | グーグル インコーポレイテッド | 発話者の検証のための動的な閾値 |
GB2555661A (en) * | 2016-11-07 | 2018-05-09 | Cirrus Logic Int Semiconductor Ltd | Methods and apparatus for biometric authentication in an electronic device |
JP2019507992A (ja) * | 2016-03-10 | 2019-03-22 | シバントス ピーティーイー リミテッド | 聴取装置の動作方法、および聴取装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1055194A (ja) * | 1996-08-08 | 1998-02-24 | Sanyo Electric Co Ltd | 音声制御装置と音声制御方法 |
JP2002236665A (ja) * | 2001-02-09 | 2002-08-23 | Matsushita Electric Ind Co Ltd | 個人認証装置 |
JP2003308091A (ja) * | 2002-04-17 | 2003-10-31 | Pioneer Electronic Corp | 音声認識装置、音声認識方法および音声認識プログラム |
JP2003316389A (ja) * | 2002-04-19 | 2003-11-07 | Apukotto:Kk | 個人認証方法とその装置、及び個人特徴割出プログラム |
JP2004109563A (ja) * | 2002-09-19 | 2004-04-08 | Fujitsu Ltd | 音声対話システム、音声対話のためのプログラムおよび音声対話方法 |
WO2004102527A2 (en) * | 2003-05-08 | 2004-11-25 | Voice Signal Technologies, Inc. | A signal-to-noise mediated speech recognition method |
-
2006
- 2006-09-14 JP JP2006249161A patent/JP5151103B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1055194A (ja) * | 1996-08-08 | 1998-02-24 | Sanyo Electric Co Ltd | 音声制御装置と音声制御方法 |
JP2002236665A (ja) * | 2001-02-09 | 2002-08-23 | Matsushita Electric Ind Co Ltd | 個人認証装置 |
JP2003308091A (ja) * | 2002-04-17 | 2003-10-31 | Pioneer Electronic Corp | 音声認識装置、音声認識方法および音声認識プログラム |
JP2003316389A (ja) * | 2002-04-19 | 2003-11-07 | Apukotto:Kk | 個人認証方法とその装置、及び個人特徴割出プログラム |
JP2004109563A (ja) * | 2002-09-19 | 2004-04-08 | Fujitsu Ltd | 音声対話システム、音声対話のためのプログラムおよび音声対話方法 |
WO2004102527A2 (en) * | 2003-05-08 | 2004-11-25 | Voice Signal Technologies, Inc. | A signal-to-noise mediated speech recognition method |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017507352A (ja) * | 2014-06-24 | 2017-03-16 | グーグル インコーポレイテッド | 発話者の検証のための動的な閾値 |
US9972323B2 (en) | 2014-06-24 | 2018-05-15 | Google Llc | Dynamic threshold for speaker verification |
JP2019507992A (ja) * | 2016-03-10 | 2019-03-22 | シバントス ピーティーイー リミテッド | 聴取装置の動作方法、および聴取装置 |
GB2555661A (en) * | 2016-11-07 | 2018-05-09 | Cirrus Logic Int Semiconductor Ltd | Methods and apparatus for biometric authentication in an electronic device |
Also Published As
Publication number | Publication date |
---|---|
JP5151103B2 (ja) | 2013-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5151102B2 (ja) | 音声認証装置、音声認証方法およびプログラム | |
US8140330B2 (en) | System and method for detecting repeated patterns in dialog systems | |
US7013276B2 (en) | Method of assessing degree of acoustic confusability, and system therefor | |
US8069039B2 (en) | Sound signal processing apparatus and program | |
JP5621783B2 (ja) | 音声認識システム、音声認識方法および音声認識プログラム | |
GB2552723A (en) | Speaker recognition | |
US20050143997A1 (en) | Method and apparatus using spectral addition for speaker recognition | |
CA2536976A1 (en) | Method and apparatus for detecting speaker change in a voice transaction | |
Yang et al. | BaNa: A noise resilient fundamental frequency detection algorithm for speech and music | |
KR101888058B1 (ko) | 발화된 단어에 기초하여 화자를 식별하기 위한 방법 및 그 장치 | |
CN116490920A (zh) | 用于针对由自动语音识别系统处理的语音输入检测音频对抗性攻击的方法、对应的设备、计算机程序产品和计算机可读载体介质 | |
US7908142B2 (en) | Apparatus and method for identifying prosody and apparatus and method for recognizing speech | |
JP2969862B2 (ja) | 音声認識装置 | |
JP5151103B2 (ja) | 音声認証装置、音声認証方法およびプログラム | |
CN113241059B (zh) | 语音唤醒方法、装置、设备及存储介质 | |
KR20110079161A (ko) | 이동 단말기에서 화자 인증 방법 및 장치 | |
JP2002189487A (ja) | 音声認識装置および音声認識方法 | |
Jayamaha et al. | Voizlock-human voice authentication system using hidden markov model | |
RU2234746C2 (ru) | Способ дикторонезависимого распознавания звуков речи | |
JP2006010739A (ja) | 音声認識装置 | |
Barlaskar et al. | Study on the varying degree of speaker identity information reflected across the different MFCCs | |
JP4807261B2 (ja) | 音声処理装置およびプログラム | |
JPH05249987A (ja) | 音声検出方法および音声検出装置 | |
Pattanayak et al. | Significance of single frequency filter for the development of children's KWS system. | |
JP3026855B2 (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090717 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120814 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121012 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121119 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5151103 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |