TW200828267A

TW200828267A - Voice authentication apparatus

Info

Publication number: TW200828267A
Application number: TW096131267A
Authority: TW
Inventors: Yasuo Yoshioka; Takehiko Kawahara
Original assignee: Yamaha Corp
Priority date: 2006-09-14
Filing date: 2007-08-23
Publication date: 2008-07-01
Also published as: DE602007002132D1; KR100929958B1; US8694314B2; JP5151102B2; EP1901285A2; US20080071535A1; ATE441176T1; EP1901285B1; TWI342008B; JP2008070596A; KR20080025018A; CN101145342B; CN101145342A; EP1901285A3

Description

200828267 九、發明說明：【發明所屬之技術領域】本發明係關於一種個別聲音之驗證技術。【先前技術】已提出一種習知聲音驗證技術，該技術藉由將先前自已授權使用者獲取之聲音（下文中稱作"參考聲音”或"登錄聲音π)的特徵量與自待驗證之人（下文中稱作”受驗者"）獲取之聲音（下文中稱作’’樣本聲音”或”驗證聲音之特徵量之間的距離與一臨限值進行比較來判定受驗者之真確性。專利文獻日本專利申請案公告第2003-248661號描述一種組態，其中根據驗證之目的或根據驗證之所需精確度水準來改變臨限值。圖8為用以評估聲音驗證之圖。圖8中之錯誤拒絕率 (False Rejection Rate，FRR)意謂即使一受驗者為一授權使用者，該受驗者之真確性亦將在驗證期間被拒絕的可能性 (使用者拒絕率），且錯誤接受率（False Acceptance Rate， FAR)意謂即使受驗者並非授權使用者，該受驗者之真確性亦將在驗證期間被接受之可能性（陌生人接受率）。如自圖8 可見，若將驗證中所使用之臨限值設定為圖8中之值na’’，則拒絕未授權受驗者的可能性維持在一足夠高之水準，而拒絕授權使用者之可能性得以充分降低。然而，驗證聲音與登錄聲音之間的距離根據驗證期間產生之環境聲響（下文中稱作’’樣本雜音”或”驗證雜音"）而改變，因為驗證雜音影響驗證聲音之特性。因此，圖8中之 I20166.doc 200828267 FRR及FAR中之每—者的曲線根據驗證雜音之特性而平行於水平軸（距離）移動。舉例而言，絲由圖8中之實線所示之FAR改為虛㈣，則錯誤接受陌生人的真確性之可能性增加（亦即’驗證之精確度水準降低），且若將圖8中之舰改為虛線L2,則拒絕授權使用者的真確性之可能性增加 (亦即’驗g之便利性降低）。亦即，習知聲音驗證之問題 ^驗證之«度與驗證之便利性之間的平衡根據驗證雜曰之特性而被打破。此問題甚至不可如在專利文獻日本專利申請案公告第 2〇03-248661號中藉由根據驗證之目的或所需精確度水準而改變臨限值來解決。當以由行動電話代表之攜帶型電子 5又備執行驗證時此問題更為嚴重，因為驗證雜音之特性根據電子設備的使用環境而以各種方式改變。【發明内容】已蓉於此等情形作出本發明，且本發明之一目標為解決 …關於樣本雜音而維持驗證之精確度與驗證的便利性之間的平衡之問題。 ^解決以上問題，根據本發明之一態樣之聲音驗證裝置 w之HI析構件’其分析在受驗者產生用於受驗者的驗 I，本聲音或驗證聲音時在受驗者周圍產生之樣本雜音設定構件（例如，圖ι中之設定器 —其根據由特性分析構件分析之驗證雜音之特性來設疋弟一校正值(例如’圖1中之校正值Aa);校正構件，其土；由第構件設定之第―校正值來校正指數值（例 120166.doc 200828267 如，圖1中之距離DO)，該指數值指示先前已登錄之參考聲音或登錄聲音的特徵量與自受驗者獲取之驗證聲音之特徵量之間的相似程度；及判定器，其藉由將由校正構件校正後之指數值與預定臨限值進行比較來判定受驗者之真確性。根據此態樣，在根據驗證雜音之特性校正指數值之後將指示登錄聲音是否與驗證聲音類似之指數值與預定臨限值 • 進行比較，藉此無關於驗證雜音两維持驗證的便利性與驗證之精確度之間的平衡。預定臨限值可為固定值或可變值。立在本發明之一較佳實施例中，第一設定構件根據驗證雜音及登錄聲音與在登錄聲音之登錄期間產生之登錄雜音之間的位準比率（例如，圖4中之位準比率en—sn)來判定第一校正值，使得第一校正值設定為預定臨限值與一變數（例如，圖4中之臨限值TH)之間的差，該變數係與驗證雜音之 • #性及登錄聲音與登錄雜音之間的位準比率相關聯而判的。 ^ 牛例而δ，第—设^構件將第—校正值設定為預定臨限 - =^ &錄聲音與登錄雜音之間的位準比率而沿對應於驗證雜音之特性之線或曲線變化的變數之間的差。更特定言之，第—設定構件根據登錄聲音與登錄雜音之間的位準比率及作為登錄聲音與登錄雜音之間的位準比率與驗證聲音與驗證雜音間曰心间的位準比率（例如，位準比率 V—SN)之間的位舉出輋| “ 半差（例如，圖4中之位準比率差 120166.d〇i 200828267 ⑽一SN1〜DIF_SN3)之驗證雜音之特性來設定第一校正值。 =實施例可無關於登錄雜音或驗證雜音之特性而藉由簡 :处理來維持驗證之便利性與驗證的精確度之間的平衡。 :一設定構件可基於界定第-校正值與登錄聲音與登錄雜二=位準比率及驗證雜音之特性(更特定言之，登錄雜音之㈣位準比率與驗證聲音與驗證雜音之 =的位準比率之間的位準比率差）的關係之表來設定第一一斗〜曰由使用表不此等值之間的關係之等式進订计异而設定第_未粑攄炎έ # 。該表或該等式之内容可（例如） χ 使用者之指令而適當改變。根據本發明之_ ^ / τ ^ ^ Λ鉍例之卑音驗證裝置進一步包含第二 U又疋構件（例如，圖1中錄雜音之間的差（例如，S6t 根據驗證雜音與登一—一圖6中之相關值NOISE—DIF)來設定 :二校正值(例如’圖1中之校正值，，其中該校正構件根據第-及第二校正值來校正指數值。即^:貝^例’即使當在實際驗證期間登錄雜音(亦即，參考雜音）與驗噔雜立關性不同於在判定第一^正稽P ’樣本雜音）之間的實際相係時所採用# ~ 校正值與登錄雜音及登錄聲音之關你时所彳木用之登錄雜音盥可基於根據實際驗證雜：二釺：：間的原始相關性’亦值來校正指數值，一雜音之間的差之第二校正精破声精此有效地維持驗證之便利性與驗證之 :驗：雜：的平衡。第二設定構件可基於界定第二校正值 ▲雜音與登錄雜音之間的差之關係之表來設定第二校 120166.doc 200828267 亦可藉由使用表示該關係的等式來進行計算而設值。該表或該等式之内容可(例岣根據來自使用者之指令而適當改變。根據本發明之—實施例之聲音驗證裝置進設定構件（例如，圖丨中之設定哭5 3弟二驗说辣立& r x疋°。53)該弟二設定構件根據驗迅耳日（亦即，樣本聲音）或登錄聲音（亦即，參考聲的持績期間（例如，圖7中之語音長度EN—speech則或 v—spEECH_len)來設定第三校正值(例如，圖4之校正 =)’纟中該校正構件根據第—及第三校正值來校正指數值。根據此實施例’即使當登錄聲音或驗證聲音之語音長度 =續期間)不同於在判定第一校正值與登錄雜音及：：耳曰之關係％所採用的語音長度時，亦可基於根據驗證聲音或登錄聲音之第三校正值來校正指數值，藉此有效地維持驗證之便利性與驗證之精確度之間的平衡。第三設定構件可基於界定第三校正值與驗證聲音或登錄聲音之持續期 m的關係'之表來設定第三校正值，且亦可藉由使用表不該關，之等式進行計算來設定第三校正值。該表或該等式之内容可(例如)根據來自使用者之指令而適當改變。用作用於判疋用以校正指數值之校正值之基礎的參數不聲音或登錄聲音之持續期間及驗證雜音與登錄雜曰之間的差。舉例而言，聲音驗證裝置可進一步包含根據匕括於登錄聲音或驗證聲音中之有聲與無聲聲響之持續期 I㈣㈣來設定校正值之設定構件，或根據登錄聲音 120166.doc 200828267 或驗證聲音之音節之數目來設定校正值的設定構件。根據如上所述之表或等式來判定校正值之組態或表或等式的内容為可變之組態用於此等實施例中之任一者中。本發明亦指定為一種控制根據以上實施例中之每一者之聲音驗證裝置的聲音驗證方法。根據本發明之一實施例之聲音驗證方法包含：分析在一受驗者產生一用於該受驗者的驗證之驗證聲音時在該受驗者周圍產生之驗證雜音之特性；根據驗證雜音之所分析特性設定校正值；基於所設定校正值校正指數值，該指數值指示先前已登錄之登錄聲音之特徵量與自受驗者獲取的驗證聲音之特徵量之間的相似程度；及藉由將經校正之指數值與預定臨限值進行比較來判定受驗者之真確性。此方法達成與根據本發明之聲音驗證裝置之操作及優勢相同的操作及優勢。根據以上實施例中之每一者之聲音驗證裝置藉由專用於每一處理的諸如數位信號處理器（DSP)之硬體（電子電路）來實施，且亦經由程式與諸如中央處理單元（CPU)之通用處理單元之間的協作來實施。根據本發明之程式使得電腦執行以下處理：特性分析處理，以分析在受驗者產生用於受驗者之驗證的樣本聲音時在受驗者周圍產生之驗證雜音之特性；設定處理，以根據在特性分析處理中所分析之驗證雜音之特性來設定校正值；校正處理，以基於在設定處理中設定之校正值來校正指數值，該指數值指示先前已登錄之登錄聲音的特徵量與自受驗者獲取之驗證聲音之特徵量之間的相似程度；及判定處理，以藉由將經校正之指數值 120166.doc -12- 200828267 與預定臨限值進行比較來判定受驗者之真確性。此程達成與根據以上實施例中之每一者之聲音驗證裝置及優勢相同之操作及優勢。本發明之程式係以儲存於如 CD-ROM之機器可讀取媒體或攜帶型記錄媒體中之形提供至使用者且接著安裝於電腦上，且亦以在網路上2 布式方式自伺服器裝置提供且接著安裝於電腦上。为【實施方式】 ❿ <A :聲音驗證裝置之組態> 圖1為說明根據本發明之實施例之聲音驗證裝置的㈣冗塊圖。聲音驗證裝置1GG為基於當受驗者說出特定^ :時f生之聲音來判定其真確性(亦即，判定受驗者是否二先=已且錄之正式使用者）之設備。聲音驗證裝置1 ^於多種電子設備中，諸如行動電話或資訊處理設備。圖所不之特性分析器2G、驗證器則校正值控制器可 κ施為（例如）由諸如CPU之處理單元執行之程式，可由諸如DSP之硬體電路實施。儲存單元^可之機器可讀媒體。有^式

聲音驗證裝置⑽之操作分為初始登錄及驗證。初始登、彔為在驗證之前登錄由授權使㈣W 的操作。驗證為藉由將登錄聲音與由受驗者說出之;;) (D驗^聲音）進行對比來判定受驗者之真確性的操作。操作 2 〇包括由使用者操縱之複數個操作器。使用者可藉由 2操縱操作單元10而命令聲音驗證裝置100開始勒始登錄或驗證。 120166.doc 200828267 圖1中之輸入單元15及特性分析器2〇用以當執行驗證時偵測驗證聲音或聲音驗證裝置_之環境雜音（驗證雜音）的、f +且用以當如圖丨中之虛線R所示執行初始登錄時偵測登錄聲音或聲音驗證裝置100之環境雜音（登錄雜音）的特性。輪入單元15為根據環境聲響（聲音及雜音）產生聲響信號 s。之聲響收集器。如圖2中所說明，聲響信號§分為未出聲 φ 區段P1及出聲區段P2。出聲區段P2為授權使用者在初始登錄期間δ兄出登錄聲音之區段，或受驗者在驗證期間說出驗也聲音之區段。另一方面，未出聲區段Ρ1為未說出登錄或驗也聲音之區段。因為在安裝有聲音驗證裝置100之環境中可產生多種雜音，所以未出聲區段Ρ1並非完全安靜（亦即茸響^號S之振幅在未出聲區段P1中並非零），且輸入單兀15在未出聲區段？1中收集登錄雜音或驗證雜音。將由輸入單元15產生之聲響信號s提供至圖丨之特性分析 φ 态2〇。特性分析器20為用於分析由输入單元15收集之聲響之構件。特性分析器2〇包括區段偵測器22、開關23、雜音分析器25、聲音分析器26及特徵分析器28。區段债測㈣ • 將未出聲區段P1與出聲區段P2加以區分。舉例而言，區段偵測器22將聲響信號s之振幅不連續增加或減少時之時間偵測為未出聲區段P1與出聲區段p2之間的邊界。可使用多種已知技術來將未出聲區段ρι與出聲區段p2加以區分。開關23為用於初換由輸入單元15產生之聲響信號§之供應目的地的構件。此允許將聲響信號S由區段偵測器22識 120166.doc -14- 200828267 別為未出聲區段P1之部分提供至雜音分析器25，且允許將聲響信號S由區段偵測器22識別為出聲區段P2之部分提供至聲音分析器26及特徵分析器28。雜音分析器25為用於基於未出聲區段P1中之聲響信號s 來分析登錄雜音或驗證雜音之特性的構件。此實施例中之雜音分析器25週期性地分析未出學區段p 1中之聲響信號s 的特性。當操縱操作單元1 〇以命令聲音驗證裝置1⑽開始初始登錄或驗證時，雜音分析器25判定區段P(稱作偵測區段）（該區段在所命令時間之前一預定時間開始且在所命令時間結束）之經分析特性為如圖2中所示之登錄雜音或驗證雜音的特性。在以下描述中，與登錄雜音或登錄聲音相關聯之項目由包括，，登錄（enr〇ll)"<縮寫"EN"的符號表示，且與驗證雜音或驗證聲音相關聯之項目由包括"驗證（verify)" 之縮寫” V”的符號表示。如圖1中所示，此實施例中之雜音分析器25在執行初始登錄時計算登錄雜音之頻率特性EN_NOISE_FC及雜音位準EN—NOISE—LEVEL，且在執行驗證時計算驗證雜音之頻率特性V^NOISEJFC及雜音位準V__NOISE_LEVEL。雜音位準 EN—NOISE_LEVEL及 V—NOISE—LEVEL 中之每一者為偵測區段P中之聲響信號S在未出聲區段P1中的分量中包括於特定頻帶中之分量之量值（聲壓）的平均值。頻率特性 EN一NOISE—FC或V一NOISE一FC為表示將偵測區段P中之聲響信號S所分為的複數個頻帶之分量之各別量值的資訊。因此，雜音分析器25包括（例如）具有不同通頻帶之複數個 120166.doc -15· 200828267 帶通濾波器（濾波器組）。頻率特性en_noise_fc及 V_NOISE_FC之資訊僅需要反映登錄雜音或驗證雜音之特性。舉例而言，雜音分析器25可為用於藉由諸如快速傅立葉變換（FFT)之頻率分析來計算頻譜以作為頻率特性 EN_NOISE_F(^V_NOISE_FC之構件。聲音分析器26基於出聲區段P2中之聲響信號S來分析登錄聲音或驗證聲音之特性。此實施例中之聲音分析器26在執行初始登錄時計算登錄聲音之語音位準 EN—SPEECH_LEVEL及語音長度（或持續期間）EN— SPEECH JLEN，且在執行驗證時計算驗證聲音的語音位準 V一SPEECH_LEVEL 及語音長度 V_SPEECH_LEN 〇語音位準 EN^SPEECH—LEVEU V_SPEECH_LEVEL 中之每一者為包括於出聲區段P2中的聲響信號S中之特定頻帶中的分量之量值的平均值。語音長度EN_SPEECH_LEN及 V—SPEECH—LEN中之每一者表示出聲區段P2之持續期間 (亦即，語音持續之時段）。自聲響信號S之振幅快速增加時之時間（其對應於出聲區段P2之開始）至聲響信號S的振幅快速減少時之時間（其對應於出聲區段P2之結束）之時段被偵測為語音長度EN_SPEECHLLEN及V—SPEECH—LEN。特徵分析器28為用於分析登錄聲音或驗證聲音之特徵之構件。此實施例中之特徵分析器28在執行初始登錄時計算登錄聲音之特徵量EN_DATA，且在執行驗證時計算驗證聲音的特徵量V_DATA。特徵量EN_DATA& V_D ATA中之每一者為自出聲區段P2中之聲響信號S計算的倒譜之向量之 120166.doc •16- 200828267 時序（time-series)。因此，用於執行包括頻率分析（例如， FFT方法）之多種計算之構件較佳用作特徵分析器28。儲存設備32為用於儲存驗證中所使用之多種資訊之構件。舉例而言，如圖1中所示，儲存設備32將特性分析器 20指定用於登錄聲音及登錄雜音之多種資訊儲存為驗證辭典。更特定言之，由雜音分析器25指定之頻率特性 EN一NOISE—FC及雜音位準EN—NOISE—LEVEL、由聲音分析器26指定之語音位準EN_SPEECH_LEVEL及語音長度 ENJPEECHJLEN，及由特徵分析器28指定的特徵量 EN_DΑΤΑ在執行驗證之前儲存於儲存設備32中。儲存設備 32可為固定至聲音驗證裝置1〇〇之設備，且亦可為可拆卸地附接至聲音驗證裝置1〇〇之攜帶型設備（記憶體）。驗證器40為用於藉由將驗證聲音與登錄聲音進行對比來判定受驗者之真確性之構件。驗證器40包括距離計算器 42、校正器44及判定器46。距離計算器42計算儲存於儲存設備32中之特徵量EN^DATA與特徵分析器28針對驗證聲音產生之特徵量V_DATA之間的距離D0。距離計算器42使用諸如計算特徵量EN_DATA& V_DATA之向量序列之間的正規化距離之DP匹配之多種圖案匹配技術來計算距離D0。隨著距離D0減小，驗證聲音與登錄聲音更類似（亦即，受驗者更可能為一授權使用者）。校正器44為用於基於校正值A(Aa、Ab及Ac)1來校正由距 i 離計算器42計算出之距離DO之構件。在此實施例中，校正器44藉由自距離D0減去由校正值控制器50設定之每一校正 120166.doc -17- 200828267 值Aa、Ab及Ac來計算經校正的距離D1。判定器46藉由將由校正器44校正之距離D1與臨限值ΤΗ0 進行比較來判定受驗者之真確性。更特定言之，若距離D1 低於臨限值ΤΉ0(亦即，若登錄聲音與驗證聲音類似），則判定器46接受受驗者之真確性，且若距離D1高於臨限值 ΤΗ0(亦即，若登錄聲音不同於驗證聲音），則判定器46拒 ’ 絕受驗者之真確性。臨限值ΤΉ0為預定的固定值。判定器 46之判定結果經由輸出單元60輸出。舉例而言，輸出指示 • 驗證結果之影像之顯示器或輸出指示驗證結果的聲響之音訊輸出設備較佳用作輸出單元60。校正值控制器50為用於設定在校正器44之校正中使用之校正值A(Aa、Ab及Ac)的構件。校正值控制器50包括設定器51、52及53。設定器51基於特性分析器20在初始登錄及驗證期間所產生之資訊來設定校正值Aa。設定器52根據驗證雜音之特性與登錄雜音之特性之間的差來設定校正值 0 Ab。設定器53根據初始登錄期間的語音長度 EN一SPEECH__LEN來設定校正值Ac 〇稍後將描述校正值控制器5 0之操作之細節。圖1中之儲存單元3 5儲存校正值控制器50用以設定校正值A之表。儲存設備32中之特定儲存 • 區域可用作儲存單元35。 <B :聲音驗證裝置之操作> - 現將描述聲音，驗證裝置100之詳細操作，集中於校正值控制器50在驗證期間設定校正值Aa、Ab及Ac之過程。每次有必要進行驗證時，校正值控制器50執行圖3之過程。 120166.doc • 18 - 200828267 驗證變得必要時之實例包括當包括聲音驗證裝置100之電子設備隨著施加電力而開始操作時’及當電子設備開始特定操作（例如，存取特定資訊之操作）時。當起始驗證時，受驗者在藉由操縱操作單元1 〇而發出語音啟動指令之後向輸入單元15說出特定詞語。雜音分析器25自結束於操縱操作單元10時之偵測區段P中的聲響信號S指定頻率特性 V_NOISE_FC及雜音位準V_NOISE_LEVEL，且自緊接偵測區段P之出聲區段P2中之聲響信號S指定語音位準 V—SPEECH—LEVEL及語音長度 V_SPEECH—LEN。如圖3中所示，校正值控制器50計算登錄聲音與登錄雜音之間的位準比率EN_SN(步驟S10)。位準比率EN_SN為儲存設備32中儲存之語音位準EN_SPEECH—LEVEL與雜音位準ΕΝ—NOISE—LEVEL之間的比率。舉例而言，使用等式 (1)來計算位準比率EN_SN。 EN一SN=log(EN一SPEECHJLEVEL/EN—NOISE—LEVEL)……（1) 接著，校正值控制器50計算驗證聲音與驗證雜音之間的位準比率乂』]^(步驟S11)。位準比為自雜音分析器 25提供之雜音位準V—NOISE—LEVEL與自聲音分析器26提供之語音位準V_SPEECH_LEVEL之間的比率。與位準比率EN—SN類似，使用等式（2)來計算位準比率V—SN。 V—SN=log(V—SPEECH—LEVEW—N0ISE—LEVEL)……(2) 接下來，在步驟S12，校正值控制器50計算在步驟810計算出的初始登錄中之位準比率EN_SN與在步驟S11計，算出之驗證中之位準比率V__SN之間的差DIF_SN(DIF__SN= 120166.doc -19- 200828267 V—SN-EN—SN)。在下文中，差DIF—SN將稱作"位準比率差’’。校正值控制器50計算表示登錄雜音之特性與驗證雜音之特性之間的相關性之相關值NOISEJ3IF(步驟S 13)。此處，舉例而言，相關性為登錄雜音與驗證雜音之各別波譜形狀是否類似。舉例而言，使用等式（3)來計算相關值 NOISEJDIF。

L ΥΧΕΝ _MAG{})-EN _MAG _AVEjy _MAGi})-V __MAG _AVE) NOISE _ DIF = . /=M -- :.=.-…：_..厂丄.....

^(EN_mG(〇-EN_mG_AVE)\^(V_MAG(i)-V_mG_AFE)2 V/=M V/=M ...... ( 3 ) 等式（3)中之值EN_MAG(i)為複數個頻帶中由變數i指定之頻帶中的登錄雜音之量值，且自值EN_MAG(i)減去之值 EN_MAG_AVG為由變數i指定之頻帶中的登錄雜音之量值之平均值。類似地，等式（3)中之值V_MAG(i)為由變數i指定之頻帶中的驗證雜音之量值，且自減去之值VJMAG—AVG為該頻帶中的驗證雜音之量值之平均值。因此，若登錄雜音與驗證雜音完全匹配，則校正值 NOISE—DIF為1，且校正值NOISE—DIF隨著兩個雜音之特性之間的差增加而減少（-1SNOISE—DIFS1)。接著，校正值控制器50之設定器51基於在步驟S10計算出之位準比率EN_SN及在步驟S12計算出之位準比率差 DIF_SN來設定校正值Aa(步驟S14)。校正值Aa與位準比率 EN_SN及位準比率差DIF_SN之關係以以下方式來判定。首先，吾人考慮根據由距離計算器42計算出之距離D0大於還是小於臨限值TH來判定受驗者之真確性之狀況。藉 I20166.doc -20- 200828267 由進行测試，此申請案之發明者已發現，用於將驗證之精確度維持在一高水準的臨限值TH滿足與位準比率EN_SN 及位準比率差DIF__SN之特定關係。更特定言之，如圖4中所示，臨限值TH經設定使得對於位準比率EN_SN(其為登錄雜音與登錄聲音之間的比率）之值改變為一新值且接著對水平軸上之每一相應位準比率EN_SN繪製垂直轴上之臨限值TH的每一狀況，驗證之精確度滿足一特定條件（例如，使得FRR及FAR各低於一特定位準）。當對所繪製之點進行統計處理時，其傾向於根據位準比率差DIF_SN而沿一線分布。舉例而言，當將位準比率差DIF_SN設定為值 DIF_SN 1時，滿足所要條件之臨限值TH隨位準比率EN—SN 而沿一具有諸如對應於值DIF—SN1之梯度及截距的屬性之線改變。另外，如圖4中所示，用於將驗證精確度維持在一所要水準之臨限值TH隨著位準比率EN__SN或位準比率差 DIF__SN(DIF—SN1>DIF—SN2>DIF—SN3)增加而增加。因此，若針對在步驟S10計算出之位準比率EN_SN來設定臨限值TH以使得臨限值TH及位準比率EN_SN滿足對應於一在步驟S12計算出之位準比率差DIF_SN的線之關係，則可將驗證維持在一所要精確度水準。舉例而言，在位準比率EN_SN計算為圖4中之值SNa之狀況下，若位準比率差 DIF_SN為DIF_SN1，則將臨限值TH設定為THa，且若位準比率差DIF_SN為DIF_SN2，則將臨限值TH設定為THb。因為距離大於還是小於臨限值係在驗證期間判定，所以用於將待與距離D0比較之臨限值TH改變一特定值之處理 120166.doc -21- 200828267 等效於用於在臨限值ΤΗ固定為ΤΗ0的情形下將距離DO校正特定值Aa之處理。因此，此實施例之設定器5 1將預定臨限值TH0與臨限值ΤΉ之間的差設定為校正值Aa，臨限值TH 與位準比率EN_SN滿足一對應於位準比率差DIFJN之線之關係。亦即，舉例而言，當位準比率EN_SN在步驟S10 計算為值SNa(如圖4中所示）時，若位準比率差DIF__SN在步驟S12計算為DIF_SN1，則臨限值TH0與值THa之間的差al 設定為校正值Aa，且若位準比率差DIF_SN在步驟S12計算為DIF—SN2，則臨限值ΤΉ0與值THb之間的差a2設定為校正值Aa。藉由自距離DO減去以此方式定之校正值Aa而計算出之距離D1在判定器46處與臨限值TH0進行比較;，藉

J 此將此實施例的驗證維持在所要精確度水準。

更特定言之，此實施例之設定器5 1基於已建立以滿足以上條件之表來自位準比率EN_SN及位準比率差DIF_SN判定校正值Aa。圖5為說明在步驟S14使用之表之内容之示意圖。如圖5中所示，對應於不同位準比率差DIF_SN (DIF—SN1、DIF—SN2、DIF—SN3......)之複數個表儲存於儲存單元35中。在每一表中，每一位準比率EN_SN與滿足圖 4之與位準比率EN_SN之關係的相應校正值Aa相關聯。亦即，在對應於位準比率差DIF_SN之表中，每一位準比率 EN_SN與一相應校正值4a相關聯，使得藉由將校正值Aa 與臨限值ΤΗ0相加獲取之臨限值ΤΗ與位準比率EN_SN具有一對應於位準比率差DIF_SN的線之關係。，在步驟S14，設定器51搜尋對應於在步驟S12計算出之位 120166.doc -22 200828267 準比率差DIF_SN之表，且將對應於包括於所擷取表中之在步驟S10計算出之位準比率EN_SN的校正值Aa輸出至校正器44。若不存在對應於在步驟S12計算出之位準比率差 DIF_SN之表，則設定器51根據來自對應於先於及緊隨所計算的位準比率差DIF_SN之位準比率差DIF_SN之表的位準比率EN—SN來指定校正值Aa，且藉由在所指定之校正值 Aa之間内插來計算一校正值Aa，該校正值Aa實際上待應用於校正器44之校正。因此，舉例而言，若位準比率差 DIF_SN在步驟S12計算為圖2之值DIF__SN1與值DIF_SN2之平均數，則校正值Aa計算為對應於值DIF_SN1的校正值 Aa(值al)與對應於值DIF—SN2之校正值Aa(值a2)之平均數。然而，臨限值TH與位準比率EN_SN及位準比率差 DIF_SN之關係係（例如）在登錄雜音之特性與驗證雜音之特性一致的假設下判定。然而，在許多狀況下，登錄雜音之特性不同於驗證雜音之特性。因此，設定器52根據登錄雜音與驗證雜音之間的相關值NOISE_DIF來計算校正值Ab以校正距離D0(步驟S15)。校正器44’自距離D0減去校正值 Ab。圖6為說明相關值NOISE JDIF與校正值Ab之間的關係之圖。使用等式（3)計算出之相關值NOISEJ3IF根據登錄雜音與驗證雜音之間的相關性而在”-1”至"1Π之範圍内變化。當兩個雜音之特性完全 < 致時，相關值NOISE_DIF為"1”。若登錄雜音與驗證雜音之間的關係等效於在判定圖4之關 120166.doc -23- 200828267 係時的關係（若兩個雜音在此實施例中一致），則無需根據相關值NOISE—DIF來校正距離D0。當登錄雜音與驗證雜音之間的關係與判定圖4之關係時的關係差別較大時，必須更大地校正距離D0。因此，當相關值NOISE_DIF為π 1" 時，設定器52將校正值Ab設定為零（亦即，未校正距離 D0)，且設定器52隨著相關值NOISE-DIF減小至”P以下而將校正值Ab設定為較高。更特定言之，儲存單元35¼存一表，其中每一相關值NOISE—DIF與一相應校正值Aa(其滿足與相關值NOISE_DIF之此關係）相關聯，且設定器52基於此表判定校正值Ab。另外，圖4中所示之臨限值TH與位準比率EN_SN及位準比率差DIF_SN之關係係（例如）基於在特定持續期間（時長）L0期間連續說出登錄聲音時所收集的資料而判定。然而，實際初始登錄中之登錄聲音之語音長度EN— SPEECHJLEN係不同的。因此，設定器53根據語音長k EN—SPEECH—LEN來計算校正值Ac以校正距離DO(步'驟 S16)。校正器44自距離D0減去校正值Ac。

圖7為展示語音長度EN_SPEECH_LEN與校正值Ac之間的關係之圖。若判定圖4之關係時語音長度EN_SPEECH_ LEN與持續期間L0 —致，則無需根據語音長度EN_ SPEECH-LEN來校正距離DO。因此，若儲存單元32中儲存之語音長度EN—SPEECH—LEN與持續期間L0 —致，則設定器53將校正值Ac設定為”0”。隨著語音長度EN_SPEECH_ LEN增加，登錄聲音之語音更穩定，使得特徵量en_DATA 120166.doc -24· 200828267 更可靠地反映授權使用者之固有的基本特性，藉此增加距離D0的精確度。因此，即使相對於距離D0降低臨限值ΤΗ0 以便減少接受陌生人之真確性之可能性，亦不會不當地增加拒絕授權使用者之可能性。因此’若語音長度EN_SPEECH_LEN大於持續期間L0，則設定器53根據語音長度EN_SPEECH_LEN而選擇負值作為校正值Ac。因為校正器44自距離D0減去校正值Ac，所以若校正值Ac為負，則經校正之距離D1大於距離D0。亦即，因為臨限值ΤΗ0相對於距離D0減小，所以錯誤地接受陌生人之真確性之可能性得以減小。相反，若語音長度 EN-SPEECHJLEN小於持續期間L0，則設定器53根據語音長度EN—SPEECH JLEN而選擇正值作為校正值Ac。舉例而言，設定器53基於每一語音長度EN_SPEECH—LEN與相應校正值Ac相關聯之表來判定校正值Ac。如上所述，在此實施例中，無關，於驗證雜音或登錄雜音之特性，可將驗證維持在一所要精確度水準，因為距離D0 係根據驗證雜音與驗證聲音（V_SN)之間的關係或登錄雜音與登錄聲音（EN—SN)之間的關係來校正。亦即，驗證之便利性之增加（FRR之減少）及驗證的精確度之增加（FAR之減少）皆可在不受驗證雜音或登錄雜音影響之情形下達成。在此實施例中，尤其校正值Aa係基於滿足所要條件之臨限值TH與位準比率EN_SN成一對應於位準比率差DIF_SN 之線的關係之認知來調整。因此，此實施例之優勢為有可能以高精確度指定最佳校正值Aa，同時充分減少設定校正 120166.doc •25· 200828267 值Aa所需之變數之數目。亦有可能藉由充分考慮初始登錄或驗證時聲音驗證裝置100之環境來實現高度精確的驗證，因為距離D0係根據相關值NOISE_DIF或語音長度 EN_SPEECH_LEN來校正。 <C :經修改實施例> 以上實施例可以各種方式修改。以下說明特定經修改實施例。以下經修改實施例之適當組合亦為可能的。 (1) 經修改實施例1 儘管在以上實施例中所說明之組態使用儲存於儲存單元 35中之表，但藉由使用預定等式的計算方法計算校正值 A(Aa、Ab及Ac)之組態亦為可能的。舉例而言，儲存單元 35儲存分別表示根據位準比率差（DIF_SN)之線（亦即，圖4 之線，每一者界定位準比率EN_SN與臨限值TH之間的關係）之複數個公式，且設定器51藉由將在步驟S10計算出之位準比率EN_SN代入等式而，根據在步驟S12計算出的位準比率差DIF_SN來計算臨限值TH，且藉由自所計算之臨限值TH減去臨限值ΤΗ0來計算枝正值Aa。此實例Φ使用設定器52基於表示校正值NOISE_DIF與校正值Ab之間的關係之等式來計算校正值Ab之組態，或設定器53基於表示語音長度EN—SPEECH—LEN與校正值Ac之間的關係之等式來計算校正值Ac之組態。 — ) (2) 經修改實施例2 判定將距離D0校正至何程度之變數不限於校正值 NOISE—DIF及語音長度EN—SPEECH—LEN。舉例而言，可 120166.doc -26- 200828267 替代或結合根據語音長度EN_SPEECH_LEN設定校正值Ab 之組態來使用根據驗證聲音之語音長度V_SPEECH_LEN來計算校正值Ab的組態或根據語音長度EN_SPEECH_LEN與語音長度V-SPEECH—LEN之平均值來計算校正值Ab之組態。舉例而言，校正值Ab經設定使得經校正之距離D1隨著語音長度V_SPEECHJLEN增加而增加，此類似於校正值 Ab與語音長度EN_SPEECH—LEN之間的關係。亦使用校正值控制器50基於除以上所述之變數以外之變數來判定每一校正值的組態。舉例而言，可根據包括於登錄聲音或驗證聲音中之有聲聲響與無聲聲響之持續期間之間的比率來設定每一校正值（在出聲區段P2中）。隨著有聲聲響之比率增加，特徵量EN_DATAi V_DATA之值更可靠地反映說話者的特性，藉此增加距離D0之精確度。因此，即使距離D1自距離D0增加，FRR亦不會不當地增加。因此’使用每一校正值經設定使得距離D1隨著登錄聲音或驗證聲音中之有聲聲響之比率增加而增加的組態。另外，亦可使用每一校正值經設定使得距離D1隨著登錄聲音或驗證聲音之音節之數目增加而增加的組態，因為距離D0之精確度P通者登錄聲音或驗證聲普之音節的數目增加而增加。 (3)經修改實施例3 亦使用變數與校正值之間的關係為可變之組態。舉例而言’可提供藉由根據操作單元1〇之操縱更新表來改變校正值Aa與位準比率EN-SN或位準比率差DIF_SN之關係的組態。類似地，可根據操作單元1〇之操縱來修改對應於相關 120166.doc -27- 200828267 值NOISE—DIF之校正值Ab或對應於語音長度EN_ SPEECH 一 LEN的校正值Ae 〇此等組態可根據使用者之需要而達成驗證。在藉由如經修改實施例1中所說明之等式的計算來計算校正值A(Aa、Ab及Ac)之組態中，可根據操作單元10之操縱來修改該等等式中之每一者的内容（例如，變數之係數）。 • (4)經修改實施例4 儘管以上實施例中所說明之組態在驗證中使用距離 • D0(經校正之距離D1)，但指示登錄聲音與驗證聲音之間的相似性之值不限於距離D0。舉例而言，使用基於任何變數 (亦即，任何指數值）執行驗證之組態，該變數之值隨著登錄聲音的特性與驗證聲音之特性彼此接近而增加。在此組態中，與以上實施例相比，校正值A(Aa、Ab及Ac)根據每一變數之增加或減小反轉。舉例而言，與圖4之組態相反，此組態中之校正值Aa隨著位準比率EN_SN增加而減 • 小。 (5)經修改實施例5 儘管在以上實施例中所說明之組態中將三種類型之校正值Aa、Ab及Ac個別地輸出至校正器44，但亦可使用校正值控制器50輸出校正值Aa、Ab與Ac的總和之組態。另外，可適當地修改校正器44校正距離D0之計算操作。舉例而言，使用校正器44將每一校正值A(Aa、Ab及Ac)與距離 DO相加或將距離DO乘以每一校正值A(Aa、Ab及Ac)之組態。在藉由將每一校正值A與距離DO相加來計算D1之組態 120166.doc -28 - 200828267 / 中，與圖1的組態相比，每一校正值A之正負號反轉。 (6)經修改實施例6 儘管以上實施例中所說明之組態將預定臨限值TH0與隨位準比率EN_SN線性變化之變數（臨限值）TH之間的差計算為校正值Aa，但可適當地改變位準比率EN一SN與臨限值 ΤΗ之間的關係。舉例而言，此經修改實施例使用一組 • 態，其中根據位準比率EN_SN及位準比率差DIF一SN來指定臨限值TH，以使得位準比率EN_SN及臨限值TH滿足對 _ 應於位準比率差DIF_SN之曲線的關係（亦即’使得臨限值 ΤΉ隨著位準比率EN—SN而沿對應於位準比率差DIF一SN之曲線改變），且臨限值TH與臨限值ΤΗ0之間的差判定為校正值Aa。其將足以設定臨限值TH使得臨限值TH與位準比率EN_SN如上所述根據驗證雜音而具有不同關係（通常，根據位準比率差DIF_SN而成線性或曲線關係）。舉例而言，根據導出位準比率EN_SN與對應於一位準比率差 ^ DIFJN之臨限值TH之間的關係之測試之結果或根據對該測試結果的統計處理結果來適當地改變此等變數之間的特定關係。因此，本發明之一較佳實施例中之校正值Aa判定為預定臨限值ΤΗ0與臨限值TH之間的差，臨限值TH根據 ‘ 驗證雜音滿足與位準比率ENJN之關係。 (7)經修改實施例7 .. 儘管在以上實施例中說明聲音驗證裝置100用以區分授權使用者與陌生人之狀況，但根據以上實施例之聲音驗證裝置100亦可用於聲音密碼驗證，其判定由驗證聲音指定 120166.doc -29· 200828267 的密碼是否匹配先前基於授權使用者之語音而登錄之密碼。【圖式簡單說明】圖1為說明根據本發明之一實施例之聲音驗證裝置的組態之方塊圖。圖2為由輸入單元產生之聲響信號之波形圖。圖3為說明由校正值控制器執行之程序之流程圖。圖4為說明校正值Aa與位準比率EN_SN及位準比率差 DIF_SN之關係之圖。圖5為說明用以判定校正值Aa之表之内容之示意圖。圖6為說明相關值NOISE_DIF與校正值Ab之間的關係之圖。圖7為說明語音長度EN_SPEECH_LEN與校正值Ac之間的關係之圖。圖8為說明臨限值與FAR及FRR之關係之圖。【主要元件符號說明】 10 操作單元 15 輸入單元 20 特性分析器 22 區段偵測器 23 開關 25 雜音分析器 26 聲音分析器 28 特徵分析器 120166.doc - 30 - 200828267 32 儲存設備 35 儲存單元 40 驗證器 42 距離計算器 44 校正器 46 判定器 50 校正值控制器 51 設定器 52 設定器 53 設定器 60 輸出單元 100 聲音驗證裝置 Aa 校正值 Ab 校正值 Ac 校正值 D〇距離〇! 距離 L〇持續期間 L! 虛線 l2 虛線 P 偵測區段 PI 未出聲區段 P2 出聲區段 R 虛線 120166.doc -31 - 200828267 S 聲響信號 TH〇臨限值馨 120166.doc -32-

Claims

200828267 十、申請專利範圍： L 一種聲音驗證裝置，其包含：特性分析構件，其分析一受驗者產生—用於該受驗者之驗證之樣本聲音時在該受驗者周圍產生的一樣本雜音之特性；第一設定構件，其根據經該特性分析構件分析之該樣本雜音之該等特性來設定一第一校正值；

权正構件，其基於由該第一設定構件所設定之該第一 =正值來校正-指數值，該指數值指示先前已登錄之一參考聲音的一特徵量與自該受驗者獲取之該樣本聲音之特欲Ϊ之間的一相似程度；及，、精由將該由該校正構件校正之指數值與預疋臨限值進行比較來判定該受驗者之真確性。 2 項1之聲音驗證裝置’其中該第—設定構件根據 “ #音之該等特性及該參考聲音與—在 :=== 考雜… 預定臨限值與-變數^使㈣弟—校正值設定為該音之心數之間的一i，該變數係與該樣本雜比率相關聯而決定。參考雜音之間的該位準 3·如請求項2之聲音 # 第_於也其中該第一設定構件將該該變數隨著定臨限值與該變數之間的該差，而沿—對^9與該參考雜音之間的該位準比率 μ於4樣本雜音之該等特性之線或曲線變化。 120166.doc 200828267 4·如睛求項2或3之聲音驗證裝置，发據該參考簦立血兮4 土祕* /、Y孩弟一設定構件根 ^考耳曰與該參考雜音之間的該位雜音之兮' 發士 L L 士年及^該樣本 «之該等特性來設定該第一校正 # M tu ^ ^ ^ 該樣本雜音之該 4特i·生係作為該參考聲音與該參率另诗接丄你、隹曰之間的該位準比 ^樣本聲音與該樣本雜音 -位準比率差。卒食曰之間的-位準比率之間的步包含第二設定構與該參考雜音之間 5.如請求項2之聲音驗證裝置，其進一

件，該第二設定構件根據該樣本雜音的一差來設定一第二校正值，二校正值來其中該校正構件根據該第一校正值及該第校正該指數值。 &如請求们之聲音驗證裝置，其進—步包含第三設定構件忒第一 σ又疋構件根據該樣本聲音或該參考聲音之一持續期間來設定一第三校正值，〃中該ic正構件根據该第_校正值及該第三校正值來校正該指數值。 7· —種聲音驗證方法，其包含·· 分析在一受驗者產生一用於該受驗者之驗證之樣本聲音時在該受驗者周圍產生的一樣本雜音之特性；根據該樣本雜音之該等分析後之特性設定一校正值；基於該所設定校正值校正一指數值，該指數值指示先 Μ已登錄之一參考聲音之一特徵量與自該受驗者獲取的該樣本聲音之一特徵量之間的一相似程度；及藉由將該經校正指數值與一預定臨限值進行比較來判 120166.doc -2. 200828267 定該受驗者之真確性。 8· -種用於-電腦中之機器可讀媒體，該媒體含有可由該電腦執行以執行以下處理之程式指令·· :特性分析處理，其分析在驗者產生—用於該受 =之魏之樣本聲㈣在該受驗者肖目雜音之特性；银+ 樣本=處理/其根據在該特性分析處理巾分析後之該 7 -曰之該等特性來設定一校正值；正處理’其基於該在該設定處理中所設定之該校者辣：父正一指數值，該指數值指示先前已登錄之-參曰的特妓量與自該受驗者獲取之該樣本聲音之一特徵量之間的一相似程度；及判疋處理，其藉由將該經校正指數值與一預定臨限進灯比#父來判定該受驗者之真確性。

120166.doc