TWI342008B - Voice authentication apparatus - Google Patents
Voice authentication apparatus Download PDFInfo
- Publication number
- TWI342008B TWI342008B TW096131267A TW96131267A TWI342008B TW I342008 B TWI342008 B TW I342008B TW 096131267 A TW096131267 A TW 096131267A TW 96131267 A TW96131267 A TW 96131267A TW I342008 B TWI342008 B TW I342008B
- Authority
- TW
- Taiwan
- Prior art keywords
- sound
- noise
- correction value
- verification
- value
- Prior art date
Links
- 238000012937 correction Methods 0.000 claims abstract description 161
- 238000012795 verification Methods 0.000 claims description 165
- 238000000034 method Methods 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 4
- 239000010902 straw Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 230000007423 decrease Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 125000001072 heteroaryl group Chemical group 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Collating Specific Patterns (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Telephone Function (AREA)
- Image Processing (AREA)
- Devices For Checking Fares Or Tickets At Control Points (AREA)
- Lock And Its Accessories (AREA)
Description
1342008 九、發明說明: 【發明所屬之技術領域】 本發明係關於一種個別聲音之驗證技術。 【先前技術】 已提出一種習知聲音驗證技術,該技術藉由將先前自已 授權使用者獲取之聲音(下文中稱作"參考聲音"或"登錄聲 音")的特徵量與自待驗證之人(下文中稱作"受驗者”)獲取 之聲音(下文中稱作”樣本聲音"或"驗證聲音之特徵量之 間的距離與一臨限值進行比較來判定受驗者之真確性。專 利文獻日本專利申請案公告第2003_248661號描述一種組 態,其中根據驗證之目的或根據驗證之所需精確度水準來 改變臨限值。 圖8為用以評估聲音驗證之圖。圖8中之錯誤拒絕率 (False Rejection Rate,FRR)意謂即使一受驗者為一授權使 用者,該受驗者之真確性亦將在驗證期間被拒絕的可能性 (使用者拒.·色率),且錯誤接受率(False Acceptance Rate, FAR)意謂即使受驗者並非授權使用者,該受驗者之真確性 亦將在驗證期間被接受之可能性(陌生人接受率)。如自圖8 可見,右將驗證中所使用之臨限值設定為圖8令之值"a", 則拒絕未授權受驗者的可能性維持在一足夠高之水準,而 拒絕授權使用者之可能性得以充分降低。 然而’驗證聲音斑Λ it Vr_ nn θ且錄聲音之間的距離根據驗證期間產 生之環境聲響(下女φ猫& 以丄 I卜文中稱作樣本雜音"或,,驗證雜音")而改 支因為驗°丘雜音影響驗證聲音之特性。因此,圖8中之 120166.doc 1342008 FRR及FAR中之每一者的曲線根據驗證雜音之特性而平行 於水平軸(距離)移動。舉例而言,若將由圖8中之實線所示 之FAR改為虛線乙丨,則錯誤接受陌生人的真確性之可能性 增加(亦即,驗證之精確度水準降低),且若將圖8中之 改為虛線L2,則拒絕授權使用者的真確性之可能性增加 (亦即,驗I登之便利性降低)。㈣,習知聲音驗證之^題 在於驗證之精確度與驗證之便利性之間的平衡根據驗證雜 音之特性而被打破。
此問題甚至不可如在專利文獻曰本專利申請案公告第 2003-248661號中藉由根據驗證之目的或所需精確度水準 而改變臨限值來解決。當以由行動電話代表之揭帶型電子 設備執行驗證時此問題更為嚴重,因為驗證雜音之特性根 據電子設備的使用環境而以各種方式改變。 乂 【發明内容】 已鑒於此等情形作出本發明,且本發明之一目標為解決
無關於樣本雜音㈣持魏之精確度與驗㈣ 門' 的平衡之問題。 ] ::決:上問題’根據本發明之一態樣之聲音驗證裝置 匕β特性分析構件,其分析在受驗者 典 说夕媒夫敫立★ 生用於又驗者的驗 Γ 6或驗證聲音時在受驗相圍產生之樣本雜音 或驗證雜音的特性;第一設定構件(例如,圖丨中之設定器 5 1)’其根據由特性分析構 ° 定第一校正值(例如,圖广::二, 基於由第-設定構件Λ Γ );校正構件,其 構件…第-校正值來校正指數值(例 120166.doc 1342008 如,圖艸之距離D〇),該指數值指示先前已登錄之參考聲 音或登錄聲音的特徵量與自受驗者獲取之驗證聲音之特徵 量之間的相似程度;及判定器’其藉由將由校正構件校: 後之指數值與預定臨限值進行比較來判定受驗者之真確 性。 根據此態樣,在根據驗證雜音之特性校正指數值之後將 指示登錄聲音是否與驗證聲音類似之指數值與預定臨限值 # $行比較,藉此無關於驗證雜音而維持驗證的便利性與驗 證之精確度之間的平衡。預定臨限值可為固定值或可變 值。 立在本發明之一較佳實施例中’第一設定構件根據驗證雜 音及登錄聲音與在登錄聲音之登錄期間產生之登錄雜音之 間的位準比率(例如’圖4中之位準比率en—sn)來判定第— 校正值,使得第一校正值設定為預定臨限值與一變數(例 如圖4中之臨限值TH)之間的差,該變數係與驗證雜音之 • 肖性及登錄聲音與登錄雜音之間的位準比率相關聯而判定 的0 ..舉例而言’第-設定構件將第—校正值設定為預定臨限 .2與隨登錄聲音與登錄雜音之間的位準比率而沿對應於驗 雜3之特性之線或曲線變化的變數之間的差。 更特义3之,第一設定構件根據登錄聲音與登錄雜音之 間的:準比率及作為登錄聲音與登錄雜音之間的位準比率 與驗-且聲音與驗證雜音之間的位準比率(例如,位準比率 V—SN)之間的位準比率差(例如,圖4中之位準比率差 120166.doc 1342008 -dif〜SN3)之驗證雜音之特性來設定第一校正 值。 ”此實施例可無關於登錄雜音或驗證雜音之特性而藉由簡 單維持驗證之便利性與驗證的精確度之間的平衡。 2。又夂構件可基於界定第—校正值與登錄聲音與登錄雜 的位準比率及驗證雜音之特性(更特定言之,登錄 聲音與登錄雜音之間的位準比率與驗證聲音與驗證雜音之 間的位準比率之間的位準比率差)的關係之表來設定第— j… Α亦可藉由使用表示此等值之間的關係之等式進 而設定第一校正值。該表或該等式之内容可(例如) 根據來自使用者之指令而適當改變。 根據本發明之—實施例之聲音驗證裝置進—步包含第二 設定構件(例如,圖1中之設定 又疋器52),其根據驗證雜音與登 錄雜音之間的差(例如,圖6中夕 _ 囫中之相關值NOISE_DIF)來設定 一第二校正值(例如,圖1中 校值Ab),其中該校正構 件根據第-及第二校正值來校正指數值。 根據此實施例,即使當為誊帆Μ ’ 么心 田在實際驗證期間登錄雜音(亦 即,參考雜音)與驗證雜音(亦 Μ ω f η 丨樣本雜音)之間的實際相 關性不同於在判定第一校正值 .,值興I錄雜音及登錄聲音之關 係時所抓用之登錄雜音與驗證雜 ^ 之間的原始相關性,亦 可基於根據實際驗證雜音與登 & Α > 且錄雜音之間的差之第二校正 值來杈正指數值,藉此有效地 ^rt ^ Ps ^ τ 维持驗證之便利性與驗證之 精確度之間的平衡。第二設定 構件可基於界定第二校正值 興驗祖雜音與登錄雜音之間 圭之關係之表來設定第二校 120166.doc 1342008 正值’且亦可藉由使用表示該關係、的等式來進行計算而咬 2二校正值。該表或該等式之内容可⑽如)板據來自使 用者之指令而適當改變。 根據本發明之—實施例之聲音驗證裝置進—步包含第三
:::件(例如,圖丨中之設定器53)’該第三設定構件根: 驗-聲曰(亦即’樣本聲音)或登錄聲音(亦即,參考聲音) ㈣續期間(例如’圖7中之語音長度en—SPEECH—LENa或 V—SPEECH—LEN)來設定第三校正值(例如,圖1中之校正 值Α〇,丨中該校正構件根據第一及第三校正值來校正指 數值。 根據此實施例,即使當登錄聲音或驗證聲音之語音長度 (或持續期間)不同於在判定第一校正值與登錄雜音及^ 聲音之關係時所採用的語音長度時,亦可基於根據驗證聲 音或登錄聲音之第三校正值來校正指數值,藉此有效地維 持驗證之便利性與驗證之精確度之間的平衡。第三設定構 件可基於界定第三校正值與驗證聲音或登錄聲音之持續期 間之間的關係之表來設定第三校正值,且亦可藉由使用表 示該關係之等式進行計算來設定第三校正值。該表或該等 式之内容可(例如)根據來自使用者之指令而適當改變。 用作用於判定用以校正指數值之校正值之基礎的參數不 限於驗證聲音或登錄聲音之持續期間及驗證雜音與登錄雜 音之㈣差》舉例而言,聲音驗證裝置可進一步包含根據 包括於登錄聲音或驗證聲音中之有聲與無聲聲響之持續期 間之㈣比率來設定校正值之設定構件,或根據登錄聲音 120166.doc i • 11 - 1342008 或驗證聲音之音節之數目來設定校正值的設定構件。根據 如上所述之表或等式來判定校正值之組態或表或等式的内 谷為可變之組態用於此等實施例中之任一者中。 本發明亦指定為一種控制根據以上實施例中之每_者 聲音驗證裝置的聲音驗證方法。根據本發明之一實施例之 聲音驗證方法包含:分析在一受驗者產生一用於該受驗者 的驗證之驗證聲音時在該受驗者周圍產生之驗證雜音之特 性;根據驗證雜音之所分析特性設定校正值;基於所設定 校正值校正指數值,該指數值指示先前已登錄之登錄^音 之特徵量與自受驗者獲取的驗證聲音之特徵量之間的相似 程f;及藉由將經校正之指數值與預定臨限值進行比較來 1疋又驗者之真確性。此方法達成與根據本發明之聲音驗 證裝置之操作及優勢相同的操作及優勢。 —根據以上實施例中之每一者之聲音驗證裝置藉由專用於 —處里的諸如數位仏號處理器(DSP)之硬體(電子電路)來 實二且亦經由程式與諸如中央處理單元(CPU)之通用處 —單元之間的協作來實施。根據本發明之程式使得電腦執 '亍、下處理.特性分析處理,以分析在受驗者產生用於受 驗者之^的樣本聲音時在受驗者周圍產生之驗證雜音之 特:’設定處理,以根據在特性分析處理中所分析之驗證 '、π ^特II來叹定校正值;校正處理,以基於在設定處理 Α疋^校正值來校正指數值,該指數值指示先前已登錄 之且錄聲音的特徵量與自受驗者獲取之驗證聲音之特徵量 相似铨度,及判定處理,以藉由將經校正之指數值 120166.doc •12· 1342008 與預定臨限值進行比較來判定受驗者之真確性。此程式亦 達成與根據以上實施例中之每一者之聲音驗證裝置的操作 及優勢相同之操作及優勢。本發明之程式係以儲存於諸如 CD-ROM之機器可讀取媒體或攜帶型記錄媒體中之形式而 提供至使用者且接著安裝於電腦上,且亦以在網路上之分 布式方式自伺服器裝置提供且接著安裝於電腦上。 【實施方式】 <A :聲音驗證裝置
圖1為說明根據本發明之實施例之聲音驗證裝置的組態 之方塊圖。聲音驗證裝置⑽為基於當受驗者說出特定; 語時產生之聲音來狀以確性(料,衫受驗者是否 為先前已登錄之正式使用者)之設備。聲音驗證裝置⑽安 裝於多種電子設備中’諸如行動電話或資訊處理設備。圖 1中所示之特性分析器2〇、驗證器或校正值控制器50可 各實施為(例如)由諸如CPU之處理單元執行之程式
可由諸如DSP之硬體電时施。儲存單元抑 之機器可讀媒體。 有3程式 :音驗證裝置刚之操作分為初始登錄 :::驗:之前登錄由授權使用者說出之聲音(登錄聲音) “乍。驗證為藉由將登錄聲 (驗證聲音)進行對比來判定受驗者之真;之聲音 單元H)包括由❹者 Λ確㈣#作。操作 文用者麵縱之複數個操作器。 適當操縱操作單元】。而命令聲音 =可措由 錄或驗證。 裝置1 〇〇開始初始登 120166.doc -13. 1342008 偵:中入單元15及特性分析器2°用以當執行驗證時 =聲9或聲音驗證裝置⑽之環境雜音(驗證雜音)的 特性,且用以當如圖14? _ ^ 登錄聲音或聲音H置所不執行初始登錄時伯測 性。 °五、置0之裱境雜音(登錄雜音)的特 輪入單元⑽根據環境聲響(聲音及雜音)產生聲塑㈣ S之聲響收集器。如圖2中所說明,聲響信號S分為二聲 區段P1及出聲區段P2。出聲區段㈣授權使用者在初始登 錄期間說出登錄聲音之區段,或受驗者在驗證期間說出驗 證聲音之區段。另-方面,未出聲區段?1為未說出登錄或 驗證聲音之區段。因為在安裝有聲音驗證裝置⑽之環境 中可產生多種雜音’所以未出聲區段ρι並非完全安靜(亦 即’聲響信號S之振幅在未出聲區段P1令並非零),且輸入 單元15在未出聲區段P1中收集登錄雜音或驗證雜音。 將由輸入單元15產生之聲響信號8提供至圖丨之特性分析 器20。特性分析器20為用於分析由輸入單元^收集之聲響 之構件。特性分析器20包括區段偵測器22 '開關23、雜音 分析器25、聲音分析器26及特徵分析器28。區段偵測器22 將未出聲區段P1與出聲區段P2加以區分。舉例而言,區段 偵測器22將聲響信號S之振幅不連續增加或減少時之時間 <貞測為未出聲區段p 1與出聲區段P2之間的邊界。可使用多 種已知技術來將未出聲區段P1與出聲區段P2加以區分。 開關23為用於,切換由輸入單元15產生之聲響信號s之供 應目的地的構件。此允許將聲響信號S由區段偵測器22識 120166.doc 14 1342008 別為未出聲區段P1之部分提供至雜音分析器25,且允許將 聲響信號S由區段偵測器22識別為出聲區段P2之部分提供 至聲音分析器26及特徵分析器28。 雜音分析器25為用於基於未出聲區段P1中之聲響信號S 來分析登錄雜音或驗證雜音之特性的構件。此實施例中之 雜音分析器25週期性地分析未出學區段P1中之聲響信號S 的特性。當操縱操作單元10以命令聲音驗證裝置100開始 初始登錄或驗證時,雜音分析器25判定區段P(稱作偵測區 段)(該區段在所命令時間之前一預定時間開始且在所命令 時間結束)之經分析特性為如圖2中所示之登錄雜音或驗證 雜音的特性。在以下描述中,與登錄雜音或登錄聲音相關 聯之項目由包括"登錄(enroll)"之縮寫"EN"的符號表示,且 與驗證雜音或驗證聲音相關聯之項目由包括”驗證(verify)" 之縮寫"V”的符號表示。 如圖1中所示,此實施例中之雜音分析器25在執行初始 登錄時計算登錄雜音之頻率特性EN_NOISE_FC及雜音位 準EN_NOISE_LEVEL,且在執行驗證時計算驗證雜音之頻 率特性V_NOISE_FC及雜音位準V_NOISE_LEVEL。雜音 位準 EN—NOISE一LEVEL及 V_NOISE_LEVEL 中之每一者為 偵測區段P中之聲響信號S在未出聲區段P1中的分量中包括 於特定頻帶中之分量之量值(聲壓)的平均值。頻率特性 EN_NOISE_FC或V_NOISE_FC為表示將伯測區段P中之聲 響信號S所分為的複數個頻帶之分量之各別量值的資訊。 因此,雜音分析器25包括(例如)具有不同通頻帶之複數個 120166.doc -15 - 1342008 帶通濾波器(濾波器組)。頻率特性EN_NOISE_FC及 V_NOISE_FC之資訊僅需要反映登錄雜音或驗證雜音之特 性。舉例而言,雜音分析器25可為用於藉由諸如快速傅立 葉變換(FFT)之頻率分析來計算頻譜以作為頻率特性 EN_NOISE_FC及V_NOISE_FC之構件。 聲音分析器26基於出聲區段P2中之聲響信號S來分析登 錄聲音或驗證聲音之特性。此實施例中之聲音分析器2 6在 執行初始登錄時計算登錄聲音之語音位準 EN_SPEECH_LEVEL及語音長度(或持續期間)EN_ SPEECH—LEN,且在執行驗證時計算驗證聲音的語音位準 V_SPEECH_LEVEL 及語音長度 V_SPEECH_LEN。語音位 準 EN_SPEECH_LEVELA V_SPEECH_LEVEL 中之每一者為 包括於出聲區段P2中的聲響信號S中之特定頻帶中的分量 之量值的平均值。語音長度EN_SPEECH_LEN及 V—SPEECH_LEN中之每一者表示出聲區段P2之持續期間 (亦即,語音持續之時段)。自聲響信號S之振幅快速增加 時之時間(其對應於出聲區段P2之開始)至聲響信號S的振 幅快速減少時之時間(其對應於出聲區段P2之結東)之時段 被偵測為語音長度 EN_SPEECH_LENA V_SPEECH_LEN。 特徵分析器28為用於分析登錄聲音或驗證聲音之特徵之 構件。此實施例中之特徵分析器28在執行初始登錄時計算 登錄聲音之特徵量EN_DATA,且在執行驗證時計算驗證聲 音的特徵量V_DATA。特徵量EN_DATA& V_DATA中之每 一者為自出聲區段P2中之聲響信號S計算的倒譜之向量之 120166.doc • 16- 1342008 時序(time-series)。因此,用於執行包括頻率分析(例如’ FFT方法)之多種計算之構件較佳用作特徵分析器28。 儲存設備32為用於儲存驗證中所使用之多種資訊之構 件。舉例而言,如圖1中所示,儲存設備32將特性分析器 20指定用於登錄聲音及登錄雜音之多種資訊儲存為驗證辭 典。更特定言之’由雜音分析器25指定之頻率特性 EN_NOISE_FC及雜音位準EN_NOISE_LEVEL、由聲音分 析器26指定之語音位準EN_SPEECH_LEVEL及語音長度 EN_SPEECH_LEN,及由特徵分析器28指定的特徵量 EN_DATA在執行驗證之前儲存於儲存設備32中。儲存設備 32可為固定至聲音驗證裝置1〇〇之設備,且亦可為可拆卸 地附接至聲音驗證裝置1〇〇之攜帶型設備(記憶體)。 驗證器40為用於藉由將驗證聲音與登錄聲音進行對比來 判定受驗者之真確性之構件。驗證器40包括距離計算器 42、校正器44及判定器46。距離計算器42計算儲存於儲存 設備32中之特徵量en_DATA與特徵分析器28針對驗證聲音 產生之特徵量V_DATA之間的距離D0。距離計算器42使用 諸如計算特徵量£1^_0八丁八及V_DATA之向量序列之間的正 規化距離之DP匹配之多種圖案匹配技術來計算距離DO。 隨著距離DO減小,驗證聲音與登錄聲音更類似(亦即,受 驗者更可能為一授權使用者 校正器44為用於基於校正值A(Aa、Ab及Ac)來校正由距 離計算器42計算出之距離D0之構件。在此實施例中,校正 器44藉由自距離do減去由校正值控制器50設定之每一校正 120166.doc 17 1342008 值Aa、Ab及Ac來計算經校正的距離dj。 判定1§ 46藉由將由校正器44校正之距離〇1與臨限值th〇 進行比較來判定受驗者之真確性。更特定言之,若距離叫 低於臨限值ΤΗ0(亦即,若登錄聲音與驗證聲音類似),則 判定器46接受受驗者之真確性,且若距離⑴高於臨限值 ΤΗ0(亦即,若登錄聲音不同於驗證聲音),則判定器牝拒 絕受驗者之真確性。臨限值ΤΗ〇為預定的固定值。判定器 46之判定結果經由輸出單元6〇輸出。舉例而言,輸出指示 驗證結果之影像之顯示器或輸出指示驗證結果的聲響之音 訊輸出設備較佳用作輸出單元6〇 ρ 杈正值控制器50為用於設定在校正器料之校正中使用之 校正值A(Aa、Ab及Ac)的構件。校正值控制器5〇包括設定 器5卜52及53。設定器51基於特性分析器2〇在初始登錄及 驗战期間所產生之資訊來設定校正值Aa β設定器52根據驗 證雜音之特性與登錄雜音之特性之間的I來設定校正值 Ab。設定器53根據初始登錄期間的語音長度 EN—SPEECH—LEN來設定校正值Ae將描述校正值控 制器50之操作之細^中之储存單元35儲存校正值控 制器50用以設定校正值人之表。料設備32中之特定儲存 區域可用作儲存單元35。 :聲音驗證裝置之操作> 現將描述聲音驗證裝置1〇〇之詳細操作,集中於校正值 7制器50在驗證期間設定校正值心、^及^之過程。每 -人有必要進订驗證時,校正值控制器5〇執行圖3之過程。 120166.doc •18- 驗證變得必要時之實例包括當包括聲音驗證裝置100之電 子設備隨著施加電力而開始操作時,及當電子設備開始特 定操作(例如,存取特定資訊之操作)時。當起始驗證時, 受驗者在藉由操縱操作單元10而發出語音啟動指令之後向 輸入單元15說出特定詞語。雜音分析器25自結束於操縱操 作單元10時之偵測區段P中的聲響信號S指定頻率特性 V_NOISE_FC及雜音位準V_NOISE_LEVEL,且自緊接偵 測區段P之出聲區段P2中之聲響信號S指定語音位準 V_SPEECH_LEVEL及語音長度 V_SPEECH_LEN。 如圖3中所示,校正值控制器50計算登錄聲音與登錄雜 音之間的位準比率EN_SN(步驟S10)。位準比率EN_SN為 儲存設備32中儲存之語音位準EN_SPEECH_LEVEL與雜音 位準EN_NOISE_LEVEL之間的比率。舉例而言,使用等式 (1)來計算位準比率EN_SN。 EN一SN=log(EN_SPEECH一LEVEL/EN_NOISE—LEVEL)......(1) 接著,校正值控制器50計算驗證聲音與驗證雜音之間的 位準比率V_SN(步驟S11)。位準比率V_SN為自雜音分析器 25提供之雜音位與自聲音分析器26提 供之語音位準V_SPEECH_LEVEL之間的比率。與位準比 率EN_SN類似,使用等式(2)來計算位準比率¥_51^。 V_SN=log(V_SPEECH_LEVEL/V_N0ISE_LEVEL)......(2) 接下來,在步驟S12,校正值控制器50計算在步驟S10計 算出的初始登錄中之位準比率EN_SN與在步驟S11計算出 之驗證中之位準比率V_SN之間的差DIF_SN(DIF_SN= 120166.doc -19- IB42008 V_SN-EN_SN)。在下文中,差DIF_SN將稱作”位準比率 差”。校正值控制器50計算表示登錄雜音之特性與驗證雜 音之特性之間的相關性之相關值NOISE_DIF(步驟S13)。此 處,舉例而言,相關性為登錄雜音與驗證雜音之各別波譜 形狀是否類似。舉例而言,使用等式(3)來計算相關值 NOISE_DIF。
L ^(EN_MAG(i)-EN_M4G_AVE^V_MAG{i)-V MAG_AVE) NOISE _DIF= ,Bt<
yΣ(EN_MAG(i)~EN_MAG_AVEf ^(y_MAG(i)-V_AiAG_AVE)1 (苫)
等式(3)中之值EN_MAG(i)為複數個頻帶中由變數i指定 之頻帶中的登錄雜音之量值,且自值EN_MAG(i)減去之值 EN_MAG_AVG為由變數i指定之頻帶中的登錄雜音之量值 之平均值。類似地,等式(3)中之值V_MAG(i)為由變數i指 定之頻帶中的驗證雜音之量值,且自值V_MAG(i)減去之 值V_M AG_AVG為該頻帶中的驗證雜音之量值之平均值。 因此,若登錄雜音與驗證雜音完全匹配,則校正值 NOISE—DIF為1,且校正值NOISE_DIF隨著兩個雜音之特 性之間的差增加而減少(-l$NOISE_DIF$l)。 接著,校正值控制器50之設定器51基於在步驟S10計算 出之位準比率EN_SN及在步驟S12計算出之位準比率差 DIF_SN來設定校正值Aa(步驟S14)。校正值Aa與位準比率 EN_SN及位準比率差DIF_SN之關係以以下方式來判定。 首先,吾人考慮根據由距離計算器42計算出之距離DO大 於還是小於臨限值TH來判定受驗者之真確性之狀況。藉 120166.doc •20- 1342008 由進行測試,此申請案之發明者已發現,用於將驗證之精 確度維持在一高水準的臨限值TH滿足與位準比率EN_SN 及位準比率差DIF_SN之特定關係。更特定言之,如圖4中 所示,臨限值TH經設定使得對於位準比率EN_SN(其為登 錄雜音與登錄聲音之間的比率)之值改變為一新值且接著 對水平軸上之每一相應位準比率EN_SN繪製垂直軸上之臨 限值TH的每一狀況,驗證之精確度滿足一特定條件(例 如,使得FRR及FAR各低於一特定位準)。當對所繪製之點 進行統計處理時,其傾向於根據位準比率差DIF_SN而沿 一線分布。舉例而言,當將位準比率差DIF_SN設定為值 DIF_SN1時,滿足所要條件之臨限值TH隨位準比率EN_SN 而沿一具有諸如對應於值DIF_SN1之梯度及截距的屬性之 線改變。另外,如圖4中所示,用於將驗證精確度維持在 一所要水準之臨限值TH隨著位準比率EN_SN或位準比率 差 DIF_SN(DIF_SN1>DIF一SN2>DIF一SN3)增加而增加。 因此,若針對在步驟S10計算出之位準比率EN_SN來設 定臨限值TH以使得臨限值TH及位準比率EN_SN滿足對應 於一在步驟S12計算出之位準比率差DIF_SN的線之關係, 則可將驗證維持在一所要精確度水準。舉例而言,在位準 比率EN_SN計算為圖4中之值SNa之狀況下,若位準比率差 DIF_SN為DIF_SN1,則將臨限值TH設定為THa,且若位準 比率差DIF_SN為DIF_SN2,則將臨限值TH設定為THb。 因為距離大於還是小於臨限值係在驗證期間判定,所以 用於將待與距離D0比較之臨限值TH改變一特定值之處理 120166.doc •21 - 1342008 等效於用於在臨限值丁Η固定為TH〇的情形下將距離〇〇校正 特定值Aa之處理。因此,此實施例之設定器51將預定臨限 值ΤΗ0與臨限值TH之間的差設定為校正值Aa,臨限值τΗ 與位準比率EN_SN滿足—對應於位準比率差dif—SN之線 之關係。亦即,舉例而言,當位準比率ENJSN在步驟si〇 計算為值SNa(如圖4中所示)時,若位準比率差DIF-SN在步 驟S12計算為DIF_SN1,則臨限值TH〇與值THa之間的差“ 設定為校正值Aa ’且若位準比率差DIF_SN在步驟si2計算 ’則臨限值TH〇與值THb之間的差。設定為校 正值Aa。藉由自距離D0減去以此方式設定之校正值^而 計算出之距離D1在判定器46處與臨限值TH0進行比較,藉 此將此實施例的驗證維持在所要精確度水準。 更特定言之,此實施例之設定器51基於已建立以滿足以 上條件之表來自位準比率EN_SN及位準比率差DIF—SN判 定校正值Aa。圖5為說明在步驟S14使用之表之内容之示意 圖。如圖5中所示,對應於不同位準比率差dif_sn (DIF_SN1 . DIF_SN2 ^ DIF_SN3……)之複數個表儲存於儲 存單元35令。在每一表令,每一位準比率EN-SN與滿足圖 4之與位準比率EN一SN之關係的相應校正值Aa相關聯。亦 即在對應於位準比率差DIF—SN之表中,每一位準比率 EN一SN與一相應校正值—相關聯,使得藉由將校正值Aa 與臨限值丁H0相加獲取之臨限值TH與位準比率EN—SN具有 一對應於位準比率差DIF_SN的線之關係。 在步驟S14,設定器51搜尋對應於在步驟S12計算出之位 120166.doc •22· 1342008 準比率差DIF_SN之表,且將對應於包括於所擷取表中之 在步驟S10計算出之位準比率EN_SN的校正值Aa輸出至校 正器44。若不存在對應於在步驟S12計算出之位準比率差 DIF_SN之表,則設定器5 1根據來自對應於先於及緊隨所 計算的位準比率差DIF_SN之位準比率差DIF_SN之表的位 準比率EN_SN來指定校正值Aa,且藉由在所指定之校正值 Aa之間内插來計算一校正值Aa,該校正值Aa實際上待應 用於校正器44之校正。因此,舉例而言,若位準比率差 DIF_SN在步驟S12計算為圖2之值DIF_SN1與值DIF_SN2之 平均數,則校正值Aa計算為對應於值DIF_SN1的校正值 Aa(值al)與對應於值DIF_SN2之校正值Aa(值a2)之平均 數。 然而,臨限值TH與位準比率EN_SN及位準比率差 DIF_SN之關係係(例如)在登錄雜音之特性與驗證雜音之特 性一致的假設下判定。然而,在許多狀況下,登錄雜音之 特性不同於驗證雜音之特性。因此,設定器52根據登錄雜 音與驗證雜音之間的相關值NOISE_DIF來計算校正值Ab以 校正距離D0(步驟S1 5)。校正器44自距離D0減去校正值 Ab。 圖6為說明相關值n〇ISE_DIF與校正值Ab之間的關係之 圖。使用等式(3)計算出之相關值NOISE_DIF根據登錄雜音 與驗證雜音之間的相關性而在"-1"至"1"之範圍内變化。當 兩個雜音之特性完全一致時,相關值N〇ISE_DIF為” 1 ”。 若登錄雜音與驗證雜音之間的關係等效於在判定圖4之關 120166.doc •23· 1342008 係時的關係(若兩個雜音在此實施例中一致),則無需根據 相關值NOISE_DIF來校正距離D0。當登錄雜音與驗證雜音 之間的關係與判定圖4之關係時的關係差別較大時,必須 更大地校正距離D0。因此,當相關值NOISE_DIF為"1" 時,設定器52將校正值Ab設定為零(亦即,未校正距離 D0),且設定器52隨著相關值NOISE_DIF減小至"丨"以下而 將校正值Ab設定為較高。更特定言之,儲存單元3 5儲存一 表,其中每一相關值NOISE_DIF與一相應校正值Aa(其滿 足與相關值NOISE_DIF之此關係)相關聯,且設定器52基 於此表判定校正值Ab。 另外,圖4中所示之臨限值TH與位準比率EN_SN及位準 比率差DIF_SN之關係係(例如)基於在特定持續期間(時 長)L0期間連續說出登錄聲音時所收集的資料而判定。然 而,實際初始登錄中之登錄聲音之語音長度EN_ SPEECHJLEN係不同的。因此,設定器53根據語音長度 EN_SPEECH_LEN來計算校正值Ac以校正距離D0(步驟 S16)。校正器44自距離D0減去校正值Ac。
圖7為展示語音長度EN_SPEECH_LEN與校正值Ac之間 的關係之圖。若判定圖4之關係時語音長度EN_SPEECH_ LEN與持續期間L0 —致,則無需根據語音長度EN_ SPEECH_LEN來校正距離DO。因此,若儲存單元32中儲存 之語音長度EN_SPEECH—LEN與持續期間L0—致,則設定 器53將校正值Ac設定為"〇"。隨著語音長度EN_SPEECH_ LEN增加,登錄聲音之語音更穩定,使得特徵量en DATA 120166.doc ·24· 1342008 更可靠地反映授權使用者之固有的基本特性,藉此增加距 離D0的精確度。因此,即使相對於距離D0降低臨限值ΤΗ0 以便減少接受陌生人之真確性之可能性,亦不會不當地增 加拒絕授權使用者之可能性。 因此,若語音長度EN_SPEECH_LEN大於持續期間L0, 則設定器53根據語音長度EN_SPEECH_LEN而選擇負值作 為校正值Ac。因為校正器44自距離DO減去校正值Ac,所 以若校正值Ac為負,則經校正之距離D1大於距離D0。亦 即,因為臨限值ΤΗ0相對於距離D0減小,所以錯誤地接受 陌生人之真確性之可能性得以減小。相反,若語音長度 EN_SPEECH_LEN小於持續期間L0,則設定器53根據語音 長度EN_SPEECH_LEN而選擇正值作為校正值Ac。舉例而 言,設定器53基於每一語音長度EN_SPEECH_LEN與相應 校正值Ac相關聯之表來判定校正值Ac。 如上所述,在此實施例中,無關於驗證雜音或登錄雜音 之特性,可將驗證維持在一所要精確度水準,因為距離D0 係根據驗證雜音與驗證聲音(V_SN)之間的關係或登錄雜音 與登錄聲音(EN_SN)之間的關係來校正。亦即,驗證之便 利性之增加(FRR之減少)及驗證的精確度之增加(FAR之減 少)皆可在不受驗證雜音或登錄雜音影響之情形下達成。 在此實施例中,尤其校正值Aa係基於滿足所要條件之臨 限值TH與位準比率EN_SN成一對應於位準比率差DIF_SN 之線的關係之認知來調整。因此,此實施例之優勢為有可 能以高精確度指定最佳校正值Aa,同時充分減少設定校正 120166.doc •25- 1342008 值Aa所需之變數之數目。亦有可能藉由充分考慮初始登錄 或驗證時聲音驗證裝置⑽之環境來實現高度精確的驗 證,因為距離D0係根據相關值N〇ISE_DIF或語音長度 EN_SPEECH_LEN來校正。 又 <c :經修改實施例> 以上實施例可以各種方式修改β以下說明特定經修改實 施例。以下經修改實施例之適當組合亦為可能的。
(1)經修改實施例1
儘管在以上實施例中所說明之組態使用儲存於儲存單元 35中之表,但藉由使用預定等式的計算方法計算校正值 A(Aa、Ab及Ac)之組態亦為可能的。舉例而言,儲存單元 35儲存分別表示根據位準比率差(DIF 一 SN)之線(亦即,圖4 之線,每一者界定位準比率en_sN與臨限值TH之間的關 係)之複數個公式,且設定器51藉由將在步驟si〇訃算出之 位準比率EN_SN代入等式而根據在步驟S12計算出的位準 比率差DIF_SN來計算臨限值TH,且藉由自所計算之臨限 值TH減去臨限值TH 0來計算1校正值A a。此實例亦使用設定 器52基於表示校正值noise—DIF與校正值Ab之間的關係之 等式來計算校正值Ab之組態,或設定器53基於表示語音長 度EN一SPEECH_LEN與校正值Ac之間的關係之等式來計算 校正值Ac之组態。 (2)經修改實施例2 判定將距離D0校正至何程度之變數不限於校正值 NOISE一DIF及語音長度en_SPEECH_LEN。舉例而言,可 I20166.doc -26- 替代或結合根據語音長度EN_SPEECH_LEN設定校正值Ab 之組態來使用根據驗證聲音之語音長度V_SPEECH_LEN來 計算校正值Ab的組態或根據語音長度EN_SPEECH_LEN與 語音長度V_SPEECH_LEN之平均值來計算校正值Ab之組 態。舉例而言,校正值Ab經設定使得經校正之距離D1隨 著語音長度V_SPEECH_LEN增加而增加,此類似於校正值 Ab與語音長度EN_SPEECH_LEN之間的關係。 亦使用校正值控制器50基於除以上所述之變數以外之變 數來判定每一校正值的組態。舉例而言,可根據包括於登 錄聲音或驗證聲音中之有聲聲響與無聲聲響之持續期間之 間的比率來設定每一校正值(在出聲區段P2中)。隨著有聲 聲響之比率增加,特徵量丑1<_0八丁八及V_DATA之值更可靠 地反映說話者的特性,藉此增加距離D0之精確度》因此, 即使距離D 1自距離D0增加,FRR亦不會不當地增加。因 此’使用每一校正值經設定使得距離D1隨著登錄聲音或驗 證聲音中之有聲聲響之比率增加而增加的組態。另外,亦 可使用每一校正值經設定使得距離〇1隨著登錄聲音或驗證 聲音之音節之數目增加而增加的組態,因為距離D0之精確 度隨著登錄聲音或驗證聲音之音節的數目增加而增加。 (3)經修改實施例3 亦使用變數與校正值之間的關係為可變之組態。舉例而 言’可提供藉由根據操作單元10之操縱更新表來改變校正 值Aa與位準比率en_SN或位準比率差DIF_SN之關係的組 態。類似地’可根據操作單元1 〇之操縱來修改對應於相關 120166.doc -27- 1342008 值NOISE_DIF之校正值Ab或對應於語音長度en SPEECH_LEN的校正值Ae。此等組態可根據使用者之需要 而達成驗證。在藉由如經修改實施例丨中所說明之等式的 計算來計算校正值A(Aa、Ab&Ac)之組態中,可根據操作 單元10之操縱來修改該等等式中之每一者的内容(例如, 變數之係數)。 (4) 經修改實施例4 儘管以上實施例中所說明之組態在驗證中使用距離 D0(經校正之距離D1),但指示登錄聲音與驗證聲音之間的 相似性之值不限於距離D0。舉例而言,使用基於任何變數 (亦即,任何指數值)執行驗證之組態,該變數之值隨著登 錄聲音的特性與驗證聲音之特性彼此接近而增加。在此組 態中,與以上實施例相比,校正值A(Aa、^及Ae)根據每 一變數之增加或減小反轉。舉例而言,與圖4之組態相 反’此組態中之校正值Aa隨著位準比率en_sn增加而減 小 〇 (5) 經修改實施例5 儘管在以上實施例中所說明之組態中將三種類型之校正 值Aa、Ab及Ac個別地輸出至校正器44,但亦可使用校正 值控制器50輸出校正值Aa、Ab與Ac的總和之組態。另 外,可適當地修改校正器44校正距離〇0之計算操作◊舉例 而吕,使用校正器44將每一校正值A(Aa、心及Ac)與距離 DO相加或將距離D0乘以每一校正值A(Aa、^及Ac)之組 態。在藉由將每一校正值八與距離D〇相加來計算m之組態 120166.doc -28- 中’與圖1的組態相比,每一校正值A之正負號反轉。 (6) 經修改實施例6 儘管以上實施例中所說明之組態將預定臨限值THO與隨 位準比率EN—SN線性變化之變數(臨限值)Th之間的差計算 為奴正值Aa,但可適當地改變位準比率en_SN與臨限值 之間的關係。舉例而言,此經修改實施例使用一組 態’其中根據位準比率EN_SN及位準比率差dif_SN來指 定臨限值TH,以使得位準比率EN_SN及臨限值TH滿足對 應於位準比率差DIF一SN之曲線的關係(亦即,使得臨限值 TH隨著位準比率εν一SN而沿對應於位準比率差dif_SN之 曲線改變)’且臨限值TH與臨限值THO之間的差判定為校 正值Aa。其將足以設定臨限值τη使得臨限值TH與位準比 率EN—SN如上所述根據驗證雜音而具有不同關係(通常, 根據位準比率差DIF_SN而成線性或曲線關係)。舉例而 言’根據導出位準比率en_sn與對應於一位準比率差 DIF一SN之臨限值TH之間的關係之測試之結果或根據對該 測試結果的統計處理結果來適當地改變此等變數之間的特 疋關係。因此’本發明之一較佳實施例中之校正值Aa判定 為預定臨限值THO與臨限值TH之間的差,臨限值τη根據 驗證雜音滿足與位準比率EN_SN之關係。 (7) 經修改實施例7 儘管在以上實施例中說明聲音驗證裝置1 〇〇用以區分授 權使用者與陌生人之狀況,但根據以上實施例之聲音驗證 裝置100亦可用於聲音密碼驗證,其判定由驗證聲音指定 120166.doc -29· 1342008 的密碼是否匹配先前基於授權使用者之語音而登錄之密 碼。 【圖式簡單說明】 圖1為說明根據本發明之一實施例之聲音驗證裝置的組 態之方塊圖。 圖2為由輸入單元產生之聲響信號之波形圖。 圖3為說明由校正值控制器執行之程序之流程圖。 圖4為說明校正值Aa與位準比率EN_SN及位準比率差 DIF_SN之關係之圖。 圖5為說明用以判定校正值Aa之表之内容之示意圖。 圖6為說明相關值NOISE_DIF與校正值Ab之間的關係之 圖。 圖7為說明語音長度EN_SPEECH_LEN與校正值Ac之間 的關係之圖。 圖8為說明臨限值與FAR及FRR之關係之圖。 【主要元件符號說明】 10 操作單元 15 輸入單元 20 特性分析器 22 區段偵測器 23 開關 25 雜音分析器 26 聲音分析器 28 特徵分析器 120166.doc -30· 1342008
32 儲存設備 35 儲存單元 40 驗證器 42 距離計算器 44 校正器 46 判定器 50 校正值控制器 51 設定 52 設定器 53 設定 60 輸出單元 100 聲音驗證裝置 Aa 校正值 Ab 校正值 Ac 校正值 D〇 距離 Di 距離 L〇 持續期間 Li 虛線 l2 虛線 P 4貞測區段 PI 未出聲區段 P2 出聲區段 R 虛線 120166.doc -31 - 1342008 s 聲響信號 TH〇 臨限值 120166.doc -32-
Claims (1)
1342008 獅卿修正替換頁 第096131267號專利申請案 中文申請專利範圍替換本(99年U月) 十、申請專利範圍: 1. 一種聲音驗證裝置,其包含: 特性分析構件,其分析一受驗者產生一用於該受驗者 之驗證之樣本聲音時在該受驗者周圍產生的—樣本雜音 之特性; 9 第一設定構件,其根據經該特性分析構件 本雜音之料特性來設定H正值;析u /交正構件’其基於由該第一設定構件所設定之該第一 校正值來校正一指數值,該指數值指示先前已登錄之一 參考聲音的一特徵量與自該受驗者獲取之該樣本聲音之 特徵量之間的一相似程度;及 q丨,丨人a〜?目数值興 -預定臨限值進行比較來判定該受驗者之真確性;
2. 3. *中忒第一设定構件根據該樣本雜音之該等特性及該 參考聲音與一在該參考聲音的登錄期間產生之參考雜音 :間的-位準比率(丨evehaU。)來設定該第_校正值使 仟°亥第—校正值設定為該預定臨限值與-變數之間的一 差’该變數係與該樣本雜音之該㈣性及 該^雜音之間的該位準比率相關聯而決定。名曰。 :::们之聲音驗謹裝置,其中該第一設定構件將該 …又正值設定為該預定臨限值與該變數之間的該差, 二數隨著5亥參考聲音與該參考雜音之間的該位準比率 =對應於該樣本雜音之該料性之線或曲線變化。 〜求項1或2之聲音驗證裝置’其中該第一設定構件根 120I66-991124.doc
據2參考聲音與該參考雜音之間的該位準比率及該樣本 雜曰之該等特性來設定該第—校正值,該樣本雜立之1 ^特性係作為該參考聲音與該參㈣音之⑽ ’、及該樣本聲音與該樣本雜音之間的—位準比率 —位準比率差。 包含第二設定構 該參考雜音之間 如請求項1之聲音驗證裝置,其進—步 件"亥第—設定構件根據該樣本雜音與 的—差來設定一第二校正值, 一权正值來 其中該校正構件根據該第一校正值及該第 校正遠指數值。 5‘如請求1之聲音驗證裝置,其進_步包含第三設定構 件,該第三設定構件根據該樣本聲音或該參考聲音之一 期間來設定一第三校正值, 其中該校正構件根據該第一校正值及該第三校正值來 才父正该指數值。 6‘ 一種聲音驗證方法,其包含: 刀析在文驗者產生一用於該受驗者之驗證之樣本聲 音時在該受驗者周圍產生的一樣本雜音之特性; 根據該樣本雜音之該等分析後之特性設定一校正值; 二基於該所設定校正值校正一指數值,該指數值指示先 前已登錄之一參考聲音之一特徵量與自該受驗者獲取的 #亥樣本聲音之—特徵量之間的一相似程度;及 稭由將該經校正指數值與一預定臨限值進行比較來判 定該受驗者之真確性;且 I20166-991124.doc 1342008 其中根據該樣本雜音之該等特性及該參考聲音斑一在 該參考聲音的登錄期間產生之參考雜音之間的一位準比 率(y)來設定該校正值,使得該校正值設定為該 預定臨限值與-變數之間的—差,該變數係與該樣本雜 音之該等特性及該參考聲音與該參考雜音之間的該位準 比率相關聯而決定。 -種用於一電腦中之機器可讀媒體,該媒體含有可由該 電腦執行以執行以下處理之程式指令:
一特性分析處理’其分析在一受驗者產生一用於該受 驗者之驗證之樣本聲音時在該受驗者周圍產生的一樣本 雜音之特性; 一設定處理,其根據在該特性分析處理中分析後之該 樣本雜音之該等特性來設定—校正值; 〆 一校正處理,其基於該在該設定處理中所設定之該校 正值來校正一指數值,該指數值指示先前已登錄之—參 考聲音的一特徵量與自該受驗者獲取之該樣本聲音之一 特徵量之間的一相似程度;及 一判定處理,其藉由將該經校正指數值與一預定臨限 值進行比較來判定該受驗者之真確性; 其中根據該樣本雜音之該等特性及該參考聲音與一在 該參考聲音的登錄期間產生之參考雜音之間的一位準比 率(level ratio)來設定該校正值,使得該校正值設定為气 預定臨限值與一變數之間的一差,該變數係與該樣本雜 音之泫等特性及該參考聲音與該參考雜音之間的該位準 比率相關聯而決定。 / 120166-991124.doc
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006249160A JP5151102B2 (ja) | 2006-09-14 | 2006-09-14 | 音声認証装置、音声認証方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200828267A TW200828267A (en) | 2008-07-01 |
TWI342008B true TWI342008B (en) | 2011-05-11 |
Family
ID=38830359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW096131267A TWI342008B (en) | 2006-09-14 | 2007-08-23 | Voice authentication apparatus |
Country Status (8)
Country | Link |
---|---|
US (1) | US8694314B2 (zh) |
EP (1) | EP1901285B1 (zh) |
JP (1) | JP5151102B2 (zh) |
KR (1) | KR100929958B1 (zh) |
CN (1) | CN101145342B (zh) |
AT (1) | ATE441176T1 (zh) |
DE (1) | DE602007002132D1 (zh) |
TW (1) | TWI342008B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8849199B2 (en) * | 2010-11-30 | 2014-09-30 | Cox Communications, Inc. | Systems and methods for customizing broadband content based upon passive presence detection of users |
US9372979B2 (en) * | 2011-01-07 | 2016-06-21 | Geoff Klein | Methods, devices, and systems for unobtrusive mobile device user recognition |
JP5782810B2 (ja) | 2011-04-22 | 2015-09-24 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US8949958B1 (en) * | 2011-08-25 | 2015-02-03 | Amazon Technologies, Inc. | Authentication using media fingerprinting |
ES2907259T3 (es) * | 2013-12-06 | 2022-04-22 | The Adt Security Corp | Aplicación activada por voz para dispositivos móviles |
US20160302210A1 (en) * | 2015-04-10 | 2016-10-13 | Enovate Medical, Llc | Communication hub and repeaters |
US9734682B2 (en) | 2015-03-02 | 2017-08-15 | Enovate Medical, Llc | Asset management using an asset tag device |
US10614813B2 (en) * | 2016-11-04 | 2020-04-07 | Intellisist, Inc. | System and method for performing caller identity verification using multi-step voice analysis |
US10579814B2 (en) * | 2017-10-30 | 2020-03-03 | International Business Machines Corporation | Monitoring and preventing unauthorized data access |
KR20200066149A (ko) * | 2018-11-30 | 2020-06-09 | 삼성전자주식회사 | 사용자 인증 방법 및 장치 |
CN109636937A (zh) * | 2018-12-18 | 2019-04-16 | 深圳市沃特沃德股份有限公司 | 语音考勤方法、装置及终端设备 |
WO2022249801A1 (ja) | 2021-05-28 | 2022-12-01 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音声認識装置、音声認識方法、及び音声認識プログラム |
WO2023182014A1 (ja) * | 2022-03-22 | 2023-09-28 | パナソニックIpマネジメント株式会社 | 音声認証装置および音声認証方法 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6006175A (en) | 1996-02-06 | 1999-12-21 | The Regents Of The University Of California | Methods and apparatus for non-acoustic speech characterization and recognition |
JPH1055194A (ja) * | 1996-08-08 | 1998-02-24 | Sanyo Electric Co Ltd | 音声制御装置と音声制御方法 |
US6466906B2 (en) * | 1999-01-06 | 2002-10-15 | Dspc Technologies Ltd. | Noise padding and normalization in dynamic time warping |
GB2349259B (en) * | 1999-04-23 | 2003-11-12 | Canon Kk | Speech processing apparatus and method |
JP2001021309A (ja) | 1999-07-12 | 2001-01-26 | Toshiba Tec Corp | 個体認証方法及び個人認証方法 |
US7117149B1 (en) * | 1999-08-30 | 2006-10-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Sound source classification |
WO2001028107A1 (fr) | 1999-10-12 | 2001-04-19 | Japan As Represented By President Of Hokkaido University | Système de réception radio |
TW521266B (en) | 2000-07-13 | 2003-02-21 | Verbaltek Inc | Perceptual phonetic feature speech recognition system and method |
JP2002236665A (ja) * | 2001-02-09 | 2002-08-23 | Matsushita Electric Ind Co Ltd | 個人認証装置 |
US7277853B1 (en) * | 2001-03-02 | 2007-10-02 | Mindspeed Technologies, Inc. | System and method for a endpoint detection of speech for improved speech recognition in noisy environments |
US20030033143A1 (en) * | 2001-08-13 | 2003-02-13 | Hagai Aronowitz | Decreasing noise sensitivity in speech processing under adverse conditions |
JP2003248661A (ja) | 2002-02-25 | 2003-09-05 | Sony Corp | 認証処理装置および認証処理方法、情報処理装置および情報処理方法、認証処理システム、記録媒体、並びにプログラム |
JP2003308091A (ja) | 2002-04-17 | 2003-10-31 | Pioneer Electronic Corp | 音声認識装置、音声認識方法および音声認識プログラム |
JP4212825B2 (ja) * | 2002-04-19 | 2009-01-21 | 株式会社アプコット | 個人認証方法とその装置、及び個人認証システム |
CN1453767A (zh) | 2002-04-26 | 2003-11-05 | 日本先锋公司 | 语音识别装置以及语音识别方法 |
US20030236663A1 (en) * | 2002-06-19 | 2003-12-25 | Koninklijke Philips Electronics N.V. | Mega speaker identification (ID) system and corresponding methods therefor |
TWI225640B (en) | 2002-06-28 | 2004-12-21 | Samsung Electronics Co Ltd | Voice recognition device, observation probability calculating device, complex fast fourier transform calculation device and method, cache device, and method of controlling the cache device |
JP3926242B2 (ja) * | 2002-09-19 | 2007-06-06 | 富士通株式会社 | 音声対話システム、音声対話のためのプログラムおよび音声対話方法 |
US20040186724A1 (en) * | 2003-03-19 | 2004-09-23 | Philippe Morin | Hands-free speaker verification system relying on efficient management of accuracy risk and user convenience |
JP2004325897A (ja) | 2003-04-25 | 2004-11-18 | Pioneer Electronic Corp | 音声認識装置及び音声認識方法 |
DE112004000782T5 (de) * | 2003-05-08 | 2008-03-06 | Voice Signal Technologies Inc., Woburn | Signal-zu-Rausch-Verhältnis vermittelter Spracherkennungs-Algorithmus |
JP4548646B2 (ja) * | 2003-09-12 | 2010-09-22 | 株式会社エヌ・ティ・ティ・ドコモ | 音声モデルの雑音適応化システム、雑音適応化方法、及び、音声認識雑音適応化プログラム |
TWI242729B (en) | 2004-01-16 | 2005-11-01 | Micro Star Int Co Ltd | Speech database establishment and recognition method and system thereof |
US8340309B2 (en) * | 2004-08-06 | 2012-12-25 | Aliphcom, Inc. | Noise suppressing multi-microphone headset |
TWI269268B (en) | 2005-01-24 | 2006-12-21 | Delta Electronics Inc | Speech recognizing method and system |
JP4670483B2 (ja) * | 2005-05-31 | 2011-04-13 | 日本電気株式会社 | 雑音抑圧の方法及び装置 |
CN1719516B (zh) * | 2005-07-15 | 2010-04-14 | 北京中星微电子有限公司 | 自适应滤波装置以及自适应滤波方法 |
EP1843325B1 (en) * | 2006-04-03 | 2009-11-18 | Voice.Trust Ag | Speaker authentication in digital communication networks |
-
2006
- 2006-09-14 JP JP2006249160A patent/JP5151102B2/ja not_active Expired - Fee Related
-
2007
- 2007-08-23 TW TW096131267A patent/TWI342008B/zh not_active IP Right Cessation
- 2007-09-04 DE DE602007002132T patent/DE602007002132D1/de active Active
- 2007-09-04 EP EP07115597A patent/EP1901285B1/en not_active Not-in-force
- 2007-09-04 AT AT07115597T patent/ATE441176T1/de not_active IP Right Cessation
- 2007-09-05 US US11/850,365 patent/US8694314B2/en active Active
- 2007-09-12 CN CN2007101541029A patent/CN101145342B/zh not_active Expired - Fee Related
- 2007-09-13 KR KR1020070093249A patent/KR100929958B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
EP1901285A3 (en) | 2008-09-03 |
EP1901285B1 (en) | 2009-08-26 |
JP2008070596A (ja) | 2008-03-27 |
TW200828267A (en) | 2008-07-01 |
JP5151102B2 (ja) | 2013-02-27 |
US20080071535A1 (en) | 2008-03-20 |
CN101145342A (zh) | 2008-03-19 |
ATE441176T1 (de) | 2009-09-15 |
KR20080025018A (ko) | 2008-03-19 |
KR100929958B1 (ko) | 2009-12-04 |
EP1901285A2 (en) | 2008-03-19 |
DE602007002132D1 (de) | 2009-10-08 |
US8694314B2 (en) | 2014-04-08 |
CN101145342B (zh) | 2011-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI342008B (en) | Voice authentication apparatus | |
US12026241B2 (en) | Detection of replay attack | |
CN108630202B (zh) | 语音识别装置、语音识别方法以及记录介质 | |
JP6024180B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
US20120232899A1 (en) | System and method for identification of a speaker by phonograms of spontaneous oral speech and by using formant equalization | |
WO2018025025A1 (en) | Speaker recognition | |
US10366121B2 (en) | Apparatus, method, and computer-readable medium for cue point generation | |
GB2552722A (en) | Speaker recognition | |
JP2009508144A (ja) | 生体測定声紋認証方法および生体測定声紋認証装置 | |
GB2583420A (en) | Speaker identification | |
CN112216294B (zh) | 音频处理方法、装置、电子设备及存储介质 | |
US20080154585A1 (en) | Sound Signal Processing Apparatus and Program | |
US8600751B2 (en) | Digital method and arrangement for authenticating a person | |
KR20160056104A (ko) | 사용자 음색 분석 장치 및 음색 분석 방법 | |
JP5151103B2 (ja) | 音声認証装置、音声認証方法およびプログラム | |
KR20110079161A (ko) | 이동 단말기에서 화자 인증 방법 및 장치 | |
JP2006154212A (ja) | 音声評価方法および評価装置 | |
Barlaskar et al. | Study on the varying degree of speaker identity information reflected across the different MFCCs | |
WO2006027844A1 (ja) | 話者照合装置 | |
JP2001265387A (ja) | 話者照合装置及び方法 | |
WO2019073233A1 (en) | ANALYSIS OF VOICE SIGNALS | |
Wu et al. | Voice Doppelgä nger Susceptibility among Racial and Gender Groups | |
JP5186793B2 (ja) | カラオケ装置 | |
JP2008158396A (ja) | 音声処理装置およびプログラム | |
JPH0619491A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |