TW200828267A - Voice authentication apparatus - Google Patents

Voice authentication apparatus Download PDF

Info

Publication number
TW200828267A
TW200828267A TW096131267A TW96131267A TW200828267A TW 200828267 A TW200828267 A TW 200828267A TW 096131267 A TW096131267 A TW 096131267A TW 96131267 A TW96131267 A TW 96131267A TW 200828267 A TW200828267 A TW 200828267A
Authority
TW
Taiwan
Prior art keywords
sound
verification
noise
correction value
sample
Prior art date
Application number
TW096131267A
Other languages
English (en)
Other versions
TWI342008B (en
Inventor
Yasuo Yoshioka
Takehiko Kawahara
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Publication of TW200828267A publication Critical patent/TW200828267A/zh
Application granted granted Critical
Publication of TWI342008B publication Critical patent/TWI342008B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Collating Specific Patterns (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Image Processing (AREA)
  • Telephone Function (AREA)
  • Lock And Its Accessories (AREA)
  • Devices For Checking Fares Or Tickets At Control Points (AREA)

Description

200828267 九、發明說明: 【發明所屬之技術領域】 本發明係關於一種個別聲音之驗證技術。 【先前技術】 已提出一種習知聲音驗證技術,該技術藉由將先前自已 授權使用者獲取之聲音(下文中稱作"參考聲音”或"登錄聲 音π)的特徵量與自待驗證之人(下文中稱作”受驗者")獲取 之聲音(下文中稱作’’樣本聲音”或”驗證聲音之特徵量之 間的距離與一臨限值進行比較來判定受驗者之真確性。專 利文獻日本專利申請案公告第2003-248661號描述一種組 態,其中根據驗證之目的或根據驗證之所需精確度水準來 改變臨限值。 圖8為用以評估聲音驗證之圖。圖8中之錯誤拒絕率 (False Rejection Rate,FRR)意謂即使一受驗者為一授權使 用者,該受驗者之真確性亦將在驗證期間被拒絕的可能性 (使用者拒絕率),且錯誤接受率(False Acceptance Rate, FAR)意謂即使受驗者並非授權使用者,該受驗者之真確性 亦將在驗證期間被接受之可能性(陌生人接受率)。如自圖8 可見,若將驗證中所使用之臨限值設定為圖8中之值na’’, 則拒絕未授權受驗者的可能性維持在一足夠高之水準,而 拒絕授權使用者之可能性得以充分降低。 然而,驗證聲音與登錄聲音之間的距離根據驗證期間產 生之環境聲響(下文中稱作’’樣本雜音”或”驗證雜音")而改 變,因為驗證雜音影響驗證聲音之特性。因此,圖8中之 I20166.doc 200828267 FRR及FAR中之每—者的曲線根據驗證雜音之特性而平行 於水平軸(距離)移動。舉例而言,絲由圖8中之實線所示 之FAR改為虛㈣,則錯誤接受陌生人的真確性之可能性 增加(亦即’驗證之精確度水準降低),且若將圖8中之舰 改為虛線L2,則拒絕授權使用者的真確性之可能性增加 (亦即’驗g之便利性降低)。亦即,習知聲音驗證之問題 ^驗證之«度與驗證之便利性之間的平衡根據驗證雜 曰之特性而被打破。 此問題甚至不可如在專利文獻日本專利申請案公告第 2〇03-248661號中藉由根據驗證之目的或所需精確度水準 而改變臨限值來解決。當以由行動電話代表之攜帶型電子 5又備執行驗證時此問題更為嚴重,因為驗證雜音之特性根 據電子設備的使用環境而以各種方式改變。 【發明内容】 已蓉於此等情形作出本發明,且本發明之一目標為解決 …關於樣本雜音而維持驗證之精確度與驗證的便利性之間 的平衡之問題。 ^解決以上問題,根據本發明之一態樣之聲音驗證裝置 w之HI析構件’其分析在受驗者產生用於受驗者的驗 I,本聲音或驗證聲音時在受驗者周圍產生之樣本雜音 設定構件(例如,圖ι中之設定器 —其根據由特性分析構件分析之驗證雜音之特性來設 疋弟一校正值(例如’圖1中之校正值Aa);校正構件,其 土;由第構件設定之第―校正值來校正指數值(例 120166.doc 200828267 如,圖1中之距離DO),該指數值指示先前已登錄之參考聲 音或登錄聲音的特徵量與自受驗者獲取之驗證聲音之特徵 量之間的相似程度;及判定器,其藉由將由校正構件校正 後之指數值與預定臨限值進行比較來判定受驗者之真確 性。 根據此態樣,在根據驗證雜音之特性校正指數值之後將 指示登錄聲音是否與驗證聲音類似之指數值與預定臨限值 • 進行比較,藉此無關於驗證雜音两維持驗證的便利性與驗 證之精確度之間的平衡。預定臨限值可為固定值或可變 值。 立在本發明之一較佳實施例中,第一設定構件根據驗證雜 音及登錄聲音與在登錄聲音之登錄期間產生之登錄雜音之 間的位準比率(例如,圖4中之位準比率en—sn)來判定第一 校正值,使得第一校正值設定為預定臨限值與一變數(例 如,圖4中之臨限值TH)之間的差,該變數係與驗證雜音之 • #性及登錄聲音與登錄雜音之間的位準比率相關聯而判 的。 ^ 牛例而δ,第—设^構件將第—校正值設定為預定臨限 - =^ &錄聲音與登錄雜音之間的位準比率而沿對應於驗 證雜音之特性之線或曲線變化的變數之間的差。 更特定言之,第—設定構件根據登錄聲音與登錄雜音之 間的位準比率及作為登錄聲音與登錄雜音之間的位準比率 與驗證聲音與驗證雜音間 曰心间的位準比率(例如,位準比率 V—SN)之間的位舉出輋| “ 半差(例如,圖4中之位準比率差 120166.d〇i 200828267 ⑽一SN1〜DIF_SN3)之驗證雜音之特性來設定第一校正 值。 =實施例可無關於登錄雜音或驗證雜音之特性而藉由簡 :处理來維持驗證之便利性與驗證的精確度之間的平衡。 :一設定構件可基於界定第-校正值與登錄聲音與登錄雜 二=位準比率及驗證雜音之特性(更特定言之,登錄 雜音之㈣位準比率與驗證聲音與驗證雜音之 =的位準比率之間的位準比率差)的關係之表來設定第一 一斗〜 曰由使用表不此等值之間的關係之等式進 订计异而設定第_未 粑攄炎έ # 。該表或該等式之内容可(例如) χ 使用者之指令而適當改變。 根據本發明之_ ^ / τ ^ ^ Λ鉍例之卑音驗證裝置進一步包含第二 U又疋構件(例如,圖1中 錄雜音之間的差(例如,S6t 根據驗證雜音與登 一—一 圖6中之相關值NOISE—DIF)來設定 :二校正值(例如’圖1中之校正值,,其中該校正構 件根據第-及第二校正值來校正指數值。 即^:貝^例’即使當在實際驗證期間登錄雜音(亦 即,參考雜音)與驗噔雜立 關性不同於在判定第一^正稽P ’樣本雜音)之間的實際相 係時所採用# ~ 校正值與登錄雜音及登錄聲音之關 你时所彳木用之登錄雜音盥 可基於根據實際驗證雜:二釺::間的原始相關性’亦 值來校正指數值,一 雜音之間的差之第二校正 精破声精此有效地維持驗證之便利性與驗證之 :驗:雜:的平衡。第二設定構件可基於界定第二校正值 ▲雜音與登錄雜音之間的差之關係之表來設定第二校 120166.doc 200828267 亦可藉由使用表示該關係的等式來進行計算而設 值。該表或該等式之内容可(例岣根據來自使 用者之指令而適當改變。 根據本發明之—實施例之聲音驗證裝置進 設定構件(例如,圖丨中之設定哭5 3弟二 驗说辣立& r x疋°。53)該弟二設定構件根據 驗迅耳日(亦即,樣本聲音)或登錄聲音(亦即,參考聲 的持績期間(例如,圖7中之語音長度EN—speech則或 v—spEECH_len)來設定第三校正值(例如,圖4之校正 =)’纟中該校正構件根據第—及第三校正值來校正指 數值。 根據此實施例’即使當登錄聲音或驗證聲音之語音長度 =續期間)不同於在判定第一校正值與登錄雜音及:: 耳曰之關係%所採用的語音長度時,亦可基於根據驗證聲 音或登錄聲音之第三校正值來校正指數值,藉此有效地維 持驗證之便利性與驗證之精確度之間的平衡。第三設定構 件可基於界定第三校正值與驗證聲音或登錄聲音之持續期 m的關係'之表來設定第三校正值,且亦可藉由使用表 不該關,之等式進行計算來設定第三校正值。該表或該等 式之内容可(例如)根據來自使用者之指令而適當改變。 用作用於判疋用以校正指數值之校正值之基礎的參數不 聲音或登錄聲音之持續期間及驗證雜音與登錄雜 曰之間的差。舉例而言,聲音驗證裝置可進一步包含根據 匕括於登錄聲音或驗證聲音中之有聲與無聲聲響之持續期 I㈣㈣來設定校正值之設定構件,或根據登錄聲音 120166.doc 200828267 或驗證聲音之音節之數目來設定校正值的設定構件。根據 如上所述之表或等式來判定校正值之組態或表或等式的内 容為可變之組態用於此等實施例中之任一者中。 本發明亦指定為一種控制根據以上實施例中之每一者之 聲音驗證裝置的聲音驗證方法。根據本發明之一實施例之 聲音驗證方法包含:分析在一受驗者產生一用於該受驗者 的驗證之驗證聲音時在該受驗者周圍產生之驗證雜音之特 性;根據驗證雜音之所分析特性設定校正值;基於所設定 校正值校正指數值,該指數值指示先前已登錄之登錄聲音 之特徵量與自受驗者獲取的驗證聲音之特徵量之間的相似 程度;及藉由將經校正之指數值與預定臨限值進行比較來 判定受驗者之真確性。此方法達成與根據本發明之聲音驗 證裝置之操作及優勢相同的操作及優勢。 根據以上實施例中之每一者之聲音驗證裝置藉由專用於 每一處理的諸如數位信號處理器(DSP)之硬體(電子電路)來 實施,且亦經由程式與諸如中央處理單元(CPU)之通用處 理單元之間的協作來實施。根據本發明之程式使得電腦執 行以下處理:特性分析處理,以分析在受驗者產生用於受 驗者之驗證的樣本聲音時在受驗者周圍產生之驗證雜音之 特性;設定處理,以根據在特性分析處理中所分析之驗證 雜音之特性來設定校正值;校正處理,以基於在設定處理 中設定之校正值來校正指數值,該指數值指示先前已登錄 之登錄聲音的特徵量與自受驗者獲取之驗證聲音之特徵量 之間的相似程度;及判定處理,以藉由將經校正之指數值 120166.doc -12- 200828267 與預定臨限值進行比較來判定受驗者之真確性。此程 達成與根據以上實施例中之每一者之聲音驗證裝置 及優勢相同之操作及優勢。本發明之程式係以儲存於如 CD-ROM之機器可讀取媒體或攜帶型記錄媒體中之形 提供至使用者且接著安裝於電腦上,且亦以在網路上2 布式方式自伺服器裝置提供且接著安裝於電腦上。为 【實施方式】 ❿ <A :聲音驗證裝置之組態> 圖1為說明根據本發明之實施例之聲音驗證裝置的㈣ 冗塊圖。聲音驗證裝置1GG為基於當受驗者說出特定^ :時f生之聲音來判定其真確性(亦即,判定受驗者是否 二先=已且錄之正式使用者)之設備。聲音驗證裝置1 ^於多種電子設備中,諸如行動電話或資訊處理設備。圖 所不之特性分析器2G、驗證器則校正值控制器可 κ施為(例如)由諸如CPU之處理單元執行之程式, 可由諸如DSP之硬體電路實施。儲存單元^可 之機器可讀媒體。 有^式
聲音驗證裝置⑽之操作分為初始登錄及驗證。初始登 、彔為在驗證之前登錄由授權使㈣W 的操作。驗證為藉由將登錄聲音與由受驗者說出之;;) (D驗^聲音)進行對比來判定受驗者之真確性的操作。操作 2 〇包括由使用者操縱之複數個操作器。使用者可藉由 2操縱操作單元10而命令聲音驗證裝置100開始勒始登 錄或驗證。 120166.doc 200828267 圖1中之輸入單元15及特性分析器2〇用以當執行驗證時 偵測驗證聲音或聲音驗證裝置_之環境雜音(驗證雜音)的 、f +且用以當如圖丨中之虛線R所示執行初始登錄時偵測 登錄聲音或聲音驗證裝置100之環境雜音(登錄雜音)的特 性。 輪入單元15為根據環境聲響(聲音及雜音)產生聲響信號 s。之聲響收集器。如圖2中所說明,聲響信號§分為未出聲 φ 區段P1及出聲區段P2。出聲區段P2為授權使用者在初始登 錄期間δ兄出登錄聲音之區段,或受驗者在驗證期間說出驗 也聲音之區段。另一方面,未出聲區段Ρ1為未說出登錄或 驗也聲音之區段。因為在安裝有聲音驗證裝置100之環境 中可產生多種雜音,所以未出聲區段Ρ1並非完全安靜(亦 即茸響^號S之振幅在未出聲區段P1中並非零),且輸入 單兀15在未出聲區段?1中收集登錄雜音或驗證雜音。 將由輸入單元15產生之聲響信號s提供至圖丨之特性分析 φ 态2〇。特性分析器20為用於分析由输入單元15收集之聲響 之構件。特性分析器2〇包括區段偵測器22、開關23、雜音 分析器25、聲音分析器26及特徵分析器28。區段债測㈣ • 將未出聲區段P1與出聲區段P2加以區分。舉例而言,區段 偵測器22將聲響信號s之振幅不連續增加或減少時之時間 偵測為未出聲區段P1與出聲區段p2之間的邊界。可使用多 種已知技術來將未出聲區段ρι與出聲區段p2加以區分。 開關23為用於初換由輸入單元15產生之聲響信號§之供 應目的地的構件。此允許將聲響信號S由區段偵測器22識 120166.doc -14- 200828267 別為未出聲區段P1之部分提供至雜音分析器25,且允許將 聲響信號S由區段偵測器22識別為出聲區段P2之部分提供 至聲音分析器26及特徵分析器28。 雜音分析器25為用於基於未出聲區段P1中之聲響信號s 來分析登錄雜音或驗證雜音之特性的構件。此實施例中之 雜音分析器25週期性地分析未出學區段p 1中之聲響信號s 的特性。當操縱操作單元1 〇以命令聲音驗證裝置1⑽開始 初始登錄或驗證時,雜音分析器25判定區段P(稱作偵測區 段)(該區段在所命令時間之前一預定時間開始且在所命令 時間結束)之經分析特性為如圖2中所示之登錄雜音或驗證 雜音的特性。在以下描述中,與登錄雜音或登錄聲音相關 聯之項目由包括,,登錄(enr〇ll)"<縮寫"EN"的符號表示,且 與驗證雜音或驗證聲音相關聯之項目由包括"驗證(verify)" 之縮寫” V”的符號表示。 如圖1中所示,此實施例中之雜音分析器25在執行初始 登錄時計算登錄雜音之頻率特性EN_NOISE_FC及雜音位 準EN—NOISE—LEVEL,且在執行驗證時計算驗證雜音之頻 率特性V^NOISEJFC及雜音位準V__NOISE_LEVEL。雜音 位準 EN—NOISE_LEVEL及 V—NOISE—LEVEL 中之每一者為 偵測區段P中之聲響信號S在未出聲區段P1中的分量中包括 於特定頻帶中之分量之量值(聲壓)的平均值。頻率特性 EN一NOISE—FC或V一NOISE一FC為表示將偵測區段P中之聲 響信號S所分為的複數個頻帶之分量之各別量值的資訊。 因此,雜音分析器25包括(例如)具有不同通頻帶之複數個 120166.doc -15· 200828267 帶通濾波器(濾波器組)。頻率特性en_noise_fc及 V_NOISE_FC之資訊僅需要反映登錄雜音或驗證雜音之特 性。舉例而言,雜音分析器25可為用於藉由諸如快速傅立 葉變換(FFT)之頻率分析來計算頻譜以作為頻率特性 EN_NOISE_F(^V_NOISE_FC之構件。 聲音分析器26基於出聲區段P2中之聲響信號S來分析登 錄聲音或驗證聲音之特性。此實施例中之聲音分析器26在 執行初始登錄時計算登錄聲音之語音位準 EN—SPEECH_LEVEL及語音長度(或持續期間)EN— SPEECH JLEN,且在執行驗證時計算驗證聲音的語音位準 V一SPEECH_LEVEL 及語音長度 V_SPEECH_LEN 〇 語音位 準 EN^SPEECH—LEVEU V_SPEECH_LEVEL 中之每一者為 包括於出聲區段P2中的聲響信號S中之特定頻帶中的分量 之量值的平均值。語音長度EN_SPEECH_LEN及 V—SPEECH—LEN中之每一者表示出聲區段P2之持續期間 (亦即,語音持續之時段)。自聲響信號S之振幅快速增加 時之時間(其對應於出聲區段P2之開始)至聲響信號S的振 幅快速減少時之時間(其對應於出聲區段P2之結束)之時段 被偵測為語音長度EN_SPEECHLLEN及V—SPEECH—LEN。 特徵分析器28為用於分析登錄聲音或驗證聲音之特徵之 構件。此實施例中之特徵分析器28在執行初始登錄時計算 登錄聲音之特徵量EN_DATA,且在執行驗證時計算驗證聲 音的特徵量V_DATA。特徵量EN_DATA& V_D ATA中之每 一者為自出聲區段P2中之聲響信號S計算的倒譜之向量之 120166.doc •16- 200828267 時序(time-series)。因此,用於執行包括頻率分析(例如, FFT方法)之多種計算之構件較佳用作特徵分析器28。 儲存設備32為用於儲存驗證中所使用之多種資訊之構 件。舉例而言,如圖1中所示,儲存設備32將特性分析器 20指定用於登錄聲音及登錄雜音之多種資訊儲存為驗證辭 典。更特定言之,由雜音分析器25指定之頻率特性 EN一NOISE—FC及雜音位準EN—NOISE—LEVEL、由聲音分 析器26指定之語音位準EN_SPEECH_LEVEL及語音長度 ENJPEECHJLEN,及由特徵分析器28指定的特徵量 EN_DΑΤΑ在執行驗證之前儲存於儲存設備32中。儲存設備 32可為固定至聲音驗證裝置1〇〇之設備,且亦可為可拆卸 地附接至聲音驗證裝置1〇〇之攜帶型設備(記憶體)。 驗證器40為用於藉由將驗證聲音與登錄聲音進行對比來 判定受驗者之真確性之構件。驗證器40包括距離計算器 42、校正器44及判定器46。距離計算器42計算儲存於儲存 設備32中之特徵量EN^DATA與特徵分析器28針對驗證聲音 產生之特徵量V_DATA之間的距離D0。距離計算器42使用 諸如計算特徵量EN_DATA& V_DATA之向量序列之間的正 規化距離之DP匹配之多種圖案匹配技術來計算距離D0。 隨著距離D0減小,驗證聲音與登錄聲音更類似(亦即,受 驗者更可能為一授權使用者)。 校正器44為用於基於校正值A(Aa、Ab及Ac)1來校正由距 i 離計算器42計算出之距離DO之構件。在此實施例中,校正 器44藉由自距離D0減去由校正值控制器50設定之每一校正 120166.doc -17- 200828267 值Aa、Ab及Ac來計算經校正的距離D1。 判定器46藉由將由校正器44校正之距離D1與臨限值ΤΗ0 進行比較來判定受驗者之真確性。更特定言之,若距離D1 低於臨限值ΤΉ0(亦即,若登錄聲音與驗證聲音類似),則 判定器46接受受驗者之真確性,且若距離D1高於臨限值 ΤΗ0(亦即,若登錄聲音不同於驗證聲音),則判定器46拒 ’ 絕受驗者之真確性。臨限值ΤΉ0為預定的固定值。判定器 46之判定結果經由輸出單元60輸出。舉例而言,輸出指示 • 驗證結果之影像之顯示器或輸出指示驗證結果的聲響之音 訊輸出設備較佳用作輸出單元60。 校正值控制器50為用於設定在校正器44之校正中使用之 校正值A(Aa、Ab及Ac)的構件。校正值控制器50包括設定 器51、52及53。設定器51基於特性分析器20在初始登錄及 驗證期間所產生之資訊來設定校正值Aa。設定器52根據驗 證雜音之特性與登錄雜音之特性之間的差來設定校正值 0 Ab。設定器53根據初始登錄期間的語音長度 EN一SPEECH__LEN來設定校正值Ac 〇稍後將描述校正值控 制器5 0之操作之細節。圖1中之儲存單元3 5儲存校正值控 制器50用以設定校正值A之表。儲存設備32中之特定儲存 • 區域可用作儲存單元35。 <B :聲音驗證裝置之操作> - 現將描述聲音,驗證裝置100之詳細操作,集中於校正值 控制器50在驗證期間設定校正值Aa、Ab及Ac之過程。每 次有必要進行驗證時,校正值控制器50執行圖3之過程。 120166.doc • 18 - 200828267 驗證變得必要時之實例包括當包括聲音驗證裝置100之電 子設備隨著施加電力而開始操作時’及當電子設備開始特 定操作(例如,存取特定資訊之操作)時。當起始驗證時, 受驗者在藉由操縱操作單元1 〇而發出語音啟動指令之後向 輸入單元15說出特定詞語。雜音分析器25自結束於操縱操 作單元10時之偵測區段P中的聲響信號S指定頻率特性 V_NOISE_FC及雜音位準V_NOISE_LEVEL,且自緊接偵 測區段P之出聲區段P2中之聲響信號S指定語音位準 V—SPEECH—LEVEL及語音長度 V_SPEECH—LEN。 如圖3中所示,校正值控制器50計算登錄聲音與登錄雜 音之間的位準比率EN_SN(步驟S10)。位準比率EN_SN為 儲存設備32中儲存之語音位準EN_SPEECH—LEVEL與雜音 位準ΕΝ—NOISE—LEVEL之間的比率。舉例而言,使用等式 (1)來計算位準比率EN_SN。 EN一SN=log(EN一SPEECHJLEVEL/EN—NOISE—LEVEL)……(1) 接著,校正值控制器50計算驗證聲音與驗證雜音之間的 位準比率乂』]^(步驟S11)。位準比為自雜音分析器 25提供之雜音位準V—NOISE—LEVEL與自聲音分析器26提 供之語音位準V_SPEECH_LEVEL之間的比率。與位準比 率EN—SN類似,使用等式(2)來計算位準比率V—SN。 V—SN=log(V—SPEECH—LEVEW—N0ISE—LEVEL)……(2) 接下來,在步驟S12,校正值控制器50計算在步驟810計 算出的初始登錄中之位準比率EN_SN與在步驟S11計,算出 之驗證中之位準比率V__SN之間的差DIF_SN(DIF__SN= 120166.doc -19- 200828267 V—SN-EN—SN)。在下文中,差DIF—SN將稱作"位準比率 差’’。校正值控制器50計算表示登錄雜音之特性與驗證雜 音之特性之間的相關性之相關值NOISEJ3IF(步驟S 13)。此 處,舉例而言,相關性為登錄雜音與驗證雜音之各別波譜 形狀是否類似。舉例而言,使用等式(3)來計算相關值 NOISEJDIF。
L ΥΧΕΝ _MAG{})-EN _MAG _AVEjy _MAGi})-V __MAG _AVE) NOISE _ DIF = . /=M -- :.=.-…:_..厂丄.....
^(EN_mG(〇-EN_mG_AVE)\^(V_MAG(i)-V_mG_AFE)2 V/=M V/=M ...... ( 3 ) 等式(3)中之值EN_MAG(i)為複數個頻帶中由變數i指定 之頻帶中的登錄雜音之量值,且自值EN_MAG(i)減去之值 EN_MAG_AVG為由變數i指定之頻帶中的登錄雜音之量值 之平均值。類似地,等式(3)中之值V_MAG(i)為由變數i指 定之頻帶中的驗證雜音之量值,且自減去之 值VJMAG—AVG為該頻帶中的驗證雜音之量值之平均值。 因此,若登錄雜音與驗證雜音完全匹配,則校正值 NOISE—DIF為1,且校正值NOISE—DIF隨著兩個雜音之特 性之間的差增加而減少(-1SNOISE—DIFS1)。 接著,校正值控制器50之設定器51基於在步驟S10計算 出之位準比率EN_SN及在步驟S12計算出之位準比率差 DIF_SN來設定校正值Aa(步驟S14)。校正值Aa與位準比率 EN_SN及位準比率差DIF_SN之關係以以下方式來判定。 首先,吾人考慮根據由距離計算器42計算出之距離D0大 於還是小於臨限值TH來判定受驗者之真確性之狀況。藉 I20166.doc -20- 200828267 由進行测試,此申請案之發明者已發現,用於將驗證之精 確度維持在一高水準的臨限值TH滿足與位準比率EN_SN 及位準比率差DIF__SN之特定關係。更特定言之,如圖4中 所示,臨限值TH經設定使得對於位準比率EN_SN(其為登 錄雜音與登錄聲音之間的比率)之值改變為一新值且接著 對水平軸上之每一相應位準比率EN_SN繪製垂直轴上之臨 限值TH的每一狀況,驗證之精確度滿足一特定條件(例 如,使得FRR及FAR各低於一特定位準)。當對所繪製之點 進行統計處理時,其傾向於根據位準比率差DIF_SN而沿 一線分布。舉例而言,當將位準比率差DIF_SN設定為值 DIF_SN 1時,滿足所要條件之臨限值TH隨位準比率EN—SN 而沿一具有諸如對應於值DIF—SN1之梯度及截距的屬性之 線改變。另外,如圖4中所示,用於將驗證精確度維持在 一所要水準之臨限值TH隨著位準比率EN__SN或位準比率 差 DIF__SN(DIF—SN1>DIF—SN2>DIF—SN3)增加而增加。 因此,若針對在步驟S10計算出之位準比率EN_SN來設 定臨限值TH以使得臨限值TH及位準比率EN_SN滿足對應 於一在步驟S12計算出之位準比率差DIF_SN的線之關係, 則可將驗證維持在一所要精確度水準。舉例而言,在位準 比率EN_SN計算為圖4中之值SNa之狀況下,若位準比率差 DIF_SN為DIF_SN1,則將臨限值TH設定為THa,且若位準 比率差DIF_SN為DIF_SN2,則將臨限值TH設定為THb。 因為距離大於還是小於臨限值係在驗證期間判定,所以 用於將待與距離D0比較之臨限值TH改變一特定值之處理 120166.doc -21- 200828267 等效於用於在臨限值ΤΗ固定為ΤΗ0的情形下將距離DO校正 特定值Aa之處理。因此,此實施例之設定器5 1將預定臨限 值TH0與臨限值ΤΉ之間的差設定為校正值Aa,臨限值TH 與位準比率EN_SN滿足一對應於位準比率差DIFJN之線 之關係。亦即,舉例而言,當位準比率EN_SN在步驟S10 計算為值SNa(如圖4中所示)時,若位準比率差DIF__SN在步 驟S12計算為DIF_SN1,則臨限值TH0與值THa之間的差al 設定為校正值Aa,且若位準比率差DIF_SN在步驟S12計算 為DIF—SN2,則臨限值ΤΉ0與值THb之間的差a2設定為校 正值Aa。藉由自距離DO減去以此方式定之校正值Aa而 計算出之距離D1在判定器46處與臨限值TH0進行比較;,藉
J 此將此實施例的驗證維持在所要精確度水準。
更特定言之,此實施例之設定器5 1基於已建立以滿足以 上條件之表來自位準比率EN_SN及位準比率差DIF_SN判 定校正值Aa。圖5為說明在步驟S14使用之表之内容之示意 圖。如圖5中所示,對應於不同位準比率差DIF_SN (DIF—SN1、DIF—SN2、DIF—SN3......)之複數個表儲存於儲 存單元35中。在每一表中,每一位準比率EN_SN與滿足圖 4之與位準比率EN_SN之關係的相應校正值Aa相關聯。亦 即,在對應於位準比率差DIF_SN之表中,每一位準比率 EN_SN與一相應校正值4a相關聯,使得藉由將校正值Aa 與臨限值ΤΗ0相加獲取之臨限值ΤΗ與位準比率EN_SN具有 一對應於位準比率差DIF_SN的線之關係。 , 在步驟S14,設定器51搜尋對應於在步驟S12計算出之位 120166.doc -22 200828267 準比率差DIF_SN之表,且將對應於包括於所擷取表中之 在步驟S10計算出之位準比率EN_SN的校正值Aa輸出至校 正器44。若不存在對應於在步驟S12計算出之位準比率差 DIF_SN之表,則設定器51根據來自對應於先於及緊隨所 計算的位準比率差DIF_SN之位準比率差DIF_SN之表的位 準比率EN—SN來指定校正值Aa,且藉由在所指定之校正值 Aa之間内插來計算一校正值Aa,該校正值Aa實際上待應 用於校正器44之校正。因此,舉例而言,若位準比率差 DIF_SN在步驟S12計算為圖2之值DIF__SN1與值DIF_SN2之 平均數,則校正值Aa計算為對應於值DIF_SN1的校正值 Aa(值al)與對應於值DIF—SN2之校正值Aa(值a2)之平均 數。 然而,臨限值TH與位準比率EN_SN及位準比率差 DIF_SN之關係係(例如)在登錄雜音之特性與驗證雜音之特 性一致的假設下判定。然而,在許多狀況下,登錄雜音之 特性不同於驗證雜音之特性。因此,設定器52根據登錄雜 音與驗證雜音之間的相關值NOISE_DIF來計算校正值Ab以 校正距離D0(步驟S15)。校正器44’自距離D0減去校正值 Ab。 圖6為說明相關值NOISE JDIF與校正值Ab之間的關係之 圖。使用等式(3)計算出之相關值NOISEJ3IF根據登錄雜音 與驗證雜音之間的相關性而在”-1”至"1Π之範圍内變化。當 兩個雜音之特性完全 < 致時,相關值NOISE_DIF為"1”。 若登錄雜音與驗證雜音之間的關係等效於在判定圖4之關 120166.doc -23- 200828267 係時的關係(若兩個雜音在此實施例中一致),則無需根據 相關值NOISE—DIF來校正距離D0。當登錄雜音與驗證雜音 之間的關係與判定圖4之關係時的關係差別較大時,必須 更大地校正距離D0。因此,當相關值NOISE_DIF為π 1" 時,設定器52將校正值Ab設定為零(亦即,未校正距離 D0),且設定器52隨著相關值NOISE-DIF減小至”P以下而 將校正值Ab設定為較高。更特定言之,儲存單元35¼存一 表,其中每一相關值NOISE—DIF與一相應校正值Aa(其滿 足與相關值NOISE_DIF之此關係)相關聯,且設定器52基 於此表判定校正值Ab。 另外,圖4中所示之臨限值TH與位準比率EN_SN及位準 比率差DIF_SN之關係係(例如)基於在特定持續期間(時 長)L0期間連續說出登錄聲音時所收集的資料而判定。然 而,實際初始登錄中之登錄聲音之語音長度EN— SPEECHJLEN係不同的。因此,設定器53根據語音長k EN—SPEECH—LEN來計算校正值Ac以校正距離DO(步'驟 S16)。校正器44自距離D0減去校正值Ac。
圖7為展示語音長度EN_SPEECH_LEN與校正值Ac之間 的關係之圖。若判定圖4之關係時語音長度EN_SPEECH_ LEN與持續期間L0 —致,則無需根據語音長度EN_ SPEECH-LEN來校正距離DO。因此,若儲存單元32中儲存 之語音長度EN—SPEECH—LEN與持續期間L0 —致,則設定 器53將校正值Ac設定為”0”。隨著語音長度EN_SPEECH_ LEN增加,登錄聲音之語音更穩定,使得特徵量en_DATA 120166.doc -24· 200828267 更可靠地反映授權使用者之固有的基本特性,藉此增加距 離D0的精確度。因此,即使相對於距離D0降低臨限值ΤΗ0 以便減少接受陌生人之真確性之可能性,亦不會不當地增 加拒絕授權使用者之可能性。 因此’若語音長度EN_SPEECH_LEN大於持續期間L0, 則設定器53根據語音長度EN_SPEECH_LEN而選擇負值作 為校正值Ac。因為校正器44自距離D0減去校正值Ac,所 以若校正值Ac為負,則經校正之距離D1大於距離D0。亦 即,因為臨限值ΤΗ0相對於距離D0減小,所以錯誤地接受 陌生人之真確性之可能性得以減小。相反,若語音長度 EN-SPEECHJLEN小於持續期間L0,則設定器53根據語音 長度EN—SPEECH JLEN而選擇正值作為校正值Ac。舉例而 言,設定器53基於每一語音長度EN_SPEECH—LEN與相應 校正值Ac相關聯之表來判定校正值Ac。 如上所述,在此實施例中,無關,於驗證雜音或登錄雜音 之特性,可將驗證維持在一所要精確度水準,因為距離D0 係根據驗證雜音與驗證聲音(V_SN)之間的關係或登錄雜音 與登錄聲音(EN—SN)之間的關係來校正。亦即,驗證之便 利性之增加(FRR之減少)及驗證的精確度之增加(FAR之減 少)皆可在不受驗證雜音或登錄雜音影響之情形下達成。 在此實施例中,尤其校正值Aa係基於滿足所要條件之臨 限值TH與位準比率EN_SN成一對應於位準比率差DIF_SN 之線的關係之認知來調整。因此,此實施例之優勢為有可 能以高精確度指定最佳校正值Aa,同時充分減少設定校正 120166.doc •25· 200828267 值Aa所需之變數之數目。亦有可能藉由充分考慮初始登錄 或驗證時聲音驗證裝置100之環境來實現高度精確的驗 證,因為距離D0係根據相關值NOISE_DIF或語音長度 EN_SPEECH_LEN來校正。 <C :經修改實施例> 以上實施例可以各種方式修改。以下說明特定經修改實 施例。以下經修改實施例之適當組合亦為可能的。 (1) 經修改實施例1 儘管在以上實施例中所說明之組態使用儲存於儲存單元 35中之表,但藉由使用預定等式的計算方法計算校正值 A(Aa、Ab及Ac)之組態亦為可能的。舉例而言,儲存單元 35儲存分別表示根據位準比率差(DIF_SN)之線(亦即,圖4 之線,每一者界定位準比率EN_SN與臨限值TH之間的關 係)之複數個公式,且設定器51藉由將在步驟S10計算出之 位準比率EN_SN代入等式而,根據在步驟S12計算出的位準 比率差DIF_SN來計算臨限值TH,且藉由自所計算之臨限 值TH減去臨限值ΤΗ0來計算枝正值Aa。此實例Φ使用設定 器52基於表示校正值NOISE_DIF與校正值Ab之間的關係之 等式來計算校正值Ab之組態,或設定器53基於表示語音長 度EN—SPEECH—LEN與校正值Ac之間的關係之等式來計算 校正值Ac之組態。 — ) (2) 經修改實施例2 判定將距離D0校正至何程度之變數不限於校正值 NOISE—DIF及語音長度EN—SPEECH—LEN。舉例而言,可 120166.doc -26- 200828267 替代或結合根據語音長度EN_SPEECH_LEN設定校正值Ab 之組態來使用根據驗證聲音之語音長度V_SPEECH_LEN來 計算校正值Ab的組態或根據語音長度EN_SPEECH_LEN與 語音長度V-SPEECH—LEN之平均值來計算校正值Ab之組 態。舉例而言,校正值Ab經設定使得經校正之距離D1隨 著語音長度V_SPEECHJLEN增加而增加,此類似於校正值 Ab與語音長度EN_SPEECH—LEN之間的關係。 亦使用校正值控制器50基於除以上所述之變數以外之變 數來判定每一校正值的組態。舉例而言,可根據包括於登 錄聲音或驗證聲音中之有聲聲響與無聲聲響之持續期間之 間的比率來設定每一校正值(在出聲區段P2中)。隨著有聲 聲響之比率增加,特徵量EN_DATAi V_DATA之值更可靠 地反映說話者的特性,藉此增加距離D0之精確度。因此, 即使距離D1自距離D0增加,FRR亦不會不當地增加。因 此’使用每一校正值經設定使得距離D1隨著登錄聲音或驗 證聲音中之有聲聲響之比率增加而增加的組態。另外,亦 可使用每一校正值經設定使得距離D1隨著登錄聲音或驗證 聲音之音節之數目增加而增加的組態,因為距離D0之精確 度P通者登錄聲音或驗證聲普之音節的數目增加而增加。 (3)經修改實施例3 亦使用變數與校正值之間的關係為可變之組態。舉例而 言’可提供藉由根據操作單元1〇之操縱更新表來改變校正 值Aa與位準比率EN-SN或位準比率差DIF_SN之關係的組 態。類似地,可根據操作單元1〇之操縱來修改對應於相關 120166.doc -27- 200828267 值NOISE—DIF之校正值Ab或對應於語音長度EN_ SPEECH 一 LEN的校正值Ae 〇此等組態可根據使用者之需要 而達成驗證。在藉由如經修改實施例1中所說明之等式的 計算來計算校正值A(Aa、Ab及Ac)之組態中,可根據操作 單元10之操縱來修改該等等式中之每一者的内容(例如, 變數之係數)。 • (4)經修改實施例4 儘管以上實施例中所說明之組態在驗證中使用距離 • D0(經校正之距離D1),但指示登錄聲音與驗證聲音之間的 相似性之值不限於距離D0。舉例而言,使用基於任何變數 (亦即,任何指數值)執行驗證之組態,該變數之值隨著登 錄聲音的特性與驗證聲音之特性彼此接近而增加。在此組 態中,與以上實施例相比,校正值A(Aa、Ab及Ac)根據每 一變數之增加或減小反轉。舉例而言,與圖4之組態相 反,此組態中之校正值Aa隨著位準比率EN_SN增加而減 • 小。 (5)經修改實施例5 儘管在以上實施例中所說明之組態中將三種類型之校正 值Aa、Ab及Ac個別地輸出至校正器44,但亦可使用校正 值控制器50輸出校正值Aa、Ab與Ac的總和之組態。另 外,可適當地修改校正器44校正距離D0之計算操作。舉例 而言,使用校正器44將每一校正值A(Aa、Ab及Ac)與距離 DO相加或將距離DO乘以每一校正值A(Aa、Ab及Ac)之組 態。在藉由將每一校正值A與距離DO相加來計算D1之組態 120166.doc -28 - 200828267 / 中,與圖1的組態相比,每一校正值A之正負號反轉。 (6)經修改實施例6 儘管以上實施例中所說明之組態將預定臨限值TH0與隨 位準比率EN_SN線性變化之變數(臨限值)TH之間的差計算 為校正值Aa,但可適當地改變位準比率EN一SN與臨限值 ΤΗ之間的關係。舉例而言,此經修改實施例使用一組 • 態,其中根據位準比率EN_SN及位準比率差DIF一SN來指 定臨限值TH,以使得位準比率EN_SN及臨限值TH滿足對 _ 應於位準比率差DIF_SN之曲線的關係(亦即’使得臨限值 ΤΉ隨著位準比率EN—SN而沿對應於位準比率差DIF一SN之 曲線改變),且臨限值TH與臨限值ΤΗ0之間的差判定為校 正值Aa。其將足以設定臨限值TH使得臨限值TH與位準比 率EN_SN如上所述根據驗證雜音而具有不同關係(通常, 根據位準比率差DIF_SN而成線性或曲線關係)。舉例而 言,根據導出位準比率EN_SN與對應於一位準比率差 ^ DIFJN之臨限值TH之間的關係之測試之結果或根據對該 測試結果的統計處理結果來適當地改變此等變數之間的特 定關係。因此,本發明之一較佳實施例中之校正值Aa判定 為預定臨限值ΤΗ0與臨限值TH之間的差,臨限值TH根據 ‘ 驗證雜音滿足與位準比率ENJN之關係。 (7)經修改實施例7 .. 儘管在以上實施例中說明聲音驗證裝置100用以區分授 權使用者與陌生人之狀況,但根據以上實施例之聲音驗證 裝置100亦可用於聲音密碼驗證,其判定由驗證聲音指定 120166.doc -29· 200828267 的密碼是否匹配先前基於授權使用者之語音而登錄之密 碼。 【圖式簡單說明】 圖1為說明根據本發明之一實施例之聲音驗證裝置的組 態之方塊圖。 圖2為由輸入單元產生之聲響信號之波形圖。 圖3為說明由校正值控制器執行之程序之流程圖。 圖4為說明校正值Aa與位準比率EN_SN及位準比率差 DIF_SN之關係之圖。 圖5為說明用以判定校正值Aa之表之内容之示意圖。 圖6為說明相關值NOISE_DIF與校正值Ab之間的關係之 圖。 圖7為說明語音長度EN_SPEECH_LEN與校正值Ac之間 的關係之圖。 圖8為說明臨限值與FAR及FRR之關係之圖。 【主要元件符號說明】 10 操作單元 15 輸入單元 20 特性分析器 22 區段偵測器 23 開關 25 雜音分析器 26 聲音分析器 28 特徵分析器 120166.doc - 30 - 200828267 32 儲存設備 35 儲存單元 40 驗證器 42 距離計算器 44 校正器 46 判定器 50 校正值控制器 51 設定器 52 設定器 53 設定器 60 輸出單元 100 聲音驗證裝置 Aa 校正值 Ab 校正值 Ac 校正值 D〇 距離 〇! 距離 L〇 持續期間 L! 虛線 l2 虛線 P 偵測區段 PI 未出聲區段 P2 出聲區段 R 虛線 120166.doc -31 - 200828267 S 聲響信號 TH〇 臨限值 馨 120166.doc -32-

Claims (1)

  1. 200828267 十、申請專利範圍: L 一種聲音驗證裝置,其包含: 特性分析構件,其分析一受驗者產生—用於該受驗者 之驗證之樣本聲音時在該受驗者周圍產生的一樣本雜音 之特性; 第一設定構件,其根據經該特性分析構件分析之該樣 本雜音之該等特性來設定一第一校正值;
    权正構件,其基於由該第一設定構件所設定之該第一 =正值來校正-指數值,該指數值指示先前已登錄之一 參考聲音的一特徵量與自該受驗者獲取之該樣本聲音之 特欲Ϊ之間的一相似程度;及 ,、精由將該由該校正構件校正之指數值與 預疋臨限值進行比較來判定該受驗者之真確性。 2 項1之聲音驗證裝置’其中該第—設定構件根據 “ #音之該等特性及該參考聲音與—在 :=== 考雜… 預定臨限值與-變數^使㈣弟—校正值設定為該 音之心 數之間的一i,該變數係與該樣本雜 比率相關聯而決定。參考雜音之間的該位準 3·如請求項2之聲音 # 第_於 也其中該第一設定構件將該 該變數隨著定臨限值與該變數之間的該差, 而沿—對^9與該參考雜音之間的該位準比率 μ於4樣本雜音之該等特性之線或曲線變化。 120166.doc 200828267 4·如睛求項2或3之聲音驗證裝置,发 據該參考簦立血兮4 土祕* /、Y孩弟一設定構件根 ^考耳曰與該參考雜音之間的該位 雜音之兮' 發士 L L 士 年及^該樣本 «之該等特性來設定該第一校正 # M tu ^ ^ ^ 該樣本雜音之該 4特i·生係作為該參考聲音與該參 率另诗接丄你 、隹曰之間的該位準比 ^樣本聲音與該樣本雜音 -位準比率差。 卒食曰之間的-位準比率之間的 步包含第二設定構 與該參考雜音之間 5.如請求項2之聲音驗證裝置,其進一
    件,該第二設定構件根據該樣本雜音 的一差來設定一第二校正值, 二校正值來 其中該校正構件根據該第一校正值及該第 校正該指數值。 &如請求们之聲音驗證裝置,其進—步包含第三設定構 件忒第一 σ又疋構件根據該樣本聲音或該參考聲音之一 持續期間來設定一第三校正值, 〃中該ic正構件根據该第_校正值及該第三校正值來 校正該指數值。 7· —種聲音驗證方法,其包含·· 分析在一受驗者產生一用於該受驗者之驗證之樣本聲 音時在該受驗者周圍產生的一樣本雜音之特性; 根據該樣本雜音之該等分析後之特性設定一校正值; 基於該所設定校正值校正一指數值,該指數值指示先 Μ已登錄之一參考聲音之一特徵量與自該受驗者獲取的 該樣本聲音之一特徵量之間的一相似程度;及 藉由將該經校正指數值與一預定臨限值進行比較來判 120166.doc -2. 200828267 定該受驗者之真確性。 8· -種用於-電腦中之機器可讀媒體,該媒體含有可由該 電腦執行以執行以下處理之程式指令·· :特性分析處理,其分析在驗者產生—用於該受 =之魏之樣本聲㈣在該受驗者肖目 雜音之特性; 银+ 樣本=處理/其根據在該特性分析處理巾分析後之該 7 -曰之該等特性來設定一校正值; 正處理’其基於該在該設定處理中所設定之該校 者辣:父正一指數值,該指數值指示先前已登錄之-參 曰的特妓量與自該受驗者獲取之該樣本聲音之一 特徵量之間的一相似程度;及 判疋處理,其藉由將該經校正指數值與一預定臨限 進灯比#父來判定該受驗者之真確性。
    120166.doc
TW096131267A 2006-09-14 2007-08-23 Voice authentication apparatus TWI342008B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006249160A JP5151102B2 (ja) 2006-09-14 2006-09-14 音声認証装置、音声認証方法およびプログラム

Publications (2)

Publication Number Publication Date
TW200828267A true TW200828267A (en) 2008-07-01
TWI342008B TWI342008B (en) 2011-05-11

Family

ID=38830359

Family Applications (1)

Application Number Title Priority Date Filing Date
TW096131267A TWI342008B (en) 2006-09-14 2007-08-23 Voice authentication apparatus

Country Status (8)

Country Link
US (1) US8694314B2 (zh)
EP (1) EP1901285B1 (zh)
JP (1) JP5151102B2 (zh)
KR (1) KR100929958B1 (zh)
CN (1) CN101145342B (zh)
AT (1) ATE441176T1 (zh)
DE (1) DE602007002132D1 (zh)
TW (1) TWI342008B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8849199B2 (en) * 2010-11-30 2014-09-30 Cox Communications, Inc. Systems and methods for customizing broadband content based upon passive presence detection of users
WO2012093393A1 (en) * 2011-01-07 2012-07-12 Seal Mobile Id Ltd Method and system for unobtrusive mobile device user recognition
JP5782810B2 (ja) * 2011-04-22 2015-09-24 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US8949958B1 (en) * 2011-08-25 2015-02-03 Amazon Technologies, Inc. Authentication using media fingerprinting
CA2932273C (en) * 2013-12-06 2022-08-30 Adt Us Holdings, Inc. Voice activated application for mobile devices
US9734682B2 (en) 2015-03-02 2017-08-15 Enovate Medical, Llc Asset management using an asset tag device
US20160302210A1 (en) * 2015-04-10 2016-10-13 Enovate Medical, Llc Communication hub and repeaters
US10614813B2 (en) * 2016-11-04 2020-04-07 Intellisist, Inc. System and method for performing caller identity verification using multi-step voice analysis
US10579814B2 (en) * 2017-10-30 2020-03-03 International Business Machines Corporation Monitoring and preventing unauthorized data access
CN109636937A (zh) * 2018-12-18 2019-04-16 深圳市沃特沃德股份有限公司 语音考勤方法、装置及终端设备
EP4328903A1 (en) 2021-05-28 2024-02-28 Panasonic Intellectual Property Corporation of America Voice recognition device, voice recognition method, and voice recognition program
WO2023182014A1 (ja) * 2022-03-22 2023-09-28 パナソニックIpマネジメント株式会社 音声認証装置および音声認証方法

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6006175A (en) 1996-02-06 1999-12-21 The Regents Of The University Of California Methods and apparatus for non-acoustic speech characterization and recognition
JPH1055194A (ja) * 1996-08-08 1998-02-24 Sanyo Electric Co Ltd 音声制御装置と音声制御方法
US6466906B2 (en) * 1999-01-06 2002-10-15 Dspc Technologies Ltd. Noise padding and normalization in dynamic time warping
GB2349259B (en) * 1999-04-23 2003-11-12 Canon Kk Speech processing apparatus and method
JP2001021309A (ja) 1999-07-12 2001-01-26 Toshiba Tec Corp 個体認証方法及び個人認証方法
US7117149B1 (en) * 1999-08-30 2006-10-03 Harman Becker Automotive Systems-Wavemakers, Inc. Sound source classification
JP3648202B2 (ja) 1999-10-12 2005-05-18 国立大学法人 北海道大学 無線受信システム
TW521266B (en) 2000-07-13 2003-02-21 Verbaltek Inc Perceptual phonetic feature speech recognition system and method
JP2002236665A (ja) * 2001-02-09 2002-08-23 Matsushita Electric Ind Co Ltd 個人認証装置
US7277853B1 (en) * 2001-03-02 2007-10-02 Mindspeed Technologies, Inc. System and method for a endpoint detection of speech for improved speech recognition in noisy environments
US20030033143A1 (en) * 2001-08-13 2003-02-13 Hagai Aronowitz Decreasing noise sensitivity in speech processing under adverse conditions
JP2003248661A (ja) 2002-02-25 2003-09-05 Sony Corp 認証処理装置および認証処理方法、情報処理装置および情報処理方法、認証処理システム、記録媒体、並びにプログラム
JP2003308091A (ja) 2002-04-17 2003-10-31 Pioneer Electronic Corp 音声認識装置、音声認識方法および音声認識プログラム
JP4212825B2 (ja) * 2002-04-19 2009-01-21 株式会社アプコット 個人認証方法とその装置、及び個人認証システム
CN1453767A (zh) 2002-04-26 2003-11-05 日本先锋公司 语音识别装置以及语音识别方法
US20030236663A1 (en) * 2002-06-19 2003-12-25 Koninklijke Philips Electronics N.V. Mega speaker identification (ID) system and corresponding methods therefor
TWI225640B (en) 2002-06-28 2004-12-21 Samsung Electronics Co Ltd Voice recognition device, observation probability calculating device, complex fast fourier transform calculation device and method, cache device, and method of controlling the cache device
JP3926242B2 (ja) * 2002-09-19 2007-06-06 富士通株式会社 音声対話システム、音声対話のためのプログラムおよび音声対話方法
US20040186724A1 (en) * 2003-03-19 2004-09-23 Philippe Morin Hands-free speaker verification system relying on efficient management of accuracy risk and user convenience
JP2004325897A (ja) 2003-04-25 2004-11-18 Pioneer Electronic Corp 音声認識装置及び音声認識方法
CN1802694A (zh) * 2003-05-08 2006-07-12 语音信号科技公司 信噪比中介的语音识别算法
JP4548646B2 (ja) * 2003-09-12 2010-09-22 株式会社エヌ・ティ・ティ・ドコモ 音声モデルの雑音適応化システム、雑音適応化方法、及び、音声認識雑音適応化プログラム
TWI242729B (en) 2004-01-16 2005-11-01 Micro Star Int Co Ltd Speech database establishment and recognition method and system thereof
US8340309B2 (en) * 2004-08-06 2012-12-25 Aliphcom, Inc. Noise suppressing multi-microphone headset
TWI269268B (en) 2005-01-24 2006-12-21 Delta Electronics Inc Speech recognizing method and system
JP4670483B2 (ja) * 2005-05-31 2011-04-13 日本電気株式会社 雑音抑圧の方法及び装置
CN1719516B (zh) * 2005-07-15 2010-04-14 北京中星微电子有限公司 自适应滤波装置以及自适应滤波方法
EP1843325B1 (en) * 2006-04-03 2009-11-18 Voice.Trust Ag Speaker authentication in digital communication networks

Also Published As

Publication number Publication date
DE602007002132D1 (de) 2009-10-08
KR100929958B1 (ko) 2009-12-04
US8694314B2 (en) 2014-04-08
JP5151102B2 (ja) 2013-02-27
EP1901285A2 (en) 2008-03-19
US20080071535A1 (en) 2008-03-20
ATE441176T1 (de) 2009-09-15
EP1901285B1 (en) 2009-08-26
TWI342008B (en) 2011-05-11
JP2008070596A (ja) 2008-03-27
KR20080025018A (ko) 2008-03-19
CN101145342B (zh) 2011-01-19
CN101145342A (zh) 2008-03-19
EP1901285A3 (en) 2008-09-03

Similar Documents

Publication Publication Date Title
TW200828267A (en) Voice authentication apparatus
US11735191B2 (en) Speaker recognition with assessment of audio frame contribution
US10950245B2 (en) Generating prompts for user vocalisation for biometric speaker recognition
US7603275B2 (en) System, method and computer program product for verifying an identity using voiced to unvoiced classifiers
JP4802135B2 (ja) 話者認証登録及び確認方法並びに装置
US9047866B2 (en) System and method for identification of a speaker by phonograms of spontaneous oral speech and by using formant equalization using one vowel phoneme type
US20120173239A1 (en) Method for verifying the identityof a speaker, system therefore and computer readable medium
WO2017162053A1 (zh) 一种身份认证的方法和装置
JPH1083194A (ja) 話し手照合システムのための2段階群選択方法
KR101888058B1 (ko) 발화된 단어에 기초하여 화자를 식별하기 위한 방법 및 그 장치
WO2020128476A1 (en) Biometric user recognition
Weng et al. The sysu system for the interspeech 2015 automatic speaker verification spoofing and countermeasures challenge
US8600751B2 (en) Digital method and arrangement for authenticating a person
JP5151103B2 (ja) 音声認証装置、音声認証方法およびプログラム
CN113241059B (zh) 语音唤醒方法、装置、设备及存储介质
KR20110079161A (ko) 이동 단말기에서 화자 인증 방법 및 장치
JP4440414B2 (ja) 話者照合装置及び方法
WO2006027844A1 (ja) 話者照合装置
Pandiaraj et al. A confidence measure based—Score fusion technique to integrate MFCC and pitch for speaker verification
Barlaskar et al. Study on the varying degree of speaker identity information reflected across the different MFCCs
JPH0619491A (ja) 音声認識装置
JP2004309779A (ja) 音声認証装置
EP2356652A1 (en) Method for verifying the identity of a speaker, system therefore and computer readable medium

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees