TWM622203U - 用於金融交易系統之聲紋辨識裝置 - Google Patents
用於金融交易系統之聲紋辨識裝置 Download PDFInfo
- Publication number
- TWM622203U TWM622203U TW110210626U TW110210626U TWM622203U TW M622203 U TWM622203 U TW M622203U TW 110210626 U TW110210626 U TW 110210626U TW 110210626 U TW110210626 U TW 110210626U TW M622203 U TWM622203 U TW M622203U
- Authority
- TW
- Taiwan
- Prior art keywords
- feature
- voiceprint
- data
- feature data
- unit
- Prior art date
Links
Images
Landscapes
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
一種用於金融交易系統之聲紋辨識裝置,其藉由增加識別的緩衝機制,提升聲紋識別的品質,並且對於電子裝置上的金融交易行為可做為一道輔助認證的功能。該聲紋辨識裝置包含音訊接收單元、聲紋辨識單元、儲存單元以及運算單元,該運算單元將音頻資料擷取後之至少一聲紋特徵比對該儲存單元之第一特徵資料、第二特徵資料,並且搭配深度學習、神經網路等訓練第一特徵資料、第二特徵資料,進行安全性驗證。
Description
本創作係有關一種聲紋辨識裝置,尤其是有關一種用於金融交易系統之聲紋辨識裝置。
聲紋具有唯一性、獨特性和不易竄改性,加之較不涉及使用者隱私問題,故聲紋識別可用於要求從音頻信號中提取個體差異,擷取出能夠反映使用者是誰的信息,從而進行使用者識別,其基本原理是每一個使用者建立一個能夠描述這一使用者個性特徵的模組,作為此使用者個性特徵的描述。
聲紋辨識目前已經應用於身份辨識,作為判斷使用者身份之工具。然而,聲紋識別的缺點在於,聲音容易受到年齡、情緒、或身體狀況等因素影響,導致識別性能降低,故目前聲紋辨識技術的準確度仍有待改善。此外設備的收音品質與環境噪音等因素,也會影響聲紋辨識的識別效能。
有鑑於先前技術的上述缺點,本創作提供了一聲紋辨識裝置,該裝置包含:一音訊接收單元,係用以擷取一音頻資料;一聲紋辨識單元,係連接於該音訊接收單元,該聲紋辨識單元由該音訊接收單元接收該音頻資料,且該聲紋辨識單元辨識出該音頻資料的至少一聲紋特徵;一儲存單元,儲存一第一特徵資料;一運算單元,係連接於該聲紋辨識單元與該儲存單元,該運算單元自該聲紋辨識單元接收該至少一聲紋特徵以及自該儲存單元接收該第一特徵資料,其中該運算單元根據該第一特徵資料判斷該至少一聲紋特徵與該第一特徵資料的是否相符;其中,若該運算單元判斷該至少一聲紋特徵符合該第一特徵資料,則該運算單元將該至少一聲紋特徵儲存於該儲存單元的一暫存空間內,根據該暫存空間內的該至少一聲紋特徵訓練該第一特徵資料,以產生一調整後之第一特徵資料,並根據該調整後之第一特徵資料進行安全性驗證;以及若該運算單元判斷該至少一聲紋特徵不符該第一特徵資料,則該運算單元傳送一驗證請求,並於該驗證請求完成確認後,該運算單元將該至少一聲紋特徵儲存於該暫存空間內,但該儲存單元不根據該至少一聲紋特徵變更該第一特徵資料,以根據該第一特徵資料進行安全性驗證。
綜上所述,使用者於登入系統環境欲進行金融交易等動作時,藉由讀取裝置使用時所記錄的聲紋特徵,搭配深度學習、加入神經網路等訓練聲紋特徵模型,可改善認證的品質,讓模型可以更準確地辨認使用者本人,亦進一步地將此項認證應用於各種金融交易系統當中。
以下說明係為完成創作的較佳實現方式,其目的在於描述本創作的基本精神,但並不用以限定本創作。實際的創作內容必須參考之後的權利要求範圍。
必須了解的是,使用於本說明書中的“包含”、“包括”等詞,係用以表示存在特定的技術特徵、數值、運作程序、作業處理、元件以及/或組件,但並不排除可加上更多的技術特徵、數值、運作程序、作業處理、元件、組件,或以上的任意組合。
於權利要求中使用如“第一”、“第二”等詞係用來修飾權利要求中的元件,並非用來表示之間具有優先權順序,先行關係,或者是一個元件先於另一個元件,或者是執行運作程序時的時間先後順序,僅用來區別具有相同名字的元件。
請一併參閱圖1與圖2,圖1係依據本創作一實施例繪示一種聲紋辨識裝置之方塊圖,圖2係依據本創作另一實施例繪示一種聲紋辨識裝置之方塊圖。
於一實施例中,如圖1所示,聲紋辨識裝置100包含一音訊接收單元10、一聲紋辨識單元20、一運算單元30以及一儲存單元40。
音訊接收單元10係擷取一音頻資料。聲紋辨識單元20係連接音訊接收單元10以接收上述音頻資料,且可辨識出上述音頻資料內的至少一聲紋特徵。在一些實施例中,上述至少一聲紋特徵可以是特定關鍵詞、聲波波段、聲波波形、聲波頻率等。於一實施例中,聲紋辨識單元20用於辨識音頻資料內的上述至少一聲紋特徵,並且聲紋辨識單元20可包含以下操作中至少一者,例如為濾波、降低雜訊、抑制背景噪音、放大特定聲紋特徵、計算音頻資料之一向量參數、偵測特定關鍵詞、偵測特定聲波波段、偵測特定聲波波形、偵測特定聲波頻率等。
儲存單元40可儲存第一特徵資料44。在一些實施例中,第一特徵資料44可以是符合使用者之任何一相關聲紋資訊,例如為特定關鍵詞、聲波波段、聲波波形、聲波頻率等。在一些實施例中,第一特徵資料44可以是類比訊號、數位訊號、類比/數位混合訊號等資料儲存之模式。
運算單元30係連接聲紋辨識單元20與儲存單元40,可接收自聲紋辨識單元20的上述至少一聲紋特徵,以及接收自儲存單元40的第一特徵資料44,於運算單元30內判斷上述至少一聲紋特徵與第一特徵資料44是否相符。
若運算單元30判斷上述至少一聲紋特徵符合第一特徵資料44,則運算單元30將上述至少一聲紋特徵儲存於儲存單元40的一暫存空間42內,且根據暫存空間42內的上述至少一聲紋特徵來訓練第一特徵資料44,以產生一調整後之第一特徵資料44,並根據該調整後之第一特徵資料44進行安全性驗證。舉例來說,上述安全性驗證可以在調整後第一特徵資料44建立完當下立即執行,以更進一步達成一快速安全性驗證之效果。
在另一範例中,上述安全性驗證可以待後續收到新的一聲紋特徵,再將此新的一聲紋特徵與調整後第一特徵資料44比對,如此同樣可達到安全性驗證之目的,且相較於前一個範例,可降低誤判斷為「不通過」之機率,提昇整體流程的順暢度,進而提昇使用者體驗。
在一些實施例中,上述判斷的至少一聲紋特徵可對應於使用者之一正常聲紋,或受到年齡、情緒、或身體狀況等因素影響後之異常聲紋,第一特徵資料44則可視為使用者原始預設之聲紋特徵,若至少一聲紋特徵能與第一特徵資料44相符,則使用訓練後之第一特徵資料44作為聲紋識別標準來進行安全性驗證,且第一特徵資料44可被持續訓練,以持續更新第一特徵資料44可接受之聲紋範疇。
於一實施例中,如圖2所示,聲紋辨識裝置200之運算單元30可進一步包含一驗證計算器32,驗證計算器32之計數值於一初始狀態為0單位,若運算單元30判斷上述至少一聲紋特徵不符第一特徵資料44,則驗證計算器32之計數值增加1單位。
若上述計算值小於一預定數值,若運算單元30判斷上述至少一聲紋特徵不符第一特徵資料44,則運算單元30將傳送一驗證請求給使用者,且等待上述驗證請求被使用者完成確認後,運算單元30將上述至少一聲紋特徵儲存於暫存空間42內,但儲存單元40不根據上述至少一聲紋特徵來變更第一特徵資料44,而是仍以第一特徵資料44進行安全性驗證。在一些實施例中,上述至少一聲紋特徵可對應於使用者受到年齡、情緒、或身體狀況等因素影響後之異常聲紋,第一特徵資料44則可視為使用者原始預設之聲紋特徵。若異常聲紋的上述至少一聲紋特徵與第一特徵資料44不符,則本創作仍保留第一特徵資料44,並且僅將異常聲紋另外儲存於暫存空間42內,以此可作為一辨識緩衝機制,上述辨識緩衝機制主要避免使用者之上述至少一聲紋特徵僅為聲紋暫時性異常、或聲紋辨識裝置100判斷失誤之可能。
若上述計算值達該預定數值,則運算單元30根據暫存空間42內的上述至少一聲紋特徵與第一特徵資料44產生一第二特徵資料46。在一些實施例中,第二特徵資料46可以是類比訊號、數位訊號、類比/數位混合訊號等資料儲存之模式。
於第二特徵資料46產生後,驗證計算器32調整計算值為0單位,運算單元30將第一特徵資料44、第二特徵資料46儲存於儲存單元40,並修改為根據第一特徵資料44、第二特徵資料46,使運算單元30判斷後續接收之至少一聲紋特徵與第一特徵資料44、第二特徵資料46是否相符,以進行安全性驗證。在一些實施例中,上述至少一聲紋特徵可對應於使用者受到年齡、情緒、或身體狀況等因素影響後之異常聲紋,第一特徵資料44則可視為使用者原始預設之聲紋特徵。若異常聲紋的上述至少一聲紋特徵已達一定預定次數(預定時間)而不能符合第一特徵資料44,則本創作仍保留第一特徵資料44,並且另根據暫存空間42內儲存的上述至少一聲紋特徵與第一特徵資料44產生一第二特徵資料46,以此可作為另一辨識緩衝機制,上述辨識緩衝機制主要增加使用者受到年齡、情緒、或身體狀況等因素一定時間影響後的聲紋特徵辨識資料。
於一實施例中,運算單元30於判斷至少一聲紋特徵與第一特徵資料44、第二特徵資料46是否相符時,若上述至少一聲紋特徵符合第二特徵資料46,則運算單元30傳送上述至少一聲紋特徵儲存於暫存空間42內,且根據暫存空間42內的上述至少一聲紋特徵訓練第二特徵資料46,以產生一調整後之第二特徵資料46,並根據該調整後之第二特徵資料46進行安全性驗證。舉例來說,上述安全性驗證可以在調整後第二特徵資料46建立完當下立即執行,以更進一步達成一快速安全性驗證之效果。
在另一範例中,上述安全性驗證可以待後續收到新的一聲紋特徵,再將此新的一聲紋特徵與調整後第二特徵資料46比對,如此同樣可達到安全性驗證之目的,且相較於前一個範例,可降低誤判斷為「不通過」之機率,提昇整體流程的順暢度,進而提昇使用者體驗。
在一些實施例中,上述至少一聲紋特徵可對應於使用者受到年齡、情緒、或身體狀況等因素影響後之異常聲紋,第二特徵資料46則可視為使用者受一定時間異常影響後的聲紋特徵辨識資料。若異常聲紋的上述至少一聲紋特徵已達一定預定次數(預定時間)而卻與第二特徵資料46相符,則本創作仍保留第一特徵資料44,並且僅判斷為使用者已達一聲紋異常變化後的穩定狀況,而使用訓練後之第二特徵資料46作為此穩定狀況的聲紋識別標準來進行安全性驗證,且第二特徵資料46可被持續訓練,以持續更新第二特徵資料46可接受之聲紋範疇。
若運算單元30判斷上述至少一聲紋特徵不符第二特徵資料46、但符合第一特徵資料44,則運算單元30自儲存單元40中移除第二特徵資料46。第二特徵資料46移除後,重新根據第一特徵資料44進行安全性驗證。在一些實施例中,上述至少一聲紋特徵可對應於使用者受到年齡、情緒、或身體狀況等因素影響後之異常聲紋特徵,第一特徵資料44可視為使用者原始預設之聲紋特徵,第二特徵資料46則可視為使用者受一定時間異常影響後的聲紋特徵辨識資料。若使用者由造成異常聲紋特徵之狀況恢復時,則可判斷為第二特徵資料46已不適用為一聲紋識別標準,故予以移除第二特徵資料46、恢復為根據第一特徵資料44作為聲紋識別之標準來進行安全性驗證。
若運算單元30判斷上述至少一聲紋特徵不符第二特徵資料46且不符第一特徵資料44,則驗證計算器32對上述計數值增加1單位。若上述計算值小於一預定數值,則運算單元30傳送一驗證請求給使用者,且等待上述驗證請求被使用者完成確認後,運算單元30將上述至少一聲紋特徵儲存於暫存空間42內,但儲存單元40不根據上述至少一聲紋特徵變更第一特徵資料44、第二特徵資料46,以根據該第一特徵資料、該第二特徵進行安全性驗證。
於一實施例中,若上述計算值達該預定數值,則運算單元30根據暫存空間42內的上述至少一聲紋特徵訓練第二特徵資料46,以產生一調整後之第二特徵資料46。產生調整後之第二特徵資料46後,驗證計算器32調整該計算值為0單位,且運算單元30判斷至少一聲紋特徵與第一特徵資料44、調整後之第二特徵資料46是否相符,以進行安全性驗證。舉例來說,上述安全性驗證可以在調整後第二特徵資料46建立完當下立即執行,以更進一步達成一快速安全性驗證之效果。
在另一範例中,上述安全性驗證可以待後續收到新的一聲紋特徵,再將此新的一聲紋特徵與第一特徵資料44、調整後第二特徵資料46比對,如此同樣可達到安全性驗證之目的,且相較於前一個範例,可降低誤判斷為「不通過」之機率,提昇整體流程的順暢度,進而提昇使用者體驗。
在一些實施例中,上述至少一聲紋特徵可對應於使用者受到年齡、情緒、或身體狀況等因素影響後之異常聲紋特徵,且造成異常聲紋特徵之狀況恐已難以恢復。若異常聲紋的上述至少一聲紋特徵已達一定預定次數(預定時間)而不能符合第一特徵資料44、第二特徵資料46,則可判斷為第二特徵資料46已不適用為一聲紋異常變化達穩定狀況的聲紋識別標準,故利用暫存空間42內的聲紋特徵重新訓練第二特徵資料46,產生一調整後之第二特徵資料46,使其重新作為聲紋識別之標準來進行安全性驗證。
於一實施例中,聲紋辨識裝置100、200可設置於透過網路執行金融交易的個人電腦、膝上型電腦、蜂窩電話、相機電話、智慧型電話、個人數位助理、媒體播放機、導航設備、電子郵件收發設備、遊戲控制台、平板電腦、可穿戴設備或者這些設備中的任意幾種設備的組合。於一實施例中,聲紋辨識裝置100、200可設置於電子金融交易系統,例如為自動櫃員機(ATM)、網路銀行、或其他金融交易系統上。
於一實施例中,運算單元30可以是一中央處理器(central processing unit,CPU),亦可配置為其他運算能力足夠的元件。
於一實施例中,儲存單元40可以是一伺服器(server),用於儲存一或多個公司、銀行或機構的聲紋辨識資料庫。於另一實施例中,儲存單元40可以是一任何型態的固定式或可移動式的隨機存取記憶體(random access memory,RAM)、唯讀記憶體(read-only memory,ROM)、快閃記憶體(flash memory)、硬碟(hard disk drive,HDD)、固態硬碟(solid state drive,SSD)或類似元件或上述元件的組合。
於一實施例中,上述驗證請求所包含的使用者身份特徵之識別程序可以是簡訊、傳真、電子郵件、應用程式、數位簽章、或基於其他生物學特徵(例如為臉部影像、指紋、虹膜等辨識)等。
於一實施例中,儲存單元40可包含一深度學習模型,用以訓練第一特徵資料44、第二特徵資料46,上述深度學習模型可包括各種類型的神經網路模型中的至少一者,所述各種類型的神經網路模型包括卷積神經網路(convolution neural network,CNN)、區域卷積神經網路(region with convolution neural network,R-CNN)、區域建議網絡(region proposal network,RPN)、遞迴神經網路(recurrent neural network,RNN)、基於堆疊的深度神經網路(stacking-based deep neural network,S-DNN)、狀態空間動態神經網路(state-space dynamic neural network,S-SDNN)、反卷積網路(deconvolution network)、深度置信網路(deep belief network,DBN)、受限玻爾茲曼機(restricted Boltzmann machine,RBM)、全卷積網路(fully convolutional network)、長短期記憶體(long short-term memory,LSTM)網路以及分類網路(classification network)。
請一併參閱圖3與圖4,圖3係根據本創作之一實施例繪示一種聲紋辨識裝置之運作程序之示意圖,圖4係根據本創作之另一實施例繪示一種聲紋辨識裝置之運作程序之示意圖。
於一實施例中,如圖3所示,於運作程序步驟S1中,藉由音訊接收單元10擷取一音頻資料。
於運作程序步驟S2中,聲紋辨識單元20接收音訊接收單元10所傳送的上述音頻資料,且辨識出上述音頻資料內的至少一聲紋特徵。
於運作程序步驟S3中,運算單元30接收聲紋辨識單元20所傳送的上述至少一聲紋特徵、接收儲存單元40所傳送的第一特徵資料44,用以比對上述聲紋特徵與第一特徵資料44是否相符。
於運作程序步驟S4中,若上述至少一聲紋特徵符合第一特徵資料44,則運算單元30將上述至少一聲紋特徵儲存於暫存空間42內,且運算單元30根據暫存空間42內的上述至少一聲紋特徵訓練第一特徵資料44,以產生一調整後第一特徵資料44,以根據調整後之第一特徵資料44進行安全性驗證。舉例來說,上述安全性驗證可以在調整後第一特徵資料44建立完當下立即執行,以更進一步達成一快速安全性驗證之效果。
在另一範例中,上述安全性驗證可以待後續收到新的一聲紋特徵,再將此新的一聲紋特徵與調整後第一特徵資料44比對,如此同樣可達到安全性驗證之目的,且相較於前一個範例,可降低誤判斷為「不通過」之機率,提昇整體流程的順暢度,進而提昇使用者體驗。
於運作程序步驟S5中,運算單元30可包含一驗證計算器32,驗證計算器32之計數值於一初始狀態為0單位,若上述聲紋特徵不符第一特徵資料44,則增加驗證計算器32之計數值1單位。若上述計算值小於一預定數值,運算單元30將傳送一驗證請求給使用者,當上述驗證請求被使用者完成確認後,則運算單元30將上述至少一聲紋特徵儲存於暫存空間42內,但不根據上述至少一聲紋特徵變更第一特徵資料44,以根據第一特徵資料44進行安全性驗證。
於運作程序步驟S6中,若上述至少一聲紋特徵不符第一特徵資料44,且上述計算值達該預定數值,則運算單元30使暫存空間42內的至少一聲紋特徵與第一特徵資料44產生一第二特徵資料46。
於運作程序步驟S7中,第二特徵資料46產生後,驗證計算器32調整計算值為0單位,且運算單元30修正成根據第一特徵資料44、第二特徵資料46來比對至少一聲紋特徵與第一特徵資料44、第二特徵資料46是否相符,以進行安全性驗證。
於一實施例中,如圖4所示,於運作程序步驟S8中,運算單元30修正成根據第一特徵資料44、第二特徵資料46來比對至少一聲紋特徵與第一特徵資料44、第二特徵資料46是否相符,而其中運算單元30先根據第二特徵資料46來比對至少一聲紋特徵與第二特徵資料46是否相符。
於運作程序步驟S9中,若上述聲紋特徵符合第二特徵資料46,則運算單元30將上述至少一聲紋特徵儲存於暫存空間42內,且儲存單元40根據暫存空間42內的上述至少一聲紋特徵訓練第二特徵資料46,以產生一調整後之第二特徵資料46,並根據調整後之第二特徵資料46進行安全性驗證。舉例來說,上述安全性驗證可以在調整後第二特徵資料46建立完當下立即執行,以更進一步達成一快速安全性驗證之效果。
在另一範例中,上述安全性驗證可以待後續收到新的一聲紋特徵,再將此新的一聲紋特徵與調整後第二特徵資料46比對,如此同樣可達到安全性驗證之目的,且相較於前一個範例,可降低誤判斷為「不通過」之機率,提昇整體流程的順暢度,進而提昇使用者體驗。
於運作程序步驟S10中,若上述聲紋特徵不符第二特徵資料46,則運算單元30再根據第一特徵資料44來比對上述聲紋特徵與第一特徵資料44是否相符。
於運作程序步驟S11中,若上述聲紋特徵不符第二特徵資料46、但符合第一特徵資料44,則運算單元30移除第二特徵資料46,以根據第一特徵資料44進行安全性驗證。
於運作程序步驟S12中,驗證計算器32之計數值於一初始狀態為0單位,若上述聲紋特徵不符第二特徵資料46且不符第一特徵資料44,則增加驗證計算器32之計數值1單位。若上述計算值小於一預定數值,則傳送一驗證請求給使用者,上述驗證請求被使用者完成確認後,運算單元30傳送上述聲紋特徵至暫存空間42內儲存,但儲存單元40不根據上述至少一聲紋特徵變更第一特徵資料44、第二特徵資料46,以根據第一特徵資料44、第二特徵資料46進行安全性驗證。
於運作程序步驟S13中,若上述至少一聲紋特徵不符第二特徵資料46且不符第一特徵資料44,且上述計算值達一預定數值,則運算單元30根據暫存空間42的上述至少一聲紋特徵訓練第二特徵資料46,以產生一調整後之第二特徵資料46。
於運作程序步驟S14中,產生調整後之第二特徵資料46後,該驗證計算器調整該計算值為0單位,運算單元30修正成根據第一特徵資料44、調整後之第二特徵資料46來判斷至少一聲紋特徵與第一特徵資料44、調整後之第二特徵資料46是否相符,以進行安全性驗證。舉例來說,上述安全性驗證可以在調整後第二特徵資料46建立完當下立即執行,以更進一步達成一快速安全性驗證之效果。
在另一範例中,上述安全性驗證可以待後續收到新的一聲紋特徵,再將此新的一聲紋特徵與第一特徵資料44、調整後第二特徵資料46比對,如此同樣可達到安全性驗證之目的,且相較於前一個範例,可降低誤判斷為「不通過」之機率,提昇整體流程的順暢度,進而提昇使用者體驗。
於一實施例中,聲紋辨識裝置之運作程序300、400可設置於電子金融交易系統,例如為自動櫃員機(ATM)、網路銀行、或其他金融交易系統上。
本創作對於電子裝置上的金融交易系統可做為一道輔助認證的功能。使用者於登入系統環境欲進行金融交易等動作時,藉由讀取裝置使用時所記錄的聲紋圖譜,透過深度學習、加入遞歸神經網路來訓練聲紋圖譜模型,藉此改善認證的品質,讓模型可以更準確地辨認使用者本人的指令,進而將此項認證應用於各種金融交易系統中,例如為行動銀行(網路銀行)等。
本創作所述以示意圖及步驟進行說明的聲紋辨識裝置之運作程序僅為各種實施例之例示,其運作程序實施順序或步驟可在本創作揭露範圍內任意重組,並不以說明書及圖式所揭露者為限。隨著各步驟、順序介紹之各型態格式的實體/數位或硬體/軟體,不受其被揭露的步驟或順序所侷限。
惟以上所述者,僅為本創作之實施例而已,當不能以此限定本創作實施之範圍,凡任何熟習相關技術者,在不脫離本創作之精神和範圍內,當可作些許之更動與潤飾,因此本創作之專利保護範圍須視本說明書所附之申請專利範圍所界定者為準。
100,200:聲紋辨識裝置
300,400:聲紋辨識裝置之運作程序
10:音訊接收單元
20:聲紋辨識單元
30:運算單元
32:驗證計算器
40:儲存單元
42:暫存空間
44:第一特徵資料
46:第二特徵資料
S1~S14:步驟
S1’,S2’:步驟
圖1係根據本創作一實施例繪示一種聲紋辨識裝置之方塊圖。
圖2係根據本創作另一實施例繪示一種聲紋辨識裝置之方塊圖。
圖3係根據本創作之一實施例繪示一種聲紋辨識裝置之運作程序之示意圖。
圖4係根據本創作之另一實施例繪示一種聲紋辨識裝置之運作程序之示意圖。
200:聲紋辨識裝置
10:音訊接收單元
20:聲紋辨識單元
30:運算單元
32:驗證計算器
40:儲存單元
42:暫存空間
44:第一特徵資料
46:第二特徵資料
Claims (7)
- 一種用於金融交易系統之聲紋辨識裝置,包含: 一音訊接收單元,係用以擷取一音頻資料; 一聲紋辨識單元,係連接於該音訊接收單元,該聲紋辨識單元由該音訊接收單元接收該音頻資料,且該聲紋辨識單元辨識出該音頻資料的至少一聲紋特徵; 一儲存單元,儲存一第一特徵資料; 一運算單元,係連接於該聲紋辨識單元與該儲存單元,該運算單元自該聲紋辨識單元接收該至少一聲紋特徵以及自該儲存單元接收該第一特徵資料,且該運算單元包含:一驗證計算器,該驗證計算器之計數值於一初始狀態為0單位,其中該運算單元根據該第一特徵資料判斷該至少一聲紋特徵與該第一特徵資料的是否相符; 其中,若該運算單元判斷該至少一聲紋特徵符合該第一特徵資料,則該運算單元將該至少一聲紋特徵儲存於該儲存單元的一暫存空間內,根據該暫存空間內的該至少一聲紋特徵訓練該第一特徵資料,以產生一調整後之第一特徵資料,並根據該調整後之第一特徵資料進行安全性驗證;以及 若該運算單元判斷該至少一聲紋特徵不符該第一特徵資料,則該驗證計算器對該計數值增加1單位,且當該計算值小於一預定數值時,該運算單元傳送一驗證請求,並於該驗證請求完成確認後,該運算單元將該至少一聲紋特徵儲存於該暫存空間內,但該儲存單元不根據該至少一聲紋特徵變更該第一特徵資料,以根據該第一特徵資料進行安全性驗證。
- 如請求項1之聲紋辨識裝置,其中該運算單元判斷該至少一聲紋特徵與該第一特徵資料是否相符進一步包含: 若該運算單元判斷該至少一聲紋特徵不符該第一特徵資料,且該計算值達該預定數值,則該運算單元根據該暫存空間內的該至少一聲紋特徵與該第一特徵資料產生一第二特徵資料;以及 於該第二特徵資料產生後,該驗證計算器調整該計算值為0單位,該運算單元將該第一特徵資料、該第二特徵資料儲存於儲存單元,以根據該第一特徵資料、該第二特徵資料判斷該至少一聲紋特徵與該第一特徵資料、該第二特徵資料是否相符,以進行安全性驗證。
- 如請求項2之聲紋辨識裝置,其中該運算單元判斷該至少一聲紋特徵與該第一特徵資料、該第二特徵資料是否相符進一步包含: 若該運算單元判斷該至少一聲紋特徵符合該第二特徵資料,則該運算單元傳送該至少一聲紋特徵儲存於該暫存空間內,且根據該暫存空間內的該至少一聲紋特徵訓練該第二特徵資料,以產生一調整後之第二特徵資料,並根據該調整後之第二特徵資料進行安全性驗證; 若該運算單元判斷該至少一聲紋特徵不符該第二特徵資料、但符合該第一特徵資料,則該運算單元自該儲存單元移除該第二特徵資料,以根據該第一特徵資料進行安全性驗證;以及 於該第二特徵資料產生後,若該運算單元判斷該至少一聲紋特徵不符該第二特徵資料且不符該第一特徵資料,則該驗證計算器對該計數值增加1單位,且當該計算值小於一預定數值時,該運算單元傳送一驗證請求,並於該驗證請求完成確認後,該運算單元將該至少一聲紋特徵儲存於該暫存空間內,但該儲存單元不根據該至少一聲紋特徵變更該第一特徵資料、該第二特徵資料,以根據該第一特徵資料、該第二特徵資料進行安全性驗證。
- 如請求項3之聲紋辨識裝置,其中該運算單元判斷該至少一聲紋特徵與該第一特徵資料、該第二特徵資料是否相符進一步包含: 於該第二特徵資料產生後,若該計算值達該預定數值,則該運算單元根據該暫存空間內的該至少一聲紋特徵訓練該第二特徵資料,以產生一調整後之第二特徵資料;以及 於產生該調整後之第二特徵資料後,該驗證計算器調整該計算值為0單位,該運算單元根據該第一特徵資料、該調整後之第二特徵資料來判斷該至少一聲紋特徵與該第一特徵資料、該調整後之第二特徵資料是否相符,以進行安全性驗證。
- 如請求項1之聲紋辨識裝置,其中辨識該音頻資料內的至少一聲紋特徵進一步包含以下操作中至少一者:濾波、降低雜訊、抑制背景噪音、放大特定聲紋特徵、計算該音頻資料之向量參數、偵測特定關鍵詞、偵測特定聲波波段、偵測特定聲波波形以及偵測特定聲波頻率。
- 如請求項2之聲紋辨識裝置,其中該儲存單元進一步包含:一深度學習演算法,用以訓練該第一特徵資料、該第二特徵資料,該深度學習演算法包含一深度神經網絡(Deep Neural Network,DNN)模型、一卷積神經網絡(Convolutional Neural Network,CNN)模型、一循環神經網路(Recurrent Neural Network,RNN)以及其組合其中之一。
- 如請求項1之聲紋辨識裝置,其中該驗證請求進一步包含以下身份特徵之識別程序中至少一者:簡訊、傳真、電子郵件、應用程式、數位簽章,以及基於其他生物學特徵之識別程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW110210626U TWM622203U (zh) | 2021-09-08 | 2021-09-08 | 用於金融交易系統之聲紋辨識裝置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW110210626U TWM622203U (zh) | 2021-09-08 | 2021-09-08 | 用於金融交易系統之聲紋辨識裝置 |
Publications (1)
Publication Number | Publication Date |
---|---|
TWM622203U true TWM622203U (zh) | 2022-01-11 |
Family
ID=80785712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW110210626U TWM622203U (zh) | 2021-09-08 | 2021-09-08 | 用於金融交易系統之聲紋辨識裝置 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWM622203U (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI787996B (zh) * | 2021-09-08 | 2022-12-21 | 華南商業銀行股份有限公司 | 用於金融交易系統之聲紋辨識裝置與其方法 |
-
2021
- 2021-09-08 TW TW110210626U patent/TWM622203U/zh unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI787996B (zh) * | 2021-09-08 | 2022-12-21 | 華南商業銀行股份有限公司 | 用於金融交易系統之聲紋辨識裝置與其方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9099085B2 (en) | Voice authentication systems and methods | |
CN107517207A (zh) | 服务器、身份验证方法及计算机可读存储介质 | |
US20200296098A1 (en) | Voiceprint security with messaging services | |
US20150169943A1 (en) | System, method and apparatus for biometric liveness detection | |
US20080270132A1 (en) | Method and system to improve speaker verification accuracy by detecting repeat imposters | |
US9646613B2 (en) | Methods and systems for splitting a digital signal | |
CN115315699A (zh) | 用于语音用户接口的耳内活性检测 | |
Korshunov et al. | Impact of score fusion on voice biometrics and presentation attack detection in cross-database evaluations | |
US20220328050A1 (en) | Adversarially robust voice biometrics, secure recognition, and identification | |
Javed et al. | Voice spoofing detector: A unified anti-spoofing framework | |
Duraibi | Voice biometric identity authentication model for IoT devices | |
Ranjan et al. | Statnet: Spectral and temporal features based multi-task network for audio spoofing detection | |
TWM622203U (zh) | 用於金融交易系統之聲紋辨識裝置 | |
US11841932B2 (en) | System and method for updating biometric evaluation systems | |
US10446138B2 (en) | System and method for assessing audio files for transcription services | |
Qadir et al. | Voice spoofing countermeasure based on spectral features to detect synthetic attacks through LSTM | |
TWI817897B (zh) | 用於金融交易系統之低雜訊聲紋辨識裝置與其方法 | |
TWI787996B (zh) | 用於金融交易系統之聲紋辨識裝置與其方法 | |
Shi et al. | Anti-replay: A fast and lightweight voice replay attack detection system | |
TWI778234B (zh) | 語者驗證系統 | |
US20230131359A1 (en) | System and Method for Generating Synthetic Cohorts Using Generative Modeling | |
Feng et al. | SHNU anti-spoofing systems for asvspoof 2019 challenge | |
US12131750B1 (en) | Methods and systems for enhancing the detection of synthetic voice data | |
US20230289420A1 (en) | Method for multifactor authentication using bone conduction and audio signals | |
Nakajima et al. | Speaker Verification Based on Synchronous Speech and Video Features |