TWI787996B - 用於金融交易系統之聲紋辨識裝置與其方法 - Google Patents

用於金融交易系統之聲紋辨識裝置與其方法 Download PDF

Info

Publication number
TWI787996B
TWI787996B TW110133397A TW110133397A TWI787996B TW I787996 B TWI787996 B TW I787996B TW 110133397 A TW110133397 A TW 110133397A TW 110133397 A TW110133397 A TW 110133397A TW I787996 B TWI787996 B TW I787996B
Authority
TW
Taiwan
Prior art keywords
voiceprint
feature
feature data
data
verification
Prior art date
Application number
TW110133397A
Other languages
English (en)
Other versions
TW202311990A (zh
Inventor
翁子崴
Original Assignee
華南商業銀行股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 華南商業銀行股份有限公司 filed Critical 華南商業銀行股份有限公司
Priority to TW110133397A priority Critical patent/TWI787996B/zh
Application granted granted Critical
Publication of TWI787996B publication Critical patent/TWI787996B/zh
Publication of TW202311990A publication Critical patent/TW202311990A/zh

Links

Images

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一種用於金融交易系統之聲紋辨識裝置與其方法,其藉由增加識別的緩衝機制,提升聲紋識別的品質,並且對於電子裝置上的金融交易行為可做為一道輔助認證的功能。該聲紋辨識裝置包含音訊接收單元、聲紋辨識單元、儲存單元以及運算單元,該運算單元將音頻資料擷取後之至少一聲紋特徵比對該儲存單元之第一特徵資料、第二特徵資料,並且搭配深度學習、神經網路等訓練第一特徵資料、第二特徵資料,進行安全性驗證。

Description

用於金融交易系統之聲紋辨識裝置與其方法
本發明係有關一種聲紋辨識裝置與其方法,尤其是有關一種用於金融交易系統之聲紋辨識裝置與其方法。
聲紋具有唯一性、獨特性和不易竄改性,加之較不涉及使用者隱私問題,故聲紋識別可用於要求從音頻信號中提取個體差異,擷取出能夠反映使用者是誰的信息,從而進行使用者識別,其基本原理是每一個使用者建立一個能夠描述這一使用者個性特徵的模組,作為此使用者個性特徵的描述。
聲紋辨識目前已經應用於身份辨識,作為判斷使用者身份之工具。然而,聲紋識別的缺點在於,聲音容易受到年齡、情緒、或身體狀況等因素影響,導致識別性能降低,故目前聲紋辨識技術的準確度仍有待改善。此外設備的收音品質與環境噪音等因素,也會影響聲紋辨識的識別效能。
有鑑於先前技術的上述缺點,本發明之一態樣提供了一聲紋辨識裝置,該裝置包含:一音訊接收單元,係用以擷取一音頻資料;一聲紋辨識單元,係連接於該音訊接收單元,該聲紋辨識單元由該音訊接收單元接收該音 頻資料,且該聲紋辨識單元辨識出該音頻資料的至少一聲紋特徵;一儲存單元,儲存一第一特徵資料;一運算單元,係連接於該聲紋辨識單元與該儲存單元,該運算單元自該聲紋辨識單元接收該至少一聲紋特徵以及自該儲存單元接收該第一特徵資料,其中該運算單元根據該第一特徵資料判斷該至少一聲紋特徵與該第一特徵資料的是否相符;其中,若該運算單元判斷該至少一聲紋特徵符合該第一特徵資料,則該運算單元將該至少一聲紋特徵儲存於該儲存單元的一暫存空間內,根據該暫存空間內的該至少一聲紋特徵訓練該第一特徵資料,以產生一調整後第一特徵資料,並根據該調整後第一特徵資料進行安全性驗證;以及若該運算單元判斷該至少一聲紋特徵不符該第一特徵資料,則該運算單元傳送一驗證請求,並於該驗證請求完成確認後,該運算單元將該至少一聲紋特徵儲存於該暫存空間內,但該儲存單元不根據該至少一聲紋特徵變更該第一特徵資料,以根據該第一特徵資料進行安全性驗證。
本發明之另一態樣提供了一聲紋辨識方法,應用於一聲紋辨識裝置,該聲紋辨識裝置包含一運算單元,該聲紋辨識方法包含控制該運算單元進行以下步驟:擷取一音頻資料;辨識該音頻資料內的至少一聲紋特徵;提供一第一特徵資料、一暫存空間以及一驗證請求;根據該第一特徵資料,比對該至少一聲紋特徵與該第一特徵資料是否相符;若該至少一聲紋特徵符合該第一特徵資料,則儲存該至少一聲紋特徵於該暫存空間內,並根據該暫存空間內的該至少一聲紋特徵訓練該第一特徵資料,以產生一調整後第一特徵資料,以根據該調整後第一特徵資料進行安全性驗證;以及若該至少一聲紋特徵不符該第一特徵資料,則傳送該驗證請求,當該驗證請求完成確認後,儲存該至少一聲 紋特徵於該暫存空間內,但不根據該至少一聲紋特徵變更該第一特徵資料,以根據該第一特徵資料進行安全性驗證。
綜上所述,使用者於登入系統環境欲進行金融交易等動作時,藉由讀取裝置使用時所記錄的聲紋特徵,搭配深度學習、加入神經網路等訓練聲紋特徵模型,可改善認證的品質,讓模型可以更準確地辨認使用者本人,亦進一步地將此項認證應用於各種金融交易系統當中。
100,200:聲紋辨識裝置
300,400:聲紋辨識方法
10:音訊接收單元
20:聲紋辨識單元
30:運算單元
32:驗證計算器
40:儲存單元
42:暫存空間
44:第一特徵資料
46:第二特徵資料
S1~S14:步驟
S1’,S2’:步驟
圖1係依據本發明一實施例繪示一種聲紋辨識裝置之方塊圖。
圖2係依據本發明另一實施例繪示一種聲紋辨識裝置之方塊圖。
圖3係依據本發明之一實施例繪示一種聲紋辨識方法之流程圖。
圖4係依據本發明之另一實施例繪示一種聲紋辨識方法之流程圖。
以下說明係為完成發明的較佳實現方式,其目的在於描述本發明的基本精神,但並不用以限定本發明。實際的發明內容必須參考之後的權利要求範圍。
必須了解的是,使用於本說明書中的“包含”、“包括”等詞,係用以表示存在特定的技術特徵、數值、方法步驟、作業處理、元件以及/或組件,但並不排除可加上更多的技術特徵、數值、方法步驟、作業處理、元件、組件,或以上的任意組合。
於權利要求中使用如“第一”、“第二”等詞係用來修飾權利要求中的元件,並非用來表示之間具有優先權順序,先行關係,或者是一個元件先於另一個元件,或者是執行方法步驟時的時間先後順序,僅用來區別具有相同名字的元件。
請一併參閱圖1與圖2,圖1係依據本發明一實施例繪示一種聲紋辨識裝置之方塊圖,圖2係依據本發明另一實施例繪示一種聲紋辨識裝置之方塊圖。
於一實施例中,如圖1所示,聲紋辨識裝置100包含一音訊接收單元10、一聲紋辨識單元20、一運算單元30以及一儲存單元40。
音訊接收單元10係擷取一音頻資料。聲紋辨識單元20係連接音訊接收單元10以接收上述音頻資料,且可辨識出上述音頻資料內的至少一聲紋特徵。在一些實施例中,上述至少一聲紋特徵可以是特定關鍵詞、聲波波段、聲波波形、聲波頻率等。於一實施例中,聲紋辨識單元20用於辨識音頻資料內的上述至少一聲紋特徵,並且聲紋辨識單元20可包含以下操作中至少一者,例如為濾波、降低雜訊、抑制背景噪音、放大特定聲紋特徵、計算音頻資料之一向量參數、偵測特定關鍵詞、偵測特定聲波波段、偵測特定聲波波形、偵測特定聲波頻率等。
儲存單元40可儲存第一特徵資料44。在一些實施例中,第一特徵資料44可以是符合使用者之任何一相關聲紋資訊,例如為特定關鍵詞、聲波波段、聲波波形、聲波頻率等。在一些實施例中,第一特徵資料44可以是類比訊號、數位訊號、類比/數位混合訊號等資料儲存之模式。
運算單元30係連接聲紋辨識單元20與儲存單元40,可接收自聲紋辨識單元20的上述至少一聲紋特徵,以及接收自儲存單元40的第一特徵資料44,於運算單元30內判斷上述至少一聲紋特徵與第一特徵資料44是否相符。
若運算單元30判斷上述至少一聲紋特徵符合第一特徵資料44,則運算單元30將上述至少一聲紋特徵儲存於儲存單元40的一暫存空間42內,且根據暫存空間42內的上述至少一聲紋特徵來訓練第一特徵資料44,以產生一調整後第一特徵資料44,並根據調整後第一特徵資料44進行安全性驗證。舉例來說,上述安全性驗證可以在調整後第一特徵資料44建立完當下立即執行,以更進一步達成一快速安全性驗證之效果。
在另一範例中,上述安全性驗證可以待後續收到新的一聲紋特徵,再將此新的一聲紋特徵與調整後第一特徵資料44比對,如此同樣可達到安全性驗證之目的,且相較於前一個範例,可降低誤判斷為「不通過」之機率,提昇整體流程的順暢度,進而提昇使用者體驗。
在一些實施例中,上述判斷的至少一聲紋特徵可對應於使用者之一正常聲紋,或受到年齡、情緒、或身體狀況等因素影響後之異常聲紋,第一特徵資料44則可視為使用者原始預設之聲紋特徵,若至少一聲紋特徵能與第一特徵資料44相符,則使用調整後第一特徵資料44作為聲紋識別標準來進行安全性驗證,且第一特徵資料44可被持續訓練,以持續更新第一特徵資料44可接受之聲紋範疇。
於一實施例中,如圖2所示,聲紋辨識裝置200之運算單元30可進一步包含一驗證計算器32,驗證計算器32之計數值於一初始狀態為0單位, 若運算單元30判斷上述至少一聲紋特徵不符第一特徵資料44,則驗證計算器32之計數值增加1單位。
若上述計算值小於一預定數值,若運算單元30判斷上述至少一聲紋特徵不符第一特徵資料44,則運算單元30將傳送一驗證請求給使用者,且等待上述驗證請求被使用者完成確認後,運算單元30將上述至少一聲紋特徵儲存於暫存空間42內,但儲存單元40不根據上述至少一聲紋特徵來變更第一特徵資料44,而是仍以第一特徵資料44進行安全性驗證。在一些實施例中,上述至少一聲紋特徵可對應於使用者受到年齡、情緒、或身體狀況等因素影響後之異常聲紋,第一特徵資料44則可視為使用者原始預設之聲紋特徵。若異常聲紋的上述至少一聲紋特徵與第一特徵資料44不符,則本發明仍保留第一特徵資料44,並且僅將異常聲紋另外儲存於暫存空間42內,以此可作為一辨識緩衝機制,上述辨識緩衝機制主要避免使用者之上述至少一聲紋特徵僅為聲紋暫時性異常、或聲紋辨識裝置100判斷失誤之可能。
若上述計算值達該預定數值,則運算單元30根據暫存空間42內的上述至少一聲紋特徵與第一特徵資料44產生一第二特徵資料46。在一些實施例中,第二特徵資料46可以是類比訊號、數位訊號、類比/數位混合訊號等資料儲存之模式。
於第二特徵資料46產生後,驗證計算器32調整計算值為0單位,運算單元30將第一特徵資料44、第二特徵資料46儲存於儲存單元40,並修改為根據第一特徵資料44、第二特徵資料46,使運算單元30判斷後續接收之至少一聲紋特徵與第一特徵資料44、第二特徵資料46是否相符,以進行安全性驗證。在一些實施例中,上述至少一聲紋特徵可對應於使用者受到年齡、情緒、或身體狀況等因素影響後之異常聲紋,第一特徵資料44則可視為使用者原始預設之聲紋特徵。若異常聲紋的上述至少一聲紋特徵已達一定預定次數(預定時間)而不能符合第一特徵資料44,則本發明仍保留第一特徵資料44,並且另根據暫 存空間42內儲存的上述至少一聲紋特徵與第一特徵資料44產生一第二特徵資料46,以此可作為另一辨識緩衝機制,上述辨識緩衝機制主要增加使用者受到年齡、情緒、或身體狀況等因素一定時間影響後的聲紋特徵辨識資料。
於一實施例中,運算單元30於判斷至少一聲紋特徵與第一特徵資料44、第二特徵資料46是否相符時,若上述至少一聲紋特徵符合第二特徵資料46,則運算單元30傳送上述至少一聲紋特徵儲存於暫存空間42內,且根據暫存空間42內的上述至少一聲紋特徵訓練第二特徵資料46,以產生一調整後第二特徵資料46,並根據該調整後第二特徵資料46進行安全性驗證。舉例來說,上述安全性驗證可以在調整後第二特徵資料46建立完當下立即執行,以更進一步達成一快速安全性驗證之效果。
在另一範例中,上述安全性驗證可以待後續收到新的一聲紋特徵,再將此新的一聲紋特徵與調整後第二特徵資料46比對,如此同樣可達到安全性驗證之目的,且相較於前一個範例,可降低誤判斷為「不通過」之機率,提昇整體流程的順暢度,進而提昇使用者體驗。
在一些實施例中,上述至少一聲紋特徵可對應於使用者受到年齡、情緒、或身體狀況等因素影響後之異常聲紋,第二特徵資料46則可視為使用者受一定時間異常影響後的聲紋特徵辨識資料。若異常聲紋的上述至少一聲紋特徵已達一定預定次數(預定時間)而卻與第二特徵資料46相符,則本發明仍保留第一特徵資料44,並且僅判斷為使用者已達一聲紋異常變化後的穩定狀況,而使用調整後第二特徵資料46作為此穩定狀況的聲紋識別標準來進行安全性驗證,且第二特徵資料46可被持續訓練,以持續更新第二特徵資料46可接受之聲紋範疇。
若運算單元30判斷上述至少一聲紋特徵不符第二特徵資料46、但符合第一特徵資料44,則運算單元30自儲存單元40中移除第二特徵資料46。第二特徵資料46移除後,重新根據第一特徵資料44進行安全性驗證。在一些實施例中,上述至少一聲紋特徵可對應於使用者受到年齡、情緒、或身體狀況等因素影響後之異常聲紋特徵,第一特徵資料44可視為使用者原始預設之聲紋特徵,第二特徵資料46則可視為使用者受一定時間異常影響後的聲紋特徵辨識資料。若使用者由造成異常聲紋特徵之狀況恢復時,則可判斷為第二特徵資料46已不適用為一聲紋識別標準,故予以移除第二特徵資料46、恢復為根據第一特徵資料44作為聲紋識別之標準來進行安全性驗證。
若運算單元30判斷上述至少一聲紋特徵不符第二特徵資料46且不符第一特徵資料44,則驗證計算器32對上述計數值增加1單位。若上述計算值小於一預定數值,則運算單元30傳送一驗證請求給使用者,且等待上述驗證請求被使用者完成確認後,運算單元30將上述至少一聲紋特徵儲存於暫存空間42內,但儲存單元40不根據上述至少一聲紋特徵變更第一特徵資料44、第二特徵資料46,以根據該第一特徵資料、該第二特徵進行安全性驗證。
於一實施例中,若上述計算值達該預定數值,則運算單元30根據暫存空間42內的上述至少一聲紋特徵訓練第二特徵資料46,以產生一調整後第二特徵資料46。產生調整後第二特徵資料46後,驗證計算器32調整該計算值為0單位,且運算單元30判斷至少一聲紋特徵與第一特徵資料44、調整後第二特徵資料46是否相符,以進行安全性驗證。舉例來說,上述安全性驗證可以在調整後第二特徵資料46建立完當下立即執行,以更進一步達成一快速安全性驗證之效果。
在另一範例中,上述安全性驗證可以待後續收到新的一聲紋特徵,再將此新的一聲紋特徵與第一特徵資料44、調整後第二特徵資料46比對,如此同樣可達到安全性驗證之目的,且相較於前一個範例,可降低誤判斷為「不通過」之機率,提昇整體流程的順暢度,進而提昇使用者體驗。
在一些實施例中,上述至少一聲紋特徵可對應於使用者受到年齡、情緒、或身體狀況等因素影響後之異常聲紋特徵,且造成異常聲紋特徵之狀況恐已難以恢復。若異常聲紋的上述至少一聲紋特徵已達一定預定次數(預定時間)而不能符合第一特徵資料44、第二特徵資料46,則可判斷為第二特徵資料46已不適用為一聲紋異常變化達穩定狀況的聲紋識別標準,故利用暫存空間42內的聲紋特徵重新訓練第二特徵資料46,產生一調整後第二特徵資料46,使其重新作為聲紋識別之標準來進行安全性驗證。
於一實施例中,聲紋辨識裝置100、200可設置於透過網路執行金融交易的個人電腦、膝上型電腦、蜂窩電話、相機電話、智慧型電話、個人數位助理、媒體播放機、導航設備、電子郵件收發設備、遊戲控制台、平板電腦、可穿戴設備或者這些設備中的任意幾種設備的組合。
於一實施例中,運算單元30可以是一中央處理器(central processing unit,CPU),亦可配置為其他運算能力足夠的元件。
於一實施例中,儲存單元40可以是一伺服器(server),用於儲存一或多個公司、銀行或機構的聲紋辨識資料庫。於另一實施例中,儲存單元40可以是一任何型態的固定式或可移動式的隨機存取記憶體(random access memory,RAM)、唯讀記憶體(read-only memory,ROM)、快閃記憶體 (flash memory)、硬碟(hard disk drive,HDD)、固態硬碟(solid state drive,SSD)或類似元件或上述元件的組合。
於一實施例中,上述驗證請求所包含的使用者身份特徵之識別方法可以是簡訊、傳真、電子郵件、應用程式、數位簽章、或基於其他生物學特徵(例如為臉部影像、指紋、虹膜等辨識)等。
於一實施例中,儲存單元40可包含一深度學習模型,用以訓練第一特徵資料44、第二特徵資料46,上述深度學習模型可包括各種類型的神經網路模型中的至少一者,所述各種類型的神經網路模型包括卷積神經網路(convolution neural network,CNN)、區域卷積神經網路(region with convolution neural network,R-CNN)、區域建議網絡(region proposal network,RPN)、遞迴神經網路(recurrent neural network,RNN)、基於堆疊的深度神經網路(stacking-based deep neural network,S-DNN)、狀態空間動態神經網路(state-space dynamic neural network,S-SDNN)、反卷積網路(deconvolution network)、深度置信網路(deep belief network,DBN)、受限玻爾茲曼機(restricted Boltzmann machine,RBM)、全卷積網路(fully convolutional network)、長短期記憶體(long short-term memory,LSTM)網路以及分類網路(classification network)。
請一併參閱圖3與圖4,圖3係根據本發明之一實施例繪示一種聲紋辨識方法之流程圖,圖4係根據本發明之另一實施例繪示一種聲紋辨識方法之流程圖。
於一實施例中,如圖3所示,於步驟S1中,藉由音訊接收單元10擷取一音頻資料。
於步驟S2中,聲紋辨識單元20接收音訊接收單元10所傳送的上述音頻資料,且辨識出上述音頻資料內的至少一聲紋特徵。
於步驟S3中,運算單元30接收聲紋辨識單元20所傳送的上述至少一聲紋特徵、接收儲存單元40所傳送的第一特徵資料44,用以比對上述聲紋特徵與第一特徵資料44是否相符。
於步驟S4中,若上述至少一聲紋特徵符合第一特徵資料44,則運算單元30將上述至少一聲紋特徵儲存於暫存空間42內,且運算單元30根據暫存空間42內的上述至少一聲紋特徵訓練第一特徵資料44,以產生一調整後第一特徵資料44,以根據調整後第一特徵資料44進行安全性驗證。舉例來說,上述安全性驗證可以在調整後第一特徵資料44建立完當下立即執行,以更進一步達成一快速安全性驗證之效果。
在另一範例中,上述安全性驗證可以待後續收到新的一聲紋特徵,再將此新的一聲紋特徵與調整後第一特徵資料44比對,如此同樣可達到安全性驗證之目的,且相較於前一個範例,可降低誤判斷為「不通過」之機率,提昇整體流程的順暢度,進而提昇使用者體驗。
於步驟S5中,運算單元30可包含一驗證計算器32,驗證計算器32之計數值於一初始狀態為0單位,若上述聲紋特徵不符第一特徵資料44,則增加驗證計算器32之計數值1單位。若上述計算值小於一預定數值,則運算單元30將傳送一驗證請求給使用者,當上述驗證請求被使用者完成確認後,則運算單元30將上述至少一聲紋特徵儲存於暫存空間42內,但不根據上述至少一聲紋特徵變更第一特徵資料44,以根據第一特徵資料44進行安全性驗證。
於步驟S6中,若上述至少一聲紋特徵不符第一特徵資料44,且上述計算值達一預定數值,則運算單元30使暫存空間42內的至少一聲紋特徵與第一特徵資料44產生一第二特徵資料46。
於步驟S7中,第二特徵資料46產生後,驗證計算器32調整計算值為0單位,且運算單元30修正成根據第一特徵資料44、第二特徵資料46來比對至少一聲紋特徵與第一特徵資料44、第二特徵資料46是否相符,以進行安全性驗證。
於一實施例中,如圖4所示,於步驟S8中,運算單元30修正成根據第一特徵資料44、第二特徵資料46來比對至少一聲紋特徵與第一特徵資料44、第二特徵資料46是否相符,而其中運算單元30先根據第二特徵資料46來比對至少一聲紋特徵與第二特徵資料46是否相符。
於步驟S9中,若上述聲紋特徵符合第二特徵資料46,則運算單元30將上述至少一聲紋特徵儲存於暫存空間42內,且儲存單元40根據暫存空間42內的上述至少一聲紋特徵訓練第二特徵資料46,以產生一調整後第二特徵資料46,並根據調整後第二特徵資料46進行安全性驗證。舉例來說,上述安全性驗證可以在調整後第二特徵資料46建立完當下立即執行,以更進一步達成一快速安全性驗證之效果。
在另一範例中,上述安全性驗證可以待後續收到新的一聲紋特徵,再將此新的一聲紋特徵與調整後第二特徵資料46比對,如此同樣可達到安全性驗證之目的,且相較於前一個範例,可降低誤判斷為「不通過」之機率,提昇整體流程的順暢度,進而提昇使用者體驗。
於步驟S10中,若上述聲紋特徵不符第二特徵資料46,則運算單元30再根據第一特徵資料44來比對上述聲紋特徵與第一特徵資料44是否相符。
於步驟S11中,若上述聲紋特徵不符第二特徵資料46、但符合第一特徵資料44,則運算單元30移除第二特徵資料46,以根據第一特徵資料44進行安全性驗證。
於步驟S12中,驗證計算器32之計數值於一初始狀態為0單位,若上述聲紋特徵不符第二特徵資料46且不符第一特徵資料44,則增加驗證計算器32之計數值1單位。若上述計算值小於一預定數值,則傳送一驗證請求給使用者,上述驗證請求被使用者完成確認後,運算單元30傳送上述聲紋特徵至暫存空間42內儲存,但儲存單元40不根據上述至少一聲紋特徵變更第一特徵資料44、第二特徵資料46,以根據第一特徵資料44、第二特徵資料46進行安全性驗證。
於步驟S13中,若上述至少一聲紋特徵不符第二特徵資料46且不符第一特徵資料44,且上述計算值達一預定數值,則運算單元30根據暫存空間42的上述至少一聲紋特徵訓練第二特徵資料46,以產生一調整後第二特徵資料46。
於步驟S14中,產生調整後第二特徵資料46後,該驗證計算器調整該計算值為0單位,運算單元30修正成根據第一特徵資料44、調整後第二特徵資料46來判斷至少一聲紋特徵與第一特徵資料44、調整後第二特徵資料46是否相符,以進行安全性驗證。舉例來說,上述安全性驗證可以在調整後第二特徵資料46建立完當下立即執行,以更進一步達成一快速安全性驗證之效果。
在另一範例中,上述安全性驗證可以待後續收到新的一聲紋特徵,再將此新的一聲紋特徵與第一特徵資料44、調整後第二特徵資料46比對,如此同樣可達到安全性驗證之目的,且相較於前一個範例,可降低誤判斷為「不通過」之機率,提昇整體流程的順暢度,進而提昇使用者體驗。
於一實施例中,聲紋辨識方法300、400可設置於電子金融交易系統,例如為自動櫃員機(ATM)、網路銀行、或其他金融交易系統上。
於一實施例中,上述驗證請求所包含的使用者身份特徵之識別方法可以是簡訊、傳真、電子郵件、應用程式、數位簽章、或基於其他生物學特徵(例如為臉部影像、指紋、虹膜等辨識)等。
於一實施例中,聲紋辨識方法300、400中之聲紋辨識裝置可包含一深度學習模型,用以訓練第一特徵資料44、第二特徵資料46,上述深度學習模型可包括各種類型的神經網路模型中的至少一者,所述各種類型的神經網路模型包括卷積神經網路(convolution neural network,CNN)、區域卷積神經網路(region with convolution neural network,R-CNN)、區域建議網絡(region proposal network,RPN)、遞迴神經網路(recurrent neural network,RNN)、基於堆疊的深度神經網路(stacking-based deep neural network,S-DNN)、狀態空間動態神經網路(state-space dynamic neural network,S-SDNN)、反卷積網路(deconvolution network)、深度置信網路(deep belief network,DBN)、受限玻爾茲曼機(restricted Boltzmann machine,RBM)、全卷積網路(fully convolutional network)、長短期記憶體(long short-term memory,LSTM)網路以及分類網路(classification network)。
本發明對於電子裝置上的金融交易系統可做為一道輔助認證的功能。使用者於登入系統環境欲進行金融交易等動作時,藉由讀取裝置使用時所記錄的聲紋圖譜,透過深度學習、加入遞歸神經網路來訓練聲紋圖譜模型,藉此改善認證的品質,讓模型可以更準確地辨認使用者本人的指令,進而將此項認證應用於各種金融交易系統中,例如為行動銀行(網路銀行)等。
惟以上所述者,僅為本發明之實施例而已,當不能以此限定本發明實施之範圍,凡是依本發明申請專利範圍及專利說明書內容所作之簡單的等效變化與修飾,皆仍屬本發明專利涵蓋之範圍內。
400:聲紋辨識方法
S1~S14:步驟
S1’,S2’:步驟

Claims (8)

  1. 一種用於金融交易系統之聲紋辨識裝置,包含:一音訊接收單元,係用以擷取一音頻資料;一聲紋辨識單元,係連接於該音訊接收單元,該聲紋辨識單元由該音訊接收單元接收該音頻資料,且該聲紋辨識單元辨識出該音頻資料的至少一聲紋特徵;一儲存單元,儲存一第一特徵資料;一運算單元,係連接於該聲紋辨識單元與該儲存單元,該運算單元自該聲紋辨識單元接收該至少一聲紋特徵以及自該儲存單元接收該第一特徵資料,且該運算單元包含:一驗證計算器,該驗證計算器之計數值於一初始狀態為0單位,其中該運算單元根據該第一特徵資料判斷該至少一聲紋特徵與該第一特徵資料的是否相符;其中,若該運算單元判斷該至少一聲紋特徵符合該第一特徵資料,則該運算單元將該至少一聲紋特徵儲存於該儲存單元的一暫存空間內,根據該暫存空間內的該至少一聲紋特徵訓練該第一特徵資料,以產生一調整後第一特徵資料,並根據該調整後第一特徵資料進行安全性驗證;若該運算單元判斷該至少一聲紋特徵不符該第一特徵資料,則該驗證計算器對該計數值增加1單位,且當該計算值小於一預定數值時,該運算單元傳送一驗證請求,並於該驗證請求完成確認後,該運算單元將該至少一聲紋特徵儲存於該暫存空間內,但該儲存單元不根據該至 少一聲紋特徵變更該第一特徵資料,以根據該第一特徵資料進行安全性驗證,其中該驗證請求包含使用者身份特徵之識別;若該運算單元判斷該至少一聲紋特徵不符該第一特徵資料,且該計算值達該預定數值,則該運算單元根據該暫存空間內的該至少一聲紋特徵與該第一特徵資料產生一第二特徵資料;以及於該第二特徵資料產生後,該驗證計算器調整該計算值為0單位,該運算單元將該第一特徵資料、該第二特徵資料儲存於儲存單元,以根據該第一特徵資料、該第二特徵資料判斷該至少一聲紋特徵與該第一特徵資料、該第二特徵資料是否相符,以進行安全性驗證。
  2. 如請求項1之聲紋辨識裝置,其中該運算單元判斷該至少一聲紋特徵與該第一特徵資料、該第二特徵資料是否相符進一步包含:若該運算單元判斷該至少一聲紋特徵符合該第二特徵資料,則該運算單元傳送該至少一聲紋特徵儲存於該暫存空間內,且根據該暫存空間內的該至少一聲紋特徵訓練該第二特徵資料,以產生一調整後第二特徵資料,並根據該調整後第二特徵資料進行安全性驗證;若該運算單元判斷該至少一聲紋特徵不符該第二特徵資料、但符合該第一特徵資料,則該運算單元自該儲存單元移除該第二特徵資料,以根據該第一特徵資料進行安全性驗證;以及於該第二特徵資料產生後,若該運算單元判斷該至少一聲紋特徵不符該第二特徵資料且不符該第一特徵資料,則該驗證計算器對該計數值增加1單位,且當該計算值小於一預定數值時,該運算單元傳送一驗證請求,並於該驗證請求完成確認後,該運算單元將該至少一聲紋特 徵儲存於該暫存空間內,但該儲存單元不根據該至少一聲紋特徵變更該第一特徵資料、該第二特徵資料,以根據該第一特徵資料、該第二特徵資料進行安全性驗證。
  3. 如請求項2之聲紋辨識裝置,其中該運算單元判斷該至少一聲紋特徵與該第一特徵資料、該第二特徵資料是否相符進一步包含:於該第二特徵資料產生後,若該計算值達該預定數值,則該運算單元根據該暫存空間內的該至少一聲紋特徵訓練該第二特徵資料,以產生一調整後第二特徵資料;以及於產生該調整後第二特徵資料後,該驗證計算器調整該計算值為0單位,該運算單元根據該第一特徵資料、該調整後第二特徵資料來判斷該至少一聲紋特徵與該第一特徵資料、該調整後第二特徵資料是否相符,以進行安全性驗證。
  4. 一種用於金融交易系統之聲紋辨識方法,應用於一聲紋辨識裝置,該聲紋辨識裝置包含一運算單元以及一驗證計算器,該驗證計算器之一計數值於一初始狀態為0單位,該聲紋辨識方法包含控制該運算單元進行以下步驟:擷取一音頻資料;辨識該音頻資料內的至少一聲紋特徵;提供一第一特徵資料、一暫存空間以及一驗證請求;根據該第一特徵資料,比對該至少一聲紋特徵與該第一特徵資料是否相符; 若該至少一聲紋特徵符合該第一特徵資料,則儲存該至少一聲紋特徵於該暫存空間內,並根據該暫存空間內的該至少一聲紋特徵訓練該第一特徵資料,以產生一調整後第一特徵資料,以根據該調整後第一特徵資料進行安全性驗證;若該至少一聲紋特徵不符該第一特徵資料,則對該驗證計算器之該計數值增加1單位,且當該計算值小於一預定數值時,傳送該驗證請求,當該驗證請求完成確認後,儲存該至少一聲紋特徵於該暫存空間內,但不根據該至少一聲紋特徵變更該第一特徵資料,以根據該第一特徵資料進行安全性驗證,其中該驗證請求包含使用者身份特徵之識別;若該計算值達該預定數值,則根據該暫存空間內的該至少一聲紋特徵與該第一特徵資料產生一第二特徵資料;以及於該第二特徵資料產生後,調整該驗證計算器之該計算值為0單位,且根據該第一特徵資料、該第二特徵資料來比對該至少一聲紋特徵與該第一特徵資料、該第二特徵資料是否相符,以進行安全性驗證。
  5. 如請求項4之聲紋辨識方法,其中比對該至少一聲紋特徵與該第一特徵資料、該第二特徵資料是否相符進一步包含以下步驟:若該至少一聲紋特徵符合該第二特徵資料,則儲存該至少一聲紋特徵於該暫存空間內,且根據該暫存空間內的該至少一聲紋特徵訓練該第二特徵資料,以產生一調整後第二特徵資料,並根據該調整後第二特徵資料進行安全性驗證; 若該至少一聲紋特徵不符該第二特徵資料、但符合該第一特徵資料,則移除該第二特徵資料,以根據該第一特徵資料進行安全性驗證;以及於該第二特徵資料產生後,若該至少一聲紋特徵不符該第二特徵資料且不符該第一特徵資料,則增加1單位該驗證計算器之該計數值,且當該計算值小於一預定數值時,傳送該驗證請求,並於該驗證請求完成確認後,傳送該至少一聲紋特徵儲存於該暫存空間內,但不根據該至少一聲紋特徵變更該第一特徵資料、該第二特徵資料,以根據該第一特徵資料、該第二特徵資料進行安全性驗證。
  6. 如請求項5之聲紋辨識方法,其中比對該至少一聲紋特徵與該第一特徵資料、該第二特徵資料是否相符進一步包含以下步驟:於該第二特徵資料產生後,該計算值達該預定數值,則根據該暫存空間內的該至少一聲紋特徵訓練該第二特徵資料,以產生一調整後第二特徵資料;以及於產生該調整後第二特徵資料後,調整該驗證計算器之該計算值為0單位,且根據該至少一聲紋特徵與該第一特徵資料、該調整後第二特徵資料是否相符,以進行安全性驗證。
  7. 如請求項1之聲紋辨識裝置或如請求項4之聲紋辨識方法,其中辨識該音頻資料內的該至少一聲紋特徵進一步包含以下操作中至少一者:濾波、降低雜訊、抑制背景噪音、放大特定聲紋特徵、計算該音頻資料之向量參數、偵測特定關鍵詞、偵測特定聲波波段、偵測特定聲波波形以及偵測特定聲波頻率。
  8. 如請求項1之聲紋辨識裝置或如請求項4之聲紋辨識方法,其中該聲紋辨識裝置進一步包含:一深度學習演算法,用以訓練該第一特徵資料、該第二特徵資料,該深度學習演算法包含一深度神經網絡(Deep Neural Network,DNN)模型、一卷積神經網絡(Convolutional Neural Network,CNN)模型、一循環神經網路(Recurrent Neural Network,RNN)以及其組合其中之一。
TW110133397A 2021-09-08 2021-09-08 用於金融交易系統之聲紋辨識裝置與其方法 TWI787996B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW110133397A TWI787996B (zh) 2021-09-08 2021-09-08 用於金融交易系統之聲紋辨識裝置與其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW110133397A TWI787996B (zh) 2021-09-08 2021-09-08 用於金融交易系統之聲紋辨識裝置與其方法

Publications (2)

Publication Number Publication Date
TWI787996B true TWI787996B (zh) 2022-12-21
TW202311990A TW202311990A (zh) 2023-03-16

Family

ID=85795142

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110133397A TWI787996B (zh) 2021-09-08 2021-09-08 用於金融交易系統之聲紋辨識裝置與其方法

Country Status (1)

Country Link
TW (1) TWI787996B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI527023B (zh) * 2013-01-28 2016-03-21 Tencent Tech Shenzhen Co Ltd A voiceprint recognition method and apparatus
TW201918920A (zh) * 2017-11-02 2019-05-16 香港商阿里巴巴集團服務有限公司 聲紋認證方法、帳號註冊方法及裝置
WO2019136911A1 (zh) * 2018-01-12 2019-07-18 平安科技(深圳)有限公司 更新声纹数据的语音识别方法、终端装置及存储介质
TWM582743U (zh) * 2019-05-22 2019-08-21 元大商業銀行股份有限公司 Financial voice system and sound input and output device
TWM622203U (zh) * 2021-09-08 2022-01-11 華南商業銀行股份有限公司 用於金融交易系統之聲紋辨識裝置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI527023B (zh) * 2013-01-28 2016-03-21 Tencent Tech Shenzhen Co Ltd A voiceprint recognition method and apparatus
TW201918920A (zh) * 2017-11-02 2019-05-16 香港商阿里巴巴集團服務有限公司 聲紋認證方法、帳號註冊方法及裝置
WO2019136911A1 (zh) * 2018-01-12 2019-07-18 平安科技(深圳)有限公司 更新声纹数据的语音识别方法、终端装置及存储介质
TWM582743U (zh) * 2019-05-22 2019-08-21 元大商業銀行股份有限公司 Financial voice system and sound input and output device
TWM622203U (zh) * 2021-09-08 2022-01-11 華南商業銀行股份有限公司 用於金融交易系統之聲紋辨識裝置

Also Published As

Publication number Publication date
TW202311990A (zh) 2023-03-16

Similar Documents

Publication Publication Date Title
EP3157005B1 (en) Hotword recognition
US11727942B2 (en) Age compensation in biometric systems using time-interval, gender and age
Bigun et al. Multimodal biometric authentication using quality signals in mobile communications
US9646613B2 (en) Methods and systems for splitting a digital signal
US11252152B2 (en) Voiceprint security with messaging services
KR20180040028A (ko) 핫 워드 인식
CN105723450A (zh) 用于话语检测的包络比较
US20150169943A1 (en) System, method and apparatus for biometric liveness detection
WO2018087761A1 (en) Dynamically configurable means of user authentication
Korshunov et al. Impact of score fusion on voice biometrics and presentation attack detection in cross-database evaluations
US11081115B2 (en) Speaker recognition
CN113095204B (zh) 双录数据质检方法、装置及系统
TWM622203U (zh) 用於金融交易系統之聲紋辨識裝置
US10446138B2 (en) System and method for assessing audio files for transcription services
US11841932B2 (en) System and method for updating biometric evaluation systems
TWI787996B (zh) 用於金融交易系統之聲紋辨識裝置與其方法
KR20190142056A (ko) 기계학습을 이용한 음성 인식 OTP(One Time Password)인증 방법 및 시스템
TWI817897B (zh) 用於金融交易系統之低雜訊聲紋辨識裝置與其方法
US11582336B1 (en) System and method for gender based authentication of a caller
Tashan et al. Speaker verification using heterogeneous neural network architecture with linear correlation speech activity detection
US20240126851A1 (en) Authentication system and method
Nakajima et al. Speaker Verification Based on Synchronous Speech and Video Features
KR102338684B1 (ko) 비자발적 감정의 예측을 위한 데이터 처리 방법
US20230386453A1 (en) Method for detecting an audio adversarial attack with respect to a voice command processed byan automatic speech recognition system, corresponding device, computer program product and computer-readable carrier medium
WO2023076815A1 (en) System and method for generating synthetic cohorts using generative modeling