TW202414385A

TW202414385A - 人工智能聲控銀行交易系統

Info

Publication number: TW202414385A
Application number: TW111135658A
Authority: TW
Inventors: 白庭楷
Original assignee: 華南商業銀行股份有限公司
Filing date: 2022-09-21
Publication date: 2024-04-01

Abstract

一種人工智能聲控銀行交易系統，包含自動櫃員機、運算裝置、記憶體及語音接收裝置。運算裝置用於進行身分驗證操作及指令確認操作，記憶體用於儲存兩語音訊息，以及語音識別模型、登記身分資料和指令資料庫，語音接收裝置用於接收兩語音訊息並傳輸至記憶體。身分驗證操作包含藉由語音識別模型擷取第一語音訊息中的待定身分資料，以及比對並確認待定身分資料符合登記身分資料，指令確認操作包含藉由語音識別模型擷取一第二語音訊息中的待定指令資料，以及比對並判斷待定指令資料與指令資料庫中的多個執行指令資料對應的一執行指令資料。

Description

人工智能聲控銀行交易系統

本發明係關於一種銀行交易系統，特別是關於一種人工智能聲控銀行交易系統。

目前的銀行交易系統，如自動櫃員機(ATM)的交易介面大多是採取按鍵或面板的形式，在某些情況或對於特定族群(如視力受損、行動不便者)而言，造成了一定的不便性。

在某些系統中，語音功能往往都是輔助性的，需要搭配螢幕顯示以及觸摸點字等，因此對於特定使用者而言，使用輔助性的自動櫃員機往往不如透過手機使用網路銀行來得方便。

鑒於上述，本發明提供一種人工智能聲控銀行交易系統。

依據本發明一實施例的人工智能聲控銀行交易系統，包含自動櫃員機、連接於自動櫃員機的運算裝置、連接於運算裝置的記憶體及連接於記憶體的語音接收裝置。自動櫃員機用於讓使用者自助辦理銀行櫃檯服務，運算裝置用於對使用者進行一身分驗證操作及一指令確認操作，記憶體用於儲存一第一及第二語音訊息，並儲存有語音識別模型、使用者的一登記身分資料及一指令資料庫，語音接收裝置用於接收使用者的第一及第二語音訊息並傳輸至記憶體。所述運算裝置執行的身分驗證操作包含：藉由語音識別模型擷取第一語音訊息中含有的一待定身分資料，以及比對待定身分資料與登記身分資料並確認待定身分資料符合該登記身分資料，且運算裝置執行的該指令確認操作包含：藉由語音識別模型擷取一第二語音訊息中含有的一待定指令資料，以及比對待定指令資料與指令資料庫中的多個執行指令資料，以判斷與所述待定指令資料對應的一執行指令資料。

藉由上述結構，本案所揭示的人工智能聲控銀行交易系統，可透過儲存有人工智慧語音識別模型的記憶體搭配運算裝置，對接收的語音訊息進行內容判斷，以安全有效地執行身分驗證以及指令確認的功能。讓使用者只需再自動櫃員機前講述自己的身分或帳戶資料完成驗證後，再口語表達欲執行的銀行服務項目，如此一來一般的銀行業務皆能完全透過聲音控制的方式來完成，對各種族群來說都是便利的措施。

以上之關於本揭露內容之說明及以下之實施方式之說明係用以示範與解釋本發明之精神與原理，並且提供本發明之專利申請範圍更進一步之解釋。

以下在實施方式中詳細敘述本發明之詳細特徵以及優點，其內容足以使任何熟習相關技藝者了解本發明之技術內容並據以實施，且根據本說明書所揭露之內容、申請專利範圍及圖式，任何熟習相關技藝者可輕易地理解本發明相關之目的及優點。以下之實施例係進一步詳細說明本發明之觀點，但非以任何觀點限制本發明之範疇。

請參考圖1a至圖1c，圖1a為依據本發明一實施例所繪示的人工智能聲控銀行交易系統的方塊圖，圖1b為依據本發明一實施例所繪示的人工智能聲控銀行交易系統的使用情境的方塊圖，圖1c為依據本發明一實施例所繪示的人工智能聲控銀行交易系統的記憶體接收語音訊息的方塊示意圖。

如圖1a及圖1b所示，人工智能聲控銀行交易系統1包含自動櫃員機10、訊號連接於自動櫃員機10的運算裝置20、訊號連接於運算裝置20的記憶體30，及訊號連接於記憶體30的語音接收裝置40。自動櫃員機10是用於讓使用者C自助辦理銀行櫃檯服務，例如但不以此為限的，可為一般大眾使用的自動櫃員機(ATM)。運算裝置20用於對使用者C進行一身分驗證操作及一指令確認操作，也就是對使用者C進行身分確認並判斷使用者欲下達的指令，其中運算裝置20可為各種具有運算能力的處理器。記憶體30用於儲存一第一及第二語音訊息，並儲存有語音識別模型31、使用者C的一登記身分資料32及一指令資料庫33，其中記憶體30可為各種具有儲存資料之能力的儲存裝置。語音接收裝置40用於接收使用者C的第一及第二語音訊息並傳輸至記憶體30，其中語音接收裝置40可為一麥克風，且可鄰近設置於自動櫃員機10以接收來自使用者C的語音。

請一同參考圖1c，語音接收裝置40將第一語音訊息及第二語音訊息以訊號傳輸的方式傳遞至記憶體30中。上述兩語音訊息都會被運算裝置20透過語音識別模型31進行分析判斷，且第一語音訊息及第二語音訊息分別對應至登記身分資料32及指令資料庫33，此部分於後續描述。需要注意的是，圖1a至圖1c的不同方塊之間的連線可為實線或虛線，具體來說，不同方塊之間的訊號連皆可透過實體訊號線連接或透過無線通訊方式連接，本案不予限制。另一方面，如具本案通常知識者能理解的，上述除了圖1b的語音接收裝置40需鄰近設置於自動櫃員機10以滿足物理上聲波傳遞的有利條件外，其餘方塊可遠端設置於其他位置，例如運算裝置20可為中央處理器，記憶體30可為雲端資料庫等。當然，在一些實施例中，運算裝置20及記憶體30可鄰近設置於自動櫃員機10附近，以達到高效率的邊緣運算及防止資料攔截等的功效，此部分將於後續進行描述且不應成為本案限制條件。

關於本例的語音識別模型31，可為一種預先透過深度學習方法訓練的神經網路，具體來說，語音識別模型31可包含自動語音識別(Automatic Speech Recognition，ASR)軟體，使得理論上，運算裝置20可透過自動語音識別軟體進行以下步驟來完成本案的語音識別功能。一、使用者向語音接收裝置發出聲音訊息。二、將聲音訊息轉為聲波訊號。三、語音接收裝置中的濾波器濾除聲波訊號中的雜訊。四、將濾波後的聲波訊號分解為多組音素(Phonemes)(所謂音素，指組成語言的聲音的基本聲音塊，以英語來說，具有44個音素如「wh」、「th」及「t」等，而中文系統則較缺乏統一標準而沒有定數)。五、每個音素可組成一列表(list)，且可依序在統計上被分析。六、可透過自動語音識別軟體理解一段話的語意。

建立在上述自動語音識別的語音識別模型31可更具有兩種主要的變化形態，分別為直接對話(Directed Dialogue)模型及自然語言處理(Natural Language Processing，NLP)模型。在本文中，將主要以直接對話模型進行舉例，但是在其他實施例中，也可以使用自然語言處理模型，本案不限於此。所謂直接對話模型，係指可直接提供使用者一定範圍的特定選擇詞彙，使得機器在判斷語意上較使用自然語言處理模型容易。

基於上述圖1a至圖1c的人工智能聲控銀行交易系統1，請參考圖2a及圖2b，圖2a係依據本發明一實施例所繪示的人工智能聲控銀行交易系統在執行身分驗證的操作流程圖，圖2b係依據本發明一實施例所繪示的人工智能聲控銀行交易系統在執行指令確認的操作流程圖。

如圖2a所示，運算裝置執行的身分驗證操作S40包含，步驟S400：藉由語音識別模型擷取第一語音訊息中含有的一待定身分資料、步驟S401：比對待定身分資料與登記身分資料並確認待定身分資料符合登記身分資料，以及步驟S402：當判斷待定身分資料符合登記身分資料，運算裝置可對使用者進行指令確認操作。舉例來說，在步驟S400中，自動櫃員機可先向使用者發出訊息：「請講述使用者帳號及密碼。」，使用者便向語音接收裝置講述舉例由英文與數字組成的帳號及密碼(即第一語音訊息)，語音接收裝置在將聲波訊號傳輸至記憶體中，供運算裝置分析。在此情況下，運算裝置可主動採用包含英文與數字的音素的模型對聲波訊號進行分析，以得到一串輸入帳號及輸入密碼(即待定身分資料)。當然在其他實施例中，使用者未必要講述帳號及密碼，也可以是使用者姓名、身分證字號或生日等資訊，實現方式同上且本案不限於此。舉例來說，在步驟S401中，運算裝置會將該輸入帳號及輸入密碼與預先儲存的登記帳號及登記密碼(即登記身分資料)進行比對。進一步，運算裝置會先比對帳號以確定輸入帳號的對應密碼，再將輸入密碼與預先儲存的登記密碼進行比對，兩者都符合才算通過身分驗證操作。當然此步驟也可對使用者的其他資訊如姓名、生日等進行比對，在此不贅述。

如圖2b所示，運算裝置執行的指令確認操作S50包含，步驟S500：運算裝置藉由語音識別模型擷取第二語音訊息中含有的一待定指令資料、步驟S501：比對待定指令資料與指令資料庫中的多個執行指令資料、步驟S502：判斷待定指令資料對應的一執行指令資料，以及步驟S503：將該執行指令資料傳送至該自動櫃員機以執行相關服務。舉例來說，在步驟S500中，自動櫃員機可先向使用者發出訊息：「請講述您想進行的業務，包含存款、提款、轉帳……」，其中業務選項可被包含在圖1c的指令資料庫33中，使用者便向語音接收裝置講述欲執行的業務內容(即第二語音訊息)，語音接收裝置在將聲波訊號傳輸至記憶體中，供運算裝置分析。在此情況下，運算裝置可主動採用包含相關業務內容的音素的模型對聲波訊號進行分析，以得到相關的業務選項(即待定指令資料)。舉例來說，在步驟S501中，運算裝置會將待定指令資料(如「轉帳」)與預先儲存在指令資料庫中的執行指令資料(如「提款」、「轉帳」、「存款」等)進行比對，使得在步驟S502中能判斷出一執行指令資料(以本例來說，為「轉帳」)，並將該執行指令資料傳送至自動櫃員機中以執行相關服務。

具體來說，使用者可講述「轉帳」的服務項目，而運算裝置可將執行指令資料判斷為「轉帳」並讓自動櫃員機提供服務。而在其他實施例中，記憶體可更包含自然語言處理模型，用於讓運算裝置在特定情形下斟酌使用。舉例來說，當使用者講述的業務項目為「我要領錢」時，運算裝置透過自然語言模型可先抓出關鍵字為「錢」而降低較不相關的「我要」的權重，進一步理解「領錢」同義於指令資料庫中的「提款」指令，以避免「我要領錢」無法產生對應至「提款」指令之情形。

需要注意的是，步驟S503所述的執行相關服務在本例中可理解為執行與轉帳相關的服務，包括透過自動櫃員機向使用者索取轉帳帳號及金額等，也就是說，使用者會再次向語音接收裝置發出另一第二語音訊息，讓運算裝置擷取分析出進一步的資料。此外，步驟S503為可選擇性被設置的，例如當交易結束時，運算裝置可能直接向雲端伺服器發送交易紀錄而不將執行指令資料傳送至自動櫃員機。

請參考圖3，圖3係依據本發明一實施例所繪示的人工智能聲控銀行交易系統在執行身分驗證的另一操作流程圖。如圖3所示，在身分驗證的操作(S60)中，當運算裝置藉由語音識別模型擷取第一語音訊息中含有的一待定身分資料(步驟S600)時，運算裝置透過自動櫃員機向使用者發送一身分提示訊息，且透過從語音接收裝置接收來自使用者的一身分確認訊息(步驟S601)。舉例來說，當使用者講述帳號為「abc123」時，自動櫃員機可回應「abc123」的身分提示訊息，讓使用者確認本案系統所接收的語音訊息是否正確而回應一「是」或「否」(即身分確認訊息)。接著在步驟S602：運算裝置判斷身分確認訊息為一肯定訊息或一否定訊息。舉例來說，當自動櫃員機回應「abc723」的身分提示訊息，使用者可回應「否」(即否定訊息)，使得系統必須重新執行上述身分驗證操作，以獲得另一第一語音訊息。所謂重新執行身分驗證操作，表示使用者需重新講述帶有身分資料的第一語音訊息。具體來說，當運算裝置判斷身分確認訊息為否定訊息時，會透過自動櫃員機發出請求以要求該使用者提供另一第一語音訊息以更新該待定身分資料，之後再回到步驟S600。另一方面，若身分確認訊息為一肯定訊息，則運算裝置維持待定身分資料並執行步驟S603：運算裝置比對待定身分資料與登記身分資料以判斷待定身分資料通過身分驗證操作，以及步驟S604：運算裝置對使用者進行指令確認操作。此二步驟與上述的步驟S401及步驟S402相同，在此不贅述。特別來說，當運算裝置判斷待定身分資料與登記身分資料不相符而判斷待定身分資料未通過身分驗證時，運算裝置可則等待新的第一語音訊息輸入或透過ATM要求使用者輸入新的第一語音訊息。

請參考圖4，圖4係依據本發明一實施例所繪示的人工智能聲控銀行交易系統在執行操作確認的另一操作流程圖。如圖4所示，在指令確認的操作(S70)中，當運算裝置判斷待定指令資料對應的一執行指令資料(步驟S700)時，運算裝置可透過自動櫃員機向使用者發送一指令提示訊息，且透過從語音接收裝置接收來自使用者的一指令確認訊息(步驟S701)。舉例來說，當使用者說出「我要領兩千元」時，自動櫃員機可發出「請問您要提款嗎？」的指令提示訊息，使用者再回復「是」的指令確認訊息。關於如何從「領兩千元」對應到「提款」的方法，可參照上述直接對話模型或自然語言模型的描述，在此不贅述。接著於步驟S702，運算裝置判斷指令確認訊息為一肯定訊息或一否定訊息，若為肯定訊息則運算裝置可將執行指令資料傳送至自動櫃員機以執行相關服務(步驟S703)。或者，當指令確認訊息為否定訊息時，可重新執行指令確認操作，以獲得另一執行指令資料。也就是說，當運算裝置判斷指令確認訊息為非同意訊息時，運算裝置可透過自動櫃員機發出請求以要求該使用者提供另一第二語音訊息以更新該待定指令資料。例如：「請問您要提款嗎？」(指令提示訊息)、「不是」(指令確認訊息)、「請問您要進行何種業務？」(重新要求第二語音訊息)、「轉帳」(更新待定指令資料)、「請問您要轉帳嗎？」(指令提示訊息)、「是」(指令確認訊息)。

本案系統的變化實施例的身分驗證可進一步涵蓋影像辨識功能。請參照圖5a至圖5c，圖5a為依據本發明另一實施例所繪示的人工智能聲控銀行交易系統的方塊圖，圖5b為依據本發明另一實施例所繪示的人工智能聲控銀行交易系統的使用情境的方塊圖，圖5c為依據本發明另一實施例所繪示的人工智能聲控銀行交易系統的記憶體接收語音訊息及臉部影像資料的方塊示意圖。

如圖5a至圖5c所示，人工智能聲控銀行交易系統1’除了包含自動櫃員機10、運算裝置20、記憶體30’、語音接收裝置40以外，更包含影像擷取裝置50，連接至記憶體30’。如圖5b所示，影像擷取裝置50可例如為安裝在自動櫃員機10上的一攝像機，用於擷取使用者C的一臉部影像資料。如圖5c所示，記憶體30’更事先儲存有一臉部特徵偵測模型34及使用者的一登錄臉部特徵35。

請參照圖6，圖6係依據本發明另一實施例所繪示的人工智能聲控銀行交易系統在執行身分驗證的臉部識別的一操作流程圖。如圖6所示，運算裝置執行的身分驗證操作更包含一臉部識別操作，包含步驟S900：藉由該臉部特徵偵測模型擷取該臉部影像資料中含有的一待定臉部特徵、步驟S901：比對該待定臉部特徵與該登錄臉部特徵、步驟S902：判斷該待定臉部特徵是否符合該登錄臉部特徵，若該待定臉部特徵符合該登錄臉部特徵，則進行步驟S903：運算裝置執行其他身分驗證操作或該指令確認操作，而若待定臉部特徵不符合該登錄臉部特徵，則運算裝置重新執行該身分驗證操作。

舉例來說，影像擷取裝置在拍攝使用者的臉部影像後，可將影像資料傳輸至記憶體中，運算裝置可藉由臉部特徵偵測模型擷取該影像資料的特徵，其中，臉部特徵偵測模型可為具有深度學習能力的神經網路(如VGG-Face、Google FaceNet、OpenFace等)。以Google FaceNet為例，其並非一開始就輸出分類結果，而是先輸出量化特徵值，此運算可藉此將臉部特徵如輪廓擷取出來成為一待定臉部特徵，再於特徵向量空間中對不同臉部照片進行比較，以判別不同臉孔的相似度，換言之，在特徵向量空間中距離越近的兩點表示臉孔相似度越高。另外，記憶體儲存的登錄臉部特徵是關聯於上述登記身分資料，具體來說，當使用者先進行如圖2a步驟S401所示的比對身分資料後，該身分資料會對應至一登陸臉部特徵以用於比對。在臉部特徵的比對判斷上，可透過擷取使用者的多張影像來增加識別準確率，在此不贅述。需要注意的是，當運算裝置判斷待定臉部特徵不符合登錄臉部特徵時，表示使用者的身分資料可能有誤，需要重新執行身分驗證操作，也因此會再度進行上述臉部識別操作，然而圖6並沒有示出所有身分驗證操作，故步驟S902的否定箭頭以指向步驟S900表示，本案不限於此。

請參照圖7，圖7為依據本發明又一實施例所繪示的人工智能聲控銀行交易系統的又一記憶體接收訊息及資料的方塊示意圖。如圖7所示，記憶體30”更事先儲存有一唇形識別模型36(如LipNet)，而運算裝置更用於透過影像擷取裝置50擷取使用者的的多個唇部影像以獲得一動態唇形資料，且運算裝置20執行的該指令確認操作更包含一唇形識別操作。

請參照圖8，圖8為依據本發明又一實施例所繪示的人工智能聲控銀行交易系統在執行指令確認的唇形識別的一操作流程圖。如圖8所示，運算裝置執行的唇形識別操作S110包含步驟S1100：藉由唇形識別模型擷取動態唇形資料所包含的一參照指令資料、步驟S1101：判斷待定指令資料與參照指令資料是否相同，以及步驟S1102：保留待定指令資料。在步驟S1101中，若判斷待定指令資料與參照指令資料相同，則進行步驟S1102，若判斷待定指令資料與參照指令資料不同，表示語音識別模型得到的待定指令資料與唇形識別模型得到的參照指令資料不同，可重新進行上述指令確認操作。需要注意的是，本圖未示出所有指令確認操作，因此將表示「重新進行指令確認操作」的否定箭頭指向步驟S1100(意味著當重新進行指令確認操作，也可重新進行唇形識別操作)，本案不限於此。具體來說，唇形識別模型的原理類似於上述語音識別模型，可透過將口語分解為對應至不同發音的口形元素，並儲存為一序列供運算裝置進行分析，在此不詳述。需要注意的是，用於前述實施例的影像擷取裝置可僅具有拍攝影像功能，但在本實施例中，影像擷取裝置需具有錄製連續影片或拍攝高速連續影像的功能，以達成唇形識別。

請參照圖9，圖9為依據本發明其他實施例所繪示的人工智能聲控銀行交易系統的使用情境的方塊圖。如圖9所示，聲音接收裝置40可為使用者C的一行動裝置(如智慧型手機)，且聲音接收裝置40可更連接於運算裝置40。在本例中，使用者C的手機可與運算裝置20及記憶體30產生連線，具體來說，手機可透過與自動櫃員機10連線，再連線至運算裝置20及記憶體30，本案不限於此。使用者C可向手機講述個人資料及欲執行的銀行業務，使得周遭他人不易聽見隱私資料。同理，系統可透過手機向使用者C發出提示訊息，也避免被周遭人聽見。此外，手機更可用於接收來自系統的經過加密的一提示訊息並將該提示訊息轉為一提示音後播放給該使用者，增加資訊安全性。

請參照圖10，圖10為依據本發明其他實施例所繪示的人工智能聲控銀行交易系統的其他記憶體接收訊息及資料的方塊示意圖。如圖10所示，記憶體30’’’更事先儲存有一第一觸發訊息37及一第二觸發訊息38，且更用於接收來自語音接收裝置的一第三語音訊息。

請結合圖10參照圖11，圖11為依據本發明其他實施例所繪示的人工智能聲控銀行交易系統在受觸發的情況下的方塊流程圖。如圖11所示，當運算裝置透過語音接收裝置接收來自使用者的一第三語音訊息時，可判斷第三語音訊息是否符合第一觸發訊息或第二觸發訊息，若第三語音訊息符合第一觸發訊息，則重新執行上述身分驗證操作，若第三語音訊息符合第二觸發訊息，則重新執行指令確認操作，否則，不執行額外操作。具體來說，若一個使用者完成身分驗證訊息後，發現他/她是想對另一帳戶進行操作，便可對語音接收裝置發出符合第一觸發訊息的一第三語音訊息(如「重新驗證」)。類似的，若一個使用者說出要轉帳後，發現他/她其實是想提款，便可對語音接收裝置發出符合第二觸發訊息的一第三語音訊息(如「重新交易」)。當然，只要在過程中使用者避談上述第一觸發訊息或第二觸發訊息，系統便不會受到第三語音訊息之觸發而中斷交易。

依據本文的揭露，可達成以下描述的一種使用者情境，需要注意的是，此情境僅為一種舉例，本案不限於此。客戶前往自動櫃員機，依指示插入金融卡或點選無卡交易功能後，自動櫃員機播放語音指示客戶於指定時間內靠近麥克風，並講述身分驗證問題，如生日、電話、帳號及密碼等個人資訊。麥克風收到客戶語音，透過降躁技術過濾雜音，傳輸至本案系統內以判定客戶語音內容。系統判定身分驗證通過，於自動櫃員機播放系語音指示客戶於指定時間內靠近麥克風，講述交易項目(存款/提款/轉帳)及交易內容(帳號/金額)，若系統判定身分驗證未通過或逾時，重新回到上述身分驗證步驟。麥克風接收到客戶語音，系統辨識客戶交易內容，並再次於自動櫃員機播放語音指示客戶於指定時間內靠近麥克風，回覆交易確認/修改/取消指令。系統收到客戶確認指令，於自動櫃員機執行交易，若系統收到客戶修改指令，重新回到上述對應流程，若系統收到客戶取消或系統交易逾時，重新回到初始流程。客戶完成交易後，系統以電子郵件及簡訊傳送留存單據。

藉由上述結構，本案所揭示的人工智能聲控銀行交易系統，可透過儲存有人工智慧識別模型的記憶體搭配運算裝置，對接收的語音訊息進行內容判斷，以安全有效地執行身分驗證以及指令控制的功能。讓使用者只需再自動櫃員機前講述自己的身分資料完成驗證後，再口語表達欲執行的銀行服務項目，如此一來一般的銀行業務皆能完全透過聲音控制的方式來完成，對各種族群來說都是便利的措施。

雖然本發明以前述之實施例揭露如上，然其並非用以限定本發明。在不脫離本發明之精神和範圍內，所為之更動與潤飾，均屬本發明之專利保護範圍。關於本發明所界定之保護範圍請參考所附之申請專利範圍。

1:人工智能聲控銀行交易系統 10:自動櫃員機 20:運算裝置 30,30’,30”,30’’’:記憶體 31:語音識別模型 32:登記身分資料 33:指令資料庫 34:臉部特徵偵測模型 35:登錄臉部特徵 36:唇形識別模型 37:第一觸發訊息 38:第二觸發訊息 40:語音接收裝置 50:影像擷取裝置 C:使用者 S40:身分驗證操作 S400~S402,S500~S503,S600~S604,S700~S703,:

圖1a為依據本發明一實施例所繪示的人工智能聲控銀行交易系統的方塊圖。圖1b為依據本發明一實施例所繪示的人工智能聲控銀行交易系統的使用情境的方塊圖。圖1c為依據本發明一實施例所繪示的人工智能聲控銀行交易系統的記憶體接收語音訊息的方塊示意圖。圖2a係依據本發明一實施例所繪示的人工智能聲控銀行交易系統在執行身分驗證的操作流程圖。圖2b係依據本發明一實施例所繪示的人工智能聲控銀行交易系統在執行指令確認的操作流程圖。圖3係依據本發明一實施例所繪示的人工智能聲控銀行交易系統在執行身分驗證的另一操作流程圖。圖4係依據本發明一實施例所繪示的人工智能聲控銀行交易系統在執行操作確認的另一操作流程圖。圖5a為依據本發明另一實施例所繪示的人工智能聲控銀行交易系統的方塊圖。圖5b為依據本發明另一實施例所繪示的人工智能聲控銀行交易系統的使用情境的方塊圖。圖5c為依據本發明另一實施例所繪示的人工智能聲控銀行交易系統的記憶體接收語音訊息及臉部影像資料的方塊示意圖。圖6係依據本發明另一實施例所繪示的人工智能聲控銀行交易系統在執行身分驗證的臉部識別的一操作流程圖。圖7為依據本發明又一實施例所繪示的人工智能聲控銀行交易系統的又一記憶體接收訊息及資料的方塊示意圖。圖8為依據本發明又一實施例所繪示的人工智能聲控銀行交易系統在執行指令確認的唇形識別的一操作流程圖。圖9為依據本發明其他實施例所繪示的人工智能聲控銀行交易系統的使用情境的方塊圖。圖10為依據本發明其他實施例所繪示的人工智能聲控銀行交易系統的其他記憶體接收訊息及資料的方塊示意圖。圖11為依據本發明其他實施例所繪示的人工智能聲控銀行交易系統在受觸發的情況下的方塊流程圖。

1:人工智能聲控銀行交易系統

10:自動櫃員機

20:運算裝置

30:記憶體

40:語音接收裝置

Claims

一種人工智能聲控銀行交易系統，包含：一自動櫃員機，用於讓一使用者自助辦理銀行櫃檯服務；一運算裝置，連接於該自動櫃員機，用於對該使用者進行一身分驗證操作及一指令確認操作；一記憶體，連接於該運算裝置，用於儲存一第一語音訊息及一第二語音訊息，並事先儲存有一語音識別模型、該使用者的一登記身分資料及一指令資料庫；以及一語音接收裝置，連接於該記憶體，用於接收該使用者的該第一語音訊息及該第二語音訊息並傳輸至該記憶體，其中該運算裝置執行的該身分驗證操作包含：藉由該語音識別模型擷取該第一語音訊息中含有的一待定身分資料；以及比對該待定身分資料與該登記身分資料並確認該待定身分資料符合該登記身分資料，且該運算裝置執行的該指令確認操作包含：藉由該語音識別模型擷取該第二語音訊息中含有的一待定指令資料；以及比對該待定指令資料與該指令資料庫中的多個執行指令資料，以判斷與該待定指令資料對應的一執行指令資料。
如請求項1所述的人工智能聲控銀行交易系統，其中該運算裝置執行的該身分驗證操作更包含：當該運算裝置藉由該語音識別模型擷取該第一語音訊息中含有的該待定身分資料時，執行：透過該自動櫃員機向該使用者發送一身分提示訊息；該運算裝置透過從該語音接收裝置接收來自該使用者的一身分確認訊息，並判斷該身分確認訊息為一肯定訊息或一否定訊息；若該身分確認訊息為該肯定訊息，該運算裝置維持該待定身分資料；以及若該身分確認訊息為該否定訊息，該運算裝置透過該自動櫃員機發出請求以要求該使用者提供另一第一語音訊息以更新該待定身分資料。
如請求項1所述的人工智能聲控銀行交易系統，其中該運算裝置執行的該指令確認操作更包含：當該運算裝置判斷該待定指令資料對應的一執行指令資料時，執行：透過該自動櫃員機向該使用者發送一指令提示訊息；透過從該語音接收裝置接收來自該使用者的一指令確認訊息，並判斷該指令確認訊息為一同意訊息或一非同意訊息；若該指令確認訊息為該同意訊息，該運算裝置將該執行指令資料傳送至該自動櫃員機以執行相關服務；若該指令確認訊息為該非同意訊息，該運算裝置透過該自動櫃員機發出請求以要求該使用者提供另一第二語音訊息以更新該待定指令資料。
如請求項1所述的人工智能聲控銀行交易系統，其中該運算裝置執行的該指令確認操作更包含：當該運算裝置判斷該待定指令資料對應的一執行指令資料時，執行：將該執行指令資料傳送至該自動櫃員機以執行相關服務。
如請求項1所述的人工智能聲控銀行交易系統，更包含一影像擷取裝置，連接於該記憶體，用於擷取該使用者的一臉部影像資料，且該記憶體更事先儲存有一臉部特徵偵測模型及該使用者的一登錄臉部特徵，且該登錄臉部特徵關聯於該登記身分資料，其中，該運算裝置執行的該身分驗證操作更包含一臉部識別操作，包含：藉由該臉部特徵偵測模型擷取該臉部影像資料中含有的一待定臉部特徵；比對該待定臉部特徵與該登錄臉部特徵，以判斷該待定臉部特徵是否符合該登錄臉部特徵；若該待定臉部特徵符合該登錄臉部特徵，該運算裝置執行其他身分驗證操作或該指令確認操作；若該待定臉部特徵不符合該登錄臉部特徵，該運算裝置透過該自動櫃員機發出請求以要求該使用者提供另一第一語音訊息以更新該待定身分資料與該登記身分資料。
如請求項5所述的人工智能聲控銀行交易系統，其中該記憶體更儲存有一唇形識別模型，該運算裝置更用於透過該影像擷取裝置擷取該使用者的多個唇部影像以獲得一動態唇形資料，且該運算裝置執行的該指令確認操作更包含一唇形識別操作，包含：藉由該唇形識別模型擷取該動態唇形資料所包含的一參照指令資料；判斷該待定指令資料與該參照指令資料是否相同；若該待定指令資料與該參照指令資料相同，保留該待定指令資料；以及若該待定指令資料與該參照指令資料不同，該運算裝置透過該自動櫃員機發出請求以要求該使用者提供另一第二語音訊息以更新該待定指令資料。
如請求項1所述的人工智能聲控銀行交易系統，其中該語音接收裝置為該使用者的一行動裝置或一耳機設備。
如請求項1所述的人工智能聲控銀行交易系統，更包含該使用者的一行動裝置，連接於該自動櫃員機，用於接收加密的一提示訊息並將該提示訊息轉為一提示音後播放給該使用者。
如請求項1所述的人工智能聲控銀行交易系統，其中該記憶體更儲存有一第一觸發訊息及一第二觸發訊息，使得當該運算裝置透過該語音接收裝置接收來自該使用者的一第三語音訊息時，判斷該第三語音訊息是否符合該第一觸發訊息或該第二觸發訊息，若該第三語音訊息符合該第一觸發訊息，則重新執行該身分驗證操作，若該第三語音訊息符合該第二觸發訊息，則重新執行該指令確認操作，否則，不執行額外操作。
如請求項1所述的人工智能聲控銀行交易系統，其中該聲音接收裝置內具有一濾波器，用於濾除該第一語音訊息及該第二語音訊息中的雜音。