TWI770395B - 語音控制電視版銀行轉帳之裝置與方法 - Google Patents
語音控制電視版銀行轉帳之裝置與方法 Download PDFInfo
- Publication number
- TWI770395B TWI770395B TW108122294A TW108122294A TWI770395B TW I770395 B TWI770395 B TW I770395B TW 108122294 A TW108122294 A TW 108122294A TW 108122294 A TW108122294 A TW 108122294A TW I770395 B TWI770395 B TW I770395B
- Authority
- TW
- Taiwan
- Prior art keywords
- bank
- voice
- account
- transfer
- alias
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/4104—Peripherals receiving signals from specially adapted client devices
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/441—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
- H04N21/4415—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/443—OS processes, e.g. booting an STB, implementing a Java virtual machine in an STB or power management in an STB
- H04N21/4431—OS processes, e.g. booting an STB, implementing a Java virtual machine in an STB or power management in an STB characterized by the use of Application Program Interface [API] libraries
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/443—OS processes, e.g. booting an STB, implementing a Java virtual machine in an STB or power management in an STB
- H04N21/4438—Window management, e.g. event handling following interaction with the user interface
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/475—End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
- H04N21/4751—End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data for defining user accounts, e.g. accounts for children
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/47805—Electronic banking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8166—Monomedia components thereof involving executable data, e.g. software
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Child & Adolescent Psychology (AREA)
- Library & Information Science (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
一種語音控制電視版銀行轉帳之裝置與方法,應用於一網路電視機上盒或一智慧型電視,該方法包含:啟動一麥克風以接收一語音;將該語音與一第一資料庫所儲存的複數語音資料進行比對以轉譯為一文字類型之一語音譯文;依據一第二資料庫將該語音譯文進行校對與解析,當符合一銀行服務邏輯時產生一語音指令;將該語音指令轉為一音檔並透過一揚聲器播放,並提示以等待接收一確認執行指令,在一預設時間之內未接收到該確認執行指令時即放棄該語音指令之執行;以及,接收該確認執行指令以將該語音指令轉換為符合一銀行API規範的一銀行規範指令;上傳該銀行規範指令至一銀行伺服器,並接收對應該銀行規範指令的一執行結果。
Description
本發明是關於一種網路銀行的操作技術,特別是關於一種語音控制電視版網路銀行轉帳之裝置與方法。
根據維基百科所記載“網路電視機上盒,是2012年開始興起的一種電視網際網路終端裝置,也被稱作網際網路播放機、網際網路高畫質播放機、電視伴侶、電視盒子、網路機上盒等,亦常被簡稱作「盒子」。該裝置的作業系統通常基於tvOS或Android或Linux,藉由透過Wifi無線網路或乙太網等實體線路與網際網路進行連線。在連線網際網路之後,可以實現在傳統的電視上在線點播、在線電視直播、瀏覽網頁、收看海外電視與電影、甚至是玩遊戲。由於部分網路機上盒的操作相當簡單,價格低廉,而大受歡迎。導致近年有一些上市的智慧型電視機甚至將Android等系統附加在電視主機板內,實現了內建傳統電視機上盒。”
維基百科又記載“智慧型電視(Smart TV)又稱網際網路電視,是一種加入網際網路與物聯網功能的電視機。智慧型電視可以執行完整的作業系統,並含一個軟體平台,可以供應用軟體開發者開發他們自己的軟體在智慧型電視之上運行。目前智慧型電視多搭載Android系統。”
目前,在網路電視機上盒或智慧型電視上所運行的網路銀行軟體,並無任何語音控制的相關技術。舉凡查詢帳戶餘額資訊、查詢帳戶交易資訊、甚至轉帳,所有操作皆需透過遙控器(即,電視機上盒或智慧型電視的遙控器)來控制。當使用者需要輸入資料時(例如:轉出帳號、轉帳金額、轉入帳號…等),另需借助螢幕鍵盤(On-Screen Keyboard,又稱螢幕虛擬鍵盤)來輸入,然而,此種以遙控器搭配螢幕鍵盤的組合使得電視版網路銀行軟體在操作上較電腦版或行動版複雜許多。電腦版(諸如利用桌上型個人電腦或筆記型電腦的瀏覽器存取網路銀行服務)可讓使用者輕易以實體鍵盤及滑鼠(或觸控板)進行操作與資料輸入,而行動版(諸如運行在智慧型手機或平板電腦的行動銀行軟體)則是讓使用者以觸控方式直接在觸控螢幕上進行操作與資料輸入,相較之下,電視版網路銀行軟體的學習門檻比電腦版與行動版來得高,意即,使用者較不喜歡操作電視版的網路銀行。
目前,運用在電視的語音辨識技術有以下的幾種:先前技術一,中華民國專利公開號200826646,揭示了一種電視系統,包括有:一電視聲控裝置,係接收一第一聲音訊號及一第二聲音訊號,該電視聲控裝置包括:一語音輸入模組,係接收該第一聲音訊號及該第二聲音訊號至少其中之一,並輸出一語音訊號;一第一語音處理模組,係電性耦接至該語音輸入模組,用以對該語音訊號作放大與濾波處理後輸出;一第二語音處理模組,係電性耦接至該第一語音處理模組,該第二語音處理模組係接收該第一語音處理模組處理後之該語音訊號與該第二聲音訊號,用以根據該第二聲音訊號對該語音訊號作一消除運算後,輸出一還原後第一聲音訊號;一語音資料
庫,係儲存有多數個內建語音資料;以及一語音辨識模組,係電性耦接至該語音資料庫與該第二語音處理模組,且接收該還原後第一聲音訊號,該語音辨識模組係以該還原後第一聲音訊號與該些內建語音資料作比對,用以輸出一無線控制命令;以及一電視機,係以一無線方式接收該無線控制命令,並根據該無線控制命令作動。根據先前技術一所揭露之聲控電視機,可供使用者使用聲控方式去控制電視機的操作並直接執行語音指令之動作。
先前技術二,中華民國專利公開號201535157,揭示了一種語音輸入命令之方法,該方法包括檢測自一電子裝置之一使用者的至少一個語音輸入;將該至少一個語音輸入變換成包括至少一個字組之一文字結構;及決定該電子裝置之一目前情境範圍。該方法也包括比較該文字結構與多個既有文字結構,於該處該既有文字結構各自係與針對在該電子裝置上之一動作的一指令相聯結。該方法進一步包括當該文字結構匹配該等既有文字結構中之至少一者時,識別一指令以相對應於自該使用者之至少一個語音輸入;及基於該經識別之指令進行在該電子裝置上之一動作。先前技術二讓使用者以語音指令控制電子裝置而不需動手,同時,使用者的雙手仍可從事其它活動。
先前技術三,中華民國專利公告號M560646,揭示了一種智能語音交易系統,該系統包含:一處理主機,處理主機包括一儲存單元、一處理器、以及一傳輸單元,處理器電性連接至儲存單元和傳輸單元,傳輸單元用以接收一文字訊號,處理器用以執行儲存於儲存單元的一語意辨識模組,語意辨識模組進行文字訊號與儲存於儲存單元的一資料庫中的複數個
指令選項的匹配,從而產生對應指令選項的複數個信心指數,其中,處理器根據信心指數進行一反應,包括(a)當信心指數中之一者大於一預設值時,執行大於預設值之信心指數所對應的指令選項的動作。該系統進一步包括:一電子裝置,包括一語音輸入單元、一第二儲存單元、一第二處理器、以及一第二傳輸單元,其中該第二處理器電性連接至該語音輸入單元、該第二儲存單元、以及該第二傳輸單元,該第二處理器用以執行儲存於該第二儲存單元的一語音分析模組以分析藉由該語音輸入單元所接收的一語音訊號,從而產生該文字訊號,該第二傳輸單元設置以與該第一傳輸單元建立一通訊連結以傳送該文字訊號。先前技術三提供了系統性、且合適的智能語音交易方法,有助於改善手動操作之繁雜手續問題,讓一些特定使用者(例如老人)得以更簡單的操作,進而完成其業務目的。
由於先前技術一與先前技術二都是屬於通用型的語音控制,例如:直接操作電子裝置本身(如調整音量、轉換頻道、開/關電源)或是存取通用型的應用服務(如控制瀏覽器、相機應用程式),並未針對特定領域的應用(如,銀行服務)進行優化語音辨識技術,因此,先前技術僅利用一個通用型的資料庫來進行通用型的辨識,例如:先前技術一的語音資料庫,以及,先前技術二的資料庫80或外部資料庫20(參見其說明書[0046]段)皆屬於通用型的資料庫,換句話說,先前技術皆未針對網路銀行此一特定領域的應用提供優化技術以提高辨識準確度,而經辨識後所產生的命令/指令亦未針對網路銀行設計一套適用的防錯機制。至於先前技術三,雖然已是針對特定領域的應用(即,銀行服務),但先前技術三也僅利用一個資料庫122b(見其說
明書第[0017]段及第1圖)來做辨識,很難同時兼顧通用型及特定領域(銀行服務)的辨識準確度,另外,先前技術三同樣缺乏防錯機制,防止語音辨識錯誤而對應到不適當的指令。簡而言之,先前技術僅利用單一個資料庫來辨識指令,無法兼顧通用型及特定領域(銀行服務)的辨識準確度,以及,先前技術缺乏“針對網路銀行的防錯機制”,以致若直接採用先前技術的電視語音辨識技術於網路銀行領域有可能發生“誤辨識指令的問題”。意即,在極度講求數字精確、指令無誤的銀行業來講,先前技術無法有效提高應用在網路銀行的語音指令辨識精確度以滿足使用者需求。故,實有必要改善先前技術的方法,以硬體與軟體協同運作的資源提出一種語音控制電視版銀行轉帳(或/與交易)之技術,使得使用者的語音指令辨識度可以提高,並具有防錯機制以降低語音指令誤判的可能。
有鑑於此,本發明提出一種語音控制電視版銀行轉帳之裝置與方法,運用於網路電視機上盒或智慧型電視,讓使用者以口說出網路銀行轉帳的語音指令,語音指令於辨識之時係參照第一資料庫與第二資料庫,辨識後以語音回饋方式再次向使用者確認,使用者確認無誤後,再將其轉換成符合銀行API規範的銀行規範指令,以上傳至銀行伺服器執行。
本發明提出一種語音控制電視版銀行轉帳之裝置,該裝置包含:一網路模組,用以建立Internet網路連線;一語音接收模組,用以啟動一麥克風以接收一語音;一語音轉譯模組,將該語音與一第一資料庫所儲存的複數語音資料進行比對以轉譯為一文字類型之一語音譯文;一譯文校對
解析模組,依據一第二資料庫將該語音譯文進行校對與解析,當符合一銀行服務邏輯時產生一語音指令;一防錯機制模組,將該語音指令轉為一音檔並透過一揚聲器播放,並提示以等待接收一確認執行指令,在一預設時間之內未接收到該確認執行指令時即放棄該語音指令之執行;一網路銀行模組,產生一網銀服務視圖顯示於一螢幕,將該語音指令轉換為符合一銀行API規範的一銀行規範指令並上傳至一銀行伺服器,及,接收該銀行伺服器所回傳對應該銀行規範指令之一執行結果並更新顯示於該網銀服務視圖;一記憶體,安裝一作業系統並儲存一應用程式、該語音、該語音譯文、該語音指令、該銀行規範指令與該第二資料庫,該應用程式包含該語音接收模組、該語音轉譯模組、該譯文校對解析模組、該防錯機制模組、該網路銀行模組與該第二資料庫;該螢幕,用以顯示該應用程式之圖形化使用者介面;一或多個處理器,連接該麥克風、該揚聲器、該記憶體與該螢幕並執行該應用程式。
本發明更進一步,在一些實施例中,該銀行服務邏輯包含:一編輯帳戶別名邏輯,由一銀行帳號、一帳戶別名與一編輯帳戶別名指令組成,或,包含該編輯帳戶別名指令的任意組合,用以編輯帳戶之別名,使該銀行帳號與該帳戶別名產生對應關係並儲存至一帳戶別名清單;一查詢餘額邏輯,由該銀行帳號或該帳戶別名加上一查詢餘額指令所組成,或,包含該查詢餘額指令的任意組合,用以查詢銀行帳號之餘額;以及,該轉帳邏輯,由該銀行帳號或該帳戶別名、一轉帳金額與一轉帳指令所組成,或,由一轉出銀行帳號或一轉出帳戶別名、該轉帳金額、該轉入銀行帳號或一轉入帳戶別名與該轉帳指令所組成,或,包含該轉帳指令的任意組合,用以進行轉帳
交易。
本發明更進一步,在一些實施例中,該譯文校對解析模組更包含:當該語音譯文不符合該銀行服務邏輯且缺乏該銀行帳號或該帳戶別名時,以一模糊理論技術比對該帳戶別名清單以檢核出符合的該帳戶別名,並以該符合的帳戶別名校對該語音譯文。
本發明更進一步,在一些實施例中,該防錯機制模組更包含:當該語音指令包含該帳戶別名,且當該揚聲器播放該語音指令之該音檔時,接著以該揚聲器播放該帳戶別名所對應之該銀行帳號。
本發明更進一步,在一些實施例中,該防錯機制模組更包含:當該揚聲器播放該語音指令之該音檔時,同時以文字方式在該螢幕顯示該語音指令之一內容。
本發明更進一步,在一些實施例中,該防錯機制模組更包含:透過該揚聲器以語音回報該執行結果。
本發明更進一步,在一些實施例中,該第二資料庫係該帳戶別名清單。
本發明更進一步,在一些實施例中,該第二資料庫係包含該帳戶別名清單與一應用程式功能清單。
本發明更進一步,在一些實施例中,該第二資料庫係一約定戶清單。
本發明更進一步,在一些實施例中,該銀行帳號或該轉入銀行帳號係選自:一約定戶帳號或一非約定戶帳號。
本發明又提出一種語音控制電視版銀行轉帳之方法,應用於一網路電視機上盒或一智慧型電視,該方法包含:啟動一麥克風以接收一語音;將該語音與一第一資料庫所儲存的複數語音資料進行比對以轉譯為一文字類型之一語音譯文;依據一第二資料庫將該語音譯文進行校對與解析,當符合一銀行服務邏輯時產生一語音指令;將該語音指令轉為一音檔並透過一揚聲器播放,並提示以等待接收一確認執行指令,在一預設時間之內未接收到該確認執行指令時即放棄該語音指令之執行;接收該確認執行指令以將該語音指令轉換為符合一銀行API規範的一銀行規範指令;上傳該銀行規範指令至一銀行伺服器;以及,接收對應該銀行規範指令的一執行結果。
本發明更進一步,在一些實施例中,該銀行服務邏輯包含:一編輯帳戶別名邏輯,由一銀行帳號、一帳戶別名與一編輯帳戶別名指令組成,或,包含該編輯帳戶別名指令的任意組合,用以編輯帳戶之別名,使該銀行帳號與該帳戶別名產生對應關係並儲存至一帳戶別名清單;一查詢餘額邏輯,由該銀行帳號或該帳戶別名加上一查詢餘額指令所組成,或,包含該查詢餘額指令的任意組合,用以查詢銀行帳號之餘額;以及,一轉帳邏輯,由該銀行帳號或該帳戶別名、一轉帳金額與一轉帳指令所組成,或,由一轉出銀行帳號或一轉出帳戶別名、該轉帳金額、一轉入銀行帳號或一轉入帳戶別名與該轉帳指令所組成,或,包含該轉帳指令的任意組合,用以進行轉帳交易。
本發明更進一步,在一些實施例中,更包含:當該語音譯文
不符合該銀行服務邏輯且缺乏該銀行帳號或該帳戶別名時,以一模糊理論技術比對該帳戶別名清單以檢核出符合的該帳戶別名,並以該符合的帳戶別名校對該語音譯文。
本發明更進一步,在一些實施例中,更包含:當該語音指令包含該帳戶別名,且當該揚聲器播放該語音指令之該音檔時,接著以該揚聲器播放該帳戶別名所對應之該銀行帳號。
本發明更進一步,在一些實施例中,更包含:當該揚聲器播放該語音指令之該音檔時,同時以文字方式在該螢幕顯示該語音指令之一內容。
本發明更進一步,在一些實施例中,更包含:透過該揚聲器以語音回報該執行結果。
本發明更進一步,在一些實施例中,該第二資料庫係該帳戶別名清單。
本發明更進一步,在一些實施例中,該第二資料庫係包含該帳戶別名清單與一應用程式功能清單。
本發明更進一步,在一些實施例中,該第二資料庫係一約定戶清單。
本發明更進一步,在一些實施例中,該銀行帳號或該轉入銀行帳號係選自:一約定戶帳號或一非約定戶帳號。
以下在實施方式中詳細敘述本發明之詳細特徵以及優點,其內容足以使任何熟習相關技藝者瞭解本發明之技術內容並據以實施,且
根據本說明書所揭露之內容、申請專利範圍及圖式,任何熟習相關技藝者可輕易地理解本發明相關之目的及優點。
10:語音控制電視版銀行轉帳之裝置(如:網路電視機上盒、電視棒)
12a、12b、12c:處理器
14a、14b:記憶體
16:應用程式
18a、18b:作業系統
20a、20b:網路模組
22:電視
24a、24b:螢幕
26a、26b:揚聲器
28a、28b:麥克風
30:語音控制電視版銀行轉帳之裝置(如:智慧型電視)
32:語音接收模組
34:語音轉譯模組
36:譯文校對解析模組
38:防錯機制模組
40:網路銀行模組
42:編輯帳戶別名模組
44:第二資料庫
46:網銀服務視圖
48:語音指令
50:確認提示
第1圖為本發明實施例一裝置之系統功能方塊圖;第2圖為本發明實施例二裝置之系統功能方塊圖;第3圖為本發明一實施例應用程式之系統功能方塊圖;第4圖為本發明一實施例網銀服務視圖之示意圖;第5圖為本發明一實施例語音指令之示意圖;第6圖為本發明一實施例確認提示之示意圖;第7圖為本發明另一實施例確認提示之示意圖;及,第8圖為本發明實施例之操作流程圖。
本發明係使用於網路電視機上盒(IPTV Set-Top Box,Set-Top Box或稱Set-Top Unit)、智慧型電視(Smart TV)或電視棒(Chromecast TV Adapter),本發明應用程式(即,網路銀行軟體)係安裝於上述網路電視機上盒、智慧型電視或電視棒中。
參閱第1圖與第2圖,本發明實施例一與實施例二語音控制電視版銀行轉帳之裝置之系統功能方塊圖,圖例僅列出與本發明實施例相關之核心模組,其餘模組省略未描繪。第1圖係實施例一之系統功能方塊圖,而本實施例語音控制電視版銀行轉帳之裝置10即網路電視機上盒或電視
棒,本實施例的應用程式16係執行於語音控制電視版銀行轉帳之裝置10(網路電視機上盒或電視棒)上。在本發明的實施例一中,本發明語音控制電視版銀行轉帳之裝置10包含:一或多個處理器12a、記憶體14a、應用程式16、作業系統18a以及網路模組20a。其中,記憶體14a安裝有作業系統18a並儲存有應用程式16(即,網路銀行軟體);處理器12a執行作業系統18a以管理裝置10之硬體與軟體資源,以及執行應用程式16所包含的複數個程式指令並以硬體與軟體協同運作的方式實施以下模組:語音接收模組32、語音轉譯模組34、譯文校對解析模組36、防錯機制模組38、網路銀行模組40、編輯帳戶別名模組42及第二資料庫44;作業系統18a例如:Android TV、tvOS、Tizen、webOS、Opera TV…等等;網路模組20a用以建立Internet網路連線,如:有線寬頻、WLAN(Wi-Fi等)、行動通訊網路(如3G、4G、5G…)等等。由於網路電視機上盒或電視棒本身並不俱備顯示螢幕,故,本實施例語音控制電視版銀行轉帳之裝置10須外接電視22,以利用螢幕24a顯示應用程式16的圖形化使用者介面(GUI);揚聲器26a用以播放應用程式16產生的語音指令之音檔,以提供使用者語音回饋;麥克風28a,用以接收使用者之語音輸入,在一些實施例中麥克風28a係設置於電視22本體,在一些實施例中麥克風28a係設置於遙控器,在一些實施例中麥克風28a係設置於網路電視機上盒或電視棒本體。
第2圖係實施例二之系統功能方塊圖,而本實施例語音控制電視版銀行轉帳之裝置30即智慧型電視,與實施例一不同的地方係,本實施例裝置30即內建有作業系統18b、螢幕24b、揚聲器26b與麥克風28b。故,應用程式16的圖形化使用者介面直接顯示於內建的螢幕24b,應用程式16產生
的語音指令之音檔直接以內建的揚聲器26b播放。在一些實施例中,麥克風28b係設置於智慧型電視30本體;在一些實施例中麥克風28b係設置於遙控器。除此之外,本實施例其餘模組之功能與實施例一相同,故不另贅述。
繼續參閱第3圖,本發明一實施例應用程式16之系統功能方塊圖,其包含有:語音接收模組32、語音轉譯模組34、譯文校對解析模組36、防錯機制模組38、網路銀行模組40、編輯帳戶別名模組42及第二資料庫44。圖例僅列出與本發明一較佳實施例相關之核心模組,其餘模組省略未描繪。
語音接收模組32用以啟動麥克風28a、28b以接收使用者的語音輸入,所接收到的語音係暫時儲存於記憶體14a、14b中。在一些實施例中,使用者需按下遙控器上的特定按鍵(如:語音輸入鍵,未描繪)以啟動麥克風28a、28b開始收音。
語音轉譯模組34用以將儲存於記憶體14a、14b中的語音(即,聲音檔案,或稱音檔)與第一資料庫所儲存的複數筆語音資料進行比對以轉譯為文字類型之語音譯文。其中,第一資料庫係通用型的語音資料庫,儲存了多種使用情境的單字與詞彙的語音資料。所謂的通用型語音資料庫,主要係著重於日常生活常見用語的語音資料,或許涵蓋多數領域的部份用語,但因真實世界的資料量龐大,故,第一資料庫並無法針對每一個專業領域提供該領域內的所有完整語音資料。在一些實施例中,第一資料庫係儲存於記憶體14a、14b中,例如:作業系統18a、18b所內建的語音辨識軟體(又稱語音辨識引擎,未描繪),語音轉譯模組34可透過API或是直接存取記憶體14a、14b中的第一資料庫以比對出符合的單字與詞彙;在一些實施例中,第一資料庫
係設置於遠端的伺服器,語音轉譯模組34需透過API存取遠端的第一資料庫以比對出符合的單字與詞彙,例如:Google Cloud Speech API。不管第一資料庫位於本地端或是遠端,當語音轉譯模組34比對完成後即可得到一串文字類型的語音譯文,此語音譯文由語音轉譯模組34儲存於記憶體14a、14b中。
譯文校對解析模組36依據第二資料庫44將語音譯文進行校對(Correcting)與解析(Parsing),當符合「銀行服務邏輯」時產生語音指令。所謂的第二資料庫44係儲存有針對特定專業領域(即,網路銀行服務)的單字與字彙,主要係用以補強通用型資料庫(即,第一資料庫)在網路銀行服務不足之處,例如:原本語音為“轉帳500元給吳百”(假設其中的“吳百”為使用者所設定的帳戶別名,即轉入帳號的別名,再假設使用者的總歸戶僅有一個銀行帳戶,故可省略指定“轉出帳號”),在比對第一資料庫後產生的語音譯文被誤譯為“轉帳500元給500”,此錯誤的譯文實際上並無任何意義(因缺乏“轉入帳號”,即,收款人帳號),此錯誤的譯文若交由先前技術處理則會發生“無法執行”的結果,但是,經本發明的譯文校對解析模組36依據第二資料庫44(其中的帳戶別名清單)校對後即可修正為“轉帳500元給吳百”。在一些實施例中,第二資料庫44儲存有帳戶別名清單,其包含對應的銀行帳號以及帳戶別名(由使用者設定),例如:“013-039-12345678(實際銀行帳號)、吳百(使用者設定的別名)”。在一些實施例中,帳戶別名清單可包含複數個不同的別名以對應同一個銀行帳號,其可為:第一別名(系統設定的序號,如螢幕上的排列順序或清單中儲存的順序)、第二別名(使用者設定的短別名)、第三別名(使用者設定的長別名,當作備註用的資訊)…等,例如:
“1(第一別名,系統設定的序號)、吳百(第二別名,使用者設定的短別名)、每月孝親費用(第三別名,使用者設定的備註)、013-039-12345678(實際銀行帳號)”,如第7圖所示;在一些實施例中,第二資料庫44另儲存有應用程式功能清單,此係包含應用程式16所提供的所有功能與資訊之詞彙,例如:“匯款、轉帳、約定戶、非約定戶、查詢餘額、查詢交易明細、…”。
所謂的「銀行服務邏輯」係預先設定好如同公式般的檢查要件,用來判斷語音譯文是否符合銀行服務情境中的用語,其可包含:編輯帳戶別名邏輯、查詢餘額邏輯、轉帳邏輯、網路銀行軟體(應用程式16)操作邏輯…等。編輯帳戶別名邏輯,由銀行帳號、帳戶別名與編輯帳戶別名指令組成,或,包含編輯帳戶別名指令的任意組合(例如:單獨使用編輯帳戶別名指令、使用編輯帳戶別名指令與銀行帳號、使用編輯帳戶別名指令與帳戶別名),編輯帳戶別名邏輯可用於編輯帳戶之別名,使銀行帳號與帳戶別名產生對應關係並儲存至帳戶別名清單。所謂的編輯帳戶別名指令係指驅動此一工作的關鍵字/詞、相關字/詞或同義字/詞,例如:編輯別名、新增別名、修改別名、刪除別名、編輯名稱、新增名稱、修改名稱、刪除名稱…等指令。查詢餘額邏輯,由銀行帳號或帳戶別名加上查詢餘額指令所組成,或,包含查詢餘額指令的任意組合(例如:單獨使用查詢餘額指令、使用查詢餘額指令與銀行帳號、使用查詢餘額指令與帳戶別名),查詢餘額邏輯可用於查詢銀行帳號之餘額,而查詢餘額指令例如:查詢餘額、查餘額、查詢、餘額、剩多少、有多少…等指令。轉帳邏輯,由銀行帳號或帳戶別名、轉帳金額(含/不含單位)與轉帳指令所組成,或,由轉出銀行帳號或轉出帳戶別名、轉帳
金額(含/不含單位)、轉入銀行帳號或轉入帳戶別名與轉帳指令所組成,或,包含轉帳指令的任意組合(例如:單獨使用轉帳指令、使用轉帳指令與轉帳金額、使用轉帳指令與銀行帳號或帳戶別名…等),轉帳邏輯可用於進行轉帳交易,而轉帳指令例如:轉帳、轉、匯款、匯錢、匯…等。網路銀行軟體(應用程式16)操作邏輯,由應用程式功能及操作指令(例如:切換、顯示、上一頁、下一頁、向下捲動、向上捲動、向右捲動、向左捲動、字體放大、字體還原…等)組成,例如:“顯示總歸戶”、“切換主選單”。在一些實施例中,因缺乏某一(或某些)檢查要件而不符銀行服務邏輯時,本發明即以互動式語音向使用者詢問所缺乏的要件,而不需在第一次檢查時即須符合所有要件。例如:使用者單獨使用編輯帳戶別名指令,本發明再以互動式語音向使用者詢問要編輯哪一個銀行帳號或是哪一個帳戶別名,使用者答覆後,本發明再次以互動式語音向使用者詢問尚缺乏的要件。
譯文校對解析模組36依據第二資料庫44將語音譯文進行校對與解析,其中,校對與解析這兩項工作並非固定地各執行一次,而是視情況而定,亦有可能反覆進行複數次。當譯文校對解析模組36解析時發現原始的語音譯文不符合任何銀行服務邏輯,即以“最接近的銀行服務邏輯”來校對語音譯文,例如:假設使用者所輸入的語音為“轉帳500元給吳百”,再假設原始的語音譯文為“轉帳500元給500”,譯文校對解析模組36解析後判斷此語音譯文包括了“轉帳指令”(即,“轉帳”)、“轉帳金額與單位”(即,“500元”),與此語音譯文最接近的銀行服務邏輯為轉帳邏輯,唯,缺乏了“銀行帳號”或“帳戶別名”此檢查要件,(因語音譯文減去已
辨識的詞彙後僅剩下“給500”,而“給500”並不在第二資料庫44的帳戶別名清單),故,譯文校對解析模組36以轉帳邏輯(最接近的銀行服務邏輯)來校對語音譯文以補足所乏的“銀行帳號”或“帳戶別名”。在一些實施例中,譯文校對解析模組36以同音異字方式來檢核並校對語音譯文;在一些實施例中,則以近音異字方式來檢核並校對語音譯文;在一些實施例中,則以補缺漏字方式來檢核並校對語音譯文,不管是同音異字、近音異字或是補缺漏字;此三種方式皆屬於模糊理論(Fuzzy Logic)技術。譯文校對解析模組36在校對時,依據帳戶別名清單把“給500”校對為“給吳百”(承前例,假設“吳百”為帳戶別名清單中使用者自訂的別名),被校對後的語音譯文即為“轉帳500元給吳百”。校對之後,譯文校對解析模組36再次解析“轉帳500元給吳百”,當判斷其符合轉帳邏輯後即產生語音指令,此語音指令即“轉帳500元給吳百”(承前例,假設使用者的總歸戶僅有一個銀行帳號,故,不需指定轉出帳號)。上述所舉例子係無關約定戶或非定戶轉帳,本發明可應用於約定戶轉帳,亦可應用於非約定戶轉帳,唯,應用於非約定轉帳時另有其他限制(如,每日轉帳限額或單筆轉帳限額)與特定步驟(如,以晶片金融卡及讀卡機驗證,或,以OTP簡訊驗證)需依循。
防錯機制模組38將語音指令轉為音檔並透過揚聲器26a、26b播放,並提示以等待接收確認執行指令,在預設時間之內未接收到確認執行指令時即放棄該語音指令之執行。所謂的防錯(Fool-Proof,或稱防呆)機制,係用以預防某一作業環節發生錯誤時,可即時中斷處理,避免傷害擴大,在本發明中,防錯機制模組38係以語音回請方式向使用者確認所接收到的語
音指令是否正確,避免語音辨識中間過程因誤判而產生錯誤指令最後造成使用者的損失。故,播放語音回饋後若使用者未在預設的時間之內下達“確認執行指令”,防錯機制模組38即自動放棄該語音指令。將語音指令轉為音檔並透過揚聲器26a、26b播放需以“文字轉語音”(Text-to-Speech)技術處理,此為成熟的習見技術,故不贅述,在一些實施例中,防錯機制模組38內建文字轉語音引擎,可直接在本地端轉為音檔;在一些實施例中,防錯機制模組38透過作業系統18a、18b所內建的文字轉語音引擎,亦可直接在本地端轉為音檔;在一些實施例中,防錯機制模組38透過API利用設於遠端伺服器的文字轉語音引擎,最後將產生的音檔下載回本地端。所謂的確認執行指令即使用者聽取語音回饋後,所下達的確認動作,在一些實施例中,使用者透過麥克風28a、28b以口頭回覆“確認”(即產生確認執行指令)。本實施例達成了以全語音控制應用程式16,使得有視障間題的投資者亦可以全語音控制方式操作網路銀行軟體;在一些實施例中,使用者按下遙控器之“確認鍵”(即產生確認執行指令)。承前例:當揚聲器26a、26b播放語音回饋“轉帳500元給吳百”後,接著立即再播放確認提示“是否確認?請說確認,或按下遙控器的確認鍵”;在一些實施例中,使用者需正確說出帳戶別名所對應的部份帳號(例如:所對應的銀行帳號最後四碼),以確認轉帳對象(即,帳戶別名)無誤,才可產生確認執行指令。在一些實施例中,當揚聲器26a、26b播放語音回饋與確認提示時,同時,防錯機制模組38以文字方式在螢幕24a、24b顯示語音指令48(如第5圖所示)及確認提示50(如第6圖所示)。
在一些實施例中,防錯機制模組38將語音指令轉為音檔並
透過揚聲器26a、26b播放之時,當語音指令同時包含帳戶別名時,防錯機制模組38查詢帳戶別名清單,並將所對應的銀行帳號轉為音檔再透過揚聲器26a、26b播放,以讓使用者聽取語音回饋之時可同時確認轉帳的對象,更可降低錯誤的發生。例如:承前例,當揚聲器26a、26b播放“轉帳500元給吳百”後,接著立即再播放“銀行帳號013-039-12345678”,最後再播放確認提示“是否確認?請說確認,或按下遙控器的確認鍵”。
在一些實施例中,防錯機制模組38更包含:當語音指令執行完畢後,透過揚聲器26a、26b以語音回報執行結果,例如:當執行完語音指令“轉帳500元給吳百”以語音回報“轉帳成功”,讓使用者不必盯著螢幕24a、24b,即可聽取執行結果。在一些實施例中,防錯機制模組38更包含:當語音指令執行轉帳交易完畢後,透過揚聲器26a、26b以語音回報轉出帳戶的餘額,例如:當執行完語音指令“轉帳500元給吳百”以語音回報“帳戶餘額5888元”,讓使用者不必盯著螢幕24a、24b,即可聽取轉帳後的餘額。在一些實施例中,“以語音回報執行結果”此一工作亦可拆開由其他模組(未描繪)負責執行,而非防錯機制模組38負責。
網路銀行模組40,係所有銀行服務子功能的一個統稱,可提供帳戶查詢、轉帳…等服務,其將語音指令轉換為符合銀行API規範的銀行規範指令,再透過網路模組20a、20b與遠端的銀行伺服器建立連線並上傳銀行規範指令與下載對應銀行規範指令的執行結果,以及,產生網銀服務視圖46並更新顯示於螢幕24a、24b。例如:防錯機制模組38收到確認執行指令後,網路銀行模組40將原本較接近口語化的語音指令轉換為符合銀行API規範
的程式碼指令,然後把銀行規範指令上傳到遠端的銀行伺服器(其係透過網路模組20a、20b與遠端的銀行伺服器建立連線),銀行伺服器端執行完畢後,再回傳執行結果(如,轉帳成功後的帳戶餘額)給網路銀行模組40,再產生網銀服務視圖46(如第4圖所示)顯示於螢幕24a、24b。
編輯帳戶別名模組42,依據編輯帳戶別名指令編輯帳戶別名清單,編輯帳戶別名指令即“編輯/新增/刪除/修改帳戶別名”,例如:新增帳戶別名指令,用以新增帳戶別名在某一個銀行帳號上(即,新增帳戶別名與銀行帳號的對應關係);再例如:刪除帳戶別名指令,用以刪除某一個銀行帳號所對應的既有帳戶別名;再例如:修改帳戶別名指令,用以修改某一個銀行帳號所對應的既有帳戶別名。編輯帳戶別名指令亦可包含相近的關鍵字/詞、同義字/詞…等。本發明讓使用者在語音輸入時可利用帳戶別名替代長串的銀行帳號,不但可提高語音辨識率,並可避免使用者誤說/誤讀長串銀行帳號的風險,更能縮短使用者語音輸入的時間(包含省略了反覆目視以檢查長串帳號是否錯誤的時間)。在一些實施例中,編輯帳戶別名模組42可讓使用者設定銀行帳號所對應的相片或圖示,當使用者以語音指令轉帳到有設定對應相片或圖示的銀行帳號/帳戶別名時,可在螢幕24a、24b顯示對應相片或圖示,藉由視覺效果(即,對應銀行帳號/帳戶別名的相片或圖示)可讓使用者快速檢視指定的收款對象是否正確。
第二資料庫44除了儲存帳戶別名清單,另儲存了針對網路銀行服務的單字與字彙(即,應用程式功能清單),以補強通用型資料庫(即,第一資料庫)在網路銀行領域不足之處。在一些實施例中,其與第一資料庫
差異之處在於,第一資料庫係儲存通用領域之語音資料的聲音檔案,而第二資料庫44係儲存網路銀行領域之文字類型的單字與字彙;在一些實施例中,第二資料庫44與第一資料庫係同樣儲存語音資料的聲音檔案,其差異僅在第一資料庫係儲存通用領域之語音資料,而第二資料庫44係儲存網路銀行領域之語音資料,於一些實施例中,當譯文校對解析模組36對語音譯文進行解析時未有符合的銀行服務邏輯時,譯文校對解析模組36不直接對語音譯文進行校對,而是改用第二資料庫44的語音資料重新對儲存於記憶體14a、14b中的語音進行比對以轉譯為文字類型之語音譯文,接著,再次對新的語音譯文進行解析以判斷是否符合銀行服務邏輯。
參閱第4圖,本發明一實施例網銀服務視圖46之示意圖,其係顯示於螢幕24a或螢幕24b。圖例說明了本發明應用程式16之網銀服務視圖46提供了數項網路銀行服務,使用者可以遙控器(未圖示)選擇服務,或是,以語音控制選擇服務項目。圖例中的服務項目僅為說明用途,而非用以限定本發明之範圍,在一些其他實施例中,可包含更多的服務項目,例如:查詢記錄、信用卡服務、繳費…等。若以遙控器操作進行轉帳,使用者大致的操作步驟為:以上/下鍵選擇轉帳服務→按下確認鍵→輸入帳號約8~14位數(承前例,需輸入14個數字)→以按鍵選擇金額欄位→輸入金額→按下確認鍵;若以語音控制進行轉帳,使用者大致的操作步驟為:按下語音輸入鍵→以口說出語音指令(承前例:“轉帳500元給吳百”,其中吳百為帳戶別名)→按下確認鍵,以上兩種操作步驟皆同時略過驗證流程以方便進行比較,相較之下,可知利用本發明的語音控制可大幅降低遙控器的按鍵操作次數,意即,
以語音控制來輔助操作電視版網路銀行可以降低遙控器的操作不便性。當使用者以語音控制應用程式16(網路銀行軟體)時,螢幕24a或螢幕24b上顯示的畫面可以是應用程式16任意視圖之中。
參閱第5圖為本發明一實施例語音指令48之示意圖。圖例所顯示的語音指令48係經第二資料庫44校對與解析過,並且確認符合銀行服務邏輯的版本。
參閱第6圖為本發明一實施例確認提示50之示意圖。承前例的語音指令(如第5圖所示),此例係假設使用者之總歸戶僅有一個銀行帳號,故,無須指定轉出帳號,而圖例中的銀行帳號(即,轉入帳號)係對應帳戶別名“吳百”的帳號,圖例說明了當使用者按下確認提示50中的“確認鍵”後即可產生確認執行指令。
參閱第7圖為本發明另一實施例確認提示50之示意圖,本實施例確認提示50係假設使用者的語音指令為“編輯帳戶別名”,由於語音中未指名要編輯哪一個帳戶別名,故,確認提示50依據帳戶別名清單將所有的帳戶別名顯示在螢幕上供使用者選擇。在一些實施例中,當使用者下達語音指令“編輯帳戶別名”時,確認提示50將所有的約定戶銀行帳號顯示在螢幕上供使用者選擇,其中包含未設定帳戶別名的約定戶。在一些實施例中,帳戶別名亦可儲存於約定戶清單之中,而約定戶清單亦可視為第二資料庫44的一部份。
參閱第8圖,本發明實施例之操作流程圖,使用者利用網路電視機上盒、電視棒或智慧型電視執行應用程式16並以語音控制轉帳之操
作流程,請同時參考第1圖、第2圖、第4圖、第4圖、第5圖及第6圖,此流程係包含:
步驟S101:於裝置10上執行本發明應用程式16。使用者於語音控制電視版銀行轉帳之裝置10(網路電視機上盒或電視棒)或語音控制電視版銀行轉帳之裝置30(智慧型電視)上執行本發明之應用程式16(網路銀行軟體)。
步驟S102:進行登入驗證作業。處理器12a、12c執行應用程式16後,使用者須登入驗證,使用者以帳號及密碼進行登入驗證作業;在一些實施例中,使用者係以生物驗證方法進行登入驗證;在一些實施例中,使用者需以OTP簡訊密碼進行登入驗證;在一些實施例中,使用者係以晶片金融卡與讀卡機進行登入驗證。
步驟S103:顯示網銀服務視圖46。登入驗證後,網路銀行模組40產生網銀服務視圖46並顯示於螢幕24a、24b上,如第4圖所示。假設使用者欲進行轉帳,使用者可用遙控器控制以選擇轉帳服務項目,再輸入銀行帳號與金額,或,直接以語音控制下達轉帳的語音指令。
步驟S104:啟動麥克風28a、28b以接收語音。處理器12a、12c執行語音接收模組32以啟動麥克風28a、28b接收使用者的語音輸入。在一些實施例中,使用者按下遙控器上的語音輸入鍵(未描繪)以啟動麥克風28a、28b開始收音。假設此步驟使用者所輸入的語音為“轉帳500元給吳百”,輸入後,語音接收模組32將語音(此為音檔)儲存至記憶體14a、14b中。
步驟S105:將語音與第一資料庫進行比對以轉譯為語音譯文。語音儲存至記憶體14a、14b後,處理器12a、12c執行語音轉譯模組34,以將語音與第一資料庫所儲存的複數筆語音資料進行比對以轉譯為文字類型之語音譯文。在一些實施例中,第一資料庫係儲存於記憶體14a、14b中;在一些實施例中,第一資料庫係設置於遠端的伺服器。假設此步驟所轉譯出的語音譯文為“轉帳500元給500”(因第一資料庫係通用型資料庫,例如:Google Cloud Speech API,因缺乏第二資料庫的帳戶別名清單,故,不認得帳戶別名“吳百”),轉譯為語音譯文後,語音轉譯模組34將語音譯文儲存至記憶體14a、14b中。
步驟S106:依據第二資料庫44將語音譯文進行校對與解析以產生語音指令。語音譯文儲存至記憶體14a、14b後,處理器12a、12c執行譯文校對解析模組36,並依據第二資料庫44將語音譯文進行校對與解析,當譯文校對解析模組36解析時發現原始的語音譯文不符合任何銀行服務邏輯(因第二資料庫44中並無任何帳戶別名叫“給500”),即以“最接近的銀行服務邏輯”來校對語音譯文,於此,譯文校對解析模組36以轉帳邏輯(最接近的銀行服務邏輯,因語音譯文中包含“轉帳”)來校對前一步驟所產生的語音譯文以補足所缺乏的銀行帳號或帳戶別名,被校對後的語音譯文即為“轉帳500元給吳百”,譯文校對解析模組36將被校對後的語音譯文儲存至記憶體14a、14b。校對之後,譯文校對解析模組36再次解析“轉帳500元給吳百”,當判斷其符合轉帳邏輯後即產生語音指令,此語音指令即“轉帳500元給吳百”,此時,譯文校對解析模組36再將產生的語音指
令儲存至記憶體14a、14b。當再次解析仍被判斷無符合的銀行服務邏輯時,在一些實施例中,在螢幕24a、24b上列出一至複數個最接近的銀行服務邏輯(僅缺乏一個指令或關鍵字),同時,以互動式語音詢問使用者何者才是原意,並詢問所缺乏的指令或關鍵字為何。例如,假設當校對後的語音譯文為“轉帳給吳百”,而譯文校對解析模組36再次解析時判斷最接近的銀行服務邏輯為轉帳邏輯,因語音譯文中包含“轉帳”的轉帳指令,也包含了銀行帳號或帳戶別名,但明顯缺乏了“轉帳金額”,因此,本發明以互動式語音向使用者詢問:“轉帳金額要多少?”或“轉帳金額為何?”,以獲得完整的轉帳邏輯。
因此,透過本發明以銀行服務邏輯來檢查語音譯文與校對後的語音譯文,再透過互動式語音與使用者的互動,即可確保使用者講出符合銀行服務邏輯的語音內容,達到使用者不須明白銀行服務邏輯,即可透過本發明的技術有效地實現以語音控制網路銀行服務的特殊技術目的。
步驟S107:將語音指令轉為音檔並透過揚聲器26a、26b播放。產生語音指令儲存至記憶體14a、14b後,處理器12a、12c執行防錯機制模組38,以將語音指令轉為音檔並透過揚聲器26a、26b播放(此即語音回饋)。在一些實施例中,於此步驟螢幕24a、24b亦同時顯示語音指令48,如第5圖所示。
步驟S108:提示以等待接收確認執行指令。播放語音回饋後,處理器12a、12c繼續執行防錯機制模組38,在一些實施例中,透過揚聲器26a、26b播放確認提示並等待接收確認執行指令;在一些實施例中,
於螢幕24a、24b顯示確認提示50並等待接收確認執行指令,如第6圖所示。若使用者未於預設時間(例如:“30秒鐘”)之內下達確認執行指令,防錯機制模組38即中止此操作流程,並放棄該語音指令。
步驟S109:接收確認執行指令以轉換為銀行規範指令。在一些實施例中,使用者透過麥克風28a、28b以口頭回覆“確認”、“正確”、“完成”、“送出”之類的確認相關語音(即產生確認執行指令);在一些實施例中,使用者按下遙控器之“確認鍵”(即產生確認執行指令)。接收確認執行指令後,網路銀行模組40即按照遠端銀行伺服器所提供的銀行API規範以將語音指令轉換為符合的銀行規範指令,意即,將原本較為“口語化”的語音指令改寫為符合銀行API規範的程式碼指令,並儲存至記憶體14a、14b。
步驟S110:上傳銀行規範指令至銀行伺服器。網路銀行模組40轉換為符合的銀行規範指令後,即上傳銀行規範指令至遠端的銀行伺服器。銀行伺服器執行後再回傳對應銀行規範指令(即,前一步驟所上傳的指令)的執行結果給網路銀行模組40,並儲存至記憶體14a、14b。
步驟S111:透過揚聲器26a、26b以語音回報執行結果。銀行伺服器回傳對應上傳銀行規範指令的執行結果後,將執行結果以語音透過揚聲器26a、26b回報,例如:“轉帳成功”、“帳戶餘額不足,轉帳失敗”、“轉帳成功,帳戶餘戶為XXX元”…等執行結果(未描繪),讓使用者不需看螢幕24a、24b,即可透過語音回報明瞭執行得如何。
對本發明的不同實施例可理解的是,由電腦執行的程式指令
可實行流程圖中的各個方塊、流程圖中方塊的組合、以及各實施例中的步驟。把該等程式指令提供給一處理器操作以產生一機器或產生硬體與軟體協同運作的資源,藉此在該處理器上執行該等指令時,將產生用以實行流程圖方塊指明之動作或技術效果的構件。不同集合的程式指令亦可使展示於流程圖方塊中的至少某些操作步驟並行地進行,且一應用程式的各個程式指令所表達的技術內容可能依不同實施例而不同。再者,亦可在不只一個處理器上進行某些該等步驟,例如本發明裝置中微處理器與周邊介面處理器所協同運作的狀況。此外,在不偏離本發明範圍或精神的條件下,流程圖中之一或多個方塊或方塊的組合亦可與其他方塊或方塊組合同時地進行,或甚至以不同於展示出的順序來進行。
因此,本發明流程圖的方塊支援用以進行指明動作或技術效果的構件組合、用以進行指明動作或技術效果的步驟組合、以及用以進行指明動作或技術效果的程式指令構件。亦可了解的是,這些指明動作或技術效果是由特殊用途硬體式系統或者特殊用途硬體與程式指令協同運作來實行本發明流程圖的各個方塊以及流程圖的方塊組合。
綜上所述,本發明提出一種語音控制電視版銀行轉帳之技術,解決了先前技術未針對網路銀行服務提供優化技術以提高語音指令的辨識準確度,且先前技術亦未針對網路銀行服務設計一套適用的防錯機制,藉由本發明使得使用者的語音指令辨識度可以提高,並具有防錯機制以降低語音指令誤判的可能,另外,本發明的語音控制與語音回饋技術更可幫助有視障問題的投資者以全語音控制的方式操作金融軟體,彌補了先前技術不足
之處。
雖然本發明的技術內容已經以較佳實施例揭露如上,然其並非用以限定本發明,任何熟習此技藝者,在不脫離本發明之精神所作些許之更動與潤飾,皆應涵蓋於本發明的範疇內,因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。
16:應用程式
32:語音接收模組
34:語音轉譯模組
36:譯文校對解析模組
38:防錯機制模組
40:網路銀行模組
42:編輯帳戶別名模組
44:第二資料庫
Claims (16)
- 一種語音控制電視版銀行轉帳之裝置,該裝置包含:一網路模組,用以建立Internet網路連線;一語音接收模組,用以啟動一麥克風以接收一語音;一語音轉譯模組,將該語音與一第一資料庫所儲存的複數語音資料進行比對以轉譯為一文字類型之一語音譯文;一譯文校對解析模組,依據一第二資料庫將該語音譯文進行校對與解析,當符合一銀行服務邏輯時產生一語音指令;一防錯機制模組,將該語音指令轉為一音檔並透過一揚聲器播放,並提示以等待接收一確認執行指令,在一預設時間之內未接收到該確認執行指令時即放棄該語音指令之執行;一網路銀行模組,產生一網銀服務視圖顯示於一螢幕,將該語音指令轉換為符合一銀行API規範的一銀行規範指令並上傳至一銀行伺服器,及,接收該銀行伺服器所回傳對應該銀行規範指令之一執行結果並更新顯示於該網銀服務視圖;一編輯帳戶別名模組,依據一編輯帳戶別名指令編輯一帳戶別名清單,其中,該編輯帳戶別名指令包括編輯/新增/刪除/修改帳戶別名;一記憶體,安裝一作業系統並儲存一應用程式、該語音、該語音譯文、該語音指令、該銀行規範指令與該第二資料庫,該應用程式包含該語音接收模組、該語音轉譯模組、該譯文校對解析模組、該防錯機制模組、該網路銀行模組與該第二資料庫;該螢幕,用以顯示該應用程式之圖形化使用者介面; 一或多個處理器,連接該麥克風、該揚聲器、該記憶體與該螢幕並執行該應用程式;以及,其中,當該銀行服務邏輯為一轉帳邏輯時,該語音指令以一帳戶別名取代一轉入銀行帳號以進行轉帳交易;其中,該銀行服務邏輯由複數個檢查要件組成,當該譯文校對解析模組將該語音譯文進行校對與解析後,因缺乏該些檢查要件其中之一或多個檢查要件而不符該銀行服務邏輯時,以互動式語音詢問以取得所缺乏的該一個或多個該檢查要件;其中,該銀行服務邏輯包含:一編輯帳戶別名邏輯,由一銀行帳號、一帳戶別名與該編輯帳戶別名指令組成,或,包含該編輯帳戶別名指令的任意組合,為編輯帳戶之別名之相關銀行服務邏輯,可使該銀行帳號與該帳戶別名產生對應關係並儲存至該帳戶別名清單;一查詢餘額邏輯,由該銀行帳號或該帳戶別名加上一查詢餘額指令所組成,或,包含該查詢餘額指令的任意組合,為查詢銀行帳號之餘額之相關銀行服務邏輯;以及,該轉帳邏輯,由該銀行帳號或該帳戶別名、一轉帳金額與一轉帳指令所組成,或,由一轉出銀行帳號或一轉出帳戶別名、該轉帳金額、該轉入銀行帳號或一轉入帳戶別名與該轉帳指令所組成,或,包含該轉帳指令的任意組合,為進行轉帳交易之相關銀行服務邏輯。
- 如請求項1所述之語音控制電視版銀行轉帳之裝置,其中該譯文校對解析模組更包含:當該語音譯文不符合該銀行服務邏輯且缺乏該銀行帳號或該帳戶別名時,以一模糊理論技術比對該帳戶別名清單以檢核出符合的該帳戶別名,並以該符合的帳戶別名校對該語音譯文。
- 如請求項1所述之語音控制電視版銀行轉帳之裝置,其中該防錯機制模組更包含:當該語音指令包含該帳戶別名,且當該揚聲器播放該語音指令之該音檔時,接著以該揚聲器播放該帳戶別名所對應之該銀行帳號。
- 如請求項1所述之語音控制電視版銀行轉帳之裝置,其中該防錯機制模組更包含:當該揚聲器播放該語音指令之該音檔時,同時以文字方式在該螢幕顯示該語音指令之一內容。
- 如請求項4所述之語音控制電視版銀行轉帳之裝置,其中該語音指令中的該銀行帳號或該帳戶別名有設定對應的一相片或一圖示時,當該揚聲器播放該語音指令之該音檔時,同時在該螢幕顯示對應的該相片或該圖示。
- 如請求項1所述之語音控制電視版銀行轉帳之裝置,其中該防錯機制模組更包含:透過該揚聲器以語音回報該執行結果。
- 如請求項1所述之語音控制電視版銀行轉帳之裝置,其中該第二資料 庫係包含以下任一或任意組合:該帳戶別名清單、一應用程式功能清單與一約定戶清單。
- 如請求項1所述之語音控制電視版銀行轉帳之裝置,其中該銀行帳號或該轉入銀行帳號係選自:一約定戶帳號或一非約定戶帳號。
- 一種語音控制電視版銀行轉帳之方法,應用於一網路電視機上盒或一智慧型電視,該方法包含:啟動一麥克風以接收一語音;將該語音與一第一資料庫所儲存的複數語音資料進行比對以轉譯為一文字類型之一語音譯文;依據一編輯帳戶別名指令編輯一帳戶別名清單,其中,該編輯帳戶別名指令包括編輯/新增/刪除/修改帳戶別名;依據一第二資料庫將該語音譯文進行校對與解析,當符合一銀行服務邏輯時產生一語音指令;該銀行服務邏輯由複數個檢查要件組成;當該譯文校對解析模組將該語音譯文進行校對與解析後,因缺乏該些檢查要件其中之一或多個檢查要件而不符該銀行服務邏輯時,以互動式語音詢問以取得所缺乏的該一個或多個該檢查要件;將該語音指令轉為一音檔並透過一揚聲器播放,並提示以等待接收一確認執行指令,在一預設時間之內未接收到該確認執行指令時即放棄該語音指令之執行;接收該確認執行指令以將該語音指令轉換為符合一銀行API規範 的一銀行規範指令;上傳該銀行規範指令至一銀行伺服器,並接收對應該銀行規範指令的一執行結果;以及,其中,當該銀行服務邏輯為一轉帳邏輯時,該語音指令以一帳戶別名取代一轉入銀行帳號以進行轉帳交易;其中,該銀行服務邏輯包含:一編輯帳戶別名邏輯,由一銀行帳號、一帳戶別名與該編輯帳戶別名指令組成,或,包含該編輯帳戶別名指令的任意組合,為編輯帳戶之別名之相關銀行服務邏輯,使該銀行帳號與該帳戶別名產生對應關係並儲存至該帳戶別名清單;一查詢餘額邏輯,由該銀行帳號或該帳戶別名加上一查詢餘額指令所組成,或,包含該查詢餘額指令的任意組合,為查詢銀行帳號之餘額之相關銀行服務邏輯;以及,該轉帳邏輯,由該銀行帳號或該帳戶別名、一轉帳金額與一轉帳指令所組成,或,由一轉出銀行帳號或一轉出帳戶別名、該轉帳金額、該轉入銀行帳號或一轉入帳戶別名與該轉帳指令所組成,或,包含該轉帳指令的任意組合,為進行轉帳交易之相關銀行服務邏輯。
- 如請求項9所述的語音控制電視版銀行轉帳之方法,其中更包含:當該語音譯文不符合該銀行服務邏輯且缺乏該銀行帳號或該帳戶別名時,以一模糊理論技術比對該帳戶別名清單以檢核出符合的該帳戶別名,並以該符合的帳戶別名校對該語音譯文。
- 如請求項9所述的語音控制電視版銀行轉帳之方法,其中更包含:當該語音指令包含該帳戶別名,且當該揚聲器播放該語音指令之該音檔時,接著以該揚聲器播放該帳戶別名所對應之該銀行帳號。
- 如請求項9所述的語音控制電視版銀行轉帳之方法,其中更包含:當該揚聲器播放該語音指令之該音檔時,同時以文字方式在一螢幕顯示該語音指令之一內容。
- 如請求項12所述的語音控制電視版銀行轉帳之方法,其中該語音指令中的該銀行帳號或該帳戶別名有設定對應的一相片或一圖示時,當該揚聲器播放該語音指令之該音檔時,同時在該螢幕顯示對應的該相片或該圖示。
- 如請求項9所述的語音控制電視版銀行轉帳之方法,其中更包含:透過該揚聲器以語音回報該執行結果。
- 如請求項9所述的語音控制電視版銀行轉帳之方法,其中該第二資料庫係包含以下任一或任意組合:該帳戶別名清單、一應用程式功能清單與一約定戶清單。
- 如請求項9所述的語音控制電視版銀行轉帳之方法,其中該銀行帳號或該轉入銀行帳號係選自:一約定戶帳號或一非約定戶帳號。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108122294A TWI770395B (zh) | 2019-06-26 | 2019-06-26 | 語音控制電視版銀行轉帳之裝置與方法 |
CN201911011031.6A CN112153430B (zh) | 2019-06-26 | 2019-10-23 | 语音控制电视版应用程序银行转账的装置与方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108122294A TWI770395B (zh) | 2019-06-26 | 2019-06-26 | 語音控制電視版銀行轉帳之裝置與方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202101330A TW202101330A (zh) | 2021-01-01 |
TWI770395B true TWI770395B (zh) | 2022-07-11 |
Family
ID=73891787
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW108122294A TWI770395B (zh) | 2019-06-26 | 2019-06-26 | 語音控制電視版銀行轉帳之裝置與方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112153430B (zh) |
TW (1) | TWI770395B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI801015B (zh) * | 2021-12-03 | 2023-05-01 | 中華電信股份有限公司 | 電視頻道資訊介接系統及其方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102833633A (zh) * | 2012-09-04 | 2012-12-19 | 深圳创维-Rgb电子有限公司 | 一种电视机语音控制系统及方法 |
US8447691B2 (en) * | 2007-05-30 | 2013-05-21 | Hsbc Card Services, Inc. | Systems and methods for NACHA compliant ACH transfers using an automated voice response system |
CN103116841A (zh) * | 2011-11-17 | 2013-05-22 | 银视通信息科技有限公司 | 一种电视综合支付系统以及相应的控制方法 |
TWM557409U (zh) * | 2017-09-30 | 2018-03-21 | Ctbc Bank Co Ltd | 利用語音辨識的銀行交易系統 |
TW201905789A (zh) * | 2017-06-16 | 2019-02-01 | 香港商阿里巴巴集團服務有限公司 | 支付方法、客戶端、電子設備、儲存媒體和伺服器 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5845246A (en) * | 1995-02-28 | 1998-12-01 | Voice Control Systems, Inc. | Method for reducing database requirements for speech recognition systems |
US20020091527A1 (en) * | 2001-01-08 | 2002-07-11 | Shyue-Chin Shiau | Distributed speech recognition server system for mobile internet/intranet communication |
KR20140020389A (ko) * | 2012-08-08 | 2014-02-19 | 주식회사 우리은행 | 스마트폰을 이용한 개인 스마트 뱅킹 서비스 방법 |
CN103246977A (zh) * | 2013-04-28 | 2013-08-14 | 深圳创维-Rgb电子有限公司 | 一种电视支付信息发送、接收方法 |
CN103810763B (zh) * | 2014-02-17 | 2016-04-27 | 无锡普智联科高新技术有限公司 | 基于服务器端语音识别的手机语音报读付费系统及其方法 |
TW201719453A (zh) * | 2015-11-25 | 2017-06-01 | Fubon Securities Co Ltd | 以語音操控金融軟體的方法及行動裝置、電腦可讀取的紀錄媒體 |
CN106910124A (zh) * | 2015-12-23 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 信息处理方法和装置 |
-
2019
- 2019-06-26 TW TW108122294A patent/TWI770395B/zh active
- 2019-10-23 CN CN201911011031.6A patent/CN112153430B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8447691B2 (en) * | 2007-05-30 | 2013-05-21 | Hsbc Card Services, Inc. | Systems and methods for NACHA compliant ACH transfers using an automated voice response system |
CN103116841A (zh) * | 2011-11-17 | 2013-05-22 | 银视通信息科技有限公司 | 一种电视综合支付系统以及相应的控制方法 |
CN102833633A (zh) * | 2012-09-04 | 2012-12-19 | 深圳创维-Rgb电子有限公司 | 一种电视机语音控制系统及方法 |
TW201905789A (zh) * | 2017-06-16 | 2019-02-01 | 香港商阿里巴巴集團服務有限公司 | 支付方法、客戶端、電子設備、儲存媒體和伺服器 |
TWM557409U (zh) * | 2017-09-30 | 2018-03-21 | Ctbc Bank Co Ltd | 利用語音辨識的銀行交易系統 |
Also Published As
Publication number | Publication date |
---|---|
CN112153430B (zh) | 2023-07-11 |
CN112153430A (zh) | 2020-12-29 |
TW202101330A (zh) | 2021-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA3088396C (en) | Computing devices with improved interactive animated conversational interface systems | |
WO2020029500A1 (zh) | 语音命令定制方法、装置和设备及计算机存储介质 | |
EP3611723B1 (en) | Graphical user interface voice control apparatus/system and method | |
US9361878B2 (en) | Computer-readable medium, system and method of providing domain-specific information | |
CA3065764C (en) | Extracting domain-specific actions and entities in natural language commands | |
AU2017425675A1 (en) | Extracting domain-specific actions and entities in natural language commands | |
US20150149163A1 (en) | Voice input correction | |
US12080298B2 (en) | Speech-to-text system | |
US20100217603A1 (en) | Method, System, and Apparatus for Enabling Adaptive Natural Language Processing | |
CN111507698A (zh) | 用于转账的处理方法和装置、计算设备及介质 | |
WO2015188454A1 (zh) | 一种快速进入ivr菜单的方法及装置 | |
TWI770395B (zh) | 語音控制電視版銀行轉帳之裝置與方法 | |
US11056103B2 (en) | Real-time utterance verification system and method thereof | |
US11532308B2 (en) | Speech-to-text system | |
TWM560646U (zh) | 智能語音交易系統 | |
WO2021217915A1 (zh) | 人机对话方法、装置、计算机设备和存储介质 | |
TWI778273B (zh) | 語音控制電視版金融報價之裝置與方法 | |
KR101372837B1 (ko) | 직접입력과 음성 명령을 이용한 하이브리드 방식의 전자문서 입력 방법 및 이를 위한 컴퓨터로 판독가능한 기록매체 | |
US20200074428A1 (en) | Digital Concierge and Method | |
US11722572B2 (en) | Communication platform shifting for voice-enabled device | |
TWI673673B (zh) | 智能語音交易系統 | |
TWI745804B (zh) | 以互動式信息存取金融服務的方法與系統 | |
TWI741258B (zh) | 智慧分行櫃檯系統及其運作方法 | |
KR20220017655A (ko) | 음성 인식을 이용한 정보 검색 시스템 및 방법과 이를 위한 컴퓨터 프로그램 | |
TWM593609U (zh) | 以互動式信息存取金融服務的系統 |