CN112153430A - 语音控制电视版应用程序银行转账的装置与方法 - Google Patents
语音控制电视版应用程序银行转账的装置与方法 Download PDFInfo
- Publication number
- CN112153430A CN112153430A CN201911011031.6A CN201911011031A CN112153430A CN 112153430 A CN112153430 A CN 112153430A CN 201911011031 A CN201911011031 A CN 201911011031A CN 112153430 A CN112153430 A CN 112153430A
- Authority
- CN
- China
- Prior art keywords
- voice
- bank
- account
- transfer
- alias
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012546 transfer Methods 0.000 title claims abstract description 140
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000013519 translation Methods 0.000 claims abstract description 110
- 238000012790 confirmation Methods 0.000 claims abstract description 52
- 230000007246 mechanism Effects 0.000 claims abstract description 35
- 230000015654 memory Effects 0.000 claims description 27
- 230000001915 proofreading effect Effects 0.000 claims description 24
- 238000005516 engineering process Methods 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 230000014616 translation Effects 0.000 description 92
- 238000010586 diagram Methods 0.000 description 17
- 230000009471 action Effects 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000012795 verification Methods 0.000 description 7
- 230000002452 interceptive effect Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000003825 pressing Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 206010047571 Visual impairment Diseases 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 208000029257 vision disease Diseases 0.000 description 1
- 230000004393 visual impairment Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/4104—Peripherals receiving signals from specially adapted client devices
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/441—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
- H04N21/4415—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/443—OS processes, e.g. booting an STB, implementing a Java virtual machine in an STB or power management in an STB
- H04N21/4431—OS processes, e.g. booting an STB, implementing a Java virtual machine in an STB or power management in an STB characterized by the use of Application Program Interface [API] libraries
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/443—OS processes, e.g. booting an STB, implementing a Java virtual machine in an STB or power management in an STB
- H04N21/4438—Window management, e.g. event handling following interaction with the user interface
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/475—End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
- H04N21/4751—End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data for defining user accounts, e.g. accounts for children
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/47805—Electronic banking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8166—Monomedia components thereof involving executable data, e.g. software
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Biomedical Technology (AREA)
- Child & Adolescent Psychology (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种语音控制电视版应用程序银行转账的装置与方法,应用于一网络电视机顶盒或一智能型电视,该方法包含:启动一麦克风以接收一语音;将该语音与一第一数据库所存储的复数语音数据进行比对以转译为一文字类型的一语音译文;依据一第二数据库将该语音译文进行校对与解析,产生一语音指令;将该语音指令转为一音频并通过一扬声器播放,并提示以等待接收一确认执行指令;以及,接收该确认执行指令以将该语音指令转换为符合一银行规范的一银行规范指令;上传该银行规范指令至一银行服务器,并接收对应该银行规范指令的一执行结果。通过本发明,实现了提高用户的语音指令辨识度,并具有防错机制以降低语音指令误判的可能。
Description
技术领域
本发明是关于一种网络银行的操作方法,特别是关于一种语音控制电视版应用程序网络银行转账的装置与方法。
背景技术
根据维基百科所记载“网络电视机顶盒,是2012年开始兴起的一种电视互联网终端装置,也被称作互联网播放器、互联网高画质播放器、电视伴侣、电视盒子、网络机顶盒等,也常被简称作“盒子”。该装置的操作系统通常基于tvOS或Android或Linux,借由通过Wifi无线网络或以太网等实体线路与互联网进行连接。在连接互联网之后,可以实现在传统的电视上在线点播、在线电视直播、浏览网页、收看海外电视与电影、甚至是玩游戏。由于部分网络机顶盒的操作相当简单,价格低廉,而大受欢迎。导致近年有一些上市的智能型电视机甚至将Android等系统附加在电视主板内,实现了内建传统电视机顶盒。”
维基百科又记载“智能型电视(Smart TV)又称互联网电视,是一种加入互联网与物联网功能的电视机。智能型电视可以执行完整的操作系统,并含一个软件平台,可以供应用软件开发者开发他们自己的软件在智能型电视之上运行。目前智能型电视多搭载Android系统。”
目前,在网络电视机顶盒或智能型电视上所运行的网络银行软件,并无任何语音控制的相关技术。举凡查询帐户余额信息、查询帐户交易信息、甚至转账,所有操作均需通过遥控器(即,电视机顶盒或智能型电视的遥控器)来控制。当用户需要输入数据时(例如:转出账号、转账金额、转入账号…等),另需借助屏幕键盘(On-Screen Keyboard,又称屏幕虚拟键盘)来输入,然而,此种以遥控器搭配屏幕键盘的组合使得电视版网络银行软件在操作上较计算机版或移动版复杂许多。计算机版(诸如利用桌上型个人计算机或笔记本电脑的浏览器存取网络银行服务)可让用户轻易以实体键盘及鼠标(或触摸板)进行操作与数据输入,而移动版(诸如运行在智能型手机或平板计算机的移动银行软件)则是让用户以触控方式直接在触控屏幕上进行操作与数据输入,相较之下,电视版网络银行软件的学习门坎比计算机版与移动版来得高,也就是说,用户较不喜欢操作电视版的网络银行。
目前,运用在电视的语音识别技术有以下的几种:现有技术一,中国台湾专利公开号200826646,公开了一种电视系统,包括有:一电视声控装置,是接收一第一声音信号及一第二声音信号,该电视声控装置包括:一语音输入模块,是接收该第一声音信号及该第二声音信号至少其中之一,并输出一语音信号;一第一语音处理模块,是电性耦接至该语音输入模块,用以对该语音信号作放大与滤波处理后输出;一第二语音处理模块,是电性耦接至该第一语音处理模块,该第二语音处理模块是接收该第一语音处理模块处理后的该语音信号与该第二声音信号,用以根据该第二声音信号对该语音信号作一消除运算后,输出一还原后第一声音信号;一语音数据库,是存储有多数个内建语音数据;以及一语音识别模块,是电性耦接至该语音数据库与该第二语音处理模块,且接收该还原后第一声音信号,该语音识别模块是以该还原后第一声音信号与该些内建语音数据作比对,用以输出一无线控制命令;以及一电视机,是以一无线方式接收该无线控制命令,并根据该无线控制命令作动。根据现有技术一所公开的声控电视机,可供用户使用声控方式去控制电视机的操作并直接执行语音指令的动作。
现有技术二,中国台湾专利公开号201535157,公开了一种语音输入命令的方法,该方法包括检测自一电子装置的一用户的至少一个语音输入;将该至少一个语音输入变换成包括至少一个字组的一文字结构;及决定该电子装置的一目前情境范围。该方法也包括比较该文字结构与多个既有文字结构,于该处该既有文字结构各自是与针对在该电子装置上的一动作的一指令相联结。该方法进一步包括当该文字结构匹配该些既有文字结构中的至少一者时,识别一指令以相对应于自该用户的至少一个语音输入;及基于该经识别的指令进行在该电子装置上的一动作。现有技术二让用户以语音指令控制电子装置而不需动手,同时,用户的双手仍可从事其它活动。
现有技术三,中国台湾专利公告号M560646,公开了一种智能语音交易系统,该系统包含:一处理主机,处理主机包括一存储单元、一处理器、以及一传输单元,处理器电性连接至存储单元和传输单元,传输单元用以接收一文字信号,处理器用以执行存储于存储单元的一语意辨识模块,语意辨识模块进行文字信号与存储于存储单元的一数据库中的复数个指令选项的匹配,从而产生对应指令选项的复数个信心指数,其中,处理器根据信心指数进行一反应,包括a、当信心指数中的一者大于一默认值时,执行大于默认值的信心指数所对应的指令选项的动作。该系统进一步包括:一电子装置,包括一语音输入单元、一第二存储单元、一第二处理器、以及一第二传输单元,其中该第二处理器电性连接至该语音输入单元、该第二存储单元、以及该第二传输单元,该第二处理器用以执行存储于该第二存储单元的一语音分析模块以分析借由该语音输入单元所接收的一语音信号,从而产生该文字信号,该第二传输单元设置以与该第一传输单元建立一通信链接以传送该文字信号。现有技术三提供了系统性、且合适的智能语音交易方法,有助于改善手动操作的繁杂手续问题,让一些特定用户(例如老人)得以更简单的操作,进而完成其业务目的。
由于现有技术一与现有技术二都是属于通用型的语音控制,例如:直接操作电子装置本身(如调整音量、转换频道、开/关电源)或是存取通用型的应用服务(如控制浏览器、相机应用程序),并未针对特定领域的应用(如,银行服务)进行优化语音识别技术,因此,现有技术仅利用一个通用型的数据库来进行通用型的辨识,例如:现有技术一的语音数据库,以及,现有技术二的数据库80或外部数据库20(参见其说明书[0046]段)均属于通用型的数据库,换句话说,现有技术均未针对网络银行此一特定领域的应用提供优化技术以提高辨识准确度,而经辨识后所产生的命令/指令也未针对网络银行设计一套适用的防错机制。至于现有技术三,虽然已是针对特定领域的应用(即,银行服务),但现有技术三也仅利用一个数据库122b(见其说明书第[0017]段及图1)来做辨识,很难同时兼顾通用型及特定领域(银行服务)的辨识准确度,另外,现有技术三同样缺乏防错机制,防止语音识别错误而对应到不适当的指令。简而言之,现有技术仅利用单一个数据库来辨识指令,无法兼顾通用型及特定领域(银行服务)的辨识准确度,以及,现有技术缺乏“针对网络银行的防错机制”,以致若直接采用现有技术的电视语音识别技术于网络银行领域有可能发生“误辨识指令的问题”。也就是说,在极度讲求数字精确、指令无误的银行业来讲,现有技术无法有效提高应用在网络银行的语音指令辨识精确度以满足用户需求。
发明内容
有鉴于此,本发明的目的在于提出一种语音控制电视版应用程序银行转账的装置与方法,运用于网络电视机顶盒或智能型电视,让用户以口说出网络银行转账的语音指令,语音指令于辨识之时是参照第一数据库与第二数据库,辨识后以语音反馈方式再次向用户确认,用户确认无误后,再将其转换成符合银行应用程序编程接口(API)规范的银行规范指令,以上传至银行服务器执行。
本发明提出一种语音控制电视版应用程序银行转账的装置,该装置包含:网络模块,用以建立因特网(Internet)网络连接;语音接收模块,用以启动一麦克风以接收一语音;语音转译模块,将该语音与一第一数据库所存储的复数语音数据进行比对以转译为一文字类型的一语音译文;译文校对解析模块,依据一第二数据库将该语音译文进行校对与解析,当符合一银行服务逻辑时产生一语音指令;防错机制模块,将该语音指令转为一音频并通过一扬声器播放,并提示以等待接收一确认执行指令,在一默认时间之内未接收到该确认执行指令时即放弃该语音指令的执行;网络银行模块,产生一网银服务视图显示于一屏幕,将该语音指令转换为符合一银行API规范的一银行规范指令并上传至一银行服务器,及,接收该银行服务器所回传对应该银行规范指令的一执行结果并更新显示于该网银服务视图;内存,安装一操作系统并存储一应用程序、该语音、该语音译文、该语音指令、该银行规范指令与该第二数据库,该应用程序包含该语音接收模块、该语音转译模块、该译文校对解析模块、该防错机制模块、该网络银行模块与该第二数据库;该屏幕,用以显示该应用程序的图形化用户接口;一或多个处理器,连接该麦克风、该扬声器、该内存与该屏幕并执行该应用程序。
可选地,该银行服务逻辑包含:一编辑帐户别名逻辑,由一银行账号、一账户别名与一编辑帐户别名指令组成,或,包含该编辑帐户别名指令的任意组合,用以编辑帐户的别名,使该银行账号与该账户别名产生对应关系并存储至一帐户别名清单;一查询余额逻辑,由该银行账号或该账户别名加上一查询余额指令所组成,或,包含该查询余额指令的任意组合,用以查询银行账号的余额;以及,该转账逻辑,由该银行账号或该账户别名、一转账金额与一转账指令所组成,或,由一转出银行账号或一转出账户别名、该转账金额、该转入银行账号或一转入帐户别名与该转账指令所组成,或,包含该转账指令的任意组合,用以进行转账交易。
可选地,该译文校对解析模块还包含:当该语音译文不符合该银行服务逻辑且缺乏该银行账号或该账户别名时,以一模糊理论技术比对该帐户别名清单以检核出符合的该账户别名,并以该符合的帐户别名校对该语音译文。
可选地,该防错机制模块还包含:当该语音指令包含该帐户别名,且当该扬声器播放该语音指令的该音频时,接着以该扬声器播放该账户别名所对应的该银行账号。
可选地,该防错机制模块还包含:当该扬声器播放该语音指令的该音频时,同时以文字方式在该屏幕显示该语音指令的一内容。
可选地,该防错机制模块还包含:通过该扬声器以语音回报该执行结果。
可选地,该第二数据库是该帐户别名清单。
可选地,该第二数据库是包含该帐户别名列表与一应用程序功能列表。
可选地,该第二数据库是一约定户清单。
可选地,该银行账号或该转入银行账号是选自:一约定户账号或一非约定户账号。
本发明又提出一种语音控制电视版应用程序银行转账的方法,应用于一网络电视机顶盒或一智能型电视,该方法包含:启动一麦克风以接收一语音;将该语音与一第一数据库所存储的复数语音数据进行比对以转译为一文字类型的一语音译文;依据一第二数据库将该语音译文进行校对与解析,当符合一银行服务逻辑时产生一语音指令;将该语音指令转为一音频并通过一扬声器播放,并提示以等待接收一确认执行指令,在一默认时间之内未接收到该确认执行指令时即放弃该语音指令的执行;接收该确认执行指令以将该语音指令转换为符合一银行API规范的一银行规范指令;上传该银行规范指令至一银行服务器;以及,接收对应该银行规范指令的一执行结果。
可选地,该银行服务逻辑包含:一编辑帐户别名逻辑,由一银行账号、一账户别名与一编辑帐户别名指令组成,或,包含该编辑帐户别名指令的任意组合,用以编辑帐户的别名,使该银行账号与该账户别名产生对应关系并存储至一帐户别名清单;一查询余额逻辑,由该银行账号或该账户别名加上一查询余额指令所组成,或,包含该查询余额指令的任意组合,用以查询银行账号的余额;以及,一转账逻辑,由该银行账号或该账户别名、一转账金额与一转账指令所组成,或,由一转出银行账号或一转出账户别名、该转账金额、一转入银行账号或一转入帐户别名与该转账指令所组成,或,包含该转账指令的任意组合,用以进行转账交易。
可选地,该方法还包含:当该语音译文不符合该银行服务逻辑且缺乏该银行账号或该账户别名时,以一模糊理论技术比对该帐户别名清单以检核出符合的该账户别名,并以该符合的帐户别名校对该语音译文。
可选地,该方法还包含:当该语音指令包含该帐户别名,且当该扬声器播放该语音指令的该音频时,接着以该扬声器播放该账户别名所对应的该银行账号。
可选地,该方法还包含:当该扬声器播放该语音指令的该音频时,同时以文字方式在该屏幕显示该语音指令的一内容。
可选地,该方法还包含:通过该扬声器以语音回报该执行结果。
可选地,该第二数据库是该帐户别名清单。
可选地,该第二数据库是包含该帐户别名列表与一应用程序功能列表。
可选地,该第二数据库是一约定户清单。
可选地,该银行账号或该转入银行账号是选自:一约定户账号或一非约定户账号。
本发明还提出一种具有屏幕的计算设备,包含:一内存、一处理器以及存储在该内存上并可在该处理器上运行的计算机程序,该处理器执行该计算机程序时实现上述语音控制电视版应用程序银行转账的方法的步骤。
本发明还提出一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述语音控制电视版应用程序银行转账的方法的步骤。
通过本发明的技术方案,以硬件与软件协同运作的资源提出一种语音控制电视版应用程序银行转账的技术,实现了提高用户的语音指令辨识度,并具有防错机制以降低语音指令误判的可能。
以下在实施方式中详细叙述本发明的详细特征以及优点,其内容足以使任何本领域的技术人员了解本发明的技术内容并据以实施,且根据本说明书所公开的内容、权利要求书保护范围及附图,任何本领域的技术人员可轻易地理解本发明相关的目的及优点。
附图说明
图1为本发明实施例一装置的系统功能方框图;
图2为本发明实施例二装置的系统功能方框图;
图3为本发明一实施例应用程序的系统功能方框图;
图4为本发明一实施例网银服务视图的示意图;
图5为本发明一实施例语音指令的示意图;
图6为本发明一实施例确认提示的示意图;
图7为本发明另一实施例确认提示的示意图;及,
图8为本发明实施例的操作流程图。
图中:
10:语音控制电视版应用程序银行转账的装置;12a、12b、12c:处理器;14a、14b:内存;16:应用程序;18a、18b:操作系统 ;20a、20b:网络模块;22:电视 ;24a、24b:屏幕;26a、26b:扬声器 ;28a、28b:麦克风;30:语音控制电视版应用程序银行转账的装置;32:语音接收模块;34:语音转译模块 ;36:译文校对解析模块;38:防错机制模块;40:网络银行模块;42:编辑账户别名模块;44:第二数据库;46:网银服务视图;48:语音指令;50:确认提示。
具体实施方式
本发明是使用于网络电视机顶盒(IPTV Set-Top Box,Set-Top Box或称Set-TopUnit)、智能型电视(Smart TV)或电视棒(Chromecast TV Adapter),本发明应用程序(即,网络银行软件)是安装于上述网络电视机顶盒、智能型电视或电视棒中。
参阅图1与图2,本发明实施例一与实施例二语音控制电视版应用程序银行转账的装置的系统功能方框图,图例仅列出与本发明实施例相关的核心模块,其余模块省略未描绘。图1是实施例一的系统功能方框图,而本实施例语音控制电视版应用程序银行转账的装置10即网络电视机顶盒或电视棒,本实施例的应用程序16是执行于语音控制电视版应用程序银行转账的装置10 (网络电视机顶盒或电视棒)上。在本发明的实施例一中,本发明语音控制电视版应用程序银行转账的装置10包含:一或多个处理器12a、内存14a、应用程序16、操作系统18a以及网络模块20a。其中,内存14a安装有操作系统18a并存储有应用程序16(即,网络银行软件);处理器12a执行操作系统18a以管理装置10的硬件与软件资源,以及执行应用程序16所包含的复数个程序指令并以硬件与软件协同运作的方式实施以下模块:语音接收模块32、语音转译模块34、译文校对解析模块36、防错机制模块38、网络银行模块40、编辑账户别名模块42及第二数据库44;操作系统18a例如:Android TV、tvOS、Tizen、webOS、Opera TV…等等;网络模块20a用以建立因特网(Internet)网络连接,如:有线宽带、WLAN(Wi-Fi等)、移动通信网络(如3G、4G、5G…)等等。由于网络电视机顶盒或电视棒本身并不俱备显示屏幕,因此,本实施例语音控制电视版应用程序银行转账的装置10须外接电视22,以利用屏幕24a显示应用程序16的图形化用户接口(GUI);扬声器26a用以播放应用程序16产生的语音指令的音频,以提供用户语音反馈;麦克风28a,用以接收用户的语音输入,在一些实施例中麦克风28a是设置于电视22本体,在一些实施例中麦克风28a是设置于遥控器,在一些实施例中麦克风28a是设置于网络电视机顶盒或电视棒本体。
图2是实施例二的系统功能方框图,而本实施例语音控制电视版应用程序银行转账的装置30即智能型电视,与实施例一不同的地方是,本实施例装置30即内建有操作系统18b、屏幕24b、扬声器26b与麦克风28b。因此,应用程序16的图形化用户接口直接显示于内建的屏幕24b,应用程序16产生的语音指令的音频直接以内建的扬声器26b播放。在一些实施例中,麦克风28b是设置于智能型电视30本体;在一些实施例中麦克风28b是设置于遥控器。除此之外,本实施例其余模块的功能与实施例一相同,故不另赘述。
继续参阅图3,本发明一实施例应用程序16的系统功能方框图,其包含有:语音接收模块32、语音转译模块34、译文校对解析模块36、防错机制模块38、网络银行模块40、编辑账户别名模块42及第二数据库44。图例仅列出与本发明一较佳实施例相关的核心模块,其余模块省略未描绘。
语音接收模块32用以启动麦克风28a、28b以接收用户的语音输入,所接收到的语音是暂时存储于内存14a、14b中。在一些实施例中,用户需按下遥控器上的特定按键(如:语音输入键,未描绘)以启动麦克风28a、28b开始收音。
语音转译模块34用以将存储于内存14a、14b中的语音(即,声音档案,或称音频)与第一数据库所存储的复数笔语音数据进行比对以转译为文字类型的语音译文。其中,第一数据库是通用型的语音数据库,存储了多种使用情境的单字与词汇的语音数据。所谓的通用型语音数据库,主要是着重于日常生活常见用语的语音数据,或许涵盖多数领域的部份用语,但因真实世界的数据量庞大,因此,第一数据库并无法针对每一个专业领域提供该领域内的所有完整语音数据。在一些实施例中,第一数据库是存储于内存14a、14b中,例如:操作系统18a、18b所内建的语音识别软件(又称语音识别引擎,未描绘),语音转译模块34可通过API或是直接存取内存14a、14b中的第一数据库以比对出符合的单字与词汇;在一些实施例中,第一数据库是设置于远程的服务器,语音转译模块34需通过API存取远程的第一数据库以比对出符合的单字与词汇,例如:谷歌云语音(Google Cloud Speech API)。不管第一数据库位于本地端或是远程,当语音转译模块34比对完成后即可得到一串文字类型的语音译文,此语音译文由语音转译模块34存储于内存14a、14b中。
译文校对解析模块36依据第二数据库44将语音译文进行校对(Correcting)与解析(Parsing),当符合“银行服务逻辑”时产生语音指令。所谓的第二数据库44是存储有针对特定专业领域(即,网络银行服务)的单字与字汇,主要是用以补强通用型数据库(即,第一数据库)在网络银行服务不足之处,例如:原本语音为“转账500元给吴百”(假设其中的“吴百”为用户所设定的帐户别名,即转入账号的别名,再假设用户的总归户仅有一个银行账户,故可省略指定“转出账号”),在比对第一数据库后产生的语音译文被误译为“转账500元给500”,此错误的译文实际上并无任何意义(因缺乏“转入账号”,即,收款人账号),此错误的译文若交由现有技术处理则会发生“无法执行”的结果,但是,经本发明的译文校对解析模块36依据第二数据库44(其中的帐户别名清单)校对后即可修正为“转账500元给吴百”。在一些实施例中,第二数据库44存储有帐户别名清单,其包含对应的银行账号以及帐户别名(由用户设定),例如:“013-039-12345678(实际银行账号)、吴百(用户设定的别名)”。在一些实施例中,帐户别名清单可包含复数个不同的别名以对应同一个银行账号,其可为:第一别名(系统设定的序号,如屏幕上的排列顺序或列表中存储的顺序)、第二别名(用户设定的短别名)、第三别名(用户设定的长别名,当作备注用的信息)…等,例如:“1(第一别名,系统设定的序号)、吴百(第二别名,用户设定的短别名)、每月孝亲费用(第三别名,用户设定的备注)、013-039-12345678(实际银行账号)”,如图7所示;在一些实施例中,第二数据库44另存储有应用程序功能列表,此是包含应用程序16所提供的所有功能与信息的词汇,例如:“汇款、转账、约定户、非约定户、查询余额、查询交易明细、…”。
所谓的“银行服务逻辑”是预先设定好如同公式般的检查要件,用来判断语音译文是否符合银行服务情境中的用语,其可包含:编辑帐户别名逻辑、查询余额逻辑、转账逻辑、网络银行软件(应用程序16)操作逻辑…等。编辑帐户别名逻辑,由银行账号、帐户别名与编辑帐户别名指令组成,或,包含编辑帐户别名指令的任意组合(例如:单独使用编辑帐户别名指令、使用编辑帐户别名指令与银行账号、使用编辑帐户别名指令与帐户别名),编辑帐户别名逻辑可用于编辑帐户的别名,使银行账号与账户别名产生对应关系并存储至帐户别名清单。所谓的编辑帐户别名指令是指驱动此一工作的关键词/词、相关字/词或同义字/词,例如:编辑别名、新增别名、修改别名、删除别名、编辑名称、新增名称、修改名称、删除名称…等指令。查询余额逻辑,由银行账号或帐户别名加上查询余额指令所组成,或,包含查询余额指令的任意组合(例如:单独使用查询余额指令、使用查询余额指令与银行账号、使用查询余额指令与帐户别名),查询余额逻辑可用于查询银行账号的余额,而查询余额指令例如:查询余额、查余额、查询、余额、剩多少、有多少…等指令。转账逻辑,由银行账号或帐户别名、转账金额(含/不含单位)与转账指令所组成,或,由转出银行账号或转出账户别名、转账金额(含/不含单位)、转入银行账号或转入帐户别名与转账指令所组成,或,包含转账指令的任意组合(例如:单独使用转账指令、使用转账指令与转账金额、使用转账指令与银行账号或帐户别名…等),转账逻辑可用于进行转账交易,而转账指令例如:转账、转、汇款、汇钱、汇、打钱…等。网络银行软件(应用程序16)操作逻辑,由应用程序功能及操作指令(例如:切换、显示、上一页、下一页、向下滚动、向上滚动、向右滚动、向左滚动、字体放大、字体还原…等)组成,例如:“显示总归户”、“切换主菜单”。在一些实施例中,因缺乏某一(或某些)检查要件而不符银行服务逻辑时,本发明即以交互式语音向用户询问所缺乏的要件,而不需在第一次检查时即须符合所有要件。例如:用户单独使用编辑帐户别名指令,本发明再以交互式语音向用户询问要编辑哪一个银行账号或是哪一个帐户别名,用户答复后,本发明再次以交互式语音向用户询问尚缺乏的要件。
译文校对解析模块36依据第二数据库44将语音译文进行校对与解析,其中,校对与解析这两项工作并非固定地各执行一次,而是视情况而定,也有可能反复进行复数次。当译文校对解析模块36解析时发现原始的语音译文不符合任何银行服务逻辑,即以“最接近的银行服务逻辑”来校对语音译文,例如:假设用户所输入的语音为“转账500元给吴百”,再假设原始的语音译文为“转账500元给500”, 译文校对解析模块36解析后判断此语音译文包括了“转账指令”(即,“转账”)、“转账金额与单位”(即,“500元”),与此语音译文最接近的银行服务逻辑为转账逻辑,而缺乏了“银行账号”或“账户别名”此检查要件,(因语音译文减去已辨识的词汇后仅剩下“给500”,而“给500”并不在第二数据库44的帐户别名清单),因此,译文校对解析模块36以转账逻辑(最接近的银行服务逻辑)来校对语音译文以补足所乏的“银行账号”或“账户别名”。在一些实施例中,译文校对解析模块36以同音异字方式来检核并校对语音译文;在一些实施例中,则以近音异字方式来检核并校对语音译文;在一些实施例中,则以补缺漏字方式来检核并校对语音译文,不管是同音异字、近音异字或是补缺漏字;此三种方式均属于模糊理论(Fuzzy Logic)技术。译文校对解析模块36在校对时,依据帐户别名清单把“给500”校对为“给吴百”(承前例,假设“吴百”为帐户别名列表中用户自定义的别名),被校对后的语音译文即为“转账500元给吴百”。校对之后,译文校对解析模块36再次解析“转账500元给吴百”,当判断其符合转账逻辑后即产生语音指令,此语音指令即“转账500元给吴百”(承前例,假设用户的总归户仅有一个银行账号,因此,不需指定转出账号)。上述所举例子是无关约定户或非定户转账,本发明可应用于约定户转账,也可应用于非约定户转账,而应用于非约定转账时另有其他限制(如,每日转账限额或单笔转账限额)与特定步骤(如,以芯片金融卡及卡片阅读机验证,或,以OTP短信验证)需依循。
防错机制模块38将语音指令转为音频并通过扬声器26a、26b播放,并提示以等待接收确认执行指令,在默认时间之内未接收到确认执行指令时即放弃该语音指令的执行。所谓的防错(Fool-Proof,或称防呆)机制,是用以预防某一作业环节发生错误时,可实时中断处理,避免伤害扩大,在本发明中,防错机制模块38是以语音反馈方式向用户确认所接收到的语音指令是否正确,避免语音识别中间过程因误判而产生错误指令最后造成用户的损失。因此,播放语音反馈后若用户未在默认的时间之内下达“确认执行指令”,防错机制模块38即自动放弃该语音指令。将语音指令转为音频并通过扬声器26a、26b播放需以“文字转语音”(Text-to-Speech)技术处理,此为成熟的现有技术,故不赘述,在一些实施例中,防错机制模块38内建文字转语音引擎,可直接在本地端转为音频;在一些实施例中,防错机制模块38通过操作系统18a、18b所内建的文字转语音引擎,也可直接在本地端转为音频;在一些实施例中,防错机制模块38通过API利用设于远程服务器的文字转语音引擎,最后将产生的音频下载回本地端。所谓的确认执行指令即用户听取语音反馈后,所下达的确认动作,在一些实施例中,用户通过麦克风28a、28b以口头回复“确认”(即产生确认执行指令)。本实施例达成了以全语音控制应用程序16,使得有视障问题的投资者也可以全语音控制方式操作网络银行软件;在一些实施例中,用户按下遥控器的“确认键”(即产生确认执行指令)。承前例:当扬声器26a、26b播放语音反馈“转账500元给吴百”后,接着立即再播放确认提示“是否确认。请说确认,或按下遥控器的确认键”;在一些实施例中,用户需正确说出帐户别名所对应的部份账号(例如:所对应的银行账号最后四码),以确认转账对象(即,帐户别名)无误,才可产生确认执行指令。在一些实施例中,当扬声器26a、26b播放语音反馈与确认提示时,同时,防错机制模块38以文字方式在屏幕24a、24b显示语音指令48(如图5所示)及确认提示50(如图6所示)。
在一些实施例中,防错机制模块38将语音指令转为音频并通过扬声器26a、26b播放之时,当语音指令同时包含帐户别名时,防错机制模块38查询帐户别名清单,并将所对应的银行账号转为音频再通过扬声器26a、26b播放,以让用户听取语音反馈之时可同时确认转账的对象,更可降低错误的发生。例如:承前例,当扬声器26a、26b播放“转账500元给吴百”后,接着立即再播放“银行账号013-039-12345678”,最后再播放确认提示“是否确认。请说确认,或按下遥控器的确认键”。
在一些实施例中,防错机制模块38还包含:当语音指令执行完毕后,通过扬声器26a、26b以语音回报执行结果,例如:当执行完语音指令“转账500元给吴百”以语音回报“转账成功”,让用户不必盯着屏幕24a、24b,即可听取执行结果。在一些实施例中,防错机制模块38还包含:当语音指令执行转账交易完毕后,通过扬声器26a、26b以语音回报转出帐户的余额,例如:当执行完语音指令“转账500元给吴百”以语音回报“帐户余额5888元”,让用户不必盯着屏幕24a、24b,即可听取转账后的余额。在一些实施例中,“以语音回报执行结果”此一工作也可拆开由其他模块(未描绘)负责执行,而非防错机制模块38负责。
网络银行模块40,是所有银行服务子功能的一个统称,可提供账户查询、转账…等服务,其将语音指令转换为符合银行API规范的银行规范指令,再通过网络模块20a、20b与远程的银行服务器建立连接并上传银行规范指令与下载对应银行规范指令的执行结果,以及,产生网银服务视图46并更新显示于屏幕24a、24b。例如:防错机制模块38收到确认执行指令后,网络银行模块40将原本较接近口语化的语音指令转换为符合银行API规范的程序码指令,然后把银行规范指令上传到远程的银行服务器(其是通过网络模块20a、20b与远程的银行服务器建立连接),银行服务器端执行完毕后,再回传执行结果(如,转账成功后的账户余额)给网络银行模块40,再产生网银服务视图46(如图4所示)显示于屏幕24a、24b。
编辑账户别名模块42,依据编辑帐户别名指令编辑帐户别名列表,编辑帐户别名指令即“编辑/新增/删除/修改账户别名”,例如:新增帐户别名指令,用以新增帐户别名在某一个银行账号上(即,新增账户别名与银行账号的对应关系);再例如:删除帐户别名指令,用以删除某一个银行账号所对应的既有账户别名;再例如:修改帐户别名指令,用以修改某一个银行账号所对应的既有账户别名。编辑帐户别名指令也可包含相近的关键词/词、同义字/词…等。本发明让用户在语音输入时可利用帐户别名替代长串的银行账号,不但可提高语音识别率,并可避免用户误说/误读长串银行账号的风险,更能缩短用户语音输入的时间(包含省略了反复目视以检查长串账号是否错误的时间)。在一些实施例中,编辑账户别名模块42可让用户设定银行账号所对应的相片或图标,当用户以语音指令转账到有设定对应相片或图示的银行账号/帐户别名时,可在屏幕24a、24b显示对应相片或图标,借由视觉效果(即,对应银行账号/帐户别名的相片或图标)可让用户快速检视指定的收款对象是否正确。
第二数据库44除了存储帐户别名清单,另存储了针对网络银行服务的单字与字汇(即,应用程序功能列表),以补强通用型数据库(即,第一数据库)在网络银行领域不足之处。在一些实施例中,其与第一数据库差异之处在于,第一数据库是存储通用领域的语音数据的声音档案(即,音频),而第二数据库44是存储网络银行领域的文字类型的单字与字汇;在一些实施例中,第二数据库44与第一数据库是同样存储语音数据的声音档案,其差异仅在第一数据库是存储通用领域的语音数据,而第二数据库44是存储网络银行领域的语音数据,于一些实施例中,当译文校对解析模块36对语音译文进行解析时未有符合的银行服务逻辑时,译文校对解析模块36不直接对语音译文进行校对,而是改用第二数据库44的语音数据重新对存储于内存14a、14b中的语音进行比对以转译为文字类型的语音译文,接着,再次对新的语音译文进行解析以判断是否符合银行服务逻辑。
参阅图4,本发明一实施例网银服务视图46的示意图,其是显示于屏幕24a或屏幕24b。图例说明了本发明应用程序16的网银服务视图46提供了数项网络银行服务,用户可以遥控器(未图示)选择服务,或是,以语音控制选择服务项目。图例中的服务项目仅为说明用途,而非用以限定本发明的范围,在一些其他实施例中,可包含更多的服务项目,例如:查询记录、信用卡服务、缴费…等。若以遥控器操作进行转账,用户大致的操作步骤为:以上/下键选择转账服务→按下确认键→输入账号约8~14位数(承前例,需输入14个数字)→以按键选择金额字段→输入金额→按下确认键;若以语音控制进行转账,用户大致的操作步骤为:按下语音输入键→以口说出语音指令(承前例:“转账500元给吴百”,其中吴百为账户别名)→按下确认键,以上两种操作步骤均同时略过验证流程以方便进行比较,相较之下,可知利用本发明的语音控制可大幅降低遥控器的按键操作次数,也就是说,以语音控制来辅助操作电视版网络银行可以降低遥控器的操作不便性。当用户以语音控制应用程序16(网络银行软件)时,屏幕24a或屏幕24b上显示的画面可以是应用程序16任意视图之中。
参阅图5为本发明一实施例语音指令48的示意图。图例所显示的语音指令48是经第二数据库44校对与解析过,并且确认符合银行服务逻辑的版本。
参阅图6为本发明一实施例确认提示50的示意图。承前例的语音指令(如图5所示),此例是假设用户的总归户仅有一个银行账号,因此,无须指定转出账号,而图例中的银行账号(即,转入账号)是对应账户别名“吴百”的账号,图例说明了当用户按下确认提示50中的“确认键”后即可产生确认执行指令。
参阅图7为本发明另一实施例确认提示50的示意图,本实施例确认提示50是假设用户的语音指令为“编辑帐户别名”,由于语音中未指名要编辑哪一个账户别名,因此,确认提示50依据帐户别名清单将所有的帐户别名显示在屏幕上供用户选择。在一些实施例中,当用户下达语音指令“编辑帐户别名”时,确认提示50将所有的约定户银行账号显示在屏幕上供用户选择,其中包含未设定账户别名的约定户。在一些实施例中,账户别名也可存储于约定户清单之中,而约定户清单也可视为第二数据库44的一部份。
参阅图8,本发明实施例的操作流程图,用户利用网络电视机顶盒、电视棒或智能型电视执行应用程序16并以语音控制转账的操作流程,请同时参考图1、图2、图4、图4、图5及图6,此流程是包含:
步骤S101:于装置10上执行本发明应用程序16。用户于语音控制电视版应用程序银行转账的装置10 (网络电视机顶盒或电视棒)或语音控制电视版应用程序银行转账的装置30(智能型电视)上执行本发明的应用程序16(网络银行软件)。
步骤S102:进行登入验证作业。处理器12a、12c执行应用程序16后,用户须登入验证,用户以账号及密码进行登入验证作业;在一些实施例中,用户是以生物验证方法进行登入验证;在一些实施例中,用户需以动态密码(OTP,One-time Password)短信密码进行登入验证;在一些实施例中,用户是以芯片金融卡与卡片阅读机进行登入验证。
步骤S103:显示网银服务视图46。登入验证后,网络银行模块40产生网银服务视图46并显示于屏幕24a、24b上,如图4所示。假设用户欲进行转账,用户可用遥控器控制以选择转账服务项目,再输入银行账号与金额,或,直接以语音控制下达转账的语音指令。
步骤S104:启动麦克风28a、28b以接收语音。处理器12a、12c执行语音接收模块32以启动麦克风28a、28b接收用户的语音输入。在一些实施例中,用户按下遥控器上的语音输入键(未描绘)以启动麦克风28a、28b开始收音。假设此步骤用户所输入的语音为“转账500元给吴百”,输入后,语音接收模块32将语音(此为音频)存储至内存14a、14b中。
步骤S105:将语音与第一数据库进行比对以转译为语音译文。语音存储至内存14a、14b后,处理器12a、12c执行语音转译模块34,以将语音与第一数据库所存储的复数笔语音数据进行比对以转译为文字类型的语音译文。在一些实施例中,第一数据库是存储于内存14a、14b中;在一些实施例中,第一数据库是设置于远程的服务器。假设此步骤所转译出的语音译文为“转账500元给500”(因第一数据库是通用型数据库,例如:Google CloudSpeech API,因缺乏第二数据库的帐户别名列表,因此,不认得账户别名“吴百” ),转译为语音译文后,语音转译模块34将语音译文存储至内存14a、14b中。
步骤S106:依据第二数据库44将语音译文进行校对与解析以产生语音指令。语音译文存储至内存14a、14b后,处理器12a、12c执行译文校对解析模块36,并依据第二数据库44将语音译文进行校对与解析,当译文校对解析模块36解析时发现原始的语音译文不符合任何银行服务逻辑(因第二数据库44中并无任何账户别名叫“给500”),即以“最接近的银行服务逻辑”来校对语音译文,于此,译文校对解析模块36以转账逻辑(最接近的银行服务逻辑,因语音译文中包含“转账”)来校对前一步骤所产生的语音译文以补足所缺乏的银行账号或账户别名,被校对后的语音译文即为“转账500元给吴百”, 译文校对解析模块36将被校对后的语音译文存储至内存14a、14b。校对之后,译文校对解析模块36再次解析“转账500元给吴百”,当判断其符合转账逻辑后即产生语音指令,此语音指令即“转账500元给吴百”,此时,译文校对解析模块36再将产生的语音指令存储至内存14a、14b。当再次解析仍被判断无符合的银行服务逻辑时,在一些实施例中,在屏幕24a、24b上列出一至复数个最接近的银行服务逻辑(仅缺乏一个指令或关键词),同时,以交互式语音询问用户何者才是原意,并询问所缺乏的指令或关键词为何。例如,假设当校对后的语音译文为“转账给吴百”,而译文校对解析模块36再次解析时判断最接近的银行服务逻辑为转账逻辑,因语音译文中包含“转账”的转账指令,也包含了银行账号或账户别名,但明显缺乏了“转账金额”,因此,本发明以交互式语音向用户询问:“转账金额要多少”或“转账金额为何”,以获得完整的转账逻辑。
因此,通过本发明以银行服务逻辑来检查语音译文与校对后的语音译文,再通过交互式语音与用户的互动,即可确保用户讲出符合银行服务逻辑的语音内容,达到用户不须明白银行服务逻辑,即可通过本发明的技术有效地实现以语音控制网络银行服务的特殊技术目的。
步骤S107:将语音指令转为音频并通过扬声器26a、26b播放。产生语音指令存储至内存14a、14b后,处理器12a、12c执行防错机制模块38,以将语音指令转为音频并通过扬声器26a、26b播放(此即语音反馈)。在一些实施例中,于此步骤屏幕24a、24b也同时显示语音指令48,如图5所示。
步骤S108:提示以等待接收确认执行指令。播放语音反馈后,处理器12a、12c继续执行防错机制模块38,在一些实施例中,通过扬声器26a、26b播放确认提示并等待接收确认执行指令;在一些实施例中,于屏幕24a、24b显示确认提示50并等待接收确认执行指令,如图6所示。若用户未于默认时间(例如:“30秒钟”)之内下达确认执行指令,防错机制模块38即中止此操作流程,并放弃该语音指令。
步骤S109:接收确认执行指令以转换为银行规范指令。在一些实施例中,用户通过麦克风28a、28b以口头回复“确认”、“正确”、“完成”、“送出”的类的确认相关语音(即产生确认执行指令);在一些实施例中,用户按下遥控器的“确认键”(即产生确认执行指令)。接收确认执行指令后,网络银行模块40即按照远程银行服务器所提供的银行API规范以将语音指令转换为符合的银行规范指令,也就是说,将原本较为“口语化”的语音指令改写为符合银行API规范的程序码指令,并存储至内存14a、14b。
步骤S110:上传银行规范指令至银行服务器。网络银行模块40转换为符合的银行规范指令后,即上传银行规范指令至远程的银行服务器。银行服务器执行后再回传对应银行规范指令(即,前一步骤所上传的指令)的执行结果给网络银行模块40,并存储至内存14a、14b。
步骤S111:通过扬声器26a、26b以语音回报执行结果。银行服务器回传对应上传银行规范指令的执行结果后,将执行结果以语音通过扬声器26a、26b回报,例如:“转账成功”、“账户余额不足,转账失败”、“转账成功,账户余户为XXX元”…等执行结果(未描绘),让用户不需看屏幕24a、24b,即可通过语音回报明了执行得如何。
对本发明的不同实施例可理解的是,由计算机执行的程序指令可实行流程图中的各个方块、流程图中方块的组合、以及各实施例中的步骤。把该些程序指令提供给一处理器操作以产生一机器或产生硬件与软件协同运作的资源,借此在该处理器上执行该些指令时,将产生用以实行流程图方块指明的动作或技术效果的构件。不同集合的程序指令也可使展示于流程图方块中的至少某些操作步骤并行地进行,且一应用程序的各个程序指令所表达的技术内容可能依不同实施例而不同。再者,也可在不只一个处理器上进行某些该些步骤,例如本发明装置中微处理器与周边接口处理器所协同运作的状况。此外,在不偏离本发明范围或精神的条件下,流程图中的一或多个方块或方块的组合也可与其他方块或方块组合同时地进行,或甚至以不同于展示出的顺序来进行。
因此,本发明流程图的方块支持用以进行指明动作或技术效果的构件组合、用以进行指明动作或技术效果的步骤组合、以及用以进行指明动作或技术效果的程序指令构件。也可了解的是,这些指明动作或技术效果是由特殊用途硬件式系统或者特殊用途硬件与程序指令协同运作来实行本发明流程图的各个方块以及流程图的方块组合。
综上所述,本发明提出一种语音控制电视版应用程序银行转账的技术,解决了现有技术未针对网络银行服务提供优化技术以提高语音指令的辨识准确度,且现有技术也未针对网络银行服务设计一套适用的防错机制,借由本发明使得用户的语音指令辨识度可以提高,并具有防错机制以降低语音指令误判的可能,另外,本发明的语音控制与语音反馈技术更可帮助有视障问题的投资者以全语音控制的方式操作金融软件,弥补了现有技术不足之处。
虽然本发明的技术内容已经以较佳实施例公开如上,但其并非用以限定本发明,任何本领域的技术人员,在不脱离本发明的精神所作些许的更动与润饰,均应涵盖于本发明的范畴内,因此本发明的保护范围当视所附的权利要求保护范围所界定的为准。
Claims (20)
1.一种语音控制电视版应用程序银行转账的装置,其特征在于,包含:
网络模块,用以建立因特网网络连接;
语音接收模块,用以启动一麦克风以接收一语音;
语音转译模块,将该语音与一第一数据库所存储的复数语音数据进行比对以转译为一文字类型的一语音译文;
译文校对解析模块,依据一第二数据库将该语音译文进行校对与解析,当符合一银行服务逻辑时产生一语音指令;
防错机制模块,将该语音指令转为一音频并通过一扬声器播放,并提示以等待接收一确认执行指令,在一默认时间之内未接收到该确认执行指令时即放弃该语音指令的执行;
网络银行模块,产生一网银服务视图显示于一屏幕,将该语音指令转换为符合一银行API规范的一银行规范指令并上传至一银行服务器,及,接收该银行服务器所回传对应该银行规范指令的一执行结果并更新显示于该网银服务视图;
内存,安装一操作系统并存储一应用程序、该语音、该语音译文、该语音指令、该银行规范指令与该第二数据库,该应用程序包含该语音接收模块、该语音转译模块、该译文校对解析模块、该防错机制模块、该网络银行模块与该第二数据库;
该屏幕,用以显示该应用程序的图形化用户接口;
一或多个处理器,连接该麦克风、该扬声器、该内存与该屏幕并执行该应用程序;以及,
其中,当该银行服务逻辑为一转账逻辑时,该语音指令以一帐户别名取代一转入银行账号以进行转账交易。
2.如权利要求1所述的语音控制电视版应用程序银行转账的装置,其特征在于,该银行服务逻辑包含:
一编辑帐户别名逻辑,由一银行账号、一账户别名与一编辑帐户别名指令组成,或,包含该编辑帐户别名指令的任意组合,为编辑帐户的别名的相关银行服务逻辑,可使该银行账号与该账户别名产生对应关系并存储至一帐户别名清单;
一查询余额逻辑,由该银行账号或该账户别名加上一查询余额指令所组成,或,包含该查询余额指令的任意组合,为查询银行账号的余额的相关银行服务逻辑;以及,
该转账逻辑,由该银行账号或该账户别名、一转账金额与一转账指令所组成,或,由一转出银行账号或一转出账户别名、该转账金额、该转入银行账号或一转入帐户别名与该转账指令所组成,或,包含该转账指令的任意组合,为进行转账交易的相关银行服务逻辑。
3.如权利要求1所述的语音控制电视版应用程序银行转账的装置,其特征在于,该译文校对解析模块还包含:
当该语音译文不符合该银行服务逻辑且缺乏该银行账号或该账户别名时,以一模糊理论技术比对该帐户别名清单以检核出符合的该账户别名,并以该符合的帐户别名校对该语音译文。
4.如权利要求1所述的语音控制电视版应用程序银行转账的装置,其特征在于,该防错机制模块还包含:
当该语音指令包含该帐户别名,且当该扬声器播放该语音指令的该音频时,接着以该扬声器播放该账户别名所对应的该银行账号。
5.如权利要求1所述的语音控制电视版应用程序银行转账的装置,其特征在于,该防错机制模块还包含:
当该扬声器播放该语音指令的该音频时,同时以文字方式在该屏幕显示该语音指令的一内容。
6.如权利要求5所述的语音控制电视版应用程序银行转账的装置,其特征在于,该语音指令中的该银行账号或该账户别名有设定对应的一相片或一图示时,当该扬声器播放该语音指令的该音频时,同时在该屏幕显示对应的该相片或该图示。
7.如权利要求1所述的语音控制电视版应用程序银行转账的装置,其特征在于,该防错机制模块还包含:
通过该扬声器以语音回报该执行结果。
8.如权利要求1所述的语音控制电视版应用程序银行转账的装置,其特征在于,该第二数据库是包含以下任一或任意组合:
该帐户别名列表、一应用程序功能列表与一约定户列表。
9.如权利要求1所述的语音控制电视版应用程序银行转账的装置,其特征在于,该银行账号或该转入银行账号是选自:
一约定户账号或一非约定户账号。
10.一种语音控制电视版应用程序银行转账的方法,其特征在于,应用于一网络电视机顶盒或一智能型电视,包含:
启动一麦克风以接收一语音;
将该语音与一第一数据库所存储的复数语音数据进行比对以转译为一文字类型的一语音译文;
依据一第二数据库将该语音译文进行校对与解析,当符合一银行服务逻辑时产生一语音指令;
将该语音指令转为一音频并通过一扬声器播放,并提示以等待接收一确认执行指令,在一默认时间之内未接收到该确认执行指令时即放弃该语音指令的执行;
接收该确认执行指令以将该语音指令转换为符合一银行API规范的一银行规范指令;
上传该银行规范指令至一银行服务器,并接收对应该银行规范指令的一执行结果;以及,
其中,当该银行服务逻辑为一转账逻辑时,该语音指令以一帐户别名取代一转入银行账号以进行转账交易。
11.如权利要求10所述的语音控制电视版应用程序银行转账的方法,其特征在于,该银行服务逻辑包含:
一编辑帐户别名逻辑,由一银行账号、一账户别名与一编辑帐户别名指令组成,或,包含该编辑帐户别名指令的任意组合,为编辑帐户的别名的相关银行服务逻辑,使该银行账号与该账户别名产生对应关系并存储至一帐户别名清单;
一查询余额逻辑,由该银行账号或该账户别名加上一查询余额指令所组成,或,包含该查询余额指令的任意组合,为查询银行账号的余额的相关银行服务逻辑;以及,
该转账逻辑,由该银行账号或该账户别名、一转账金额与一转账指令所组成,或,由一转出银行账号或一转出账户别名、该转账金额、该转入银行账号或一转入帐户别名与该转账指令所组成,或,包含该转账指令的任意组合,为进行转账交易的相关银行服务逻辑。
12.如权利要求10所述的语音控制电视版应用程序银行转账的方法,其特征在于,该方法还包含:
当该语音译文不符合该银行服务逻辑且缺乏该银行账号或该账户别名时,以一模糊理论技术比对该帐户别名清单以检核出符合的该账户别名,并以该符合的帐户别名校对该语音译文。
13.如权利要求10所述的语音控制电视版应用程序银行转账的方法,其特征在于,该方法还包含:
当该语音指令包含该帐户别名,且当该扬声器播放该语音指令的该音频时,接着以该扬声器播放该账户别名所对应的该银行账号。
14.如权利要求10所述的语音控制电视版应用程序银行转账的方法,其特征在于,该方法还包含:
当该扬声器播放该语音指令的该音频时,同时以文字方式在该屏幕显示该语音指令的一内容。
15.如权利要求14所述的语音控制电视版应用程序银行转账的方法,其特征在于,该语音指令中的该银行账号或该账户别名有设定对应的一相片或一图示时,当该扬声器播放该语音指令的该音频时,同时在该屏幕显示对应的该相片或该图示。
16.如权利要求10所述的语音控制电视版应用程序银行转账的方法,其特征在于,该方法还包含:
通过该扬声器以语音回报该执行结果。
17.如权利要求10所述的语音控制电视版应用程序银行转账的方法,其特征在于,该第二数据库是包含以下任一或任意组合:
该帐户别名列表、一应用程序功能列表与一约定户列表。
18.如权利要求10所述的语音控制电视版应用程序银行转账的方法,其特征在于,该银行账号或该转入银行账号是选自:
一约定户账号或一非约定户账号。
19.一种具有屏幕的计算设备,其特征在于,包含:一内存、一处理器以及存储在该内存上并可在该处理器上运行的计算机程序,该处理器执行该计算机程序时实现权利要求10至18任一项所述方法的步骤。
20.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求10至18任一项所述方法的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108122294A TWI770395B (zh) | 2019-06-26 | 2019-06-26 | 語音控制電視版銀行轉帳之裝置與方法 |
TW108122294 | 2019-06-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112153430A true CN112153430A (zh) | 2020-12-29 |
CN112153430B CN112153430B (zh) | 2023-07-11 |
Family
ID=73891787
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911011031.6A Active CN112153430B (zh) | 2019-06-26 | 2019-10-23 | 语音控制电视版应用程序银行转账的装置与方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112153430B (zh) |
TW (1) | TWI770395B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI801015B (zh) * | 2021-12-03 | 2023-05-01 | 中華電信股份有限公司 | 電視頻道資訊介接系統及其方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5845246A (en) * | 1995-02-28 | 1998-12-01 | Voice Control Systems, Inc. | Method for reducing database requirements for speech recognition systems |
US20020091527A1 (en) * | 2001-01-08 | 2002-07-11 | Shyue-Chin Shiau | Distributed speech recognition server system for mobile internet/intranet communication |
CN103116841A (zh) * | 2011-11-17 | 2013-05-22 | 银视通信息科技有限公司 | 一种电视综合支付系统以及相应的控制方法 |
CN103246977A (zh) * | 2013-04-28 | 2013-08-14 | 深圳创维-Rgb电子有限公司 | 一种电视支付信息发送、接收方法 |
KR20140020389A (ko) * | 2012-08-08 | 2014-02-19 | 주식회사 우리은행 | 스마트폰을 이용한 개인 스마트 뱅킹 서비스 방법 |
CN103810763A (zh) * | 2014-02-17 | 2014-05-21 | 无锡普智联科高新技术有限公司 | 基于服务器端语音识别的手机语音报读付费系统及其方法 |
TWI563398B (zh) * | 2015-11-25 | 2016-12-21 | ||
CN106910124A (zh) * | 2015-12-23 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 信息处理方法和装置 |
TWM557409U (zh) * | 2017-09-30 | 2018-03-21 | Ctbc Bank Co Ltd | 利用語音辨識的銀行交易系統 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8447691B2 (en) * | 2007-05-30 | 2013-05-21 | Hsbc Card Services, Inc. | Systems and methods for NACHA compliant ACH transfers using an automated voice response system |
CN102833633B (zh) * | 2012-09-04 | 2016-01-20 | 深圳创维-Rgb电子有限公司 | 一种电视机语音控制系统及方法 |
CN109146450A (zh) * | 2017-06-16 | 2019-01-04 | 阿里巴巴集团控股有限公司 | 支付方法、客户端、电子设备、存储介质和服务器 |
-
2019
- 2019-06-26 TW TW108122294A patent/TWI770395B/zh active
- 2019-10-23 CN CN201911011031.6A patent/CN112153430B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5845246A (en) * | 1995-02-28 | 1998-12-01 | Voice Control Systems, Inc. | Method for reducing database requirements for speech recognition systems |
US20020091527A1 (en) * | 2001-01-08 | 2002-07-11 | Shyue-Chin Shiau | Distributed speech recognition server system for mobile internet/intranet communication |
CN103116841A (zh) * | 2011-11-17 | 2013-05-22 | 银视通信息科技有限公司 | 一种电视综合支付系统以及相应的控制方法 |
KR20140020389A (ko) * | 2012-08-08 | 2014-02-19 | 주식회사 우리은행 | 스마트폰을 이용한 개인 스마트 뱅킹 서비스 방법 |
CN103246977A (zh) * | 2013-04-28 | 2013-08-14 | 深圳创维-Rgb电子有限公司 | 一种电视支付信息发送、接收方法 |
CN103810763A (zh) * | 2014-02-17 | 2014-05-21 | 无锡普智联科高新技术有限公司 | 基于服务器端语音识别的手机语音报读付费系统及其方法 |
TWI563398B (zh) * | 2015-11-25 | 2016-12-21 | ||
CN106910124A (zh) * | 2015-12-23 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 信息处理方法和装置 |
TWM557409U (zh) * | 2017-09-30 | 2018-03-21 | Ctbc Bank Co Ltd | 利用語音辨識的銀行交易系統 |
Non-Patent Citations (2)
Title |
---|
吴剑锋;章璐圯;: "移动情景下不同支付确认方式的支付体验初探", 设计 * |
魏旭阳;: "基于生物认证的移动支付专利技术综述", 河南科技 * |
Also Published As
Publication number | Publication date |
---|---|
TW202101330A (zh) | 2021-01-01 |
CN112153430B (zh) | 2023-07-11 |
TWI770395B (zh) | 2022-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10785522B2 (en) | Method and system for controlling network-enabled devices with voice commands | |
WO2020029500A1 (zh) | 语音命令定制方法、装置和设备及计算机存储介质 | |
US11404052B2 (en) | Service data processing method and apparatus and related device | |
US12080298B2 (en) | Speech-to-text system | |
US8725505B2 (en) | Verb error recovery in speech recognition | |
KR102060775B1 (ko) | 음성 입력에 대응하는 동작을 수행하는 전자 장치 | |
WO2015188454A1 (zh) | 一种快速进入ivr菜单的方法及装置 | |
US20080095327A1 (en) | Systems, apparatuses, and methods for interactively accessing networked services using voice communications | |
KR20240021834A (ko) | 대화형 통신 시스템을 동적으로 탐색하기 위한 방법, 장치 및 시스템 | |
CN111142834A (zh) | 一种业务处理方法及系统 | |
CN112153430B (zh) | 语音控制电视版应用程序银行转账的装置与方法 | |
US20050234720A1 (en) | Voice application system | |
CN113314115B (zh) | 终端设备的语音处理方法、终端设备及可读存储介质 | |
US12277938B2 (en) | Assisted speech recognition | |
US11532308B2 (en) | Speech-to-text system | |
TWM579337U (zh) | Smart branch counter system | |
CN112272182B (zh) | 一种应用登录方法、服务器、设备、介质和计算设备 | |
TWI778273B (zh) | 語音控制電視版金融報價之裝置與方法 | |
KR20130078391A (ko) | 직접입력과 음성 명령을 이용한 하이브리드 방식의 전자문서 입력 방법, 그리고 하이브리드 방식의 전자문서 입력 프로그램을 기록한 컴퓨터로 판독가능한 기록매체 | |
CN111552779A (zh) | 人机对话方法、装置、介质及电子设备 | |
TWI745804B (zh) | 以互動式信息存取金融服務的方法與系統 | |
CN117672216A (zh) | 一种基于智能外设的大屏语音识别方法 | |
CN120220665A (zh) | 语音交互方法、终端、平台、电子设备及程序产品 | |
KR100432373B1 (ko) | 독립적 음성처리를 위한 음성인식 시스템 | |
CN119905091A (zh) | 语音控制方法、第一服务器、第二服务器和语音控制系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |