CN106898349A - 一种语音控制计算机的方法和智能语音助手系统 - Google Patents

一种语音控制计算机的方法和智能语音助手系统 Download PDF

Info

Publication number
CN106898349A
CN106898349A CN201710020864.3A CN201710020864A CN106898349A CN 106898349 A CN106898349 A CN 106898349A CN 201710020864 A CN201710020864 A CN 201710020864A CN 106898349 A CN106898349 A CN 106898349A
Authority
CN
China
Prior art keywords
voice command
mouse
voice
keyboard
configuration file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710020864.3A
Other languages
English (en)
Inventor
梅其珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201710020864.3A priority Critical patent/CN106898349A/zh
Publication of CN106898349A publication Critical patent/CN106898349A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Digital Computer Display Output (AREA)

Abstract

本发明涉及一种语音控制计算机的方法和智能语音助手系统,智能语音助手系统包括:显示界面,用于接收用户输入的第一操作指令,第一操作指令用于开启智能语音助手系统;存储器,用于存储语音配置文件和鼠标键盘配置文件;语音采集器,用于采集用户输入的语音命令,并将语音命令传输至处理器;处理器,用于将语音命令转化为对应的语音命令词条,并调用存储器中的语音配置文件,将语音命令词条与语音配置文件中的词条进行匹配,若匹配,则调用存储器中的鼠标键盘配置文件中与语音命令词条对应的程序操作序列控制程序运行;显示界面还用于显示执行结果为成功。本发明通过语音命令控制计算机工作,代替鼠标键盘操作,从而使计算机的使用更简洁、方便。

Description

一种语音控制计算机的方法和智能语音助手系统
技术领域
本发明涉及计算机技术领域,尤其涉及一种语音控制计算机的方法和智能语音助手系统。
背景技术
微软的windows7系统自带语音识别功能,可以让计算机"聆听",通过语音识别,用声音进行文本的听写,创建文档,根据语音命令进行程序的启动,窗口之间的切换,通过显示编号加确定焦点的方式进行菜单的操作,使用语音识别比使用键盘更方便,相比过去有很明显的进步。
但现有的window7语音识别功能存在以下问题:语音识别有限,通常没有限定场景,上下文,明显逻辑时,语音识别错误频发,语音命令由windows的帮助功能中的“显示语音参考卡”中内容设定,所以功能有限,远没有达到方便实用的目的。而且,window7的语音识别功能,不能通过连续的语音命令,来实现复杂的计算机自动操作。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种语音控制计算机的方法和智能语音助手系统。
本发明解决上述技术问题的技术方案如下:一种智能语音助手系统,其特征在于,包括:
显示界面,用于接收用户输入的第一操作指令,所述第一操作指令用于开启所述智能语音助手系统;
存储器,用于存储语音配置文件和鼠标键盘配置文件;
语音采集器,用于采集所述用户输入的语音命令,并将所述语音命令传输至处理器;
所述处理器,用于将所述语音命令转化为对应的语音命令词条,并调用所述存储器中的所述语音配置文件,将所述语音命令词条与所述语音配置文件中的词条进行匹配,若匹配,则调用所述存储器中的所述鼠标键盘配置文件中与所述语音命令词条对应的程序操作序列控制程序运行;
所述显示界面还用于显示执行结果为成功。
本发明的有益效果是:在开启智能语音助手系统后,通过将接收的用户输入的语音命令转化为对应的语音命令词条,并将语音命令词条与智能语音助手系统中存储的语音配置文件中的词条进行匹配,若匹配,则调用智能语音助手系统中存储的鼠标键盘配置文件中与语音命令词条对应的程序操作序列控制程序运行,并在智能语音助手系统的显示界面上显示执行结果为成功,从而能提高语音识别效率,实现语音控制计算机,使得计算机操作自动化,智能化,使计算机使用更简洁、方便、快捷、省时。方便了老人,残疾人,使语音控制达到日常应用程度,实现了语音识别准确,提高了语音识别率,将日常人工操作的键盘,鼠标动作规范程序化,实现了个人机语音控制自动化完成各种各样任务,省略人工手工键盘鼠标一步步操作,且语音控制计算机执行速度比手工操作快。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步地,所述显示界面还用于,接收所述用户输入的第二操作指令,并将所述第二操作指令传输至所述处理器,所述第二操作指令用于指示所述处理器对所述语音命令词条进行语音识别测试;
所述处理器还用于,根据所述第二操作指令对所述语音命令词条进行语音识别测试,若通过语音识别测试,则将所述语音命令词条传输至存储器;若未通过语音识别测试,则删除所述语音命令词条;
所述存储器还用于,将所述语音命令词条存储至所述语音配置文件中。
进一步地,所述显示界面还用于在其第一区域显示所述语音命令,并当通过语音识别测试,在其第二区域显示所述语音命令词条。
进一步地,当所述语音命令词条与所述语音配置文件中的词条不匹配时,所述显示界面还用于显示执行结果为失败。
进一步地,所述语音配置文件包括语音命令词条库,所述语音命令词条库根据所述用户的需求建立,所述鼠标键盘配置文件包括:网页地址、程序路径和程序名,以及执行所述程序时鼠标操作的具体动作、鼠标操作的位置信息、鼠标操作的等待时间,其中,所述鼠标操作的具体动作包括:移动、双击、左击和右击,所述键盘操作的具体动作包括:输入、回车和ESC。
用户可以用文本编辑功能对语音配置文件和鼠标键盘配置文件进行编辑、增减、修改和保存。
进一步地,当程序运行出现错误时,所述显示界面还用于显示出错信息,且所述智能语音助手系统停止运行。
进一步地,所述处理器还用于判断当前运行的程序所对应的窗口是否处于打开状态,若是,则判断所述窗口的窗口名称是否为所述鼠标键盘配置文件中设定的窗口名称,若不是,则确定程序运行出现错误。
进一步地,还包括:鼠标坐标定位系统,所述鼠标坐标定位系统包括显示界面,所述显示界面用于接收所述用户输入的对键盘的操作指令,并将所述操作指令传输至处理器;
所述处理器还用于根据所述操作指令获取所述鼠标操作的位置信息。
进一步地,当所述鼠标坐标定位系统的显示界面接收到所述用户输入的对键盘“F1”的操作指令时,在所述鼠标坐标定位系统的显示界面的第一区域显示鼠标的当前位置信息(X、Y);
或者,当所述鼠标坐标定位系统的显示界面接收到所述用户输入的对键盘“F2”的操作指令时,强制退出所述鼠标坐标定位系统;
或者,当所述鼠标坐标定位系统接收到所述用户输入的对键盘“F3”的操作指令时,在所述鼠标坐标定位系统的显示界面的第二区域显示当前窗口的名称。
本发明解决上述技术问题的另一种技术方案如下:一种语音控制计算机的方法,其特征在于,包括以下步骤:
步骤1、根据用户输入的第一操作指令开启智能语音助手系统,所述智能语音助手系统中已存储语音配置文件和鼠标键盘配置文件;
步骤2、接收所述用户输入的语音命令,并将所述语音命令转化为对应的语音命令词条;
步骤3、将所述语音命令词条与所述语音配置文件中的词条进行匹配,若匹配,则调用所述鼠标键盘配置文件中与所述语音命令词条对应的程序操作序列控制程序运行,并在所述智能语音助手系统的显示界面上显示执行结果为成功。
本发明的有益效果是:在开启智能语音助手系统后,通过将接收的用户输入的语音命令转化为对应的语音命令词条,并将语音命令词条与智能语音助手系统中存储的语音配置文件中的词条进行匹配,若匹配,则调用智能语音助手系统中存储的鼠标键盘配置文件中与语音命令词条对应的程序操作序列控制程序运行,并在智能语音助手系统的显示界面上显示执行结果为成功,从而能提高语音识别效率,实现语音控制计算机,使得计算机操作自动化,智能化,使计算机使用更简洁、方便、快捷、省时。方便了老人,残疾人,使语音控制达到日常应用程度,实现了语音识别准确,提高了语音识别率,将日常人工操作的键盘,鼠标动作规范程序化,实现了个人机语音控制自动化完成各种各样任务,省略人工手工键盘鼠标一步步操作,且语音控制计算机执行速度比手工操作快。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步地,在步骤2和步骤3之间,还包括:
步骤23、根据所述用户输入的第二操作指令对所述语音命令词条进行语音识别测试,若通过语音识别测试,则将所述语音命令词条存储至所述语音配置文件中;若未通过语音识别测试,则删除所述语音命令词条。
进一步地,在步骤2中,还包括:将所述语音命令显示在所述智能语音助手系统的显示界面的第一区域;在步骤23中,还包括:若通过语音识别测试,则将所述语音命令词条显示在所述智能语音助手系统的显示界面的第二区域。
进一步地,在步骤3中还包括:若不匹配,则在所述智能语音助手系统的显示界面上显示执行结果为失败。
进一步地,所述语音配置文件包括语音命令词条库,所述语音命令词条库根据所述用户的需求建立,所述鼠标键盘配置文件包括:网页地址、程序路径和程序名,以及执行所述程序时鼠标/键盘操作的具体动作、鼠标操作的位置信息、鼠标/键盘操作的等待时间,其中,所述鼠标操作的具体动作包括:移动、双击、左击和右击,所述键盘操作的具体动作包括:输入、回车和ESC。
进一步地,还包括:步骤4、当程序运行出现错误时,在所述智能语音助手系统的显示界面上显示出错信息,且所述智能语音助手系统停止运行。
进一步地,在步骤4中,还包括:判断当前运行的程序所对应的窗口是否处于打开状态,若是,则判断所述窗口的窗口名称是否为所述鼠标键盘配置文件中设定的窗口名称,若不是,则确定程序运行出现错误。
进一步地,所述鼠标操作的位置信息通过所述智能语音助手系统中的鼠标坐标定位系统获取。
进一步地,当所述鼠标坐标定位系统接收到所述用户输入的对键盘“F1”的操作指令时,在所述鼠标坐标定位系统的显示界面的第一区域显示鼠标的当前位置信息(X、Y);
或者,当所述鼠标坐标定位系统接收到所述用户输入的对键盘“F2”的操作指令时,则强制退出所述鼠标坐标定位系统;
或者,当所述鼠标坐标定位系统接收到所述用户输入的对键盘“F3”的操作指令时,在所述鼠标坐标定位系统的显示界面的第二区域显示当前窗口的名称。
本发明附加的方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种智能语音助手系统的示意性结构框图;
图2为图1中所示的显示界面110的示意图;
图3为本发明另一实施例提供的一种智能语音助手系统的示意性结构框图;
图4为图3中所示的鼠标坐标定位系统150包括的显示界面的示意图;
图5为本发明实施例提供的一种语音控制计算机的方法的示意性流程图;
图6为本发明另一实施例提供的一种语音控制计算机的方法的示意性流程图;
图7为本发明另一实施例提供的一种语音控制计算机的方法的示意性流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
图1给出了本发明实施例提供的一种智能语音助手系统100的示意性结构框图。如图1所示的智能语音助手系统100包括:显示界面110、存储器120、语音采集器130和处理器140。其中,
显示界面110用于接收用户输入的第一操作指令。其中,第一操作指令用于开启该智能语音助手系统100。存储器120用于存储语音配置文件和鼠标键盘配置文件。语音采集器130用于采集用户输入的语音命令,并将该语音命令传输至处理器140。
处理器140用于将语音命令转化为对应的语音命令词条,并调用存储器130中的语音配置文件,将语音命令词条与语音配置文件中的词条进行匹配。若匹配,则调用存储器130中的鼠标键盘配置文件中与语音命令词条对应的程序操作序列控制程序运行。显示界面110还用于显示执行结果为成功。通过一条语音命令控制计算机执行序列“连续”的多步骤工作。
上述实施例中提供的一种智能语音助手系统,在开启智能语音助手系统后,通过将接收的用户输入的语音命令转化为对应的语音命令词条,并将语音命令词条与智能语音助手系统中存储的语音配置文件中的词条进行匹配,若匹配,则调用智能语音助手系统中存储的鼠标键盘配置文件中与语音命令词条对应的程序操作序列控制程序运行,并在智能语音助手系统的显示界面上显示执行结果为成功,从而能提高语音识别效率,实现语音控制计算机,使得计算机操作自动化,智能化,使计算机使用更简洁、方便、快捷、省时。方便了老人,残疾人,使语音控制达到日常应用程度,实现了语音识别准确,提高了语音识别率,将日常人工操作的键盘,鼠标动作规范程序化,实现了个人机语音控制自动化完成各种各样任务,省略人工手工键盘鼠标一步步操作,且语音控制计算机执行速度比手工操作快。
同时,由于微软是用显示编号来确定焦点表示菜单的,所以在一打开菜单中往往无法打开下一层菜单。而本发明提供的一种智能语音助手系统可以实现即时打开下一层菜单,即在新打开窗口下打开下一层菜单,从而能通过用户测试过的不同语音命令,实现复杂的计算机自动操作,省时,省力、可靠。
具体的,在该实施例中,语音配置文件可以包括语音命令词条库,语音命令词条库根据用户的需求建立,另外,用户还可以根据自身发音和具体需求确定可识别的语音命令。本发明实施例中采用语义相同,但语音识别率高的语音命令词条存入语音命令词条词库,使得语音命令识别成功率明显提高,且更新方便灵活,可靠性好。
例如,用户经常使用的语音命令词条可以包括“你好、yes、no、确定、取消、界面、双击、计算机、测试、打开文本文件、word文档、哈尔滨到新乡地图、哈尔滨到河南陈堡村地图、中央气象台卫星云图、高空图、云图、高德地图、我的信箱、163、700、哈尔滨到南京地图、文档、百度、地面图、红外卫星云图、高空图700、高空图500、高空图850、计算机C盘、恢复、窗口最小化、关闭、存盘、不保存、否、不是、是、向上翻、向下翻、greet、启动Micaps、打开Micaps、打开网易、网易新闻1、网易新闻2、网易新闻3、网易新闻4、网易新闻5”等等,则语音配置文件中的语音命令词条库至少要包括上述语音命令词条。
应理解,这里仅仅是以一个用户的使用习惯和语音命令的使用频率来列举的语音命令词条,只是举例来说明本发明实施例的技术方案,并不对本发明实施例构成任何限定。
鼠标键盘配置文件可以包括:网页地址、程序路径和程序名,以及执行程序时鼠标/键盘操作的具体动作、鼠标操作的位置信息、鼠标/键盘操作的等待时间。其中,鼠标操作的具体动作包括:移动、双击、左击和右击。键盘操作的具体动作包括:输入、回车和ESC。
例如,语音命令为“百度”则,鼠标键盘配置文件可以包括“打开www.baidu.com、等待第一时间、判断活动窗口是否为百度一下,你就知道-2345加速浏览器8.2、等待第二时间进行判断,若在第二时间内找不到www.baidu.com的窗口名称,则程序自动退出;若在第二时间内找到www.baidu.com的窗口名称,则窗口最大化,即将当前窗口最大化,等待第三时间、左击百度搜索wenbenkuang、等待第四时间、输入“南京”、等待第五时间、左击百度搜索、移动鼠标到(X、Y)。
应理解,这里仅仅是以语音命令为“百度”为例来说明本发明实施例的技术方案,并不对本发明实施例构成任何限定。另外,上述各个等待时间均为毫秒两级。
还应理解,在该实施例中,语音配置文件和鼠标键盘配置文件均可以为“.txt”格式的文本文件,通过记事本打开,方便用户随时查看,修改、编辑和保存。
需要说明的是,在该实施例中,语音采集器140采用教师和/或导游所用的便携式扩音器所带耳机式麦克风与桌面麦克结合使用,使得声卡的音频输入功效提高,因此在使用智能语音助手系统时,使用日常说话音量即可,不用非大声说或喊不可,从而解决了由于没有功放麦克音量偏小影响语音识别的问题。
可选地,在一个实施例中,显示界面110还用于接收用户输入的第二操作指令,并将第二操作指令传输至处理器140。其中,该第二操作指令用于指示处理器140对语音命令词条进行语音识别测试。处理器140还用于根据第二操作指令对语音命令词条进行语音识别测试,若通过语音识别测试,则将语音命令词条传输至存储器130。若未通过语音识别测试,则删除语音命令词条。存储器130还用于将语音命令词条存储至语音配置文件中。
具体的,在该实施例中,显示界面110还用于其第一区域显示语音命令且当通过语音识别测试时,在其第二区域显示语音命令词条。应理解,在该实施例中,第一区域和第二区域是不同的区域,且两个区域不重合。例如,显示界面110的各个显示区域可以如图2所示。
从图2中可以看出,语音命令可以显示在“1”所标示的区域;语音命令词条可以显示在“2”所标示的区域;执行结果则可以显示在“3”所标示的区域。“4”标示的区域为指示语音音量大小的音量条。
如图2所示的显示界面110上设置的“打开语音助手”和“开始词条测试”两个功能按键的功能是互斥的,也就是说,各自独立开始或结束词条测试,打开或关闭语音助手。
另外,显示界面110上还可以显示智能语音助手系统与用户之间的互动交流信息,这样可以提供用户体验。例如:语音命令为“您好”,则在“1”所标示的区域显示“您好”,且在“3”所标示的区域显示“您好,智能语音助手祝您健康”。再如:语音命令为“智能语音助手”,则在“1”所标示的区域显示“智能语音助手”,且在“3”所标示的区域显示“智能语音助手,祝您工作愉快”。再如:语音命令为“节日快乐”,则在“1”所标示的区域显示“节日快乐”,且在“3”所标示的区域显示“智能语音助手,祝您节日快乐”。应理解,这里图2所示的显示界面的布局仅仅是举例说明本发明实施例的技术方案,并不对本发明实施例构成任何限定。
需要说明的是,在该实施例中,若未通过语音识别测试,则显示界面110的第二区域内没有显示该语音命令词条,则用户可以将语音配置文件中的相关内容进行删除。
可选地,在一个实施例中,当语音命令词条与语音配置文件中的词条不匹配时,显示界面还用于显示执行结果为失败。可选地,在一个实施例中,当程序运行出现错误时,显示界面110还用于显示出错信息,且智能语音助手系统停止运行。这样可以避免在程序运行出现错误后,接着执行不必要的操作。
可选地,在一个实施例中,处理器140还用于判断当前运行的程序所对应的窗口是否处于打开状态,若是,则判断该窗口的窗口名称是否为鼠标键盘配置文件中设定的窗口名称,若不是,则确定程序运行出现错误。
上述实施例提供的智能语音助手系统,可以使得每个最新打开窗口都最大化,这样最新打开的窗口中鼠标的操作位置坐标每次启动程序,鼠标坐标都相同,确保了鼠标操作的可靠性。
可选地,在一个实施例中,如图3所示,智能语音助手系统100还包括:鼠标坐标定位系统150。鼠标坐标定位系统150包括显示界面151。显示界面151用于接收用户输入的对键盘的操作指令,并将操作指令传输至处理器140。处理器140还用于根据操作指令获取鼠标操作的位置信息。
具体的,在该实施例中,当鼠标坐标定位系统150的显示界面151接收到用户输入的对键盘“F1”的操作指令时,在鼠标坐标定位系统150的显示界面151的第一区域显示鼠标的当前位置信息(X、Y)。当鼠标坐标定位系统150的显示界面151接收到用户输入的对键盘“F2”的操作指令时,强制退出鼠标坐标定位系统150。这是为了避免获取鼠标位置坐标时,产生鼠标被死锁的问题。当鼠标坐标定位系统150接收到用户输入的对键盘“F3”的操作指令时,在鼠标坐标定位系统150的显示界面151的第二区域显示当前窗口的名称。
应理解,在该实施例中,显示界面151的第一区域和第二区域是不同的区域,且两个区域不重合。例如,显示界面151的各个显示区域可以如图4所示。从图4中可以看出,鼠标的当前位置信息(X、Y)可以显示在“1”所标示的区域;当前窗口的名称可以显示在“2”所标示的区域。
上文结合图1至图4对本发明实施例提供的一种智能语音助手系统进行了详细的描述,下面结合图5至图7,对本发明实施例提供的一种语音控制计算机的方法的技术方案进行详细的描述。
应理解,本发明实施例中的计算机安装了上文各实施例中描述的智能语音助手系统100。
图5给出了本发明实施例提供的一种语音控制计算机的方法200的示意性流程图。如图5所示的语音控制计算机的方法200包括:
210、根据用户输入的第一操作指令开启智能语音助手系统,智能语音助手系统中已存储语音配置文件和鼠标键盘配置文件。
220、接收用户输入的语音命令,并将语音命令转化为对应的语音命令词条。
230、将语音命令词条与语音配置文件中的词条进行匹配,若匹配,则调用鼠标键盘配置文件中与语音命令词条对应的程序操作序列控制程序运行,并在智能语音助手系统的显示界面上显示执行结果为成功。
上述实施例中提供的一种语音控制计算机的方法,在开启智能语音助手系统后,通过将接收的用户输入的语音命令转化为对应的语音命令词条,并将语音命令词条与智能语音助手系统中存储的语音配置文件中的词条进行匹配,若匹配,则调用智能语音助手系统中存储的鼠标键盘配置文件中与语音命令词条对应的程序操作序列控制程序运行,并在智能语音助手系统的显示界面上显示执行结果为成功,从而能提高语音识别效率,实现语音控制计算机,使得计算机操作自动化,智能化,使计算机使用更简洁、方便、快捷、省时。方便了老人,残疾人,使语音控制达到日常应用程度,实现了语音识别准确,提高了语音识别率,将日常人工操作的键盘,鼠标动作规范程序化,实现了个人机语音控制自动化完成各种各样任务,省略人工手工键盘鼠标一步步操作,且语音控制计算机执行速度比手工操作快。
同时,由于微软是用显示编号来确定焦点表示菜单的,所以在一打开菜单中往往无法打开下一层菜单。而本发明提供的一种智能语音助手系统可以实现即时打开下一层菜单,即在新打开窗口下打开下一层菜单,从而能通过用户测试过的不同语音命令,实现复杂的计算机自动操作,省时,省力、可靠。
具体的,在该实施例中,在步骤210中,语音配置文件可以包括语音命令词条库,语音命令词条库根据用户的需求建立。本发明实施例中采用语义相同,但语音识别率高的语音命令词条存入语音命令词条词库,使得语音命令识别成功率明显提高,且更新方便灵活,可靠性好。
鼠标键盘配置文件可以包括:网页地址、程序路径和程序名,以及执行程序时鼠标/键盘操作的具体动作、鼠标操作的位置信息、鼠标/键盘操作的等待时间。其中,鼠标操作的具体动作包括:移动、双击、左击和右击。键盘操作的具体动作包括:输入、回车和ESC。
在步骤220中,还可以将语音命令显示在智能语音助手系统的显示界面的第一区域。在步骤230中,若不匹配,则在智能语音助手系统的显示界面上显示执行结果为失败。
可选地,在一个实施例中,如图6所示,在步骤220和步骤230之间,方法200还包括:
225、根据用户输入的第二操作指令对语音命令词条进行语音识别测试,若通过语音识别测试,则将语音命令词条存储至语音配置文件中。若未通过语音识别测试,则删除语音命令词条。
具体的,在该实施例中,若通过语音识别测试,则将语音命令词条显示在智能语音助手系统的显示界面的第二区域。
可选地,在一个实施例中,如图7所示,方法200还包括:
240、当程序运行出现错误时,在智能语音助手系统的显示界面上显示出错信息,且智能语音助手系统停止运行。
具体的,在该实施例中,判断当前运行的程序所对应的窗口是否处于打开状态,若是,则判断该窗口的窗口名称是否为鼠标键盘配置文件中设定的窗口名称,若不是,则确定程序运行出现错误。
应理解,在另一个实施例中,可以同时包括步骤210、步骤220、步骤225、步骤230和步骤240,这里仅仅是为了描述的简洁,不再赘述各个步骤的具体内容。
可选地,在一个实施例中,鼠标操作的位置信息通过智能语音助手系统中的鼠标坐标定位系统获取。
具体的,在该实施例中,当鼠标坐标定位系统接收到用户输入的对键盘“F1”的操作指令时,在鼠标坐标定位系统的显示界面的第一区域显示鼠标的当前位置信息(X、Y)。当鼠标坐标定位系统接收到用户输入的对键盘“F2”的操作指令时,则强制退出鼠标坐标定位系统。当鼠标坐标定位系统接收到用户输入的对键盘“F3”的操作指令时,在鼠标坐标定位系统的显示界面的第二区域显示当前窗口的名称。
应理解,在本发明各实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
还应理解,在本发明实施例中,根据本发明实施例的语音控制计算机的方法200的执行可对应于根据本发明实施例的智能语音助手系统100,并且该智能语音助手系统100中的各个模块的上述和其它操作和/或功能分别为了实现图5至图7中的各个方法的相应流程,为了简洁,在此不再赘述。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (18)

1.一种智能语音助手系统,其特征在于,包括:
显示界面,用于接收用户输入的第一操作指令,所述第一操作指令用于开启所述智能语音助手系统;
存储器,用于存储语音配置文件和鼠标键盘配置文件;
语音采集器,用于采集所述用户输入的语音命令,并将所述语音命令传输至处理器;
所述处理器,用于将所述语音命令转化为对应的语音命令词条,并调用所述存储器中的所述语音配置文件,将所述语音命令词条与所述语音配置文件中的词条进行匹配,若匹配,则调用所述存储器中的所述鼠标键盘配置文件中与所述语音命令词条对应的程序操作序列控制程序运行;
所述显示界面还用于显示执行结果为成功。
2.根据权利要求1所述的智能语音助手系统,其特征在于,所述显示界面还用于,接收所述用户输入的第二操作指令,并将所述第二操作指令传输至所述处理器,所述第二操作指令用于指示所述处理器对所述语音命令词条进行语音识别测试;
所述处理器还用于,根据所述第二操作指令对所述语音命令词条进行语音识别测试,若通过语音识别测试,则将所述语音命令词条传输至存储器;若未通过语音识别测试,则删除所述语音命令词条;
所述存储器还用于,将所述语音命令词条存储至所述语音配置文件中。
3.根据权利要求2所述的智能语音助手系统,其特征在于,所述显示界面还用于在其第一区域显示所述语音命令,并当通过语音识别测试时,在其第二区域显示所述语音命令词条。
4.根据权利要求1至3中任一项所述的智能语音助手系统,其特征在于,当所述语音命令词条与所述语音配置文件中的词条不匹配时,所述显示界面还用于显示执行结果为失败。
5.根据权利要求4所述的智能语音助手系统,其特征在于,所述语音配置文件包括语音命令词条库,所述语音命令词条库根据所述用户的需求建立,所述鼠标键盘配置文件包括:网页地址、程序路径和程序名,以及执行所述程序时鼠标/键盘操作的具体动作、鼠标操作的位置信息、鼠标/键盘操作的等待时间,其中,所述鼠标操作的具体动作包括:移动、双击、左击和右击,所述键盘操作的具体动作包括:输入、回车和ESC。
6.根据权利要求5所述的智能语音助手系统,其特征在于,当程序运行出现错误时,所述显示界面还用于显示出错信息,且所述智能语音助手系统停止运行。
7.根据权利要求6所述的智能语音助手系统,其特征在于,所述处理器还用于判断当前运行的程序所对应的窗口是否处于打开状态,若是,则判断所述窗口的窗口名称是否为所述鼠标键盘配置文件中设定的窗口名称,若不是,则确定程序运行出现错误。
8.根据权利要求5至7中任一项所述的智能语音助手系统,其特征在于,还包括:鼠标坐标定位系统,所述鼠标坐标定位系统包括显示界面,所述显示界面用于接收所述用户输入的对键盘的操作指令,并将所述操作指令传输至处理器;
所述处理器还用于根据所述操作指令获取所述鼠标操作的位置信息。
9.根据权利要求8所述的智能语音助手系统,其特征在于,当所述鼠标坐标定位系统的显示界面接收到所述用户输入的对键盘“F1”的操作指令时,在所述鼠标坐标定位系统的显示界面的第一区域显示鼠标的当前位置信息(X、Y);
或者,当所述鼠标坐标定位系统的显示界面接收到所述用户输入的对键盘“F2”的操作指令时,强制退出所述鼠标坐标定位系统;
或者,当所述鼠标坐标定位系统接收到所述用户输入的对键盘“F3”的操作指令时,在所述鼠标坐标定位系统的显示界面的第二区域显示当前窗口的名称。
10.一种语音控制计算机的方法,其特征在于,包括以下步骤:
步骤1、根据用户输入的第一操作指令开启智能语音助手系统,所述智能语音助手系统中已存储语音配置文件和鼠标键盘配置文件;
步骤2、接收所述用户输入的语音命令,并将所述语音命令转化为对应的语音命令词条;
步骤3、将所述语音命令词条与所述语音配置文件中的词条进行匹配,若匹配,则调用所述鼠标键盘配置文件中与所述语音命令词条对应的程序操作序列控制程序运行,并在所述智能语音助手系统的显示界面上显示执行结果为成功。
11.根据权利要求10所述的语音控制计算机的方法,其特征在于,在步骤2和步骤3之间,还包括:
步骤23、根据所述用户输入的第二操作指令对所述语音命令词条进行语音识别测试,若通过语音识别测试,则将所述语音命令词条存储至所述语音配置文件中;若未通过语音识别测试,则删除所述语音命令词条。
12.根据权利要求16所述的语音控制计算机的方法,其特征在于,
在步骤2中,还包括:将所述语音命令显示在所述智能语音助手系统的显示界面的第一区域;
在步骤23中,还包括:若通过语音识别测试,则将所述语音命令词条显示在所述智能语音助手系统的显示界面的第二区域。
13.根据权利要求10至12中任一项所述的语音控制计算机的方法,其特征在于,在步骤3中还包括:
若不匹配,则在所述智能语音助手系统的显示界面上显示执行结果为失败。
14.根据权利要求13所述的语音控制计算机的方法,其特征在于,所述语音配置文件包括语音命令词条库,所述语音命令词条库根据所述用户的需求建立,所述鼠标键盘配置文件包括:网页地址、程序路径和程序名,以及执行所述程序时鼠标/键盘操作的具体动作、鼠标操作的位置信息、鼠标/键盘操作的等待时间,其中,所述鼠标操作的具体动作包括:移动、双击、左击和右击,所述键盘操作的具体动作包括:输入、回车和ESC。
15.根据权利要求14所述的语音控制计算机的方法,其特征在于,还包括:
步骤4、当程序运行出现错误时,在所述智能语音助手系统的显示界面上显示出错信息,且所述智能语音助手系统停止运行。
16.根据权利要求15所述的语音控制计算机的方法,其特征在于,在步骤4中,还包括:
判断当前运行的程序所对应的窗口是否处于打开状态,若是,则判断所述窗口的窗口名称是否为所述鼠标键盘配置文件中设定的窗口名称,若不是,则确定程序运行出现错误。
17.根据权利要求14至16中任一项所述的语音控制计算机的方法,其特征在于,所述鼠标操作的位置信息通过所述智能语音助手系统中的鼠标坐标定位系统获取。
18.根据权利要求17所述的语音控制计算机的方法,其特征在于,当所述鼠标坐标定位系统接收到所述用户输入的对键盘“F1”的操作指令时,在所述鼠标坐标定位系统的显示界面的第一区域显示鼠标的当前位置信息(X、Y);
或者,当所述鼠标坐标定位系统接收到所述用户输入的对键盘“F2”的操作指令时,则强制退出所述鼠标坐标定位系统;
或者,当所述鼠标坐标定位系统接收到所述用户输入的对键盘“F3”的操作指令时,在所述鼠标坐标定位系统的显示界面的第二区域显示当前窗口的名称。
CN201710020864.3A 2017-01-11 2017-01-11 一种语音控制计算机的方法和智能语音助手系统 Pending CN106898349A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710020864.3A CN106898349A (zh) 2017-01-11 2017-01-11 一种语音控制计算机的方法和智能语音助手系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710020864.3A CN106898349A (zh) 2017-01-11 2017-01-11 一种语音控制计算机的方法和智能语音助手系统

Publications (1)

Publication Number Publication Date
CN106898349A true CN106898349A (zh) 2017-06-27

Family

ID=59198192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710020864.3A Pending CN106898349A (zh) 2017-01-11 2017-01-11 一种语音控制计算机的方法和智能语音助手系统

Country Status (1)

Country Link
CN (1) CN106898349A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107748602A (zh) * 2017-11-15 2018-03-02 安徽声讯信息技术有限公司 一种基于语音识别的智能语音计算机
CN107845383A (zh) * 2017-09-27 2018-03-27 北京金山安全软件有限公司 控制服务设备执行服务操作的方法、装置、设备及介质
CN107861706A (zh) * 2017-11-07 2018-03-30 成都野望数码科技有限公司 一种语音指令的响应方法及装置
CN107909998A (zh) * 2017-10-18 2018-04-13 成都市共维科技有限公司 语音指令处理方法、装置、计算机设备和存储介质
CN108153574A (zh) * 2017-12-28 2018-06-12 北京奇点机智科技有限公司 应用程序处理方法、装置及电子设备
CN108765785A (zh) * 2018-04-02 2018-11-06 广州供电局有限公司 一种远程视频柜员机vtm自助终端系统
CN109189280A (zh) * 2018-06-29 2019-01-11 南京铁道职业技术学院 语音屏幕鼠标校核下的图标安全操作方法
CN109878434A (zh) * 2017-12-06 2019-06-14 通用汽车环球科技运作有限责任公司 外部信息呈现
CN109979460A (zh) * 2019-03-11 2019-07-05 上海白泽网络科技有限公司 可视化语音信息交互方法及装置
CN112102820A (zh) * 2019-06-18 2020-12-18 北京京东尚科信息技术有限公司 交互方法、交互装置、电子设备和介质
CN115016708A (zh) * 2017-09-15 2022-09-06 三星电子株式会社 电子装置及其控制方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1521239A1 (en) * 2003-10-01 2005-04-06 Alcatel Multi-modal input form with dictionary and grammar
US20080270128A1 (en) * 2005-11-07 2008-10-30 Electronics And Telecommunications Research Institute Text Input System and Method Based on Voice Recognition
US20110153315A1 (en) * 2009-12-22 2011-06-23 Qualcomm Incorporated Audio and speech processing with optimal bit-allocation for constant bit rate applications
CN102622085A (zh) * 2012-04-11 2012-08-01 北京航空航天大学 多维感官人机交互系统及交互方法
CN202694544U (zh) * 2012-07-30 2013-01-23 厦门哈隆电子有限公司 无线语音识别遥控器
CN103219005A (zh) * 2013-04-28 2013-07-24 北京云知声信息技术有限公司 一种语音识别方法及装置
CN103488401A (zh) * 2013-09-30 2014-01-01 乐视致新电子科技(天津)有限公司 一种语音助手激活方法和装置
CN103488384A (zh) * 2013-09-30 2014-01-01 乐视致新电子科技(天津)有限公司 一种语音助手应用界面显示方法和装置
CN105989841A (zh) * 2015-02-17 2016-10-05 上海汽车集团股份有限公司 车载语音控制方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1521239A1 (en) * 2003-10-01 2005-04-06 Alcatel Multi-modal input form with dictionary and grammar
US20080270128A1 (en) * 2005-11-07 2008-10-30 Electronics And Telecommunications Research Institute Text Input System and Method Based on Voice Recognition
US20110153315A1 (en) * 2009-12-22 2011-06-23 Qualcomm Incorporated Audio and speech processing with optimal bit-allocation for constant bit rate applications
CN102622085A (zh) * 2012-04-11 2012-08-01 北京航空航天大学 多维感官人机交互系统及交互方法
CN202694544U (zh) * 2012-07-30 2013-01-23 厦门哈隆电子有限公司 无线语音识别遥控器
CN103219005A (zh) * 2013-04-28 2013-07-24 北京云知声信息技术有限公司 一种语音识别方法及装置
CN103488401A (zh) * 2013-09-30 2014-01-01 乐视致新电子科技(天津)有限公司 一种语音助手激活方法和装置
CN103488384A (zh) * 2013-09-30 2014-01-01 乐视致新电子科技(天津)有限公司 一种语音助手应用界面显示方法和装置
CN105989841A (zh) * 2015-02-17 2016-10-05 上海汽车集团股份有限公司 车载语音控制方法及装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115016708A (zh) * 2017-09-15 2022-09-06 三星电子株式会社 电子装置及其控制方法
CN107845383A (zh) * 2017-09-27 2018-03-27 北京金山安全软件有限公司 控制服务设备执行服务操作的方法、装置、设备及介质
WO2019062090A1 (zh) * 2017-09-27 2019-04-04 北京金山安全软件有限公司 控制服务设备执行服务操作的方法、装置、设备及介质
CN107909998A (zh) * 2017-10-18 2018-04-13 成都市共维科技有限公司 语音指令处理方法、装置、计算机设备和存储介质
CN107861706A (zh) * 2017-11-07 2018-03-30 成都野望数码科技有限公司 一种语音指令的响应方法及装置
CN107748602A (zh) * 2017-11-15 2018-03-02 安徽声讯信息技术有限公司 一种基于语音识别的智能语音计算机
CN109878434A (zh) * 2017-12-06 2019-06-14 通用汽车环球科技运作有限责任公司 外部信息呈现
CN108153574A (zh) * 2017-12-28 2018-06-12 北京奇点机智科技有限公司 应用程序处理方法、装置及电子设备
CN108765785A (zh) * 2018-04-02 2018-11-06 广州供电局有限公司 一种远程视频柜员机vtm自助终端系统
CN109189280A (zh) * 2018-06-29 2019-01-11 南京铁道职业技术学院 语音屏幕鼠标校核下的图标安全操作方法
CN109189280B (zh) * 2018-06-29 2022-04-01 南京铁道职业技术学院 语音屏幕鼠标校核下的图标安全操作方法
US11656738B2 (en) 2018-06-29 2023-05-23 Nanjing Institute Of Railway Technology Secure operation method for icon based on voice-screen-mouse verification
CN109979460A (zh) * 2019-03-11 2019-07-05 上海白泽网络科技有限公司 可视化语音信息交互方法及装置
CN112102820A (zh) * 2019-06-18 2020-12-18 北京京东尚科信息技术有限公司 交互方法、交互装置、电子设备和介质

Similar Documents

Publication Publication Date Title
CN106898349A (zh) 一种语音控制计算机的方法和智能语音助手系统
CN102509483B (zh) 一种口语考试的分布式自动评分系统及其方法
CN111277706B (zh) 一种应用推荐方法、装置、存储介质及电子设备
US8886521B2 (en) System and method of dictation for a speech recognition command system
Johnston et al. MATCH: An architecture for multimodal dialogue systems
CN108399923B (zh) 多人发言中发言人识别方法以及装置
KR101545881B1 (ko) 휴대 단말기의 입력 처리 장치 및 방법
CN107680019A (zh) 一种考试方案的实现方法、装置、设备及存储介质
CN105810194B (zh) 待机状态下语音控制信息获取方法和智能终端
CN107924483A (zh) 通用假设排列模型的生成与应用
CN106504748A (zh) 一种语音控制方法和装置
WO2020253064A1 (zh) 语音的识别方法及装置、计算机设备、存储介质
CN104538034A (zh) 一种语音识别方法及系统
CN108733343A (zh) 生成语音控制指令的方法、装置及存储介质
CN108108094A (zh) 一种信息处理方法、终端及计算机可读介质
JP2022037100A (ja) 車載機器の音声処理方法、装置、機器及び記憶媒体
CN107733782A (zh) 根据任务生成群的方法、装置及系统
CN101211335A (zh) 具有翻译功能的移动通信终端、翻译系统和翻译方法
TW201510774A (zh) 以語音辨識來選擇控制客體的裝置及方法
CN108959483A (zh) 一种基于搜索的学习辅助方法及电子设备
CN111524507A (zh) 语音信息的反馈方法、装置、设备、服务器及存储介质
JPH07222248A (ja) 携帯型情報端末における音声情報の利用方式
CN108491379A (zh) 快捷键识别方法、装置、设备以及计算机可读存储介质
CN113901186A (zh) 电话录音标注方法、装置、设备及存储介质
CN109033052A (zh) 页面处理方法及装置、介质和计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170627