CN104461446A - 基于语音交互的软件运行方法及系统 - Google Patents
基于语音交互的软件运行方法及系统 Download PDFInfo
- Publication number
- CN104461446A CN104461446A CN201410634017.2A CN201410634017A CN104461446A CN 104461446 A CN104461446 A CN 104461446A CN 201410634017 A CN201410634017 A CN 201410634017A CN 104461446 A CN104461446 A CN 104461446A
- Authority
- CN
- China
- Prior art keywords
- information
- software
- voice
- project implementation
- project
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000003993 interaction Effects 0.000 title abstract 3
- 238000006243 chemical reaction Methods 0.000 claims abstract description 30
- 230000008878 coupling Effects 0.000 claims description 35
- 238000010168 coupling process Methods 0.000 claims description 35
- 238000005859 coupling reaction Methods 0.000 claims description 35
- 230000002452 interceptive effect Effects 0.000 claims description 27
- 238000004891 communication Methods 0.000 claims description 19
- 238000011161 development Methods 0.000 abstract description 8
- 238000005516 engineering process Methods 0.000 abstract description 8
- 206010063385 Intellectualisation Diseases 0.000 abstract 1
- 230000000875 corresponding effect Effects 0.000 description 16
- 230000008569 process Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 238000011038 discontinuous diafiltration by volume reduction Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Abstract
本发明涉及一种基于语音交互的软件运行方法及系统,所述软件与所述语音助手独立运行,所述语音助手获取所述软件运行的执行项目信息,所述语音助手将语音识别转换结果与获取的执行项目信息进行匹配,然后对于匹配的执行项目信息,根据执行项目元素信息和执行项目状态信息和语音信息,由软件进行操作执行。本发明基于语音交互的软件运行方法及系统,根据软件的实时执行项目信息进行对其进行操作和使用,使语音软件真正迈向智能化,同时,与软件分开独立运行,可以一个语音助手与多个软件配合使用,大大节约系统资源。另外,方便对语音引擎进行更新和创新,促进语音技术在智能化方面的发展。
Description
技术领域
本发明涉及一种语音交互辅助方法及系统,尤其涉及一种基于语音交互的软件运行方法及系统。
背景技术
尽管智能手机、网络等新兴科技大大改变了人们的生产和生活,但在生产生活中,软件使用具有不可取代的信息传输地位。随着科技的发展,软件技术也得到了长足的发展。随着语音技术的发展,电脑、智能终端也越来越走近人们的生活。目前在软件语音服务通常采用在软件中内嵌语音软件进行语音控制操作,多数只能进行具体操作项目进行操作,这种方法大多将软件的操作语音预先固定在所述软件中,只能根据预先固定的语音信息进行操作。而一些软件用于网络信息服务,软件运行会根据网络信息的变化而变化,由于固设的语音信息不可能随之变化,导致对于变化的信息的语音操作面临技术障碍,因此,现有内嵌操作不能针对软件的实时执行项目信息进行对其进行操作和使用。另外,对于在系统中通常装载多个软件,则每个软件均进行复杂的语音内嵌开发才能进行使用,同时,在软件进行加载时,会占用大量的内存,特别是同时加载几个软件时,需要大量的内存资源,影响系统的运行效果。随着语音识别的程度越来越高,语音引擎也越来越庞大,语音控制也越来越智能化,这需要语音引擎本身不断的更新和发展,语音内嵌显然大大限制了语音控制的发展。
发明内容
本发明解决的技术问题是:构建一种基于语音交互的软件运行方法及系统,克服现有技术不能针对软件的实时执行项目信息进行对其进行操作和使用以及影响系统的运行效果,限制语音控制在软件上的发展的技术问题。
本发明的技术方案是:提供一种基于语音交互的软件运行方法,包括软件、语音助手,所述软件与所述语音助手独立运行,语音交互辅助方法包括如下步骤:
获取执行项目信息:所述语音助手获取所述软件运行的执行项目信息,所述执行项目信息包括执行项目元素信息或执行项目状态信息;
输入语音:所述语音助手采集语音信息,所述语音助手对所述语音信息进行语音识别转换;
匹配执行:所述语音助手将语音识别转换结果与获取的执行项目信息进行匹配;若所述软件运行的执行项目元素信息与所述语音识别结果在相关信息上相同或相似,则所述语音助手将匹配的执行项目元素信息传送到所述软件,由所述软件执行所述执行项目元素信息对应的项目;若所述软件运行的执行项目状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手调用预先构建的该项目信息的项目状态模板,则所述语音助手根据语音信息将相应项目状态模板的信息传送到所述软件,由所述软件执行所述项目状态模板的信息对应的项目。
本发明的进一步技术方案是:所述软件和所述语音助手通过所述软件的预留接口建立通信连接或者所述软件和所述语音助手通过专有协议建立通信连接。
本发明的进一步技术方案是:所述软件包括多种独立运行的软件,所述语音助手与当前活动的所述软件配合工作。
本发明的进一步技术方案是:还包括网络服务器,所述语音助手将采集的执行项目信息上传到所述网络服务器,所述网络服务器将所述执行项目信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
本发明的进一步技术方案是:所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,或者匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。
本发明的技术方案是:构建一种基于语音交互的软件运行系统,包括软件、语音助手,所述软件与所述语音助手独立运行,所述软件包括采集执行项目信息的采集模块、与所述语音助手进行通信的通信模块、执行模块,所述语音助手包括获取所述软件运行的执行项目信息的信息获取模块、采集语音信息的语音采集模块、进行语音识别转换的语音识别模块、匹配模块、传输模块,所述信息获取模块获取所述软件运行的执行项目信息,所述执行项目信息包括执行项目元素信息或执行项目状态信息;所述语音采集模块采集语音信息,所述语音识别模块对所述语音信息进行语音识别转换;所述匹配模块将语音识别转换结果与获取的执行项目信息进行匹配;若所述软件运行的执行项目元素信息与所述语音识别结果在相关信息上相同或相似,所述传输模块将匹配的执行项目元素信息传送到所述软件,所述执行模块执行所述执行项目元素信息对应的项目;若所述软件运行的执行项目状态信息与所述语音识别结果在相关信息上相同或相似,所述语音助手调用预先构建的该项目信息的项目状态模板,由所述传输模块根据语音信息将相应项目状态模板的信息传送到所述软件,所述执行模块执行所述项目状态模板的信息对应的项目。
本发明的进一步技术方案是:所述软件包括多种独立运行的软件,所述语音助手与当前活动的所述软件配合工作。
本发明的进一步技术方案是:还包括网络服务器,所述语音助手将采集的执行项目信息上传到所述网络服务器,所述网络服务器将所述执行项目信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
本发明的进一步技术方案是:所述软件包括第一信息输出模块或者所述语音助手包括第二信息输出模块。
本发明的技术效果是:构建一种基于语音交互的软件运行方法及系统,包括软件、语音助手,所述软件与所述语音助手独立运行,所述语音助手获取所述软件运行的执行项目信息,所述执行项目信息包括执行项目元素信息或执行项目状态信息;所述语音助手采集语音信息,所述语音助手对所述语音信息进行语音识别转换;所述语音助手将语音识别转换结果与获取的执行项目信息进行匹配;若所述软件运行的执行项目元素信息与所述语音识别结果在相关信息上相同或相似,则所述语音助手将匹配的执行项目元素信息传送到所述软件,由所述软件执行所述执行项目元素信息对应的项目;若所述软件运行的执行项目状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手调用预先构建的该项目信息的项目状态模板,则所述语音助手根据语音信息将相应项目状态模板的信息传送到所述软件,由所述软件执行所述项目状态模板的信息对应的项目。本发明基于语音交互的软件运行方法及系统,所述软件与所述语音助手独立运行,所述语音助手获取所述软件运行的执行项目信息,所述语音助手将语音识别转换结果与获取的执行项目信息进行匹配,然后对于匹配的执行项目信息,根据执行项目元素信息和执行项目状态信息和语音信息,由软件进行操作执行。本发明基于语音交互的软件运行方法及系统,根据软件的实时执行项目信息进行对其进行操作和使用,使语音软件真正迈向智能化,同时,与软件分开独立运行,可以一个语音助手与多个软件配合使用,大大节约系统资源。另外,方便对语音引擎进行更新和创新,促进语音技术在智能化方面的发展。
附图说明
图1为本发明的结构示意图。
图2为本发明的优选实施方式结构示意图。
具体实施方式
下面结合具体实施例,对本发明技术方案进一步说明。
如图1所示,本发明的具体实施方式是:提供一种基于语音交互的软件运行方法,包括软件1、语音助手2,所述软件1与所述语音助手2独立运行,语音交互辅助方法包括如下步骤:
获取执行项目信息:所述语音助手2获取所述软件1运行的执行项目信息,所述执行项目信息包括执行项目元素信息或执行项目状态信息。
具体实施过程如下:所述语音助手2获取所述软件1运行的执行项目信息方式包括两种方式:一种方式是所述软件1后台采集自身运行的执行项目信息,这种信息采集方式全面、准确、快速,为首选方式。另外一种方式是:所述语音助手2通过所述软件1的预留接口采集所述软件1运行的执行项目信息,这种方式要根据预留接口的功能决定采集信息的程度。针对所述软件1采集的执行项目信息,由所述软件1传送到所述语音助手2完成执行项目信息的获取。针对所述语音助手2通过所述软件1的预留接口采集所述软件1运行的执行项目信息,其本身即是执行项目信息获取的过程。所述执行项目信息包括执行项目元素信息或执行项目状态信息。所述执行项目元素信息包括运行详情界面呈现的可视信息,具体包括运行界面的文字信息、图片信息、视频信息名称等,运行详情界面的文字信息为最主要的信息。所述执行项目状态信息主要包括运行界面涉及的操作信息,比如:播放视频、播放音乐、操作游戏等相关运行信息。具体实施例中,根据这些信息,通常将采集的元素信息多转换为文字信息。
输入语音:所述语音助手2采集语音信息,所述语音助手2对所述语音信息进行语音识别转换。
具体实施过程如下:通过外部语音输入设备输入语音信息,所述语音助手2采集所述语音信息,然后对所述语音信息进行语音识别转换。具体实施例中,语音识别转换结果包括文字信息,也可以涉及操作信息。比如:打开快乐大本营,则语音识别转换结果涉及操作信息,也包括文字信息。
匹配执行:所述语音助手2将语音识别转换结果与获取的执行项目信息进行匹配;若所述软件1运行的执行项目元素信息与所述语音识别结果在相关信息上相同或相似,则所述语音助手2将匹配的执行项目元素信息传送到所述软件1,由所述软件1执行所述执行项目元素信息对应的项目;若所述软件运行的执行项目状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手2调用预先构建的该项目信息的项目状态模板,则所述语音助手2根据语音信息将相应项目状态模板的信息传送到所述软件1,由所述软件1执行所述项目状态模板的信息对应的项目。
具体实施过程如下:所述语音助手2将语音识别转换结果与获取的执行项目信息进行匹配,主要从各自己相关信息的发音、文字、文字含义或者操作信息进行匹配,所述执行项目元素信息包括执行项目元素信息的名称或执行操作信息的名称。所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,比如:以视频播放软件为例,当前执行项目元素信息为“快乐大本营”,从“快乐大本营”的发音、文字进行相同或相似匹配,也可以从其所属类型上进行匹配,如:“快乐大本营”为综艺节目,还可以从其主持人上进行信息的匹配,还可以从其所属软件台上进行信息匹配等。另一种方式是:匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。比如:当前执行项目元素信息为“快乐大本营”,可以取其部分信息“快乐”和“大本营”进行匹配,若语音识别结果中包括“快乐”或者“大本营”,则也可以将“快乐大本营”匹配为相关。匹配相关后,所述语音助手2将匹配的执行项目元素信息传送到所述软件1,由所述软件1执行所述执行项目元素信息对应的项目。比如执行项目元素信息中有显示“快乐大本营”的节目,匹配相关后,所述语音助手2将“快乐大本营”信息传输到所述软件1,所述软件1执行该“快乐大本营”的节目,执行结果包括选择、点击等操作。
所述软件1运行的执行项目状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手2调用预先构建的该项目信息的项目状态模板,则所述语音助手2根据语音信息将相应项目状态模板的信息传送到所述软件1,由所述软件1执行所述项目状态模板的信息对应的项目。举例如下:若当前采集的执行项目状态信息为“播放非诚勿扰”,则所述语音助手2调用预先构建的视频播放器模块,视频播放器模块包括“播放”、“快进”、“快退”、“音量加大”、“音量减小”、“对比度增大”、“对比度减小”等相关视频播放涉及到的操作信息,若语音识别结果的信息包括“增大音量”,从其含义理解,应为“音量加大”,则所述语音助手2将“音量加大”发送到所述软件1,然后所述软件1执行音量加大的操作。
如图1所示,本发明的优选实施方式是:所述软件1和所述语音助手2进行信息传输过程中,所述软件1和所述语音助手2通过以下两种方式建立通信连接。所述软件1和所述语音助手2通过所述软件1的预留接口建立通信连接或者所述软件1和所述语音助手2通过专有协议建立通信连接。所述语音助手2获取采集运行的执行项目信息包括两种方式:所述软件1向所述语音助手2传输或者所述语音助手2直接向所述软件1采集。针对所述软件1采集运行的执行项目信息,所述软件1与所述语音助手2建立通信连接,然后由所述软件1将采集的运行执行项目信息传输到所述语音助手2。所述语音助手2也可以通过所述软件1预留的接口与所述软件1建立通信连接,所述语音助手2直接向所述软件1采集获取所述软件1的运行执行项目信息。所述语音助手2根据所述软件1的预留接口与所述软件1建立通信连接。目前,大多数软件为一些特殊功能,均预留一些通信接口,比如:一些软件为老人看不清楚而预留进行语音朗读的接口,或者,一些软件为盲人预留的辅助操作接口等。所述语音助手2通过所述软件1的这些功能接口与所述软件1建立通信连接。所述语音助手2与所述软件1通过专有协议建立通信连接。通过构建所述语音助手2与所述软件1通信的专有协议,实现所述语音助手2与所述软件1的通信连接。
如图1所示,本发明的优选实施方式是:所述软件包括多种独立运行的软件,所述语音助手与当前活动的所述软件配合工作。具体实施过程如下:所述软件1为多种独立运行的软件,所述语音助手2与当前活动的所述软件1配合工作。若当前环境只有一个所述软件1运行,则所述语音助手2与当前的所述软件1配合工作,若当前系统环境有多个所述软件1运行,则所述语音助手2通过当前系统,比如安卓系统,获取系统环境中的当前的所述软件1,然后所述语音助手2与当前的所述软件1建立通信连接,进行相关工作。
如图2所示,本发明的优选实施方式是:还包括网络服务器3,所述语音助手2将采集的执行项目信息上传到所述网络服务器3,所述网络服务器3将所述执行项目信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手2。若执行项目信息为“非诚勿扰”,所述网络服务器3预先存储有“非诚勿扰”的相关信息,比如,“非诚勿扰”的介绍信息、“非诚勿扰”的主持人相关信息,“非诚勿扰”的歌曲链接信息等信息,所述网络服务器3将“非诚勿扰”相关的这些信息传输到所述语音助手2,所述语音助手2将这些信息组织成信息列表,可以直接显示输出,供用户使用,包括查看、播放等操作;也可以传输到所述软件1,由所述软件1显示输出,供使用;还可以传输到移动终端,由移动终端显示输出,供使用。
如图1所示,本发明的具体实施方式是:构建一种基于语音交互的软件运行系统,包括软件1、语音助手2,所述软件1与所述语音助手2独立运行,所述软件1包括采集执行项目信息的采集模块11、与所述语音助手进行通信的通信模块12、执行模块13,所述语音助手2包括获取所述软件1运行的执行项目信息的信息获取模块21、采集语音信息的语音采集模块22、进行语音识别转换的语音识别模块23、匹配模块24、传输模块25,所述信息获取模块21获取所述软件1运行的执行项目信息,所述执行项目信息包括执行项目元素信息或执行项目状态信息;所述语音采集模块22采集语音信息,所述语音识别模块23对所述语音信息进行语音识别转换;所述匹配模块24将语音识别转换结果与获取的执行项目信息进行匹配;若所述软件1运行的执行项目元素信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,所述传输模块25将匹配的执行项目元素信息传送到所述软件1,所述执行模块13执行所述执行项目元素信息对应的项目;若所述软件1运行的执行项目状态信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,所述语音助手2调用预先构建的该项目信息的项目状态模板,由所述传输模块25根据语音信息将相应项目状态模板的信息传送到所述软件1,所述执行模块13执行所述项目状态模板的信息对应的项目。
如图1所示,本发明的具体实施过程是:所述信息获取模块21获取所述软件1运行的执行项目信息方式包括两种方式:一种方式是所述软件1后台采集自身运行的执行项目信息,这种信息采集方式全面、准确、快速,为首选方式。另外一种方式是:所述语音助手2通过所述软件1的预留接口采集所述软件1运行的执行项目信息,这种方式要根据预留接口的功能决定采集信息的程度。针对所述软件1采集的执行项目信息,由所述软件1传送到所述语音助手2完成执行项目信息的获取。针对所述语音助手2通过所述软件1的预留接口采集所述软件1运行的执行项目信息,其本身即是执行项目信息获取的过程。所述执行项目信息包括执行项目元素信息或执行项目状态信息。所述执行项目元素信息包括运行详情界面呈现的可视信息,具体包括运行界面的文字信息、图片信息、视频信息名称等,运行详情界面的文字信息为最主要的信息。所述执行项目状态信息主要包括运行界面涉及的操作信息,比如:播放视频、播放音乐、操作游戏等相关运行信息。具体实施例中,根据这些信息,通常将采集的元素信息多转换为文字信息。
通过外部语音输入设备输入语音信息,所述语音采集模块22采集所述语音信息,然后语音识别模块23对所述语音信息进行语音识别转换。具体实施例中,语音识别转换结果包括文字信息,也可以涉及操作信息。比如:打开快乐大本营,则语音识别转换结果涉及操作信息,也包括文字信息。
所述匹配模块24将语音识别转换结果与获取的执行项目信息进行匹配,主要从各自己相关信息的发音、文字、文字含义或者操作信息进行匹配,所述执行项目元素信息包括执行项目元素信息的名称或执行操作信息的名称。所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,比如:当前执行项目元素信息为“快乐大本营”,从“快乐大本营”的发音、文字进行相同或相似匹配,也可以从其所属类型上进行匹配,如:“快乐大本营”为综艺节目,还可以从其主持人上进行信息的匹配,还可以从其所属电视台上进行信息匹配等。另一种方式是:匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。比如:当前执行项目元素信息为“快乐大本营”,可以取其部分信息“快乐”和“大本营”进行匹配,若语音识别结果中包括“快乐”或者“大本营”,则也可以将“快乐大本营”匹配为相关。匹配相关后,所述传输模块25将匹配的执行项目元素信息传送到所述软件1,由所述执行模块13执行所述执行项目元素信息对应的项目。比如执行项目元素信息中有显示“快乐大本营”的节目,匹配相关后,所述语音助手2将“快乐大本营”信息传输到所述软件1,所述执行模块13执行该“快乐大本营”的节目,执行结果包括选择、点击等操作。
所述软件1运行的执行项目状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手2调用预先构建的该项目信息的项目状态模板,则所述传输模块25根据语音信息将相应项目状态模板的信息传送到所述软件1,由所述执行模块13执行所述项目状态模板的信息对应的项目。举例如下:若当前采集的执行项目状态信息为“播放非诚勿扰”,则所述语音助手2调用预先构建的视频播放器模块,视频播放器模块包括“播放”、“快进”、“快退”、“音量加大”、“音量减小”、“对比度增大”、“对比度减小”等相关视频播放涉及到的操作信息,若语音识别结果的信息包括“增大音量”,从其含义理解,应为“音量加大”,则所述传输模块25将“音量加大”发送到所述软件1,然后所述执行模块13执行音量加大的操作。
如图1所示,本发明的优选实施方式是:所述软件1包括多种独立运行的软件,所述语音助手与当前活动的所述软件配合工作。具体实施过程如下:所述软件1为多种独立运行的软件,所述语音助手2与当前活动的所述软件1配合工作。若当前环境只有一个所述软件1运行,则所述语音助手2与当前的所述软件1配合工作,若当前系统环境有多个所述软件1运行,则所述语音助手2通过当前系统,比如安卓系统,获取系统环境中的当前的所述软件1,然后所述语音助手2与当前的所述软件1建立通信连接,进行相关工作。
如图2所示,本发明的优选实施方式是:还包括网络服务器3,所述语音助手2将采集的执行项目信息上传到所述网络服务器3,所述网络服务器3将所述执行项目信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手2。若执行项目信息为“非诚勿扰”,所述网络服务器3预先存储有“非诚勿扰”的相关信息,比如,“非诚勿扰”的介绍信息、“非诚勿扰”的主持人相关信息,“非诚勿扰”的歌曲链接信息等信息,所述网络服务器3将“非诚勿扰”相关的这些信息传输到所述语音助手2,所述语音助手2将这些信息组织成信息列表,由第二信息输出模块26直接显示输出,供用户使用,包括查看、播放等操作;也可以传输到所述软件1,由所述第一信息输出模块14显示输出,供使用;还可以传输到移动终端,由移动终端显示输出,供使用。
本发明的技术效果是:构建一种基于语音交互的软件运行方法及系统,包括软件1、语音助手2,所述软件1与所述语音助手2独立运行,所述语音助手2获取所述软件1运行的执行项目信息,所述执行项目信息包括执行项目元素信息或执行项目状态信息;所述语音助手2采集语音信息,所述语音助手2对所述语音信息进行语音识别转换;所述语音助手2将语音识别转换结果与获取的执行项目信息进行匹配;若所述软件1运行的执行项目元素信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,由所述语音助手2将匹配的执行项目元素信息传送到所述软件1,由所述软件1执行所述执行项目元素信息对应的项目;若所述软件运行的执行项目状态信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,所述语音助手2调用预先构建的该项目信息的项目状态模板,由所述语音助手2根据语音信息将相应项目状态模板的信息传送到所述软件1,由所述软件1执行所述项目状态模板的信息对应的项目。本发明基于语音交互的软件运行方法及系统,所述软件1与所述语音助手2独立运行,所述语音助手2获取所述软件1运行的执行项目信息,所述语音助手2将语音识别转换结果与获取的执行项目信息进行匹配,然后对于匹配的执行项目信息,根据执行项目元素信息和执行项目状态信息和语音信息,由软件1进行操作执行。本发明基于软件场景及语音助手2的语音交互辅助方法及系统,根据软件的实时执行项目信息进行对其进行操作和使用,使语音软件真正迈向智能化,同时,与软件1分开独立运行,可以一个语音助手2与多个软件1配合使用,大大节约系统资源。另外,方便对语音引擎进行更新和创新,促进语音技术在智能化方面的发展。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (10)
1. 一种基于语音交互的软件运行方法,包括软件、语音助手,所述软件与所述语音助手独立运行,其特征在于,语音交互辅助方法包括如下步骤:
获取执行项目信息:所述语音助手获取所述软件运行的执行项目信息,所述执行项目信息包括执行项目元素信息或执行项目状态信息;
输入语音:所述语音助手采集语音信息,所述语音助手对所述语音信息进行语音识别转换;
匹配执行:所述语音助手将语音识别转换结果与获取的执行项目信息进行匹配;若所述软件运行的执行项目元素信息与所述语音识别结果在相关信息上相同或相似,则所述语音助手将匹配的执行项目元素信息传送到所述软件,由所述软件执行所述执行项目元素信息对应的项目;若所述软件运行的执行项目状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手调用预先构建的该项目信息的项目状态模板,则所述语音助手根据语音信息将相应项目状态模板的信息传送到所述软件,由所述软件执行所述项目状态模板的信息对应的项目。
2.根据权利要求1所述基于语音交互的软件运行方法,其特征在于,所述软件和所述语音助手通过所述软件的预留接口建立通信连接。
3.根据权利要求1所述基于语音交互的软件运行方法,其特征在于,所述软件和所述语音助手通过专有协议建立通信连接。
4.根据权利要求1所述基于语音交互的软件运行方法,其特征在于,所述软件包括多种独立运行的软件,所述语音助手与当前活动的所述软件配合工作。
5.根据权利要求1所述基于语音交互的软件运行方法,其特征在于,还包括网络服务器,所述语音助手将采集的执行项目信息上传到所述网络服务器,所述网络服务器将所述执行项目信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
6.根据权利要求1所述基于语音交互的软件运行方法,其特征在于,所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,或者匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。
7.一种基于语音交互的软件运行系统,其特征在于,包括软件、语音助手,所述软件与所述语音助手独立运行,所述软件包括采集执行项目信息的采集模块、与所述语音助手进行通信的通信模块、执行模块,所述语音助手包括获取所述软件运行的执行项目信息的信息获取模块、采集语音信息的语音采集模块、进行语音识别转换的语音识别模块、匹配模块、传输模块,所述信息获取模块获取所述软件运行的执行项目信息,所述执行项目信息包括执行项目元素信息或执行项目状态信息;所述语音采集模块采集语音信息,所述语音识别模块对所述语音信息进行语音识别转换;所述匹配模块将语音识别转换结果与获取的执行项目信息进行匹配;若所述软件运行的执行项目元素信息与所述语音识别结果在相关信息上相同或相似,所述传输模块将匹配的执行项目元素信息传送到所述软件,所述执行模块执行所述执行项目元素信息对应的项目;若所述软件运行的执行项目状态信息与所述语音识别结果在相关信息上相同或相似,所述语音助手调用预先构建的该项目信息的项目状态模板,由所述传输模块根据语音信息将相应项目状态模板的信息传送到所述软件,所述执行模块执行所述项目状态模板的信息对应的项目。
8.根据权利要求7基于语音交互的软件运行系统,其特征在于,所述软件包括多种独立运行的软件,所述语音助手与当前活动的所述软件配合工作。
9.根据权利要求7基于语音交互的软件运行系统,其特征在于,还包括网络服务器,所述语音助手将采集的执行项目信息上传到所述网络服务器,所述网络服务器将所述执行项目信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
10.根据权利要求9基于语音交互的软件运行系统,其特征在于,所述软件包括第一信息输出模块或者所述语音助手包括第二信息输出模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410634017.2A CN104461446B (zh) | 2014-11-12 | 2014-11-12 | 基于语音交互的软件运行方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410634017.2A CN104461446B (zh) | 2014-11-12 | 2014-11-12 | 基于语音交互的软件运行方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104461446A true CN104461446A (zh) | 2015-03-25 |
CN104461446B CN104461446B (zh) | 2018-05-18 |
Family
ID=52907567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410634017.2A Active CN104461446B (zh) | 2014-11-12 | 2014-11-12 | 基于语音交互的软件运行方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104461446B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104834531A (zh) * | 2015-05-29 | 2015-08-12 | 中山大学 | 一种盲人计算机的命令匹配系统及其实现方法 |
CN106201177A (zh) * | 2016-06-24 | 2016-12-07 | 维沃移动通信有限公司 | 一种操作执行方法及移动终端 |
CN107436748A (zh) * | 2017-07-13 | 2017-12-05 | 普联技术有限公司 | 处理第三方应用消息的方法、装置、终端设备及可读介质 |
CN108491220A (zh) * | 2018-03-15 | 2018-09-04 | 苏州思必驰信息科技有限公司 | 技能训练方法及系统 |
CN110634485A (zh) * | 2019-10-16 | 2019-12-31 | 声耕智能科技(西安)研究院有限公司 | 语音交互服务处理器及处理方法 |
CN112786034A (zh) * | 2019-11-08 | 2021-05-11 | 阿里巴巴集团控股有限公司 | 语音交互方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101516005A (zh) * | 2008-02-23 | 2009-08-26 | 华为技术有限公司 | 一种语音识别频道选择系统、方法及频道转换装置 |
CN102395013A (zh) * | 2011-11-07 | 2012-03-28 | 康佳集团股份有限公司 | 一种对智能电视机的语音控制方法和系统 |
US20120134507A1 (en) * | 2010-11-30 | 2012-05-31 | Dimitriadis Dimitrios B | Methods, Systems, and Products for Voice Control |
-
2014
- 2014-11-12 CN CN201410634017.2A patent/CN104461446B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101516005A (zh) * | 2008-02-23 | 2009-08-26 | 华为技术有限公司 | 一种语音识别频道选择系统、方法及频道转换装置 |
US20120134507A1 (en) * | 2010-11-30 | 2012-05-31 | Dimitriadis Dimitrios B | Methods, Systems, and Products for Voice Control |
CN102395013A (zh) * | 2011-11-07 | 2012-03-28 | 康佳集团股份有限公司 | 一种对智能电视机的语音控制方法和系统 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104834531A (zh) * | 2015-05-29 | 2015-08-12 | 中山大学 | 一种盲人计算机的命令匹配系统及其实现方法 |
CN106201177A (zh) * | 2016-06-24 | 2016-12-07 | 维沃移动通信有限公司 | 一种操作执行方法及移动终端 |
CN106201177B (zh) * | 2016-06-24 | 2019-10-15 | 维沃移动通信有限公司 | 一种操作执行方法及移动终端 |
CN107436748A (zh) * | 2017-07-13 | 2017-12-05 | 普联技术有限公司 | 处理第三方应用消息的方法、装置、终端设备及可读介质 |
CN107436748B (zh) * | 2017-07-13 | 2020-06-30 | 普联技术有限公司 | 处理第三方应用消息的方法、装置、终端设备及可读介质 |
CN108491220A (zh) * | 2018-03-15 | 2018-09-04 | 苏州思必驰信息科技有限公司 | 技能训练方法及系统 |
CN110634485A (zh) * | 2019-10-16 | 2019-12-31 | 声耕智能科技(西安)研究院有限公司 | 语音交互服务处理器及处理方法 |
CN112786034A (zh) * | 2019-11-08 | 2021-05-11 | 阿里巴巴集团控股有限公司 | 语音交互方法、装置、设备及存储介质 |
CN112786034B (zh) * | 2019-11-08 | 2023-04-07 | 阿里巴巴集团控股有限公司 | 语音交互方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104461446B (zh) | 2018-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104516709A (zh) | 基于软件运行场景及语音助手的语音辅助方法及系统 | |
CN104461446A (zh) | 基于语音交互的软件运行方法及系统 | |
US10403280B2 (en) | Lamp device for inputting or outputting voice signal and method of driving the same | |
CN104506944A (zh) | 基于电视场景及语音助手的语音交互辅助方法及系统 | |
WO2021063343A1 (zh) | 语音交互方法及装置 | |
CN106970790B (zh) | 一种应用程序创建的方法、相关设备及系统 | |
US9743226B2 (en) | Method for short-range wireless communication and electronic device using the same | |
CN102939579B (zh) | 绑定用户接口元素和粒度反映处理的方法和装置 | |
EP3531416A1 (en) | System for processing user utterance and controlling method thereof | |
TWI497311B (zh) | 跨裝置通訊傳輸系統及其方法 | |
CN108735204A (zh) | 用于执行与用户话语相对应的任务的设备 | |
CN104506906A (zh) | 基于电视场景元素及语音助手的语音交互辅助方法及系统 | |
US11170764B2 (en) | Electronic device for processing user utterance | |
CN104506901A (zh) | 基于电视场景状态及语音助手的语音辅助方法及系统 | |
KR102256291B1 (ko) | 번역 상황을 인지하고 번역 기능을 수행하는 방법 및 이를 구현하는 전자장치 | |
EP3678132A1 (en) | Electronic device and server for processing user utterances | |
CN104598443A (zh) | 语言服务提供方法、装置及系统 | |
CN104363517A (zh) | 基于电视场景及语音助手的语音切换方法及系统 | |
CN102929385A (zh) | 语音控制应用程序的方法 | |
CN105100208A (zh) | 一种移动终端与穿戴设备的通信方法 | |
US20150220512A1 (en) | Language interface system, method and computer readable medium | |
KR102380717B1 (ko) | 사용자 발화를 처리하는 전자 장치 및 이 전자 장치의 제어 방법 | |
CN105407445A (zh) | 一种连接方法及第一电子设备 | |
CN112650498A (zh) | 静态库集成方法、装置、电子设备及存储介质 | |
CN107483993A (zh) | 电视的语音输入方法、电视和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20190312 Address after: 510000 X1301-G5145 (Cluster Registration) (JM) No. 106 Fengze East Road, Nansha District, Guangzhou, Guangdong Province Patentee after: Science and Technology University Information Flying South China Institute of Artificial Intelligence (Guangzhou) Co., Ltd. Address before: 230000 666 Wangjiang West Road, Hefei hi tech Development Zone, Anhui Patentee before: Iflytek Co., Ltd. |