CN112908327A - 应用程序的语音控制方法、装置、设备和存储介质 - Google Patents

应用程序的语音控制方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN112908327A
CN112908327A CN202110145116.4A CN202110145116A CN112908327A CN 112908327 A CN112908327 A CN 112908327A CN 202110145116 A CN202110145116 A CN 202110145116A CN 112908327 A CN112908327 A CN 112908327A
Authority
CN
China
Prior art keywords
voice
shortcut key
application program
shortcut
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110145116.4A
Other languages
English (en)
Inventor
汤钦华
宓林晖
袁骏毅
马群圣
赵东阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Chest Hospital
Original Assignee
Shanghai Chest Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Chest Hospital filed Critical Shanghai Chest Hospital
Priority to CN202110145116.4A priority Critical patent/CN112908327A/zh
Publication of CN112908327A publication Critical patent/CN112908327A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明涉及一种应用程序的语音控制方法、装置、设备和存储介质,方法包括:响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与所述语音指令相对应的快捷按键;将所述快捷按键通过预设的数据传输接口发送给与所述快捷按键对应的应用程序,以控制所述应用程序执行所述快捷按键对应的操作,实现了语音识别功能模块和应用程序在松耦合下利用语音控制应用程序,避免SDK版本发生变化,API接口发生变化,或者SDK的版本做升级时,对应用程序进行调用方式调整。采用本发明的技术方案,能够简化应用程序维护过程,降低应用程序维护难度。

Description

应用程序的语音控制方法、装置、设备和存储介质
技术领域
本发明涉及语音识别技术领域,具体涉及一种应用程序的语音控制方法、装置、设备和存储介质。
背景技术
电脑等终端中通常安装有多个应用程序,安装的应用程序可以为终端用户带来便捷的服务。随着终端的不断更新换代,终端上可运行的应用程序数量也随之增多,通过应用程序终端用户可以办公、聊天等,应用程序已经成为终端用户日常生活中不可或缺的部分。
当前人们为了更便捷地控制各类应用程序执行相应的操作,经常会使用语音控制的技术。通常情况下,语音识别系统提供语音识别能力,以功能模块库的形式,集成到应用程序中,应用程序通过集成语音识别功能模块,接收语音识别结果,对相应的结果进行处理,以达到响应语音控制的目的。其中,传统系统集成的方式是语音识别系统提供语音识别的软体开发工具包(Software Development Kit,SDK),负责将语音转换成文字,应用程序在自己的系统内部集成SDK。然后通过调用SDK提供应用程序编程接口(应用程序licationProgramming Interface,API),获取语音识别内容,再将语音转写的文字翻译成相应的指令。
但是,由于应用程序与SDK属于紧耦合,所以一旦SDK版本发生变化,API接口发生变化,或者SDK的版本做升级,就需要应用程序重新同步进行更新,版本发布,当需要进行维护时,就需要应用程序进行调用方式调整,维护过程繁琐,难度较高。
发明内容
本发明提供一种应用程序的语音控制方法、装置、设备和存储介质,能够解决现有技术中因应用程序与SDK耦合度较高,导致应用程序维护过程繁琐,难度较高的技术问题。
本发明解决上述技术问题的技术方案如下:
一种应用程序的语音控制方法,包括:
响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与所述语音指令相对应的快捷按键;
将所述快捷按键通过预设的数据传输接口发送给与所述快捷按键对应的应用程序,以控制所述应用程序执行所述快捷按键对应的操作。
进一步地,上述所述的应用程序的语音控制方法中,响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与所述语音指令相对应的快捷按键之前,还包括:
将N组语音指令与快捷按键的映射关系显示在当前显示界面的快捷指令提示区域;
其中,N为自然数。
进一步地,上述所述的应用程序的语音控制方法中,将N组语音指令与快捷按键的映射关系显示在当前显示界面的快捷指令提示区域,包括:
统计每组语音指令与快捷按键的映射关系的调用频率;
根据每组语音指令与快捷按键的映射关系的调用频率,确定每组语音指令与快捷按键的优先显示等级;
按照等级由高到低的顺序,依次显示每组语音指令与快捷按键的映射关系。
进一步地,上述所述的应用程序的语音控制方法中,根据每组语音指令与快捷按键的映射关系的调用频率,确定每组语音指令与快捷按键的优先显示等级,包括:
将调用频率小于预设频率的语音指令与快捷按键的映射关系按照调用频率由高到低的顺序等级逐渐降低的原则设置优先显示等级;
将调用频率大于预设频率的语音指令与快捷按键的映射关系按照调用频率由低到高的顺序等级逐渐降低的原则设置优先显示等级;
其中,调用频率小于预设频率的语音指令与快捷按键的映射关系中最低的优先显示等级高于调用频率小于预设频率的语音指令与快捷按键的映射关系中最高的优先显示等级。
进一步地,上述所述的应用程序的语音控制方法中,将N组语音指令与快捷按键的映射关系显示在当前显示界面的快捷指令提示区域之前,还包括:
检测当前显示界面的至少一个空白区域;
将至少一个所述空白区域进行标记;
响应于至少一个所述空白区域中的目标空白区域的选取指令,将所述目标空白区域作为所述快捷指令提示区域。
进一步地,上述所述的应用程序的语音控制方法中,响应于至少一个所述空白区域中的目标空白区域的选取指令,将所述目标空白区域作为所述快捷指令提示区域之后,还包括:
清除每个所述空白区域的标记。
进一步地,上述所述的应用程序的语音控制方法中,所述语音指令与快捷按键的映射关系根据所述应用程序的原有快捷按键对应的文本设定,和/或,所述语音指令与快捷按键的映射关系由用户自定义设定。
本发明还提供一种应用程序的语音控制装置,包括:
确定模块,用于响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与所述语音指令相对应的快捷按键;
控制模块,用于将所述快捷按键通过预设的数据传输接口发送给与所述快捷按键对应的应用程序,以控制所述应用程序执行所述快捷按键对应的操作。
本发明还提供一种应用程序的语音控制设备,包括:处理器和存储器;
所述处理器用于执行所述存储器中存储的语音识别文本的展示方法的程序,以实现上述任一项所述的应用程序的语音控制方法。
本发明还提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被执行时实现上述任一项所述的应用程序的语音控制方法。
本发明的有益效果是:
响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与语音指令相对应的快捷按键;将快捷按键通过预设的数据传输接口发送给与快捷按键对应的应用程序,以控制应用程序执行快捷按键对应的操作,实现了语音识别功能模块和应用程序在松耦合下利用语音控制应用程序,避免SDK版本发生变化,API接口发生变化,或者SDK的版本做升级时,对应用程序进行调用方式调整。采用本发明的技术方案,能够简化应用程序维护过程,降低应用程序维护难度。
附图说明
图1为本发明实施例提供的一种应用程序的语音控制方法的流程图;
图2为本发明实施例提供的另一种应用程序的语音控制方法的流程图;
图3为本发明实施例的应用程序的语音控制装置的结构示意图;
图4为本发明实施例提供的应用程序的语音控制设备的结构示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
图1为本发明实施例提供的一种应用程序的语音控制方法的流程图,如图1所示,本实施例的应用程序的语音控制方法具体可以包括如下步骤:
100、响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与语音指令相对应的快捷按键;
在一个具体实现过程中,很多应用程序在开发时会设置一些常用的快捷按键,例如Word、Excel、绘图软件等办公用的应用程序,这些应用程序已经设置有相应的快捷按键,可以将这些快捷按键对应的文本作为语音指令,预先通过预设的数据传输接口进行注册,如,可以通过电脑中的Windows OS接口进行注册,从而生成语音指令与快捷按键的映射关系。
本实施例中,还可以由用户自定义设定语音指令与快捷按键的映射关系。例如,用户可以根据自己实际需求设置自己方便操控的快捷按键作为自己常用的指令,并将该快捷按键与语音指令对应后进行注册。
本实施例中,在采集到用户的语音信息后,进行语音识别,若得到的识别结果为语音指令,可以进行响应,并根据预设的语音指令与快捷按键的映射关系,确定与语音指令相对应的快捷按键,以将识别的语音指令转转成对应的快捷按键。例如,在识别结果中,提取上述语音指令内容-保存、打印、撤销、恢复,并标记为语音指令后,确定对应的快捷按键依次为:ctrl+s、ctrl+p、ctrl+u、ctrl+r。
101、将快捷按键通过预设的数据传输接口发送给与快捷按键对应的应用程序,以控制应用程序执行快捷按键对应的操作。
在将得到的语音指令转换为快捷按键后,可以将对应的快捷按键通过预设的数据传输接口发送给与快捷按键对应的应用程序,以控制应用程序执行快捷按键对应的操作,相当于在终端对快捷按键进行操控后,应用程序即可执行响应的操作,这样,则实现了语音识别功能模块和应用程序之间独立设置,降低了二者的耦合度,即使SDK版本发生变化,API接口发生变化,或者SDK的版本做升级,也可以不再对应用程序重新同步进行更新,版本发布,当需要进行维护时,也就不再需要对应用程序进行调用方式调整。
本实施例的应用程序的语音控制方法,响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与语音指令相对应的快捷按键;将快捷按键通过预设的数据传输接口发送给与快捷按键对应的应用程序,以控制应用程序执行快捷按键对应的操作,实现了语音识别功能模块和应用程序在松耦合下利用语音控制应用程序,避免SDK版本发生变化,API接口发生变化,或者SDK的版本做升级时,对应用程序进行调用方式调整。采用本发明的技术方案,能够简化应用程序维护过程,降低应用程序维护难度。
图2为本发明实施例提供的另一种应用程序的语音控制方法的流程图,如图2所示,本实施例的应用程序的语音控制方法具体可以包括如下步骤:
200、检测当前显示界面的至少一个空白区域;
本实施例中,可以自动检测当前显示界面的至少一个空白区域,例如,可以利用截取当前显示界面对应的图片,并利用图像识别技术检测出不包含文字、图片等内容的区域作为空白区域,从而得到至少一个空白区域。
201、将至少一个空白区域进行标记;
在得到至少一个空白区域后,可以利用带有颜色的线框将至少一个空白区域圈住,以便对至少一个空白区域进行标记。
202、响应于至少一个空白区域中的目标空白区域的选取指令,将目标空白区域作为快捷指令提示区域;
用户可以根据自己的需求,从当前显示界面的至少一个空白区域中选取目标空白区域,这样,终端可以响应用户的选取指令,并将目标空白区域作为快捷指令提示区域,并清除每个空白区域的标记。
需要说明的是,在当前显示界面中随着用户使用应用程序的过程,空白区域可能会随着发生变化,例如,用户可能需要用到目标空白区域,如在目标空白区域进行打字,此时,需要用户再重新选择目标空白区域。
203、将N组语音指令与快捷按键的映射关系显示在当前显示界面的快捷指令提示区域;
在一些实施例中,可能某个应用程序的快捷按键较多,用户无法记住很多快捷按键对应的语音指令,因此,用户可以自定义N的数目,这样即可将N组语音指令与快捷按键的映射关系显示在当前显示界面的快捷指令提示区域。其中,N为自然数。例如,可以将N组语音指令与快捷按键的映射关系以图片的形式插入当前显示界面的快捷指令提示区域。用户即可在当前显示界面查看到不同快捷按键对应的语音指令,从而可以不再记忆语音指令与快捷按键的映射关系,提高了用户使用语音控制应用程序的便捷性。
需要说明的是,如果N的数目较大,快捷指令提示区域无法将N组语音指令与快捷按键的映射关系全部显示时,可以只显示部分,并可以滚动显示N组语音指令与快捷按键的映射关系。
在一个具体实现过程中,该步骤可以按照如下方式实现:
a、统计每组语音指令与快捷按键的映射关系的调用频率;
在用户使用过程中,可以统计每组语音指令与快捷按键的映射关系的调用频率。
b、根据每组语音指令与快捷按键的映射关系的调用频率,确定每组语音指令与快捷按键的优先显示等级;
具体地,可以将调用频率小于预设频率的语音指令与快捷按键的映射关系按照调用频率由高到低的顺序等级逐渐降低的原则设置优先显示等级;将调用频率大于预设频率的语音指令与快捷按键的映射关系按照调用频率由低到高的顺序等级逐渐降低的原则设置优先显示等级;其中,调用频率小于预设频率的语音指令与快捷按键的映射关系中最低的优先显示等级高于调用频率小于预设频率的语音指令与快捷按键的映射关系中最高的优先显示等级。
例如,ctrl+s的调用频率为10次、ctrl+p的调用频率为8次、ctrl+u的调用频率为5次、ctrl+r的调用频率为4次。4个快捷按键的等级排序为:ctrl+u、ctrl+r、ctrl+p、ctrl+s。这样,对于用户常用的快捷按键而言,用户可能已经熟记,计时不显示,也不会影响用户的使用,因此,可以将其等级降低,不再优先显示,而调用频率较低的快捷按键用户可能不能熟记,此时将其等级升高,优先显示调用频率较低的快捷按键。
c、按照等级由高到低的顺序,依次显示每组语音指令与快捷按键的映射关系。
204、响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与语音指令相对应的快捷按键;
205、将快捷按键通过预设的数据传输接口发送给与快捷按键对应的应用程序,以控制应用程序执行快捷按键对应的操作。
本实施例的应用程序的语音控制方法,通过在当前显示界面的快捷指令提示区域显示语音指令与快捷按键的映射关系,无需用户对语音指令与快捷按键的映射关系进行记忆,而是直接快捷指令提示区域查看后,即可输入相应的语音指令,实现控制应用程序执行快捷按键对应的操作,提高了用户使用语音控制应用程序的便捷性。
需要说明的是,本发明实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本发明实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成的方法。
图3为本发明实施例的应用程序的语音控制装置的结构示意图,如图3所示,本实施例的应用程序的语音控制装置可以包括确定模块30和控制模块31。
确定模块30,用于响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与所述语音指令相对应的快捷按键;
本实施例中,所述语音指令与快捷按键的映射关系根据所述应用程序的原有快捷按键对应的文本设定,和/或,所述语音指令与快捷按键的映射关系由用户自定义设定。
控制模块31,用于将所述快捷按键通过预设的数据传输接口发送给与所述快捷按键对应的应用程序,以控制所述应用程序执行所述快捷按键对应的操作。
本实施例的应用程序的语音控制装置,响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与语音指令相对应的快捷按键;将快捷按键通过预设的数据传输接口发送给与快捷按键对应的应用程序,以控制应用程序执行快捷按键对应的操作,实现了语音识别功能模块和应用程序在松耦合下利用语音控制应用程序,避免SDK版本发生变化,API接口发生变化,或者SDK的版本做升级时,对应用程序进行调用方式调整。采用本发明的技术方案,能够简化应用程序维护过程,降低应用程序维护难度。
在一个具体实现过程中,控制模块31,还用于检测当前显示界面的至少一个空白区域;将至少一个所述空白区域进行标记;响应于至少一个所述空白区域中的目标空白区域的选取指令,将所述目标空白区域作为所述快捷指令提示区域,并清除每个所述空白区域的标记。
本实施例中,在确定快捷指令提示区域后,可以将N组语音指令与快捷按键的映射关系显示在当前显示界面的快捷指令提示区域;其中,N为自然数。
具体地,可以统计每组语音指令与快捷按键的映射关系的调用频率;根据每组语音指令与快捷按键的映射关系的调用频率,确定每组语音指令与快捷按键的优先显示等级;例如,将调用频率小于预设频率的语音指令与快捷按键的映射关系按照调用频率由高到低的顺序等级逐渐降低的原则设置优先显示等级;将调用频率大于预设频率的语音指令与快捷按键的映射关系按照调用频率由低到高的顺序等级逐渐降低的原则设置优先显示等级;其中,调用频率小于预设频率的语音指令与快捷按键的映射关系中最低的优先显示等级高于调用频率小于预设频率的语音指令与快捷按键的映射关系中最高的优先显示等级。
本实施例中,在确定每组语音指令与快捷按键的优先显示等级后,可以按照等级由高到低的顺序,依次显示每组语音指令与快捷按键的映射关系。
上述实施例的装置用于实现前述实施例中相应的方法,其具体实现方案可以参见前述实施例记载的方法及方法实施例中的相关说明,并且具有相应的方法实施例的有益效果,在此不再赘述。
图4为本发明实施例提供的应用程序的语音控制设备的结构示意图,如图4所示,本实施例的通行设备可以包括:处理器1010和存储器1020。本领域技术人员可知的,该设备还可以包括输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(应用程序lication Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本发明还提供一种存储介质,其存储有一个或者多个程序,所述一个或者多个程序可被执行时实现上述实施例的应用程序的语音控制方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种应用程序的语音控制方法,其特征在于,包括:
响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与所述语音指令相对应的快捷按键;
将所述快捷按键通过预设的数据传输接口发送给与所述快捷按键对应的应用程序,以控制所述应用程序执行所述快捷按键对应的操作。
2.根据权利要求1所述的应用程序的语音控制方法,其特征在于,响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与所述语音指令相对应的快捷按键之前,还包括:
将N组语音指令与快捷按键的映射关系显示在当前显示界面的快捷指令提示区域;
其中,N为自然数。
3.根据权利要求2所述的应用程序的语音控制方法,其特征在于,将N组语音指令与快捷按键的映射关系显示在当前显示界面的快捷指令提示区域,包括:
统计每组语音指令与快捷按键的映射关系的调用频率;
根据每组语音指令与快捷按键的映射关系的调用频率,确定每组语音指令与快捷按键的优先显示等级;
按照等级由高到低的顺序,依次显示每组语音指令与快捷按键的映射关系。
4.根据权利要求3所述的应用程序的语音控制方法,其特征在于,根据每组语音指令与快捷按键的映射关系的调用频率,确定每组语音指令与快捷按键的优先显示等级,包括:
将调用频率小于预设频率的语音指令与快捷按键的映射关系按照调用频率由高到低的顺序等级逐渐降低的原则设置优先显示等级;
将调用频率大于预设频率的语音指令与快捷按键的映射关系按照调用频率由低到高的顺序等级逐渐降低的原则设置优先显示等级;
其中,调用频率小于预设频率的语音指令与快捷按键的映射关系中最低的优先显示等级高于调用频率小于预设频率的语音指令与快捷按键的映射关系中最高的优先显示等级。
5.根据权利要求2所述的应用程序的语音控制方法,其特征在于,将N组语音指令与快捷按键的映射关系显示在当前显示界面的快捷指令提示区域之前,还包括:
检测当前显示界面的至少一个空白区域;
将至少一个所述空白区域进行标记;
响应于至少一个所述空白区域中的目标空白区域的选取指令,将所述目标空白区域作为所述快捷指令提示区域。
6.根据权利要求5所述的应用程序的语音控制方法,其特征在于,响应于至少一个所述空白区域中的目标空白区域的选取指令,将所述目标空白区域作为所述快捷指令提示区域之后,还包括:
清除每个所述空白区域的标记。
7.根据权利要求1-6任一项所述的应用程序的语音控制方法,其特征在于,所述语音指令与快捷按键的映射关系根据所述应用程序的原有快捷按键对应的文本设定,和/或,所述语音指令与快捷按键的映射关系由用户自定义设定。
8.一种应用程序的语音控制装置,其特征在于,包括:
确定模块,用于响应于接收的语音信息为语音指令,根据预设的语音指令与快捷按键的映射关系,确定与所述语音指令相对应的快捷按键;
控制模块,用于将所述快捷按键通过预设的数据传输接口发送给与所述快捷按键对应的应用程序,以控制所述应用程序执行所述快捷按键对应的操作。
9.一种应用程序的语音控制设备,其特征在于,包括:处理器和存储器;
所述处理器用于执行所述存储器中存储的语音识别文本的展示方法的程序,以实现权利要求1-7任一项所述的应用程序的语音控制方法。
10.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被执行时实现权利要求1-7任一项所述的应用程序的语音控制方法。
CN202110145116.4A 2021-02-02 2021-02-02 应用程序的语音控制方法、装置、设备和存储介质 Pending CN112908327A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110145116.4A CN112908327A (zh) 2021-02-02 2021-02-02 应用程序的语音控制方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110145116.4A CN112908327A (zh) 2021-02-02 2021-02-02 应用程序的语音控制方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN112908327A true CN112908327A (zh) 2021-06-04

Family

ID=76121570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110145116.4A Pending CN112908327A (zh) 2021-02-02 2021-02-02 应用程序的语音控制方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN112908327A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641328A (zh) * 2021-07-16 2021-11-12 深圳市华粤世通软件科技有限公司 基于语音识别的电脑控制方法、装置、设备及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08115195A (ja) * 1994-09-30 1996-05-07 Internatl Business Mach Corp <Ibm> メニュー・バーを設計及び定義するための方法及びコンピュータ・システム
EP2154678A1 (en) * 2008-08-13 2010-02-17 Weistech Technology Co., Ltd. Voice command game controlling apparatus and method of the same
US20100085317A1 (en) * 2008-10-06 2010-04-08 Samsung Electronics Co., Ltd. Method and apparatus for displaying graphical user interface depending on a user's contact pattern
CN102929385A (zh) * 2012-09-05 2013-02-13 四川长虹电器股份有限公司 语音控制应用程序的方法
US20130275134A1 (en) * 2011-05-20 2013-10-17 Mitsubishi Electric Corporation Information equipment
CN106023994A (zh) * 2016-04-29 2016-10-12 杭州华橙网络科技有限公司 一种语音处理的方法、装置以及系统
KR20160139609A (ko) * 2015-05-28 2016-12-07 주식회사 인프라웨어 모바일 디바이스 및 모바일 디바이스에서의 단축키 제공 방법
KR20170100166A (ko) * 2016-02-25 2017-09-04 충북대학교 산학협력단 핫키를 이용한 자동 일정관리 서비스 제공방법
CN108491379A (zh) * 2018-03-08 2018-09-04 平安科技(深圳)有限公司 快捷键识别方法、装置、设备以及计算机可读存储介质
CN109324840A (zh) * 2018-09-29 2019-02-12 五八有限公司 一种操作处理方法、装置、设备及存储介质
CN111475063A (zh) * 2020-03-31 2020-07-31 掌阅科技股份有限公司 用于阅读终端的快捷键设置方法、终端及计算机存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08115195A (ja) * 1994-09-30 1996-05-07 Internatl Business Mach Corp <Ibm> メニュー・バーを設計及び定義するための方法及びコンピュータ・システム
EP2154678A1 (en) * 2008-08-13 2010-02-17 Weistech Technology Co., Ltd. Voice command game controlling apparatus and method of the same
US20100085317A1 (en) * 2008-10-06 2010-04-08 Samsung Electronics Co., Ltd. Method and apparatus for displaying graphical user interface depending on a user's contact pattern
US20130275134A1 (en) * 2011-05-20 2013-10-17 Mitsubishi Electric Corporation Information equipment
CN102929385A (zh) * 2012-09-05 2013-02-13 四川长虹电器股份有限公司 语音控制应用程序的方法
KR20160139609A (ko) * 2015-05-28 2016-12-07 주식회사 인프라웨어 모바일 디바이스 및 모바일 디바이스에서의 단축키 제공 방법
KR20170100166A (ko) * 2016-02-25 2017-09-04 충북대학교 산학협력단 핫키를 이용한 자동 일정관리 서비스 제공방법
CN106023994A (zh) * 2016-04-29 2016-10-12 杭州华橙网络科技有限公司 一种语音处理的方法、装置以及系统
CN108491379A (zh) * 2018-03-08 2018-09-04 平安科技(深圳)有限公司 快捷键识别方法、装置、设备以及计算机可读存储介质
CN109324840A (zh) * 2018-09-29 2019-02-12 五八有限公司 一种操作处理方法、装置、设备及存储介质
CN111475063A (zh) * 2020-03-31 2020-07-31 掌阅科技股份有限公司 用于阅读终端的快捷键设置方法、终端及计算机存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641328A (zh) * 2021-07-16 2021-11-12 深圳市华粤世通软件科技有限公司 基于语音识别的电脑控制方法、装置、设备及存储介质
CN113641328B (zh) * 2021-07-16 2024-06-25 深圳市华粤世通软件科技有限公司 基于语音识别的电脑控制方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US10237622B2 (en) Page turning method, page turning apparatus and terminal as well as computer readable medium
US20190265886A1 (en) Apparatus and method for providing function associated with keyboard layout
RU2602791C2 (ru) Способ, устройство и система набора
KR20140092873A (ko) 적응식 입력 언어 전환
JP2011238220A (ja) コンテキスト認識型ヘルプ・コンテンツを提供する方法、デバイス、及びコンピュータ・プログラム製品
CN112395038B (zh) 一种共享桌面时调整文字的方法和装置
US20190130647A1 (en) Display control method and system, and virtual reality device
WO2015043442A1 (en) Method, device and mobile terminal for text-to-speech processing
EP3166012A1 (en) Audio input of field entries
CN109215660A (zh) 语音识别后文本纠错方法及移动终端
US11163377B2 (en) Remote generation of executable code for a client application based on natural language commands captured at a client device
CN112908327A (zh) 应用程序的语音控制方法、装置、设备和存储介质
KR101968669B1 (ko) 통화 서비스 제공 방법 및 컴퓨터 프로그램
US20130113708A1 (en) Method and apparatus enabling keystroke acceleration
WO2024002051A1 (zh) 文档编辑方法、装置、电子设备及存储介质
WO2020124454A1 (zh) 字体切换方法及相关产品
KR102266869B1 (ko) 전자 장치 및 전자 장치의 디스플레이 방법
WO2015081749A1 (zh) 输入号码的修正方法和修正装置
US20210073458A1 (en) Comic data display system, method, and program
CN112541141B (zh) 控件展示回调方法、装置、终端及存储介质
CN112035108B (zh) 一种用户界面布局设计方法、系统、终端及介质
KR101525025B1 (ko) 스마트폰에서의 라이브 캡쳐링 방법
CN108563486B (zh) 一种光标控制方法和装置
CN113407038A (zh) 一种输入方法、装置和用于输入的装置
CN110609669A (zh) 界面处理方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210604