CN113641328A

CN113641328A - 基于语音识别的电脑控制方法、装置、设备及存储介质

Info

Publication number: CN113641328A
Application number: CN202110806393.5A
Authority: CN
Inventors: 马化镇; 徐敏; 陈勇
Original assignee: Shenzhen Huayue Shitong Software Technology Co ltd
Current assignee: Shenzhen Huayue Shitong Software Technology Co ltd
Priority date: 2021-07-16
Filing date: 2021-07-16
Publication date: 2021-11-12

Abstract

本发明公开了一种基于语音识别的电脑控制方法、装置、设备及存储介质。本发明通过检测当前电脑系统的系统信息；依据系统信息，获取当前电脑系统的活动窗口及当前电脑系统的应用语种；接收用户发出的语音信息控制指令；依据当前电脑系统的应用语种，将语音信息控制指令转换成对应的语种文本信息；依据当前电脑系统的活动窗口及语种文本信息，在指令集中检索匹配度最高的键盘操作指令；依据键盘操作指令，输出对应键值到当前电脑系统；控制当前电脑系统执行与对应键值匹配的操作。本发明的基于语音识别的电脑控制方法能够通过用户语音指令实现对电脑的操作，有效降低了对电脑的输入及使用难度，提升用户体验。

Description

基于语音识别的电脑控制方法、装置、设备及存储介质

技术领域

本发明涉及电脑控制技术领域，尤其涉及一种基于语音识别的电脑控制方法、装置、设备及存储介质。

背景技术

以窗口操作系统为主的电脑系统中,虽然操作系统或应用程序本身提供了具有亲和操作性的图像式人机界面,以使电脑使用者只要以点选的方式来点选所需要执行的功能或程序,但电脑使用者通常都必需在完成所有窗口操作系统的启动后,才能在显示屏.上点选所需执行的功能或程序。如果该项被点选的功能有许多阶层的子功能选单或下拉式选项,则电脑使用者仍需重复执行点选的操作才能顺利启动所需要的功能或程序。这种方式仍造成了电脑使用者的许多不便。

另外，对于对键盘输入使用不熟悉或不方便的人群比如残疾人、老人、任务繁琐的人等等来说，通过逐个敲字与鼠标的配合以实现对电脑操作系统以及相应地应用软件的控制，在一定程度上操作繁琐，降低工作效率。因此，如何有效地降低对电脑的输入及使用难度而提升用户体验的问题已成为该领域技术人员亟待解决的问题。

发明内容

本发明实施例针对以上缺陷，提供了一种基于语音识别的电脑控制方法、装置、设备及存储介质，用以解决现有技术存在的问题。

第一方面，本发明实施例提供了一种基于语音识别的电脑控制方法，所述方法包括：

检测当前电脑系统的系统信息；

依据所述系统信息，获取所述当前电脑系统的活动窗口及所述当前电脑系统的应用语种；

接收用户发出的语音信息控制指令；

依据所述当前电脑系统的应用语种，将所述语音信息控制指令转换成对应的语种文本信息；

依据所述当前电脑系统的活动窗口及所述语种文本信息，在指令集中检索匹配度最高的键盘操作指令；

依据所述键盘操作指令，输出对应键值到所述当前电脑系统；

控制所述当前电脑系统执行与所述对应键值匹配的操作。

优选地，所述当前电脑系统为Windows/ios/android/鸿蒙操作系统中的一种。

优选地，所述接收用户发出的语音信息控制指令包括：

接收用户发出的声音数据；

将所述声音数据通过有线或无线的方式传递给电脑；

对所述声音数据进行解析、过滤及放大处理；

将过滤及放大处理后的声音数据转换成所述语音信息控制指令。

优选地，所述依据所述当前电脑系统的活动窗口及所述语种文本信息，在指令集中检索匹配度最高的键盘操作指令包括：

若所述当前电脑系统处于桌面状态，则调用所述当前电脑系统的指令集；

若所述当前电脑系统处于应用软件的活动窗口状态，则调用所述活动窗口的指令集；其中，所述活动窗口的指令集包括应用软件的操作指令及操作函数。

优选地，所述应用软件的操作指令对应一条或多条文本显示结果。

优选地，所述在若所述当前电脑系统处于应用软件的活动窗口状态，则调用所述活动窗口的指令集；其中，所述活动窗口的指令集包括应用软件的操作指令及操作函数之前包括：

将第一应用软件中的第一操作函数编译成第一对应键值并形成映射关系；

将所述第一对应键值存储于所述活动窗口的指令集存储空间内。

优选地，所述在若所述当前电脑系统处于应用软件的活动窗口状态，则调用所述活动窗口的指令集；其中，所述活动窗口的指令集包括应用软件的操作指令及操作函数之前还包括：

将第一应用软件中的第二操作函数编译成第二对应键值并形成映射关系；

将所述第二对应键值存储于所述活动窗口的指令集存储空间内；

或者将第二应用软件中的第三操作函数编译成第三对应键值并形成映射关系；

将所述第三对应键值存储于所述活动窗口的指令集存储空间内。

第二方面，本发明实施例提供了一种基于语音识别的电脑控制装置，所述装置包括：

系统识别模块，用于检测当前电脑系统的系统信息；

活动窗口及应用语种获取模块，依据所述系统信息，获取所述当前电脑系统的活动窗口及所述当前电脑系统的应用语种；

语音接收模块，用于接收用户发出的语音信息控制指令；

语音识别模块，用于依据所述当前电脑系统的应用语种，将所述语音信息控制指令转换成对应的语种文本信息；

匹配模块，用于依据所述当前电脑系统的活动窗口及所述语种文本信息，在指令集中检索匹配度最高的键盘操作指令；

键值输出模块，用于依据所述键盘操作指令，输出对应键值到所述当前电脑系统；

指令执行模块，用于控制所述当前电脑系统执行与所述对应键值匹配的操作。

第三方面，本发明实施例提供了一种基于语音识别的电脑控制设备，包括：至少一个处理器、至少一个存储器以及存储在存储器中的计算机程序指令，当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。

第四方面，本发明实施例提供了一种存储介质，其上存储有计算机程序指令，当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。

综上所述，本发明实施例提供的基于语音识别的电脑控制方法、装置、设备及存储介质。本发明通过检测当前电脑系统的系统信息；依据所述系统信息，获取所述当前电脑系统的活动窗口及所述当前电脑系统的应用语种；接收用户发出的语音信息控制指令；依据所述当前电脑系统的应用语种，将所述语音信息控制指令转换成对应的语种文本信息；依据所述当前电脑系统的活动窗口及所述语种文本信息，在指令集中检索匹配度最高的键盘操作指令；依据所述键盘操作指令，输出对应键值到所述当前电脑系统；控制所述当前电脑系统执行与所述对应键值匹配的操作。因此，本发明的基于语音识别的电脑控制方法能够通过用户语音指令实现对电脑的操作，有效降低了对电脑的输入及使用难度，提升用户体验。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例基于语音识别的电脑控制方法的流程图。

图2是本发明实施例基于语音识别的电脑控制方法的所述接收用户发出的语音信息控制指令的流程图。

图3是本发明实施例的基于语音识别的电脑控制装置的结构示意图。

图4是本发明实施例的基于语音识别的电脑控制设备的结构示意图。

具体实施方式

下面将详细描述本发明的各个方面的特征和示例性实施例，为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细描述。应理解，此处所描述的具体实施例仅被配置为解释本发明，并不被配置为限定本发明。对于本领域技术人员来说，本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

请参见图1，本发明实施例提供了一种基于语音识别的电脑控制方法，本发明的基于语音识别的电脑控制方法能够通过用户语音指令实现对电脑的操作，有效降低了对电脑的输入及使用难度，提升用户体验。

所述方法包括如下步骤：

S1、检测当前电脑系统的系统信息；

优选地，所述当前电脑系统为Windows/ios/android/鸿蒙操作系统中的一种。可以理解的是，在本实施例中，检测当前电脑系统的系统信息以便于更好地通过用户语音指令调用相应地功能界面，或在对应地活动窗口上实现操作控制。在另一个优选地实施例中，所述当前电脑系统可以为其他的电脑操作系统，电脑操作系统的类型不作具体限定。

S2、依据所述系统信息，获取所述当前电脑系统的活动窗口及所述当前电脑系统的应用语种；

具体地，所述当前电脑操作系统的应用语种可以为英语、日语、法语等语言中的一种，所述当前电脑操作系统的应用语种不作具体限定。

S3、接收用户发出的语音信息控制指令；

优选地，请参阅图2，所述接收用户发出的语音信息控制指令包括：

S31、接收用户发出的声音数据；

S32、将所述声音数据通过有线或无线的方式传递给电脑；

S33、对所述声音数据进行解析、过滤及放大处理；

S34、将过滤及放大处理后的声音数据转换成所述语音信息控制指令。在本实施例中，接收用户发出的声音数据可以通过电脑的麦克风接收，也可以通过在鼠标或键盘内设置声音接收部件，再通过有线或无线方式传递到电脑处理器内进行接收，接收所述声音数据的方式在此不作具体限定。可以理解的是，本实施例的声音数据经过解析、过滤及放大处理以实现更准确的语音识别，实现用户语音对电脑的精准控制。

S4、依据所述当前电脑系统的应用语种，将所述语音信息控制指令转换成对应的语种文本信息；

S5、依据所述当前电脑系统的活动窗口及所述语种文本信息，在指令集中检索匹配度最高的键盘操作指令；

S6、依据所述键盘操作指令，输出对应键值到所述当前电脑系统；

S7、控制所述当前电脑系统执行与所述对应键值匹配的操作。

具体地，举例来说，若所述当前电脑系统为Windows操作系统，且所述当前电脑系统处于Excel应用软件的活动窗口状态，用于通过有线方式或者无线方式接入电脑麦克风的声音数据为“复制”或“帮我复制”，所述当前电脑系统的语音接收模块将语音段传递给语音识别模块；语音识别模块根据系统识别的应用语种信息，将语音段转译成“复制”、“帮我复制”、“copy”或“help me to copy”后传递给指令执行模块；指令执行模块接收到对应的文本后，在Excel应用软件的活动窗口指令集中检索匹配度最高的键盘键值，例如“复制”对应的键值为：ctrl+c；随后将ctrl+c键值传递给系统执行相对应的操作。可以理解的是，在本实施例中，无线方式包括但不限于WIFI、蓝牙、LoRa、ZigBee或移动通信中的一种，有线方式包括但不限于USB接口、TYPEC接口或Micro USB中的一种，电脑麦克风接收声音数据的方式在此不作具体限定。

具体地，本实施例的应用软件包含但不限于Microsoft office、CAD.Pro-E、Visio等应用软件，应用软件中复杂的操作指令或操作函数预先编译成对应的键值指令并存储在对应的指令集内，通过用于的语音控制操作实现同样的效果。因此，本发明通过用户语音指令实现对电脑的操作，有效降低了对电脑的输入及使用难度，提升用户体验。

请参阅图3，明实施例提供了一种基于语音识别的电脑控制装置，所述装置包括：

系统识别模块1，用于检测当前电脑系统的系统信息；

活动窗口及应用语种获取模块2，依据所述系统信息，获取所述当前电脑系统的活动窗口及所述当前电脑系统的应用语种；

语音接收模块3，用于接收用户发出的语音信息控制指令；

语音识别模块4，用于依据所述当前电脑系统的应用语种，将所述语音信息控制指令转换成对应的语种文本信息；

匹配模块5，用于依据所述当前电脑系统的活动窗口及所述语种文本信息，在指令集中检索匹配度最高的键盘操作指令；

键值输出模块6，用于依据所述键盘操作指令，输出对应键值到所述当前电脑系统；

指令执行模块7，用于控制所述当前电脑系统执行与所述对应键值匹配的操作。

另外，结合图1描述的本发明实施例的基于语音识别的电脑控制方法可以由基于语音识别的电脑控制设备来实现。图4示出了本发明实施例提供的基于语音识别的电脑控制设备的硬件结构示意图。

基于语音识别的电脑控制设备可以包括处理器401以及存储有计算机程序指令的存储器402。

具体地，上述处理器401可以包括中央处理器(CPU)，或者特定集成电路(Application Specific Integrated Circuit，ASIC)，或者可以被配置成实施本发明实施例的一个或多个集成电路。

存储器402可以包括用于数据或指令的大容量存储器。举例来说而非限制，存储器402可包括硬盘驱动器(Hard Disk Drive，HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus，USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下，存储器402可包括可移除或不可移除(或固定)的介质。在合适的情况下，存储器402可在数据处理装置的内部或外部。在特定实施例中，存储器402是非易失性固态存储器。在特定实施例中，存储器402包括只读存储器(ROM)。在合适的情况下，该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。

处理器401通过读取并执行存储器402中存储的计算机程序指令，以实现上述实施例中的任意一种基于语音识别的电脑控制方法。

在一个示例中，基于语音识别的电脑控制设备还可包括通信接口403和总线410。其中，如图4所示，处理器401、存储器402、通信接口403通过总线410连接并完成相互间的通信。

通信接口403，主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。

总线410包括硬件、软件或两者，将基于语音识别的电脑控制设备的部件彼此耦接在一起。举例来说而非限制，总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下，总线410可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线，但本发明考虑任何合适的总线或互连。

另外，结合上述实施例中的基于语音识别的电脑控制方法，本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令；该储存介质也可以为云端服务器，不限于本地存储；该计算机程序指令被处理器执行时实现上述实施例中的任意一种基于语音识别的电脑控制方法。

还需要说明的是，本发明中提及的示例性实施例，基于一系列的步骤或者装置描述一些方法或系统。但是，本发明不局限于上述步骤的顺序，也就是说，可以按照实施例中提及的顺序执行步骤，也可以不同于实施例中的顺序，或者若干步骤同时执行。

以上所述，仅为本发明的具体实施方式，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的系统、模块和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。应理解，本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。

Claims

1.一种基于语音识别的电脑控制方法，其特征在于，所述方法包括：

检测当前电脑系统的系统信息；

接收用户发出的语音信息控制指令；

控制所述当前电脑系统执行与所述对应键值匹配的操作。

2.根据权利要求1所述的基于语音识别的电脑控制方法，其特征在于，所述当前电脑系统为Windows/ios/android/鸿蒙操作系统中的一种。

3.根据权利要求1所述的基于语音识别的电脑控制方法，其特征在于，所述接收用户发出的语音信息控制指令包括：

接收用户发出的声音数据；

将所述声音数据通过有线或无线的方式传递给电脑；

对所述声音数据进行解析、过滤及放大处理；

4.根据权利要求1所述的基于语音识别的电脑控制方法，其特征在于，所述依据所述当前电脑系统的活动窗口及所述语种文本信息，在指令集中检索匹配度最高的键盘操作指令包括：

5.根据权利要求4所述的基于语音识别的电脑控制方法，其特征在于，所述应用软件的操作指令对应一条或多条文本显示结果。

6.根据权利要求4所述的基于语音识别的电脑控制方法，其特征在于，所述在若所述当前电脑系统处于应用软件的活动窗口状态，则调用所述活动窗口的指令集；其中，所述活动窗口的指令集包括应用软件的操作指令及操作函数之前包括：

7.根据权利要求6所述的基于语音识别的电脑控制方法，其特征在于，所述在若所述当前电脑系统处于应用软件的活动窗口状态，则调用所述活动窗口的指令集；其中，所述活动窗口的指令集包括应用软件的操作指令及操作函数之前还包括：

8.一种基于语音识别的电脑控制装置，其特征在于，所述装置包括：

系统识别模块，用于检测当前电脑系统的系统信息；

语音接收模块，用于接收用户发出的语音信息控制指令；

9.一种基于语音识别的电脑控制设备，其特征在于，包括：至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令，当所述计算机程序指令被所述处理器执行时实现如权利要求1-7中任一项所述的方法。

10.一种存储介质，其上存储有计算机程序指令，其特征在于，当所述计算机程序指令被处理器执行时实现如权利要求1-7中任一项所述的方法。