CN106251863B

CN106251863B - 一种基于智能设备的指令式语音控制系统及控制方法

Info

Publication number: CN106251863B
Application number: CN201610589347.3A
Authority: CN
Inventors: 公雷
Original assignee: Proud Love Software Technology (shanghai) Co Ltd
Current assignee: Proud Love Software Technology (shanghai) Co Ltd
Priority date: 2016-07-26
Filing date: 2016-07-26
Publication date: 2019-05-24
Anticipated expiration: 2036-07-26
Also published as: CN106251863A

Abstract

本发明公开了一种基于智能设备的指令式语音控制系统，该控制系统包括语音交互系统和指令控制系统，所述语音交互系统包括语音采集模块、语音识别模块、指令解析模块和指令提醒模块；所述指令控制系统包括指令匹配模块、指令响应模块、指令集堆栈和操控引导模块；与现有技术相比，本发明为智能设备提供一套口令操控系统，让用户在不方便用手操控，用眼睛观看的时候，也能够跟智能设备进行交互，对其进行操控。提高了智能设备的适用范围和环境，大大减小误判率，提高整个智能设备操控的精准性。

Description

一种基于智能设备的指令式语音控制系统及控制方法

技术领域

本发明属于语音控制领域，特别是涉及一种基于智能设备的指令式语音控制系统及控制方法。

背景技术

当今社会智能设备无处不在，手机、平板、车载系统等等。目前的智能设备的一个主要交互方式就是触摸屏，用户点触屏进行操控，系统把操作结果反馈到屏幕上。但实际生活中，经常会遇到手或眼睛被占用，不方便操作这些设备的情况。特别是在驾驶过程中，如果需要联系某人或者查找地址信息，操作起来十分不便，而且非常危险。目前也有人工智能语音识别的系统，不过由于语音识别与人工智能发展的局限性，效果并不理想，识别的错误率极高，很难用于实际应用。

发明内容

针对现有技术中存在的问题，本发明提供一种基于智能设备的指令式语音控制系统及控制方法，能够通过基本语音口令来操控智能设备，并得到语音反馈，而且识别的准确率较高。

为实现上述目的，本发明采用以下技术方案：

一种基于智能设备的指令式语音控制系统，该控制系统包括语音交互系统和指令控制系统，在所述指令式语音控制系统中预先设置指令预定义数据；

所述语音交互系统包括语音采集模块、语音识别模块、指令解析模块和指令提醒模块；

所述指令控制系统包括指令匹配模块、指令响应模块、指令集堆栈和操控引导模块；

所述语音采集模块监听采集声音输入，并将声音信号进行降噪、过滤、压缩处理后，生成声音采样，传输给语音识别模块，所述语音识别模块将输入的声音采样，转化为文字信息，将文字信息传给指令解析模块，指令解析模块从文字信息中解析出拼音编码，并根据预定义的映射关系得到此拼音编码所对应的指令编码，并将指令编码传给指令控制系统中的指令匹配模块，所述指令匹配模块将传入的指令编码跟指令集堆栈栈顶指令集中的指令进行匹配，并将匹配到的指令数据传递给指令响应模块，所述指令响应模块根据指令数据中所定义的指令类型进行不同的响应处理；

还包括触屏交互系统，所述触屏交互系统包括触控响应模块和指令显示模块，所示指令显示模块所显示的指令按钮数量等同于系统所使用的指令编码的数量，所述指令显示模块展示指令集堆栈栈顶的指令信息，包括指令名称、功能名称、堆栈层级信息，在指令显示模块中的指令按钮上显示指令名称，指令按钮的一侧显示功能名称。

语音交互系统中内置了有限固定数量的指令编码，并且内置了指令编码与拼音编码的映射关系，每一条指令编码映射一条或多条拼音编码。

所述文字信息和拼音编码包括预先定义的应用于系统支持的语言资源。

所述指令预定义数据以树状结构存储，所述树状结构中的每个结点中都存储着数量固定的一套指令数据，且各个结点中所使用的指令编码的集合相同，所述结点中每条指令数据存储的内容为：指令编码、指令类型、功能名称和元数据，所述同一结点中各个指令数据中的指令编码均不重复；所述指令预定义数据中的指令类型包括：进栈指令、出栈指令、肯定指令、否定指令、功能指令、无效指令。

所述指令预定义数据中使用的指令编码在应用于同一智能设备或同一个应用中，指令编码的数量为有限固定个数。

所述指令编码的数量为4-12个，触屏交互系统中的屏幕尺寸会影响所需指令编码的数量，如果智能设备没有屏幕或者屏幕较大，则可以采用12条指令编码；如果智能设备的屏幕较小，为了便于浏览和交互操作，则要减少指令编码的使用数量，但最少不能少于4条。

指令集堆栈中结点的数据与指令预定义数据中的结点之间为引用关系，系统初始化时，用指令预定义数据中的根结点来初始化指令集堆栈的初始结点，之后每次所压入指令集堆栈的数据均需引用预定义数据中的一个结点。

所述指令响应模块响应处理方式为：

a）如果是进栈指令，先获取指令数据中所指向的预定义数据中的结点，引导模块根据此结点数据创建新的堆栈结点，并将其压栈，同时通知指令显示模块更新信息显示；

b）如果是出栈指令，则直接通知控制引导模块，控制引导模块将指令集堆栈的栈顶结点出栈，同时通知指令显示模块更新信息显示；当指令集堆栈只有一个结点时，出栈指令不做响应；

c）如果是功能指令，就通知功能执行模块，功能执行模块执行具体功能。

所述指令式语音控制系统中设置一个内置指令，此内置指令有两种功能响应：

a）当系统未激活或进入休眠时，此指令用于激活系统；

b）当系统激活后，指令响应模块接收到此指令，会将指令集堆栈栈顶结点的信息传给指令提醒模块，指令提醒模块语音播报当前栈顶结点中各个指令的功能名称。

一种基于智能设备的指令式语音控制系统的控制方法，该控制方法包括以下步骤：

a、首先，执行开启语音控制/打开APP过程，此过程开启功能或者启动程序；

b、之后，初始化指令集过程，根据指令预定义数据进行初始化操作，指令集堆栈初始化到第一级堆栈；

c、之后，更新显示当前级指令集过程，将指令显示模块刷新为指令集堆栈栈顶的指令信息；

d、之后，监听响应语音指令过程，等待来自于通过指令匹配模块的指令数据输入；

e、当监测到一条指令数据输入后，通过判断指令类型过程，对指令类型进行判断，根据指令类型进行不同的处理；

f、如果是进栈指令，则执行下一级指令集进入堆栈过程，将次指令数据中所引用的指令集压入堆栈，然后去执行更新显示当前级指令集过程；

g、如果是出栈指令，则将执行当前指令集出栈，返回上一级指令集过程，此过程将指令集堆栈的栈顶结点出栈，新的栈顶指令集作为当前指令集，之后执行更新显示当前级指令集过程；

h、如果是功能类的指令，则先执行是否需要确认过程，判断是否需要执行确认，对于需要进行确认的功能类指令，要先执行监听响应确认指令过程，监听响应确认指令过程，等待来自于通过指令响应模块的指令输入；如果下达否定指令，则返回监听响应语音指令过程；如果下达肯定指令，则开始执行功能过程，对于不需要进行确认的功能类指令，则直接开始执行功能过程；

i、执行功能过程之后，返回监听响应语音指令过程，等待后续的指令数据输入。

本发明中拼音编码可以为数字、字母等能识别的语言、字符或汉字，具体可以采用10个数字、是”、“否”两个字作为指令集，具体数字可采用：0、1、2、3、4、5、6、7、8、9，指令0表示返回上一级堆栈，是”、“否”分别用于对功能执行的确认或取消；使用会大大提高识别度和认知度，或者根据具体需要采用不同的字符或汉字。

本发明中12条指令编码，指令显示模块显示的指令编码数至少为4个，为了满足进度指令：上级、下级及功能确定和取消的操作，根据智能设备屏幕的大小不同，可以选择显示不同数量的指令。应用于手机、平板设备、电脑、车载系统，显示模块每层显示12个指令；应用于智能手表、AR眼镜设备，显示模块每层显示4~6个指令。针对不同的设备显示不同数量的指令，增加显示的效果性。

本发明中指令显示说明模块：用于展示在当前指令级别的各个指令及其功能名称。指令说明以图标的方式排列展示，图标上显示指令名称，指令名称在图标内，显示清晰。当前可用的指令高亮，不可用指令变暗。图标下方显示指令功能名称；显示层级列表，用以帮助用户导航。指令发音可以支持不同的语言，针对当前级的指令功能，给使用者进行界面展示和语音提示说明，无屏幕智能设备，只进行语音提示说明。

本发明对于可用指令的图标、指令名、指令功能名称进行放大显示，不可用指令图标缩小或者隐藏；语音提示模块，菜单语音播报，适用于不方便用眼睛观看指令功能的时候，系统自动播报当前上下文的指令功能。

本发明中：①进栈指令：定义数据中引用一个子结点，当执行此指令后，其引用的子结点所对应的指令集进栈；②出栈指令：表示执行此指令后，此指令所在的结点出栈，返回到其父结点。如果本结点是根结点则无响应；③功能指令：表示此指令对应的是用户要操作使用的一个应用级的功能。具体功能由使用此方法和系统的应用或设备自行定义实现；④无效指令：表示在本结点中此指令不做任何响应。

与现有技术相比，本发明为智能设备提供一套口令操控系统，让用户在不方便用手操控，用眼睛观看的时候，也能够跟智能设备进行交互，对其进行操控。提高了智能设备的适用范围和环境，大大减小误判率，提高整个智能设备操控的精准性。而且，本发明不需要记忆和猜测下达指令的关键词、指令固定、简单，所以指令下达简单、迅速识别库非常小，减小系统的大小，由于识别库小，可以集成到设备中，脱离网络。

附图说明

图1为本发明的系统模块图。

图2为本发明的指令控制流程图。

图3为本发明在手机、平板电脑、车载电脑设备上的界面示意图。

具体实施方式

下面将参考附图并结合实施例来详细说明本发明技术方案：

如图1-3所示，本实施例基于智能设备的指令式语音控制系统，其特征在于，该控制系统包括语音交互系统12和指令控制系统16，所述指令式语音控制系统中预先设置指令预定义数据175，

所述语音交互系统12包括语音采集模块110、语音识别模块120、指令解析模块130和指令提醒模块140；

所述指令控制系统16包括指令匹配模块170、指令响应模块180、指令集堆栈185和操控引导模块190；所述指令式语音控制系统中设置一个内置指令，此内置指令有两种功能响应：

a）当系统未激活或进入休眠时，此指令用于激活系统；

b）当系统激活后，指令响应模块180接收到此指令，会将指令集堆栈185栈顶结点的信息传给指令提醒模块140，指令提醒模块140语音播报当前栈顶结点中各个指令的功能名称。

所述语音采集模块110监听采集声音输入，并将声音信号进行降噪、过滤、压缩处理后，生成声音采样a10，传输给语音识别模块120，所述语音识别模块120将输入的声音采样a10，转化为文字信息a20，将文字信息a20传给指令解析模块130，指令解析模块130从文字信息a20中解析出拼音编码a30，并根据预定义的映射关系得到此拼音编码a30所对应的指令编码a40，并将指令编码a40传给指令控制系统16中的指令匹配模块170，所述指令匹配模块170将传入的指令编码a40跟指令集堆栈185栈顶指令集中的指令进行匹配，并将匹配到的指令数据a50传递给指令响应模块180，所述指令响应模块180根据指令数据a50中所定义的指令类型进行不同的响应处理。

作为优选，本实施例还包括触屏交互系统14，所述触屏交互系统14包括触控响应模块150和指令显示模块160，所示指令显示模块160所显示的指令按钮数量等同于系统所使用的指令编码a40的数量，所述指令显示模块160展示指令集堆栈185栈顶的指令信息，包括指令名称b1、功能名称b2、堆栈层级b3信息，在指令显示模块160中的指令按钮上显示指令名称b1，指令按钮的一侧显示功能名称b2。

本实施例语音交互系统12中内置了有限固定数量的指令编码a40，并且内置了指令编码a40与拼音编码a30的映射关系，每一条指令编码a40映射一条或多条拼音编码a30。

作为优选，本实施例中所述文字信息a20和拼音编码a30包括预先定义的应用于系统支持的语言资源。

本实施例所述指令预定义数据175以树状结构存储，所述树状结构中的每个结点中都存储着数量固定的一套指令数据，且各个结点中所使用的指令编码a40的集合相同，所述结点中每条指令数据存储的内容为：指令编码a40、指令类型、功能名称和元数据，所述同一结点中各个指令数据中的指令编码a40均不重复；所述指令预定义数据175中的指令类型包括：进栈指令、出栈指令、肯定指令、否定指令、功能指令、无效指令；所述指令预定义数据175中使用的指令编码a40在应用于同一智能设备或同一个应用中，指令编码a40的数量为有限固定个数，根据不同的智能设备所述指令编码a40的数量为4-12个。

所述指令预定义数据175中使用的指令编码a40在应用于同一智能设备或同一个应用中，指令编码a40的数量为有限固定个数。

本实施例中指令集堆栈185中结点的数据与指令预定义数据175中的结点之间为引用关系，系统初始化时，用指令预定义数据175中的根结点来初始化指令集堆栈185的初始结点，之后每次所压入指令集堆栈185的数据均需引用预定义数据175中的一个结点。

本实施例指令响应模块180根据指令数据a50中所定义的指令类型进行不同的响应处理，指令响应模块180响应处理方式为：

a）如果是进栈指令，先获取指令数据a50中所指向的预定义数据175中的结点，引导模块190根据此结点数据创建新的堆栈结点，并将其压栈，同时通知指令显示模块160更新信息显示；

b）如果是出栈指令，则直接通知控制引导模块190，控制引导模块190将指令集堆栈185的栈顶结点出栈，同时通知指令显示模块160更新信息显示；当指令集堆栈185只有一个结点时，出栈指令不做响应；

c）如果是功能指令，就通知功能执行模块195，功能执行模块195执行具体功能。

如图3所示，本实施例在手机、平板电脑、车载电脑设备上的界面示意图，所述指令显示模块160展示指令集堆栈185栈顶的指令信息，包括指令名称b1、功能名称b2、堆栈层级b3信息。

本实施例一种基于智能设备的指令式语音控制系统的控制方法，该控制方法包括以下步骤：

a、首先，执行开启语音控制/打开APP210过程，此过程开启功能或者启动程序；

b、之后，初始化指令集220过程，根据指令预定义数据175进行初始化操作，指令集堆栈185初始化到第一级堆栈；

c、之后，更新显示当前级指令集230过程，将指令显示模块160刷新为指令集堆栈185栈顶的指令信息；

d、之后，监听响应语音指令240过程，等待来自于通过指令匹配模块170的指令数据a50输入；

e、当监测到一条指令数据a50输入后，通过判断指令类型250过程，对指令类型进行判断，根据指令类型进行不同的处理；

f、如果是进栈指令，则执行下一级指令集进入堆栈254过程，将此指令数据a50中所引用的指令集压入堆栈，然后去执行更新显示当前级指令集230过程；

g、如果是出栈指令，则将执行当前指令集出栈，返回上一级指令集252过程，此过程将指令集堆栈185的栈顶结点出栈，新的栈顶指令集作为当前指令集，之后执行更新显示当前级指令集230过程；

h、如果是功能类的指令，则先执行是否需要确认260过程，判断是否需要执行确认，对于需要进行确认的功能类指令，要先执行监听响应确认指令262过程，监听响应确认指令262过程，等待来自于通过指令响应模块180的指令输入；如果下达否定指令，则返回监听响应语音指令240过程；如果下达肯定指令，则开始执行功能270过程，对于不需要进行确认的功能类指令，则直接开始执行功能270过程；

i、执行功能270过程之后，返回监听响应语音指令240过程，等待后续的指令数据a50输入。

尽管上述实施例已对本发明作出具体描述，但是对于本领域的普通技术人员来说，应该理解为可以在不脱离本发明的精神以及范围之内基于本发明公开的内容进行修改或改进，这些修改和改进都在本发明的精神以及范围之内。

Claims

1.一种基于智能设备的指令式语音控制系统，其特征在于，该控制系统包括语音交互系统（12）和指令控制系统（16），在所述指令式语音控制系统中预先设置指令预定义数据（175），

所述语音交互系统（12）包括语音采集模块（110）、语音识别模块（120）、指令解析模块（130）和指令提醒模块（140）；

所述指令控制系统（16）包括指令匹配模块（170）、指令响应模块（180）、指令集堆栈（185）和操控引导模块（190）；

所述语音采集模块（110）监听采集声音输入，并将声音信号进行降噪、过滤、压缩处理后，生成声音采样（a10），传输给语音识别模块（120），所述语音识别模块（120）将输入的声音采样（a10），转化为文字信息(a20)，将文字信息(a20)传给指令解析模块（130），指令解析模块（130）从文字信息(a20)中解析出拼音编码(a30)，并根据预定义的映射关系得到此拼音编码（a30）所对应的指令编码（a40），并将指令编码(a40)传给指令控制系统（16）中的指令匹配模块（170），所述指令匹配模块（170）将传入的指令编码（a40）跟指令集堆栈（185）栈顶指令集中的指令进行匹配，并将匹配到的指令数据(a50)传递给指令响应模块（180），所述指令响应模块（180）根据指令数据（a50）中所定义的指令类型进行不同的响应处理；

还包括触屏交互系统（14），所述触屏交互系统（14）包括触控响应模块（150）和指令显示模块（160），所示指令显示模块（160）所显示的指令按钮数量等同于系统所使用的指令编码（a40）的数量，所述指令显示模块（160）展示指令集堆栈（185）栈顶的指令信息，包括指令名称（b1）、功能名称（b2）、堆栈层级（b3）信息，在指令显示模块（160）中的指令按钮上显示指令名称（b1），指令按钮的一侧显示功能名称（b2）；所述语音交互系统（12）中内置了有限固定数量的指令编码（a40），并且内置了指令编码（a40）与拼音编码（a30）的映射关系，每一条指令编码（a40）映射一条或多条拼音编码（a30）；所述文字信息(a20)和拼音编码(a30)包括预先定义的应用于系统支持的语言资源；所述指令预定义数据（175）以树状结构存储，所述树状结构中的每个结点中都存储着数量固定的一套指令数据，且各个结点中所使用的指令编码（a40）的集合相同，结点中每条指令数据存储的内容为：指令编码（a40）、指令类型、功能名称和元数据，同一结点中各个指令数据中的指令编码（a40）均不重复；所述指令预定义数据（175）中的指令类型包括：进栈指令、出栈指令、肯定指令、否定指令、功能指令、无效指令；

所述指令集堆栈（185）中结点的数据与指令预定义数据（175）中的结点之间为引用关系，系统初始化时，用指令预定义数据（175）中的根结点来初始化指令集堆栈（185）的初始结点，之后每次所压入指令集堆栈（185）的数据均需引用预定义数据（175）中的一个结点；所述指令响应模块（180）响应处理方式为：

a）如果是进栈指令，先获取指令数据（a50）中所指向的预定义数据（175）中的结点，引导模块（190）根据此结点数据创建新的堆栈结点，并将其压栈，同时通知指令显示模块（160）更新信息显示；

b）如果是出栈指令，则直接通知控制引导模块（190），控制引导模块（190）将指令集堆栈（185）的栈顶结点出栈，同时通知指令显示模块（160）更新信息显示；当指令集堆栈（185）只有一个结点时，出栈指令不做响应；

c）如果是功能指令，就通知功能执行模块（195），功能执行模块（195）执行具体功能。

2.根据权利要求1所述的基于智能设备的指令式语音控制系统，其特征在于，所述指令预定义数据（175）中使用的指令编码（a40）在应用于同一智能设备或同一个应用中，指令编码（a40）的数量为有限固定个数。

3.根据权利要求2所述的基于智能设备的指令式语音控制系统，其特征在于，所述指令编码（a40）的数量为4-12个。

4.根据权利要求1所述的基于智能设备的指令式语音控制系统，其特征在于，所述指令式语音控制系统中设置一个内置指令，此内置指令有两种功能响应：

a）当系统未激活或进入休眠时，此指令用于激活系统；

b）当系统激活后，指令响应模块（180）接收到此指令，会将指令集堆栈（185）栈顶结点的信息传给指令提醒模块（140），指令提醒模块（140）语音播报当前栈顶结点中各个指令的功能名称。

5.一种权利要求1所述的基于智能设备的指令式语音控制系统的控制方法，其特征在于，该控制方法包括以下步骤：

a、首先，执行开启语音控制/打开APP（210）过程，此过程开启功能或者启动程序；

b、之后，初始化指令集（220）过程，根据指令预定义数据（175）进行初始化操作，指令集堆栈（185）初始化到第一级堆栈；

c、之后，更新显示当前级指令集（230）过程，将指令显示模块（160）刷新为指令集堆栈（185）栈顶的指令信息；

d、之后，监听响应语音指令（240）过程，等待来自于通过指令匹配模块（170）的指令数据（a50）输入；

e、当监测到一条指令数据（a50）输入后，通过判断指令类型（250）过程，对指令类型进行判断，根据指令类型进行不同的处理；

f、如果是进栈指令，则执行下一级指令集进入堆栈（254）过程，将此指令数据（a50）中所引用的指令集压入堆栈，然后去执行更新显示当前级指令集（230）过程；

g、如果是出栈指令，则将执行当前指令集出栈，返回上一级指令集（252）过程，此过程将指令集堆栈（185）的栈顶结点出栈，新的栈顶指令集作为当前指令集，之后执行更新显示当前级指令集（230）过程；

h、如果是功能类的指令，则先执行是否需要确认（260）过程，判断是否需要执行确认，对于需要进行确认的功能类指令，要先执行监听响应确认指令（262）过程，监听响应确认指令（262）过程，等待来自于通过指令响应模块（180）的指令输入；如果下达否定指令，则返回监听响应语音指令（240）过程；如果下达肯定指令，则开始执行功能（270）过程，对于不需要进行确认的功能类指令，则直接开始执行功能（270）过程；

i、执行功能（270）过程之后，返回监听响应语音指令（240）过程，等待后续的指令数据（a50）输入。