CN108008885A

CN108008885A - 指令式语音控制语法文件辅助生成系统

Info

Publication number: CN108008885A
Application number: CN201711132012.XA
Authority: CN
Inventors: 须明; 原帅; 徐克�; 郭航宇; 王伟长; 吴慧垚
Original assignee: China Aeronautical Radio Electronics Research Institute
Current assignee: China Aeronautical Radio Electronics Research Institute
Priority date: 2017-11-15
Filing date: 2017-11-15
Publication date: 2018-05-08

Abstract

本发明公开了一种指令式语音控制语法文件辅助生成系统，包含以下程序模块：解析模块，对语音控制语法结构文件进行解析，分解出关键指令、指令参数、以及关键指令与指令参数之间的关系，并生成关键指令、指令参数的编辑界面；编辑模块，捕获所述编辑界面上对关键指令、指令参数辑编的内容，更新语音控制语法结构文件。本发明将人工全手动输入编辑语法结构文件的方式转变成计算机辅助生成方式，有效降低语音控制产品开发、测试、修改过程的工作量，消除产生人为差错的可能性，提高语音控制产品的开发质量和效率，节省人力资源、缩短产品开发周期。

Description

指令式语音控制语法文件辅助生成系统

技术领域

本发明属语音处理技术，模式识别技术，语音识别和语音控制。

背景技术

随着语音识别技术的发展和不断成熟，语音识别技术产品的应用领域和范围在不断扩展，逐渐深入到人们生活、生产的各个环节，成为改善生活和工作质量、提高效率的重要支撑工具。

语音识别技术的应用领域不同，其实现的方式有所区别。以互联网平台为基础的语音识别服务依托于强大的数据服务器和背后庞大的系统维护专业团队，能够为人们提供日常生活交流的语音服务。然而对于各专业领域的工作系统，一般不具备上述条件，适合采用专用的指令式的语音控制操作方式，这种语音控制功能一般不需要日常更新和维护，也不需要大型的服务器平台，能够实时识别响应，适合于在各专业生产领域内广泛应用。

目前的语音识别技术，在实现过程中包含两部分的处理，即语音模型处理和语法模型处理。语音模型处理主要基于连续HMM模型，识别出语音的发音序列，语法模型处理中包含了由各字词组成语句的语言组织语法规则。大规模互联网语音识别应用采用无限词汇，其词汇和语法规则需要不断地维护和刷新，以适应于不断涌现的新的词汇和用法；专用系统的语音控制仅仅针对系统人机操作本身有限的词汇，其词法和语法相对固定，不需要频繁刷新维护，因此在语音识别的实现技术上可以采用预先设计定义的词法和语法结构。其中，语法结构文件就是定义指令式语音控制目标系统指令词汇及其语法的专用语法文件。

语音控制语法结构文件的基本组成元素如下：

a)关键指令，语音控制指令的关键指令部分，区别于其他指令的关键词；

b)指令参数，关键指令后接的参数，可以是表示某个范围的数字参数，也可以是非数字的类型参数。

其中指令参数定义于语法结构文件开头的参数定义列表中，关键指令列表则以固定的结构化字符串格式定义。

语音控制语法结构文件在语音识别中主要用于定义可被识别出的所有语音指令词汇及其参数的语法规则。其文件基本格式如下：

#文件开始#

$指令参数1＝定义1；

$指令参数2＝定义2；

…

$指令参数n＝定义n；

(标头

(

关键指令1$指令参数1|

关键指令2$指令参数2|

…

关键指令n$指令参数n|

)

标尾)

#文件结尾#

语音控制语法结构文件中包含了语音控制系统所有语音指令中所包含的字词，其数量规模随实际应用系统而定，复杂的系统(飞机驾驶舱控制)可以有近1000条的词条规模。

在指令式语音识别控制系统开发过程中，一直采用人工编辑的方式产生语音控制语法结构文件，这需要编辑人员非常熟悉语法结构的复杂的编写规则，其中输入数字参数的指令语法尤为复杂。对于一套指令数量较多的语音控制系统，人工编辑语法结构文件过程中难免会产生一些错误，需要反复的测试来查找修正这些错误，耗费较多的人力和时间。

发明内容

本发明的发明目的在于指供一种指令式语音控制语法文件辅助生成系统，将人工全手动输入编辑语法结构文件的方式转变成计算机辅助生成方式，有效降低语音控制产品开发、测试、修改过程的工作量，消除产生人为差错的可能性，提高语音控制产品的开发质量和效率，节省人力资源、缩短产品开发周期。

本发明的发明目的通过以下技术方案实现：

一种指令式语音控制语法文件辅助生成系统，包含以下程序模块：

解析模块，对语音控制语法结构文件进行解析，分解出关键指令、指令参数、以及关键指令与指令参数之间的关系，并生成关键指令、指令参数的编辑界面；

编辑模块，捕获所述编辑界面上对关键指令、指令参数辑编的内容，更新语音控制语法结构文件。

依据上述特征，语音控制语法结构文件包含指令参数定义和关键指令定义两个部分。

优选地，指令参数的类型有无参数、数字型参数和类型型参数，其中，在语音控制语法结构文件中，同一关键指令的各数字型参数之间用第一符号分隔，同一关键指令的各类型型参数之间用第二符号分隔。

本发明的有益效果在于：

通过使用该发明，语音控制语法结构文件的计算机处理生成效率比全人工编辑提高3倍以上，不会产生差错，免除了针对语音控制语法结构文件的错误查找和修正，降低了语音控制产品的整体缺陷故障因素。

附图说明

图1为实施例所示的编辑界面1；

图2为实施例所示的编辑界面2；

图3为实施例所示的编辑界面3；

图4为指令式语音控制语法文件辅助生成系统的典型操作流程图；

图5为语音控制语法结构文件与语法物理存储结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。

本实施例所示的一种指令式语音控制语法文件辅助生成系统，包含以下程序模块：

解析模块首先生成的编辑界面1如图所示，以关键指令项列表为显示主体，具备加载、解析与生成语音控制语法结构文件的能力，开发人员可通过简单的操作输入关键内容，从而查找、增加、删除和修改关键指令项，利用编辑界面2、编辑界面3(见图2、图3)对不同类型的参数列表进行设计。

在编辑界面1中，每个关键指令项的显示包含指令名称和参数列表两部分内容：

a)指令名称，直接显示当前关键指令的名称；

b)参数列表，根据当前关键指令的参数内容进行显示，分为无参数、数字参数、类型参数三种情况。无参数时参数列表框中不显示内容；有数字参数时，参数列表框会通过第一符号来分隔不同数值区间进行显示，在本实施例中使用小括号“()”作为第一符号起限定作用范围，在波浪号“～”前后添加数字表示数字范围；有类型参数时，参数列表框通过第二符号来分隔不同类型进行显示，本实施例中使用斜杠“/”作为第二符号进行分隔。

开发人员在编辑界面1-3上进行关键指令项和指令参数的增删改操作，由编辑模块捕获编辑的内容，对应到语法的物理存储结构数据，当开发人员进行完指令集的设计后，更新/生成语音控制语法结构文件。

语音识别语法结构文件以文本形式保存，其内容主要分为指令参数定义和指令项定义两个部分(详见技术背景介绍章节)，对应的计算机存储结构如图5所示，解析模块对其解析的具体过程如下：

a)指令参数定义，在语音控制语法结构文件的头部，每个指令参数定义由一个参数标识与一条参数内容组成，形如“$指令参数1＝定义1”，因为指令参数可以分为数字参数和类型参数两种，因此对应两种存储结构：

1)数字参数：

以“$参数1＝(00～23)(00～59)(00～59)”为例，通过解析字符串中的符号和内容后，得到该定义的存储格式：

指令参数标识名称：“参数1”；

含数字范围个数:3；

数字1-1：“00”；

数字1-2：“23”；

数字2-1：“00”；

数字2-2：“59”；

数字3-2：“00”；

数字3-2：“59”；

2)类型参数：

以“$参数2＝地速|空速|校正空速”为例，通过解析字符串中的符号和内容后，得到该定义的存储格式：

指令参数标识名称：“参数2”；

含类型个数:3；

类型1：“地速”；

类型2：“空速”；

类型3：“校正空速”；

b)关键指令项定义，在语音控制语法结构文件中指令参数定义之后的剩余部分，关键指令项和关键指令项之间通过竖杠“|”分隔，每个指令项包含一个关键指令和一个指令参数标识，形如“关键指令1$指令参数1”，其中指令参数标识对应于语法结构文件头部的指令参数定义。以“时间$参数1”为例，通过解析字符串中的符号和内容后，得到该定义的存储格式：

关键指令：“时间”；

指令参数:指针(指向指令参数标识名称为“参数1”的存储结构)；

指令式语音控制语法文件辅助生成系统中增加关键指令项的操作流程如图4所示，具体流程如下：

a)新建或打开一个语音控制语法结构文件，解析文件后显示关键指令项；

b)增加关键指令项，添加关键指令名称；

c)根据参数列表类型添加参数，若需要填数字参数，则执行d)，若需要添加类型参数，则执行e)；

d)数字参数可增加、修改、删除数字范围定义(见图2)，通过对多组数字范围定义进行组合形成数字参数列表，比如指令内容“时间”的数字参数列表分为三个数字范围，分别是“0～23”、“0～59”、“0～59”，分别表示“时”、“分”、“秒”；

e)类型参数可增加、修改、删除类型描述(见图3)，通过对多组类型描述进行组合形成类型参数列表，表示指令名称可后接参数列表中的某一个类型描述，从而形成一条完整的语音指令；

f)关键指令项增加完毕后，保存关键指令项集合，形成新的语音控制语法结构文件。

可以理解的是，对本领域普通技术人员来说，可以根据本发明的技术方案及其发明构思加以等同替换或改变，而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。

Claims

1.一种指令式语音控制语法文件辅助生成系统，包含以下程序模块：

2.根据权利要求1所述的一种指令式语音控制语法文件辅助生成系统，其特征在于所述语音控制语法结构文件包含指令参数定义和关键指令定义两个部分。

3.根据权利要求1所述的一种指令式语音控制语法文件辅助生成系统，其特征在于所述指令参数的类型有无参数、数字型参数和类型型参数，其中，在语音控制语法结构文件中，同一关键指令的各数字型参数之间用第一符号分隔，同一关键指令的各类型型参数之间用第二符号分隔。