CN108008885A - 指令式语音控制语法文件辅助生成系统 - Google Patents

指令式语音控制语法文件辅助生成系统 Download PDF

Info

Publication number
CN108008885A
CN108008885A CN201711132012.XA CN201711132012A CN108008885A CN 108008885 A CN108008885 A CN 108008885A CN 201711132012 A CN201711132012 A CN 201711132012A CN 108008885 A CN108008885 A CN 108008885A
Authority
CN
China
Prior art keywords
voice control
instruction
parameter
key instruction
order parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711132012.XA
Other languages
English (en)
Inventor
须明
原帅
徐克�
郭航宇
王伟长
吴慧垚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Aeronautical Radio Electronics Research Institute
Original Assignee
China Aeronautical Radio Electronics Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Aeronautical Radio Electronics Research Institute filed Critical China Aeronautical Radio Electronics Research Institute
Priority to CN201711132012.XA priority Critical patent/CN108008885A/zh
Publication of CN108008885A publication Critical patent/CN108008885A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04847Interaction techniques to control parameter settings, e.g. interaction with sliders or dials
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Abstract

本发明公开了一种指令式语音控制语法文件辅助生成系统,包含以下程序模块:解析模块,对语音控制语法结构文件进行解析,分解出关键指令、指令参数、以及关键指令与指令参数之间的关系,并生成关键指令、指令参数的编辑界面;编辑模块,捕获所述编辑界面上对关键指令、指令参数辑编的内容,更新语音控制语法结构文件。本发明将人工全手动输入编辑语法结构文件的方式转变成计算机辅助生成方式,有效降低语音控制产品开发、测试、修改过程的工作量,消除产生人为差错的可能性,提高语音控制产品的开发质量和效率,节省人力资源、缩短产品开发周期。

Description

指令式语音控制语法文件辅助生成系统
技术领域
本发明属语音处理技术,模式识别技术,语音识别和语音控制。
背景技术
随着语音识别技术的发展和不断成熟,语音识别技术产品的应用领域和范围在不断扩展,逐渐深入到人们生活、生产的各个环节,成为改善生活和工作质量、提高效率的重要支撑工具。
语音识别技术的应用领域不同,其实现的方式有所区别。以互联网平台为基础的语音识别服务依托于强大的数据服务器和背后庞大的系统维护专业团队,能够为人们提供日常生活交流的语音服务。然而对于各专业领域的工作系统,一般不具备上述条件,适合采用专用的指令式的语音控制操作方式,这种语音控制功能一般不需要日常更新和维护,也不需要大型的服务器平台,能够实时识别响应,适合于在各专业生产领域内广泛应用。
目前的语音识别技术,在实现过程中包含两部分的处理,即语音模型处理和语法模型处理。语音模型处理主要基于连续HMM模型,识别出语音的发音序列,语法模型处理中包含了由各字词组成语句的语言组织语法规则。大规模互联网语音识别应用采用无限词汇,其词汇和语法规则需要不断地维护和刷新,以适应于不断涌现的新的词汇和用法;专用系统的语音控制仅仅针对系统人机操作本身有限的词汇,其词法和语法相对固定,不需要频繁刷新维护,因此在语音识别的实现技术上可以采用预先设计定义的词法和语法结构。其中,语法结构文件就是定义指令式语音控制目标系统指令词汇及其语法的专用语法文件。
语音控制语法结构文件的基本组成元素如下:
a)关键指令,语音控制指令的关键指令部分,区别于其他指令的关键词;
b)指令参数,关键指令后接的参数,可以是表示某个范围的数字参数,也可以是非数字的类型参数。
其中指令参数定义于语法结构文件开头的参数定义列表中,关键指令列表则以固定的结构化字符串格式定义。
语音控制语法结构文件在语音识别中主要用于定义可被识别出的所有语音指令词汇及其参数的语法规则。其文件基本格式如下:
#文件开始#
$指令参数1=定义1;
$指令参数2=定义2;
$指令参数n=定义n;
(标头
(
关键指令1$指令参数1|
关键指令2$指令参数2|
关键指令n$指令参数n|
)
标尾)
#文件结尾#
语音控制语法结构文件中包含了语音控制系统所有语音指令中所包含的字词,其数量规模随实际应用系统而定,复杂的系统(飞机驾驶舱控制)可以有近1000条的词条规模。
在指令式语音识别控制系统开发过程中,一直采用人工编辑的方式产生语音控制语法结构文件,这需要编辑人员非常熟悉语法结构的复杂的编写规则,其中输入数字参数的指令语法尤为复杂。对于一套指令数量较多的语音控制系统,人工编辑语法结构文件过程中难免会产生一些错误,需要反复的测试来查找修正这些错误,耗费较多的人力和时间。
发明内容
本发明的发明目的在于指供一种指令式语音控制语法文件辅助生成系统,将人工全手动输入编辑语法结构文件的方式转变成计算机辅助生成方式,有效降低语音控制产品开发、测试、修改过程的工作量,消除产生人为差错的可能性,提高语音控制产品的开发质量和效率,节省人力资源、缩短产品开发周期。
本发明的发明目的通过以下技术方案实现:
一种指令式语音控制语法文件辅助生成系统,包含以下程序模块:
解析模块,对语音控制语法结构文件进行解析,分解出关键指令、指令参数、以及关键指令与指令参数之间的关系,并生成关键指令、指令参数的编辑界面;
编辑模块,捕获所述编辑界面上对关键指令、指令参数辑编的内容,更新语音控制语法结构文件。
依据上述特征,语音控制语法结构文件包含指令参数定义和关键指令定义两个部分。
优选地,指令参数的类型有无参数、数字型参数和类型型参数,其中,在语音控制语法结构文件中,同一关键指令的各数字型参数之间用第一符号分隔,同一关键指令的各类型型参数之间用第二符号分隔。
本发明的有益效果在于:
通过使用该发明,语音控制语法结构文件的计算机处理生成效率比全人工编辑提高3倍以上,不会产生差错,免除了针对语音控制语法结构文件的错误查找和修正,降低了语音控制产品的整体缺陷故障因素。
附图说明
图1为实施例所示的编辑界面1;
图2为实施例所示的编辑界面2;
图3为实施例所示的编辑界面3;
图4为指令式语音控制语法文件辅助生成系统的典型操作流程图;
图5为语音控制语法结构文件与语法物理存储结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。
本实施例所示的一种指令式语音控制语法文件辅助生成系统,包含以下程序模块:
解析模块,对语音控制语法结构文件进行解析,分解出关键指令、指令参数、以及关键指令与指令参数之间的关系,并生成关键指令、指令参数的编辑界面;
编辑模块,捕获所述编辑界面上对关键指令、指令参数辑编的内容,更新语音控制语法结构文件。
解析模块首先生成的编辑界面1如图所示,以关键指令项列表为显示主体,具备加载、解析与生成语音控制语法结构文件的能力,开发人员可通过简单的操作输入关键内容,从而查找、增加、删除和修改关键指令项,利用编辑界面2、编辑界面3(见图2、图3)对不同类型的参数列表进行设计。
在编辑界面1中,每个关键指令项的显示包含指令名称和参数列表两部分内容:
a)指令名称,直接显示当前关键指令的名称;
b)参数列表,根据当前关键指令的参数内容进行显示,分为无参数、数字参数、类型参数三种情况。无参数时参数列表框中不显示内容;有数字参数时,参数列表框会通过第一符号来分隔不同数值区间进行显示,在本实施例中使用小括号“()”作为第一符号起限定作用范围,在波浪号“~”前后添加数字表示数字范围;有类型参数时,参数列表框通过第二符号来分隔不同类型进行显示,本实施例中使用斜杠“/”作为第二符号进行分隔。
开发人员在编辑界面1-3上进行关键指令项和指令参数的增删改操作,由编辑模块捕获编辑的内容,对应到语法的物理存储结构数据,当开发人员进行完指令集的设计后,更新/生成语音控制语法结构文件。
语音识别语法结构文件以文本形式保存,其内容主要分为指令参数定义和指令项定义两个部分(详见技术背景介绍章节),对应的计算机存储结构如图5所示,解析模块对其解析的具体过程如下:
a)指令参数定义,在语音控制语法结构文件的头部,每个指令参数定义由一个参数标识与一条参数内容组成,形如“$指令参数1=定义1”,因为指令参数可以分为数字参数和类型参数两种,因此对应两种存储结构:
1)数字参数:
以“$参数1=(00~23)(00~59)(00~59)”为例,通过解析字符串中的符号和内容后,得到该定义的存储格式:
指令参数标识名称:“参数1”;
含数字范围个数:3;
数字1-1:“00”;
数字1-2:“23”;
数字2-1:“00”;
数字2-2:“59”;
数字3-2:“00”;
数字3-2:“59”;
2)类型参数:
以“$参数2=地速|空速|校正空速”为例,通过解析字符串中的符号和内容后,得到该定义的存储格式:
指令参数标识名称:“参数2”;
含类型个数:3;
类型1:“地速”;
类型2:“空速”;
类型3:“校正空速”;
b)关键指令项定义,在语音控制语法结构文件中指令参数定义之后的剩余部分,关键指令项和关键指令项之间通过竖杠“|”分隔,每个指令项包含一个关键指令和一个指令参数标识,形如“关键指令1$指令参数1”,其中指令参数标识对应于语法结构文件头部的指令参数定义。以“时间$参数1”为例,通过解析字符串中的符号和内容后,得到该定义的存储格式:
关键指令:“时间”;
指令参数:指针(指向指令参数标识名称为“参数1”的存储结构);
指令式语音控制语法文件辅助生成系统中增加关键指令项的操作流程如图4所示,具体流程如下:
a)新建或打开一个语音控制语法结构文件,解析文件后显示关键指令项;
b)增加关键指令项,添加关键指令名称;
c)根据参数列表类型添加参数,若需要填数字参数,则执行d),若需要添加类型参数,则执行e);
d)数字参数可增加、修改、删除数字范围定义(见图2),通过对多组数字范围定义进行组合形成数字参数列表,比如指令内容“时间”的数字参数列表分为三个数字范围,分别是“0~23”、“0~59”、“0~59”,分别表示“时”、“分”、“秒”;
e)类型参数可增加、修改、删除类型描述(见图3),通过对多组类型描述进行组合形成类型参数列表,表示指令名称可后接参数列表中的某一个类型描述,从而形成一条完整的语音指令;
f)关键指令项增加完毕后,保存关键指令项集合,形成新的语音控制语法结构文件。
可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及其发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。

Claims (3)

1.一种指令式语音控制语法文件辅助生成系统,包含以下程序模块:
解析模块,对语音控制语法结构文件进行解析,分解出关键指令、指令参数、以及关键指令与指令参数之间的关系,并生成关键指令、指令参数的编辑界面;
编辑模块,捕获所述编辑界面上对关键指令、指令参数辑编的内容,更新语音控制语法结构文件。
2.根据权利要求1所述的一种指令式语音控制语法文件辅助生成系统,其特征在于所述语音控制语法结构文件包含指令参数定义和关键指令定义两个部分。
3.根据权利要求1所述的一种指令式语音控制语法文件辅助生成系统,其特征在于所述指令参数的类型有无参数、数字型参数和类型型参数,其中,在语音控制语法结构文件中,同一关键指令的各数字型参数之间用第一符号分隔,同一关键指令的各类型型参数之间用第二符号分隔。
CN201711132012.XA 2017-11-15 2017-11-15 指令式语音控制语法文件辅助生成系统 Pending CN108008885A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711132012.XA CN108008885A (zh) 2017-11-15 2017-11-15 指令式语音控制语法文件辅助生成系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711132012.XA CN108008885A (zh) 2017-11-15 2017-11-15 指令式语音控制语法文件辅助生成系统

Publications (1)

Publication Number Publication Date
CN108008885A true CN108008885A (zh) 2018-05-08

Family

ID=62052435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711132012.XA Pending CN108008885A (zh) 2017-11-15 2017-11-15 指令式语音控制语法文件辅助生成系统

Country Status (1)

Country Link
CN (1) CN108008885A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113571042A (zh) * 2021-07-22 2021-10-29 成都航盛智行科技有限公司 一种用于车载式语音识别系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11305983A (ja) * 1998-04-23 1999-11-05 Victor Co Of Japan Ltd 音声制御画像スクリーン表示システム
CN105225659A (zh) * 2015-09-10 2016-01-06 中国航空无线电电子研究所 一种指令式语音控制发音词典辅助生成方法
CN106484270A (zh) * 2016-09-12 2017-03-08 深圳市金立通信设备有限公司 一种语音操作事件添加方法及终端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11305983A (ja) * 1998-04-23 1999-11-05 Victor Co Of Japan Ltd 音声制御画像スクリーン表示システム
CN105225659A (zh) * 2015-09-10 2016-01-06 中国航空无线电电子研究所 一种指令式语音控制发音词典辅助生成方法
CN106484270A (zh) * 2016-09-12 2017-03-08 深圳市金立通信设备有限公司 一种语音操作事件添加方法及终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
须明等: ""驾驶舱语音控制指令的设计问题探讨"", 《航空电子技术》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113571042A (zh) * 2021-07-22 2021-10-29 成都航盛智行科技有限公司 一种用于车载式语音识别系统
CN113571042B (zh) * 2021-07-22 2023-12-01 成都航盛智行科技有限公司 一种用于车载式语音识别系统

Similar Documents

Publication Publication Date Title
CN104485105B (zh) 一种电子病历生成方法和电子病历系统
CN106096664B (zh) 一种基于社交网络数据的情感分析方法
JP2021106017A (ja) テキストの創作方法、装置、機器及び記憶媒体
CN103810998B (zh) 基于移动终端设备的离线语音识别方法以及实现方法
CN107463553A (zh) 针对初等数学题目的文本语义抽取、表示与建模方法和系统
CN107480122A (zh) 一种人工智能交互方法及人工智能交互装置
CN103632663B (zh) 一种基于hmm的蒙古语语音合成前端处理的方法
CN105261358A (zh) 用于语音识别的n元文法模型构造方法及语音识别系统
JP2021184255A (ja) 語義表現モデルの生成方法、語義表現モデルの生成装置、電子機器、記憶媒体及びコンピュータプログラム
CN104485107A (zh) 名称的语音识别方法、语音识别系统和语音识别设备
CN104778256A (zh) 一种领域问答系统咨询的快速可增量聚类方法
CN103885924A (zh) 一种领域自适应的公开课字幕自动生成系统及方法
CN103744837B (zh) 基于关键词抽取的多文本对照方法
CN101576909A (zh) 一种蒙古语数字化知识库系统构建方法
CN109783819A (zh) 一种正则表达式的生成方法及系统
CN105225659A (zh) 一种指令式语音控制发音词典辅助生成方法
CN106502988A (zh) 一种目标属性抽取的方法和设备
CN110147550A (zh) 基于神经网络的发音特征融合方法
CN108008885A (zh) 指令式语音控制语法文件辅助生成系统
CN109213846A (zh) 一种自然语言处理系统
CN111883101B (zh) 一种模型训练及语音合成方法、装置、设备和介质
CN106021413A (zh) 基于主题模型的自展式特征选择方法及系统
CN106202047A (zh) 一种基于微博文本的人物性格刻画方法
TW201316185A (zh) 製作知識地圖的方法
CN106339367B (zh) 一种蒙古文自动校正方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180508

WD01 Invention patent application deemed withdrawn after publication