CN108510980A

CN108510980A - 一种可学习的语音识别控制方法

Info

Publication number: CN108510980A
Application number: CN201810189287.5A
Authority: CN
Inventors: 胡吉
Original assignee: Shenzhen Xu Kang Technology Co Ltd
Current assignee: Shenzhen Xu Kang Technology Co Ltd
Priority date: 2018-03-08
Filing date: 2018-03-08
Publication date: 2018-09-07

Abstract

一种可学习的语音识别控制方法，本发明涉及智能家居语音控制技术领域；一号训练阶段通过语音录入，并对录入的语音数据进行特征提取，将提取的特征数据与机器学习音素相匹配，同时将字典结合机器学习音素相匹配，形成声学模型；二号训练阶段通过文本数据的输入，对语法进行提取，再将提取的语法生成语言模型；识别阶段首先对采集的声音进行音素的特征提取，并将提取的特征音素与一号训练阶段中的声学模型和二号训练阶段中的语言模型相结合，采用统计模型与匹配模型算法相结合依次进行音素匹配、字典配对以及语法配对，最后将匹配的结果整理输出。在现有家电的开关组上添加语言识别功能，用于实现对家电的声音控制，扩大其使用范围，实用性更强。

Description

一种可学习的语音识别控制方法

技术领域

本发明涉及智能家居语音控制技术领域，具体涉及一种可学习的语音识别控制方法。

背景技术

智能家居是在物联网的影响之下物联化体现。智能家居通过物联网技术将家中的各种设备（如音视频设备、照明系统、窗帘控制、空调控制、安防系统、数字影院系统、网络家电以及三表抄送等）连接到一起，提供家电控制、照明控制、窗帘控制、电话远程控制、室内外遥控、防盗报警、环境监测、暖通控制、红外转发以及可编程定时控制等多种功能和手段。与普通家居相比，智能家居不仅具有传统的居住功能，兼备建筑、网络通信、信息家电、设备自动化，集系统、结构、服务、管理为一体的高效、舒适、安全、便利、环保的居住环境，提供全方位的信息交互功能，帮助家庭与外部保持信息交流畅通，优化人们的生活方式，帮助人们有效安排时间，增强家居生活的安全性，甚至为各种能源费用节约资金。

现有的家电控制大多采用机械开关，需要人工现场控制，使用条件收到局限，亟待改进。

发明内容

本发明的目的在于针对现有技术的缺陷和不足，提供一种结构简单，设计合理、使用方便的可学习的语音识别控制方法，在现有家电的开关组上添加语言识别功能，用于实现对家电的声音控制，扩大其使用范围，实用性更强。

为实现上述目的，本发明采用的技术方案是：它包含一号训练阶段、二号训练阶段和识别阶段，其中一号训练阶段通过语音录入，并对录入的语音数据进行特征提取，将提取的特征数据与机器学习音素相匹配，同时将字典结合机器学习音素相匹配，形成声学模型；其中二号训练阶段通过文本数据的输入，对语法进行提取，再将提取的语法生成语言模型；所述的识别阶段首先对采集的声音进行音素的特征提取，并将提取的特征音素与一号训练阶段中的声学模型和二号训练阶段中的语言模型相结合，采用统计模型与匹配模型算法相结合依次进行音素匹配、字典配对以及语法配对，最后将匹配的结果整理输出，即可。

进一步地，所述的识别阶段对采集的声音进行音素的特征提取，其中采集的声音包含对带DSP声音的采集以及和不带DSP声音的采集，其中，对带DSP声音的采集的流程如下：带DSP声音采集→ADC→运放→降噪→回声消除AEC→远场放大和唤醒→语音激活检测AVD→识别阶段；其中，对不带DSP声音的采集的采集的流程如下：不带DSP声音采集→ADC→运放→降噪→回声消除AEC→语音激活检测AVD→识别阶段。

采用上述方法后，本发明有益效果为：本发明所述的一种可学习的语音识别控制方法，在现有家电的开关组上添加语言识别功能，用于实现对家电的声音控制，扩大其使用范围，实用性更强，本发明具有结构简单，设置合理，制作成本低等优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明的流程框图。

图2是实施例的流程框图。

具体实施方式

下面结合附图对本发明作进一步的说明。

参看如图1所示，本具体实施方式采用的技术方案是：它包含一号训练阶段、二号训练阶段和识别阶段，其中一号训练阶段通过语音录入，并对录入的语音数据进行特征提取，将提取的特征数据与机器学习音素相匹配，同时将字典结合机器学习音素相匹配，形成声学模型；其中二号训练阶段通过文本数据的输入，对语法进行提取，再将提取的语法生成语言模型；所述的识别阶段首先对声音进行采集，将采集的声音进行音素的特征提取，并将提取的特征音素与一号训练阶段中的声学模型和二号训练阶段中的语言模型相结合，采用统计模型与匹配模型算法相结合依次进行音素匹配、字典配对以及语法配对，最后将匹配的结果整理输出，即可。

采用上述方法后，本具体实施方式有益效果为：本具体实施方式所述的一种可学习的语音识别控制方法，在现有家电的开关组上添加语言识别功能，用于实现对家电的声音控制，扩大其使用范围，实用性更强，本发明具有结构简单，设置合理，制作成本低等优点。

实施例：

参看图2，本实施例中首先对在一号训练阶段和二号训练阶段进行声学模型和语言模型的建立，再对声音进行采集，再利用语音识别模组对采集的声音进行预处理，预处理后的声音被语音激活检测模块激活检测之后进入识别阶段，在识别阶段中，采用统计模型与匹配模型算法相结合依次进行音素匹配、字典配对以及语法配对，最后将匹配的结果整理输出至调用URT接口，从而实现对智能开关组（PLC开关组）的控制。

以上所述，仅用以说明本发明的技术方案而非限制，本领域普通技术人员对本发明的技术方案所做的其它修改或者等同替换，只要不脱离本发明技术方案的精神和范围，均应涵盖在本发明的权利要求范围当中。

Claims

1.一种可学习的语音识别控制方法，其特征在于：它包含一号训练阶段、二号训练阶段和识别阶段，其中一号训练阶段通过语音录入，并对录入的语音数据进行特征提取，将提取的特征数据与机器学习音素相匹配，同时将字典结合机器学习音素相匹配，形成声学模型；其中二号训练阶段通过文本数据的输入，对语法进行提取，再将提取的语法生成语言模型；所述的识别阶段首先对采集的声音进行音素的特征提取，并将提取的特征音素与一号训练阶段中的声学模型和二号训练阶段中的语言模型相结合，采用统计模型与匹配模型算法相结合依次进行音素匹配、字典配对以及语法配对，最后将匹配的结果整理输出，即可。

2.根据权利要求1所述的一种可学习的语音识别控制方法，其特征在于：所述的识别阶段对采集的声音进行音素的特征提取，其中采集的声音包含对带DSP声音的采集以及和不带DSP声音的采集，其中，对带DSP声音的采集的流程如下：带DSP声音采集→ADC→运放→降噪→回声消除AEC→远场放大和唤醒→语音激活检测AVD→识别阶段；其中，对不带DSP声音的采集的采集的流程如下：不带DSP声音采集→ADC→运放→降噪→回声消除AEC→语音激活检测AVD→识别阶段。