CN110516509A

CN110516509A - 用于语音信号识别方法

Info

Publication number: CN110516509A
Application number: CN201810487456.3A
Authority: CN
Inventors: 朱姝
Original assignee: Individual
Current assignee: Individual
Priority date: 2018-05-21
Filing date: 2018-05-21
Publication date: 2019-11-29

Abstract

本发明公开了用于语音信号识别方法，涉及语音信号图像识别，包括语音信号类别样本、待识别特征图像，还包括以下步骤：S1，获取来自语音信号采集点的待识别特征图像，在空间域中进行分解域变换，使图像信息分解到的多个尺度空间中；S2，利用空间域梯度算子进行待识别特征图像的边缘检测；S3，在图像变换域中，利用小波进行待识别特征图像的边缘检测；S4，提取空间域和变换域中边缘检测获取的待识别特征图像的特征向量；S5，利用人工神经网络进行模式识别。本发明能够有效提取语音信号的边缘，作为理想的特征；能够依据空间域和变换域双重检测，提高识别精度。

Description

用于语音信号识别方法

技术领域

本发明涉及语音信号图像识别，具体涉及用于语音信号识别方法。

背景技术

语音识别的应用领域非常广泛，常见的应用系统有：语音输入系统，相对于键盘输入方法，它更符合人的日常习惯，也更自然、更高效；语音控制系统，即用语音来控制设备的运行，相对于手动控制来说更加快捷、方便，可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域；智能对话查询系统，根据客户的语音进行操作，为用户提供自然、友好的数据库检索服务，例如家庭服务、宾馆服务、旅行社服务系统、订票系统、医疗服务、银行服务、股票查询服务等等。语音识别主要有以下五个问题：对自然语言的识别和理解。首先必须将连续的讲话分解为词、音素等单位，其次要建立一个理解语义的规则；语音信息量大。语音模式不仅对不同的说话人不同，对同一说话人也是不同的，例如，一个说话人在随意说话和认真说话时的语音信息是不同的。一个人的说话方式随着时间变化；语音的模糊性。说话者在讲话时，不同的词可能听起来是相似的。这在英语和汉语中常见；单个字母或词、字的语音特性受上下文的影响，以致改变了重音、音调、音量和发音速度等；环境噪声和干扰对语音识别有严重影响，致使识别率低。目前语音信号类别存在识别困难、差异性小，存在干扰时难以识别的问题。

发明内容

本发明所要解决的技术问题是目前语音信号类别存在识别困难、差异性小，存在干扰时难以识别的问题，目的在于提供用于语音信号识别方法，解决上述问题。

本发明通过下述技术方案实现：

用于语音信号识别方法，包括语音信号类别样本、待识别特征图像，还包括以下步骤：

S1，获取来自语音信号采集点的待识别特征图像，在空间域中进行分解域变换，使图像信息分解到的多个尺度空间中；

S2，利用空间域梯度算子进行待识别特征图像的边缘检测；

S3，在图像变换域中，利用小波进行待识别特征图像的边缘检测；

S4，提取空间域和变换域中边缘检测获取的待识别特征图像的特征向量；

S5，利用人工神经网络进行模式识别，将语音信号类别样本进行离线训练，确定权值，与S4获得的特征向量进行运算，实现待识别特征图像的识别。

进一步地，所述S1中的分解域变换采用小波多尺度分解域变换。

进一步地，所述S2中的梯度算子采用高斯拉普拉斯算子。

进一步地，所述S3中的边缘检测结果采用链表进行记录。

进一步地，所述S4中的特征向量采用统计特征。

本发明与现有技术相比，具有如下的优点和有益效果：

1、本发明用于语音信号识别方法，能够有效提取语音信号的边缘，作为理想的特征；

2、本发明用于语音信号识别方法，能够依据空间域和变换域双重检测，提高识别精度。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下面结合实施例，对本发明作进一步的详细说明，本发明的示意性实施方式及其说明仅用于解释本发明，并不作为对本发明的限定。

实施例

本发明用于语音信号识别方法，包括语音信号类别样本、待识别特征图像，还包括以下步骤：

S2，利用空间域梯度算子进行待识别特征图像的边缘检测；

所述S1中的分解域变换采用小波多尺度分解域变换。

所述S2中的梯度算子采用高斯拉普拉斯算子。

所述S3中的边缘检测结果采用链表进行记录。

所述S4中的特征向量采用统计特征。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.用于语音信号识别方法，包括语音信号类别样本、待识别特征图像，其特征在于，还包括以下步骤：

S2，利用空间域梯度算子进行待识别特征图像的边缘检测；

2.根据权利要求1所述的用于语音信号识别方法，其特征在于，所述S1中的分解域变换采用小波多尺度分解域变换。

3.根据权利要求1所述的用于语音信号识别方法，其特征在于，所述S2中的梯度算子采用高斯拉普拉斯算子。

4.根据权利要求1所述的用于语音信号识别方法，其特征在于，所述S3中的边缘检测结果采用链表进行记录。

5.根据权利要求1所述的用于语音信号识别方法，其特征在于，所述S4中的特征向量采用统计特征。