CN109410985B

CN109410985B - 哭声智能翻译手表

Info

Publication number: CN109410985B
Application number: CN201811240895.0A
Authority: CN
Inventors: 潘正祥; 冯庆祥; 郑为民; 吴祖扬
Original assignee: Shandong University of Science and Technology
Current assignee: Shandong University of Science and Technology
Priority date: 2018-10-24
Filing date: 2018-10-24
Publication date: 2022-11-04
Anticipated expiration: 2038-10-24
Also published as: CN109410985A

Abstract

本发明公开了一种哭声智能翻译手表，具体涉及语音智能识别技术领域。其解决了现有的哭声识别主要关注在识别小孩有没有在哭泣，并没有关注小孩为什么哭泣，不能将小孩的哭声翻译成对应的信号，便于家长及时的了解孩子的需求的不足。哭声智能翻译手表，包括声音采集器和智能翻译系统，所述声音采集器将采集的哭声信息输送至智能翻译系统，智能翻译系统利用基于组合特征的系数表示方法对声音信息进行判别认证，经过判别认证的声音信息对应的内容以语音形式输出。

Description

哭声智能翻译手表

技术领域

本发明涉及语音智能识别技术领域，具体涉及一种哭声智能翻译手表。

背景技术

小孩哭声识别系统是目前儿童护理系统当中非常关键的一个子系统，在很多企业和科研单位受到很大的关注。小孩哭声识别系统主要用于很好的识别小孩在哭及因为什么原因哭。目前主要的小孩哭声识别技术主要有：防丢失哭声求助智能手环。智能化多功能婴幼儿伴护系统，现有的哭声识别主要关注在识别小孩有没有在哭泣，并没有关注小孩为什么哭泣，不能将小孩的哭声翻译成对应的信号，便于家长及时的了解孩子的需求。

发明内容

本发明的目的是针对上述不足，提出了一种基于智能翻译系统对哭声声音信息认证，以语音形式反馈出哭声信息表示的含义的哭声智能翻译手表。

本发明具体采用如下技术方案：

哭声智能翻译手表，包括声音采集器和智能翻译系统，所述声音采集器将采集的哭声信息输送至智能翻译系统，智能翻译系统利用基于组合特征的系数表示方法对声音信息进行判别认证，经过判别认证的声音信息对应的内容以语音形式输出。

优选地，所述基于组合特征的系数表示方法包括稀疏编码方法，该方法以声音采集器采集的哭声信息为测试样本；

设定非线性特征映射函数，Φ(.):R^q→R^Q(q＜＜Q)该函数将测试样本x和扩展原型集

按照式(1)映射到高维特征空间

x→Φ(x) (1)

将SRC中使用的原始特征定义为测试样本的“线性特征”，基于核函数的SRC使用的高维特征作为测试样本的“非线性特征”；将原始线性特征和非线性特征按照式(2)结合起来

其中，

是测试样板的线性特征，

是测试样本的非线性特征，Z是新的原型集，z是新的测试样本；将稀疏编码的优化问题表述为式(3)

另

是核矩阵，K采用式(4)进行计算

在将非线性特征变换到低维空间之后，组合特征矩阵采用式(5)表示

其中，d是伪变换矩阵K的保留维数，根据式(6)提出组合-多特征模型

其中F_com表示组合特征，F1，F2，...，Fv表示等待组合的v特征，w1，w2，...，wv是加权值和

表示样本的第v个特征中的所有点的平方的总和。

优选地，取线性特征和非线性特征的贡献相同，即w1和w2都为0.5，将X和K的每一列标准化为加权为式(7)

测试样本的非线性特征也被转换为式(8)

测试样品的组合特征可以描述为式(9)

然后采用式(10)测试样本

本发明具有如下有益效果：

具体实施方式

下面结合具体实施例对本发明的具体实施方式做进一步说明：

SRC：(sparse representation-based classifier)基于稀疏表达的分类。

哭声智能翻译手表(哭声可以着重针对小孩的哭声)，包括声音采集器和智能翻译系统，所述声音采集器将采集的哭声信息输送至智能翻译系统，智能翻译系统利用基于组合特征的系数表示方法对声音信息进行判别认证，经过判别认证的声音信息对应的内容以语音形式输出。

基于组合特征的系数表示方法包括稀疏编码方法，该以声音采集器采集的哭声信息为测试样本，在算法部分，测试样本可以为若干5秒左右(或者10s左右)的声音片断作为一个样本。

测试样本包括两部分数据：实施采集的数据x和预先采集的数据

实施采集数据是实施采集出手环旁边的声音，然后使用分类方法去判断这个声音是不是小孩哭声是那种类型的哭声(例如饿了、困了、厌烦了或者身体不舒服等)。

预先采集的数据(就是手环生产前采集的训练数据)

X_c这个大字母里面有很多小字母，也就是有很多样本，样本个数是N_c(c＝1,2，3，4，5),c＝1代表是小孩没有哭，c＝2代表是小孩饿了的哭声c＝3代表小孩困了的哭声c＝4代表小孩烦了的哭声c＝5代表小孩身体不舒服的哭声，X_c里面的声音样本是提前采集好的可以有很多也就是N_c可以有很多，(例如100或者300等)一般来说N_c越大识别精度越高不过计算量也会增加。

分类方法最后会输出一个类标，即返回一个数值c＝1？2？3？4？5？代表不同种类的哭声。

系数表示(SRC)仅使用原型集来解决线性问题，但是测试样本不容易被数据集线性编码。因此，基于核函数的稀疏表示使用原型集的非线性特征来对测试样本进行分类，设定非线性特征映射函数，Φ(.):R^q→R^Q(q＜＜Q)该函数将测试样本x和扩展原型集