CN108742602A

CN108742602A - 一种基于脑电波的结巴检测方法

Info

Publication number: CN108742602A
Application number: CN201810254915.3A
Authority: CN
Inventors: 蒋阳波
Original assignee: Schoolpal Online Hangzhou Technology Co ltd
Current assignee: Schoolpal Online Hangzhou Technology Co ltd
Priority date: 2018-03-26
Filing date: 2018-03-26
Publication date: 2018-11-06

Abstract

本发明公开了一种基于脑电波的结巴检测方法。它包括训练阶段和评测阶段，所述的训练阶段指的是：运用脑电波信号，利用深度学习技术来训练音频流利度、重复性的特征提取模型，根据特征提取模型提取特征，最终训练得到结巴评测模型；所述的评测阶段指的是：脑电波传感器获取脑电波信号，提取音频流利度、重复性的特征，利用结巴评测模型对音频进行结巴检测。本发明的有益效果是：运行脑电波检测、信号处理技术和机器学习方法，实现了对测试者的语音进行准确、自动的结巴评测。

Description

一种基于脑电波的结巴检测方法

技术领域

本发明涉及机器学习相关技术领域，尤其是指一种基于脑电波的结巴检测方法。

背景技术

结巴是一种言语障碍，表现在言语上的反复犹豫或停顿和某些语音的拖长。结巴给人们造成很大的困扰，对生活、工作、学习造成不利的影响，及时的发现结巴和对结巴的治疗，可以很大的改善结巴。对结巴的检测，当前主要靠医生的检测。自动的结巴检测对于结巴的及时发现和治疗尤其重要。随着现代科学技术的发展，脑电波技术的发展进入快车道，在新的领域应用越来越多。

发明内容

本发明是为了克服现有技术中存在上述的不足，提供了一种能够自动评测结巴的基于脑电波的结巴检测方法。

为了实现上述目的，本发明采用以下技术方案：

一种基于脑电波的结巴检测方法，包括训练阶段和评测阶段，所述的训练阶段指的是：运用脑电波信号，利用深度学习技术来训练音频流利度、重复性的特征提取模型，根据特征提取模型提取特征，最终训练得到结巴评测模型；所述的评测阶段指的是：脑电波传感器获取脑电波信号，提取音频流利度、重复性的特征，利用结巴评测模型对音频进行结巴检测。

本发明提出了结巴自动评测方法，通过采集使用者的脑电波信号，通过深度学习算法提取有关说话的流利度、重复性的特征，在结巴评测模型上进行打分，得到最终的结巴评测得分。本发明运行脑电波检测、信号处理技术和机器学习方法，实现了对测试者的语音进行准确、自动的结巴评测。

作为优选，所述的训练阶段步骤如下：

(1)数据收集和标注，建立脑电波信号语料、结巴语料库及标注文件；脑电波传感器检测人脑，每次将采集得到脑电波原始信号转换为脑电波数字信号；同时录制音频文件，人工对音频文件进行听音，对对应脑电波信号文件标注相应音频流利度、重复性的人工打分文件；设定音频流利度分为五个等级，音频重复性分为五个等级，其中五个等级分别对应的数值为0、1、2、3、4；

(2)利用信号处理算法处理脑电波数字信号，得到频谱信号；具体流程如下：将脑电波数字信号进行分段处理，对每一段信号利用快速傅里叶变换得到频域信号，对频域信号提取功率谱，最后对功率谱进行Log变换，得到Log功率谱，即频谱信号；

(3)运用频谱信号及步骤(1)标注的包含音频流利度、重复性的人工打分文本，利用深度学习模型训练音频流利度、重复性的特征模型，同时利用深度学习模型对频谱信号提取特征；

(4)利用训练得到的特征模型对脑电波数字信号提取有关结巴的音频流利度、重复性的特征得分，并根据线性回归算法训练最终的结巴评测模型。

作为优选，在步骤(2)中，分段处理方式具体为：每段长度为1s，每段处理完毕，向后移动0.5s，相邻两段之间会有0.5s重叠，重复处理，直到处理完毕；快速傅里叶变换是离散傅里叶变换的快速算法。

作为优选，在步骤(3)中，所述的深度学习模型包括深度神经网络、卷积神经网络和循环神经网络；深度学习是机器学习的分支，是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法，提取的特征包括音频流利度、重复性，这些特征是深度学习算法自动学习得到，之后对脑电波信号相应的时间片段上进行标注即可。

作为优选，在步骤(4)中，设定音频流利度分为五个等级，音频重复性分为五个等级，其中五个等级分别对应的数值为0、1、2、3、4，线性回归算法公式如下：Y＝AX+b，该公式是向量形式，其中，Y是最终得分，A和b是口语打分模型参数，A是矢量，b是标量，X是提取的特征向量。

作为优选，所述的评测阶段步骤如下：

(a)脑电波传感器检测人脑，每次将采集得到脑电波原始信号转换为脑电波数字信号；

(b)利用信号处理算法处理脑电波数字信号，得到频谱信号，将脑电波数字信号进行分段处理，对每一段信号利用快速傅里叶变换得到频域信号，对频域信号提取功率谱，最后对功率谱进行Log变换；

(c)根据训练得到的深度学习模型，对频谱信号提取音频流利度、重复性的特征；

(d)利用训练得到的结巴评测模型，并根据提取的特征对音频进行结巴评测。

作为优选，在步骤(b)中，分段处理方式具体为：每段长度为1s，每段处理完毕，向后移动0.5s，相邻两段之间会有0.5s重叠，重复处理，直到处理完毕；快速傅里叶变换是离散傅里叶变换的快速算法。

本发明的有益效果是：运行脑电波检测、信号处理技术和机器学习方法，实现了对测试者的语音进行准确、自动的结巴评测。

具体实施方式

下面结合具体实施方式对本发明做进一步的描述。

其中：训练阶段步骤如下：

(2)利用信号处理算法处理脑电波数字信号，得到频谱信号；具体流程如下：将脑电波数字信号进行分段处理，对每一段信号利用快速傅里叶变换得到频域信号，对频域信号提取功率谱，最后对功率谱进行Log变换，得到Log功率谱，即频谱信号；分段处理方式具体为：每段长度为1s，每段处理完毕，向后移动0.5s，相邻两段之间会有0.5s重叠，重复处理，直到处理完毕；快速傅里叶变换是离散傅里叶变换的快速算法；

(3)运用频谱信号及步骤(1)标注的包含音频流利度、重复性的人工打分文本，利用深度学习模型训练音频流利度、重复性的特征模型，同时利用深度学习模型对频谱信号提取特征；深度学习模型包括深度神经网络、卷积神经网络和循环神经网络；深度学习是机器学习的分支，是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法，提取的特征包括音频流利度、重复性，这些特征是深度学习算法自动学习得到，之后对脑电波信号相应的时间片段上进行标注即可；

(4)利用训练得到的特征模型对脑电波数字信号提取有关结巴的音频流利度、重复性的特征得分，并根据线性回归算法训练最终的结巴评测模型；其中：设定音频流利度分为五个等级，音频重复性分为五个等级，其中五个等级分别对应的数值为0、1、2、3、4，线性回归算法公式如下：Y＝AX+b，该公式是向量形式，其中，Y是最终得分，A和b是口语打分模型参数，A是矢量，b是标量，X是提取的特征向量。

评测阶段步骤如下：

(b)利用信号处理算法处理脑电波数字信号，得到频谱信号，将脑电波数字信号进行分段处理，对每一段信号利用快速傅里叶变换得到频域信号，对频域信号提取功率谱，最后对功率谱进行Log变换；分段处理方式具体为：每段长度为1s，每段处理完毕，向后移动0.5s，相邻两段之间会有0.5s重叠，重复处理，直到处理完毕；快速傅里叶变换是离散傅里叶变换的快速算法；

Claims

1.一种基于脑电波的结巴检测方法，其特征是，包括训练阶段和评测阶段，所述的训练阶段指的是：运用脑电波信号，利用深度学习技术来训练音频流利度、重复性的特征提取模型，根据特征提取模型提取特征，最终训练得到结巴评测模型；所述的评测阶段指的是：脑电波传感器获取脑电波信号，提取音频流利度、重复性的特征，利用结巴评测模型对音频进行结巴检测。

2.根据权利要求1所述的一种基于脑电波的结巴检测方法，其特征是，所述的训练阶段步骤如下：

3.根据权利要求2所述的一种基于脑电波的结巴检测方法，其特征是，在步骤(2)中，分段处理方式具体为：每段长度为1s，每段处理完毕，向后移动0.5s，相邻两段之间会有0.5s重叠，重复处理，直到处理完毕；快速傅里叶变换是离散傅里叶变换的快速算法。

4.根据权利要求2所述的一种基于脑电波的结巴检测方法，其特征是，在步骤(3)中，所述的深度学习模型包括深度神经网络、卷积神经网络和循环神经网络；深度学习是机器学习的分支，是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法，提取的特征包括音频流利度、重复性，这些特征是深度学习算法自动学习得到，之后对脑电波信号相应的时间片段上进行标注即可。

5.根据权利要求2所述的一种基于脑电波的结巴检测方法，其特征是，在步骤(4)中，设定音频流利度分为五个等级，音频重复性分为五个等级，其中五个等级分别对应的数值为0、1、2、3、4，线性回归算法公式如下：Y＝AX+b，该公式是向量形式，其中，Y是最终得分，A和b是口语打分模型参数，A是矢量，b是标量，X是提取的特征向量。

6.根据权利要求2或3或4或5所述的一种基于脑电波的结巴检测方法，其特征是，所述的评测阶段步骤如下：

7.根据权利要求6所述的一种基于脑电波的结巴检测方法，其特征是，在步骤(b)中，分段处理方式具体为：每段长度为1s，每段处理完毕，向后移动0.5s，相邻两段之间会有0.5s重叠，重复处理，直到处理完毕；快速傅里叶变换是离散傅里叶变换的快速算法。