CN112749295A

CN112749295A - 一种基于交叉对比神经网络的心音录音分类技术

Info

Publication number: CN112749295A
Application number: CN201911057340.7A
Authority: CN
Inventors: 赵子轩; 陈颖; 葛云; 黄晓林
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2019-10-31
Filing date: 2019-10-31
Publication date: 2021-05-04

Abstract

本发明公布了一种基于交叉对比神经网络的心音录音分类技术。本发明根据手机录音的性质，在原始数据集的基础上，通过模拟录音效果以及一维信号到二维图像的转化，建立了一个全新的心音时频图数据集，并应用交叉对比神经网络的模型进行分类。该神经网络的卷积层经过训练，能够提取出心音时频图中的特征，随后在这些特征上引入IBS模型与两两交叉对比的方法，根据其统计信息计算两张图片的相似性，进而判断所属类别，实现疾病的筛查，在手机录音的心音上取得了较高的分类准确率。

Description

一种基于交叉对比神经网络的心音录音分类技术

技术领域

本发明涉及信号处理、深度学习、卷积神经网络和IBS统计分析理论在心音信号分类方向的应用。

背景技术

心血管疾病已是我国居民致死疾病中占比最高的疾病，因此对心音的研究一直受到医学领域与信号分析领域的重视，尤其是借助计算机技术进行心音的智能分析与诊断，是现今的一个研究热点，该方法能够实现疾病的早期筛查，减轻医护人员的工作量。另一方面，与心电、脑电等生理信号不同，心音信号可以通过手机录音直接获取，是一种实时的、低成本的疾病监测方式，因此基于手机录音实现心脏疾病的智能诊断，具有很高的研究价值。

本发明中使用的卷积神经网络，在计算机视觉领域显示出了优越的性能，在各项比赛与研究中取得了显著的效果，而采用将心音信号转化为二维频谱图像的方式，便能够在心音分类上应用这种技术。同时，为了进一步提升网络对于图片的分类识别能力，引入了统计学上的IBS模型，通过对卷积层提取出的纹理特征进行交叉对比，判断两幅图像是否属于同一类，以实现图片的类别判断。

发明内容

本发明的目的在于通过手机录音功能采集到的心音信号，判断使用者是否存在心脏疾病，为此提出了一种训练神经网络的方法，以及通过该神经网络进行心音分类的方法，能够在手机采集的心音数据上达到优秀的分类效果。

本发明解决问题所采用的方案分为四个部分：第一，建立训练神经网络所需的心音数据集。此部分在一个公开的心音数据集基础上，设计了一个能够模拟手机麦克风频率响应的滤波器，将原始心音数据通过该滤波器后再随机叠加一段录音噪声，以生成与手机录音效果相似的数据集。第二，将一维的心音信号通过短时傅里叶变换转化为二维的频域图像，这样便可以在这些图像上应用卷积神经网络。第三，卷积神经网络，该部分用于提取输入图像的特征。第四，引入IBS模型并分类，该部分对各个卷积滤波器提取到的特征图进行进一步的统计，将特征图中大于一定阈值的区域个数占比作为该卷积滤波器所提取到的特征概率，通过将特征概率的排序结果带入IBS公式，计算两幅图片的相似性，判断是否属于同一类别。在此四部分基础上，进行神经网络的训练与预测。

附图说明

图1是模拟手机麦克风设计的滤波器的频率响应曲线

图2是由心音信号转化的二维频域图像

图3是卷积神经网络层的结构图

图4是该网络的训练流程图

图5是该网络的预测流程图

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面结合附图和具体实例对本发明进行详细的描述。

先描述本发明的各个模块及具体实现，再结合实例具体描述训练和预测步骤分别如何使用这些模块。

第一，建立训练所需的心音数据集。本发明中使用的数据集基于Physionet网站提供的公开心音数据集，但考虑到实际上使用该网络时，需要判断的是手机录音得到的心音，其与数据集的信号存在一定的差别，为了使网络对于手机心音录音有更好的适应性，需要对原始数据集进行处理。与自然心音信号相比，由于手机麦克风传感器存在着对低频段信号的抑制，因此首先需要模拟这种抑制的效果。图1是模拟手机麦克风的低频抑制效果设计的滤波器的频率响应曲线，由图可知，将原始信号通过该滤波器后会使信号中50Hz以下的分量被削弱。另一方面，手机录音中或多或少存在着环境噪声，为增强神经网络对于噪声的抗干扰能力，在原始信号通过上述滤波器后，需要再叠加一段噪声以进一步模拟录音效果，此处的噪声为一组事先录好的手机录音底噪，合成时从中随机抽取一条，并乘以一个在0.7至1.3间随机变动的系数以保证其随机性，然后将噪声与信号叠加。最后将这些信号统一处理为30秒的长度，即不足30秒的信号做拼接，多余30秒的信号则做剪裁，得到新的数据集。

第二，将一维的心音信号转化为二维的频域图像，便于后续卷积神经网络做提取特征。二维图像的转换通过短时傅里叶变换实现，该方法是信号分析中的一种常用方法，意在显示信号频域随时间变化的情况。本发明使用的数据集中心音信号的采样频率为2000Hz，即每秒的信号存在2000个点，据此选取512点的短时傅里叶变换窗口，每两个窗口间有256个点的混叠。对每个窗口中的信号做傅里叶变换，得到其频域分量，并将这些傅里叶变换序列按时间顺序拼接，得到心音信号的频域二维图像，如图2所示。

第三，卷积神经网络。对图像的分类实则是对图像特征的分类，而卷积神经网络能够提取图像的纹理特征，因此被使用在本发明中用作特征提取。该卷积神经网络的结构包含9个卷积层和3个池化层，如图3所示。其中，卷积层的卷积滤波器大小为3x3，其作用为通过卷积运算提取与自身参数相关性较高的特征以生成特征图；池化层的大小为2x2，作用是取该2_x2区域中特征的最大值，即将最明显的特征保留下来。卷积神经网络模块随着层数的加深，滤波器个数随之增加，其9个卷积层中滤波器个数的递进关系为，前两层64个，接下来的两层128个，再接下来的四层256个，最后一层512个。通过不断增加滤波器的个数可以提取出更多的高维特征，最后一层的512个滤波器会输出512张特征图，这是接下来IBS模型的分类依据。

第四，IBS模块。得到上一步骤的特征图输出后，借助IBS模型进行进一步的处理与分类。IBS模型根据两张图片中各个特征的出现概率来衡量两者的相似程度，这里的概率指的是对于某个卷积滤波器，其输出特征图中大于某特定阈值的区域数在总区域数中的占比。

IBS的计算公式如下：

F_i＝[-p1_ilog(p1_i)-p2_ilog(p2_i)]/Z

其中，N为滤波器的个数，此处为512；pl_i，p2_i分别为两幅图像的第i个卷积滤波器的概率值；R1_i，R2_i分别为两幅图像第i个滤波器的概率值在全部概率值中的降序排序值。由该公式可知，当两幅图像的某一特征概率值在所有概率值中的排序位置相近时，IBS将趋于0，即代表两幅图像相似。而两幅图像不相似时，IBS无法给出其上限，因此出于对网络稳定性的考虑，将IBS公式修改为ModifiedIBS，公式如下：

RevIBS＝IBS(random(p1_i)，random(p2_i))

该优化公式引入了IBS的参考上限RevIBS，优化后的IBS取值在0至1之间。具体做法为将两幅图像的特征概率序列分别随机打乱，认为此时的两个特征概率序列是一种及其不相似的状态，接着对其计算IBS值，根据这个RevIBS值和原始IBS值，按照上述公式计算出ModifiedIBS。

以上为该发明的各个功能模块，在使用时通常分为训练与预测两个步骤。

训练步骤，通过设置优化目标，用数据训练卷积神经网络层，不断更新迭代卷积滤波器的参数，具体如图4所示。首先，对网络参数进行初始化，随后，每次输入两幅图像，提取各自的特征并计算ModifiedIBS。随着两幅图像送入网络的还有它们的标签(label)，当两幅图像属于同一类时，label为0，反之则为1，代入计算损失函数如下，使损失函数最小化便是要优化的目标：

loss＝-label*log(MIBS)-(1-label)*log(1-MIBS)

使损失函数最小化的做法是，求出该损失函数对各滤波器参数的梯度，然后向着负梯度方向进行参数的更新。整个训练步骤通过不断输入训练集中的成对的图像重复上述过程，直到损失函数收敛，训练完毕，此时的网络参数便是预测时需要的参数。

预测步骤，在训练步骤得到的网络的基础上，预测时只需将待预测图片输入网络，用它提取出的特征与已知某一类别的多张图像进行比较，判断其是否属于同一类。设某类图像的总个数为N_i，其中有n_i张与待预测图像被分为了同一类，则待预测图片为这类的概率由以下公式计算：

其中，m为总的类别数，此处为2，i为其中某一类。最后，概率值较大的那个类别即为该图片最终的预测类别。

应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施方式中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明，它们并非用以限制本发明的保护范围，凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

Claims

1.本发明公开了一种基于交叉对比神经网络进行心音录音分类的技术，其特征在于模拟手机麦克风效果生成心音录音，并通过交叉对比神经网络进行训练，利用得到的网络模型进行心音录音的分类。

2.根据权利要求1所述的一种基于交叉对比神经网络进行心音录音分类的技术，其特征在于模拟手机麦克风的频率响应对纯净的心音数据库进行滤波转换，并叠加随机的噪声以产生与手机录音质量相仿的心音信号。

3.根据权利要求1所述的一种基于交叉对比神经网络进行心音录音分类的技术，其特征在于利用短时傅里叶变换将心音信号转化为频域二维图像，通过交叉对比神经网络判断是否存在疾病。

4.根据权利要求1所述的一种基于交叉对比神经网络进行心音录音分类的技术，其特征在于能够通过手机录音得到的心音文件来判断是否存在疾病。