CN112690823A - 一种识别肺部生理声音的方法以及系统 - Google Patents
一种识别肺部生理声音的方法以及系统 Download PDFInfo
- Publication number
- CN112690823A CN112690823A CN202011534490.5A CN202011534490A CN112690823A CN 112690823 A CN112690823 A CN 112690823A CN 202011534490 A CN202011534490 A CN 202011534490A CN 112690823 A CN112690823 A CN 112690823A
- Authority
- CN
- China
- Prior art keywords
- neural network
- lung
- classification model
- recurrent neural
- physiological sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B7/00—Instruments for auscultation
- A61B7/02—Stethoscopes
- A61B7/04—Electric stethoscopes
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B7/00—Instruments for auscultation
- A61B7/003—Detecting lung or respiration noise
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Biomedical Technology (AREA)
- Heart & Thoracic Surgery (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Acoustics & Sound (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Physics & Mathematics (AREA)
- Pulmonology (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
本发明提供了一种用于识别肺部生理声音的方法,所述方法包括;通过音频采集器获得肺部生理声音基础大数据集;建立循环神经网络分类模型,使用所述肺部生理声音基础大数据集训练所述循环神经网络分类模型;通过音频采集器采集至少一条肺部生理声音数据,并输入经过训练的所述循环神经网络分类模型;输出并展示所述循环神经网络分类模型的分类结果。本发明利用计算机科学人工智能深度学习大数据分析的方法来对肺部生理声音数据进行处理和分类,为进一步判断测试者的肺部生理状态提供中间数据依据和决策支持。本发明能够准确识别特征性的肺部生理声音,并且能够排除杂讯。
Description
技术领域
本发明涉及一种用于识别肺部生理声音的方法,特别针对一种提取与分类肺部生理声音特征的方法。本发明也涉及一种用于识别肺部生理声音的系统。
背景技术
祖国传统医学的方法是根据望闻问切,闻靠的是,经咳嗽的声音去判定疾病的所在和种类,听是靠听诊的办法,在现代医学通过听诊器听呼吸音、咳喘音来辨别疾病的辅助判断,这些方法广泛应用于各个医院。不足之处就在于,鉴于医生的经验和水平的不同,因而对判断的准确度而不同。现有技术因医疗资源的匮乏和紧缺以及现有医院层次级别不同,医生技术水准经验的不同,而缺少大数据的支持和判断,容易产生误诊误治、漏诊,耽搁疾病的判断。
随着现代医学的发展,计算机技术进入医学领域,包括计算机断层、核磁共振、造影技术,给医学带来了翻天覆地的变化。
AI机器学习在2016年3月及2017年5月分别以4:1和3:0在首尔战胜李世石与乌镇战胜9段棋手柯洁。人工智能技术于2017年在视觉分辨超越人类,进而在人脸识别等从视觉分辨超越人的视觉。并开始应用于医学判断和健康康复事业,随之而来的是声音的分辩,在听力声音辨别的应用,通过人工智能的技术、机器学习。AI对声音的判断,已经在很大的程度上超过了临床医生判断的水准。其中,IBM用Watson经过4年深度学习200本肿瘤教课书,290种医学期刊和1500万份文献和肿瘤科判定肿瘤的疾病判断上,已经有人工智能在医学影像超过临床医生的报道。冠状CT也会为临床医生提供更加准确的冠状动脉造影前期的筛查检查,并帮助医生做出临床判断。
中国发明授权专利(CN106251880B)公开了一种识别生理声音的系统包括接收模块,特征识别模块,分类器以及比较模块。一种识别生理声音的方法包括一接收生理声音的接收模块;用于提取至少一种生理声音的特征识别模块;分类至少一特征同时识别至少一种种类的分类器;使用比较模块对比正常生理声音以及异常生理声音中至少一种类别以评估疾病风险。上述识别生理声音的方法以及系统可以精确地识别特殊的生理声音同时排除杂讯。
然而,上述专利技术主要针对心脏声音进行处理和判断,并且具体使用的算法的分类精确程度也有待提高。
发明内容
本发明的目的是通过以下技术方案实现的。
为解决现有传统医学闻诊和西医听诊的方法和不足,本发明利用计算机科学人工智能深度学习大数据分析的方法来对肺部生理声音数据进行处理和分类,为进一步判断测试者的肺部生理状态提供中间数据依据和决策支持。
本申请第一方面实施例提出了一种用于识别肺部生理声音的方法,所述方法包括;
通过音频采集器获得肺部生理声音基础大数据集;
建立循环神经网络分类模型,使用所述肺部生理声音基础大数据集训练所述循环神经网络分类模型;
通过音频采集器采集至少一条肺部生理声音数据,并输入经过训练的所述循环神经网络分类模型;
输出并展示所述循环神经网络分类模型的分类结果。
在本发明的一个实施例中,在通过音频采集器获得肺部生理声音基础大数据集之后,进一步包括:
对所述肺部生理声音基础大数据集进行频谱分析和云图匹配,并抽取所述肺部生理声音基础大数据集中的每个音频数据的梅尔倒谱系数和音高。
在本发明的一个实施例中,所述梅尔倒谱系数的抽取过程如下:对每个音频数据依次进行预加重、分帧、加窗、快速傅立叶变换、梅尔滤波器组、对数运算和离散余弦变换,得到梅尔倒谱系数。
在本发明的一个实施例中,所述循环神经网络分类模型采用循环神经网络对音频信息以及被采集人信息进行建模,并对循环神经网络的最后一个时间步的输出使用Softmax函数获得循环神经网络对不同肺部生理声音的判断概率值,其中使用交叉熵函数作为损失函数。
在本发明的一个实施例中,所述交叉熵函数的公式如下:
其中:K是需要判别的肺部生理声音种类数量;y为肺部生理声音标签,p是循环神经网络的输出,pi为循环神经网络分类模型判断该样本类别是i的概率。
在本发明的一个实施例中,所述循环神经网络分类模型的训练通过反向传播算法进行。
在本发明的一个实施例中,所述反向传播算法由输入层、输出层、隐层构成,分为正向传播阶段和反向传播阶段;在正向传播阶段,将学习样本的输入信息输入前馈网络的输入层,输入层单元接收到输入信号,计算权重,然后根据神经元的激活函数将信息传到隐层进行计算;同样,将隐层的输出作为输出层的输入,并得到最后的结果;在反向传播阶段,将前馈网络的实际输出与期望输出相比较,如果误差不满足要求,将误差向后传播,即从输出层到输入层逐层求误差,然后相应地修改权值。
本申请第二方面的实施例提供了一种用于识别肺部生理声音的装置,所述装置包括:
基础数据采集模块,用于通过音频采集器获得肺部生理声音基础大数据集;
模型建立及训练模块,用于建立循环神经网络分类模型,使用所述肺部生理声音基础大数据集训练所述循环神经网络分类模型;
待识别数据采集模块,用于通过音频采集器采集至少一条肺部生理声音数据,并输入经过训练的所述循环神经网络分类模型;
输出及展示模块,用于输出并展示所述循环神经网络分类模型的分类结果。
本申请第三方面的实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序以实现上述第一方面所述的方法。
本申请第四方面的实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行实现上述第一方面所述的方法。
本发明的优点在于:识别肺部生理声音的系统以及方法能够准确识别特征性的肺部生理声音,并且能够排除杂讯。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
附图1示出了根据本发明实施方式的一种用于识别肺部生理声音的方法流程图。
附图2示出了根据本发明实施方式的梅尔倒谱系数的提取过程示意图。
附图3示出了根据本发明实施方式的循环神经网络分类模型示意图。
附图4示出了根据本发明实施方式的反向传播算法示意图。
附图5示出了根据本发明实施方式的一种用于识别肺部生理声音的系统结构图。
附图6示出了本发明一实施例所提供的一种电子设备的结构示意图;
附图7示出了本发明一实施例所提供的一种存储介质的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明利用人工智能技术在听觉的分辨上的辅助判断。人工智能能够更加准确地识别呼吸的声音、咳嗽的声音,采集大量以炎性爆发为特点的肺水肿纤维化病人呼吸音和咳嗽声。通过10万次的训练,用循环神经网络(Recurrent neural network),把呼吸声音当作一条序列放进写入建模,来积累大数据人群的不同,找出其共性,对肺部生理声音进行分类和识别。
如图1所示,本发明的一种用于识别肺部生理声音的方法,包括如下步骤:
S1、通过音频采集器获得肺部生理声音基础大数据集。
在这个步骤中,所述音频采集器例如可以是拾音器。肺部生理声音包括呼吸音、咳嗽音等。例如,可以通过拾音器获得至少上万例的正常人、肺部病人的呼吸音、咳嗽声的记录,组成肺部生理声音基础大数据集。对上述肺部生理声音基础大数据集进行频谱分析和云图匹配,作为初步的数据处理过程。
为了方便后续用于模型的训练学习,本发明在步骤S1后可以进一步抽取音频的梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficients)、音高(Pitch)等特征。其中,梅尔倒谱系数可以很好地捕捉到音频中人耳敏感的声音特征,并且对于通过呼吸和咳嗽声来判断疾病这一问题,音高是一个强有效,并且容易抽取的音频特征。
如图2所示,梅尔倒谱系数的提取过程如下:对基本音频依次进行预加重、分帧、加窗、快速傅立叶变换(FFT)、梅尔滤波器组、对数运算和离散余弦变换(DCT),得到梅尔倒谱系数。
S2、建立循环神经网络分类模型,使用所述肺部生理声音基础大数据集训练所述循环神经网络分类模型。这个步骤进一步包括两个步骤:
S21、建立循环神经网络分类模型。所述循环神经网络分类模型采用了循环神经网络(Recurrent Neural Network)对音频信息以及被采集人信息进行建模,并对RNN的最后一个时间步的输出使用Softmax函数获得网络对不同肺部生理声音的判断概率值,最后使用了交叉熵函数(Cross Entropy)作为损失函数。
如图3所示,为本发明建立的循环神经网络分类模型结构,将梅尔倒谱系数、音高作为音频特征,结合被采集人基本信息输入循环神经网络,经输出层输出多分类交叉熵并标记标签。其中,多分类交叉熵函数公式如下:
其中:
K是需要判别的肺部生理声音种类数量。
y为医护人员判别的肺部生理声音标签,如果类别是i,则yi等于1,否则等于0。
p是神经网络的输出,pi为模型判断该样本类别是i的概率。
S22、使用所述肺部生理声音基础大数据集训练所述循环神经网络分类模型。
数据方面,本发明大约需要300小时的音频数据,能够将所述循环神经网络分类模型训练收敛,取得可信的判别结果。
模型方面,本发明采用了神经网络,网络通过对数据训练,并在收敛后,用于肺部生理声音的判别。网络的训练通过反向传播算法(Back Propagation)。反向传播算法采用广义的学习规则,是一种有监督的学习算法。它是一种无反馈的前向网络,由输入层、输出层、隐层构成,如图4所示。它分两个阶段:正向传播阶段和反向传播阶段。正向传播阶段,将学习样本的输入信息输入前馈网络的输入层,输入层单元接收到输入信号,计算权重,然后根据神经元的激活函数将信息传到隐层(1层或2层)进行计算。同样,将隐层的输出作为输出层的输入,并得到最后的结果。反向传播阶段,将前馈网络的实际输出与期望输出相比较,如果误差不满足要求,将误差向后传播,即从输出层到输入层逐层求误差(实际上是等效误差),然后相应地修改权值。
S3、通过音频采集器采集至少一条肺部生理声音数据,并输入经过训练的所述循环神经网络分类模型。
医护人员可以通过手机、录音笔等音频采集器或者拾音器采集普通人或者病患的五到十秒钟的呼吸和咳嗽声,作为一条肺部生理声音数据。并通过通信网络上传到服务器或者云端,以输入经过训练的所述循环神经网络分类模型。
S4、输出并展示所述循环神经网络分类模型的分类结果。
模型输入音频特征数据以及被采集人的基本信息,输出需要判断的每个肺部生理声音类型的概率,将模型获得的结果传输到例如手机终端APP进行展示。
本发明的肺部生理声音分类和识别方法,能够帮助基层医院、诊所、铁路、车站、飞机场进行初步筛查。
申请第二个实施例提供了一种用于识别肺部生理声音的系统,该系统用于执行上述实施例所述的用于识别肺部生理声音的方法,如图5所示,该系统包括;
基础数据采集模块501,用于通过音频采集器获得肺部生理声音基础大数据集。
在这个模块中,所述音频采集器例如可以是拾音器。肺部生理声音包括呼吸音、咳嗽音等。例如,可以通过拾音器获得至少上万例的正常人、肺部病人的呼吸音、咳嗽声的记录,组成肺部生理声音基础大数据集。对上述肺部生理声音基础大数据集进行频谱分析和云图匹配,作为初步的数据处理过程。
为了方便后续用于模型的训练学习,本发明可以进一步抽取音频的梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficients)、音高(Pitch)等特征。其中,梅尔倒谱系数可以很好地捕捉到音频中人耳敏感的声音特征,并且对于通过呼吸和咳嗽声来判断疾病这一问题,音高是一个强有效,并且容易抽取的音频特征。
梅尔倒谱系数的提取过程如下:对基本音频依次进行预加重、分帧、加窗、快速傅立叶变换(FFT)、梅尔滤波器组、对数运算和离散余弦变换(DCT),得到梅尔倒谱系数。
模型建立及训练模块502,用于建立循环神经网络分类模型,使用所述肺部生理声音基础大数据集训练所述循环神经网络分类模型。这个模块进一步包括两个步骤:
模型建立单元,用于建立循环神经网络分类模型。所述循环神经网络分类模型采用了循环神经网络(Recurrent Neural Network)对音频信息以及被采集人信息进行建模,并对RNN的最后一个时间步的输出使用Softmax函数获得网络对不同肺部生理声音的判断概率值,最后使用了交叉熵函数(Cross Entropy)作为损失函数。
本发明建立的循环神经网络分类模型结构,将梅尔倒谱系数、音高作为音频特征,结合被采集人基本信息输入循环神经网络,经输出层输出多分类交叉熵并标记标签。其中,多分类交叉熵函数公式如下:
其中,K是需要判别的肺部生理声音种类数量。y为医护人员判别的肺部生理声音标签,如果类别是i,则yi等于1,否则等于0。p是神经网络的输出,pi为模型判断该样本类别是i的概率。
模型训练单元,用于使用所述肺部生理声音基础大数据集训练所述循环神经网络分类模型。
数据方面,本发明大约需要300小时的音频数据,能够将所述循环神经网络分类模型训练收敛,取得可信的判别结果。
模型方面,本发明采用了神经网络,网络通过对数据训练,并在收敛后,用于肺部生理声音的判别。网络的训练通过反向传播算法(Back Propagation)。反向传播算法采用广义的学习规则,是一种有监督的学习算法。它是一种无反馈的前向网络,由输入层、输出层、隐层构成。它分两个阶段:正向传播阶段和反向传播阶段。正向传播阶段,将学习样本的输入信息输入前馈网络的输入层,输入层单元接收到输入信号,计算权重,然后根据神经元的激活函数将信息传到隐层(1层或2层)进行计算。同样,将隐层的输出作为输出层的输入,并得到最后的结果。反向传播阶段,将前馈网络的实际输出与期望输出相比较,如果误差不满足要求,将误差向后传播,即从输出层到输入层逐层求误差(实际上是等效误差),然后相应地修改权值。
待识别数据采集模块503,用于通过音频采集器采集至少一条肺部生理声音数据,并输入经过训练的所述循环神经网络分类模型。
医护人员可以通过手机、录音笔等音频采集器或者拾音器采集普通人或者病患的五到十秒钟的呼吸和咳嗽声,作为一条肺部生理声音数据。并通过通信网络上传到服务器或者云端,以输入经过训练的所述循环神经网络分类模型。
输出及展示模块504,用于输出并展示所述循环神经网络分类模型的分类结果。
模型输入音频特征数据以及被采集人的基本信息,输出需要判断的每个肺部生理声音类型的概率,将模型获得的结果传输到例如手机终端APP进行展示。
本发明的肺部生理声音分类和识别系统,能够帮助基层医院、诊所、铁路、车站、飞机场进行初步筛查。
本申请的上述实施例提供的用于识别肺部生理声音的系统与本申请实施例提供的用于识别肺部生理声音的方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。
本申请实施方式还提供一种与前述实施方式所提供的用于识别肺部生理声音的方法对应的电子设备,以执行上用于识别肺部生理声音的方法。本申请实施例不做限定。
请参考图6,其示出了本申请的一些实施方式所提供的一种电子设备的示意图。如图6所示,所述电子设备2包括:处理器200,存储器201,总线202和通信接口203,所述处理器200、通信接口203和存储器201通过总线202连接;所述存储器201中存储有可在所述处理器200上运行的计算机程序,所述处理器200运行所述计算机程序时执行本申请前述任一实施方式所提供的用于识别肺部生理声音的方法。
其中,存储器201可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口203(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
总线202可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。其中,存储器201用于存储程序,所述处理器200在接收到执行指令后,执行所述程序,前述本申请实施例任一实施方式揭示的所述用于识别肺部生理声音的方法可以应用于处理器200中,或者由处理器200实现。
处理器200可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器200可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器201,处理器200读取存储器201中的信息,结合其硬件完成上述方法的步骤。
本申请实施例提供的电子设备与本申请实施例提供的用于识别肺部生理声音的方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。
本申请实施方式还提供一种与前述实施方式所提供的用于识别肺部生理声音的方法对应的计算机可读存储介质,请参考图7,其示出的计算机可读存储介质为光盘30,其上存储有计算机程序(即程序产品),所述计算机程序在被处理器运行时,会执行前述任意实施方式所提供的用于识别肺部生理声音的方法。
需要说明的是,所述计算机可读存储介质的例子还可以包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
本申请的上述实施例提供的计算机可读存储介质与本申请实施例提供的用于识别肺部生理声音的方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备有固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本申请并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本申请实施例的虚拟机的创建装置中的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种用于识别肺部生理声音的方法,其特征在于,所述方法包括;
通过音频采集器获得肺部生理声音基础大数据集;
建立循环神经网络分类模型,使用所述肺部生理声音基础大数据集训练所述循环神经网络分类模型;
通过音频采集器采集至少一条肺部生理声音数据,并输入经过训练的所述循环神经网络分类模型;
输出并展示所述循环神经网络分类模型的分类结果。
2.根据权利要求1所述的方法,其特征在于,
在通过音频采集器获得肺部生理声音基础大数据集之后,进一步包括:
对所述肺部生理声音基础大数据集进行频谱分析和云图匹配,并抽取所述肺部生理声音基础大数据集中的每个音频数据的梅尔倒谱系数和音高。
3.根据权利要求2所述的方法,其特征在于,
所述梅尔倒谱系数的抽取过程如下:对每个音频数据依次进行预加重、分帧、加窗、快速傅立叶变换、梅尔滤波器组、对数运算和离散余弦变换,得到梅尔倒谱系数。
4.根据权利要求1所述的方法,其特征在于,
所述循环神经网络分类模型采用循环神经网络对音频信息以及被采集人信息进行建模,并对循环神经网络的最后一个时间步的输出使用Softmax函数获得循环神经网络对不同肺部生理声音的判断概率值,其中使用交叉熵函数作为损失函数。
6.根据权利要求1所述的方法,其特征在于,
所述循环神经网络分类模型的训练通过反向传播算法进行。
7.根据权利要求6所述的方法,其特征在于,
所述反向传播算法由输入层、输出层、隐层构成,分为正向传播阶段和反向传播阶段;在正向传播阶段,将学习样本的输入信息输入前馈网络的输入层,输入层单元接收到输入信号,计算权重,然后根据神经元的激活函数将信息传到隐层进行计算;同样,将隐层的输出作为输出层的输入,并得到最后的结果;在反向传播阶段,将前馈网络的实际输出与期望输出相比较,如果误差不满足要求,将误差向后传播,即从输出层到输入层逐层求误差,然后相应地修改权值。
8.一种用于识别肺部生理声音的装置,其特征在于,所述装置包括:
基础数据采集模块,用于通过音频采集器获得肺部生理声音基础大数据集;
模型建立及训练模块,用于建立循环神经网络分类模型,使用所述肺部生理声音基础大数据集训练所述循环神经网络分类模型;
待识别数据采集模块,用于通过音频采集器采集至少一条肺部生理声音数据,并输入经过训练的所述循环神经网络分类模型;
输出及展示模块,用于输出并展示所述循环神经网络分类模型的分类结果。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序以实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011534490.5A CN112690823A (zh) | 2020-12-22 | 2020-12-22 | 一种识别肺部生理声音的方法以及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011534490.5A CN112690823A (zh) | 2020-12-22 | 2020-12-22 | 一种识别肺部生理声音的方法以及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112690823A true CN112690823A (zh) | 2021-04-23 |
Family
ID=75510897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011534490.5A Pending CN112690823A (zh) | 2020-12-22 | 2020-12-22 | 一种识别肺部生理声音的方法以及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112690823A (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101276454A (zh) * | 2007-12-05 | 2008-10-01 | 中原工学院 | 基于bp神经网络的股市建模、预测及决策的方法 |
CN102054199A (zh) * | 2010-12-31 | 2011-05-11 | 中国人民解放军63983部队 | 基于bp神经网络算法对涂层老化的分析方法 |
CN102075356A (zh) * | 2010-12-31 | 2011-05-25 | 深圳市永达电子股份有限公司 | 一种网络风险评估方法与系统 |
CN107423745A (zh) * | 2017-03-27 | 2017-12-01 | 浙江工业大学 | 一种基于神经网络的鱼类活性分类方法 |
CN107888843A (zh) * | 2017-10-13 | 2018-04-06 | 深圳市迅雷网络技术有限公司 | 用户原创内容的混音方法、装置、存储介质及终端设备 |
CN108175436A (zh) * | 2017-12-28 | 2018-06-19 | 北京航空航天大学 | 一种肠鸣音智能自动识别方法 |
CN108364028A (zh) * | 2018-03-06 | 2018-08-03 | 中国科学院信息工程研究所 | 一种基于深度学习的互联网网站自动分类方法 |
US20190008475A1 (en) * | 2017-07-04 | 2019-01-10 | Tata Consultancy Services Limited | Systems and methods for detecting pulmonary abnormalities using lung sounds |
CN109394258A (zh) * | 2018-09-18 | 2019-03-01 | 平安科技(深圳)有限公司 | 一种肺部呼吸音的分类方法、装置及终端设备 |
CN110123367A (zh) * | 2019-04-04 | 2019-08-16 | 平安科技(深圳)有限公司 | 计算机设备、心音识别装置、方法、模型训练装置及存储介质 |
CN110444225A (zh) * | 2019-09-17 | 2019-11-12 | 中北大学 | 基于特征融合网络的声源目标识别方法 |
CN110755108A (zh) * | 2019-11-04 | 2020-02-07 | 合肥望闻健康科技有限公司 | 一种基于智能听诊器的心脏声音分类方法、系统、装置及可读存储介质 |
US20200046244A1 (en) * | 2018-08-08 | 2020-02-13 | Tata Consultancy Services Limited | Parallel implementation of deep neural networks for classifying heart sound signals |
CN111370025A (zh) * | 2020-02-25 | 2020-07-03 | 广州酷狗计算机科技有限公司 | 音频识别方法、装置及计算机存储介质 |
CN111938691A (zh) * | 2020-08-18 | 2020-11-17 | 中国科学院声学研究所 | 一种基础心音识别方法及设备 |
CN112017695A (zh) * | 2020-03-04 | 2020-12-01 | 上海交通大学医学院附属上海儿童医学中心 | 一种自动识别生理声音的系统及方法 |
-
2020
- 2020-12-22 CN CN202011534490.5A patent/CN112690823A/zh active Pending
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101276454A (zh) * | 2007-12-05 | 2008-10-01 | 中原工学院 | 基于bp神经网络的股市建模、预测及决策的方法 |
CN102054199A (zh) * | 2010-12-31 | 2011-05-11 | 中国人民解放军63983部队 | 基于bp神经网络算法对涂层老化的分析方法 |
CN102075356A (zh) * | 2010-12-31 | 2011-05-25 | 深圳市永达电子股份有限公司 | 一种网络风险评估方法与系统 |
CN107423745A (zh) * | 2017-03-27 | 2017-12-01 | 浙江工业大学 | 一种基于神经网络的鱼类活性分类方法 |
US20190008475A1 (en) * | 2017-07-04 | 2019-01-10 | Tata Consultancy Services Limited | Systems and methods for detecting pulmonary abnormalities using lung sounds |
CN107888843A (zh) * | 2017-10-13 | 2018-04-06 | 深圳市迅雷网络技术有限公司 | 用户原创内容的混音方法、装置、存储介质及终端设备 |
CN108175436A (zh) * | 2017-12-28 | 2018-06-19 | 北京航空航天大学 | 一种肠鸣音智能自动识别方法 |
CN108364028A (zh) * | 2018-03-06 | 2018-08-03 | 中国科学院信息工程研究所 | 一种基于深度学习的互联网网站自动分类方法 |
US20200046244A1 (en) * | 2018-08-08 | 2020-02-13 | Tata Consultancy Services Limited | Parallel implementation of deep neural networks for classifying heart sound signals |
CN109394258A (zh) * | 2018-09-18 | 2019-03-01 | 平安科技(深圳)有限公司 | 一种肺部呼吸音的分类方法、装置及终端设备 |
CN110123367A (zh) * | 2019-04-04 | 2019-08-16 | 平安科技(深圳)有限公司 | 计算机设备、心音识别装置、方法、模型训练装置及存储介质 |
CN110444225A (zh) * | 2019-09-17 | 2019-11-12 | 中北大学 | 基于特征融合网络的声源目标识别方法 |
CN110755108A (zh) * | 2019-11-04 | 2020-02-07 | 合肥望闻健康科技有限公司 | 一种基于智能听诊器的心脏声音分类方法、系统、装置及可读存储介质 |
CN111370025A (zh) * | 2020-02-25 | 2020-07-03 | 广州酷狗计算机科技有限公司 | 音频识别方法、装置及计算机存储介质 |
CN112017695A (zh) * | 2020-03-04 | 2020-12-01 | 上海交通大学医学院附属上海儿童医学中心 | 一种自动识别生理声音的系统及方法 |
CN111938691A (zh) * | 2020-08-18 | 2020-11-17 | 中国科学院声学研究所 | 一种基础心音识别方法及设备 |
Non-Patent Citations (1)
Title |
---|
桑塔努•帕塔纳亚克: "《Python人工智能项目实战》", 31 October 2019 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rocha et al. | Α respiratory sound database for the development of automated classification | |
US11864880B2 (en) | Method for analysis of cough sounds using disease signatures to diagnose respiratory diseases | |
Abeyratne et al. | Cough sound analysis can rapidly diagnose childhood pneumonia | |
Lella et al. | Automatic COVID-19 disease diagnosis using 1D convolutional neural network and augmentation with human respiratory sound based on parameters: cough, breath, and voice | |
KR102081241B1 (ko) | 환자 소리들을 처리하기 위한 방법 및 장치 | |
Mukherjee et al. | Automatic lung health screening using respiratory sounds | |
Ijaz et al. | Towards using cough for respiratory disease diagnosis by leveraging Artificial Intelligence: A survey | |
Jung et al. | Efficiently classifying lung sounds through depthwise separable CNN models with fused STFT and MFCC features | |
CN110755108A (zh) | 一种基于智能听诊器的心脏声音分类方法、系统、装置及可读存储介质 | |
CN113317763B (zh) | 基于多模态的帕金森病检测装置及计算机可读存储介质 | |
Mridha et al. | Respiratory disease classification by CNN using MFCC | |
CN111653273A (zh) | 一种基于智能手机的院外肺炎初步识别方法 | |
Hafke-Dys et al. | Artificial intelligence approach to the monitoring of respiratory sounds in asthmatic patients | |
Chawla et al. | Artificial intelligence based techniques in respiratory healthcare services: a review | |
Aly et al. | A new model to detect COVID-19 coughing and breathing sound symptoms classification from CQT and Mel spectrogram image representation using deep learning | |
Rashid et al. | CoughNet-V2: A scalable multimodal DNN framework for point-of-care edge devices to detect symptomatic COVID-19 cough | |
CN112690823A (zh) | 一种识别肺部生理声音的方法以及系统 | |
Firmino et al. | Heart failure recognition using human voice analysis and artificial intelligence | |
Roy et al. | Conv-Random Forest Based IoT: A Deep Learning Model Based on CNN and Random Forest for Classification and Analysis of Valvular Heart Diseases | |
CN114283140A (zh) | 基于特征融合的肺部X-Ray图像分类方法、系统及存储介质 | |
Kim et al. | Non-invasive way to diagnose dysphagia by training deep learning model with voice spectrograms | |
Oyelade et al. | Deep Learning Model for Improving the Characterization of Coronavirus on Chest X-ray Images Using CNN | |
Sabry et al. | Lung disease recognition methods using audio-based analysis with machine learning | |
Deeven et al. | Pulmonary Sound Analysis with Deep Learning for Efficient Respiratory Disease Categorization | |
Jun et al. | Efficiently classifying lung sounds through depthwise separable CNN models with fused STFT and MFCC features. Diagnostics 2021; 11: 732 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210423 |