CN115116600A - 一种儿童咳嗽自动分类识别系统 - Google Patents

一种儿童咳嗽自动分类识别系统 Download PDF

Info

Publication number
CN115116600A
CN115116600A CN202110290043.8A CN202110290043A CN115116600A CN 115116600 A CN115116600 A CN 115116600A CN 202110290043 A CN202110290043 A CN 202110290043A CN 115116600 A CN115116600 A CN 115116600A
Authority
CN
China
Prior art keywords
cough
patient
data
signal
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110290043.8A
Other languages
English (en)
Inventor
王艳云
王晓琴
宋超
廖思淇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
West China Second University Hospital of Sichuan University
Original Assignee
West China Second University Hospital of Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by West China Second University Hospital of Sichuan University filed Critical West China Second University Hospital of Sichuan University
Priority to CN202110290043.8A priority Critical patent/CN115116600A/zh
Publication of CN115116600A publication Critical patent/CN115116600A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Primary Health Care (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本申请涉及数据采集和分析领域,特别是一种儿童咳嗽自动分类识别系统,其包括声学传感器采集模块、网络传送模块和云端计算模块;声学传感器采集模块:接收儿童病人的咳嗽声音的语音信号,并保存至本地服务器;网络传送模块:将本地语音信号数据上传至云端服务器;云端计算模块:将病人咳嗽音频保存至云端服务器;对语音信号进行数据清洗;从语音信号中分割提取出咳嗽信号片段;本发明可对病人咳嗽信号自动识别,可判断咳嗽音具有肺炎还是支气管炎的咳嗽特征。面对有标签的音频数据和无标签的咳嗽音片段数据,本申请在构建特征空间单元中采用提取分类特征的方法。也是本申请和现有的咳嗽音识别处理系统最大的不同点。

Description

一种儿童咳嗽自动分类识别系统
技术领域
本申请涉及数据采集和分析领域,特别是一种儿童咳嗽自动分类识别系统。
背景技术
咳嗽是一种呼吸道常见症状,由于气管、支气管黏膜或胸膜受炎症、异物、物理或化学性刺激引起,表现先是声门关闭、呼吸肌收缩、肺内压升高,然后声门张开,肺内空气喷射而出,通常伴随声音。咳嗽声携带着下呼吸道的重要信息。有研究结果表明,对咳嗽声进行分析来诊断下呼吸道疾病是有效的。
现有技术中也有对咳嗽进行采集和分析的专利,如申请号为CN201811261389.X,名称为《基于深度学习的咳嗽疾病识别方法及装置》,其公开了如下内容:对咳嗽音频进行预处理得到若干咳嗽音频帧序列;从若干咳嗽音频帧序列中提取得到所述咳嗽音频的声音特征;通过咳嗽疾病识别模型对所述咳嗽音频的声音特征进行分类预测,得到所述咳嗽音频对应的咳嗽疾病标签;根据所述咳嗽疾病标签输出所述咳嗽音频对应的咳嗽疾病识别结果。采用深度学习的方法,利用咳嗽疾病识别模型自动根据咳嗽音频进行咳嗽疾病的识别。上述专利中的咳嗽疾病标签对应的是咳嗽音频,是咳嗽音水平的诊断。而现实生活中,没有大量的对咳嗽音水平的标签,对咳嗽音打标签是一个耗时耗人力的一项工作。 再如专利号为CN201010217590.5的中国发明专利,该专利是对语音中的咳嗽事件进行检测和计数,并不能对咳嗽进行自动分类识别。
发明内容
本发明的首要目的在于克服上述现有技术的缺点与不足,提供一种通过声音对病人咳嗽声音进行处理,并能准确地获取咳嗽信号,且能对咳嗽信号进行简单高效识别的自动分类识别系统。
为实现上述技术效果,本申请的技术方案如下:
一种儿童咳嗽自动分类识别系统,包括声学传感器采集模块、网络传送模块和云端计算模块;
其中,声学传感器采集模块:接收儿童病人的咳嗽声音的语音信号,将记录在录音机中的儿童患者咳嗽声称为patient audios,并以WAV格式保存至本地服务器;
网络传送模块:将本地语音信号数据上传至云端服务器;
云端计算模块:将病人咳嗽音频保存至云端服务器;对WAV格式的语音信号进行数据清洗;从语音信号中分割提取出咳嗽信号片段;
云端计算模块在搭建系统时对提取出的咳嗽信号片段进行数据增强;对增强前后的咳嗽信号提取MFCC特征向量序列;聚合这些提取的MFCC特征向量,计算均值,得到特征空间里的质心,构建特征空间,用质心来代表patient audios的特征,作为特征向量;根据特征向量序列训练支持向量机SVM模型,对病人咳嗽信号进行识别,判断患有肺炎还是支气管炎;
云端计算模块使用系统时分别计算每个提取出的咳嗽信号片段的MFCC特征,再将这些来自同一个患者的多个MFCC 聚合,计算均值,得到特征空间里的质心,构造特征空间,用质心来代表患者的特征,使用训练好的SVM来对特征向量进行分类识别,判断属于肺炎还是支气管炎的咳嗽特征。
进一步地,云端计算模块包括数据存储单元、数据清洗单元以及数据分析处理单元;
进一步地,所述数据分析处理单元包括咳嗽信号分割单元、数据增强单元、特征提取单元、构建特征空间单元、训练分类器和识别单元。
数据存储单元:将接收的语音信号数据进行储存;
数据清洗单元:对语音信号进行最小均方误差降噪处理,并对音频信号的幅度值归一化。
咳嗽信号分割单元:根据设定的能量阈值从清洗后的语音信号中分割出咳嗽信号片段,所述能量阈值在咳嗽信号分割单元中实验得到,并且应用在数据清洗单元后得到的语音信号上。
数据增强单元:用于对分割出的语音信号片段进行时间偏移和音调变换。所述时间偏移了 [-0.1,0.1]s位移大小,音调变换了(0,5]个半音;以及加入白、粉噪音增强数据。
Figure 902416DEST_PATH_IMAGE002
,其中
Figure 226081DEST_PATH_IMAGE004
为增加噪音后的声音信号,
Figure 536977DEST_PATH_IMAGE006
为原始声音信号,
Figure 338711DEST_PATH_IMAGE008
为选择加入的噪音信号,
Figure 418662DEST_PATH_IMAGE010
,t为时间,R为实数;
Figure 772283DEST_PATH_IMAGE008
为一个时间连续随机过程,当加入的是白噪音时,功率谱密度为
Figure 445841DEST_PATH_IMAGE012
,其中
Figure 175900DEST_PATH_IMAGE014
表示单边功率谱密度,
Figure 251303DEST_PATH_IMAGE016
Figure 775826DEST_PATH_IMAGE018
为随机因素;当加入的是粉噪音时,功率谱密度
Figure DEST_PATH_IMAGE019
,其中
Figure DEST_PATH_IMAGE021
为频率,
Figure DEST_PATH_IMAGE023
Figure DEST_PATH_IMAGE025
一般趋近于1,将增强前后的咳嗽信号作为咳嗽信号。
特征提取单元:用于对咳嗽信号按帧提取特征,将其转换为特征向量序列,具体地说,特征提取单元将咳嗽信号经过分帧加窗,以及进行快速傅里叶变换得到其谱图,再经过一组Mel频率滤波器对其进行处理,最后再进行离散余弦变换得到一个20维的MFCC参数(Mel频率倒谱系数),作为特征向量序列
Figure DEST_PATH_IMAGE027
,其中,n代表MFCC的维度,m代表患者的咳嗽音片段数目;
构建特征空间单元:用于得到特征向量集
Figure DEST_PATH_IMAGE029
;对一位患者提取出的特征向量,在垂直空间上将特征向量进行堆叠,再取均值,得到此患者的分类特征向量
Figure DEST_PATH_IMAGE031
;分类特征向量的计算公式为:
Figure DEST_PATH_IMAGE033
,i表示的是这名患者的第几个咳嗽音片段,总共一段音频可以划分出m个咳嗽音片段,分类特征向量集合
Figure 277958DEST_PATH_IMAGE029
包含多名病人的特征向量,其中k代表病人的数目,
Figure 421494DEST_PATH_IMAGE031
表示的是一名患者的特征向量,
Figure 210459DEST_PATH_IMAGE029
表示的是k位患者的特征向量。
训练分类器:采用SVM来对分类特征向量训练集进行训练,得到分类识别分类器,对训练得到的训练分类器进行测试,保存评价指标accuracy得分最高的模型作为模型
Figure DEST_PATH_IMAGE035
识别单元:进行分类识别;根据特征向量序列训练支持向量机模型,对病人咳嗽音信号进行识别,判断属于肺炎还是支气管炎的咳嗽特征。
进一步地,所述网络传送模块为4G/5G蜂窝网络、物联网(LoRa、NB-IoT)、有线网络或/和Wifi传送模块。
本发明的优点在于:
1、本发明可对病人咳嗽信号自动识别,可判断咳嗽音具有肺炎还是支气管炎的咳嗽特征。面对有标签的音频数据和无标签的咳嗽音片段数据,本申请在构建特征空间单元中采用提取分类特征的方法。也是本申请和现有的咳嗽音识别处理系统最大的不同点。
2、本发明在一定程度上提高了对咳嗽信号自动识别的准确率,能够为音频识别相关领域的研究提供研究基础。
3、本申请咳嗽疾病标签对应的是这名患者,是对收集的患者连续长时间语音音频进行数据分析处理。并且进行了数据增强,使得模型更能适应更大范围的数据场景。
附图说明
图1为本系统训练时的结构模块示意图。
图2为本系统使用时的结构模块示意图。
具体实施方式
实施例1
一种儿童咳嗽自动分类识别系统,包括声学传感器采集模块、网络传送模块和云端计算模块;
其中,声学传感器采集模块:接收儿童病人的咳嗽声音的语音信号,将记录在录音机中的儿童患者咳嗽声称为patient audios,并以WAV格式保存至本地服务器;
网络传送模块:将本地语音信号数据上传至云端服务器;
云端计算模块:将病人咳嗽音频保存至云端服务器;对WAV格式的语音信号进行数据清洗;从语音信号中分割提取出咳嗽信号片段;
如图1所示,云端计算模块在搭建系统时对提取出的咳嗽信号片段进行数据增强;对增强前后的咳嗽信号提取MFCC特征向量序列;聚合这些提取的MFCC特征向量,计算均值,得到特征空间里的质心,构建特征空间,用质心来代表patient audios的特征,作为特征向量;根据特征向量序列训练支持向量机SVM模型,对病人咳嗽信号进行识别,判断患有肺炎还是支气管炎;
如图2所示,云端计算模块使用系统时分别计算每个提取出的咳嗽信号片段的MFCC特征,再将这些来自同一个患者的多个MFCC 聚合,计算均值,得到特征空间里的质心,构造特征空间,用质心来代表患者的特征,使用训练好的SVM来对特征向量进行分类识别,判断属于肺炎还是支气管炎的咳嗽特征。
实施例2
一种儿童咳嗽自动分类识别系统,包括声学传感器采集模块、网络传送模块和云端计算模块;
其中,声学传感器采集模块:接收儿童病人的咳嗽声音的语音信号,将记录在录音机中的儿童患者咳嗽声称为patient audios,并以WAV格式保存至本地服务器;
网络传送模块:将本地语音信号数据上传至云端服务器;
云端计算模块:将病人咳嗽音频保存至云端服务器;对WAV格式的语音信号进行数据清洗;从语音信号中分割提取出咳嗽信号片段;
如图1所示,云端计算模块在搭建系统时对提取出的咳嗽信号片段进行数据增强;对增强前后的咳嗽信号提取MFCC特征向量序列;聚合这些提取的MFCC特征向量,计算均值,得到特征空间里的质心,构建特征空间,用质心来代表patient audios的特征,作为特征向量;根据特征向量序列训练支持向量机SVM模型,对病人咳嗽信号进行识别,判断患有肺炎还是支气管炎;
如图2所示,云端计算模块使用系统时分别计算每个提取出的咳嗽信号片段的MFCC特征,再将这些来自同一个患者的多个MFCC 聚合,计算均值,得到特征空间里的质心,构造特征空间,用质心来代表患者的特征,使用训练好的SVM来对特征向量进行分类识别,判断属于肺炎还是支气管炎的咳嗽特征。
云端计算模块包括数据存储单元、数据清洗单元以及数据分析处理单元;
所述数据分析处理单元包括咳嗽信号分割单元、数据增强单元、特征提取单元、构建特征空间单元、训练分类器和识别单元。
数据存储单元:将接收的语音信号数据进行储存;
数据清洗单元:对语音信号进行最小均方误差降噪处理,并对音频信号的幅度值归一化;本申请使用python中的LogMMSE的第三方降噪库函数来进行降噪。音频信号的幅度值归一化是使用Adobe Audition CC 2019的标准化为-0.1dB操作。
咳嗽信号分割单元:根据设定的能量阈值从清洗后的语音信号中分割出咳嗽信号片段,所述能量阈值在咳嗽信号分割单元中实验得到,并且应用在数据清洗单元后得到的语音信号上;咳嗽信号分割使用python中的auditok的第三方音频分割库函数。
数据增强单元:用于对分割出的语音信号片段进行时间偏移和音调变换,时间偏移、音调变换是进行数据增强采用的具体方式。对音频的数据增强变换有很多,采用这样的变化后,能够提高分类识别效果。所述时间偏移了 [-0.1,0.1]s位移大小,音调变换了(0,5]个半音;以及加入白、粉噪音增强数据,白噪声的特点是包含各种噪声,粉红噪音是自然界最常见的噪音,利用粉红噪音可以模拟出车流的声音,考虑到医院诊断室毗邻街道,在数据集中加入模拟车流声能够增强模型实际应用效果。
Figure 577986DEST_PATH_IMAGE036
,其中
Figure DEST_PATH_IMAGE037
为增加噪音后的声音信号,
Figure DEST_PATH_IMAGE038
为原始声音信号,
Figure DEST_PATH_IMAGE039
为选择加入的噪音信号,
Figure 429399DEST_PATH_IMAGE010
,t为时间,R为实数;
Figure 970101DEST_PATH_IMAGE039
为一个时间连续随机过程,当加入的是白噪音时,功率谱密度为
Figure 20097DEST_PATH_IMAGE012
,其中
Figure 886422DEST_PATH_IMAGE014
表示单边功率谱密度,
Figure 21868DEST_PATH_IMAGE016
Figure DEST_PATH_IMAGE040
为随机因素;当加入的是粉噪音时,功率谱密度
Figure 897420DEST_PATH_IMAGE019
,其中
Figure 801922DEST_PATH_IMAGE021
为频率,
Figure 104728DEST_PATH_IMAGE023
Figure DEST_PATH_IMAGE041
一般趋近于1,将增强前后的咳嗽信号作为咳嗽信号,对分割后的语音信号增强是为了增大数据集,使得数据多样性更大。
特征提取单元:用于对咳嗽信号按帧提取特征,将其转换为特征向量序列,具体地说,特征提取单元将咳嗽信号经过分帧加窗,以及进行快速傅里叶变换得到其谱图,再经过一组Mel频率滤波器对其进行处理,最后再进行离散余弦变换得到一个20维的MFCC参数(Mel频率倒谱系数),作为特征向量序列
Figure DEST_PATH_IMAGE042
,其中,n代表MFCC的维度,m代表患者的咳嗽音片段数目;
构建特征空间单元:用于得到特征向量集
Figure 136924DEST_PATH_IMAGE029
;对一位患者提取出的特征向量,在垂直空间上将特征向量进行堆叠,再取均值,得到此患者的分类特征向量
Figure 285009DEST_PATH_IMAGE031
;分类特征向量的计算公式为:
Figure 309597DEST_PATH_IMAGE033
,i表示的是这名患者的第几个咳嗽音片段,总共一段音频可以划分出m个咳嗽音片段,分类特征向量集合
Figure 783303DEST_PATH_IMAGE029
包含多名病人的特征向量,其中k代表病人的数目,
Figure 627763DEST_PATH_IMAGE031
表示的是一名患者的特征向量,
Figure 313959DEST_PATH_IMAGE029
表示的是k位患者的特征向量。
训练分类器:采用SVM来对分类特征向量训练集进行训练,得到分类识别分类器,对训练得到的训练分类器进行测试,保存评价指标accuracy得分最高的模型作为模型
Figure 317687DEST_PATH_IMAGE035
识别单元:进行分类识别;根据特征向量序列训练支持向量机模型,对病人咳嗽音信号进行识别,判断属于肺炎还是支气管炎的咳嗽特征。
进一步地,所述网络传送模块为4G/5G蜂窝网络、物联网(LoRa、NB-IoT)、有线网络或/和Wifi传送模块。
本申请可对病人咳嗽信号自动识别,可判断咳嗽音具有肺炎还是支气管炎的咳嗽特征。面对有标签的音频数据和无标签的咳嗽音片段数据,本申请在构建特征空间单元中采用提取分类特征的方法。也是本申请和现有的咳嗽音识别处理系统最大的不同点。本申请在一定程度上提高了对咳嗽信号自动识别的准确率,能够为音频识别相关领域的研究提供研究基础。本申请咳嗽疾病标签对应的是这名患者,是对收集的患者连续长时间语音音频进行数据分析处理。并且进行了数据增强,使得模型更能适应更大范围的数据场景。

Claims (10)

1.一种儿童咳嗽自动分类识别系统,其特征在于:包括声学传感器采集模块、网络传送模块和云端计算模块;
其中,声学传感器采集模块:接收儿童病人的咳嗽声音的语音信号,将记录在录音机中的儿童患者咳嗽声称为patient audios,并以WAV格式保存至本地服务器;
网络传送模块:将本地语音信号数据上传至云端服务器;
云端计算模块:将病人咳嗽音频保存至云端服务器;对WAV格式的语音信号进行数据清洗;从语音信号中分割提取出咳嗽信号片段;
云端计算模块在搭建系统时对提取出的咳嗽信号片段进行数据增强;对增强前后的咳嗽信号提取MFCC特征向量序列;聚合这些提取的MFCC特征向量,计算均值,得到特征空间里的质心,构建特征空间,用质心来代表patient audios的特征,作为特征向量;根据特征向量序列训练支持向量机SVM模型,对病人咳嗽信号进行识别,判断患有肺炎还是支气管炎;
云端计算模块使用系统时分别计算每个提取出的咳嗽信号片段的MFCC特征,再将这些来自同一个患者的多个MFCC 聚合,计算均值,得到特征空间里的质心,构造特征空间,用质心来代表患者的特征,使用训练好的SVM来对特征向量进行分类识别,判断属于肺炎还是支气管炎的咳嗽特征。
2.根据权利要求1所述的一种儿童咳嗽自动分类识别系统,其特征在于:云端计算模块包括数据存储单元、数据清洗单元以及数据分析处理单元;
数据存储单元:将接收的语音信号数据进行储存;
数据清洗单元:对语音信号进行最小均方误差降噪处理,并对音频信号的幅度值归一化;
数据分析处理单元;对数据进行分析和处理。
3.根据权利要求2所述的一种儿童咳嗽自动分类识别系统,其特征在于:所述数据分析处理单元包括咳嗽信号分割单元、数据增强单元、特征提取单元、构建特征空间单元、训练分类器和识别单元。
4.根据权利要求3所述的一种儿童咳嗽自动分类识别系统,其特征在于:咳嗽信号分割单元:根据设定的能量阈值从清洗后的语音信号中分割出咳嗽信号片段,所述能量阈值在咳嗽信号分割单元中实验得到,并且应用在数据清洗单元后得到的语音信号上。
5.根据权利要求3所述的一种儿童咳嗽自动分类识别系统,其特征在于:数据增强单元:用于对分割出的语音信号片段进行时间偏移和音调变换,所述时间偏移了 [-0.1,0.1]s位移大小,音调变换了(0,5]个半音;以及加入白、粉噪音增强数据,
Figure DEST_PATH_IMAGE001
,其中
Figure 38327DEST_PATH_IMAGE002
为增加噪音后的声音信号,
Figure DEST_PATH_IMAGE003
为原始声音信号,
Figure 587120DEST_PATH_IMAGE004
为选择加入的噪音信号,
Figure DEST_PATH_IMAGE005
,t为时间,R为实数;
Figure 222631DEST_PATH_IMAGE006
为一个时间连续随机过程,当加入的是白噪音时,功率谱密度为
Figure DEST_PATH_IMAGE007
,其中
Figure 286402DEST_PATH_IMAGE008
表示单边功率谱密度,
Figure DEST_PATH_IMAGE009
Figure 95089DEST_PATH_IMAGE010
为随机因素;当加入的是粉噪音时,功率谱密度
Figure 232810DEST_PATH_IMAGE011
,其中
Figure DEST_PATH_IMAGE012
为频率,
Figure 288490DEST_PATH_IMAGE013
Figure DEST_PATH_IMAGE014
趋近于1,将增强前后的咳嗽信号作为咳嗽信号。
6.根据权利要求3所述的一种儿童咳嗽自动分类识别系统,其特征在于:特征提取单元:用于对咳嗽信号按帧提取特征,将其转换为特征向量序列,特征提取单元将咳嗽信号经过分帧加窗,以及进行快速傅里叶变换得到其谱图,再经过一组Mel频率滤波器对其进行处理,最后再进行离散余弦变换得到一个20维的MFCC参数,作为特征向量序列
Figure 593220DEST_PATH_IMAGE015
,其中,n代表MFCC的维度,m代表患者的咳嗽音片段数目。
7.根据权利要求3所述的一种儿童咳嗽自动分类识别系统,其特征在于:构建特征空间单元:用于得到特征向量集
Figure DEST_PATH_IMAGE016
;对一位患者提取出的特征向量,在垂直空间上将特征向量进行堆叠,再取均值,得到此患者的分类特征向量
Figure 392548DEST_PATH_IMAGE017
;分类特征向量的计算公式为:
Figure DEST_PATH_IMAGE018
,i表示的是这名患者的第几个咳嗽音片段,总共一段音频可以划分出m个咳嗽音片段,分类特征向量集合
Figure 728983DEST_PATH_IMAGE016
包含多名病人的特征向量,其中k代表病人的数目,
Figure 424406DEST_PATH_IMAGE017
表示的是一名患者的特征向量,
Figure 259507DEST_PATH_IMAGE016
表示的是k位患者的特征向量。
8.根据权利要求3所述的一种儿童咳嗽自动分类识别系统,其特征在于:训练分类器:采用SVM来对分类特征向量训练集进行训练,得到分类识别分类器,对训练得到的训练分类器进行测试,保存评价指标accuracy得分最高的模型作为模型
Figure 3472DEST_PATH_IMAGE019
9.根据权利要求3所述的一种儿童咳嗽自动分类识别系统,其特征在于:识别单元:进行分类识别;根据特征向量序列训练支持向量机模型,对病人咳嗽音信号进行识别,判断属于肺炎还是支气管炎的咳嗽特征。
10.根据权利要求1所述的一种儿童咳嗽自动分类识别系统,其特征在于:所述网络传送模块为4G/5G蜂窝网络、物联网、有线网络或/和Wifi传送模块。
CN202110290043.8A 2021-03-18 2021-03-18 一种儿童咳嗽自动分类识别系统 Pending CN115116600A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110290043.8A CN115116600A (zh) 2021-03-18 2021-03-18 一种儿童咳嗽自动分类识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110290043.8A CN115116600A (zh) 2021-03-18 2021-03-18 一种儿童咳嗽自动分类识别系统

Publications (1)

Publication Number Publication Date
CN115116600A true CN115116600A (zh) 2022-09-27

Family

ID=83323708

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110290043.8A Pending CN115116600A (zh) 2021-03-18 2021-03-18 一种儿童咳嗽自动分类识别系统

Country Status (1)

Country Link
CN (1) CN115116600A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115691808A (zh) * 2022-10-31 2023-02-03 昆山杜克大学 一种基于声音生物标志物的早期筛查与诊断方法及装置
CN117059283A (zh) * 2023-08-15 2023-11-14 宁波市鄞州区疾病预防控制中心 一种基于肺结核预警的语音数据库分类和处理系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115691808A (zh) * 2022-10-31 2023-02-03 昆山杜克大学 一种基于声音生物标志物的早期筛查与诊断方法及装置
CN117059283A (zh) * 2023-08-15 2023-11-14 宁波市鄞州区疾病预防控制中心 一种基于肺结核预警的语音数据库分类和处理系统

Similar Documents

Publication Publication Date Title
CN110120218B (zh) 基于gmm-hmm的高速公路大型车辆识别方法
EP3701528B1 (en) Segmentation-based feature extraction for acoustic scene classification
CN103280220B (zh) 一种实时的婴儿啼哭声识别方法
CN105895078A (zh) 动态选择语音模型的语音识别方法及装置
CN109686377B (zh) 音频识别方法及装置、计算机可读存储介质
CN115116600A (zh) 一种儿童咳嗽自动分类识别系统
CN102201237B (zh) 基于模糊支持向量机的可靠性检测的情感说话人识别方法
CN106409298A (zh) 一种声音重录攻击的识别方法
CN105448291A (zh) 基于语音的帕金森症检测方法及检测系统
CN110234279B (zh) 表征睡眠呼吸障碍的方法
CN111986699A (zh) 基于全卷积网络的声音事件检测方法
CN107564543A (zh) 一种高情感区分度的语音特征提取方法
CN112397074A (zh) 基于mfcc和向量元学习的声纹识别方法
CN116861303A (zh) 一种变电站数字孪生多源信息融合诊断方法
CN113936667A (zh) 一种鸟鸣声识别模型训练方法、识别方法及存储介质
CN116842460A (zh) 基于注意力机制与残差神经网络的咳嗽关联疾病识别方法和系统
CN113571088A (zh) 一种基于深度学习声纹识别的困难气道评估方法及装置
CN117423338B (zh) 一种数字人交互对话方法和系统
CN114420303A (zh) 一种基于声音特征的新型新冠辅助筛查方法
CN111179972A (zh) 一种基于深度学习的人声检测算法
CN113936663A (zh) 困难气道的检测方法及其电子设备和存储介质
Yue et al. Multidimensional zero-crossing interval points: a low sampling rate acoustic fingerprint recognition method
CN113571050A (zh) 一种基于Attention与Bi-LSTM的语音抑郁状态识别方法
Khan et al. Hybrid BiLSTM-HMM based event detection and classification system for food intake recognition
Liu et al. An end-to-end system based on TDNN for lung sound classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination