CN117958862A - 一种肺音数字生物标志物信号分析方法和系统 - Google Patents

一种肺音数字生物标志物信号分析方法和系统 Download PDF

Info

Publication number
CN117958862A
CN117958862A CN202311454386.9A CN202311454386A CN117958862A CN 117958862 A CN117958862 A CN 117958862A CN 202311454386 A CN202311454386 A CN 202311454386A CN 117958862 A CN117958862 A CN 117958862A
Authority
CN
China
Prior art keywords
lung
sound
lung sound
spectrogram
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311454386.9A
Other languages
English (en)
Inventor
刘丹
李丹
赵爽
高云龙
甘佳娣
杨蕊媛
梁书凡
刘江
马文越
明鸣
杨矫云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Zhilan Health Co ltd
West China Hospital of Sichuan University
Original Assignee
Hangzhou Zhilan Health Co ltd
West China Hospital of Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Zhilan Health Co ltd, West China Hospital of Sichuan University filed Critical Hangzhou Zhilan Health Co ltd
Publication of CN117958862A publication Critical patent/CN117958862A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B7/00Instruments for auscultation
    • A61B7/003Detecting lung or respiration noise
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B7/00Instruments for auscultation
    • A61B7/02Stethoscopes
    • A61B7/04Electric stethoscopes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2131Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on a transform domain processing, e.g. wavelet transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/30ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to physical therapies or activities, e.g. physiotherapy, acupressure or exercising
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2123/00Data types
    • G06F2123/02Data types in the time domain, e.g. time-series data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Acoustics & Sound (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Surgery (AREA)
  • Molecular Biology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pulmonology (AREA)
  • Biophysics (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明涉及一种肺音数字生物标志物信号分析方法和系统,方法包括:基于短时傅里叶变换将采集到的肺音数字信号进行至少一次信号转换并得到至少一个谱图;将若干个谱图作为输入以构建训练模型;基于训练模型获取谱图中与肺音相关的特征向量并作为肺音数字标志物信号。本发明通过将肺音数字信号进行多次信号转换能够获取若干个谱图。谱图包括若干个声谱图和若干个倒谱图。声谱图能够用于分析肺音数字信号的频谱特性和时频关系,倒谱图能够用于对信号的周期性或共振特征进行分析,从而为后期特征提取提供有效的数据支持。

Description

一种肺音数字生物标志物信号分析方法和系统
技术领域
本发明涉及数字医疗技术领域,尤其涉及一种肺音数字生物标志物信号分析方法和系统。
背景技术
慢性阻塞性肺疾病(COPD)简称慢阻肺,是一种常见的、可以预防和治疗的异质性疾病。该病症以持续的呼吸道症状和气流受限为特征,它是由气道和/或肺泡异常所致,通常由大量接触有害颗粒或气体引起。慢阻肺的主要危险因素是吸烟,其他环境因素暴露,如作业环境、生物燃料暴露和空气污染可能参与发病。除了有害颗粒或气体暴露外,个体宿主易感性也会导致慢阻肺的发生及进展,包括基因异常、肺发育异常和衰老加速等。肺音是由于气流经过呼吸道和肺泡时,产生湍流引起气道壁及肺泡壁振荡而发出声响,再通过肺组织及胸壁传至体表的声音。喘息声通常在吸气阶段结束或在呼气早期阶段产生,其频率通常在400Hz以上,持续时间超过250毫秒。喘息声多与局部气道狭窄或阻塞有关,可作为检测慢性阻塞性肺病的标准之一。
现有技术中,关于COPD肺音的训练集以及数据库的建立需要大量的干净肺音作为训练的样本,而干净肺音较难获取,目前没有专用于异常肺音采集以及相关肺音数据库搭建的技术。因此,如何从患者体表采集来自不同位置的干净的肺音、如何利用采集到的肺音进行数据库的搭建以及如何建立数字生物标志物,是现有技术急需解决的问题。
中国专利申请CN 115424721A公开了一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统、构建方法及其应用。该系统包括数据采集模块、预处理模块、转换模块、数据模块、数据处理模块、数据增强训练模块、深度学习模块、鉴别模块、分级模块和显示模块。该系统采集候选者的数字化肺音记录,转成梅尔声谱图,利用深度神经网络进行诊断。候选者为COPD患者,健康,或者患有其他肺部疾病。COPD患者的疾病等级将由搭载鉴别系统的设备给出。检查只需要临床或其他场所中采集的肺部听诊肺音,减少常规诊断过程中的放射损伤与可能的接触感染风险。在新冠肺炎流行的当下,在减少感染风险同时,为COPD的早期诊断提供了方案,提高呼吸内科,特别是COPD疾病的诊断效率。但是该专利的缺陷在于:缺乏系统的肺音数字信号的采集方式,导致其所建立的训练集缺乏人工智能学习的意义。该专利通过电子听诊或麦克风类的肺音采集过程缺乏大数据处理的有效性,其肺音中所含有的杂音严重影响了COPD数字生物标志物的正确判断。
具体地,该专利所采用的巴特沃兹高通滤波不能有效滤除与肺部声音存在重叠的心跳噪音。经验模式分解去除心跳噪音的方法由于以经验为基础,并且缺少数学理论的支撑,其模态混叠现象严重,导致该方法准确度较差且不具有自适应性和通用性。其次,该专利采用的麦克风采集候选者肺音的方式导致所采集的肺音精准度较差、肺音来源难以定位,即,该专利采集肺音的方式过于宽泛,对应异常肺音的特征频率抓取度不足,易导致关键信息的丢失。由于COPD患者的异常肺音的特征频率出现的时间较短,并且不会持续伴随肺音出现,所以该专利难以获取干净的肺音。再次,该专利在对高纬度的小样本数据进行特征提取和分类时表现欠佳,难以通过后续的检测精度测试以及提高鉴别模型的性能。最后,该专利缺少明确的训练集和测试集的信号转换以及训练方法,究其原因在于该专利肺音数据库搭建的不完善,导致训练模型的效果较差,缺少大数据的有效性。该专利仅简单用于初步的COPD判断而无法用于实际的数字生物标志物提取以及快速诊断。
此外,一方面由于对本领域技术人员的理解存在差异;另一方面由于申请人做出本发明时研究了大量文献和专利,但篇幅所限并未详细罗列所有的细节与内容,然而这绝非本发明不具备这些现有技术的特征,相反本发明已经具备现有技术的所有特征,而且申请人保留在背景技术中增加相关现有技术之权利。
发明内容
针对现有技术之不足,本发明提供了一种肺音数字生物标志物信号分析方法,方法包括:基于短时傅里叶变换将采集到的肺音数字信号进行至少一次信号转换并得到至少一个谱图;将若干个谱图作为输入以构建训练模型;基于训练模型获取谱图中与肺音相关的特征向量并作为肺音数字标志物信号。本发明通过将肺音数字信号进行多次信号转换能够获取若干个谱图。谱图包括若干个声谱图和若干个倒谱图。声谱图能够用于分析肺音数字信号的频谱特性和时频关系,倒谱图能够用于对信号的周期性或共振特征进行分析,从而为后期特征提取提供有效的数据支持。
本发明的处理模块通过对不同COPD患病情况的个体的肺音数字信号进行特征提取,从而获取关于COPD肺音数字生物标志物信号。在后续的电子听诊中,通过将听诊得到的肺音数字信号和该数字生物标志物信号作比对,医务人员能快速对患者的COPD患病情况进行诊断,进而提高医疗效率。
根据一种优选的实施方式,谱图包括声谱图和倒谱图。优选地,将肺音数字信号进行至少一次信号转换的步骤包括:基于短时傅里叶变换并基于窗函数转换肺音数字信号;将基于短时傅里叶变换获取的结果的绝对值进行平方以获取在二维平面上表示的声谱图。本发明通过将肺音数字信号转换为频谱图,提高后续数字生物标志物提取的准确性,克服传统肺音数据库搭建的粗糙以及误差较大的问题。本发明的处理模块通过加窗后的短时傅里叶变换提取到的肺音数字信号较平稳,且对异常肺音组的瞬时频率抓取度好,不会出现异常肺音组被分割特征导致截取的数字信号不全的问题。本发明所获取的声谱图和倒谱图能够从时域、频域、周期性和共振特征多维度反映声音信号特征,保证后续的特征提取环节的准确率。
根据一种优选的实施方式,将肺音数字信号进行至少一次信号转换的步骤还包括:基于短时傅里叶变换获取肺音数字信号的频谱信号;从频谱信号中取对数谱并且基于逆傅里叶变换获取肺音数字信号的时域信号;基于对数函数对时域信号进行处理以获取倒谱图。本发明通过取对数谱的方式将频谱的动态范围压缩,使得后续特征提取的处理更为方便。由于逆傅里叶变换的结果是一个复数序列,其中实部和虚部表示声音信号的振幅和相位信息。本发明通过对逆傅里叶变换的结果进行对称处理,以确保倒谱是实数表示,以便在后续的特征提取和分析中更方便地处理和应用。
根据一种优选的实施方式,获取谱图中与肺音相关的特征向量的步骤包括:基于训练模型将谱图映射至潜在空间中的低维表示;从潜在空间中采样潜在向量并将潜在向量映射回谱图的重构输出以获取谱图的重构图像;基于重构图像与谱图的原始图像之间的差异获取特征向量。本发明通过训练模型对谱图进行降维处理,从而抽取关键特征。降维处理有利于减少后续处理的计算量,同时不会降低特征提取的准确程度。
根据一种优选的实施方式,从潜在空间中采样潜在向量的步骤包括:训练模型输出用于参数化潜在向量的概率分布的平均向量和方差向量;基于重参数化从平均向量和方差向量中计算潜在向量。本发明通过重参数化技巧,使得训练模型独立于网络设置采样过程,因此,本发明可以直接通过基于梯度的方法训练网络,减小了图像数据中的冗余信息,便于后续的计算处理和特征提取。
根据一种优选的实施方式,基于重构图像与谱图的原始图像之间的差异获取特征向量的步骤包括:重构损失函数并基于均方误差来衡量重构图像与原始图像之间的差异;将重构损失函数和KL散度损失组合成总体损失函数,并使用反向传播算法训练训练模型以获取特征向量。本发明以重构损失函数以及使用均方误差的方法来衡量重构图像与原始图像之间的差异,有助于获取数据特征之间的区别,其对特征向量的获取特别有用,提高了训练模型的性能。
根据一种优选的实施方式,方法还包括:在训练模型训练完成的情况下,将声谱图和/或倒谱图输入至完成训练的训练模型以映射至潜在空间中,并且获取对应的潜在向量。本发明训练模型完成训练后,能够对后续肺音数字信号的声谱图和倒谱图进行精确的特征提取,并且获取特征提取后的特征表示。特征表示作为肺音数字生物标志物,对通过肺音鉴别患者肺部疾病具有重要意义。
根据一种优选的实施方式,在对肺音数字信号进行至少一次信号转换之前,方法还包括:基于肺音数字信号的时频特点滤除从患者不同区域传导来的噪音。本发明通过对所采集的肺音数字信号进行预处理,从而获取若干个肺音数字信号,为肺音数据库的搭建提供了大量的样本基础,并且预处理后的肺音数字信号完成了杂音的有效分离,提高了肺音检测的效率。
本发明还涉及一种肺音数字生物标志物信号分析系统,包括声音采集单元和处理模块。声音采集单元采集患者连续时间段内的肺音。处理模块将肺音转换为肺音数字信号。处理模块还被配置为:基于短时傅里叶变换将采集到的肺音数字信号进行至少一次信号转换并得到至少一个谱图;将若干个谱图作为输入以构建训练模型;基于训练模型获取谱图中与肺音相关的特征向量并作为肺音数字标志物信号。本发明通过数据库的搭建以及对应肺音数字标志物信号的提取,能够用于对COPD和AECOPD患者的诊断检查,解决现有肺音研究领域缺乏大型数据库使用的问题。
根据一种优选的实施方式,声音采集单元包括贴敷设置于患者不同区域的若干个声音传感器。若干个声音传感器沿需采集肺音的气管的延伸方向布设。若干个声音传感器采集连续时间段内患者肺部气流摩擦产生的肺音并将产生的肺音发送至预处理模块和/或处理模块以存储为肺音数字信号。本发明通过在气管和与气管位置相关的气管软骨、肋骨、胸椎等人骨的位置处设置声音传感元件,可以从人体外部实施更具有方向导向的气管、支气管内肺音的采集。医务人员能够根据X光片确定的气管在体内铺设的具体情况针对性地进行声音传感器的位置设置。医务人员能够根据获取的左主支气管和右主支气管长度粗细、分支状态不同的情况对声音传感器的安装数量进行个性化的设计。
附图说明
图1是本发明提供的一种优选实施方式的一种肺音数字生物标志物信号分析系统的简化模块连接关系示意图;
图2是本发明提供的一种优选实施方式的声音采集单元的简化人体胸部放置位置示意图;
图3是本发明提供的一种优选实施方式的声音采集单元的简化人体背部放置位置示意图;
图4是本发明提供的一种优选实施方式的一种肺音数字生物标志物信号分析方法的简化流程示意图。
附图标记列表
1:声音采集单元;2:预处理模块;3:处理模块;101:第一声音传感器;102:第二声音传感器;103:第三声音传感器;104:第四声音传感器。
具体实施方式
下面结合附图进行详细说明。
本发明对部分名词术语进行以下说明。
COPD:慢性阻塞性肺疾病,简称慢阻肺,是一种常见的、可以预防和治疗的异质性疾病,以持续的呼吸道症状和气流受限为特征。
AECOPD:慢性阻塞性肺疾病急性加重期,Acute Exacerbation of Chronic0bstructive Pulmonary Disease。AECOPD是一种急性起病的过程,慢阻肺患者呼吸系统症状出现急性加重(典型表现为呼吸困难、咳嗽、痰量增多和/或痰液呈脓性)。
带通滤波器:允许一定频段的信号通过,抑制低于或高于该频段的信号、干扰和噪声的滤波器。
短时傅里叶变换(STFT,short-time Fourier transform或short-term Fouriertransform):是傅立叶变换的一种变形,也称作加窗傅里叶变换(Windowed Fouriertransform),用于决定随时间变化的信号局部部分的正弦频率和相位。实际上,计算短时距傅立叶变换的过程是将长时间信号分成数个较短的等长信号,然后再分别计算每个较短段的傅立叶转换。通常拿来描绘频域与时域上的变化,为时频分析中其中一个重要的工具。
本发明中,使用短时傅里叶变换将肺音数字信号转换为图像的方法以获取谱图。根据所获取的图像关系的不同,谱图划分为声谱图和倒谱图。声谱图和倒谱图是将肺音数字信号经过短时傅里叶变换之后得到的两个图像。声谱图提供了肺音数字信号在时间和频率上的能量分布,能够用于分析肺音数字信号的频谱特性和时频关系。倒谱图提供了肺音数字信号的频谱信息在频率域上的对数级别,用于对信号的周期性或共振特征进行分析。本发明通过多层次信号转换,能够获取肺音数字信号在不同频谱和时谱上的关系,从而便于以无监督学习方式对肺音数字信号中有关肺病的特征进行提取,增强了对肺音数字信号的特征提取能力。
肺音数字信号:通过设置于具有肺部组织的动物或人体各处的声音传感器实时采集到的声音信号,该声音信号也能够从肺音数据库中获取。
汉明窗口:又称汉明窗函数,为特殊的公式表示,用于截断信号的一定长度。
变分自编码器模型:变分模态分解(Variational Mode Decomposition,VMD)是一种用于信号分解的估计方法,其原理为在获取模态分量的过程中,使用迭代策略搜索变分模型的最优解,并以此确定每个模态分量的中心频带和信号带宽,达到自适应分离信号及其各模态分量频域成分的目的。
无监督学习(unsupervised learning):是机器学习的一种训练方法,即,没有给定事先标记过的训练示例,自动对输入的资料进行分类或分群。
潜在空间(latent space):是在机器学习中用于表示数据的一种低维空间。它是指数据中包含的所有有用信息的压缩表示。潜在空间通常比原始数据空间维数更低,这使得它更容易进行分析和理解。
潜在向量:又称隐变量(hidden variables)或潜变量。潜在向量是指本发明通过训练模型从观测数据中推断出来的变量。与观测变量相对,指的是不可观测的随机变量。隐变量也能够指抽象概念,例如分类、行为、心理状态、数据结构等等。隐变量能用来降低数据的维度。
SVM分类器:一种二分类模型,SVM(Support Vector Machine,支持向量机)是根据结构风险最小化原理提出的监督类学习的线性分类器,在处理高维度或小样本数据分类问题时有良好的分类效果。
实施例1
现有技术中对肺音的分析方法还局限于对肺音数字信号进行简单的算法分析,包括通过二分类算法进行目的确定的有监督学习,从而提取出肺音数字信号中与肺病相关的特征。上述方法的弊端在于,对肺音数字信号的分析维度不够,导致现有技术中所获取的与肺病相关特征对实际患者肺音识别相关较差,不能有效建立高精度识别的分析方法。因此,如何将从肺部采集的肺音数字信号进行多次信号转换,并且以无监督学习方式进行特征提取,是本发明要解决的技术问题。
针对现有技术之不足,本发明公开了一种肺音数字生物标志物信号分析方法,方法可以包括:
S1:基于短时傅里叶变换将采集到的肺音数字信号进行至少一次信号转换并得到至少一个谱图。
S2:将若干个谱图作为输入以构建训练模型。
S3:基于训练模型获取谱图中与肺音相关的特征向量并作为肺音数字标志物信号。
本发明通过将肺音数字信号进行多次信号转换能够获取若干个谱图。谱图包括若干个声谱图和若干个倒谱图。声谱图能够用于分析肺音数字信号的频谱特性和时频关系,倒谱图能够用于对信号的周期性或共振特征进行分析,从而为后期特征提取提供有效的数据支持。
本发明中,对肺音数字信号进行短时傅里叶变换的原理如下所示。
将肺音数字信号中的每个音频样本分成时间窗口。时间窗口的长度设为L毫秒。本发明中时间窗口的长度优选为1O毫秒。处理模块3将肺音数字信号中的每个音频样本分成时间窗口的公式在于:
其中,f(t)表示原始信号,ω(t)表示窗口函数。
本发明的处理模块3通过加窗后的短时傅里叶变换提取到的肺音数字信号较平稳,且对异常肺音组的瞬时频率抓取度好,不会出现异常肺音组被分割特征导致截取的数字信号不全的问题。
本发明所获取的声谱图和倒谱图能够从时域、频域、周期性和共振特征多维度反映声音信号特征,保证后续的特征提取环节的准确率。
其中,步骤S1至少包括以下步骤S101~S106:
S1:基于短时傅里叶变换将采集到的肺音数字信号进行至少一次信号转换并得到至少一个谱图。
S101:基于短时傅里叶变换并基于窗函数转换肺音数字信号。
本发明以汉明窗口函数为例对本发明的肺音数字信号的信号转换方法进行示例性说明。
本发明对每个时间窗口应用汉明窗口函数以减少频谱泄漏。汉明窗口函数的计算公式在于:
其中,ω(t)表示窗口函数,在上述公式中,优选为汉明窗口函数,t表示时间,L表示时间窗口的长度。
一般来说,患者爆裂声的典型持续时间约为5~15毫秒,喘息声的典型持续时间超过250毫秒。本发明将时间窗口的长度设置为10毫秒,从而通过该帧长为10毫秒的汉明窗对肺音数字信号进行分割。该帧长的汉明窗基本可以覆盖爆裂声的持续时间。由于喘息声的典型持续时间超过本发明设定的时间窗口的长度,因此,每一个汉明窗口函数之间保留极小的重叠。上述极小例如是0.001秒的重叠。
S102:将基于短时傅里叶变换获取的结果的绝对值进行平方以获取在二维平面上表示的声谱图。
短时傅立叶变换的绝对值的平方即为声谱图,其公式在于:
优选地,处理模块3将获取的声谱图在二维平面上表示。其横轴表示时间,纵轴表示频率。
本发明可以将肺音数字信号进行信号转换并且得到能够在二维平面上表示的肺音数字信号的在时间和频率上的能量分布,由此便于后续的肺病特征提取。
S103:基于短时傅里叶变换获取肺音数字信号的频谱信号。
该步骤S103中,对肺音数字信号的短时傅里叶变换原理相同,本发明给出其具体实例,以进行清楚说明。
关于步骤S103更具体地,步骤S103至少包括以下步骤S1031~S1032。
S1031:将肺音数字信号分成若干个时间窗口。
S1032:对若干个时间窗口进行傅里叶变换以将肺音数字信号的时域信号转换为频域信号。
其中,采用短时傅里叶变换将肺音数字信号的时域信号转换为频域信号以获取频谱表示的原理在于:
其中,f(t)为输入的肺音数字信号;X(k,t)表示频谱表示中的一个频率-时间点;k表示频率;t表示时间;f(n)表示声音信号的样本点,w(n-t)表示窗函数;N表示窗口的长度。
S104:从频谱信号中取对数谱。
对上述频谱表示中的每一个时间窗口的频谱取对数谱。计算公式在于:
Y(k,t)=log(|X(k,t)|2)
其中,Y(k,t)表示取对数谱的结果,|X(k,t)|2表示频谱的模的平方。
本发明通过取对数谱的方式将频谱的动态范围压缩,使得后续特征提取的处理更为方便。
S105:基于逆傅里叶变换获取肺音数字信号的时域信号。
本发明基于逆傅里叶变换将肺音数字信号的频域信号恢复为时域信号,其公式在于:
其中,y(n,t)为时域信号;Y(k,t)表示取对数谱的结果,k表示频率;t表示时间。
S106:基于对数函数对时域信号进行处理以获取倒谱图。
本发明将逆傅里叶变换获取的时域信号应用对数函数以获取倒谱。倒谱表示了频谱信息在频率域上的对数级别。应用对数函数对时域信号进行对称处理的公式在于:
由于逆傅里叶变换的结果是一个复数序列,其中实部和虚部表示声音信号的振幅和相位信息。本发明通过对逆傅里叶变换的结果进行对称处理,以确保倒谱是实数表示,以便在后续的特征提取和分析中更方便地处理和应用。
本发明将肺音数字信号进行信号转换的优势在于:
(1)将肺音数字信号通过短时傅里叶变换的方式减小其频率范围,使得在后续特征提取过程中能够更精确地定位肺音数字信号中的频率关系,其对特征提取非常有用,能够提供对时域和频域的高分辨率。
(2)经过加窗后获取的谱图能够快速反应肺音数字信号的瞬时变换,从而更好捕捉肺音数字信号的瞬时特性。
(3)对肺音数字信号中的噪音干扰进行了有效的分离。
(4)能够从肺音数字信号的频谱特性、时频关系、周期性和/或共振特征进行分析,其特征提取结果更精确。
S2:将若干个谱图作为输入以构建训练模型。
本发明将若干个声谱图作为输入构建训练模型。训练模型是指深度生成模型。上述深度生成模型例如是变分自编码器模型、变分贝叶斯模型或其余生成式网络结构。在本发明中,深度生成模型优选为变分自编码器模型。变分自编码器模型包括编码器qφ(z|x)和解码器pθ(x|z)。
优选地,步骤S3至少包括以下步骤S301~S306:
S3:基于训练模型获取谱图中与肺音相关的特征向量并作为肺音数字标志物信号。
S301:基于训练模型将谱图映射至潜在空间中的低维表示。
编码器qφ(z|x)将一组声谱图x作为输入,并将其映射至潜在空间z中的低维表示。编码器包括多个隐藏层,每个隐藏层包括激活函数ReLU和批量归一化层。
本发明通过训练模型对谱图进行降维处理,从而抽取关键特征。降维处理有利于减少后续处理的计算量,同时不会降低特征提取的准确程度。
S302:从潜在空间中采样潜在向量并将潜在向量映射回谱图的重构输出以获取谱图的重构图像。
关于步骤S302更具体地,步骤S302至少包括以下步骤S3021~S3022。
S3021:训练模型输出用于参数化潜在向量的概率分布的平均向量和方差向量。
编码器输出用于对潜在向量进行采样的平均向量μφ(x)和方差向量/>平均向量和方差向量用于参数化潜在向量的概率分布。
S3022:基于重参数化从平均向量和方差向量中计算潜在向量。
本发明从潜在空间中采样潜在向量,并使用解码器将其映射回频谱图的重构输出。解码器包括多个隐藏层,每个隐藏层包括使用激活函数和批量归一化层。解码器pθ(x|z)从z生成x。解码器的后验分布假设为高斯分布。解码器计算关于z的均值估计μθ(z)和关于z的方差估计关于z的均值估计μθ(z)表示在给定z的情况下,生成数据x的均值。关于z的方差估计/>表示在给定z的情况下,生成数据x的方差值。梯度是基于外围似然pθ(x)的下界计算的。梯度是指某一函数在该点处的方向导数沿着该方向取得最大值。训练模型通过反向传播来更新编码器的参数集φ和解码器的参数集θ。
编码器的参数集φ和解码器的参数集θ是通过最大化对数外围似然对数pθ(x)的下界来训练的。观测数据x在给定解码器的参数集θ下的对数似然概率log pθ(x)使用以下方程计算:
其中,qφ(z|x)是指在给定观测数据x下,由编码器的参数集φ控制的后验分布,其表示在已知观测数据x的情况下,潜在向量的分布。pθ(x|z)是指解码器的条件分布,表示在给定潜在向量/>的情况下,生成观测数据x的概率密度函数。p(z)是指潜在向量/>的先验分布,通常是指在训练VAE变分自编码器模型时假设的分布,其表示在没有观测数据x的情况下,潜在向量/>的分布。潜在向量/>是使用以下重参数化(Reparameterization Trick)技巧从平均向量μφ(x)和方差向量/>计算得出的,即:
z=μ+σs
其中s∈N(0,I)表示来自标准正态分布的样本。
本发明通过重参数化技巧,VAE变分自编码器模型独立于网络设置采样过程,因此,本发明的处理模块3可以直接通过基于梯度的方法训练网络。VAE变分自编码器模型的最终目标函数表示为:
S303:基于重构图像与谱图的原始图像之间的差异获取特征向量。
关于步骤S303更具体地,步骤S303至少包括以下步骤S3031~S3032。
S3031:重构损失函数并基于均方误差来衡量重构图像与原始图像之间的差异。
本发明的处理模块3重构损失函数,使用均方误差(Mean Squared Error)来衡量重构图像与原始图像之间的差异。
S3032:将重构损失函数和KL散度损失组合成总体损失函数,并使用反向传播算法训练训练模型以获取特征向量。
同样地,本发明的处理模块3也将倒谱图输入到训练模型中进行训练,从而获得倒谱图的特征向量。本发明的处理模块3通过声谱图和倒谱图输入到变分自编码器中进行训练,从而获得对应的特征向量。
本发明基于训练模型获取谱图中与肺音相关的特征向量的优势在于:
(1)对谱图进行降维处理,从而减小图像数据中的冗余信息,便于后续的计算处理和特征提取。
(2)以重构损失函数以及使用均方误差的方法来衡量重构图像与原始图像之间的差异,有助于获取数据特征之间的区别。其对特征向量的获取特别有用,提高了训练模型的性能。
优选地,方法还包括:
S4:在训练模型训练完成的情况下,将声谱图和/或倒谱图输入至完成训练的训练模型以映射至潜在空间中,并且获取对应的潜在向量。
优选地,在上述训练模型训练完成的情况下,处理模块3通过编码器将声谱图输入到已完成训练的训练模型中。编码器将声谱图映射到潜在空间中,以获取对应的潜在向量。上述潜在向量即为对声谱图进行特征提取后得到的特征表示。
优选地,在上述训练模型训练完成的情况下,处理模块3通过编码器将倒谱图输入到已完成训练的训练模型中。编码器将倒谱图映射到潜在空间中,以获取对应的潜在向量。上述潜在向量即为对倒谱图进行特征提取后得到的特征表示。上述在训练模型训练完成的情况下,输入的声谱图和倒谱图是为后续进行的分类模型的有监督学习提供数据基础。
需要说明的是,处理模块3输入训练模型进行训练的训练集,为预先采集的若干个患者个体在预定时间内正常静坐呼吸以及步行呼吸状态下的肺音数字信号,并且其中包括了正常肺音组和异常肺音组。声音采集单元1采集具有明确症状的患者的肺音数字信号,并且由预处理模块2进行预处理,再传输至处理模块3。传输至处理模块3的正常肺音组和异常肺音组组成肺音数据库。处理模块3从肺音数据库中选择部分样本作为训练集和测试集。
需要说明的是,本发明的步骤S1~S5均为无监督学习过程,无需进行特征选择,从而能够提高对肺音数字标志物提取的精度。
S5:进行特征选择。
S501:基于测试集的肺音数字信号对训练模型进行测试。
S502:基于训练结果获取训练集的特征向量,并且基于测试结果获取测试集的特征表示。
本发明通过训练集和测试集的设置,区别于传统的过采样方法,通过深度学习的方式提供后续对数字生物标志物的鉴别性能。在训练模型训练完成的情况下,将测试集中的肺音数字信号转换为声谱图和倒谱图;将声谱图和倒谱图输入训练模型以获取对声谱图和倒谱图进行特征提取后的特征表示。
本发明通过测试集对生成的变分自编码器模型进行进一步评估、测试和验证,优化获取的特征向量,提高模型性能。
优选地,处理模块基于测试集的特征表示选择最优特征向量的步骤包括:
S503:基于分类模型中若干个特征表示的权重判断特征表示的性能表现,并且选择出在分类模型中性能表现最优的最优特征向量。
本发明通过测试集中的特征表示的选择,从而准确获取针对该COPD患者肺音的肺音数字生物标志物信号。肺音数字生物标志物信号作为肺音数据库的重要组成部分,能够辅助医务人员对患者的患病情况进行快速、高效的确认。
S504:基于训练集的特征向量和相应的类别标签训练分类模型。
分类模型能够采用例如SVM分类器。处理模块3基于线性核函数将特征向量映射至高维特征空间。处理模块3通过特征选择方法选择特征向量。处理模块3可以根据分类模型对每个特征向量的权重进行选择。上述权重能够是若干个特征选择方法。上述特征选择方法例如是特征重要性评估、基于决策函数值、递归特征消除。处理模块3基于测试集在分类模型的性能表现,比较不同特征选择方法的分类性能,并选择在分类任务中表现最优的特征向量。处理模块3将选择出的最优的特征向量保存在数据库中以进行后续判别工作。本发明的处理模块3通过对不同COPD患病情况的个体的肺音数字信号进行特征提取并分类,从而获取关于COPD肺音数字生物标志物信号。在后续的电子听诊中,处理模块3通过将听诊得到的肺音数字信号和该数字生物标志物信号作比对从而辅助医务人员快速对患者的COPD患病情况进行诊断,进而提高医疗效率。
需要说明的是,分类训练过程的目标是找到一个最优的超平面,使得不同类别的样本尽可能地被分开,并且保持最大间隔(最大化边界)。处理模块3对分类训练过程进行惩罚参数调优。分类模型还有一个惩罚参数C,用于控制分类错误的惩罚程度。
实施例2
本实施例是对上述实施例的进一步补充,重复内容不再赘述。
肺音数字信号直接被用于信号转换,会含有大量的杂音。因此,肺音数字信号最好进行预处理。现有的关于COPD肺音的训练集以及数据库的建立需要大量的“干净”的肺音作为人工智能的训练样本。但是现有技术难以获取大量的“干净”的肺音,其通过简单的声音提取获取的爆裂音、喘鸣音等异常肺音仅能用于对患者肺部病理情况进行初步判断,无法用于训练集乃至数据库的搭建。
优选地,本发明还涉及一种肺音数字生物标志物信号分析系统,系统包括声音采集单元1、预处理模块2和处理模块3。声音采集单元1采集患者连续时间段内的肺音数字信号。声音采集单元1与预处理模块2通信连接。声音采集单元1将采集到的肺音数字信号传输至预处理模块2,使得预处理模块2对肺音数字信号进行预处理。预处理模块2对肺音数字信号进行降噪和特征提取进而获取干净的肺音数字信号。优选地,在对肺音数字信号进行至少一次信号转换之前,预处理模块2基于肺音数字信号的时频特点滤除从患者不同区域传导来的噪音。上述干净的肺音数字信号是指去除心音、外部环境音等影响肺音分析的杂音后的肺音数字信号。预处理模块2对每个连续时间段中的肺音数字信号进行滤波、放大以及模数转换得到的包含肺音的时频特点、振幅、强度以及能量的高精度肺音数字信号。
处理模块3能够运行本发明的肺音数字生物标志物信号分析方法的编码程序。即处理模块3为能够执行本发明的方法的服务器、专用集成芯片和/或服务器群组、云服务器等等。
优选地,处理模块3将肺音数字信号分类为若干正常肺音组和若干异常肺音组,并且将若干正常肺音组和若干异常肺音组构建为肺音数据库。异常肺音组是指在一定时间段内呈周期性出现的具有一定频域、时域特征的肺音组,并且该肺音组不会持续伴随患者正常呼吸产生的肺音,即,脱离患者正常呼吸频率的可能呈现有周期性出现特征的肺音组。处理模块3构建包括正常肺音组和异常肺音组的肺音数据库,并将肺音数据库划分为训练集和测试集。上述异常肺音组还包括COPD肺音组、AECOPD肺音组。处理模块3将训练集中的肺音数字信号通过短时傅立叶变换转换为声谱图和倒谱图。处理模块3构建VAE变分自编码器模型训练声谱图和倒谱图,从而分别获得声谱图和倒谱图的特征向量。处理模块3使用训练集的特征向量和对应的类别标签训练分类模型,利用分类模型筛选特征向量。本发明的处理模块3通过对不同COPD患病情况的个体的肺音数字信号进行特征提取,从而获取关于COPD肺音数字生物标志物信号。在后续的电子听诊中,通过将听诊得到的肺音数字信号和该数字生物标志物信号作比对,医务人员能快速对患者的COPD患病情况进行诊断,进而提高医疗效率。
根据一种优选的实施方式,声音采集单元1采集若干个患者个体在预定时间内正常静坐呼吸以及步行呼吸状态下的肺音数字信号。预处理模块2对采集到的肺音数字信号进行环境杂音的去除。预处理模块2按照小波去噪的方式来去除肺音数字信号中的高斯白噪声。预处理模块2按照阈值滤波的方式来去除肺音数字信号中的能量微弱的背景噪声。预处理模块2通过一个高通滤波器滤去杂音以得到肺音数字信号。上述高通滤波器例如是能够滤去频率低于20Hz的成分的滤波器或具有120~1800Hz截止频率的12阶巴特沃斯带通滤波器。预处理模块2还对肺音数字信号进行心音的滤除。由于声音采集单元1不可避免地会采集到患者心音,其采集到的肺音数字信号存在被心音主导的可能性,故本发明通过预处理模块2对采集到的肺音数字信号进行心音的分离与滤除。预处理模块2对肺音数字信号进行短时傅里叶变换,从而获取肺音数字信号的复时频谱。预处理模块2对肺音数字信号的复时频谱取模,从而获取肺音数字信号的时频谱。预处理模块2对时频谱进行分解,从而获取分别处于不同频率范围的心音数字信号时频谱和肺音数字信号时频谱。预处理模块2根据提取出来的心音的时频特点,对声音采集单元1采集到的肺音数字信号基于已确定的患者的心音时频特点进行心音的剔除。
本发明的预处理模块2通过对所采集的肺音数字信号进行预处理,从而获取若干个干净的肺音数字信号,为肺音数据库的搭建提供了大量的样本基础,并且预处理后的肺音数字信号完成了杂音的有效分离,提高了肺音检测的效率。
由于在声音采集单元1采集不同区域的不同肺音的情况下,不同肺音数字信号的频谱存在区别,因此,如何抵消不同肺音之间的干扰,从而获取干净的肺音数字信号,是现有技术急需解决的技术问题。气管呼吸音是空气进出气管发出的声音,其特征在于:粗糙、极响亮、音调极高以及吸气相和呼气相的比例为1:1。支气管呼吸音是气流在声门、气管或主支气管形成湍流所产生的声音,似抬舌后经口腔呼气时所发出“ha”的音响,其特征在于:响亮、音调高、吸气相和呼气相的比例为1:3。肺泡呼吸音是气流进出肺泡,使肺泡壁振动所产生的声音,其特征在于:柔和、音调低、吸气相和呼气相的比例为3∶1。支气管肺泡呼吸音是由支气管呼吸音和肺泡呼吸音混合而成,吸气似肺泡呼吸音,呼气似支气管呼吸音,其特征在于:强度中等、音调中等、吸气相和呼气相的比例为1:1。基于上述声音采集单元1所采集的不同区域的肺音的不同,预处理模块2对分离心音后的肺音数字信号进行进一步滤波处理,从而获取干净的肺音数字信号。
优选地,预处理模块2基于肺音数字信号的时频特点滤除传导而来的不同区域的肺音数字信号。预处理模块2采用陷波滤波技术滤除由其他部位传导而来的肺音数字信号。陷波滤波器能够用于去除周期噪声。由患者其他部位传导而来的周期噪声由于较分散,陷波滤波器能够对其进行针对性抑制,并且不会对当前区域的肺音数字信号造成衰减。例如,当声音采集单元1当前采集的肺音数字信号主要是支气管呼吸音时,由于支气管呼吸音的频率最高,并且其他部位的肺音数字信号的周期性通过前述的预处理已知,预处理模块2通过陷波滤波以滤除针对的特点振幅、频率的肺音数字信号。即,预处理模块2滤除声音采集单元1采集的气管呼吸音、肺泡呼吸音以及支气管肺泡呼吸音等,从而减小人骨间固体传声相互的干扰,达到气管内部相互传声的相互抵消的效果以获得更有针对性的来自相关部位的肺音。
优选地,当预处理模块2检测到肺音数字信号因患者的动作发生强度改变时,预处理模块2基于位于患者不同区域的若干个声音传感元件采集患者动作产生的杂音,并且提取杂音的幅模时序模板以对患者的肺音数字信号进行杂音分离。上述患者的动作例如是患者进行说话、咳嗽、气喘、吞咽等动作。在患者进行相关动作的情况下,其产生的说话声、咳嗽声、气喘声和吞咽声会对声音传感元件采集的肺音数字信号造成干扰。对此,预处理模块2能够通过位于患者颈部的声音传感元件对该类杂音进行分离。实际上,由患者动作产生的杂音大多来自咽喉部,肢体动作难以影响体内肺音数字信号的采集。因此,患者的颈部能够设置有特定的声音传感元件,以采集患者咽喉部产生的杂音,并且由预处理模块2通过提取相关的幅模时序模板以对该部分杂音进行分离。预处理模块2对肺音数字信号进行短时傅里叶变换,从而获取肺音数字信号的复时频谱。预处理模块2将设置在患者颈部的声音传感元件所采集的肺音数字信号的复时频谱取模,从而获取该颈部区域的肺音数字信号的时频谱。预处理模块2在该颈部区域的肺音数字信号的时频谱中提取出幅模时序模板。预处理模块2基于提取出的幅模时序模板滤除正常采集位置采集到的肺音数字信号中的杂音。
根据一种优选的实施方式,处理模块3提取异常肺音组的过程在于:当肺音数字信号中周期性出现持续时长80-250ms、最小主频400Hz且总体频率落于100-2500Hz内的肺音组,则判断并提取该段肺音组为高调干啰音;当肺音数字信号中周期性出现持续时长80-100ms、频率在150Hz左右的肺音组,则判断并提取该段肺音组为低调干啰音;当肺音数字信号中周期性出现持续时长15ms左右、频率350Hz左右的肺音组,则判断并提取该段肺音组为粗湿啰音;当肺音数字信号中周期性出现持续时长5-20ms、频率落于20-1000Hz的肺音组,则判断并提取该段肺音组为中湿啰音;当肺音数字信号中周期性出现持续时长5ms、频率650Hz左右的肺音组,则判断并提取该段肺音组为细湿啰音。处理模块3将提取出的若干个异常肺音组进行分类学习,从而搭建肺音数据库。
对于如何判断所采集的异常肺音的来源来说,现有技术存在利用肺音采集的延迟性来进行来源的定位。例如,在患者胸部设置一个或多个声音传感器阵列。基于位于胸部不同位置的多个声音传感器所采集到的信号强度,并且基于各个声音传感器所对准的肋骨或肋间空间,通过声音信号采集的顺序性来判断声音信号的来源。但是声音在固体中的传播速度约为5200米/秒。声音在患者体内传播10cm只需要0.00002秒。若通过声音传感器的布置来进行声音信号来源的判断需要高精度声音传感器,以适应声音信号的快速传播,其使用成本较高,并且误差较大。
优选地,在处理模块3获取肺音数字信号的频谱特性、时频关系、周期性和/或共振特征的情况下,处理模块3确定出现在呼吸相同时间段的时频特征相似的异常肺音的来源。处理模块3通过比对不同声音传感元件采集到的肺音对应内容的声音能量大小来确定该异常肺音的来源。处理模块3确定一次呼吸周期内的异常肺音。例如,对应一段出现在呼气前期的异常肺音,第二肋骨上靠近胸骨的声音传感元件采集到的对应异常肺音的能量显著大于第二肋骨上远离胸骨的声音传感元件采集到的肺音,则确定该异常肺音的发生源为右主支气管的起始端。呼气、吸气阶段的判定可根据周期内整体声音的能量区别。
优选地,当处理模块3检测到非周期性的肺音数字信号时,处理模块3选择性将该肺音数字信号保存。在处理模型于预设时间内再次检测到相同非周期性的肺音数字信号的情况下,处理模块3标注其为异常肺音组。上述被标注的非周期性的肺音数字信号能够是指突发情况下的异常肺音组。由于患者体内的某一异常肺音可能不具有周期性,但是患者的偶发动作同样会产生不具有周期性的异常肺音。例如患者偶然呛水、呛颗粒物等偶发事件。在上述情况下,处理模块3难以分辨所检测的非周期性的肺音数字信号的发生原因,容易产生异常肺音组的误判。因此,本发明通过二次检测来确定该肺音数字信号是否为偶发事件,保证处理模块3不会随着患者偶发事件出现误判,同时也保证处理模块3不会漏过患者肺部某些已经有形成趋势的病灶带来的偶发但相似的肺音数字信号。
优选地,当检测到肺音数字信号因为患者出现咳嗽、气喘等突发情况而强度激增时,系统会对滤除咳嗽声、气喘声后的肺音进行更针对性的异常肺音组的采集。例如干啰音,在气管痉挛或受压等管腔变得更狭窄时会更为明显,因此在这时针对性地采集异常肺音组能获得更有标志性的异常肺音。
实施例3
本实施例是对上述实施例的进一步改进,重复的内容不再赘述。
根据一种优选的实施方式,在患者日常行动期间佩戴有声音采集单元1的情况下,声音采集单元1采集连续时间段内患者肺部气流摩擦产生的肺音并将产生的肺音发送至预处理模块2以存储为肺音数字信号。如图2和图3所示,声音采集单元1包括设置于患者身体各处的用于采集肺音的第一声音传感器1O 1、第二声音传感器102、第三声音传感器103和第四声音传感器104。本发明具体列出了声音传感器的四种设置方式,但是不代表本发明不包括设置于患者身体其余位置的第五声音传感器或第六声音传感器等。
优选地,在患者环状软骨延胸部前正中线至胸骨角处贴敷设置有第一声音传感器101,以对气管肺音进行采集。如图2所示,上述环状软骨代表患者的气管颈部的起点,即,患者胸骨上窝。上述胸骨角代表患者的气管胸部终点或分岔处。第一声音传感器101包含可移除地贴附设置在患者颈部气管软骨和/或胸骨上的若干声音传感元件。如图2所示,至少三个声音传感元件布设在人体的气管软骨环的分节上。第一声音传感器101从肋椎关节沿气管软骨环分节竖向排布,从而能够采集人体气管颈部的肺音。多个声音传感元件所采集的气管颈部处肺音能够用于杂音消除,从而获取干净的肺音数字信号。
优选地,在患者与胸骨角相连的左侧第二肋骨开始处贴附设置有第二声音传感器102,以对左支气管的肺音进行采集。如图2所示,患者与胸骨角相连的左侧第二肋骨代表患者的左主支气管起始处,即,患者的胸骨柄左侧。第二声音传感器102包含沿肋骨延伸方向可移除地贴附设置在第二肋骨至第六肋骨上的若干声音传感元件。之所以采用可移除地贴附设置方式,是因为肋骨定位不能完全地进行精准的肺音定位采集。由此,医务人员能够通过第二声音传感器102的位置的更改以采集气管分支的声音。如图2所示,第二声音传感器102能够在竖向上排布三列。第二声音传感器102在人体的第二肋骨至第六肋骨上依次排布,并且每一个肋骨上布设有至少两个声音传感元件。第二声音传感器102中布设于第二肋骨且独立设置于肋软骨上的声音传感元件能够用于对左支气管肺音中心音的滤除。按照成人的骨架间距,该单独排列出的声音传感元件在水平方向上与相邻声音传感元件的间隔优选为5cm。优选地,第二声音传感器102在同一肋骨上的相邻两个声音传感元件的间距范围为2.5cm~3cm,优选为3cm。由于成人通常的左侧主支气管较右侧长而细,并且位置水平,与气管纵轴延长线约成40°~55°角,长度约为5cm。因此,本发明的第二声音传感器102相邻两个声音传感元件的间距优选为3cm。本发明通过第二声音传感器102中独立设置于人体心脏腔室附件的声音传感元件,能够在对肺音数字信号进行预处理的过程中,提供人体心音的时域和频域信号,从而提高肺音数字信号降噪的效率和准确性,避免对后续肺音数字标志物的特征提取的干扰。
优选地,在患者与胸骨角相连的右侧第二肋骨开始处贴附设置有第三声音传感器103,以对右支气管的肺音进行采集。如图2所示,患者与胸骨角相连的右侧第二肋骨代表患者的右主支气管起始处,即,患者的胸骨柄右侧。第三声音传感器103包含沿肋骨延伸方向可移除地贴附设置在第二肋骨至第六肋骨上的若干声音传感元件。如图2所示,第三声音传感器103能够在竖向上排布两列。第三声音传感器103在人体的第二肋骨至第六肋骨上依次排布,并且每一个肋骨上布设有至少两个声音传感元件。第三声音传感器103的相邻布设能够用于杂音消除,即,通过采集到的相邻两个肺音数字信号进行相关杂音分离。优选地,第三声音传感器103在同一肋骨上的相邻两个声音传感元件的间距范围为2.5cm~3cm,优选为2.5cm。由于成人通常的右侧主支气管较左侧短而粗,其长度约为2.5cm~3cm,并且与气管纵轴延长线约成20°~30°角。因此,本发明的第三声音传感器103相邻两个声音传感元件的间距优选为2.5cm。
优选地,在患者背部的两侧肩胛之间的区域设置有第四声音传感器104,以对患者的气管和支气管的声音进行辅助采集。如图3所示,上述患者背部的两侧肩胛之间的区域是指从患者两侧肩胛骨下角沿两侧肩胛线的区域。第四声音传感器104包含可移除地设置在肩胛之间的区域的胸椎和第二肋骨至第六肋骨上的若干声音传感元件。第四声音传感器104能够在患者背部与第二声音传感器102和/或第三声音传感器103对应布设,从而能够用于对第二声音传感器102和/或第三声音传感器103所采集的肺音数字信号进行杂音消除或校准。第四声音传感器104还能够在患者背部对患者前胸前颈未采集肺音的区域进行对应采集。由此采集的声音信号能够用于对肺音数字信号噪声的滤去。例如,第四声音传感器104所采集的声音信号由于并非是在对应肋骨或颈部进行的采集,与其余声音传感器采集的声音信号相比,具体有特定的时频特点,并且该时频特点是人体内噪音产生的。由此,能够通过该时频特点不同的声音信号去滤除前胸前颈采集的声音信号中的噪音。该滤除方式由于不对前胸前颈采集的声音信号造成干扰,通过上述方式处理的肺音数字信号不会发生衰减,通过声音信号的相互抵消效果更有效地滤除人体内的噪音。
本发明通过在气管和与气管位置相关的气管软骨、肋骨、胸椎等人骨的位置处设置声音传感元件,可以从人体外部实施更具有方向导向的气管、支气管内肺音的采集。
优选地,上述各个声音传感器能够为带状设置。声音传感器包含能够贴附于患者皮肤的贴附带和若干能够采集并记录局部声音的点状声音传感元件。点状声音传感元件沿其所在的声音传感器针对的气管的延伸方向布设。优选地,贴附带设置有若干用于安装点状声音传感元件的点位。医务人员能够根据X光片确定的气管在体内铺设的具体情况针对性地进行声音传感器的位置设置。优选地,医务人员能够根据获取的左主支气管和右主支气管长度粗细、分支状态不同的情况对点状声音传感元件的安装数量进行个性化的设计。
例如,根据X光显示的患者气管分布情况,第二声音传感器102分别设置编号为2A、2B、2C、2D共计4个点状声音传感元件分别对左主支气管的起始端、左主支气管的分叉端、左上叶支气管和左下叶支气管进行声音的采集。第三声音传感器103分别设置编号为3A、3B、3C、3D、3E共计5个点状声音传感元件分别对右主支气管的起始端、右主支气管的分叉端、右上叶支气管、右中叶支气管和右下叶支气管进行声音的采集。
再例如,由于左右两侧气管分支不同和/或患者左侧具有心脏腔室,因此,第二声音传感器102和第三声音传感器103不对称设置。医务人员将第一声音传感器10 1中的若干个声音传感元件依据气管软骨环的分节情况布设。医务人员将第二声音传感器102和第三声音器参考两侧主支气管的延伸长度、角度和分支的特点来布设。医务人员将第四声音传感器104主要根据第一声音传感器1O 1、第二声音传感器102和第三声音传感器103的布设情况在患者的背部肩胛之间的肋骨和胸椎上辅助布设。第四声音传感器104能够与第一声音传感器101、第二声音传感器102和第三声音传感器103以患者身体前后对称。第四声音传感器104还能够对患者前胸前颈未采集肺音的区域进行补充采集。
优选地,肺音数字信号是由各个点状声音传感元件采集的声音信号组成并包含各个点状声音传感元件编号信息的复合声音信号。
在全文中,“优选地”所引导的特征仅为一种可选方式,不应理解为必须设置,故此申请人保留随时放弃或删除相关优选特征之权利。
需要注意的是,上述具体实施例是示例性的,本领域技术人员可以在本发明公开内容的启发下想出各种解决方案,而这些解决方案也都属于本发明的公开范围并落入本发明的保护范围之内。本领域技术人员应该明白,本发明说明书及其附图均为说明性而并非构成对权利要求的限制。本发明的保护范围由权利要求及其等同物限定。本发明说明书包含多项发明构思,诸如“优选地”“根据一个优选的实施方式”或“可选地”均表示相应段落公开了一个独立的构思,申请人保留根据每项发明构思提出分案申请的权利。

Claims (10)

1.一种肺音数字生物标志物信号分析方法,其特征在于,所述方法包括:
基于短时傅里叶变换将采集到的肺音数字信号进行至少一次信号转换并得到至少一个谱图;
将若干个所述谱图作为输入以构建训练模型;
基于所述训练模型获取所述谱图中与肺音相关的特征向量并作为肺音数字标志物信号。
2.根据权利要求1所述的肺音数字生物标志物信号分析方法,其特征在于,所述谱图包括声谱图和倒谱图,其中,
将所述肺音数字信号进行至少一次信号转换的步骤包括:
基于短时傅里叶变换并基于窗函数转换所述肺音数字信号;
将基于短时傅里叶变换获取的结果的绝对值进行平方以获取在二维平面上表示的所述声谱图。
3.根据权利要求1或2所述的肺音数字生物标志物信号分析方法,其特征在于,将所述肺音数字信号进行至少一次信号转换的步骤还包括:
基于短时傅里叶变换获取所述肺音数字信号的频谱信号;
从所述频谱信号中取对数谱并且基于逆傅里叶变换获取所述肺音数字信号的时域信号;
基于对数函数对所述时域信号进行处理以获取所述倒谱图。
4.根据权利要求1~3任一项所述的肺音数字生物标志物信号分析方法,其特征在于,获取所述谱图中与肺音相关的特征向量的步骤包括:
基于所述训练模型将所述谱图映射至潜在空间中的低维表示;
从所述潜在空间中采样潜在向量并将所述潜在向量映射回所述谱图的重构输出以获取所述谱图的重构图像;
基于所述重构图像与所述谱图的原始图像之间的差异获取所述特征向量。
5.根据权利要求1~4任一项所述的肺音数字生物标志物信号分析方法,其特征在于,从所述潜在空间中采样潜在向量的步骤包括:
所述训练模型输出用于参数化潜在向量的概率分布的平均向量和方差向量;
基于重参数化从所述平均向量和所述方差向量中计算所述潜在向量。
6.根据权利要求1~5任一项所述的肺音数字生物标志物信号分析方法,其特征在于,基于所述重构图像与所述谱图的原始图像之间的差异获取所述特征向量的步骤包括:
重构损失函数并基于均方误差来衡量所述重构图像与所述原始图像之间的差异;
将重构损失函数和KL散度损失组合成总体损失函数,并使用反向传播算法训练所述训练模型以获取所述特征向量。
7.根据权利要求1~6任一项所述的肺音数字生物标志物信号分析方法,其特征在于,所述方法还包括:
在所述训练模型训练完成的情况下,将所述声谱图和/或所述倒谱图输入至完成训练的所述训练模型以映射至所述潜在空间中,并且获取对应的潜在向量。
8.根据权利要求1~7任一项所述的肺音数字生物标志物信号分析方法,其特征在于,在对所述肺音数字信号进行至少一次信号转换之前,所述方法还包括:
基于所述肺音数字信号的时频特点滤除从患者不同区域传导来的噪音。
9.一种肺音数字生物标志物信号分析系统,其特征在于,包括声音采集单元(1)和处理模块(3),
所述声音采集单元(1)采集患者连续时间段内的肺音,所述处理模块(3)将所述肺音转换为肺音数字信号,所述处理模块(3)还被配置为:
基于短时傅里叶变换将采集到的肺音数字信号进行至少一次信号转换并得到至少一个谱图;
将若干个所述谱图作为输入以构建训练模型;
基于所述训练模型获取所述谱图中与肺音相关的特征向量并作为肺音数字标志物信号。
10.根据权利要求9所述的肺音数字生物标志物信号分析系统,其特征在于,所述声音采集单元(1)包括贴敷设置于患者不同区域的若干个声音传感器,若干个所述声音传感器沿需采集肺音的气管的延伸方向布设,
若干个所述声音传感器采集连续时间段内患者肺部气流摩擦产生的肺音并将产生的所述肺音发送至所述预处理模块(2)和/或所述处理模块(3)以存储为所述肺音数字信号。
CN202311454386.9A 2023-08-30 2023-11-01 一种肺音数字生物标志物信号分析方法和系统 Pending CN117958862A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2023111130474 2023-08-30
CN202311113047 2023-08-30

Publications (1)

Publication Number Publication Date
CN117958862A true CN117958862A (zh) 2024-05-03

Family

ID=89917306

Family Applications (5)

Application Number Title Priority Date Filing Date
CN202311358672.5A Pending CN117958861A (zh) 2023-08-30 2023-10-18 一种aecopd肺音数字生物标志物采集装置和方法
CN202311410246.1A Pending CN117582244A (zh) 2023-08-30 2023-10-27 一种肺音数字生物标志物信号处理方法和系统
CN202311442151.8A Pending CN117976004A (zh) 2023-08-30 2023-11-01 一种aecopd肺音数字生物标志物解析方法、装置、介质和系统
CN202311454386.9A Pending CN117958862A (zh) 2023-08-30 2023-11-01 一种肺音数字生物标志物信号分析方法和系统
CN202311499233.6A Pending CN117594234A (zh) 2023-08-30 2023-11-09 一种基于肺音数字生物标志物的aecopd预警系统

Family Applications Before (3)

Application Number Title Priority Date Filing Date
CN202311358672.5A Pending CN117958861A (zh) 2023-08-30 2023-10-18 一种aecopd肺音数字生物标志物采集装置和方法
CN202311410246.1A Pending CN117582244A (zh) 2023-08-30 2023-10-27 一种肺音数字生物标志物信号处理方法和系统
CN202311442151.8A Pending CN117976004A (zh) 2023-08-30 2023-11-01 一种aecopd肺音数字生物标志物解析方法、装置、介质和系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202311499233.6A Pending CN117594234A (zh) 2023-08-30 2023-11-09 一种基于肺音数字生物标志物的aecopd预警系统

Country Status (1)

Country Link
CN (5) CN117958861A (zh)

Also Published As

Publication number Publication date
CN117582244A (zh) 2024-02-23
CN117594234A (zh) 2024-02-23
CN117976004A (zh) 2024-05-03
CN117958861A (zh) 2024-05-03

Similar Documents

Publication Publication Date Title
Kosasih et al. Wavelet augmented cough analysis for rapid childhood pneumonia diagnosis
CN103687540B (zh) 使用记录的呼吸音振幅谱图和音高升降曲线诊断osa/csa
Palaniappan et al. Computer-based respiratory sound analysis: a systematic review
US10278639B2 (en) Method and system for sleep detection
US10007480B2 (en) Multi-parametric analysis of snore sounds for the community screening of sleep apnea with non-Gaussianity index
Sankur et al. Comparison of AR-based algorithms for respiratory sounds classification
US11712198B2 (en) Estimation of sleep quality parameters from whole night audio analysis
Karunajeewa et al. Silence–breathing–snore classification from snore-related sounds
Chen et al. Voice disorder identification by using Hilbert-Huang transform (HHT) and K nearest neighbor (KNN)
CN108670200A (zh) 一种基于深度学习的睡眠鼾声分类检测方法及系统
KR20140142330A (ko) 환자 소리들을 처리하기 위한 방법 및 장치
CN110301890B (zh) 呼吸暂停监测的方法及装置
Dokur Respiratory sound classification by using an incremental supervised neural network
Swarnkar et al. Neural network based algorithm for automatic identification of cough sounds
Datta et al. Automated lung sound analysis for detecting pulmonary abnormalities
CN111870235A (zh) 一种基于ippg的吸毒人员筛查方法
Roy et al. RDLINet: A Novel Lightweight Inception Network for Respiratory Disease Classification Using Lung Sounds
Dar et al. Lung anomaly detection from respiratory sound database (sound signals)
Ghaemmaghami et al. Normal probability testing of snore signals for diagnosis of obstructive sleep apnea
AU2021290457A1 (en) Systems and methods for screening obstructive sleep apnea during wakefulness using anthropometric information and tracheal breathing sounds
CN117958862A (zh) 一种肺音数字生物标志物信号分析方法和系统
Johari et al. Distinctive Features for Classification of Respiratory Sounds Between Normal and Crackles Using Cepstral Coefficients
Hande et al. An integrated computerized cough analysis by using wavelet for pneumonia diagnosis
Balasubramanian et al. Machine Learning-Based Classification of Pulmonary Diseases through Real-Time Lung Sounds.
Sun et al. Apnea and hypopnea events classification using amplitude spectrum trend feature of snores

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination