CN117582185A - 一种基于cllsr混合模型的脉力等级预测方法 - Google Patents
一种基于cllsr混合模型的脉力等级预测方法 Download PDFInfo
- Publication number
- CN117582185A CN117582185A CN202410083997.5A CN202410083997A CN117582185A CN 117582185 A CN117582185 A CN 117582185A CN 202410083997 A CN202410083997 A CN 202410083997A CN 117582185 A CN117582185 A CN 117582185A
- Authority
- CN
- China
- Prior art keywords
- data
- cllsr
- pulse
- neural network
- hybrid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000003062 neural network model Methods 0.000 claims abstract description 61
- 238000012549 training Methods 0.000 claims abstract description 35
- 238000012360 testing method Methods 0.000 claims abstract description 18
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 238000013528 artificial neural network Methods 0.000 claims description 23
- 238000009499 grossing Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 8
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 4
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 239000003814 drug Substances 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 18
- 230000002159 abnormal effect Effects 0.000 description 7
- 238000003745 diagnosis Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000009471 action Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 210000001835 viscera Anatomy 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/48—Other medical applications
- A61B5/4854—Diagnosis based on concepts of traditional oriental medicine
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/02—Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
- A61B5/7267—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7271—Specific aspects of physiological measurement analysis
- A61B5/7275—Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/90—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to alternative medicines, e.g. homeopathy or oriental medicines
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Molecular Biology (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Heart & Thoracic Surgery (AREA)
- Surgery (AREA)
- Software Systems (AREA)
- Veterinary Medicine (AREA)
- General Physics & Mathematics (AREA)
- Animal Behavior & Ethology (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Physiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Psychiatry (AREA)
- Alternative & Traditional Medicine (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Fuzzy Systems (AREA)
- Cardiology (AREA)
- Databases & Information Systems (AREA)
- Pharmacology & Pharmacy (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
Abstract
本申请属于中医诊脉技术领域,公开了一种基于CLLSR混合模型的脉力等级预测方法,包括步骤:A1.获取多个原始脉象数据并对原始脉象数据进行脉力等级评分和数据预处理,得到多个样本数据,形成样本集;样本数据包括预处理后脉象数据和对应的脉力等级标签值;A2.把样本集划分为训练集和测试集;A3.构建CLLSR混合神经网络模型;A4.利用训练集对CLLSR混合神经网络模型进行训练,并以测试集对训练后的CLLSR混合神经网络模型进行测试,得到训练好的CLLSR混合神经网络模型;A5.利用训练好的CLLSR混合神经网络模型对待测对象的实测脉象数据进行脉力等级预测;从而能够提高针对脉力评分等级的预测准确性。
Description
技术领域
本申请涉及中医诊脉技术领域,具体而言,涉及一种基于CLLSR混合模型的脉力等级预测方法。
背景技术
脉诊是传统中医学重要的组成部分,无创、便捷的诊断特点使其在疾病诊断中具有较强的竞争力及极高的研究价值。由中医理论发现,脉象由八种要素构成,分别为脉位、脉率、脉力、脉长、脉宽、均匀度、紧张度、流利度,掌握这八种要素,对研究脉象起到关键作用。
脉力作为脉象八要素中的一个重要因素,能够反映人体脉搏跳动的强弱,而脉搏的强弱能够反映人体五脏六腑生理功能的强弱和气血阴阳的盛衰,能够为判断病证提供有力依据。现有技术中往往将脉力与脉图参数中的主波幅值h1建立联系,但并没有从客观脉象数据出发找到与脉力相关的特征依据,此外,从其他角度对脉力进行分析是有必要的。目前的脉诊装备能够进行脉力简单预判,但具体的预测模型及精度未知,故结合深度神经网络搭建脉力预测模型及脉力预测精度确认是中医脉诊客观化的必要方法。
发明内容
本申请的目的在于提供一种基于CLLSR混合模型的脉力等级预测方法,能够提高针对脉力评分等级的预测准确性。
本申请提供了一种基于CLLSR混合模型的脉力等级预测方法,包括步骤:
A1.获取多个原始脉象数据,并对所述原始脉象数据进行脉力等级评分和数据预处理,得到多个样本数据,形成样本集;每个所述样本数据包括预处理后脉象数据和对应的脉力等级标签值;
A2.把所述样本集划分为训练集和测试集;
A3.构建基于CNN神经网络和LSTM神经网络的CLLSR混合神经网络模型;
A4.以所述样本数据中的预处理后脉象数据作为所述CLLSR混合神经网络模型的模型输入,并以脉力等级预测值作为所述CLLSR混合神经网络模型的模型输出,利用所述训练集对所述CLLSR混合神经网络模型进行训练,并以所述测试集对训练后的所述CLLSR混合神经网络模型进行测试,得到训练好的CLLSR混合神经网络模型;
A5.利用所述训练好的CLLSR混合神经网络模型对待测对象的实测脉象数据进行脉力等级预测。
通过对原始脉象数据进行脉力等级评分和数据预处理,构建了带有脉力等级标签(即脉力等级标签值)的专家数据集,基于此训练CLLSR混合神经网络模型,利用训练好的CLLSR混合神经网络模型进行脉力等级预测可以提高预测结果的准确性。
优选地,步骤A1中,所述获取多个原始脉象数据的步骤包括:
针对多个受试者,通过压力传感器在每个所述受试者的寸口关部脉位处采集多个不同预压力下的脉象数据,记为第一脉象数据;
从同一个所述受试者对应不同预压力的多个所述第一脉象数据中,筛选一个最优脉象数据,作为对应受试者的所述原始脉象数据。
对同一个受试者使用多个预压力进行脉象数据采集,从中择优作为有效数据,可以提高得到的脉象数据的清晰度,使得到的脉象数据更能反映受试者的真实脉搏波动情况。
优选地,步骤A1中,对所述原始脉象数据进行数据预处理包括:
采用sliding-Mean算法对所述原始脉象数据进行平滑处理;
识别平滑处理后的原始脉象数据中的峰值点和谷值点;
根据所述峰值点和所述谷值点从平滑处理后的原始脉象数据中截取多段单周期波数据;
对截取得到的多段所述单周期波数据进行数据点对齐处理;
计算对齐处理后的多段单周期波数据两两之间的相似度距离;
根据所述相似度距离对对齐处理后的多段单周期波数据进行筛选,得到多段参考单周期波数据;
计算所述参考单周期波数据的平均单周期波数据,作为有效单周期波数据;所述预处理后脉象数据为所述有效单周期波数据。
通过上述方式得到有效单周期波数据,可以有效去除原始脉象数据中的异常波动数据和异常点的干扰,使有效单周期波数据更真实地反映受试者的真实脉搏波动情况。
优选地,步骤A1还包括:
对计算得到的所述有效单周期波数据进行随机噪声添加,得到新的有效单周期波数据;
把添加噪声前的所述有效单周期波数据对应的所述脉力等级标签值,作为相应的所述新的有效单周期波数据的脉力等级标签值。
优选地,所述计算对齐处理后的多段单周期波数据两两之间的相似度距离的步骤包括:
根据以下公式计算对齐处理后的多段单周期波数据两两之间的相似度距离:
;
其中,P和Q为对齐处理后的两段单周期波数据,为P和Q之间的相似度距离,/>是P和Q之间的最长公共子串,/>、/>分别是P和Q的数据长度,/>为P和Q之间的第k组配准元素之间的欧式距离,/>,i是第k组配准元素中属于P的元素的序号,j是第k组配准元素中属于Q的元素的序号,/>是第k组配准元素中属于P的元素,/>是第k组配准元素中属于Q的元素,K为P和Q之间的配准元素的组数。
优选地,所述CLLSR混合神经网络模型包括依次连接的输入层、三层一维CNN神经网络、两层LSTM神经网络、全连接层、标签平滑正则化层和输出层。
优选地,所述LSTM神经网络中的激活函数为ELU激活函数。
优选地,所述标签平滑正则化层对标签进行平滑处理的处理函数为:
;
其中,为平滑处理后的新标签,/>为真实标签,/>为超参数,/>为类别数,/>为被平滑处理的标签对应的类别。
优选地,步骤A4包括:
把训练集的样本数据中的预处理后脉象数据输入所述CLLSR混合神经网络模型,得到所述CLLSR混合神经网络模型输出的预测结果;
根据所述预测结果和对应的所述样本数据中的脉力等级标签值,计算损失函数;
若所述损失函数满足预设停止条件,则停止训练;
若所述损失函数不满足预设停止条件,则利用Adam优化器优化所述CLLSR混合神经网络模型的模型参数后,基于训练集中的下一个样本数据重复上述训练步骤;
停止训练后,利用所述测试集对训练后的所述CLLSR混合神经网络模型进行交叉验证,验证通过后得到训练好的CLLSR混合神经网络模型。
优选地,所述损失函数为平均绝对百分比误差或均方对数误差。
有益效果:本申请提供的基于CLLSR混合模型的脉力等级预测方法,通过对原始脉象数据进行脉力等级评分和数据预处理,构建了带有脉力等级标签(即脉力等级标签值)的专家数据集,基于此训练CLLSR混合神经网络模型,利用训练好的CLLSR混合神经网络模型进行脉力等级预测可以提高预测结果的准确性。
附图说明
图1为本申请实施例提供的基于CLLSR混合模型的脉力等级预测方法的流程图。
图2为CLLSR混合神经网络模型的结构示意图。
标号说明:1、输入层;2、一维CNN神经网络;3、LSTM神经网络;4、全连接层;5、标签平滑正则化层;6、输出层。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1是本申请一些实施例中的一种基于CLLSR混合模型的脉力等级预测方法,包括步骤:
A1.获取多个原始脉象数据,并对原始脉象数据进行脉力等级评分和数据预处理,得到多个样本数据,形成样本集;每个样本数据包括预处理后脉象数据和对应的脉力等级标签值;
A2.把样本集划分为训练集和测试集;
A3.构建基于CNN神经网络和LSTM神经网络的CLLSR混合神经网络模型;
A4.以样本数据中的预处理后脉象数据作为CLLSR混合神经网络模型的模型输入,并以脉力等级预测值作为CLLSR混合神经网络模型的模型输出,利用训练集对CLLSR混合神经网络模型进行训练,并以测试集对训练后的CLLSR混合神经网络模型进行测试,得到训练好的CLLSR混合神经网络模型;
A5.利用训练好的CLLSR混合神经网络模型对待测对象的实测脉象数据进行脉力等级预测。
通过对原始脉象数据进行脉力等级评分和数据预处理,构建了带有脉力等级标签(即脉力等级标签值)的专家数据集(即样本集),基于此训练CLLSR混合神经网络模型,利用训练好的CLLSR混合神经网络模型进行脉力等级预测可以提高预测结果的准确性。
其中,可以利用压力传感器压在受试者的寸口关部脉位处进行脉象数据采集,实际上,对于同一个受试者,压力传感器的预压力(即压力传感器压在寸口关部脉位处的压力)不同,采集到的脉象数据的幅值不同,而脉象数据的幅值越大,则数据特征一般会越清晰,因此,每个受试者有对应的最佳预压力,且不同受试者的最佳预压力一般不同。
优选地,步骤A1中,获取多个原始脉象数据的步骤包括:
针对多个受试者,通过压力传感器在每个受试者的寸口关部脉位处采集多个不同预压力下的脉象数据,记为第一脉象数据;
从同一个受试者对应不同预压力的多个第一脉象数据中,筛选一个最优脉象数据,作为对应受试者的原始脉象数据。
对同一个受试者使用多个预压力进行脉象数据采集,从中择优作为有效数据,可以提高得到的脉象数据的清晰度,使得到的脉象数据更能反映受试者的真实脉搏波动情况。
其中,对每个受试者施加的预压力的梯度数(指预压力的数量,例如,向受试者施加10种不同的预压力,则预压力的梯度数为10)和对应的压力值可以根据实际需要设置。例如,对每个受试者施加10个梯度的预压力,每个梯度的预压力对应采集一个第一脉象数据,该10个梯度分别为50g、70g、90g、110g、130g、150g、170g、190g、210g、230g,但不限于是10个梯度,每个梯度的压力值也不限于此。
其中,采集第一脉象数据的时候,可以按照预设采样频率(可以根据实际需要设置)采集预设时长(可以根据实际需要设置,例如5s)的数据。
其中,从同一个受试者对应不同预压力的多个第一脉象数据中,筛选一个最优脉象数据,作为对应受试者的原始脉象数据的步骤,可以包括:从同一个受试者对应不同预压力的多个第一脉象数据中,选取脉象数据幅值最大的第一脉象数据作为对应受试者的原始脉象数据。
优选地,步骤A1中,对原始脉象数据进行数据预处理包括:
采用sliding-Mean算法对原始脉象数据进行平滑处理;
识别平滑处理后的原始脉象数据中的峰值点和谷值点;
根据峰值点和谷值点从平滑处理后的原始脉象数据中截取多段单周期波数据;
对截取得到的多段单周期波数据进行数据点对齐处理;
计算对齐处理后的多段单周期波数据两两之间的相似度距离;
根据相似度距离对对齐处理后的多段单周期波数据进行筛选,得到多段参考单周期波数据;
计算参考单周期波数据的平均单周期波数据,作为有效单周期波数据;预处理后脉象数据为有效单周期波数据。
通过上述方式得到有效单周期波数据,可以有效去除原始脉象数据中的异常波动数据和异常点的干扰,使有效单周期波数据更真实地反映受试者的真实脉搏波动情况。
其中,通过sliding-Mean算法(滑动平均算法)对原始脉象数据进行平滑处理,可以去掉呼吸或其他噪声产生的基线漂移,便于识别脉象峰值点和谷值点。sliding-Mean算法为现有技术,此处不对其进行详述。
其中,可以采用现有的峰谷识别算法识别平滑处理后的原始脉象数据中的峰值点和谷值点,此处不对其进行详述。
其中,原始脉象数据中任意相邻的峰值点和谷值点之间的数据为一段单周期波数据。
其中,可以采用三次样条插值法,对截取得到的多段单周期波数据进行数据点对齐处理,此为现有技术,此处不对其进行详述。通过数据点对齐处理后,各段单周期波数据的数据长度相同。通过三次样条插值,可以在一定程度上削弱异常点对整体波形的影响。
其中,计算对齐处理后的多段单周期波数据两两之间的相似度距离的步骤包括:
根据以下公式计算对齐处理后的多段单周期波数据两两之间的相似度距离:
;
其中,P和Q为对齐处理后的两段单周期波数据(P和Q可以是任意两段对齐处理后的单周期波数据,即任意两段对齐处理后的单周期波数据之间的相似度距离均通过上式计算),为P和Q之间的相似度距离,/>是P和Q之间的最长公共子串,/>、分别是P和Q的数据长度,/>为P和Q之间的第k组配准元素之间的欧式距离(一组配准元素包括两个元素,其中一个元素属于P,另一个元素属于Q,且该两个元素之间通过配准算法确定了配准关系,配准算法为现有技术,此处不对其进行详述),/>,i是第k组配准元素中属于P的元素的序号,j是第k组配准元素中属于Q的元素的序号,/>是第k组配准元素中属于P的元素,/>是第k组配准元素中属于Q的元素,K为P和Q之间的配准元素的组数。通过上式中的/>项,能够保证两个相似性较高的对齐处理后的单周期波数据之间的相似度距离接近于0,从而便于后续进行数据筛选。
其中,根据相似度距离对对齐处理后的多段单周期波数据进行筛选,得到多段参考单周期波数据的步骤可以包括:
依次以对齐处理后的各段单周期波数据作为目标单周期波数据;
以与目标单周期波数据之间的相似度距离小于预设相似度距离阈值(可根据实际需要设置)的其它单周期波数据作为该目标单周期波数据的匹配单周期波数据,统计各个目标单周期波数据对应的匹配单周期波数据的数量;
选取匹配单周期波数据的数量最多的目标单周期波数据以及相应的匹配单周期波数据作为参考单周期波数据(例如,假设匹配单周期波数据的数量最多的目标单周期波数据为单周期波数据A,该单周期波数据A的匹配单周期波数据包括单周期波数据B、单周期波数据C和单周期波数据D,则参考单周期波数据包括单周期波数据A、单周期波数据B、单周期波数据C和单周期波数据D)。
通过上述方式筛选参考单周期波数据,可以保留最多的数据,从而使原始脉象数据得到最重复的利用,有利于使最终得到的有效单周期波数据更真实地反映受试者的真实脉搏波动情况。
其中,计算平均单周期波数据时,计算各参考单周期波数据中同一排序的元素的平均值作为平均单周期波数据中对应排序的元素。例如,计算参考单周期波数据A、参考单周期波数据B、参考单周期波数据C和参考单周期波数据D的第一个元素的平均值,作为平均单周期波数据E的第一个元素,计算参考单周期波数据A、参考单周期波数据B、参考单周期波数据C和参考单周期波数据D的第二个元素的平均值,作为平均单周期波数据E的第二个元素,以此类推。
具体地,步骤A1中,由中医专家对受试者进行脉力判断,以对受试者的脉力进行脉力等级评分,并把评分结果作为该受试者的原始脉象数据的脉力等级分值以及相应的有效单周期波数据的脉力等级标签值。从而使最终建立的样本集是由中医专家的经验所支持的专家数据集,保证利用该样本集训练得到的CLLSR混合神经网络模型的预测结果的准确性和可解释性。其中,脉力等级的范围可以为0-100,从而,脉力等级标签值为0-100,但不限于此。
在一些优选实施方式中,步骤A1还包括:
对计算得到的有效单周期波数据进行随机噪声添加,得到新的有效单周期波数据;
把添加噪声前的有效单周期波数据对应的脉力等级标签值,作为相应的新的有效单周期波数据的脉力等级标签值。
通过上述方式进行数据增强,可以扩大样本集的数据量,保证有足够数据对CLLSR混合神经网络模型进行训练。
其中,添加噪声时可以分别对同一个有效单周期波数据进行不同种类的噪声(如白噪声、高斯噪声等)的添加,以生成多个含有不同种类噪声的新的有效单周期波数据,其中,针对同一种噪声,可以分别在同一个有效单周期波数据中随机添加不同强度范围(可以根据实际需要设置)的噪声,以得到多个含有同种类噪声但噪声强度不同的新的有效单周期波数据(例如在预设强度范围一中随机确定一个第一强度,以此生成包含第一强度的a噪声的新的有效单周期波数据,a噪声可以指任意一种噪声,并在预设强度范围二中随机确定一个第二强度,以此生成包含第二强度的a噪声的新的有效单周期波数据)。通过添加不同噪声来实现数据增强,可以在一定程度上提高CLLSR混合神经网络模型的泛化能力。
其中,步骤A2中,可以按预设比例(根据实际需要设置)把样本集划分为训练集和测试集,例如预设比例为7.5:2.5,但不限于此。
在一些实施方式中,见图2,CLLSR混合神经网络模型包括依次连接的输入层1、三层一维CNN神经网络2(一维卷积神经网络)、两层LSTM神经网络3(长短期记忆神经网络)、全连接层4、标签平滑正则化层5和输出层6。
其中,图2中的输入层1中的X1-Xn表示输入的单周期波数据的各个元素,n为输入的单周期波数据的元素数量(即输入的单周期波数据的特征维度)。
其中,一维CNN神经网络2对输入数据进行卷积后利用最大池化来降低特征维度。
其中,LSTM神经网络3中的激活函数为ELU激活函数。该ELU激活函数为:
;其中,x为自变量,/>为ELU激活函数,e为自然对数底数。
其中,全连接层4用于把LSTM神经网络3的输出结果的特征转化为一维向量。
其中,标签平滑正则化层5用于对不均衡的标签进行平滑处理。优选地,标签平滑正则化层5对标签进行平滑处理的处理函数为:
;
其中,为平滑处理后的新标签,/>为真实标签,/>为超参数,/>为类别数,/>为被平滑处理的标签对应的类别。
优选地,步骤A4包括:
A401.把训练集的样本数据中的预处理后脉象数据输入CLLSR混合神经网络模型,得到CLLSR混合神经网络模型输出的预测结果;
A402.根据该预测结果和对应的样本数据中的脉力等级标签值,计算损失函数;
A403.若损失函数满足预设停止条件,则停止训练;
A404.若损失函数不满足预设停止条件,则利用Adam优化器优化CLLSR混合神经网络模型的模型参数后,基于训练集中的下一个样本数据重复上述训练步骤(即步骤A401-步骤A404);
A405.停止训练后,利用测试集对训练后的CLLSR混合神经网络模型进行交叉验证,验证通过后得到训练好的CLLSR混合神经网络模型。
优选地,损失函数为平均绝对百分比误差或均方对数误差。
其中,平均绝对百分比误差为:
;/>为平均绝对百分比误差,jj为序号,/>为第jj个训练样本数据(即第jj次训练迭代过程使用的样本数据),/>为第jj个预测结果(即CLLSR混合神经网络模型在第jj次训练迭代输出的预测结果),m为当前已使用的训练样本数据的总数(等于当前的训练迭代总次数)。
其中,均方对数误差为:
。
其中,预设停止条件可以根据实际需要设置,例如预设停止条件为:损失函数小于预设的损失函数阈值(可根据实际需要设置);但不限于此。
其中,利用Adam优化器优化模型参数的过程为现有技术,此处不对其进行详述。
其中,利用测试集进行交叉验证的过程为现有技术,此处不对其进行详述。
其中,步骤A5包括:
通过压力传感器在待测对象的寸口关部脉位处采集多个不同预压力下的脉象数据,记为第二脉象数据(具体参考前文的第一脉象数据的采集过程);
从多个第二脉象数据中,筛选一个最优脉象数据,作为对应受试者的实测脉象数据(具体参考前文的原始脉象数据的筛选过程);
对该实测脉象数据进行预处理,得到对应的有效单周期波数据(参考前文的预处理过程),记为有效实测单周期波数据;
把该有效实测单周期波数据输入训练好的CLLSR混合神经网络模型,得到训练好的CLLSR混合神经网络模型输出的脉力等级预测值。
分别利用单一全连接层(FC)、单个LSTM神经网络(LSTM)、单个CNN神经网络(CNN)、现有的LSTM和CNN结合的神经网络模型(CNN+LSTM)、上述的CLLSR混合神经网络模型(CLLSR)对训练集和测试集的样本数据进行脉力等级预测,预测结果对比如表1所示。
表1
;
表1中,指标MAPE表示平均绝对百分比误差,指标MSLE表示均方对数误差,准确率(±10)表示±10分的脉力等级范围的样本数据的预测结果准确率,准确率(±5)表示±5分的脉力等级范围的样本数据的预测结果准确率。从表中可以看到本申请的CLLSR混合神经网络模型预测结果准确率最高。
综上所述,本申请的基于CLLSR混合模型的脉力等级预测方法具有以下优点:
对原始脉象数据经过一系列预处理,并由中医专家进行脉力等级评分,构建了带有脉力等级标签值的专家数据集。利用DTW算法对单周期波数据中的异常波动数据进行剔除,并从剔除异常波动的单周期波数据中利用平均法获取有效单周期波数据,平均法能够有效去除原始脉象数据中异常点的干扰。往有效单周期波数据中添加不同噪声来实现样本集的数据增强,在一定程度上提高了模型的泛化能力。利用CLLSR混合神经网络模型进行脉力等级预测,能够减少人工判断脉力的误差,提高预测准确性和可解释性。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种基于CLLSR混合模型的脉力等级预测方法,其特征在于,包括步骤:
A1.获取多个原始脉象数据,并对所述原始脉象数据进行脉力等级评分和数据预处理,得到多个样本数据,形成样本集;每个所述样本数据包括预处理后脉象数据和对应的脉力等级标签值;
A2.把所述样本集划分为训练集和测试集;
A3.构建基于CNN神经网络和LSTM神经网络的CLLSR混合神经网络模型;
A4.以所述样本数据中的预处理后脉象数据作为所述CLLSR混合神经网络模型的模型输入,并以脉力等级预测值作为所述CLLSR混合神经网络模型的模型输出,利用所述训练集对所述CLLSR混合神经网络模型进行训练,并以所述测试集对训练后的所述CLLSR混合神经网络模型进行测试,得到训练好的CLLSR混合神经网络模型;
A5.利用所述训练好的CLLSR混合神经网络模型对待测对象的实测脉象数据进行脉力等级预测。
2.根据权利要求1所述的基于CLLSR混合模型的脉力等级预测方法,其特征在于,步骤A1中,所述获取多个原始脉象数据的步骤包括:
针对多个受试者,通过压力传感器在每个所述受试者的寸口关部脉位处采集多个不同预压力下的脉象数据,记为第一脉象数据;
从同一个所述受试者对应不同预压力的多个所述第一脉象数据中,筛选一个最优脉象数据,作为对应受试者的所述原始脉象数据。
3.根据权利要求2所述的基于CLLSR混合模型的脉力等级预测方法,其特征在于,步骤A1中,对所述原始脉象数据进行数据预处理包括:
采用sliding-Mean算法对所述原始脉象数据进行平滑处理;
识别平滑处理后的原始脉象数据中的峰值点和谷值点;
根据所述峰值点和所述谷值点从平滑处理后的原始脉象数据中截取多段单周期波数据;
对截取得到的多段所述单周期波数据进行数据点对齐处理;
计算对齐处理后的多段单周期波数据两两之间的相似度距离;
根据所述相似度距离对对齐处理后的多段单周期波数据进行筛选,得到多段参考单周期波数据;
计算所述参考单周期波数据的平均单周期波数据,作为有效单周期波数据;所述预处理后脉象数据为所述有效单周期波数据。
4.根据权利要求3所述的基于CLLSR混合模型的脉力等级预测方法,其特征在于,步骤A1还包括:
对计算得到的所述有效单周期波数据进行随机噪声添加,得到新的有效单周期波数据;
把添加噪声前的所述有效单周期波数据对应的所述脉力等级标签值,作为相应的所述新的有效单周期波数据的脉力等级标签值。
5.根据权利要求3所述的基于CLLSR混合模型的脉力等级预测方法,其特征在于,所述计算对齐处理后的多段单周期波数据两两之间的相似度距离的步骤包括:
根据以下公式计算对齐处理后的多段单周期波数据两两之间的相似度距离:
;
其中,P和Q为对齐处理后的两段单周期波数据,为P和Q之间的相似度距离,/>是P和Q之间的最长公共子串,/>、/>分别是P和Q的数据长度,/>为P和Q之间的第k组配准元素之间的欧式距离,/>,i是第k组配准元素中属于P的元素的序号,j是第k组配准元素中属于Q的元素的序号,/>是第k组配准元素中属于P的元素,是第k组配准元素中属于Q的元素,K为P和Q之间的配准元素的组数。
6.根据权利要求1所述的基于CLLSR混合模型的脉力等级预测方法,其特征在于,所述CLLSR混合神经网络模型包括依次连接的输入层、三层一维CNN神经网络、两层LSTM神经网络、全连接层、标签平滑正则化层和输出层。
7.根据权利要求6所述的基于CLLSR混合模型的脉力等级预测方法,其特征在于,所述LSTM神经网络中的激活函数为ELU激活函数。
8.根据权利要求6所述的基于CLLSR混合模型的脉力等级预测方法,其特征在于,所述标签平滑正则化层对标签进行平滑处理的处理函数为:
;
其中,为平滑处理后的新标签,/>为真实标签,/>为超参数,/>为类别数,/>为被平滑处理的标签对应的类别。
9.根据权利要求1所述的基于CLLSR混合模型的脉力等级预测方法,其特征在于,步骤A4包括:
把训练集的样本数据中的预处理后脉象数据输入所述CLLSR混合神经网络模型,得到所述CLLSR混合神经网络模型输出的预测结果;
根据所述预测结果和对应的所述样本数据中的脉力等级标签值,计算损失函数;
若所述损失函数满足预设停止条件,则停止训练;
若所述损失函数不满足预设停止条件,则利用Adam优化器优化所述CLLSR混合神经网络模型的模型参数后,基于训练集中的下一个样本数据重复上述训练步骤;
停止训练后,利用所述测试集对训练后的所述CLLSR混合神经网络模型进行交叉验证,验证通过后得到训练好的CLLSR混合神经网络模型。
10.根据权利要求9所述的基于CLLSR混合模型的脉力等级预测方法,其特征在于,所述损失函数为平均绝对百分比误差或均方对数误差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410083997.5A CN117582185B (zh) | 2024-01-19 | 2024-01-19 | 一种基于cllsr混合模型的脉力等级预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410083997.5A CN117582185B (zh) | 2024-01-19 | 2024-01-19 | 一种基于cllsr混合模型的脉力等级预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117582185A true CN117582185A (zh) | 2024-02-23 |
CN117582185B CN117582185B (zh) | 2024-05-07 |
Family
ID=89912067
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410083997.5A Active CN117582185B (zh) | 2024-01-19 | 2024-01-19 | 一种基于cllsr混合模型的脉力等级预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117582185B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111310902A (zh) * | 2020-02-24 | 2020-06-19 | 石家庄铁道大学 | 神经网络模型的训练方法、边坡位移预测方法及相关装置 |
WO2021007812A1 (zh) * | 2019-07-17 | 2021-01-21 | 深圳大学 | 一种深度神经网络超参数优化方法、电子设备及存储介质 |
CN115251856A (zh) * | 2022-09-26 | 2022-11-01 | 季华实验室 | 脉力强弱判断方法、装置、电子设备及存储介质 |
CN115330807A (zh) * | 2022-07-12 | 2022-11-11 | 国电南瑞科技股份有限公司 | 一种基于混合卷积网络的脉络膜新生血管图像分割方法 |
CN116451129A (zh) * | 2023-02-01 | 2023-07-18 | 苏畅 | 一种脉象分类识别方法及系统 |
-
2024
- 2024-01-19 CN CN202410083997.5A patent/CN117582185B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021007812A1 (zh) * | 2019-07-17 | 2021-01-21 | 深圳大学 | 一种深度神经网络超参数优化方法、电子设备及存储介质 |
CN111310902A (zh) * | 2020-02-24 | 2020-06-19 | 石家庄铁道大学 | 神经网络模型的训练方法、边坡位移预测方法及相关装置 |
CN115330807A (zh) * | 2022-07-12 | 2022-11-11 | 国电南瑞科技股份有限公司 | 一种基于混合卷积网络的脉络膜新生血管图像分割方法 |
CN115251856A (zh) * | 2022-09-26 | 2022-11-01 | 季华实验室 | 脉力强弱判断方法、装置、电子设备及存储介质 |
CN116451129A (zh) * | 2023-02-01 | 2023-07-18 | 苏畅 | 一种脉象分类识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117582185B (zh) | 2024-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Patro et al. | An efficient optimized feature selection with machine learning approach for ECG biometric recognition | |
Dash et al. | Multi-channel EEG based automatic epileptic seizure detection using iterative filtering decomposition and Hidden Markov Model | |
Lu et al. | A method for optimal detection of lung cancer based on deep learning optimized by marine predators algorithm | |
CN107122643B (zh) | 基于ppg信号和呼吸信号特征融合的身份识别方法 | |
CN109431497A (zh) | 一种脑电信号处理方法及癫痫检测系统 | |
CN104809450B (zh) | 基于在线极限学习机的腕部静脉认证系统 | |
Zhang et al. | Explainability metrics of deep convolutional networks for photoplethysmography quality assessment | |
Nagwanshi et al. | Statistical feature analysis of human footprint for personal identification using bigml and ibm watson analytics | |
CN115204238B (zh) | 用于可穿戴设备上的ppg信号身份识别方法及可穿戴设备 | |
Chattoraj et al. | Classification of histopathological breast cancer images using iterative VMD aided Zernike moments & textural signatures | |
CN116361688A (zh) | 用于心电节律自动分类的多模态特征融合模型构建方法 | |
Bhardwaj et al. | Explainable deep convolutional neural network for valvular heart diseases classification using pcg signals | |
CN113116300A (zh) | 一种基于模型融合的生理信号分类方法 | |
CN116259415A (zh) | 一种基于机器学习的患者服药依从性预测方法 | |
Somervuo | Time–frequency warping of spectrograms applied to bird sound analyses | |
Nagadeepa et al. | Artificial Intelligence based Cervical Cancer Risk Prediction Using M1 Algorithms | |
Meltzer et al. | Efficient Clustering-Based electrocardiographic biometric identification | |
Nguyen et al. | Interpretable time series classification using all-subsequence learning and symbolic representations in time and frequency domains | |
Yang et al. | Automatic segmentation in fetal ultrasound images based on improved U-net | |
CN117582185B (zh) | 一种基于cllsr混合模型的脉力等级预测方法 | |
Pereira et al. | Initial study using electrocardiogram for authentication and identification | |
Andi et al. | Analysis of the random forest and grid search algorithms in early detection of diabetes mellitus disease | |
CN116451110A (zh) | 基于信号能量特征和脉搏周期的血糖预测模型构建方法 | |
Sorvillo et al. | Single beat ECG-based Identification System: Development and robustness test in different working conditions | |
CN115878966A (zh) | 基于对抗生成网络的心音数据增强方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |