CN118053597B - 一种基于内科检测电子数据的分析方法 - Google Patents
一种基于内科检测电子数据的分析方法 Download PDFInfo
- Publication number
- CN118053597B CN118053597B CN202410430574.6A CN202410430574A CN118053597B CN 118053597 B CN118053597 B CN 118053597B CN 202410430574 A CN202410430574 A CN 202410430574A CN 118053597 B CN118053597 B CN 118053597B
- Authority
- CN
- China
- Prior art keywords
- data
- internal medicine
- detection
- time sequence
- monitoring data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 275
- 239000003814 drug Substances 0.000 title claims abstract description 205
- 238000004458 analytical method Methods 0.000 title claims abstract description 37
- 238000012544 monitoring process Methods 0.000 claims abstract description 145
- 238000000034 method Methods 0.000 claims abstract description 39
- 230000008569 process Effects 0.000 claims abstract description 18
- 230000002776 aggregation Effects 0.000 claims abstract description 8
- 238000004220 aggregation Methods 0.000 claims abstract description 8
- 238000005457 optimization Methods 0.000 claims description 69
- 230000008859 change Effects 0.000 claims description 24
- 230000014759 maintenance of location Effects 0.000 claims description 11
- 238000010339 medical test Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 8
- 238000003064 k means clustering Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000008030 elimination Effects 0.000 description 4
- 238000003379 elimination reaction Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000010219 correlation analysis Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 206010061818 Disease progression Diseases 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003792 electrolyte Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 230000003907 kidney function Effects 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 230000003908 liver function Effects 0.000 description 1
- 230000004199 lung function Effects 0.000 description 1
- 230000027939 micturition Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
Landscapes
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及多维数据预处理技术领域,具体涉及一种基于内科检测电子数据的分析方法。该方法通过不同内科检测的时序监测数据上的转折程度和转折分布聚集性,得到每种内科检测的转折调整度;结合所有内科检测的时序监测数据中波动时长的近似程度,得到检测类别,根据检测类别中每种内科检测与其他所有内科检测在时序监测数据上数据点的变化关联程度,获得数据点的协变指标;格努转折调整度与协变指标通过道格拉斯普克算法获得每种内科检测的优化监测数据进行分析。本发明通过考虑内科检测本身数据的转折情况和不同内科检测间的关联性,自适应调整道格拉斯普克算法优化过程,得到质量更高的内科检测数据,使后续分析结果更可靠。
Description
技术领域
本发明涉及多维数据预处理技术领域,具体涉及一种基于内科检测电子数据的分析方法。
背景技术
内科检测电子数据通常指的是通过内科医疗设备或电子健康记录系统收集的患者相关的医学数据。这些数据包括但不限于生理参数、实验室检查结果、症状描述、医疗诊断、治疗计划等信息,这些数据可以以数字形式存储在电子健康记录系统中,提供全面的患者信息。这些信息的准确收集和分析有助于实现对患者更个性化的医疗护理,同时这些数据也是研究理解疾病发展和优化医疗流程的重要资源。
内科检测电子数据包括大量的长时间监测数据,这些监测数据在进行分析时由于监测采集点众多,导致将处于同一趋势下的监测数据分为多个段,那么在进行分析时这些属于一段趋势内的细小转折会增加需要分析的数据量,因此需要对这些不影响整体趋势的细小转折进行消除,以降低内科检测电子数据的处理难度,道格拉斯普克算法是一种用于曲线简化的算法,该算法可以将复杂的曲线通过去除冗余的点来近似表示为更简单的曲线,其通过判断曲线趋势内每个转折点与趋势拟合直线的距离与预设阈值的大小,从而判断拟合是否会影响趋势的变化,进而优化曲线,其可以用于对内科检测的监测数据中细小转折进行消除。但内科检测数据作为多维度的时序趋势变化数据,采用传统道格拉斯普克算法对多维内科检测数据进行拟合优化时,由于未考虑不同内科检测数据的趋势变化不同,固定不变的预设阈值参数会导致针对内科检测数据的拟合消除不能适应不同的内科检测数据,破坏了多维度的内科检测数据之间的关联性并使部分优化结果失真,内科检测数据的优化时序数据结果误差大,进而后续分析的结果更不可信。
发明内容
为了解决现有技术中传统道格拉斯普克算法对多维内科检测数据进行拟合优化时,未考虑不同内科检测数据的趋势变化不同,使得内科检测数据的优化时序数据结果误差大,进而后续分析的结果更不可信的技术问题,本发明的目的在于提供一种基于内科检测电子数据的分析方法,所采用的技术方案具体如下:
本发明提供了一种基于内科检测电子数据的分析方法,所述方法包括:
获得患者在不同内科检测的时序监测数据;
根据每种内科检测的时序监测数据的转折程度和转折分布聚集性,获得每种内科检测的转折调整度;
根据所有内科检测的时序监测数据中波动时长的近似程度,对所有内科检测聚类获得检测类别;根据每种内科检测与所在检测类别中其他所有内科检测在时序监测数据上的数据点变化关联程度,获得每种内科检测的时序监测数据中数据点的协变指标;
基于每种内科检测的转折调整度和数据点的协变指标,通过道格拉斯普克算法获得每种内科检测的优化监测数据;根据所有内科检测的优化监测数据进行分析。
进一步地,所述时序监测数据的获取方法包括:
获取患者在每个时刻下每种内科检测的监测数据,将监测数据去量纲处理后映射到时序空间中,并使用线性插值对监测数据中的残缺值进行插值拟合,获得每种内科检测的时序监测数据;
时序空间为时序坐标系,横轴表示为时间,纵轴表示为对应内科检测数据的数值;每种内科检测的时序监测数据在时序空间中的数据点呈曲线分布。
进一步地,所述转折调整度的获取方法包括:
对于任意一种内科检测的时序监测数据,依次将该内科检测的时序监测数据中的每个数据点作为参考点;将参考点相邻的数据点作为参考点的邻近点;
当邻近点为两个时,将参考点与每个邻近点间的连线作为转折线;将参考点对应的两个转折线之间的夹角进行归一化处理,获得参考点的转折指标;
根据该内科检测的时序监测数据中所有数据点的转折指标分布情况,获得该内科检测的转折调整度。
进一步地,所述转折调整度的表达式为:
;式中,表示为第种内科检测的转折调整度,表示为第种内科检测的时序监测数据中数据点的总数量,表示为第种内科检测的时序监测数据中所有数据点的转折指标的平均值,表示为第种内科检测的时序监测数据中第个数据点的转折指标,表示为第种内科检测的时序监测数据中所有数据点的转折指标的标准差,表示为以自然常数为底的指数函数,表示为归一化处理函数。
进一步地,所述根据所有内科检测的时序监测数据中波动时长的近似程度,对所有内科检测聚类获得检测类别,包括:
对于任意一种内科检测的时序监测数据,获取该内科检测的时序监测数据中的极小值点;
将每相邻两个极小值点之间的距离作为该内科检测的一个波动周长;计算该内科检测的所有波动周长的平均值,获得该内科检测的周期均长;
依据内科检测的周期均长对所有内科检测采用聚类算法,获得检测类别。
进一步地,所述协变指标的获取方法包括:
对于任意一个数据点,当该数据点存在后一个相邻数据点时,将该数据点的后一个相邻数据点的与该数据点的差值,作为该数据点的增量值;将该数据点对应内科检测所在检测类别中的其他内科检测作为该数据点的关联内科检测;
根据该数据点与所有关联内科检测的时序监测数据上对应数据点的增量值差异情况,以及该数据点所在内科检测与所有关联内科检测之间的相关程度,获得该数据点的协变指标。
进一步地,所述协变指标的表达式为:
;式中,表示为第种内科检测的时序监测数据中第个数据点的协变指标,表示为第种内科检测的时序监测数据中第个数据点的增量值,表示为第种内科检测的关联内科检测的总数量,表示为第个关联内科检测的时序监测数据中第个数据点的增量值,表示为第种内科检测与第个关联内科检测的时序监测数据的皮尔逊相关系数,表示为绝对值提取函数,表示为归一化函数。
进一步地,所述基于每种内科检测的转折调整度和数据点的协变指标,通过道格拉斯普克算法获得每种内科检测的优化监测数据,包括:
在对所有内科检测的时序监测数据采用道格拉斯普克算法进行优化过程中,将道格拉斯普克算法中的预设阈值与每种内科检测的转折调整度的乘积,作为每种内科检测的优化阈值;
依次将每种内科检测作为优化种类,将优化种类的时序监测数据中的第一个数据点与最后一个数据点作为优化种类的保留点;将相邻保留点间的连线作为连接直线;
对于任意一个连接直线,计算优化种类在该连接直线之间每个数据点与该连接直线的垂直距离,获得每个数据点在该连接直线下的判断距离;计算每个数据点的协变指标与判断距离的乘积,获得每个数据点在该连接直线下的优化距离;
当优化种类在该连接直线下的最大优化距离大于或等于优化种类的优化阈值时,将最大优化距离对应的数据点作为优化种类的保留点;当优化种类在该连接直线下的最大优化距离小于优化种类的优化阈值时,将优化种类在该连接直线之间的数据点筛除;
迭代确定保留点直至无可确定的数据点为止,将优化种类的所有保留点,作为优化种类的优化监测数据。
进一步地,所述获取该内科检测的时序监测数据中的极小值点,包括:
将内科检测的时序监测数据中一阶导为零,二阶导大于零的数据点,作为内科检测的时序监测数据中极小值点。
进一步地,所述聚类算法采用K均值聚类算法。
本发明具有如下有益效果:
本发明通过考虑不同内科检测数据在时序上的转折程度和转折分布聚集性,得到每种内科检测的转折调整度,以便于后续针对不同的转折信息对每种内科检测在进行道格拉斯普克算法优化时,自适应调整阈值,更好的保留重要小转折的数据点。同时,考虑到内科检测中数据点在道格拉斯普克算法进行简化时的重要程度不同,结合所有内科检测的时序监测数据中波动时长的近似程度,得到检测类别,使后续对具有相似波动的内科检测数据一致分析关联性更具有可信度。结合检测类别中每种内科检测与其他所有内科检测在时序监测数据上数据点的变化关联程度,获得数据点的协变指标,反映数据点的重要程度,以便于后续调整数据点在道格拉斯普克算法进行消除判断时的距离度量,使具有分析特征的数据点能够尽可能保留。最终综合转折调整度与协变指标通过道格拉斯普克算法获得每种内科检测更优质的优化监测数据进行分析。本发明通过考虑内科检测监测数据本身的转折信息和内科检测监测数据间的关联性,自适应调整内科检测数据在道格拉斯普克算法的优化过程,得到质量更高的内科检测数据,使后续分析结果更可靠。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种基于内科检测电子数据的分析方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于内科检测电子数据的分析方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于内科检测电子数据的分析方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种基于内科检测电子数据的分析方法流程图,该方法包括以下步骤:
S1:获得患者在不同内科检测的时序监测数据。
内科检测电子数据监测的是人体的体征数据,通过检测数据可反映患者的生理状态和病情变化等信息。许多内科检测数据需要通过长时间监测才能实现对体征状况的判断,如血糖、血压、心电图、肺功能指标、肾功能指标、肝功能指标和药物浓度等等种类的内科检测,这些需要长时间监测的数据能够反映患者更全面的体征状况,便于后续分析数据,这些监测的内科检测数据随人体的体征活动均呈现出周期性的波动变化,为了能够更高效对这些数据进行分析,需要进行简化处理。
首先需要收集数据获得患者在不同内科检测的时序监测数据,在本发明实施例中,针对任意一个患者的内科检测数据进行简化,在对每种内科检测数据采集时,获取患者在每个时刻下每种内科检测的监测数据,将监测数据去量纲处理后映射到时序空间中,并使用线性插值对监测数据中的残缺值进行插值拟合,获得每种内科检测的时序监测数据,其中时序空间为时序坐标系,横轴表示为时间,纵轴表示为对应内科检测数据的数值,每种内科检测的时序监测数据在时序空间中呈曲线分布,通过线性插值使得到的时序监测数据中数据点之间呈直线分布,贴合道格拉斯普克算法对曲线的优化过程。需要说明的是,对采集数据去量纲处理、映射时序空间以及线性插值拟合均为本领域技术人员熟知的技术手段,在此不做赘述。
S2:根据每种内科检测的时序监测数据的转折程度和转折分布聚集性,获得每种内科检测的转折调整度。
传统道格拉斯普克算法的基本思路为:预设一个阈值,即误差允许范围。在曲线的首尾两点间虚连一条直线,并求出其余各点到该直线的距离;找出这些距离中的最大值,并将其与阈值进行比较;若最大距离小于阈值,则认为该直线段可以作为曲线的近似,该段曲线处理完毕,若最大距离大于或等于阈值,则保留该点,并以该点为界将曲线分为两部分,对这两部分递归使用前述方法;当曲线无法再分为两部分时,算法结束,将所有简化后的曲线段连接起来,形成一个新的简化曲线。
对内科检测的时序监测数据通过预设阈值的方法进行化简时,由于不同内科检测在时序上的波动程度不同,对于波动较大的内科检测进行小波动消除的效果较好时,对于波动程度较小的时序监测数据可能造成过拟合消除,因为对于部分内科检测数据来说,其监测数据中的任何一个波动都可能是具有监测信息的波动。
对于内科检测的时序监测数据,若其本身存在较多的细小趋势转折,那么这些细小趋势转折可能由于小于阈值而被拟合掉,过多小趋势被拟合后会导致该内科检测数据的特征消失,即数据产生了失真效应。因此对于细小趋势转折较多的内科检测,在进行道格拉斯普克拟合时需要设置较小的阈值,故需要对每种内科检测的波动情况进行分析判断,根据每种内科检测的时序监测数据的波动程度和波动分布聚集性,获得每种内科检测的转折调整度。
优选地,对于任意一种内科检测的时序监测数据,依次将该内科检测的时序监测数据中的每个数据点作为参考点,将参考点相邻的数据点作为参考点的邻近点,对每个数据点根据左右相邻的数点所形成的在曲线中的转折情况进行分析,当邻近点为两个时,在除首尾数据点的情况下,每个数据点均具有左右相邻的两个数据点,故对除首尾外的数据点均进行转折情况分析,将参考点与每个邻近点间的连线作为转折线,将参考点对应的两个转折线之间的夹角进行归一化处理,获得参考点的转折指标,两个转折线之间的夹角范围在0°至180°之间,将夹角的度数进行归一化处理,方便对整体分析计算,当角度越大,说明两个转折线越趋向于形成直线,其参考点表征的转折程度是越小的。根据该内科检测的时序监测数据中所有数据点的转折指标分布程度,获得该内科检测的转折调整度,转折调整度的表达式为:
式中,表示为第种内科检测的转折调整度,表示为第种内科检测的时序监测数据中数据点的总数量,表示为第种内科检测的时序监测数据中所有数据点的转折指标的平均值,表示为第种内科检测的时序监测数据中第个数据点的转折指标,表示为第种内科检测的时序监测数据中所有数据点的转折指标的标准差,表示为以自然常数为底的指数函数,表示为归一化处理函数。
其中,表示为对第种内科检测的时序监测数据的所有转折指标的平均值进行归一化处理,由于角度越大,即转折指标越大,说明此处数据点的转折程度越小,其与相邻的数据点分布属于较为平滑的小转折,因此通过对整体数据点进行角度的分析,当平均角度越大,即所有转折指标的平均值越大,说明较小的转折越多,阈值需要调节的程度越高。表示为峰度计算,反映第种内科检测的时序监测数据中转折指标的聚集分布程度,当峰度越高,说明转折指标的分布越集中,越处于一个聚集范围内。
结合转折指标数值的分布情况,则越大,说明第种内科检测的时序监测数据中整体呈较为细小的转折,需要调整的阈值程度越大,将阈值越往小的方向调整,故通过负指数形式进行负相关归一化处理,得到第种内科检测的转折调整度,当转折调整度越小,则使道格拉斯普克算法的阈值越小。需要说明的是,峰度计算为本领域技术人员熟悉的公开技术公式,因此对于公式的具体意义不再赘述。
至此,完成对每种内科监测的时序监测数据的转折波动的分析,进行每种内科检测数据的阈值自适应调整。
S3:根据所有内科检测的时序监测数据中波动时长的近似程度,对所有内科检测聚类获得检测类别;根据每种内科检测与所在检测类别中其他所有内科检测在时序监测数据上的数据点变化关联程度,获得每种内科检测的时序监测数据中数据点的协变指标。
在内科检测的时序监测数据下,人体的体征数据是存在关联的协同变化的,即一项体征发生变化后会引起其他体征的变化,如血糖的升高会导致体内胰岛素的提升,并引起尿液中含有大量葡萄糖的频繁排尿,导致体内水分下降,同时影响体内电解质和肾指标。因此体征与体征之间的协变关系是存在正相关和负相关的,即在同一因素的影响下部分内科检测的时序监测数据之间存在关联变化情况。
由于并不是所有内科检测数据之间均存在联动变化,若整体进行关联分析将降低协变关系分析的可信度,故对监测过程中具有一定变化相似性的内科检测数据之间进行分析,先根据所有内科检测的时序监测数据中波动时长的近似程度,对所有内科检测聚类获得检测类别。
优选地,对于任意一种内科检测的时序监测数据,获取该内科检测的时序监测数据中的极小值点,在本发明实施例中,将内科检测的时序监测数据中一阶导为零,二阶导大于零的数据点,作为内科检测的时序监测数据中极小值点,导数的计算为本领域技术人员熟知的技术手段,在此不做赘述。将每相邻两个极小值点之间的距离作为该内科检测的一个波动周长,反映一次波动变化的时间长度。计算该内科检测的所有波动周长的平均值,获得该内科检测的周期均长,通过周期均长反映该内科检测数据的整体变化时间趋势情况。依据内科检测的周期均长对所有内科检测采用聚类算法,获得检测类别,也即为将周期均长相似的内科检测作为一个类别,对具有变化时间相似性的内科检测数据进行后续一致性分析,在本发明一个实施例中,将周期均长作为度量对所有内科检测采用K均值聚类算法进行聚类,K均值聚类算法为本领域技术人员熟知的技术手段,也可采用其他聚类算法进行聚类,在此不做赘述。
在同一个检测类别中,内科检测数据具有相似的波动长度,内科检测数据之间的关联变化情况极有可能存在协变情况,对于协变程度较高的数据点,说明数据点为整体变化中的数据点,提供的数据信息重要程度较弱,而对于不具有协变程度的数据点,其很有可能存在重要的异常信息,此时需要被重点考虑,减小其被消除的容易程度,以最大程度的保留具有分析价值的重要体征信息。因此进一步根据同一检测类别中内科检测的时序监测数据间的变化关联进行分析,故根据每种内科检测与所在检测类别中其他所有内科检测在时序监测数据上的数据点变化关联程度,获得每种内科检测的时序监测数据中数据点的协变指标。
优选地,对于任意一个数据点,当该数据点存在后一个相邻数据点时,将该数据点的后一个相邻数据点的与该数据点的差值,作为该数据点的增量值,也即为对除了最后一个末尾数据点外,其他每个数据点通过后一个数据点与该数据点的差值作为一个增量判断。将该数据点对应内科检测所在检测类别中的其他内科检测作为该数据点的关联内科检测,将该数据点协变判断的范围限制在同一检测类别当中,根据该数据点与所有关联内科检测的时序监测数据上对应数据点的增量值差异情况,以及该数据点所在内科检测与所有关联内科检测之间的相关程度,获得该数据点的协变指标,协变指标的表达式为:
式中,表示为第种内科检测的时序监测数据中第个数据点的协变指标,表示为第种内科检测的时序监测数据中第个数据点的增量值,表示为第种内科检测的关联内科检测的总数量,表示为第个关联内科检测的时序监测数据中第个数据点的增量值,表示为第种内科检测与第个关联内科检测的时序监测数据的皮尔逊相关系数,表示为绝对值提取函数,表示为归一化函数。
其中,通过表征的皮尔逊相关系数反映两种内科检测数据间的相关程度,将皮尔逊相关系数作为权重,对于越相关的关联内科检测,考虑其增量值的可信度越高,需要说明的是,皮尔逊相关系数为本领域技术人员熟知的技术手段,在此不做赘述,且由于增量值已经对于正相关变化和负相关变化区分考虑,因此即使皮尔逊相关系数表征的负相关性,其负权重也不影响对于差异的判断。表示为对关联内科检测的时序监测数据中对应第个数据点的增量进行加权考虑,由于不同内科检测数据在同时刻下均进行采集获取,在时序分布上相同,因此在时序监测数据中一定存在对应时序位置一致的第个数据点。
表示为对第个数据点的所有关联内科检测结合变化相似的可信度和增量值,综合得到第种内科检测的时序监测数据中第个数据点在关联下的增量值,通过差异计算,反映增量间的差异程度,当越大,说明第个数据点与关联下的其他数据的变化差异较大,该数据点越可能为不存在协变关系的数据点,该数据点被考虑的重要程度越高。由于在道格拉斯普克算法中,距离越大于阈值的数据点越可能被保留,因此通过的形式作为协变指标,以便于后续在道格拉斯普克算法中通过协变指标对数据点的距离向越大进行调整,以更好的保留数据点信息。
至此,通过不同内科检测之间的关联协同性,对数据点进行进一步变化分析,提高一些具有分析价值的数据点的保留程度,使后续数据简化后的结果质量更高。
S4:基于每种内科检测的转折调整度和数据点的协变指标,通过道格拉斯普克算法获得每种内科检测的优化监测数据;根据所有内科检测的优化监测数据进行分析。
通过调整阈值和考虑内科检测的数据点的本身重要性,可优化道格拉斯普克算法对每种内科检测的数据点进行简化的过程。故基于每种内科检测的转折调整度和数据点的协变指标,通过道格拉斯普克算法获得每种内科检测的优化监测数据。
优选地,在对所有内科检测的时序监测数据采用道格拉斯普克算法进行优化过程中,将道格拉斯普克算法中的预设阈值与每种内科检测的转折调整度的乘积,作为每种内科检测的优化阈值,需要说明的是,道格拉斯普克算法中的预设阈值为实施者根据具体实施情况自行设置,在此不做限制,仅对预设阈值考虑转折调整度后进行优化。
依次将每种内科检测作为优化种类,将优化种类的时序监测数据中的第一个数据点与最后一个数据点作为优化种类的保留点,将相邻保留点间的连线作为连接直线,对于任意一个连接直线,计算优化种类在该连接直线之间每个数据点与该连接直线的垂直距离,获得每个数据点在该连接直线下的判断距离,判断距离为传统道格拉斯普克算法进行判断的距离,此过程为道格拉斯普克算法中公知技术手段,计算每个数据点的协变指标与判断距离的乘积,获得每个数据点在该连接直线下的优化距离,通过协变指标对判断距离进行优化,使距离的度量考虑了数据点在体征关联信息上体现的重要程度,使优化过程更可信。
当优化种类在该连接直线下的最大优化距离大于或等于优化种类的优化阈值时,说明存在较为重要的数据点,将最大优化距离对应的数据点作为优化种类的保留点。当优化种类在该连接直线下的最大优化距离小于优化种类的优化阈值,将优化种类在该连接直线之间的数据点筛除,也即为对此连接直线之间的数据点进行消除处理,不进行后续判断。迭代确定保留点直至无可确定的数据点为止,完成对优化种类的时序监测数据的简化,需要说明的是,道格拉斯普克算法为本领域技术人员熟知的技术手段,具体迭代优化过程不再赘述。将优化种类的所有保留点,作为优化种类的优化监测数据,此时的优化监测数据为具有重要分析信息的监测体征数据。
最后,根据所有内科检测的优化监测数据进行分析,对于所有内科检测的优化监测数据可进行后续异常分析等,能够更高效的获得分析结果,在本发明一个实施例中,可将所有内科检测的优化监测数据输入至异常监测系统中,输出异常结果实现异常数据分析。在本发明其他实施例中,也可之间对优化监测数据进行离群点判断,当存在较多离群点时进行异常警告,在此不做限制。
综上,本发明通过考虑不同内科检测数据在时序上的转折程度和转折分布聚集性,得到每种内科检测的转折调整度,以便于后续针对不同的转折信息对每种内科检测在进行道格拉斯普克算法优化时,自适应调整阈值,更好的保留重要小转折的数据点。同时,考虑到内科检测中数据点在道格拉斯普克算法进行简化时的重要程度不同,结合所有内科检测的时序监测数据中波动时长的近似程度,得到检测类别,使后续对具有相似波动的内科检测数据一致分析关联性更具有可信度。结合检测类别中每种内科检测与其他所有内科检测在时序监测数据上数据点的变化关联程度,获得数据点的协变指标,反映数据点的重要程度,以便于后续调整数据点在道格拉斯普克算法进行消除判断时的距离度量,使具有分析特征的数据点能够尽可能保留。最终综合转折调整度与协变指标通过道格拉斯普克算法获得每种内科检测更优质的优化监测数据进行分析。本发明通过考虑内科检测监测数据本身的转折信息和内科检测监测数据间的关联性,自适应调整内科检测数据在道格拉斯普克算法的优化过程,得到质量更高的内科检测数据,使后续分析结果更可靠。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
Claims (6)
1.一种基于内科检测电子数据的分析方法,其特征在于,所述方法包括:
获得患者在不同内科检测的时序监测数据;
根据每种内科检测的时序监测数据的转折程度和转折分布聚集性,获得每种内科检测的转折调整度;
根据所有内科检测的时序监测数据中波动时长的近似程度,对所有内科检测聚类获得检测类别;根据每种内科检测与所在检测类别中其他所有内科检测在时序监测数据上的数据点变化关联程度,获得每种内科检测的时序监测数据中数据点的协变指标;
基于每种内科检测的转折调整度和数据点的协变指标,通过道格拉斯普克算法获得每种内科检测的优化监测数据;根据所有内科检测的优化监测数据进行分析;
所述转折调整度的获取方法包括:
对于任意一种内科检测的时序监测数据,依次将该内科检测的时序监测数据中的每个数据点作为参考点;将参考点相邻的数据点作为参考点的邻近点;
当邻近点为两个时,将参考点与每个邻近点间的连线作为转折线;将参考点对应的两个转折线之间的夹角进行归一化处理,获得参考点的转折指标;
根据该内科检测的时序监测数据中所有数据点的转折指标分布情况,获得该内科检测的转折调整度;
所述转折调整度的表达式为:
;式中,表示为第种内科检测的转折调整度,表示为第种内科检测的时序监测数据中数据点的总数量,表示为第种内科检测的时序监测数据中所有数据点的转折指标的平均值,表示为第种内科检测的时序监测数据中第个数据点的转折指标,表示为第种内科检测的时序监测数据中所有数据点的转折指标的标准差,表示为以自然常数为底的指数函数,表示为归一化处理函数;
所述协变指标的获取方法包括:
对于任意一个数据点,当该数据点存在后一个相邻数据点时,将该数据点的后一个相邻数据点的与该数据点的差值,作为该数据点的增量值;将该数据点对应内科检测所在检测类别中的其他内科检测作为该数据点的关联内科检测;
根据该数据点与所有关联内科检测的时序监测数据上对应数据点的增量值差异情况,以及该数据点所在内科检测与所有关联内科检测之间的相关程度,获得该数据点的协变指标;
所述协变指标的表达式为:
;式中,表示为第种内科检测的时序监测数据中第个数据点的协变指标,表示为第种内科检测的时序监测数据中第个数据点的增量值,表示为第种内科检测的关联内科检测的总数量,表示为第个关联内科检测的时序监测数据中第个数据点的增量值,表示为第种内科检测与第个关联内科检测的时序监测数据的皮尔逊相关系数,表示为绝对值提取函数。
2.根据权利要求1所述一种基于内科检测电子数据的分析方法,其特征在于,所述时序监测数据的获取方法包括:
获取患者在每个时刻下每种内科检测的监测数据,将监测数据去量纲处理后映射到时序空间中,并使用线性插值对监测数据中的残缺值进行插值拟合,获得每种内科检测的时序监测数据;
时序空间为时序坐标系,横轴表示为时间,纵轴表示为对应内科检测数据的数值;每种内科检测的时序监测数据在时序空间中的数据点呈曲线分布。
3.根据权利要求1所述一种基于内科检测电子数据的分析方法,其特征在于,所述根据所有内科检测的时序监测数据中波动时长的近似程度,对所有内科检测聚类获得检测类别,包括:
对于任意一种内科检测的时序监测数据,获取该内科检测的时序监测数据中的极小值点;
将每相邻两个极小值点之间的距离作为该内科检测的一个波动周长;计算该内科检测的所有波动周长的平均值,获得该内科检测的周期均长;
依据内科检测的周期均长对所有内科检测采用聚类算法,获得检测类别。
4.根据权利要求1所述一种基于内科检测电子数据的分析方法,其特征在于,所述基于每种内科检测的转折调整度和数据点的协变指标,通过道格拉斯普克算法获得每种内科检测的优化监测数据,包括:
在对所有内科检测的时序监测数据采用道格拉斯普克算法进行优化过程中,将道格拉斯普克算法中的预设阈值与每种内科检测的转折调整度的乘积,作为每种内科检测的优化阈值;
依次将每种内科检测作为优化种类,将优化种类的时序监测数据中的第一个数据点与最后一个数据点作为优化种类的保留点;将相邻保留点间的连线作为连接直线;
对于任意一个连接直线,计算优化种类在该连接直线之间每个数据点与该连接直线的垂直距离,获得每个数据点在该连接直线下的判断距离;计算每个数据点的协变指标与判断距离的乘积,获得每个数据点在该连接直线下的优化距离;
当优化种类在该连接直线下的最大优化距离大于或等于优化种类的优化阈值时,将最大优化距离对应的数据点作为优化种类的保留点;当优化种类在该连接直线下的最大优化距离小于优化种类的优化阈值时,将优化种类在该连接直线之间的数据点筛除;
迭代确定保留点直至无可确定的数据点为止,将优化种类的所有保留点,作为优化种类的优化监测数据。
5.根据权利要求3所述一种基于内科检测电子数据的分析方法,其特征在于,所述获取该内科检测的时序监测数据中的极小值点,包括:
将内科检测的时序监测数据中一阶导为零,二阶导大于零的数据点,作为内科检测的时序监测数据中极小值点。
6.根据权利要求3所述一种基于内科检测电子数据的分析方法,其特征在于,所述聚类算法采用K均值聚类算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410430574.6A CN118053597B (zh) | 2024-04-11 | 2024-04-11 | 一种基于内科检测电子数据的分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410430574.6A CN118053597B (zh) | 2024-04-11 | 2024-04-11 | 一种基于内科检测电子数据的分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118053597A CN118053597A (zh) | 2024-05-17 |
CN118053597B true CN118053597B (zh) | 2024-07-02 |
Family
ID=91046760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410430574.6A Active CN118053597B (zh) | 2024-04-11 | 2024-04-11 | 一种基于内科检测电子数据的分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118053597B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111916215A (zh) * | 2020-06-17 | 2020-11-10 | 扬州大学附属医院 | 一种群集性/慢性疾病早期自动报警、初步特征分析与风险评估系统 |
CN117854739A (zh) * | 2024-03-05 | 2024-04-09 | 天津市第二人民医院(天津市传染病医院) | 一种智能内科护理监控系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101650827B (zh) * | 2009-09-09 | 2011-12-14 | 西北工业大学 | 一种混合的大脑白质神经纤维自动聚类及标记方法 |
US8880352B2 (en) * | 2010-11-29 | 2014-11-04 | Siemens Aktiengesellschaft | System and method for analyzing an electrophysiological signal |
US11213258B2 (en) * | 2017-08-09 | 2022-01-04 | University of Pittsburgh—of the Commonwealth System of Higher Education | Variable index for determining patient status |
CN112401907A (zh) * | 2020-11-18 | 2021-02-26 | 江苏海洋大学 | 基于傅里叶同步压缩变换可靠划分脑低频波动子区域方法 |
CN117593308B (zh) * | 2024-01-19 | 2024-04-26 | 科普云医疗软件(深圳)有限公司 | 一种用于呼吸重症患者的呼吸监测预警方法 |
CN117609813B (zh) * | 2024-01-23 | 2024-04-23 | 山东第一医科大学附属省立医院(山东省立医院) | 一种重症患者监护数据智能管理方法 |
CN117786429B (zh) * | 2024-02-28 | 2024-05-07 | 齐鲁工业大学(山东省科学院) | 基于可穿戴设备的老人健康监测数据处理方法 |
-
2024
- 2024-04-11 CN CN202410430574.6A patent/CN118053597B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111916215A (zh) * | 2020-06-17 | 2020-11-10 | 扬州大学附属医院 | 一种群集性/慢性疾病早期自动报警、初步特征分析与风险评估系统 |
CN117854739A (zh) * | 2024-03-05 | 2024-04-09 | 天津市第二人民医院(天津市传染病医院) | 一种智能内科护理监控系统 |
Also Published As
Publication number | Publication date |
---|---|
CN118053597A (zh) | 2024-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Porumb et al. | Precision medicine and artificial intelligence: a pilot study on deep learning for hypoglycemic events detection based on ECG | |
JP5634065B2 (ja) | 生物医学的信号形態分析手法 | |
González et al. | A benchmark for machine-learning based non-invasive blood pressure estimation using photoplethysmogram | |
US20160045127A1 (en) | Automated detector and classifier of high frequency oscillations and indicator seizure onset | |
CN1836241A (zh) | 检测信号伪影的系统和方法 | |
CN118098606B (zh) | 一种基于体检数据的预警方法、介质及系统 | |
Dubatovka et al. | Automatic detection of atrial fibrillation from single-lead ECG using deep learning of the cardiac cycle | |
CN118236072B (zh) | 一种用于麻醉过程的患者体征状态监测方法 | |
CN113171059A (zh) | 多模态监测信息的术后end风险预警及相关设备 | |
CN116130104A (zh) | 基于机器学习的icu患者血糖预测模型构建方法 | |
CN116936107B (zh) | 基于卷积神经网络的心脏数据风险分析方法、系统及介质 | |
CN118053597B (zh) | 一种基于内科检测电子数据的分析方法 | |
CN117672445A (zh) | 基于大数据的糖尿病衰弱现状分析方法及系统 | |
CN117547237A (zh) | 基于ppg波形区域特征检测早搏的方法、装置、介质及设备 | |
CN114550910A (zh) | 基于人工智能的射血分数保留型心衰诊断及分型系统 | |
KR20220129283A (ko) | 인공지능 알고리즘 기반의 생체신호 비정상 측정상태 알림 시스템 및 방법 | |
Shankar et al. | Wavelet based Machine Learning Approaches towards Precision Medicine in Diabetes Mellitus. | |
CN114145722B (zh) | 一种面向胰腺炎患者的脉搏病理特征挖掘方法 | |
Giordano et al. | Comparison of Hierarchical and Partitional Clustering in Multi-Source Phonocardiography | |
CN118629656B (zh) | 一种医疗健康数据智慧化监测分析方法及系统 | |
CN118588316B (zh) | 一种儿童腹部术后康复数据处理方法及系统 | |
KR102371443B1 (ko) | 인공지능을 이용한 수면단계 분석 자동화 시스템 및 그 동작 방법 | |
CN118000683B (zh) | 基于人工智能的麻醉深度监测方法及系统 | |
CN118522470B (zh) | 基于协同诊断的带状疱疹疼痛患者的医疗数据处理方法 | |
WO2023249668A1 (en) | System and method for processing glucose data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |