CN109166626A - 一种消化性溃疡病人的医疗指标缺失数据补全方法 - Google Patents
一种消化性溃疡病人的医疗指标缺失数据补全方法 Download PDFInfo
- Publication number
- CN109166626A CN109166626A CN201811270995.8A CN201811270995A CN109166626A CN 109166626 A CN109166626 A CN 109166626A CN 201811270995 A CN201811270995 A CN 201811270995A CN 109166626 A CN109166626 A CN 109166626A
- Authority
- CN
- China
- Prior art keywords
- matrix
- patient
- patients
- peptic ulcer
- completion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及一种消化性溃疡病人的医疗指标缺失数据补全方法,本发明将原有稀疏矩阵分解为两个具有相关关系的矩阵的乘积,克服了现有技术仅考虑了一个维度来进行补全的弊端,不仅考虑了病人之间相关关系这一维度,而且考虑了时序之间相关关系的维度;本发明使用矩阵分解的方法对溃疡病人在一年内的测量指标缺失数据进行补全,增加了数据准确性,能够为医生临床决策提供参考,也能利用补全的医疗数据对病人的病情及时监测,提高患者的治愈率。
Description
技术领域
本发明涉及医疗领域,更具体的,涉及一种消化性溃疡病人的医疗指标缺失数据补全方法。
背景技术
病历记录了病人的历史健康数据,包含病人的基本情况,每次的就诊记录,吃药治疗情况等。在大数据时代,合理的挖掘大量病历后面隐藏的信息,可以帮助医生进行临床决策。然而,医疗大数据由于不同病人就诊时间不同、每个人身体的特异性,使得随时间变化的医疗指标普遍具有缺失数据的问题。因此补全医疗记录中缺失的指标是一个重要的研究方向,并且出现了较多的数据补全算法。
2013年,Liu et al.提出了一种用于估计视觉数据中缺失值的张量补全方法。该方法可以通过传播结构来填充较大的缺失区域。首先定义张量迹范数,然后张量完成度表示为凸优化问题。这种基于张量的模型已经有较好的效果,但是因为矩阵有多重依赖关系,这个方法没有很好的体现数据之间的依赖性。
2014年,Chen提出一种通过结构化矩阵补全的鲁棒光谱压缩感知方法,这个方法是从n个时域样本的一个小随机子集中恢复一个光谱稀疏信号。但是这个方法更适合补全离散的数据,医疗数据与时序有高度的相关性,这个方法无法预测出更加真实的结果。
2015年,Rahman et al.提出了结合傅里叶变换和滞后k近邻法对生物医学时间序列数据缺失的补全方法。这是一个很好的补全缺失数据的方法,但是病历既有患者之间的相关关系,也有时间关系。这个方法的不足,在于它仅考虑了时间序列这一维度。
发明内容
为了解决现有技术中只考虑一个维度的弊端,本发明提供了一种消化性溃疡病人的医疗指标缺失数据补全方法。
为实现以上发明目的,采用的技术方案是:
一种消化性溃疡病人的医疗指标缺失数据补全方法,包括以下步骤:
步骤S1:读取消化性溃疡病人的检查信息;
步骤S2:对读取到的信息进行预处理,得到了每个病人每年的记录的稀疏矩阵Rm×n,m代表共有m个病人,n代表共有n个时间点;
步骤S3:将稀疏矩阵Rm×n分解为两个矩阵Pm×k和Qk×n,使得满足,
即两个矩阵的乘积即为相应的补全矩阵,从而补全缺失值。
优选的,所述预处理的具体步骤如下:
步骤S201:以月为单位对所有病人的时间进行对齐;
步骤S202:若某个病人某个月有多条测量记录,则将多个记录计算平均值,记为该病人该月的指标;若某个月无测量指标,则将该月记录置为-1;-1表示需要进行补全的缺失数据。
步骤S203:通过以上预处理步骤得到稀疏矩阵Rm×n。
优选的,所述分解为两个矩阵的具体过程如下:
步骤S301:定义分解矩阵的中间维度K,惩罚系数b以及学习率a;
步骤S302:使用最小二乘法对非缺失的值进行评估;
步骤S303:用L2进行正则化处理,对训练过程进行约束;
步骤S304:通过梯度下降的方法求解Pm×k和Qk×n矩阵;a、b在迭代中进行不断调参。
步骤S305:求解出Pm×k和Qk×n矩阵后,计算两组矩阵的乘积,结果即为相应的补全矩阵。
与现有技术相比,本发明的有益效果是:
相对于现有的缺失数据补全方法,例如均值法,k近邻法,回归法。本发明是将原有稀疏矩阵分解为两个具有相关关系的矩阵的乘积,本发明克服了现有技术仅考虑了一个维度来进行补全的弊端,不仅考虑了病人之间相关关系这一维度,而且考虑了时序之间相关关系的维度;本发明使用矩阵分解的方法对溃疡病人在一年内的测量指标缺失数据进行补全,增加了数据准确性,能够为医生临床决策提供参考。
附图说明
图1为本发明的流程图。
图2为每人每年需要记录的12条数据。
图3为最终的计算结果。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
以下结合附图和实施例对本发明做进一步的阐述。
实施例1
如图1、图2、图3所示,一种消化性溃疡病人的医疗指标缺失数据补全方法,包括以下步骤:
步骤S1:读取溃疡病人的测量数据,
步骤S2:对采集到的数据进行预处理;
医疗大数据预处理的主要目的是降低噪声数据对整体数据的影响,噪声数据包含以下几种,录入过程的错误,偏离大多数数据的异常值以及异构数据源合并带来的数据重复。
本实例中,通过统计的方法检测数值型属性,考虑属性的可能范围区间来识别异常值,或者可以用聚类的方式识别异常值。然后将异常数据使用众数修正。
步骤S201:对数据进行时间对齐
每个病人就诊的时间不同,对齐的原则是病人第一次被诊断为消化性溃疡疾病的时间作为每个人的第0年,然后测量指标的时间相对于自己的第0年进行修正。
每个人每年需要12条记录,本实施例中记录的数据如图2所示,对于对齐后形成的缺失矩阵进行补全,
步骤S202:若某个病人某个月有多条测量记录,则将多个记录计算平均值,记为该病人该月的指标;若某个月无测量指标,则将该月记录置为-1;-1表示需要进行补全的缺失数据。
步骤S203:通过以上预处理步骤得到稀疏矩阵Rm×n。
分解为两个矩阵的具体过程如下:
步骤S301:定义分解矩阵的中间维度K,惩罚系数b以及学习率a;
步骤S302:使用最小二乘法对非缺失的值进行评估;
步骤S303:用L2进行正则化处理,对训练过程进行约束;
步骤S304:通过梯度下降的方法求解Pm×k和Qk×n矩阵;a、b在迭代中进行不断调参。
步骤S305:求解出Pm×k和Qk×n矩阵后,计算两组矩阵的乘积,结果即为相应的补全矩阵,图3即为运行结果。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (3)
1.一种消化性溃疡病人的医疗指标缺失数据补全方法,其特征在于,包括以下步骤:
步骤S1:读取消化性溃疡病人的检查信息;
步骤S2:对读取到的信息进行预处理,得到了每个病人每年的记录的稀疏矩阵Rm×n,m代表共有m个病人,n代表共有n个时间点;
步骤S3:将稀疏矩阵Rm×n分解为两个矩阵Pm×k和Qk×n,使得满足,即两个矩阵的乘积即为相应的补全矩阵,从而补全缺失值。
2.根据权利要求1所述的消化性溃疡病人的医疗指标缺失数据补全方法,其特征在于,所述预处理的具体步骤如下:
步骤S201:以月为单位对所有病人的时间进行对齐;
步骤S202:若某个病人某个月有多条测量记录,则将多个记录计算平均值,记为该病人该月的指标;若某个月无测量指标,则将该月记录置为-1;-1表示需要进行补全的缺失数据。
步骤S203:通过以上预处理步骤得到稀疏矩阵Rm×n。
3.根据权利要求1所述的消化性溃疡病人的医疗指标缺失数据补全方法,其特征在于,所述分解为两个矩阵的具体过程如下:
步骤S301:定义分解矩阵的中间维度K,惩罚系数b以及学习率a;
步骤S302:使用最小二乘法对非缺失的值进行评估;
步骤S303:用L2进行正则化处理,对训练过程进行约束;
步骤S304:通过梯度下降的方法求解Pm×k和Qk×n矩阵;a、b在迭代中进行不断调参;
步骤S305:求解出Pm×k和Qk×n矩阵后,计算两组矩阵的乘积,结果即为相应的补全矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811270995.8A CN109166626B (zh) | 2018-10-29 | 2018-10-29 | 一种消化性溃疡病人的医疗指标缺失数据补全方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811270995.8A CN109166626B (zh) | 2018-10-29 | 2018-10-29 | 一种消化性溃疡病人的医疗指标缺失数据补全方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109166626A true CN109166626A (zh) | 2019-01-08 |
CN109166626B CN109166626B (zh) | 2021-09-14 |
Family
ID=64875475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811270995.8A Active CN109166626B (zh) | 2018-10-29 | 2018-10-29 | 一种消化性溃疡病人的医疗指标缺失数据补全方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109166626B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111063442A (zh) * | 2019-11-28 | 2020-04-24 | 南京邮电大学 | 基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统 |
CN111430013A (zh) * | 2020-03-24 | 2020-07-17 | 上海联影医疗科技有限公司 | 一种图像日期的补全方法、装置、设备及存储介质 |
CN112632462A (zh) * | 2020-12-22 | 2021-04-09 | 天津大学 | 基于时序矩阵分解的同步量测缺失数据修复方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170188869A1 (en) * | 2016-01-04 | 2017-07-06 | AventuSoft, LLC | System and method of extraction of the heart valve signals |
CN107658029A (zh) * | 2017-09-29 | 2018-02-02 | 杭州电子科技大学 | 一种全新的分布式和私有化miRNA‑疾病联系预测方法 |
CN107729914A (zh) * | 2017-09-06 | 2018-02-23 | 鲁小杰 | 一种病理数据的检测方法 |
CN107832170A (zh) * | 2017-10-31 | 2018-03-23 | 北京金风科创风电设备有限公司 | 缺失数据的恢复方法和装置 |
CN107945874A (zh) * | 2017-11-15 | 2018-04-20 | 北京军秀咨询有限公司 | 一种基于互联网的老年人健康评估体系 |
CN108109700A (zh) * | 2017-12-19 | 2018-06-01 | 中国科学院深圳先进技术研究院 | 一种慢性病药物疗效评价方法和装置 |
-
2018
- 2018-10-29 CN CN201811270995.8A patent/CN109166626B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170188869A1 (en) * | 2016-01-04 | 2017-07-06 | AventuSoft, LLC | System and method of extraction of the heart valve signals |
CN107729914A (zh) * | 2017-09-06 | 2018-02-23 | 鲁小杰 | 一种病理数据的检测方法 |
CN107658029A (zh) * | 2017-09-29 | 2018-02-02 | 杭州电子科技大学 | 一种全新的分布式和私有化miRNA‑疾病联系预测方法 |
CN107832170A (zh) * | 2017-10-31 | 2018-03-23 | 北京金风科创风电设备有限公司 | 缺失数据的恢复方法和装置 |
CN107945874A (zh) * | 2017-11-15 | 2018-04-20 | 北京军秀咨询有限公司 | 一种基于互联网的老年人健康评估体系 |
CN108109700A (zh) * | 2017-12-19 | 2018-06-01 | 中国科学院深圳先进技术研究院 | 一种慢性病药物疗效评价方法和装置 |
Non-Patent Citations (1)
Title |
---|
马锦华: "有监督的流形学习及其在人体行为识别中的应用", 《中山大学硕士学位论文》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111063442A (zh) * | 2019-11-28 | 2020-04-24 | 南京邮电大学 | 基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统 |
CN111063442B (zh) * | 2019-11-28 | 2022-07-15 | 南京邮电大学 | 基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统 |
CN111430013A (zh) * | 2020-03-24 | 2020-07-17 | 上海联影医疗科技有限公司 | 一种图像日期的补全方法、装置、设备及存储介质 |
CN111430013B (zh) * | 2020-03-24 | 2023-10-03 | 上海联影医疗科技股份有限公司 | 一种图像日期的补全方法、装置、设备及存储介质 |
CN112632462A (zh) * | 2020-12-22 | 2021-04-09 | 天津大学 | 基于时序矩阵分解的同步量测缺失数据修复方法及装置 |
CN112632462B (zh) * | 2020-12-22 | 2022-03-18 | 天津大学 | 基于时序矩阵分解的同步量测缺失数据修复方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109166626B (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | A deep learning framework for identifying children with ADHD using an EEG-based brain network | |
CN109166626A (zh) | 一种消化性溃疡病人的医疗指标缺失数据补全方法 | |
CN106778042A (zh) | 心脑血管患者相似性分析方法及系统 | |
Di et al. | Joint and individual representation of domains of physical activity, sleep, and circadian rhythmicity | |
Schuler et al. | Discovering patient phenotypes using generalized low rank models | |
Anguera et al. | Applying data mining techniques to medical time series: an empirical case study in electroencephalography and stabilometry | |
CN114190897B (zh) | 睡眠分期模型的训练方法、睡眠分期方法及装置 | |
Merrill et al. | Self-Supervised Pretraining and Transfer Learning Enable\titlebreak Flu and COVID-19 Predictions in Small Mobile Sensing Datasets | |
Aldhyani et al. | Using sequence mining to predict complex systems: a case study in influenza epidemics | |
Formaggio et al. | Reduced effective connectivity in the motor cortex in Parkinson’s disease | |
EP4149351A1 (en) | System and method for testing for sars-cov-2/covid-19 based on wearable medical sensors and neural networks | |
Bertl et al. | Evaluation of deep learning-based depression detection using medical claims data | |
CN116070693B (zh) | 患者信息与医疗服务关系检测模型训练、检测方法及装置 | |
KR20100062439A (ko) | 욕창발생 위험예측 베이지안 네트워크 시스템 | |
Hallgrímsson et al. | Learning individualized cardiovascular responses from large-scale wearable sensors data | |
Geng et al. | Multi-input, multi-output neuronal mode network approach to modeling the encoding dynamics and functional connectivity of neural systems | |
Dipro et al. | A federated learning approach for detecting Parkinson’s disease through privacy preserving by blockchain | |
Oh et al. | Extreme learning machine based mutual information estimation with application to time-series change-points detection | |
CN114649071A (zh) | 一种基于真实世界数据的消化性溃疡治疗方案的预测系统 | |
TWM605334U (zh) | 醫療穿戴裝置發展決策系統 | |
Balashankar et al. | Reconstructing the MERS disease outbreak from news | |
Singh et al. | Paris: Personalized activity recommendation for improving sleep quality | |
Cheng et al. | Improving personalized clinical risk prediction based on causality-based association rules | |
Dyagilev et al. | Learning a severity score for sepsis: A novel approach based on clinical comparisons | |
Hurwitz et al. | Harnessing consumer wearable digital biomarkers for individualized recognition of postpartum depression using the All of Us Research Program dataset |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |