CN109065158B - 大数据智能设备进行数据提取工作方法 - Google Patents

大数据智能设备进行数据提取工作方法 Download PDF

Info

Publication number
CN109065158B
CN109065158B CN201810962281.7A CN201810962281A CN109065158B CN 109065158 B CN109065158 B CN 109065158B CN 201810962281 A CN201810962281 A CN 201810962281A CN 109065158 B CN109065158 B CN 109065158B
Authority
CN
China
Prior art keywords
diagnosis
patient
data
diagnostic
undiagnosed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810962281.7A
Other languages
English (en)
Other versions
CN109065158A (zh
Inventor
段红华
张添靖
刘玉蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan deshanxin Pharmaceutical Technology Co., Ltd
Original Assignee
Hunan Deshanxin Pharmaceutical Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Deshanxin Pharmaceutical Technology Co Ltd filed Critical Hunan Deshanxin Pharmaceutical Technology Co Ltd
Priority to CN201810962281.7A priority Critical patent/CN109065158B/zh
Publication of CN109065158A publication Critical patent/CN109065158A/zh
Application granted granted Critical
Publication of CN109065158B publication Critical patent/CN109065158B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种大数据智能设备进行数据提取工作方法,包括如下步骤:S1,根据遗传算法形成特定区域患者疾病形成的计算模型,通过对疾病种类预测以及选择医院频率预测形成初步计算条件;S2,设置患者分布的权重规则条件,形成患者分布的目标函数构建体系,从而筛选出患者诊断分布结果;S3,根据患者诊断分布结果形成均衡图划分算法,最终对患者诊断布局做出准确提炼。

Description

大数据智能设备进行数据提取工作方法
技术领域
本发明涉及计算机数据挖掘领域,尤其涉及一种大数据智能设备进行数据提取工作方法。
背景技术
当今社会,患者希望通过先进的技术手段进行疾病的诊断和治疗,但是又苦于到医院门诊就医时候人满为患的烦恼,这就催生了通过远程进行诊断疾病的方法,但是现有技术进行医生匹配或者药物查询信息匹配度并不准确,也不能完全智能准确匹配患者的症状信息,以及患者诊断的数据收集工作,这就亟需本领域技术人员解决相应的技术问题。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种大数据智能设备进行数据提取工作方法。
为了实现本发明的上述目的,本发明提供了一种大数据智能设备进行数据提取工作方法,包括如下步骤:
S1,根据遗传算法形成特定区域患者疾病形成的计算模型,通过对疾病种类预测以及选择医院频率预测形成初步计算条件;
S2,设置患者分布的权重规则条件,形成患者分布的目标函数构建体系,从而筛选出患者诊断分布结果;
S3,根据患者诊断分布结果形成飞跃式均衡图划分算法,最终对患者诊断布局做出准确提炼。
优选的,所述S1包括:
S1-1,疾病诊断预测模型:
Figure BDA0001774106290000021
其中,a1为初期诊断记录值;a2为中期诊断记录值;a3为晚期诊断记录值;wa为疾病诊断程度权重,pi为疾病动态变化趋势量;ri为疾病治疗完成量;
Figure BDA0001774106290000022
为疾病动态变化随机干扰分量,γ为平衡系数,m为正整数;
S1-2,选择医院频率预测模型:
Figure BDA0001774106290000023
其中,b1为街道诊所就医频率预测值;b2为区级医院就医频率预测值;b3为二级甲等医院就医频率预测值;b4为三级甲等医院就医频率预测值;R为诊断周期分量;Vj为诊断出诊率随机干扰分量,t为响应周期,
Figure BDA0001774106290000027
为诊断偏差因子,μ为诊断费用消耗增量因子,β为延误诊断影响系数,Ψ为正态适度响应值,Aj为诊断次数动态预测值。
优选的,所述S2包括:
S2-1,对于患者分布考虑到各种特性之间的相关性,定义N为诊断后确诊数据,L为诊断后未确诊数据,M为未诊断数据,Sk为病症种类分量,B为偏移值,
Figure BDA0001774106290000024
为诊断后确诊数据限制函数,
Figure BDA0001774106290000025
为诊断后未确诊数据限制函数,
Figure BDA0001774106290000026
为未诊断数据限制函数,患者诊断后确诊实例xk,患者诊断后未确诊实例yk,患者未诊断实例zk,构建相关性权重规则如下:
Figure BDA0001774106290000031
xk,yk∈N+L or xk,yk,zk∈N+L+M;
S2-2,进行患者分布目标函数构建,形成患者诊断数据的目标函数算法如下:
Figure BDA0001774106290000032
w为诊断次数的偏置项,δ为诊断数据噪声,Pi(k)为患者诊断医院选择过程向量,k为患者数量,eW为迭代分量,字母W为区分度,下标i为正整数;
用该目标函数来度量过程向量Ci(k)的平滑状态值;
Figure BDA0001774106290000033
得到的平滑部分和高斯混合模型的似然估计进行线性组合,其中
Figure BDA0001774106290000034
为患者诊断后确诊估计因子,
Figure BDA0001774106290000035
为患者诊断后未确诊估计因子,
Figure BDA0001774106290000036
为患者未诊断估计因子,
Figure BDA0001774106290000037
为患者诊断后确诊获取样本,
Figure BDA0001774106290000038
为患者诊断后未确诊获取样本,
Figure BDA0001774106290000039
为患者未诊断获取样本,
Figure BDA00017741062900000310
为患者诊断后确诊损失样本,
Figure BDA00017741062900000311
为患者诊断后未确诊损失样本,
Figure BDA00017741062900000312
为患者未诊断损失样本,
该算法不仅考虑了数据的正态分布信息,也考虑了数据间的几何结构信息通过度量平滑度最终将患者分布相关度进行优化划分做准备。
优选的,所述S3包括:
S3-1,采用标签传播的方法,每次迭代过程中进行患者相关度匹配,从而对患者诊断过程中提炼出相关患者经常入住的医院和医院级别;
S3-2,为了防止过大的提炼数据集出现,对数据集的规模以及迭代次数进行了限制,每个数据集规模条件为
Figure BDA0001774106290000041
TV为获取诊断数据的极值,τ表示数据集获取系数,r为诊断样本分类数,Z为正整数;
S3-3,载入提炼数据集规模条件进行累加之后,如果
Figure BDA0001774106290000042
其中
Figure BDA0001774106290000043
为提炼诊断符合度,形成最大值的提炼数据集把患者诊断数据进行收集。
综上所述,由于采用了上述技术方案,本发明的有益效果是:通过对疾病种类预测以及选择医院频率预测形成初步计算条件;从而筛选出患者诊断分布结果;该算法不仅考虑了数据的正态分布信息,也考虑了数据间的几何结构信息通过度量平滑度最终将患者分布相关度进行优化划分做准备;然后完成最大值的提炼数据集,把患者诊断数据进行收集整理。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明工作流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
如图1所示,一种大数据智能设备进行数据提取工作方法,其特征在于,包括如下步骤:
S1,根据遗传算法形成特定区域患者疾病形成的计算模型,通过对疾病种类预测以及选择医院频率预测形成初步计算条件;
S2,设置患者分布的权重规则条件,形成患者分布的目标函数构建体系,从而筛选出患者诊断分布结果;
S3,根据患者诊断分布结果形成均衡图划分算法,最终对患者诊断布局做出准确提炼。
优选的,所述S1包括:
S1-1,疾病诊断预测模型:
Figure BDA0001774106290000051
其中,a1为初期诊断记录值;a2为中期诊断记录值;a3为晚期诊断记录值;wa为疾病诊断程度权重,pi为疾病动态变化趋势量;ri为疾病治疗完成量;
Figure BDA0001774106290000052
为疾病动态变化随机干扰分量,γ为平衡系数,m为正整数;
S1-2,选择医院频率预测模型:
Figure BDA0001774106290000053
其中,b1为街道诊所就医频率预测值;b2为区级医院就医频率预测值;b3为二级甲等医院就医频率预测值;b4为三级甲等医院就医频率预测值;R为诊断周期分量;Vj为诊断出诊率随机干扰分量,t为响应周期,
Figure BDA0001774106290000054
为诊断偏差因子,μ为诊断费用消耗增量因子,β为延误诊断影响系数,Ψ为正态适度响应值,Aj为诊断次数动态预测值。
优选的,所述S2包括:
S2-1,对于患者分布考虑到各种特性之间的相关性,定义N为诊断后确诊数据,L为诊断后未确诊数据,M为未诊断数据,Sk为病症种类分量,B为偏移值,
Figure BDA0001774106290000061
为诊断后确诊数据限制函数,
Figure BDA0001774106290000062
为诊断后未确诊数据限制函数,
Figure BDA0001774106290000063
为未诊断数据限制函数,患者诊断后确诊实例xk,患者诊断后未确诊实例yk,患者未诊断实例zk,构建相关性权重规则如下:
Figure BDA0001774106290000064
xk,yk∈N+L or xk,yk,zk∈N+L+M;
S2-2,进行患者分布目标函数构建,形成患者诊断数据的目标函数算法如下:
Figure BDA0001774106290000065
w为诊断次数的偏置项,δ为诊断数据噪声,Pi(k)为患者诊断医院选择过程向量,k为患者数量,eW为迭代分量,字母W为区分度,下标i为正整数;
用该目标函数来度量过程向量Ci(k)的平滑状态值;
Figure BDA0001774106290000066
得到的平滑部分和高斯混合模型的似然估计进行线性组合,其中
Figure BDA0001774106290000067
为患者诊断后确诊估计因子,
Figure BDA0001774106290000068
为患者诊断后未确诊估计因子,
Figure BDA0001774106290000069
为患者未诊断估计因子,
Figure BDA00017741062900000610
为患者诊断后确诊获取样本,
Figure BDA00017741062900000611
为患者诊断后未确诊获取样本,
Figure BDA00017741062900000612
为患者未诊断获取样本,
Figure BDA00017741062900000613
为患者诊断后确诊损失样本,
Figure BDA00017741062900000614
为患者诊断后未确诊损失样本,
Figure BDA00017741062900000615
为患者未诊断损失样本,
该算法不仅考虑了数据的正态分布信息,也考虑了数据间的几何结构信息通过度量平滑度最终将患者分布相关度进行优化划分做准备。
优选的,所述S3包括:
S3-1,采用标签传播的方法,每次迭代过程中进行患者相关度匹配,从而对患者诊断过程中提炼出相关患者经常入住的医院和医院级别;
S3-2,为了防止过大的提炼数据集出现,对数据集的规模以及迭代次数进行了限制,每个数据集规模条件为
Figure BDA0001774106290000071
TV为获取诊断数据的极值,τ表示数据集获取系数,r为诊断样本分类数,Z为正整数;
S3-3,载入提炼数据集规模条件进行累加之后,如果
Figure BDA0001774106290000072
其中
Figure BDA0001774106290000073
为提炼诊断符合度,形成最大值的提炼数据集把患者诊断数据进行收集。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (1)

1.一种大数据智能设备进行数据提取工作方法,其特征在于,包括如下步骤:
S1,根据遗传算法形成特定区域患者疾病形成的计算模型,通过对疾病诊断预测以及选择医院频率预测形成初步计算条件;
S1-1,疾病诊断预测模型:
Figure FDA0002437868920000011
其中,a1为初期诊断记录值;a2为中期诊断记录值;a3为晚期诊断记录值;wa为疾病诊断程度权重,pi为疾病动态变化趋势量;ri为疾病治疗完成量;
Figure FDA0002437868920000012
为疾病动态变化随机干扰分量,γ为平衡系数,m为正整数;
S1-2,选择医院频率预测模型:
Figure FDA0002437868920000013
其中,b1为街道诊所就医频率预测值;b2为区级医院就医频率预测值;b3为二级甲等医院就医频率预测值;b4为三级甲等医院就医频率预测值;R为诊断周期分量;Vj为诊断出诊率随机干扰分量,t为响应周期,
Figure FDA0002437868920000014
为诊断偏差因子,μ为诊断费用消耗增量因子,β为延误诊断影响系数,Ψ为正态适度响应值,Aj为诊断次数动态预测值;
S2,设置患者数据分布的权重规则条件,形成患者数据分布的目标函数构建体系,从而筛选出患者诊断数据分布结果;
S2-1,对于患者分布考虑到各种特性之间的相关性,定义N为诊断后确诊数据,L为诊断后未确诊数据,M为未诊断数据,Sk为病症种类分量,B为偏移值,
Figure FDA0002437868920000021
为诊断后确诊数据限制函数,
Figure FDA0002437868920000022
为诊断后未确诊数据限制函数,
Figure FDA0002437868920000023
为未诊断数据限制函数,患者诊断后确诊实例xk,患者诊断后未确诊实例yk,患者未诊断实例zk,构建相关性权重规则如下:
Figure FDA0002437868920000024
xk,yk∈N+L or xk,yk,zk∈N+L+M;
S2-2,进行患者分布目标函数构建,形成患者诊断数据的目标函数算法如下:
Figure FDA0002437868920000025
w为诊断次数的偏置项,δ为诊断数据噪声,Pi(k)为患者诊断医院选择过程向量,k为患者数量,eW为迭代分量,字母W为区分度,下标i为正整数;
用该目标函数来度量过程向量Ci(k)的平滑状态值;
Figure FDA0002437868920000026
得到的平滑部分和高斯混合模型的似然估计进行线性组合,其中
Figure FDA0002437868920000027
为患者诊断后确诊估计因子,
Figure FDA0002437868920000028
为患者诊断后未确诊估计因子,
Figure FDA0002437868920000029
为患者未诊断估计因子,
Figure FDA00024378689200000210
为患者诊断后确诊获取样本,
Figure FDA00024378689200000211
为患者诊断后未确诊获取样本,
Figure FDA00024378689200000212
为患者未诊断获取样本,
Figure FDA00024378689200000213
为患者诊断后确诊损失样本,
Figure FDA00024378689200000214
为患者诊断后未确诊损失样本,
Figure FDA00024378689200000215
为患者未诊断损失样本,
S3,根据患者诊断数据分布结果形成飞跃式均衡图划分算法,最终对患者诊断数据布局做出准确提炼;
S3-1,采用标签传播的方法,每次迭代过程中进行患者相关度匹配,从而对患者诊断过程中提炼出相关患者经常入住的医院和医院级别;
S3-2,为了防止过大的提炼数据集出现,对数据集的规模以及迭代次数进行了限制,每个数据集规模条件为
Figure FDA0002437868920000031
TV为获取诊断数据的极值,τ表示数据集获取系数,r为诊断样本分类数,Z为正整数;
S3-3,载入提炼数据集规模条件进行累加之后,如果
Figure FDA0002437868920000032
其中
Figure FDA0002437868920000033
为提炼诊断符合度,形成最大值的提炼数据集把患者诊断数据进行收集。
CN201810962281.7A 2018-08-22 2018-08-22 大数据智能设备进行数据提取工作方法 Active CN109065158B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810962281.7A CN109065158B (zh) 2018-08-22 2018-08-22 大数据智能设备进行数据提取工作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810962281.7A CN109065158B (zh) 2018-08-22 2018-08-22 大数据智能设备进行数据提取工作方法

Publications (2)

Publication Number Publication Date
CN109065158A CN109065158A (zh) 2018-12-21
CN109065158B true CN109065158B (zh) 2020-06-30

Family

ID=64686823

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810962281.7A Active CN109065158B (zh) 2018-08-22 2018-08-22 大数据智能设备进行数据提取工作方法

Country Status (1)

Country Link
CN (1) CN109065158B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109192301B (zh) * 2018-08-22 2022-02-18 重庆华医康道科技有限公司 通过互联网智能医疗健康设备进行患者诊断工作方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103093106A (zh) * 2013-01-25 2013-05-08 上海市浦东新区疾病预防控制中心 大型活动中多源数据的传染病症状监测与预警方法
CN105224821A (zh) * 2015-11-17 2016-01-06 中国人民解放军第二军医大学 一种基于gis的军队人员伤病信息监测预警系统及方法
CN106202883A (zh) * 2016-06-28 2016-12-07 成都中医药大学 一种基于大数据分析建立疾病云图的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103093106A (zh) * 2013-01-25 2013-05-08 上海市浦东新区疾病预防控制中心 大型活动中多源数据的传染病症状监测与预警方法
CN105224821A (zh) * 2015-11-17 2016-01-06 中国人民解放军第二军医大学 一种基于gis的军队人员伤病信息监测预警系统及方法
CN106202883A (zh) * 2016-06-28 2016-12-07 成都中医药大学 一种基于大数据分析建立疾病云图的方法

Also Published As

Publication number Publication date
CN109065158A (zh) 2018-12-21

Similar Documents

Publication Publication Date Title
Fröhlich et al. From hype to reality: data science enabling personalized medicine
US20160364537A1 (en) Diagnostic support systems using machine learning techniques
CN103177179B (zh) 诊断因素集合确定设备和方法
Pardo-Fernández et al. A review on ROC curves in the presence of covariates
JP2012221508A (ja) 患者予後を予測するシステムおよびコンピュータ可読媒体
JP2003521986A (ja) 急性の心筋梗塞に対する診断支援方法及び装置
US20160364545A1 (en) Expansion And Contraction Around Physiological Time-Series Trajectory For Current And Future Patient Condition Determination
Peterson et al. Personalized Gaussian processes for future prediction of Alzheimer's disease progression
JP2013088880A (ja) 診療情報処理装置および方法並びにプログラム
Wong et al. Effectiveness of late gadolinium enhancement to improve outcomes prediction in patients referred for cardiovascular magnetic resonance after echocardiography
CN105611872A (zh) 用于评估多通道ecg信号的装置和方法
JP6164678B2 (ja) ネットワークエントロピーに基づく生体の状態遷移の予兆の検出を支援する検出装置、検出方法及び検出プログラム
CN109065158B (zh) 大数据智能设备进行数据提取工作方法
US20090222248A1 (en) Method and system for determining a combined risk
Li et al. Dynamic prediction of motor diagnosis in Huntington’s disease using a joint modeling approach
Pang et al. Multimodal striatal neuromarkers in distinguishing parkinsonian variant of multiple system atrophy from idiopathic Parkinson's disease
Zhang et al. Deep learning for malignancy risk estimation of incidental sub-centimeter pulmonary nodules on CT images
CN117238460A (zh) 一种基于护理晨交班数据的病情监测方法和系统
CN109192301B (zh) 通过互联网智能医疗健康设备进行患者诊断工作方法
Lee et al. Applying reinforcement learning techniques to detect hepatocellular carcinoma under limited screening capacity
Jiang Receiver operating characteristic (ROC) analysis of image search-and-localize tasks
Sideris et al. A data-driven feature extraction framework for predicting the severity of condition of congestive heart failure patients
Garber et al. Predicting high-risk cholesterol levels
Weaver et al. Predicting biopsy outcome after mammography: what is the likelihood the patient has invasive or in situ breast cancer?
Rajmohan et al. G-Sep: A deep learning algorithm for detection of long-term sepsis using bidirectional gated recurrent unit

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Duan Honghua

Inventor after: Zhang Tianjing

Inventor after: Liu Yurong

Inventor before: Liu Yurong

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200608

Address after: 410005 West floor, no.824, Deya Road, Dongfeng Road Street, Kaifu District, Changsha City, Hunan Province

Applicant after: Hunan deshanxin Pharmaceutical Technology Co., Ltd

Address before: 401160 6 blocks 27-6, 123 Xinglong Avenue, Yongchuan District, Chongqing

Applicant before: CHONGQING ZHIQUAN ZHILU TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant