CN112712895B - 针对2型糖尿病并发症的多模态大数据的数据分析方法 - Google Patents
针对2型糖尿病并发症的多模态大数据的数据分析方法 Download PDFInfo
- Publication number
- CN112712895B CN112712895B CN202110159364.4A CN202110159364A CN112712895B CN 112712895 B CN112712895 B CN 112712895B CN 202110159364 A CN202110159364 A CN 202110159364A CN 112712895 B CN112712895 B CN 112712895B
- Authority
- CN
- China
- Prior art keywords
- data
- big data
- neural network
- diabetes
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000007405 data analysis Methods 0.000 title claims abstract description 16
- 208000001072 type 2 diabetes mellitus Diseases 0.000 title claims abstract description 13
- 208000002249 Diabetes Complications Diseases 0.000 claims abstract description 59
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 19
- 238000011156 evaluation Methods 0.000 claims abstract description 16
- 230000008859 change Effects 0.000 claims abstract description 13
- 238000007418 data mining Methods 0.000 claims abstract description 8
- 238000013528 artificial neural network Methods 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 23
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 claims description 13
- 238000005259 measurement Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000004927 fusion Effects 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 9
- 206010012655 Diabetic complications Diseases 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 230000001537 neural effect Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims description 4
- 238000012098 association analyses Methods 0.000 claims description 3
- 238000007621 cluster analysis Methods 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000005096 rolling process Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 2
- 238000003062 neural network model Methods 0.000 claims description 2
- 238000003745 diagnosis Methods 0.000 abstract description 7
- 238000013399 early diagnosis Methods 0.000 abstract description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 15
- 201000010099 disease Diseases 0.000 description 14
- 206010012601 diabetes mellitus Diseases 0.000 description 6
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 102000004877 Insulin Human genes 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 210000005036 nerve Anatomy 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 208000017442 Retinal disease Diseases 0.000 description 1
- 206010038923 Retinopathy Diseases 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 229940126678 chinese medicines Drugs 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000003631 expected effect Effects 0.000 description 1
- 230000004153 glucose metabolism Effects 0.000 description 1
- 230000006371 metabolic abnormality Effects 0.000 description 1
- 206010062198 microangiopathy Diseases 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 208000033808 peripheral neuropathy Diseases 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 229940126673 western medicines Drugs 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- General Physics & Mathematics (AREA)
- Public Health (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Primary Health Care (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种针对2型糖尿病并发症的多模态大数据的数据分析方法,根据确定好的糖尿病并发症类型,获取糖尿病并发症类型对应的历史大数据;通过历史大数据在各模态下对应的变化率设计多密度量化器以得到实时数据的感知与获取方法;对历史大数据采用多模态数据挖掘方法,并结合卷积神经网络方法,提取出糖尿病并发症类型对应的特征信息;依据特征信息推导出历史大数据中感染糖尿病并发症类型的个体的动态演化规律;结合所述个体的动态演化规律得到实时数据的性能评估指标。通过本发明,能够预测糖尿病并发症的发病趋势,为糖尿病并发症的早诊断早治疗提供决策依据和技术支撑,提高了诊断效率和诊疗质量。
Description
技术领域
本发明涉及深度学习技术领域,更具体地说,涉及一种针对2型糖尿病并发症的多模态大数据的数据分析方法。
背景技术
国际糖尿病联盟(IDF)数据显示,2018年世界成年人口(22~79岁)的糖尿病患病率约为8.8%。2型糖尿病(T2DM)是机体胰岛素抵抗或胰岛素相对缺乏的一类代谢异常疾病,其患病总数占全部糖尿病患者的90%~95%。糖尿病及其并发症所造成的疾病负担已成为当前世界各国共同面临的重大公共健康问题和社会经济问题。
随着社会的发展,科学技术也相应地不断提高,全国各大小医院开始将自己存储数据的方式变得更加多样化,因此医疗多模态大数据的概念得到了广大专家学者的关注。临床疾病的多模态大数据是指对疾病从不同的角度和视觉采集得到的各类数据的集合。多模态大数据为复杂疾病的诊断研究提供了新的研究思路。海量多模态医疗数据中隐含着数据与疾病之间的相关性信息。
然而目前在临床上主要依靠临床表现和实验室检查做出诊断,而且随着近年来检测技术的发展,人类已经能够获得到更多的人体疾病相关的多种检查项目结果等多模态的数据,而这些数据往往与疾病间存在相关性。医疗临床资源丰富,病例病种全,多模态样本量巨大。但是由于缺乏大数据处理环境的支撑和多模态数据的有效利用,当前已有的疾病诊断研究仍然停留在传统的基于单模态的数据研究。
医学信息内容丰富多样,数据结构特殊,临床疾病大数据可能含有纯数据、图像、文字、检测信号、音频或者视频信息等。同时许多医学信息的表达、记录具有不确定性、模糊性、不完整性、带有噪声和冗余性等特征加大了医学数据挖掘的难度。尽管现如今科学界对数据的感知与获取方法有不少举足轻重的发展,但是在普适化多模态大数据环境下,数据量大及模态繁多给数据的采集、传输、清洗和储存带来了新的挑战,致使现有的方法无法直接融入到基于非侵入式普适化多模态大数据的信息提取及疾病演化规律的建模中。
然而,糖尿病(DM)患者病程较长,糖代谢的紊乱,常常会又发一系列的并发症,如视网膜病变、周围神经病变及全身性微血管病变等。糖尿病全世界发病率和病死率最高疾病之一,如何更好地控制和治疗DM已成为医学领域一个重要的课题。目前,单纯利用中西药治疗糖尿病难以到达预期的效果,同时还会引起各种不良反应,无法保证患者的生存质量得到改善。采用中西药治疗的同时,结合医疗大数据分析和挖掘方法,对于提高2型糖尿病的临床疗效及患者的生存质量具有重要意义。为此,特提出一种针对2型糖尿病并发症的多模态大数据的数据分析方法。
发明内容
本发明要解决的技术问题在于,针对现有技术的缺陷,提供一种针对2型糖尿病并发症的多模态大数据的数据分析方法。
本发明解决其技术问题所采用的技术方案是:构造一种针对2型糖尿病并发症的多模态大数据的数据分析方法,包括:
根据确定好的糖尿病并发症类型,获取所述糖尿病并发症类型对应的历史大数据;
通过所述历史大数据在不同模态下对应的变化率,设计多密度量化器以得到实时数据的感知与获取方法;
对所述历史大数据采用多模态数据挖掘方法,并结合卷积神经网络方法,提取出糖尿病并发症类型对应的特征信息;
依据所述特征信息推导出历史大数据中,感染糖尿病并发症类型的个体的动态演化规律,并结合所述个体的动态演化规律得到所述实时数据的性能评估指标。
其中,在通过所述历史大数据在不同模态下对应的变化率,设计多密度量化器以得到实时数据的感知与获取方法的步骤中,包括步骤:
按照所述变化率将所述历史大数据进行分段,并求解各分段结果对应的平均值;
按照各所述平均值的偏差的范围将所述平均值划分成多个集合,并求解所述集合的平均值;
计算所述集合中的测量数据的偏差,并根据所述测量数据的偏差与所述集合的平均值的对应关系设计预测函数;
根据所述预测函数将所述测量数据标准化;对标准化后的测量数据进行数据清洗,并依据传输网络的负载特性设置多密度量化器。
其中,所述多密度量化器用于根据传输网络的情况,动态调节量化器的设定值;由于实际传输网络的情况是动态的,多密度量化器保证最大效率量化数据,达到对多模态大数据的高效传输。
其中,通过将量化处理后的数据写成输出值加上一个高斯噪声的形式,即:
其中,yi(k)为实际测量数据,为量化后的测量数据,qi(k)为量化误差;
求出相应时刻的负载度,并根据历史大数据统计数据变化的窗口值,结合数据仓库所需要的精度和负载设计多密度量化器。
其中,在构建多密度量化器的步骤中,包括步骤:
对采集到的数据进行融合分析,针对数据不同特性,对数据进行特征抽取及属性融合,针对不同应用需求及数据结构,构建聚类分析、关联分析和分类预测算法库,实现对来自多源的结构化数据和非结构化数据进行融合分析。
其中,在对所述历史大数据采用多模态数据挖掘方法,并结合卷积神经网络方法,提取出糖尿病并发症类型对应的特征信息的步骤中,包括步骤:
将糖尿病并发症与危险因素的影响关系生成关系矩阵;
依据所述关系矩阵设定目标函数,并对所述目标函数极小化;其中,所述目标函数为:
其中,Mij为所述关系矩阵,U为糖尿病并发症,V为危险因素,Xu表示糖尿病并发症的特征,Xv为危险因素的特征,R(U,V)是对U与V的规则化约束,Ru(U,Xu)为U对Xu的规则化约束,Rv(V,Xv)为V对Xv的规则化约束,λ、λu和λv分别为对应规则化约束项的权重,值在0~1之间,L(Ui,Vj,Mij)为Ui、Vi和Mij的关系函数;
按照测量数据所属模态的类型建立多种卷积核;对所述卷积核进行混合采样得到所述特征信息;将所述特征信息与所述卷积神经网络的输出层全连接。
其中,卷积神经网络方法采用了前后传输的输出值,反向传播权重和偏置,内部的神经网络中相邻之间额神经单元采用部分连接,使上层的部分神经元,通过神经网络内部的神经元进行感知,有助于从医疗多模态大数据中抽取深层次的知识,从而建立针对多模态大数据的深度认识;建立卷积神经网络,利用卷积神经网络中的特征图,共用一个卷积神经网络核;其中每一个特征图都是由多个神经单元组成;通过实现特征数据与输出层的全连接,利用后传播神经网络的方式调整权重和偏置;通过梯度下降法来求解神经网络。
其中,个体的动态演化规律具体通过如下步骤得到:采用基于聚类和SVD算法的模糊逻辑系统辨识法建立所述特征信息与糖尿病并发症个体演化规律之间的模糊动态治疗模型。
个体的动态演化规律得到所述实时数据的性能评估指标具体包括:
基于所述模糊动态治疗模型中的目标函数,通过迭代优化算法建立糖尿病并发症性能评估指标;
计算所述糖尿病并发症性能评估指标的最小值;
基于所述糖尿病并发症性能评估指标,利用滚动优化算法得到最优的糖尿病并发症治疗序列;
通过所述实时数据对所述糖尿病并发症治疗序列进行反馈矫正;
依据所述个体的动态演化规律建立所述糖尿病并发症类型对应的群体的动态演化规律。
区别于现有技术,本发明提供了一种针对2型糖尿病并发症的多模态大数据的数据分析方法,有效地克服传统数据分析方法仅考虑糖尿病并发症患者生理单模态数据的局限性,能够综合考虑疾病的危险因素,为医院提供更加详尽且准确的临床诊断标准,同时能给出多模态大数据与糖尿病并发症的个体的动态演化规律,预测糖尿病并发症的发病趋势,为糖尿病并发症的早诊断早治疗提供决策依据和技术支撑,提高了诊断效率和诊疗质量;同时本发明通过多模态的神经网络计算模型同时将学习模型从向量空间扩展到张量空间,通过面向张量空间的高阶反向传播算法,对神经网络的各参数进行反向推演。实验结果表明多模态的神经网络计算模型能够快速准确的对复杂数据进行特征学习,比常规的基于张量空间的多层神经网络计算模型具有明显优势。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明提供的一种针对2型糖尿病并发症的多模态大数据的数据分析方法的流程示意图。
实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
如图1所示,本发明提供了一种针对2型糖尿病并发症的多模态大数据的数据分析方法,包括:
根据确定好的糖尿病并发症类型,获取所述糖尿病并发症类型对应的历史大数据;
通过所述历史大数据在不同模态下对应的变化率,设计多密度量化器以得到实时数据的感知与获取方法;
对所述历史大数据采用多模态数据挖掘方法,并结合卷积神经网络方法,提取出糖尿病并发症类型对应的特征信息;
依据所述特征信息推导出历史大数据中,感染糖尿病并发症类型的个体的动态演化规律,并结合所述个体的动态演化规律得到所述实时数据的性能评估指标。
其中,在通过所述历史大数据在不同模态下对应的变化率,设计多密度量化器以得到实时数据的感知与获取方法的步骤中,包括步骤:
按照所述变化率将所述历史大数据进行分段,并求解各分段结果对应的平均值;
按照各所述平均值的偏差的范围将所述平均值划分成多个集合,并求解所述集合的平均值;
计算所述集合中的测量数据的偏差,并根据所述测量数据的偏差与所述集合的平均值的对应关系设计预测函数;
根据所述预测函数将所述测量数据标准化;对标准化后的测量数据进行数据清洗,并依据传输网络的负载特性设置多密度量化器。
其中,所述多密度量化器用于根据传输网络的情况,动态调节量化器的设定值;由于实际传输网络的情况是动态的,多密度量化器保证最大效率量化数据,达到对多模态大数据的高效传输。
其中,通过将量化处理后的数据写成输出值加上一个高斯噪声的形式,即:
其中,yi(k)为实际测量数据,为量化后的测量数据,qi(k)为量化误差;
求出相应时刻的负载度,并根据历史大数据统计数据变化的窗口值,结合数据仓库所需要的精度和负载设计多密度量化器。
其中,在构建多密度量化器的步骤中,包括步骤:
对采集到的数据进行融合分析,针对数据不同特性,对数据进行特征抽取及属性融合,针对不同应用需求及数据结构,构建聚类分析、关联分析和分类预测算法库,实现对来自多源的结构化数据和非结构化数据进行融合分析。
其中,在对所述历史大数据采用多模态数据挖掘方法,并结合卷积神经网络方法,提取出糖尿病并发症类型对应的特征信息的步骤中,包括步骤:
将糖尿病并发症与危险因素的影响关系生成关系矩阵;
依据所述关系矩阵设定目标函数,并对所述目标函数极小化;其中,所述目标函数为:
其中,Mij为所述关系矩阵,U为糖尿病并发症,V为危险因素,Xu表示糖尿病并发症的特征,Xv为危险因素的特征,R(U,V)是对U与V的规则化约束,Ru(U,Xu)为U对Xu的规则化约束,Rv(V,Xv)为V对Xv的规则化约束,λ、λu和λv分别为对应规则化约束项的权重,值在0~1之间,L(Ui,Vj,Mij)为Ui、Vi和Mij的关系函数;
按照测量数据所属模态的类型建立多种卷积核;对所述卷积核进行混合采样得到所述特征信息;将所述特征信息与所述卷积神经网络的输出层全连接。
在建模过程中,复杂综合数据之间具有多种互相限制的关联关系,使神经网络的训练时间延长,收敛性变得困难。多模态神经网络通过张量对复杂数据进行解析,求解向量数据的模态张量值,建立模态张量数据表示的高阶模型。在求解分布特征时,采用模态张量差值构造误差重构函数,从而设计反向传播计算方法,最终将多个模态张量高阶模型进行组合,建立面向复杂大数据特征学习的多模态的多层神经网络计算模型。
在建立高阶模型时,首先应提取最原始有效数据的张量模态值,通过对第一层的训练获取其有效特征,以第一层的隐藏特征为输入,接下去对第二层进行训练来获得第二层的隐藏特征,重复上述步骤一直到多模态的多层神经网络模型所有隐藏数据类型全都分析提取完毕。将获得数据结果记录为首次训练过程,该结果可以用于海量复杂数据的特征学习。首次训练完成后,会给每个数据类型分配相应的类属标签,根据数据类型的类属标签,可以利用有监督算法对多层神经网络计算模型的参数进行再次训练补偿,进而获得多模态的多层神经网络计算模型的最终参数。
其中,卷积神经网络方法采用了前后传输的输出值,反向传播权重和偏置,内部的神经网络中相邻之间额神经单元采用部分连接,使上层的部分神经元,通过神经网络内部的神经元进行感知,有助于从医疗多模态大数据中抽取深层次的知识,从而建立针对多模态大数据的深度认识;建立卷积神经网络,利用卷积神经网络中的特征图,共用一个卷积神经网络核;其中每一个特征图都是由多个神经单元组成;通过实现特征数据与输出层的全连接,利用后传播神经网络的方式调整权重和偏置;通过梯度下降法来求解神经网络。
其中,个体的动态演化规律具体通过如下步骤得到:采用基于聚类和SVD算法的模糊逻辑系统辨识法建立所述特征信息与糖尿病并发症个体演化规律之间的模糊动态治疗模型。
个体的动态演化规律得到所述实时数据的性能评估指标具体包括:
基于所述模糊动态治疗模型中的目标函数,通过迭代优化算法建立糖尿病并发症性能评估指标;
计算所述糖尿病并发症性能评估指标的最小值;
基于所述糖尿病并发症性能评估指标,利用滚动优化算法得到最优的糖尿病并发症治疗序列;
通过所述实时数据对所述糖尿病并发症治疗序列进行反馈矫正;
依据所述个体的动态演化规律建立所述糖尿病并发症类型对应的群体的动态演化规律。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (5)
1.一种针对2型糖尿病并发症的多模态大数据的数据分析方法,其特征在于,包括:
根据确定好的糖尿病并发症类型,获取所述糖尿病并发症类型对应的历史大数据;
通过所述历史大数据在不同模态下对应的变化率,设计多密度量化器以得到实时数据的感知与获取方法;
对所述历史大数据采用多模态数据挖掘方法,并结合卷积神经网络方法,提取出糖尿病并发症类型对应的特征信息;其中,
在建模过程中,通过多模态神经网络的张量对所述历史大数据进行解析,求解向量数据的模态张量值,建立模态张量数据表示的高阶模型;在求解分布特征时,采用模态张量差值构造误差重构函数,设计反向传播计算方法,将多个模态张量高阶模型进行组合,建立面向复杂大数据特征学习的多模态的多层神经网络计算模型;
在建立高阶模型时,提取最原始有效数据的张量模态值,通过对第一层的训练获取其有效特征,以第一层的隐藏特征为输入,对第二层进行训练来获得第二层的隐藏特征,重复上述步骤直到多模态的多层神经网络模型所有隐藏数据类型全都分析提取完毕;将获得数据结果记录为首次训练过程,结果用于海量复杂数据的特征学习;首次训练完成后,给每个数据类型分配相应的类属标签,根据数据类型的类属标签,利用有监督算法对多层神经网络计算模型的参数进行再次训练补偿,获得多模态的多层神经网络计算模型的最终参数;
卷积神经网络方法采用了前后传输的输出值,反向传播权重和偏置,内部的神经网络中相邻之间的神经单元采用部分连接,使上层的部分神经元,通过神经网络内部的神经元进行感知,建立针对多模态大数据的深度认识;建立卷积神经网络,利用卷积神经网络中的特征图,共用一个卷积神经网络核;其中每一个特征图都是由多个神经单元组成;通过实现特征数据与输出层的全连接,利用后传播神经网络的方式调整权重和偏置;通过梯度下降法来求解神经网络;
依据所述特征信息推导出历史大数据中,感染糖尿病并发症类型的个体的动态演化规律,并结合所述个体的动态演化规律得到所述实时数据的性能评估指标;其中,
个体的动态演化规律具体通过如下步骤得到:采用基于聚类和SVD算法的模糊逻辑系统辨识法建立所述特征信息与糖尿病并发症个体演化规律之间的模糊动态治疗模型;
个体的动态演化规律得到所述实时数据的性能评估指标具体包括:
基于所述模糊动态治疗模型中的目标函数,通过迭代优化算法建立糖尿病并发症性能评估指标;
计算所述糖尿病并发症性能评估指标的最小值;
基于所述糖尿病并发症性能评估指标,利用滚动优化算法得到最优的糖尿病并发症治疗序列;
通过所述实时数据对所述糖尿病并发症治疗序列进行反馈矫正;
依据所述个体的动态演化规律建立所述糖尿病并发症类型对应的群体的动态演化规律。
2.根据权利要求1所述的针对2型糖尿病并发症的多模态大数据的数据分析方法,其特征在于,在通过所述历史大数据在不同模态下对应的变化率,设计多密度量化器以得到实时数据的感知与获取方法的步骤中,包括步骤:
按照所述变化率将所述历史大数据进行分段,并求解各分段结果对应的平均值;
按照各所述平均值的偏差的范围将所述平均值划分成多个集合,并求解所述集合的平均值;
计算所述集合中的测量数据的偏差,并根据所述测量数据的偏差与所述集合的平均值的对应关系设计预测函数;
根据所述预测函数将所述测量数据标准化;对标准化后的测量数据进行数据清洗,并依据传输网络的负载特性设置多密度量化器。
3.根据权利要求2所述的针对2型糖尿病并发症的多模态大数据的数据分析方法,其特征在于,所述多密度量化器用于根据传输网络的情况,动态调节量化器的设定值;由于实际传输网络的情况是动态的,多密度量化器保证最大效率量化数据,达到对多模态大数据的高效传输;将量化处理后的数据写成输出值加上一个高斯噪声的形式,即:
其中,yi(k)为实际测量数据,/>为量化后的测量数据,qi(k)为量化误差;求出相应时刻的负载度,并根据历史大数据统计数据变化的窗口值,结合数据仓库所需要的精度和负载设计多密度量化器。
4.根据权利要求2所述的针对2型糖尿病并发症的多模态大数据的数据分析方法,其特征在于,在构建多密度量化器的步骤中,包括步骤:
对采集到的数据进行融合分析,针对数据不同特性,对数据进行特征抽取及属性融合,针对不同应用需求及数据结构,构建聚类分析、关联分析和分类预测算法库,实现对来自多源的结构化数据和非结构化数据进行融合分析。
5.根据权利要求1所述的针对2型糖尿病并发症的多模态大数据的数据分析方法,其特征在于,在对所述历史大数据采用多模态数据挖掘方法,并结合卷积神经网络方法,提取出糖尿病并发症类型对应的特征信息的步骤中,包括步骤:
将糖尿病并发症与危险因素的影响关系生成关系矩阵;依据所述关系矩阵设定目标函数,并对所述目标函数极小化;其中,所述目标函数为:
其中,Mij为所述关系矩阵,U为糖尿病并发症,V为危险因素,Xu表示糖尿病并发症的特征,Xv为危险因素的特征,R(U,V)是对U与V的规则化约束,Ru(U,Xu)为U对Xu的规则化约束,Rv(V,Xv)为V对Xv的规则化约束,λ、λu和λv分别为对应规则化约束项的权重,值在0~1之间,L(Ui,Vj,Mij)为Ui、Vj和Mij的关系函数;按照测量数据所属模态的类型建立多种卷积核;对所述卷积核进行混合采样得到所述特征信息;将所述特征信息与所述卷积神经网络的输出层全连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110159364.4A CN112712895B (zh) | 2021-02-04 | 2021-02-04 | 针对2型糖尿病并发症的多模态大数据的数据分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110159364.4A CN112712895B (zh) | 2021-02-04 | 2021-02-04 | 针对2型糖尿病并发症的多模态大数据的数据分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112712895A CN112712895A (zh) | 2021-04-27 |
CN112712895B true CN112712895B (zh) | 2024-01-26 |
Family
ID=75549953
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110159364.4A Active CN112712895B (zh) | 2021-02-04 | 2021-02-04 | 针对2型糖尿病并发症的多模态大数据的数据分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112712895B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115831364B (zh) * | 2022-12-14 | 2023-09-08 | 东北林业大学 | 基于多模态特征融合的2型糖尿病风险分层预测方法 |
CN117253614B (zh) * | 2023-11-14 | 2024-01-26 | 天津医科大学朱宪彝纪念医院(天津医科大学代谢病医院、天津代谢病防治中心) | 基于大数据分析的糖尿病风险预警方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160043527A (ko) * | 2016-03-31 | 2016-04-21 | 강수진 | 당뇨병 및 당뇨 합병증 관리시스템과 방법 |
CN107273685A (zh) * | 2017-06-14 | 2017-10-20 | 广东工业大学 | 一种针对临床疾病的多模态大数据的数据分析方法 |
CN107578822A (zh) * | 2017-07-25 | 2018-01-12 | 广东工业大学 | 一种针对医疗多模态大数据的预处理及特征提取方法 |
CN109543719A (zh) * | 2018-10-30 | 2019-03-29 | 浙江大学 | 基于多模态注意力模型的宫颈非典型病变诊断模型和装置 |
CN110299005A (zh) * | 2019-06-10 | 2019-10-01 | 浙江大学 | 一种基于深度集成学习的城市大规模路网交通速度预测方法 |
CN111127441A (zh) * | 2019-12-25 | 2020-05-08 | 兰州大学 | 一种基于图节点嵌入的多模态脑影像抑郁识别方法和系统 |
CN112308306A (zh) * | 2020-10-27 | 2021-02-02 | 贵州工程应用技术学院 | 一种多模态输入的煤与瓦斯突出危险预测方法 |
-
2021
- 2021-02-04 CN CN202110159364.4A patent/CN112712895B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160043527A (ko) * | 2016-03-31 | 2016-04-21 | 강수진 | 당뇨병 및 당뇨 합병증 관리시스템과 방법 |
CN107273685A (zh) * | 2017-06-14 | 2017-10-20 | 广东工业大学 | 一种针对临床疾病的多模态大数据的数据分析方法 |
CN107578822A (zh) * | 2017-07-25 | 2018-01-12 | 广东工业大学 | 一种针对医疗多模态大数据的预处理及特征提取方法 |
CN109543719A (zh) * | 2018-10-30 | 2019-03-29 | 浙江大学 | 基于多模态注意力模型的宫颈非典型病变诊断模型和装置 |
CN110299005A (zh) * | 2019-06-10 | 2019-10-01 | 浙江大学 | 一种基于深度集成学习的城市大规模路网交通速度预测方法 |
CN111127441A (zh) * | 2019-12-25 | 2020-05-08 | 兰州大学 | 一种基于图节点嵌入的多模态脑影像抑郁识别方法和系统 |
CN112308306A (zh) * | 2020-10-27 | 2021-02-02 | 贵州工程应用技术学院 | 一种多模态输入的煤与瓦斯突出危险预测方法 |
Non-Patent Citations (1)
Title |
---|
多模态神经网络在复杂大数据特征学习中的应用;叶卫华;;电子技术与软件工程(11);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112712895A (zh) | 2021-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP4002271A1 (en) | Image segmentation method and apparatus, and storage medium | |
CN109935336B (zh) | 一种儿童呼吸科疾病的智能辅助诊断系统 | |
CN113421652B (zh) | 对医疗数据进行分析的方法、训练模型的方法及分析仪 | |
WO2021120936A1 (zh) | 一种基于多任务学习模型的慢病预测系统 | |
CN108806792B (zh) | 深度学习面诊系统 | |
CN107358014B (zh) | 一种生理数据的临床前处理方法及系统 | |
CN111968741B (zh) | 基于深度学习与集成学习的糖尿病并发症高危预警系统 | |
CN110459328A (zh) | 一种评估心脏骤停的临床决策支持系统 | |
CN112712895B (zh) | 针对2型糖尿病并发症的多模态大数据的数据分析方法 | |
JP2020518050A (ja) | エンティティ間のコンテキスト的類似度の学習及び適用 | |
CN115831364B (zh) | 基于多模态特征融合的2型糖尿病风险分层预测方法 | |
CN110400610B (zh) | 基于多通道随机森林的小样本临床数据分类方法及系统 | |
Chowdary et al. | An effective approach for detecting diabetes using deep learning techniques based on convolutional LSTM networks | |
Feng et al. | A review of methods for classification and recognition of ASD using fMRI data | |
Sorić et al. | Using convolutional neural network for chest X-ray image classification | |
Wu et al. | Improving NeuCube spiking neural network for EEG-based pattern recognition using transfer learning | |
CN116936108A (zh) | 一种面向不平衡数据的疾病预测系统 | |
He et al. | Quantification of cognitive function in Alzheimer’s disease based on deep learning | |
CN111081334A (zh) | 一种基于风险因素概率组合分析的慢性疾病早期预警方法 | |
Gecili et al. | Functional data analysis and prediction tools for continuous glucose-monitoring studies | |
Chaturvedi et al. | An Innovative Approach of Early Diabetes Prediction using Combined Approach of DC based Bidirectional GRU and CNN | |
CN116934777A (zh) | 一种不确定性引导的视网膜血管图像分割方法及系统 | |
Tan et al. | Convolutional neural networks for classification of T2DM cognitive impairment based on whole brain structural features | |
CN116230244A (zh) | 一种基于增广判别信息的ehr数据分析方法及系统 | |
Xie et al. | Thyroid disease diagnosis based on feature interpolation and dynamic weighting ensemble model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |