CN117012388A - 一种糖尿病血糖预测方法、装置、电子设备及存储介质 - Google Patents
一种糖尿病血糖预测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117012388A CN117012388A CN202310924847.8A CN202310924847A CN117012388A CN 117012388 A CN117012388 A CN 117012388A CN 202310924847 A CN202310924847 A CN 202310924847A CN 117012388 A CN117012388 A CN 117012388A
- Authority
- CN
- China
- Prior art keywords
- diabetes
- blood glucose
- historical
- data
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000008280 blood Substances 0.000 title claims abstract description 178
- 210000004369 blood Anatomy 0.000 title claims abstract description 178
- 206010012601 diabetes mellitus Diseases 0.000 title claims abstract description 151
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000003860 storage Methods 0.000 title claims abstract description 12
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims abstract description 146
- 239000008103 glucose Substances 0.000 claims abstract description 146
- 238000012549 training Methods 0.000 claims abstract description 54
- 238000012512 characterization method Methods 0.000 claims abstract description 40
- 238000007781 pre-processing Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 19
- 239000012634 fragment Substances 0.000 claims description 28
- 238000012544 monitoring process Methods 0.000 claims description 21
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 claims description 17
- 208000001072 type 2 diabetes mellitus Diseases 0.000 claims description 17
- 238000010606 normalization Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 7
- 238000012935 Averaging Methods 0.000 claims description 4
- 125000004122 cyclic group Chemical group 0.000 claims description 4
- 230000008569 process Effects 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 9
- 230000002123 temporal effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 201000001421 hyperglycemia Diseases 0.000 description 1
- 208000017169 kidney disease Diseases 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 201000001119 neuropathy Diseases 0.000 description 1
- 230000007823 neuropathy Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 208000033808 peripheral neuropathy Diseases 0.000 description 1
- 230000000379 polymerizing effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本申请提供一种糖尿病血糖预测方法、装置、设备及存储介质,涉及数据处理技术领域。其中方法包括:获取病例在历史时间段内的血糖时序数据;对所述血糖时序数据进行预处理后,输入预先训练的血糖预测模型,得到在未来设定时间段内病例的血糖预测;所述血糖预测模型是通过历史糖尿病血糖时序数据样本对图异构时间表征模型进行训练得到的,所述历史糖尿病血糖时序数据样本包括多种类型的糖尿病样本。可见,本申请的血糖预测模型是基于多种类型糖尿病病例数据训练图异构时间表征模型得到的,能够用于多种类型糖尿病病例的血糖预测,并且预测准确性高。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及一种糖尿病血糖预测方法、装置、电子设备及存储介质。
背景技术
糖尿病是一种慢性疾病,其特点是血糖水平长期高于正常范围。血糖水平的管理对于糖尿病患者来说非常重要,因为高血糖会导致各种并发症,例如神经病变、肾病、心血管疾病等。血糖预测是一种重要的糖尿病管理方法,可以帮助患者了解自己的血糖水平,并采取相应的措施来控制血糖。
血糖预测(BGP)越来越多地用于糖尿病患者血糖水平的个性化监测,为医生的诊断和治疗计划提供宝贵的支持。尽管取得了显着的成功,但在多患者场景中应用BGP仍然存在问题,这主要是由于从不同患者资料中获得的连续血糖监测数据固有的异质性和不确定性。
传统血糖预测方法的优势集中在个性化血糖预测(BGP)上,缺乏推广到多患者预测场景的能力。并且有三个主要挑战限制了预测的准确性:由于诊断、治疗和生活方式选择的个体差异,患者的监测持续时间存在差异;特定类型糖尿病(1型糖尿病或2型糖尿病)的不确定性可能会影响多患者情况下连续血糖监测数据预测的准确性;血糖预测模型必须考虑样本或时期之间跨时间和空间维度存在的潜在相关性。
发明内容
本申请的目的是提供一种糖尿病血糖预测方法、装置、电子设备及存储介质,可以用于多种类型糖尿病病例的血糖预测,并且预测准确性高。
第一方面,本申请实施例提供了一种糖尿病血糖预测方法,包括:
获取病例在历史时间段内的血糖时序数据;
对所述血糖时序数据进行预处理后,输入预先训练的血糖预测模型,得到在未来设定时间段内病例的血糖预测;
所述血糖预测模型是通过历史糖尿病血糖时序数据样本对图异构时间表征模型进行训练得到的,所述历史糖尿病血糖时序数据样本包括多种类型的糖尿病样本。
在本申请的一些实施方式中,按照以下方式预先训练所述血糖预测模型:
获取包括1型糖尿病和2型糖尿病的历史糖尿病病例数据,并统计为不同监测持续时间、不同类型糖尿病的对齐时序数据,得到历史糖尿病血糖时序数据样本;
采用动态时间规整方式来对齐历史糖尿病血糖时序数据样本的样本长度,并计算样本之间的距离,构建稀疏关系图;
将所述稀疏关系图输入所述图异构时间表征模型进行训练,在达到预设训练截止条件后得到所述血糖预测模型。
在本申请的一些实施方式中,所述获取包括1型糖尿病和2型糖尿病的历史糖尿病病例数据,并统计为不同监测持续时间、不同类型糖尿病的对齐时序数据,得到历史糖尿病血糖时序数据样本,包括:
获取包括1型糖尿病和2型糖尿病的历史糖尿病病例数据;
对所述历史糖尿病病例数据进行所述预处理;
将预处理后的历史糖尿病病例数据分割成固定长度的子序列,每个子序列表示由T个步长组成的连续时间段;
确定训练集中历史糖尿病病例数据被分割的最大子序列片段数,使用预设的子序列重复方式将每个训练集中历史糖尿病病例数据的子序列片段的数量对齐,直到总片段计数为所述最大子序列片段数。
在本申请的一些实施方式中,所述预处理包括最大值处理、最小值处理、数据均值化以及归一化处理。
在本申请的一些实施方式中,所述图异构时间表征模型包括顺序连接的图学习模块、表征增强模块以及输出层;
所述图学习模块包括两个堆叠图卷积网络,用于嵌入所述稀疏关系图的信息;
所述表征增强模块包括卷积组件、时间注意力组件和循环学习组件,用于进一步学习输入数据在时间和空间维度上的关键信息;
所述输出层由两个多层感知器网络组成,用于将预测结果编码为所需的输出形状。
第二方面,本申请实施例提供了一种糖尿病血糖预测装置,包括:
获取模块,用于获取病例在历史时间段内的血糖时序数据;
预测模块,用于对所述血糖时序数据进行预处理后,输入预先训练的血糖预测模型,得到在未来设定时间段内病例的预测血糖;
所述血糖预测模型是通过历史糖尿病血糖时序数据样本对图异构时间表征模型进行训练得到的,所述历史糖尿病血糖时序数据样本包括多种类型的糖尿病样本。
在本申请的一些实施方式中,所述装置还包括:训练模块,用于按照以下方式预先训练所述血糖预测模型:
获取包括1型糖尿病和2型糖尿病的历史糖尿病病例数据,并统计为不同监测持续时间、不同类型糖尿病的对齐时序数据,得到历史糖尿病血糖时序数据样本;
采用动态时间规整方式来对齐历史糖尿病血糖时序数据样本的样本长度,并计算样本之间的距离,构建稀疏关系图;
将所述稀疏关系图输入所述图异构时间表征模型进行训练,在达到预设训练截止条件后得到所述血糖预测模型。
在本申请的一些实施方式中,所述训练模块,具体用于:
获取包括1型糖尿病和2型糖尿病的历史糖尿病病例数据;
对所述历史糖尿病病例数据进行所述预处理;
将预处理后的历史糖尿病病例数据分割成固定长度的子序列,每个子序列表示由T个步长组成的连续时间段;
确定训练集中历史糖尿病病例数据被分割的最大子序列片段数,使用预设的子序列重复方式将每个训练集中历史糖尿病病例数据的子序列片段的数量对齐,直到总片段计数为所述最大子序列片段数。
第三方面,本申请提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行以实现如第一方面所述的方法。
第四方面,本申请实提供了一种计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如第一方面所述的方法。
相较于现有技术,本申请提供的糖尿病血糖预测方法,通过获取病例在历史时间段内的血糖时序数据;对所述血糖时序数据进行预处理后,输入预先训练的血糖预测模型,得到在未来设定时间段内病例的血糖预测;所述血糖预测模型是通过历史糖尿病血糖时序数据样本对图异构时间表征模型进行训练得到的,所述历史糖尿病血糖时序数据样本包括多种类型的糖尿病样本。可见,本申请的血糖预测模型是基于多种类型糖尿病病例数据训练图异构时间表征模型得到的,能够用于多种类型糖尿病病例的血糖预测,并且预测准确性高。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请实施例所提供的一种糖尿病血糖预测方法的流程图;
图2示出了本申请实施例所提供的一种血糖预测模型训练方法的流程图;
图3示出了本申请实施例所提供的一种血糖预测模型的预测过程示意图;
图4示出了本申请实施例所提供的另一种血糖预测模型的预测过程示意图;
图5示出了本申请实施例所提供的一种糖尿病血糖预测装置的示意图;
图6示出了本申请实施例所提供的一种电子设备的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本申请所属领域技术人员所理解的通常意义。
另外,术语“第一”和“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
请参考图1,图1是本申请实施例提供的一种糖尿病血糖预测方法的流程图,包括以下S101~S102:
S101、获取病例在历史时间段内的血糖时序数据。
其中,血糖时序数据是历史时间段内的糖尿病血糖数据按照设定时间间隔构成的时间序列数据。时间间隔可以设置为小时、日、周或月等具体时间间隔。
S102、对所述血糖时序数据进行预处理后,输入预先训练的血糖预测模型,得到在未来设定时间段内病例的预测血糖。
其中,血糖预测模型是通过历史糖尿病血糖时序数据样本对图异构时间表征模型进行训练得到的,所述历史糖尿病血糖时序数据样本包括多种类型的糖尿病样本。
示例性的,所述历史糖尿病血糖时序数据样本包括1型糖尿病样本和2型糖尿病样本。
示例性地,上述对数据预处理的操作包括:最大值处理、最小值处理、数据均值化等数据清洗,以及归一化处理。
在将病例的血糖时序数据进行预处理后,输入预先训练的血糖预测模型,得到在未来设定时间段内的预测糖尿病血糖。例如基于前一周的糖尿病血糖可以预测得到本周可能的糖尿病血糖。
下面介绍如何预先训练得到血糖预测模型,具体可以按照以下方式预先训练血糖预测模型,如图2所示,包括步骤S201~S203:
S201、获取包括1型糖尿病和2型糖尿病的历史糖尿病病例数据,并统计为不同监测持续时间、不同类型糖尿病的对齐时序数据,得到历史糖尿病血糖时序数据样本。
历史糖尿病病例数据是指糖尿病病例的历史血糖监测数据,收集来自患者的真实数据,其中包含1型糖尿病患者和2型糖尿病患者,可以将收集的数据划分为训练集、测试集和验证集。对于训练集,将两种类型糖尿病患者的历史血糖监测数据按照时序进行数据融合,得到异构连续血糖监测时序数据,用[y1,y2,…,yM]表示时序数据,yM表示第M个数据。
对融合后的历史糖尿病病例数据进行预处理,具体包括进行数据清洗,然后进行数据归一化处理。
可以使用最大最小值归一化方法将历史糖尿病病例数据单独归一化为标量值,以便最大限度地减少幅度差异的影响。归一化和逆归一化的过程如下:
其中,和D(n)表示第n个归一化数据和输入数据;max(·)是D(n)的最大值,min(·)表示最小值。将逆归一化公式用于还原模型输出的预测值为预测的血糖值。
将预处理后的历史糖尿病病例数据分割成固定长度的子序列,每个子序列表示由T个步长组成的连续时间段。确定训练集中历史糖尿病病例数据被分割的最大子序列片段数,使用预设的子序列重复方式将每个训练集中历史糖尿病病例数据的子序列片段的数量对齐,直到总片段计数为所述最大子序列片段数。
具体的,将归一化的时间序列数据分割成固定长度的子序列,每个子序列表示由T个步长(即窗口大小)组成的连续时间段。分割后序列可表示为:
在测试集中,所有样本中的分段数量保持一致。然而,由于样本长度的不确定性,训练集中的分割片段数量在样本之间仍然不一致。因此,本申请使用子序列重复方法来实现训练集中片段的对齐,这个过程可以通过以下方式表示:
其中,s表示预测步骤,T是窗口大小。已知的子序列片段被顺序复制,直到总片段计数等于β,其中β表示训练集中样本的最大片段数。
子序列重复方法通过利用已知数据样本来填充空子序列来对齐异构输入数据。该方法可能会增加冗余子序列信息,但可以避免丢失时间序列数据的原始时间依赖性。
S202、采用动态时间规整方式来对齐历史糖尿病血糖时序数据样本的样本长度,并计算样本之间的距离,构建稀疏关系图。
首先计算训练集中每个异构历史糖尿病血糖时序数据样本之间的距离,然后根据获得的距离矩阵构建稀疏关系图(Sparse Representation Graph,SRG)。SRG能够通过以图形结构排列输入数据来捕获患者之间复杂的关系,擅长揭示空间和时间维度上的样本或周期之间的潜在相关性。
由于患者之间的样本长度不一致,无法计算点对点的距离。因此,本申请采用动态时间规整(DTW)方法来对齐原始输入数据的样本,动态时间规整方法是一种广泛使用的测量时间序列之间相似性的方法,其目的是最小化两个时间序列之间的距离,同时对齐它们的样本长度。该过程可以表示为:
其中,γi,j表示计算出的样本i和j之间的距离;Λ=[λ1,…,λκ]表示两个样本之间的最佳对齐路径;对齐路径λ=(s1,s2)必须满足1≤s1≤Li和1≤s2≤Lj,其中s1和s2表示样本的时间点,Li和Lj分别表示D(i)和D(j)的样本长度;该路径从λ1=(0,0)开始,到λκ=(Li-1,Lj-1)结束;di∈D(i)和dj∈D(j)表示来自连续血糖监测数据的观测值;输入时间序列的距离矩阵可以表示为Γ=[γ1,2,…,γN,N-1],distance(·)表示元素间的曼哈顿距离,即
所提出的SRG的正式定义可以描述如下。SRG的公式为G=(V,E),其中V∈RN是节点集合(即历史糖尿病血糖时序数据样本),E∈R2×N×K是边集合(即历史糖尿病血糖时序数据样本之间的关系),其中N是样本大小,等于图中的节点数;K是一个超参数,表示与每个样本距离最小的K个相邻样本点。
S203、将所述稀疏关系图输入所述图异构时间表征模型进行训练,在达到预设训练截止条件后得到所述血糖预测模型。
具体地,图异构时间表征模型包括顺序连接的图学习模块、表征增强模块以及输出层。
所述图学习模块包括两个堆叠图卷积网络,用于嵌入所述稀疏关系图的信息;所述表征增强模块包括卷积组件、时间注意力组件和循环学习组件,用于进一步学习输入数据在时间和空间维度上的关键信息;所述输出层由两个多层感知器网络组成,用于将结果编码为所需的输出形状。
请参照图3,下面对血糖预测模型进行详细介绍。
图学习模块中的两个堆叠图卷积网络(GCN)在提出的图异构时间表征模型中被用来嵌入SRG的信息,这可以表达如下:
其中,★表示图卷积运算;X#表示血糖预测模型的输入;表示对角矩阵;元素/>表示节点i的度数,对应于连接到节点i的边的数量;/>表示具有自环的邻接矩阵;A是SRG的邻接矩阵,I表示单位矩阵;/>是嵌入图表示,/>是输出图表示;pg表示Dropout概率;φ(·)表示修正线性单元(ReLU)激活函数;Wg表示可学习的权重矩阵;bg表示可学习的偏置变量。
表征增强模块旨在进一步利用时间和空间维度上的关键信息。首先,采用卷积组件过滤掉空间维度上的无用信息,并结合Dropout法来防止过拟合:
其中,Wco表示可学习的卷积核;表示卷积组件的输出;*表示传统的卷积运算;pco表示卷积分量的Dropout概率。
图卷积网络的局限性是它们无法从输入的连续血糖监测数据中捕获连续动态模式。因为图卷积网络的信息传播仅通过节点发生,忽略了节点内时间特征的连续性。为了解决这个问题,时间注意力组件和循环学习组件被组合到表征增强模块中。
应用时间注意力来突出显示一段时间内的关键时间步骤:
其中,Sta表示时间注意力组件的输出注意力得分;Wta和bta分别表示可学习的权重矩阵和偏置变量,softmax(·)是一种激活函数,它将一组实数转换为概率分布,使得每个类别的概率值在0到1之间,并且所有类别的概率之和为1。
图异构时间表征模型利用注意力分数对卷积组件的输出进行重新加权,然后将其传递给基于门控循环单元(GRU)的循环学习组件,以进一步提取时间动态。循环学习组件中的信息传播处理可以表述为:
ht=(1-ut)⊙ht-1+ut⊙ct;
其中,ht是GRU单元第t步的隐藏状态;ut,rt,ct分别表示t时刻GRU单元循环学习组件的更新门、重置门和候选隐藏状态层的表征;σ(·)表示sigmoid激活函数;[;]表示串联运算,⊙是逐元素乘法运算。
所提出的图异构时间表征模型的输出层由两个多层感知器网络组成,旨在将预测结果编码为所需的输出形状。为了避免过度非线性引起的梯度消失或爆炸问题,模型的线性输入表示被添加到输出层的乘积中以产生最终的预测结果:
其中,表示生成的输出;/>表示预测值;po表示丢失概率;⊕表示逐元素加法操作;Wo和bo分别表示权重矩阵和偏差,用于生成模型输入的线性表示,最终预测结果通过逆归一化后得到。
在模型训练时,预测结果通过逆归一化过程后得到校正后的预测值,以与真实值进行比较,根据比较结果调整模型参数,在达到预设训练截止条件后得到最优的血糖预测模型。
在得到血糖预测模型后,可以将患者在历史时间段内的血糖时序数据输入该血糖预测模型预测在未来设定时间段内该患者的血糖,该糖尿病血糖预测过程可以参见图3所示。
如图4所示,可以实时收集历史糖尿病病例数据,对数据进行预处理,然后进行模型训练和实时预测,将预测结果发送至患者,再得到患者实时反馈的真实值,进而优化模型。
通过使用真实异构连续血糖监测数据集与多种成熟的预测方法进行比较,对本申请所提出的图异构时间表征模型进行了全面评估,结果证明了图异构时间表征模型在血糖预测方面的优越性。
本申请为了更好的预测糖尿病患者血糖水平,提供了上述利用异构时间表征的糖尿病血糖预测方法,该方法通过收集来自患者的真实数据,其中包含1型糖尿病患者和2型糖尿病患者,并统计为不同类型糖尿病的对齐时序数据;将异构连续血糖监测信号聚合成原始数据流,并传递到图异构时间表征模型中,使用图学习模块将节点的信息与其相邻节点的信息集成以捕获图中的时间依赖性,最后将处理后的数据输入表征增强模块和输出层中,以进行残差融合与预测。
本申请首先将用子序列重复方法来对齐异构连续血糖监测数据应用于多类患者血糖预测,这种方法为处理异构医疗时间序列数据提供了一种有前景的解决方案,无需数据截断或插值。
本申请提出了一种新颖的基于图的表示学习方法,用于从多个连续血糖监测时间序列子序列中提取关键的时间信息。为了解决图神经网络在捕获连续时间动态方面的局限性,本申请结合了表示增强模块,进一步挖掘跨时间和空间维度的关键信息。
本申请提供的糖尿病血糖预测方法,通过获取病例在历史时间段内的血糖时序数据;对所述血糖时序数据进行预处理后,输入预先训练的血糖预测模型,得到在未来设定时间段内病例的血糖预测;所述血糖预测模型是通过历史糖尿病血糖时序数据样本对图异构时间表征模型进行训练得到的,所述历史糖尿病血糖时序数据样本包括多种类型的糖尿病样本。可见,本申请的血糖预测模型是基于多种类型糖尿病病例数据训练图异构时间表征模型得到的,能够用于多种类型糖尿病病例的血糖预测,并且预测准确性高。
在上述的实施例中,提供了一种糖尿病血糖预测方法,与之相对应的,本申请还提供一种糖尿病血糖预测装置10。本申请实施例提供的糖尿病血糖预测装置可以实施上述糖尿病血糖预测方法,该糖尿病血糖预测装置可以通过软件、硬件或软硬结合的方式来实现。例如,该糖尿病血糖预测装置可以包括集成的或分开的功能模块或单元来执行上述各方法中的对应步骤。请参考图5所示,包括:
获取模块101,用于获取病例在历史时间段内的血糖时序数据;
预测模块102,用于对所述血糖时序数据进行预处理后,输入预先训练的血糖预测模型,得到在未来设定时间段内病例的预测血糖;
所述血糖预测模型是通过历史糖尿病血糖时序数据样本对图异构时间表征模型进行训练得到的,所述历史糖尿病血糖时序数据样本包括多种类型的糖尿病样本。
在本申请的一些实施方式中,所述装置还包括:训练模块,用于按照以下方式预先训练所述血糖预测模型:
获取包括1型糖尿病和2型糖尿病的历史糖尿病病例数据,并统计为不同监测持续时间、不同类型糖尿病的对齐时序数据,得到历史糖尿病血糖时序数据样本;
采用动态时间规整方式来对齐历史糖尿病血糖时序数据样本的样本长度,并计算样本之间的距离,构建稀疏关系图;
将所述稀疏关系图输入所述图异构时间表征模型进行训练,在达到预设训练截止条件后得到所述血糖预测模型。
在本申请的一些实施方式中,所述训练模块,具体用于:
获取包括1型糖尿病和2型糖尿病的历史糖尿病病例数据;
对所述历史糖尿病病例数据进行所述预处理;
将预处理后的历史糖尿病病例数据分割成固定长度的子序列,每个子序列表示由T个步长组成的连续时间段;
确定训练集中历史糖尿病病例数据被分割的最大子序列片段数,使用预设的子序列重复方式将每个训练集中历史糖尿病病例数据的子序列片段的数量对齐,直到总片段计数为所述最大子序列片段数。
在本申请的一些实施方式中,所述预处理包括最大值处理、最小值处理、数据均值化以及归一化处理。
在本申请的一些实施方式中,所述图异构时间表征模型包括顺序连接的图学习模块、表征增强模块以及输出层;
所述图学习模块包括两个堆叠图卷积网络,用于嵌入所述稀疏关系图的信息;
所述表征增强模块包括卷积组件、时间注意力组件和循环学习组件,用于进一步学习输入数据在时间和空间维度上的关键信息;
所述输出层由两个多层感知器网络组成,用于将预测结果编码为所需的输出形状。
本申请实施例提供的糖尿病血糖预测装置与本申请实施例提供的糖尿病血糖预测方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。
本申请实施方式还提供一种与前述实施方式所提供的方法对应的电子设备,所述电子设备可以是用于客户端的电子设备,例如手机、笔记本电脑、平板电脑、台式机电脑等,以执行上述糖尿病血糖预测方法。
请参考图6,其示出了本申请的一些实施方式所提供的一种电子设备的示意图。如图6所示,所述电子设备20包括:处理器200,存储器201,总线202和通信接口203,所述处理器200、通信接口203和存储器201通过总线202连接;所述存储器201中存储有可在所述处理器200上运行的计算机程序,所述处理器200运行所述计算机程序时执行本申请前述任一实施方式所提供的糖尿病血糖预测方法。
其中,存储器201可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口203(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
总线202可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。其中,存储器201用于存储程序,所述处理器200在接收到执行指令后,执行所述程序,前述本申请实施例任一实施方式揭示的所述糖尿病血糖预测方法可以应用于处理器200中,或者由处理器200实现。
处理器200可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器200可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器201,处理器200读取存储器201中的信息,结合其硬件完成上述方法的步骤。
本申请实施例提供的电子设备与本申请实施例提供的糖尿病血糖预测方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。
本申请实施方式还提供一种与前述实施方式所提供的糖尿病血糖预测方法对应的计算机可读存储介质,其上存储有计算机程序(即程序产品),所述计算机程序在被处理器运行时,会执行前述任意实施方式所提供的糖尿病血糖预测方法。
需要说明的是,所述计算机可读存储介质的例子还可以包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
本申请的上述实施例提供的计算机可读存储介质与本申请实施例提供的糖尿病血糖预测方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,其均应涵盖在本申请的权利要求和说明书的范围当中。
Claims (10)
1.一种糖尿病血糖预测方法,其特征在于,包括:
获取病例在历史时间段内的血糖时序数据;
对所述血糖时序数据进行预处理后,输入预先训练的血糖预测模型,得到在未来设定时间段内病例的血糖预测;
所述血糖预测模型是通过历史糖尿病血糖时序数据样本对图异构时间表征模型进行训练得到的,所述历史糖尿病血糖时序数据样本包括多种类型的糖尿病样本。
2.根据权利要求1所述的方法,其特征在于,按照以下方式预先训练所述血糖预测模型:
获取包括1型糖尿病和2型糖尿病的历史糖尿病病例数据,并统计为不同监测持续时间、不同类型糖尿病的对齐时序数据,得到历史糖尿病血糖时序数据样本;
采用动态时间规整方式来对齐历史糖尿病血糖时序数据样本的样本长度,并计算样本之间的距离,构建稀疏关系图;
将所述稀疏关系图输入所述图异构时间表征模型进行训练,在达到预设训练截止条件后得到所述血糖预测模型。
3.根据权利要求2所述的方法,其特征在于,所述获取包括1型糖尿病和2型糖尿病的历史糖尿病病例数据,并统计为不同监测持续时间、不同类型糖尿病的对齐时序数据,得到历史糖尿病血糖时序数据样本,包括:
获取包括1型糖尿病和2型糖尿病的历史糖尿病病例数据;
对所述历史糖尿病病例数据进行所述预处理;
将预处理后的历史糖尿病病例数据分割成固定长度的子序列,每个子序列表示由T个步长组成的连续时间段;
确定训练集中历史糖尿病病例数据被分割的最大子序列片段数,使用预设的子序列重复方式将训练集中每个历史糖尿病病例数据的子序列片段的数量对齐,直到总片段计数为所述最大子序列片段数。
4.根据权利要求1所述的方法,其特征在于,所述预处理包括最大值处理、最小值处理、数据均值化以及归一化处理。
5.根据权利要求2所述的方法,其特征在于,所述图异构时间表征模型包括顺序连接的图学习模块、表征增强模块以及输出层;
所述图学习模块包括两个堆叠图卷积网络,用于嵌入所述稀疏关系图的信息;
所述表征增强模块包括卷积组件、时间注意力组件和循环学习组件,用于进一步学习输入数据在时间和空间维度上的关键信息;
所述输出层由两个多层感知器网络组成,用于将结果编码为所需的输出形状。
6.一种糖尿病血糖预测装置,其特征在于,包括:
获取模块,用于获取病例在历史时间段内的血糖时序数据;
预测模块,用于对所述血糖时序数据进行预处理后,输入预先训练的血糖预测模型,得到在未来设定时间段内病例的血糖预测;
所述血糖预测模型是通过历史糖尿病血糖时序数据样本对图异构时间表征模型进行训练得到的,所述历史糖尿病血糖时序数据样本包括多种类型的糖尿病样本。
7.根据权利要求6所述的装置,其特征在于,还包括:训练模块,用于按照以下方式预先训练所述血糖预测模型:
获取包括1型糖尿病和2型糖尿病的历史糖尿病病例数据,并统计为不同监测持续时间、不同类型糖尿病的对齐时序数据,得到历史糖尿病血糖时序数据样本;
采用动态时间规整方式来对齐历史糖尿病血糖时序数据样本的样本长度,并计算样本之间的距离,构建稀疏关系图;
将所述稀疏关系图输入所述图异构时间表征模型进行训练,在达到预设训练截止条件后得到所述血糖预测模型。
8.根据权利要求7所述的装置,其特征在于,所述训练模块,具体用于:
获取包括1型糖尿病和2型糖尿病的历史糖尿病病例数据;
对所述历史糖尿病病例数据进行所述预处理;
将预处理后的历史糖尿病病例数据分割成固定长度的子序列,每个子序列表示由T个步长组成的连续时间段;
确定训练集中历史糖尿病病例数据被分割的最大子序列片段数,使用预设的子序列重复方式将每个训练集中历史糖尿病病例数据的子序列片段的数量对齐,直到总片段计数为所述最大子序列片段数。
9.一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序时以实现如权利要求1至5任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1至5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310924847.8A CN117012388A (zh) | 2023-07-26 | 2023-07-26 | 一种糖尿病血糖预测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310924847.8A CN117012388A (zh) | 2023-07-26 | 2023-07-26 | 一种糖尿病血糖预测方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117012388A true CN117012388A (zh) | 2023-11-07 |
Family
ID=88564850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310924847.8A Pending CN117012388A (zh) | 2023-07-26 | 2023-07-26 | 一种糖尿病血糖预测方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117012388A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117766145A (zh) * | 2023-12-28 | 2024-03-26 | 重庆联芯致康生物科技有限公司 | 一种连续血糖预测模型构建方法、血糖预测方法与装置 |
-
2023
- 2023-07-26 CN CN202310924847.8A patent/CN117012388A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117766145A (zh) * | 2023-12-28 | 2024-03-26 | 重庆联芯致康生物科技有限公司 | 一种连续血糖预测模型构建方法、血糖预测方法与装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Suo et al. | Personalized disease prediction using a CNN-based similarity learning method | |
EP3292492B1 (en) | Predicting likelihoods of conditions being satisfied using recurrent neural networks | |
CN111880998B (zh) | 服务系统异常检测方法、装置、计算机设备和存储介质 | |
EP1949311B1 (en) | A computing device, a system and a method for parallel processing of data streams | |
Chen et al. | A novel distribution regression approach for data loss compensation in structural health monitoring | |
CN109326353B (zh) | 预测疾病终点事件的方法、装置及电子设备 | |
Gupta et al. | ALMNet: Adjacent layer driven multiscale features for salient object detection | |
US11379842B2 (en) | Method and system for detecting fraudulent transactions using a fraud detection model trained based on dynamic time segments | |
CN111798975A (zh) | 基于循环时间卷积网络的疾病诊断系统、设备及介质 | |
CN112053363B (zh) | 视网膜血管分割方法、装置及模型构建方法 | |
US11830187B2 (en) | Automatic condition diagnosis using a segmentation-guided framework | |
CN117012388A (zh) | 一种糖尿病血糖预测方法、装置、电子设备及存储介质 | |
CN116383096B (zh) | 基于多指标时序预测的微服务系统异常检测方法及装置 | |
CN116760742A (zh) | 基于多阶段混合时空融合的网络流量异常检测方法及系统 | |
CN111639607A (zh) | 模型训练、图像识别方法和装置、电子设备及存储介质 | |
Hartvigsen et al. | Recurrent halting chain for early multi-label classification | |
Li et al. | Integrating static and time-series data in deep recurrent models for oncology early warning systems | |
CN116543351A (zh) | 一种基于时空串并联关系编码的自监督群体行为识别方法 | |
Du et al. | Heterogeneous structural responses recovery based on multi-modal deep learning | |
CN112131274B (zh) | 时间序列异常点的检测方法、装置、设备及可读存储介质 | |
EP3893159A1 (en) | Training a convolutional neural network | |
Wang et al. | Multi-branching neural network for myocardial infarction prediction | |
CN112651467A (zh) | 卷积神经网络的训练方法和系统以及预测方法和系统 | |
Lerogeron et al. | Approximating dynamic time warping with a convolutional neural network on EEG data | |
Zhou et al. | A novel neural network for improved in-hospital mortality prediction with irregular and incomplete multivariate data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |