CN115796235A - 补充缺失数据的生成器模型训练方法和系统 - Google Patents
补充缺失数据的生成器模型训练方法和系统 Download PDFInfo
- Publication number
- CN115796235A CN115796235A CN202211374808.7A CN202211374808A CN115796235A CN 115796235 A CN115796235 A CN 115796235A CN 202211374808 A CN202211374808 A CN 202211374808A CN 115796235 A CN115796235 A CN 115796235A
- Authority
- CN
- China
- Prior art keywords
- matrix
- inputting
- patient information
- data
- scale
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种补充缺失数据的生成器模型训练方法、系统、存储介质和处理器。获取患者数据并填充对应的时态信息索引得到患者信息;将患者信息依次输入至第一列多尺度神经场模块得到第一特征矩阵,将第一特征矩阵输入至感知经验池中得到第二特征矩阵;将第二特征矩阵输入至第二列多尺度神经场模块得到填充好的患者信息和生成器模型,将完整患者原始数据与填充好的患者信息随机输入至判别器模型当中,计算一致性指数对判别器模型和生成器模型进行优化。通过本发明解决了现有技术在有时间序列的临床数据上无法预测缺失数据使缺失数据得到较好填充的问题,能够更加快速高效的处理有时间序列的临床数据。
Description
技术领域
本发明涉及数据处理领域,具体而言,涉及一种补充缺失数据的生成器模型训练的方法、系统、存储介质和处理器。
背景技术
数据缺失是大数据处理当中比较常见需要解决的问题之一。在临床大数据当中,患者的指标数据往往是不全面的、较为稀疏的。对于数学模型而言,想要建立一个较为健壮的数学模型从而精准的对患者进行分类或回归,其输入数据的质量高低是非常重要的。而质量的高低很大程度上取决于有效数据的规模、数据的缺失程度以及多样性。当前业界常用的量化方法大体上分为三种:赋值填充、回归填充、序列填充、混合填充:混合填充结合了以上三种填充方法,并根据数据集情况建立规则来决定何时使用赋值填充、何时使用回归填充。本质上是大量人工参与的填充。
上述方式均无法在有时间序列的临床数据上预测缺失数据得到较好的填充。
针对现有技术在有时间序列的临床数据上无法预测缺失数据使缺失数据得到较好填充的技术问题,目前尚未提出有效地解决方案。
发明内容
本发明提供了一种补充缺失数据的生成器模型训练的方法、系统、存储介质和处理器,以解决现有技术在有时间序列的临床数据上无法预测缺失数据得到较好填充的问题。
根据本发明实施例的一个方面,提供了一种补充缺失数据的生成器模型训练方法,包括:获取患者数据并填充对应的时态信息索引得到患者信息;将所述患者信息依次输入至第一列多尺度神经场模块得到第一特征矩阵,其中,所述第一列多尺度神经场模块包括多个第一多尺度神经场模块;将所述第一特征矩阵输入至感知经验池中得到第二特征矩阵;将所述第二特征矩阵输入至所述第二列多尺度神经场模块得到填充好的患者信息和生成器模型,其中,所述第二列多尺度神经场模块包括多个第二多尺度神经场模块,所述第一多尺度神经场模块与所述第二多尺度神经场模块数量相同;将完整患者原始数据与所述填充好的患者信息随机输入至判别器模型当中,在输入至所述判别器模型的数据为所述完整患者原始数据的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型进行单独优化;在输入至所述判别器的数据为所述填充好的患者信息的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型和所述生成器模型同时进行优化;直到当所述一致性指数不再发生变化时,停止训练得到最终的生成器模型。
进一步地,将所述患者信息依次输入至所述第一列多尺度神经场模块得到所述第一特征矩阵包括:将每个所述患者信息同时输入至不同尺度的多个卷积神经网络、全连接神经网络、极大值选取过程进行运算获得各自运算的特征图;将输入不同尺度的多个所述卷积神经网络运算得到的特征图和输入所述极大值选取过程运算得到的特征图,进行矩阵拼接得到第一拼接矩阵;将输入所述全连接神经网络获得的特征图与所述第一拼接矩阵进行相乘得到第二拼接矩阵;创建高斯随机数矩阵与所述第二拼接矩阵相乘并将结果经过Sigmoid函数激活后得到第一激活特征矩阵;将所述第一拼接矩阵输入至递归神经网络中,得到待预测结果的当前时态信息;将所述待预测结果的时态信息经过ReLU函数激活后,与所述第一激活特征矩阵做点乘,得到每个当前时态的患者信息。
进一步地,将所述待预测结果的时态信息经过ReLU函数激活后,与所述第一激活特征矩阵做点乘,得到每个当前时态的患者信息之后包括:将所述当前时态的患者信息和将下一时态的患者信息输入至所述第一列多尺度神经场模块中下一个第一多尺度神经场模块得到下一时态的患者信息;直至将所述患者信息依次输入至所述第一列多尺度神经场模块中所有的第一多尺度神经场模块为止,得到所述第一特征矩阵。
进一步地,将所述第一特征矩阵输入至所述感知经验池中得到所述第二特征矩阵包括:获取预设权重矩阵,其中,所述预设权重矩阵为多个;将所述第一特征矩阵分别与所述预设权重矩阵相乘得到多个过程矩阵;将多个所述过程矩阵通过最大池化放缩至相同大小;将放缩后的多个所述过程矩阵进行拼接得到第三拼接矩阵;将所述第三拼接矩阵当中小于等于零的元素保持不变;将所述第三拼接矩阵当中大于零的元素进行开平方根获得第二特征矩阵。
进一步地,将所述第二特征矩阵输入至所述第二列多尺度神经场模块得到所述填充好的患者信息和所述生成器模型包括:将所述第二特征矩阵与从输入所述第一列多尺度神经场模块获得的患者信息共同输入至所述第二列多尺度神经场模块中的所述第二多尺度神经场模块,获得新的患者数据;将所述新的患者数据与下一时态患者信息共同输入至所述第二列多尺度神经场模块中的所述第二多尺度神经场模块,获得下一时态的患者数据直至依次输入至所述第二列多尺度神经场模块中的全部第二多尺度神经场模块进行计算为止,得到所述填充好的患者信息和所述生成器模型。
根据本发明实施例的另一个方面,还提供了一种补充缺失数据的生成器模型训练系统,包括:获取单元,用于获取患者数据并填充对应的时态信息索引得到患者信息;第一列多尺度神经场单元,用于将所述患者信息依次输入至第一列多尺度神经场模块得到第一特征矩阵,其中,所述第一列多尺度神经场模块包括多个第一多尺度神经场模块;感知经验池单元,用于将所述第一特征矩阵输入至感知经验池中得到第二特征矩阵;第二列多尺度神经场单元,用于将所述第二特征矩阵输入至所述所述第二列多尺度神经场模块得到填充好的患者信息和生成器模型,其中,所述第二列多尺度神经场模块包括多个第二多尺度神经场模块,所述第一多尺度神经场模块与所述第二多尺度神经场模块数量相同;第一判别器单元,用于将完整患者原始数据与所述填充好的患者信息随机输入至判别器模型当中,第二判别器单元,用于在输入至所述判别器模型的数据为所述完整患者原始数据的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型进行单独优化;第三判别器单元,用于在输入至所述判别器的数据为所述填充好的患者信息的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型和所述生成器模型同时进行优化,直到当所述一致性指数不再发生变化时,停止训练得到最终的生成器模型。
根据本发明实施例的另一个方面,还提供给了一种存储介质,所述存储介质上保存有程序,所述程序被运行时执行上所述的方法。
根据本发明实施例的另一个方面,还提供给了一种处理器,所述程序被运行时执行上述的方法。
根据本发明实施例中,采用获取患者数据并填充对应的时态信息索引得到患者信息;将所述患者信息依次输入至第一列多尺度神经场模块得到第一特征矩阵,其中,所述第一列多尺度神经场模块包括多个第一多尺度神经场模块;将所述第一特征矩阵输入至感知经验池中得到第二特征矩阵;将所述第二特征矩阵输入至所述所述第二列多尺度神经场模块得到填充好的患者信息和生成器模型,其中,所述第二列多尺度神经场模块包括多个第二多尺度神经场模块,所述第一多尺度神经场模块与所述第二多尺度神经场模块数量相同;将完整患者原始数据与所述填充好的患者信息随机输入至判别器模型当中,在输入至所述判别器模型的数据为所述完整患者原始数据的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型进行单独优化;在输入至所述判别器的数据为所述填充好的患者信息的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型和所述生成器模型同时进行优化;直到当所述一致性指数不再发生变化时,停止训练得到最终的生成器模型。通过本发明解决了现有技术在有时间序列的临床数据上无法预测缺失数据使缺失数据得到较好填充的问题,能够更加快速高效的处理有时间序列的临床数据。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种补充缺失数据的生成器模型训练方法的流程图;
图2是根据本发明实施例的一种数据处理示意图;
图3是根据本发明实施例的多尺度神经场模块的流程图;
图4是根据本发明实施例的感知经验池的流程图;
图5是根据本发明实施例的一种可选的补充缺失数据的生成器模型示意图;
图6是根据本发明实施例的另一种可选的判别器模型示意图。。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供了一种补充缺失数据的生成器模型训练方法。图1是根据本发明实施例的一种补充缺失数据的生成器模型训练方法的流程图。如图1所示,该方法包括如下步骤:
步骤S1002,获取患者数据并填充对应的时态信息索引得到患者信息;
步骤S1004,将所述患者信息依次输入至第一列多尺度神经场模块得到第一特征矩阵,其中,所述第一列多尺度神经场模块包括多个第一多尺度神经场模块;
步骤S1006,将所述第一特征矩阵输入至感知经验池中得到第二特征矩阵,其中,所述感知经验池是存储神经网络记忆的地方,在这里保留所有训练过的知识提高泛化能力;
步骤S1008,将所述第二特征矩阵输入至所述所述第二列多尺度神经场模块得到填充好的患者信息和生成器模型,其中,所述第二列多尺度神经场模块包括多个第二多尺度神经场模块,所述第一多尺度神经场模块与所述第二多尺度神经场模块数量相同;
步骤S1010,将完整患者原始数据与所述填充好的患者信息随机输入至判别器模型当中,
步骤S1012,在输入至所述判别器模型的数据为所述完整患者原始数据的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型进行单独优化;
步骤S1014,在输入至所述判别器的数据为所述填充好的患者信息的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型和所述生成器模型同时进行优化;
步骤S1016,直到当所述一致性指数不再发生变化时,停止训练得到最终的生成器模型。
通过本发明解决了现有技术在有时间序列的临床数据上无法预测缺失数据使缺失数据得到较好填充的问题,能够更加快速高效的处理填充有时间序列的临床数据的缺失数据。
在一种可选的实施方式中,将所述患者信息依次输入至所述第一列多尺度神经场模块得到所述第一特征矩阵包括:将每个所述患者信息同时输入至不同尺度的多个卷积神经网络、全连接神经网络、极大值选取过程进行运算获得各自运算的特征图;将输入不同尺度的多个所述卷积神经网络运算得到的特征图和输入所述极大值选取过程运算得到的特征图,进行矩阵拼接得到第一拼接矩阵;将输入所述全连接神经网络获得的特征图与所述第一拼接矩阵进行相乘得到第二拼接矩阵;创建高斯随机数矩阵与所述第二拼接矩阵相乘并将结果经过Sigmoid函数激活后得到第一激活特征矩阵;将所述第一拼接矩阵输入至递归神经网络中,得到待预测结果的当前时态信息;将所述待预测结果的时态信息经过ReLU函数激活后,与所述第一激活特征矩阵做点乘,得到每个当前时态的患者信息。
在一种可选的实施方式中,将所述待预测结果的时态信息经过ReLU函数激活后,与所述第一激活特征矩阵做点乘,得到每个当前时态的患者信息之后包括:将所述当前时态的患者信息和将下一时态的患者信息输入至所述第一列多尺度神经场模块中下一个第一多尺度神经场模块得到下一时态的患者信息;直至将所述患者信息依次输入至所述第一列多尺度神经场模块中所有的第一多尺度神经场模块为止,得到所述第一特征矩阵。
在一种可选的实施方式中,将所述第一特征矩阵输入至所述感知经验池中得到所述第二特征矩阵包括:获取预设权重矩阵,其中,所述预设权重矩阵为多个;将所述第一特征矩阵分别与所述预设权重矩阵相乘得到多个过程矩阵;将多个所述过程矩阵通过最大池化放缩至矩阵大小相同;将多个所述过程矩阵进行拼接得到第三拼接矩阵;将所述第三拼接矩阵当中小于等于零的元素保持不变;将所述第三拼接矩阵当中大于零的元素进行开平方根获得第二特征矩阵。
上述感知经验池中,将所述第三拼接矩阵当中小于等于零的元素保持不变;将所述第三拼接矩阵当中大于零的元素进行开平方根获得第二特征矩阵的方案可以确保经验更加有价值,放大特征,使得经验特征的影响更大,对变化更敏感,从而确保经验更加有价值。
在一种可选的实施方式中,将所述第二特征矩阵输入至所述第二列多尺度神经场模块得到所述填充好的患者信息和所述生成器模型包括:将所述第二特征矩阵与从输入所述第一列多尺度神经场模块获得的患者信息共同输入至所述第二列多尺度神经场模块中的所述第二多尺度神经场模块,获得新的患者数据;将所述新的患者数据与下一时态患者信息共同输入至所述第二列多尺度神经场模块中的所述第二多尺度神经场模块,获得下一时态的患者数据直至依次输入至所述第二列多尺度神经场模块中的全部第二多尺度神经场模块为止,得到所述填充好的患者信息和所述生成器模型。
上述步骤解决了现有技术在有时间序列的临床数据上无法得到很好的预测的问题建立一种基于对抗时间序列的临床缺失数据补充方法从而用于高质量填充缺失的临床数据。本发明使用对抗学习建立填充架构后在时间序列上对临床数据进行填充,且在拥有时间序列的临床数据上得到很好的表现;本申请建立的生成器模型规模小,且对时间序列的数据更为敏感,采用了全连接神经网络和递归神经网络协同处理运算,使该生成器模型相较于其他生成器模型更具时间可解释性,非常适合做这种时间序列的填充任务,本发明使用的一致性指数作为优化器优化的标准,其更加注重患者数据在时间维度上的生存预测,其变化情况更能表示出临床数据的质量。
一致性指数计算步骤为:1、产生所有的病例配对。若有n个观察个体,则所有的对子数应为Cn2(组合数);2、排除下面两种对子:对子中具有较小观察时间的个体没有达到观察终点及对子中两个个体都没达到观察终点;剩余的为有用对子。3、计算有用对子中,预测结果和实际相一致的对子数,即具有较坏预测结果个体的实际观察时间较短。4、计算,C-index=一致对子数/有用对子数。
下面结合一个可选的实施方式对上述过程进行说明:
(一)数据定义。如图2所示:标量数据特征数量为Ω,符号数据特征的种类数量为γ。数据数量为N。对原始标量数据进行标准归一化,对所有缺失数据统一赋值为-1;设为α。
(二)建立生成器模型,并初始化该模型。具体如下:
如图3所示,多尺度神经场模块主要用于对患者数据的特征提取,优势是相较于传统GRU和LSTM模型而言,其多尺度运算的过程更具可解释性,同时在处理时序任务时依旧对之前运算过的时间节点保有“记忆”。其中涉及的计算公式如下:
全连接神经网络公式:、FullyLayeri(x)=x·Wi+bi,W为权重Weight,b为偏置项Biase;
递归神经网络GRU公式:
GRUi(x,h)=σ(Wi·[ht-1,xt]+bu)·ct-1+(1-σ(Wi·[ht-1,xt]+bu))·σ(Wi·[ht-1·σ(Wi·[ht-1,xt]+br),xt]+br)
其中,W为权重Weight,b为偏置项Biase,h为输入的时态信息,c为随机矩阵。
患者特征提取中间结果计算公式:
PatientFeature(x)=Sigmoid(FullyLayer1(x)×Concat(x)·GaussianMatrix(x)),其中,GaussianMatrix(x)为x的高斯噪音。
时态信息-X公式:
Temporal(x)=GRU(Concat(x),T)
填充数据-时态X:
FillData(x)=ReLU(Temporal(x))·PatientFeature(x)
如图4所示感知经验池,感知经验池:顾名思义,就是存储神经网络“记忆”的地方,在这里保留所有训练过的知识,提高生成器的泛化能力。
Features(x)=[maxpool(W16×256×x,4),maxpool(W32×128×x,4),W64×64×x],其中,Maxpool(x,a)为最大池化,其中x为输入矩阵,a为池化大小:目的是为了将三个不同尺寸的矩阵放缩至相同大小。
整体过程如图5所示,1)将患者数据按时间序列展开,并以此输入至生成器模型当中,例如,正常情况下,数据的时间索引间隔是不固定的,如,2000、2001、2005,按时间序列展开就是填充其缺失的时间索引(不是我们的要填充的缺失数据),填充结果为:2000、2001、2002、2003、2004、2005被展开的时间索引所对应的数据同上一年的数据相同。
2)首先,数据将会被输入至图5中左边第一列的第一个“多尺度神经场模块”,在其中运算步骤如下:
(1)输入数据会分别被不同尺度的卷积神经网络和极大值选取过程运算,得到的五个特征图;其中将卷积神经网络和极大值选取结果进行拼接。
(2)输入数据在全连接神经网络当中进行运算,得到的特征矩阵与上一步所得到拼接后的特征矩阵相乘
(3)创建高斯随机数矩阵,与上一步结果相乘,并经过Sigmoid函数激活
(4)将拼接后的特征矩阵输入至GRU当中,得到的运算结果即为下一个“时态信息”
(5)将下一个“时态信息”经过ReLU函数激活后,与Sigmoid激活后的特征矩阵做点乘,得到的结果即为当前时态包含患者数据和时态信息的“特征矩阵”
3)重复第2)步骤内容,直到遍历完成当前患者的所有时态数据(设为N个),将第N个“多尺度神经场模块”的输出特征矩阵作为感知经验池的输入,过程如下:
a初始化三个权重矩阵
b将输入的特征矩阵与三个权重矩阵分别相乘,得到三个中间过程矩阵
c使用最大池化将上一步所阐述的三个中间过程矩阵放缩至相同大小
d将上一步所阐述的相同大小的三个中间过程矩阵拼接成一个矩阵
e将上一步所阐述的矩阵当中的元素按条件进行运算,规则是大于0的所有元素开平方根,小于0的所有元素保持不变,得到的结果即为“经验特征矩阵”
4)将得到的“经验特征矩阵”交给下一部分的“多尺度神经场模块”,运算过程同第2)步骤一致。
(三)建立判别器模型,并初始化该模型。
1)将患者数据按时间序列展开,将生成器处理好的填充数据按时间序列展开
2)将真实完整的患者数据与生成器所处理好的患者数据按1:1的比例随机输入至判别器模型当中,交由判别器来判断患者在时间序列上的一致性指数(C-Index,Concordance index)因为要保证判别器能够在完整数据当中学习到知识,同时又可以避免本专利模型的过拟合,故缺失数据与完整数据采用1:1进行训练。
3)根据输入给判别器模型的数据不同,判别器和生成器的优化规则不同,具体如下:
(1)当输入至判别器的数据为患者原始数据时,计算得出的一致性指数*0.2作为Loss对判别器进行单独优化
(2)当输入至判别器的数据为患者填充数据时,计算得出的一致性指数*0.8作为Loss对判别器和生成器同时优化
4)将α(生成器当中的患者数据-时态X)按时间序列展开输入至生成器模型当中进行回归,每次回归一个患者的所有时间节点,结果作为β
5)将β(展开后是判别器当中的患者/填充数据-时态(1、2。。。N))按时间序列展开与α的时间序列展开按1:1的比例随机输入至判别器模型当中,判断一致性指数
6)按上述规则对两款模型进行迭代优化。直到得到条件是所产生的C-index指数不再发生变化即停止训练,将生成器模型投入数据填充的任务当中。
通过生成器与判别器之间的时态信息的交互,是生成器模型所产生的完整数据会交由判别器来判断是否为真实数据(是完整数据而非是生成数据);生成器与判别器之间相互博弈,彼此进步。通过上述步骤解决了现有技术在有时间序列的临床数据上无法预测缺失数据使缺失数据得到较好填充的问题,能够更加快速高效的处理填充有时间序列的临床数据的缺失数据。
本发明实施例还提供了一种补充缺失数据的生成器模型训练系统,该系统可以通过多尺度神经场单元、判别器单元实现其功能。需要说明的是,本发明实施例的一种补充缺失数据的生成器模型训练系统可以用于执行本发明实施例所提供的补充缺失数据的生成器模型训练方法,本发明实施例的一种补充缺失数据的生成器模型训练方法也可以通过本发明实施例所提供的补充缺失数据的生成器模型训练系统来执行。一种用于药物研发中实体关系的标注自动生成系统包括:
获取单元,用于获取患者数据并填充对应的时态信息索引得到患者信息;
第一列多尺度神经场单元,用于将所述患者信息依次输入至第一列多尺度神经场模块得到第一特征矩阵,其中,所述第一列多尺度神经场模块包括多个第一多尺度神经场模块;
感知经验池单元,用于将所述第一特征矩阵输入至感知经验池中得到第二特征矩阵;
第二列多尺度神经场单元,用于将所述第二特征矩阵输入至所述所述第二列多尺度神经场模块得到填充好的患者信息和生成器模型,其中,所述第二列多尺度神经场模块包括多个第二多尺度神经场模块,所述第一多尺度神经场模块与所述第二多尺度神经场模块数量相同;
第一判别器单元,用于将完整患者原始数据与所述填充好的患者信息随机输入至判别器模型当中,
第二判别器单元,用于在输入至所述判别器模型的数据为所述完整患者原始数据的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型进行单独优化;
第三判别器单元,用于在输入至所述判别器的数据为所述填充好的患者信息的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型和所述生成器模型同时进行优化;直到当所述一致性指数不再发生变化时,停止训练得到最终的生成器模型。
上述一种补充缺失数据的生成器模型训练系统实施例是与一种补充缺失数据的生成器模型训练方法相对应的,所以对于有益效果不再赘述。
本发明实施例提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述方法。
本发明实施例提供了一种处理器,处理器包括处理的程序,其中,在程序运行时控制处理器所在设备执行上述方法。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、移动终端、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种补充缺失数据的生成器模型训练方法,其特征在于,包括:
获取患者数据并填充对应的时态信息索引得到患者信息;
将所述患者信息依次输入至第一列多尺度神经场模块得到第一特征矩阵,其中,所述第一列多尺度神经场模块包括多个第一多尺度神经场模块;
将所述第一特征矩阵输入至感知经验池中得到第二特征矩阵;
将所述第二特征矩阵输入至所述第二列多尺度神经场模块得到填充好的患者信息和生成器模型,其中,所述第二列多尺度神经场模块包括多个第二多尺度神经场模块,所述第一多尺度神经场模块与所述第二多尺度神经场模块数量相同;
将完整患者原始数据与所述填充好的患者信息随机输入至判别器模型当中;
在输入至所述判别器模型的数据为所述完整患者原始数据的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型进行单独优化;
在输入至所述判别器的数据为所述填充好的患者信息的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型和所述生成器模型同时进行优化;
直到当所述一致性指数不再发生变化时,停止训练得到最终的生成器模型。
2.根据权利要求1所述的方法,其特征在于,将所述患者信息依次输入至所述第一列多尺度神经场模块得到所述第一特征矩阵包括:
将每个所述患者信息同时输入至不同尺度的多个卷积神经网络、全连接神经网络、极大值选取过程进行运算获得各自运算的特征图;
将输入不同尺度的多个所述卷积神经网络运算得到的特征图和输入所述极大值选取过程运算得到的特征图,进行矩阵拼接得到第一拼接矩阵;
将输入所述全连接神经网络获得的特征图与所述第一拼接矩阵进行相乘得到第二拼接矩阵;
创建高斯随机数矩阵与所述第二拼接矩阵相乘并将结果经过Sigmoid函数激活后得到第一激活特征矩阵;
将所述第一拼接矩阵输入至递归神经网络中,得到待预测结果的当前时态信息;
将所述待预测结果的时态信息经过ReLU函数激活后,与所述第一激活特征矩阵做点乘,得到每个当前时态的患者信息。
3.根据权利要求2所述的方法,其特征在于,将所述待预测结果的时态信息经过ReLU函数激活后,与所述第一激活特征矩阵做点乘,得到每个当前时态的患者信息之后包括:
将所述当前时态的患者信息和将下一时态的患者信息输入至所述第一列多尺度神经场模块中下一个第一多尺度神经场模块得到下一时态的患者信息;
直至将所述患者信息依次输入至所述第一列多尺度神经场模块中所有的第一多尺度神经场模块为止,得到所述第一特征矩阵。
4.根据权利要求1所述的方法,其特征在于,将所述第一特征矩阵输入至所述感知经验池中得到所述第二特征矩阵包括:
获取预设权重矩阵,其中,所述预设权重矩阵为多个;
将所述第一特征矩阵分别与所述预设权重矩阵相乘得到多个过程矩阵;
将多个所述过程矩阵通过最大池化放缩至相同大小;
将放缩后的多个所述过程矩阵进行拼接得到第三拼接矩阵;
将所述第三拼接矩阵当中小于等于零的元素保持不变;
将所述第三拼接矩阵当中大于零的元素进行开平方根获得第二特征矩阵。
5.根据权利要求1所述的方法,其特征在于,将所述第二特征矩阵输入至所述第二列多尺度神经场模块得到所述填充好的患者信息和所述生成器模型包括:
将所述第二特征矩阵与从输入所述第一列多尺度神经场模块获得的患者信息共同输入至所述第二列多尺度神经场模块中的所述第二多尺度神经场模块,获得新的患者数据;
将所述新的患者数据与下一时态患者信息共同输入至所述第二列多尺度神经场模块中的所述第二多尺度神经场模块,获得下一时态的患者数据直至依次输入至所述第二列多尺度神经场模块中的全部第二多尺度神经场模块进行计算为止,得到所述填充好的患者信息和所述生成器模型。
6.一种补充缺失数据的生成器模型训练系统,其特征在于,包括:
获取单元,用于获取患者数据并填充对应的时态信息索引得到患者信息;
第一列多尺度神经场单元,用于将所述患者信息依次输入至第一列多尺度神经场模块得到第一特征矩阵,其中,所述第一列多尺度神经场模块包括多个第一多尺度神经场模块;
感知经验池单元,用于将所述第一特征矩阵输入至感知经验池中得到第二特征矩阵;
第二列多尺度神经场单元,用于将所述第二特征矩阵输入至所述所述第二列多尺度神经场模块得到填充好的患者信息和生成器模型,其中,所述第二列多尺度神经场模块包括多个第二多尺度神经场模块,所述第一多尺度神经场模块与所述第二多尺度神经场模块数量相同;
第一判别器单元,用于将完整患者原始数据与所述填充好的患者信息随机输入至判别器模型当中;
第二判别器单元,用于在输入至所述判别器模型的数据为所述完整患者原始数据的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型进行单独优化;
第三判别器单元,用于在输入至所述判别器的数据为所述填充好的患者信息的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型和所述生成器模型同时进行优化,直到当所述一致性指数不再发生变化时,停止训练得到最终的生成器模型。
7.一种存储介质,其特征在于,所述存储介质上保存有程序,所述程序被运行时执行权利要求1至5中任一项所述的方法。
8.一种处理器,其特征在于,所述程序被运行时执行权利要求1至5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211374808.7A CN115796235B (zh) | 2022-11-04 | 2022-11-04 | 补充缺失数据的生成器模型训练方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211374808.7A CN115796235B (zh) | 2022-11-04 | 2022-11-04 | 补充缺失数据的生成器模型训练方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115796235A true CN115796235A (zh) | 2023-03-14 |
CN115796235B CN115796235B (zh) | 2023-06-06 |
Family
ID=85435422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211374808.7A Active CN115796235B (zh) | 2022-11-04 | 2022-11-04 | 补充缺失数据的生成器模型训练方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115796235B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111581189A (zh) * | 2020-03-27 | 2020-08-25 | 浙江大学 | 一种空气质量检测数据缺失的补全方法及补全装置 |
WO2021169116A1 (zh) * | 2020-02-29 | 2021-09-02 | 平安科技(深圳)有限公司 | 智能化的缺失数据填充方法、装置、设备及存储介质 |
CN115238804A (zh) * | 2022-07-29 | 2022-10-25 | 广汽本田汽车有限公司 | 基于生成对抗网络的点焊数据填补方法、装置及存储介质 |
-
2022
- 2022-11-04 CN CN202211374808.7A patent/CN115796235B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021169116A1 (zh) * | 2020-02-29 | 2021-09-02 | 平安科技(深圳)有限公司 | 智能化的缺失数据填充方法、装置、设备及存储介质 |
CN111581189A (zh) * | 2020-03-27 | 2020-08-25 | 浙江大学 | 一种空气质量检测数据缺失的补全方法及补全装置 |
CN115238804A (zh) * | 2022-07-29 | 2022-10-25 | 广汽本田汽车有限公司 | 基于生成对抗网络的点焊数据填补方法、装置及存储介质 |
Non-Patent Citations (1)
Title |
---|
陈宣池: "电子健康记录缺失数据预测与填充方法研究", 中国优秀硕士学位论文全文数据库 医药卫生科技辑 * |
Also Published As
Publication number | Publication date |
---|---|
CN115796235B (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111681252B (zh) | 一种基于多路径注意力融合的医学图像自动分割方法 | |
CN109754063A (zh) | 用于学习低精度神经网络的方法及装置 | |
CN107563497A (zh) | 计算装置和方法 | |
CN111180068A (zh) | 一种基于多任务学习模型的慢病预测系统 | |
CN107194426A (zh) | 一种基于Spiking神经网络的图像识别方法 | |
CN111785366B (zh) | 患者治疗方案的确定方法、装置及计算机设备 | |
US20210406687A1 (en) | Method for predicting attribute of target object based on machine learning and related device | |
CN106096286A (zh) | 临床路径制定方法及装置 | |
Cullell-Dalmau et al. | Convolutional neural network for skin lesion classification: understanding the fundamentals through hands-on learning | |
WO2023221668A1 (zh) | 用于脉冲神经网络学习与仿真的计算平台、方法及装置 | |
Luchini et al. | Convergent thinking and insight problem solving relate to semantic memory network structure | |
CN114764619B (zh) | 一种基于量子线路的卷积操作方法及装置 | |
CN111767985B (zh) | 一种神经网络的训练方法、视频识别方法及装置 | |
CN116992980A (zh) | 一种基于超网络和联邦学习的预后预测预警模型训练方法、系统及设备 | |
CN115796235A (zh) | 补充缺失数据的生成器模型训练方法和系统 | |
CN112330362A (zh) | 用于互联网商城用户行为习惯的快速数据智能分析方法 | |
CN116579408A (zh) | 一种基于模型结构冗余度的模型剪枝方法及系统 | |
CN110825903A (zh) | 一种改进哈希融合机制的视觉问答方法 | |
CN110717539A (zh) | 基于人工智能的降维模型训练方法、检索方法及装置 | |
CN113780394B (zh) | 一种强分类器模型的训练方法、装置及设备 | |
CN116186824A (zh) | 基于图像嵌入图神经网络模型的建筑结构布置方法 | |
Omankwu et al. | Hybrid deep learning model for heart disease prediction using recurrent neural network (RNN) | |
CN108197706A (zh) | 残缺数据深度学习神经网络方法、装置、计算机设备及存储介质 | |
CN114238546A (zh) | 一种基于空洞卷积的自适应认知诊断测试设备及方法 | |
CN114066873A (zh) | 一种利用ct图像检测骨质疏松的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |