CN112259247B - 对抗网络训练、医疗数据补充方法、装置、设备及介质 - Google Patents

对抗网络训练、医疗数据补充方法、装置、设备及介质 Download PDF

Info

Publication number
CN112259247B
CN112259247B CN202011140634.9A CN202011140634A CN112259247B CN 112259247 B CN112259247 B CN 112259247B CN 202011140634 A CN202011140634 A CN 202011140634A CN 112259247 B CN112259247 B CN 112259247B
Authority
CN
China
Prior art keywords
data
loss value
network
sample
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011140634.9A
Other languages
English (en)
Other versions
CN112259247A (zh
Inventor
李彦轩
朱昭苇
孙行智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202011140634.9A priority Critical patent/CN112259247B/zh
Priority to PCT/CN2020/135342 priority patent/WO2021189960A1/zh
Publication of CN112259247A publication Critical patent/CN112259247A/zh
Application granted granted Critical
Publication of CN112259247B publication Critical patent/CN112259247B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Instructional Devices (AREA)

Abstract

本发明涉及人工智能技术领域,应用于智慧医疗领域中,揭露了一种对抗网络训练、医疗数据补充方法、装置、设备及介质。该对抗网络训练方法通过获取初始对抗网络,所述初始对抗网络包括含有初始参数的生成器模型以及训练完成的感应网络模型;将预设随机噪声输入至初始对抗网络,通过生成器模型生成与随机噪声对应的生成数据;根据生成数据,通过感应网络模型确定生成器模型的总损失值;在总损失值未达到预设的收敛条件时,更新迭代生成器模型的初始参数,直至总损失值达到所述预设的收敛条件时,将收敛之后的所述初始对抗网络记录为对抗网络。本发明通过改进GAN网络,扩展了训练得到的对抗网络功能,提高了对抗网络生成数据的准确性。

Description

对抗网络训练、医疗数据补充方法、装置、设备及介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种对抗网络训练、医疗数据补充方法、装置、设备及介质。
背景技术
随着科学技术的发展,人工智能技术被广泛应用在各个不同的领域中,如医疗领域、汽车领域。
例如,在医疗领域中,为了从医疗数据中进行人工智能学习,以智能化地完成诸如分诊和病例监控等,需要大量人力进行对应的工作。由于人工智能学习的过程中,需要通过大量数据进行不断训练学习,进而将训练完成的模型替代人工进行智能化工作,但目前,由于医疗数据常常涉及用户隐私,因此医疗数据的获取途径有限会导致医疗数据的稀缺或医疗数据质量层次不齐,从而导致可用于人工智能训练(要求数据质量较好)的医疗数据缺乏,进而使得训练之后的模型应用在医疗领域中时,产生模型准确率低的问题。
发明内容
本发明实施例提供一种对抗网络训练、医疗数据补充方法、装置、设备及介质,以解决数据缺乏且模型准确率低的问题。
一种对抗网络训练方法,包括:
获取初始对抗网络,所述初始对抗网络包括含有初始参数的生成器模型以及训练完成的感应网络模型;
将预设随机噪声输入至所述初始对抗网络,通过所述生成器模型生成与所述随机噪声对应的生成数据;
根据所述生成数据,通过所述感应网络模型确定所述生成器模型的总损失值;
在所述总损失值未达到预设的收敛条件时,更新迭代所述生成器模型的初始参数,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述初始对抗网络记录为对抗网络。
一种对抗网络训练装置,包括:
对抗网络获取模块,用于获取初始对抗网络,所述初始对抗网络包括含有初始参数的生成器模型以及训练完成的感应网络模型;
数据生成模块,用于将预设随机噪声输入至所述初始对抗网络,通过所述生成器模型生成与所述随机噪声对应的生成数据;
损失值确定模块,用于根据所述生成数据,通过所述感应网络模型确定所述生成器模型的总损失值;
收敛判断模块,用于在所述总损失值未达到预设的收敛条件时,更新迭代所述生成器模型的初始参数,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述初始对抗网络记录为对抗网络。
一种医疗数据补充方法,包括:
接收包含医疗全数据集的数据补充指令;所述医疗全数据集中包含多样本医疗数据以及第一小样本医疗数据;所述第一小样本医疗数据与小样本标签关联;
获取所述多样本医疗数据的第一样本数量以及所述第一小样本医疗数据的第二样本数量;所述第二样本数量远小于所述第一样本数量;
将所述第一样本数量与所述第二样本数量之间的差值记录为样本差值;
通过训练完成的对抗网络生成数量与所述样本差值相等且与所述小样本标签关联的第二小样本医疗数据;其中,所述对抗网络是根据上述对抗网路训练方法得到的;所述感应网络模型根据所述医疗全数据集训练得到;
将生成的所述第二小样本医疗数据补充至所述医疗全数据集中。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述对抗网络训练方法,或者所述处理器执行所述计算机程序时实现上述医疗数据补充方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述对抗网络训练方法,或者所述计算机程序被处理器执行时实现上述医疗数据补充方法。
上述对抗网络训练、医疗数据补充方法、装置、设备及介质,通过获取初始对抗网络,所述初始对抗网络包括含有初始参数的生成器模型以及训练完成的感应网络模型;将预设随机噪声输入至所述初始对抗网络,通过所述生成器模型生成与所述随机噪声对应的生成数据;根据所述生成数据,通过所述感应网络模型确定所述生成器模型的总损失值;在所述总损失值未达到预设的收敛条件时,更新迭代所述生成器模型的初始参数,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述初始对抗网络记录为对抗网络。
本发明通过改进现有技术中GAN网络的结构,采用感应网络模型代替判别器模型,使得训练得到的对抗网络可以对生成数据是否符合全数据集分布以及各类别子数据集分布进行判断,本发明扩展了对抗网络的功能,提高了对抗网络中生成数据的准确性;并且训练完成的对抗网络可以适用于不同场景下的小样本数据补充,使得通过补充之后的小样本数据进行训练完成的模型的准确率更高,为各场景下的智能化研究提供便利。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中对抗网络训练方法以及医疗数据补充方法的一应用环境示意图;
图2是本发明一实施例中对抗网络训练方法的一流程图;
图3是本发明一实施例中对抗网络训练方法中步骤S30的一流程图;
图4是本发明一实施例中对抗网络训练方法中步骤S301的一流程图;
图5是本发明一实施例中对抗网络训练方法中步骤S302的一流程图;
图6是本发明一实施例中医疗数据补充方法的一流程图;
图7是本发明一实施例中对抗网络训练装置的一原理框图;
图8是本发明一实施例中对抗网络训练装置中损失值确定模块的一原理框图;
图9是本发明一实施例中对抗网络训练装置中第一损失值确定单元的一原理框图;
图10是本发明一实施例中对抗网络训练装置中第二损失值确定单元的一原理框图;
图11是本发明一实施例中医疗数据补充装置的一原理框图;
图12是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的对抗网络训练方法,该对抗网络训练方法可应用如图1所示的应用环境中。具体地,该对抗网络训练方法应用在对抗网络训练系统中,该对抗网络训练系统包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于解决数据缺乏且模型准确率低的问题。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种对抗网络训练方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S10:获取初始对抗网络,所述初始对抗网络包括含有初始参数的生成器模型以及训练完成的感应网络模型。
其中,初始对抗网络是基于现有技术中GAN(Generative Adversarial Networks,生成对抗网络)网络进行改进得到,该初始对抗网络保留原有GAN网络中含有初始参数的生成器,将原GAN网络中的判别器替换成训练完成的感应网络模型。感应网络模型中包含如下三个模块:编码器模块、感应模块以及相关性模块,该感应网络模型通过全数据集进行训练得到。
在一具体实施方式中,步骤S10之前,也即获取初始对抗网络之前,还包括:
S11:获取全数据集,所述全数据集中包括若干分类对应的子数据集;一个所述子数据集关联一个子数据标签。
其中,全数据集可以为任意场景下的数据集,示例性地,该全数据集可以为所有应用程序数据;可以为医疗领域全数据集;该全数据集中包括若干分类对应的子数据集,假设该全数据集为应用程序数据,则对应的子数据集可以根据具体的应用程序(如网易云音乐、腾讯视频等)进行分类,也可以根据不同种类(如音乐类、视频类、游戏类)的应用程序进行分类,一个子数据集关联一个子数据标签(如音乐类应用程序对应于音乐标签)。
S12:将各所述子数据集输入至所述感应网络模型中,通过所述感应网络模型中的编码器模块对各所述子数据集进行编码转换,得到与各所述子数据集对应的子数据向量。
其中,编码器模块用于将各子数据集中的数据转化为低维度的嵌入向量,利于后续步骤对其进行识别计算。
具体地,在获取全数据集之后,将全数据集中各子数据集输入至感应网络模型中,通过感应网路模型中的编码器模块对各子数据集中的数据进行编码转换,以将该数据转化为与其对应的低维度的嵌入向量,也即各子数据集中各数据对应的子数据向量。
S13:通过所述感应网络模型中的感应模块将各所述子数据向量转化为与各子数据向量对应的类别向量。
其中,感应网络模型利用了动态路由的原理,将每一子数据集对应的子数据向量转化为与其对应的表征。
可以理解地,在感应网络模型的感应模块中,需要将各分类下的所有子数据向量表示为统一特征,也即将各子数据集中的所有子数据向量转化为与其对应的类别向量。
S14:通过所述感应网络模型中的相关性模块,确定与各所述类别向量对应的相关性函数。
其中,相关性模块是提供相关性计算方法的模块。
具体地,在通过所述感应网络模型中的感应模块将各所述子数据向量转化为与各子数据向量对应的类别向量之后,通过感应网络模型中的相关性模块,迭代确定每一类别下的类别向量之间的相关性,并在迭代完相同类别下的类别向量之后,迭代确定不同类别之间的类别向量之间的相关性,进而确定与各类别向量对应的相关性函数。假设类别向量对应为x1、x2、x3,而相关性模块中存在如下关系式:y=λ1x12x23x3,进而根据各类别向量得到的相关性函数可以为:y1=k1x1,y2=k2x2,y3=k3x3
S15:将各所述相关性函数进行同维转换,确定各所述子数据集和与其对应的所述子数据标签之间的关系式。
其中,同维转换指的是将各相关性函数转化成同维度关系式。
具体地,在通过所述感应网络模型中的相关性模块,确定与各所述类别向量对应的相关性函数之后,将各相关性函数进行同维转换,确定各子数据集和与其对应的子数据标签之间的关系式。示例性地,假设一子数据集对应的特征为x,子数据标签为z,该关系式可以为,z=x+1。可以理解地,该关系式是感应网路模型中隐藏的关系式,只有通过感应网路模型学习识别得到,以令感应网络模型可以根据各关系式确定新输入数据是否符合任意一个子数据集分类。
S16:在各所述关系式达到预设关系式标准之后,表征所述感应网络模型训练完成。
可以理解地,预设关系式标准可以为当关系式中子数据集与子数据标签之间的关系系数变化很小或者不再改变时,确定该关系式为最终的关系式,进而在所有关系式均确定完成之后,表征感应网络模型训练完成。示例性地,假设一子数据集对应的特征为x,子数据标签为z,该关系式可以为,z=x+1,1则为该关系式中的关系系数,若在后续迭代训练过程中,该关系系数变化小于0.00001,则认为该子数据集与子数据标签之前的关系式确定成功。
进一步地,训练完成的感应网络模型可以学习到全数据集的分布的同时,在新的数据输入至感应网络模型之后,可以将该新的数据归类到与其分布最接近的类别中,也即感应网络模型可以判定新的数据是否符合全数据集的分布,还可以判定新的数据是否符合任意一个类别的子数据集的分布。
S20:将预设随机噪声输入至所述初始对抗网络,通过所述生成器模型生成与所述预设随机噪声对应的生成数据。
其中,预设随机噪声可以通过随机算法产生。进一步地,在随机算法产生预设随机噪声之后,通过生成器模型接收该预设随机噪声,并生成与该预设随机噪声对应的生成数据。
S30:根据所述生成数据,通过所述感应网络模型确定所述生成器模型的总损失值。
具体地,如图3所示,步骤S30中包括以下步骤:
S301:通过所述感应网络模型输出所述生成数据与小样本数据之间的第一损失值。
其中,小样本数据指的是全数据集中样本量较少的类别对应的数据,示例性地,假设全数据集为应用程序数据集,在该全数据集中,书籍类别应用程序的数据较少,则可以将书籍类别对应的数据称为小样本数据。第一损失值是根据生成数据与小样本数据之间的匹配度进行对数计算得到的。
进一步地,如图4所示,步骤S301中包括如下步骤:
S3011:获取与所述生成数据对应的生成标签,以及与所述小样本数据对应的样本标签。其中,生成标签表征生成数据的类别。样本标签表征小样本数据的类别。
S3012:根据所述小样本数据以及所述样本标签,确定所述感应网络模型中与所述小样本数据对应的第一关系式。
可以理解地,在感应网络模型通过全数据集进行训练的时候,对于训练完成的感应网路模型,其学习了全数据集的分布,同时识别了各类别对应的子数据集的分布,也即该感应网络模型中已经确定出小样本数据与样本标签之间的第一关系式。
S3013:根据所述生成数据、生成标签以及所述第一关系式,确定所述第一损失值。
可以理解地,针对含有初始参数的生成器模型,在第一次根据预设随机噪声得到的生成数据和与其对应的生成标签之间的关系式,与第一关系式之间差别较大,感应网络模型会输出一个与生成器模型对应的第一损失值,该第一损失值是根据生成数据、生成标签以及第一关系式确定的。
S302:通过所述感应网络模型输出所述生成数据与全数据集之间的第二损失值。
其中,第二损失值是根据生成数据与全数据集之间的匹配度进行对数计算得到的。
进一步地,如图5所示,步骤S302中包括如下步骤:
S3021:获取与所述全数据集对应的全数据标签。
S3022:根据所述全数据集以及所述全数据集标签,确定所述感应网络模型中与所述全数据集对应的第二关系式。
可以理解地,在感应网络模型通过全数据集进行训练的时候,对于训练完成的感应网路模型,其学习了全数据集的分布,因此该感应网络模型中已经确定出全数据集与全数据标签之间的第二关系式。
S3023:根据所述生成数据、生成标签以及所述第二关系式,确定所述第二损失值。
可以理解地,为了使得生成器模型生成的数据,在符合对应的类别的子数据集的分布的同时,符合全数据集的分布,进而使得生成数据补充至全数据集之后,可以不破坏全数据集的分布,因此需要根据生成数据、生成标签以及所述第二关系式,确定生成器模型的第二损失值。
S303:根据所述第一损失值以及所述第二损失值,通过所述感应网络模型确定所述生成器模型的总损失值。
具体地,可以通过以下损失函数确定生成器模型的总损失值:
LOSSG=-α*log(similarityall)-βlog(similaritypart)
其中,LOSSG为所述总损失值;log(similaritypart)为所述第一损失值;log(similarityall)为所述第二损失值;α为所述第二损失值对应的权重;β为所述第一损失值对应的权重。
进一步地,similaritypart为所述生成数据与所述小样本数据之间的匹配度,也即对生成数据是否符合小样本数据分布的判断;similarityall为所述生成数据与所述全数据集之间的匹配度,也即对生成数据是否符合全数据集分布的判断。
S40:在所述总损失值未达到预设的收敛条件时,更新迭代所述生成器模型的初始参数,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述初始对抗网络记录为对抗网络。
可以理解地,该收敛条件可以为总损失值小于设定阈值的条件,也即在总损失值小于设定阈值时,停止训练;收敛条件还可以为总损失值经过了10000次计算后值为很小且不会再下降的条件,也即总损失值经过10000次计算后值很小且不会下降时,停止训练,并将收敛之后的初始对抗网络记录为对抗网络。
如此,在通过不同的预设随机噪声输入至初始对抗网络,通过生成器模型生成对应的生成数据之后,根据感应网络模型输出的总损失值,调整生成器模型的初始参数,使得生成器模型输出的生成数据可以不断向全数据集分布以及小样本数据分布靠拢,让生成数据与小样本数据之间的匹配度,以及生成数据与全数据集之间的匹配度越来越高,直至生成器模型的总损失值达到预设的收敛条件时,将收敛之后的初始对抗网络记录为对抗网络。
在本实施例中,通过改进现有技术中GAN网络的结构,采用感应网络模型代替判别器模型,使得训练得到的对抗网络可以对生成数据是否符合全数据集分布以及各类别子数据集分布进行判断,本发明扩展了对抗网络的功能,提高了对抗网络中生成数据的准确性;并且训练完成的对抗网络可以适用于不同场景下的小样本数据补充,使得通过补充之后的小样本数据进行训练完成的模型的准确率更高,为各场景下的智能化研究提供便利,以便推动智慧城市的建设。
在另一具体实施例中,为了保证上述实施例中的全数据集以及对抗网络的私密以及安全性,可以将全数据集以及对抗网络存储在区块链中。其中,区块链(Blockchain),是由区块(Block)形成的加密的、链式的交易的存储结构。
例如,每个区块的头部既可以包括区块中所有交易的哈希值,同时也包含前一个区块中所有交易的哈希值,从而基于哈希值实现区块中交易的防篡改和防伪造;新产生的交易被填充到区块并经过区块链网络中节点的共识后,会被追加到区块链的尾部从而形成链式的增长。
在一实施例中,如图6所示,提供一种医疗数据补充方法,包括如下步骤:
S50:接收包含医疗全数据集的数据补充指令;所述医疗全数据集中包含多样本医疗数据以及第一小样本医疗数据;所述第一小样本医疗数据与小样本标签关联。
其中,医疗全数据集为包含某一具体场景下(如某一具体医院、或者某一具体科室)的所有医疗数据的集合。多样本医疗数据指的是全数据集中样本量较多的类别对应的数据。小样本医疗数据指的是全数据集中样本量较少的类别对应的数据。
S60:获取所述多样本医疗数据的第一样本数量以及所述第一小样本医疗数据的第二样本数量;所述第二样本数量小于所述第一样本数量。
示例性地,假设医疗全数据集中一共包含十万组数据,其中多样本医疗数据对应的数据数量是万级别的,而小样本医疗数据对应的数据数量可能是百级别的,也即多样本医疗数据其中一类医疗数据可能有五万组数据,而小样本医疗数据中仅只有几百组数据。而在医疗领域中,常常会因为小样本医疗数据的不充足,导致诸如分诊模型等医疗模型无法从样本量少的类别中获得足够多的特征信息,从而导致无法对属于小样本医疗数据类别的数据进行正确分类。
S70:将所述第一样本数量与所述第二样本数量之间的差值记录为样本差值。
S80:通过训练完成的对抗网络生成数量与所述样本差值相等且与所述小样本标签关联的第二小样本医疗数据;其中,所述对抗网络是根据上述实施例中对抗网路训练方法得到的;所述感应网络模型根据所述医疗全数据集训练得到。
S90:将生成的所述第二小样本医疗数据补充至所述医疗全数据集中。
其中,对抗网络是根据上述实施例中对抗网络训练方法得到的,并且该对抗网络中的全数据集为医疗全数据集,也即该对抗网络中的感应网络模型是根据医疗全数据集训练得到的。
在获取所述多样本医疗数据的第一样本数量以及所述第一小样本医疗数据的第二样本数量之后,将所述第一样本数量与所述第二样本数量之间的差值记录为样本差值;通过训练完成的对抗网络中的生成器模型,根据随机算法得到的随机噪声信号生成数量与样本差值且与小样本标签关联的第二小样本医疗数据,进而将生成的第二小样本医疗数据补充至医疗全数据集中,以令多样本医疗数据的数量,与第一小样本医疗数据以及第二小样本医疗数据之和达到均衡,并且生成的第二小样本医疗数据补充至医疗全数据集之后,不会破坏医疗全数据集的分布,从而在根据补充之后的全数据集训练例如分诊模型等医疗场景的相关模型时,可以令该模型克服某些类别下样本数据过少的难题,进而在医疗全数据里的小样本医疗数据上同样达到较高的模型分类准确率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种对抗网络训练装置,该对抗网络训练装置与上述实施例中对抗网络训练方法一一对应。如图7所示,该对抗网络训练装置包括对抗网络获取模块10、数据生成模块20、损失值确定模块30和收敛判断模块40。各功能模块详细说明如下:
对抗网络获取模块10,用于获取初始对抗网络,所述初始对抗网络包括含有初始参数的生成器模型以及训练完成的感应网络模型;
数据生成模块20,用于将预设随机噪声输入至所述初始对抗网络,通过所述生成器模型生成与所述随机噪声对应的生成数据;
损失值确定模块30,用于根据所述生成数据,通过所述感应网络模型确定所述生成器模型的总损失值;
收敛判断模块40,用于在所述总损失值未达到预设的收敛条件时,更新迭代所述生成器模型的初始参数,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述初始对抗网络记录为对抗网络。
优选地,对抗网络训练装置还包括如下模块:
全数据集获取模块11,用于获取全数据集,所述全数据集中包括若干分类对应的子数据集;一个所述子数据集关联一个子数据标签;
编码转换模块12,用于将各所述子数据集输入至所述感应网络模型中,通过所述感应网络模型中的编码器模块对各所述子数据集进行编码转换,得到与各所述子数据集对应的子数据向量;
向量转化模块13,用于通过所述感应网络模型中的感应模块将各所述子数据向量转化为与各子数据向量对应的类别向量;
相关性计算模块14,用于通过所述感应网络模型中的相关性模块,确定与各所述类别向量对应的相关性函数;
维度转换模块15,用于将各所述相关性函数进行同维转换,确定各所述子数据集和与其对应的所述子数据标签之间的关系式;
标准判定模块16,用于在各所述关系式达到预设关系式标准之后,表征所述感应网络模型训练完成。
优选地,如图8所示,损失值确定模块30包括如下单元:
第一损失值确定单元301,用于通过所述感应网络模型输出所述生成数据与小样本数据之间的第一损失值;
第二损失值确定单元302,用于通过所述感应网络模型输出所述生成数据与全数据集之间的第二损失值;
总损失值确定单元303,用于根据所述第一损失值以及所述第二损失值,通过所述感应网络模型确定所述生成器模型的总损失值。
优选地,如图9所示,第一损失值确定单元301包括如下子单元:
第一标签获取子单元3011,用于获取与所述生成数据对应的生成标签,以及与所述小样本数据对应的样本标签。
第一关系式确定子单元3012,用于根据所述小样本数据以及所述样本标签,确定所述感应网络模型中与所述小样本数据对应的第一关系式。
第一损失值确定子单元3013,用于根据所述生成数据、生成标签以及所述第一关系式,确定所述第一损失值。
优选地,如图10所示,第二损失值确定单元302包括如下子单元:
第二标签获取子单元3021,用于获取与所述全数据集对应的全数据标签;
第二关系式确定子单元3022,用于根据所述全数据集以及所述全数据集标签,确定所述感应网络模型中与所述全数据集对应的第二关系式;
第二损失值确定子单元3023,用于根据所述生成数据、生成标签以及所述第二关系式,确定所述第二损失值。
优选地,总损失值确定单元303还用于通过如下损失函数确定所述生成器模型的总损失值:
LOSSG=-α*log(similarityall)-βlog(similaritypart)
其中,LOSSG为所述总损失值;log(similaritypart)为所述第一损失值;log(similarityall)为所述第二损失值;α为所述第二损失值对应的权重;β为所述第一损失值对应的权重。
关于对抗网络训练装置的具体限定可以参见上文中对于对抗网络训练方法的限定,在此不再赘述。上述对抗网络训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一实施例中,提供一种医疗数据补充装置,该医疗数据补充装置与上述实施例中医疗数据补充方法一一对应。如图11所示,该医疗数据补充装置包括补充指令接收模块50、样本数量获取模块60、样本差值记录模块70、数据生成模块80和数据补充模块90。各功能模块详细说明如下:
补充指令接收模块50,用于接收包含医疗全数据集的数据补充指令;所述医疗全数据集中包含多样本医疗数据以及第一小样本医疗数据;所述第一小样本医疗数据与小样本标签关联;
样本数量获取模块60,用于获取所述多样本医疗数据的第一样本数量以及所述第一小样本医疗数据的第二样本数量;所述第二样本数量小于所述第一样本数量;
样本差值记录模块70,用于将所述第一样本数量与所述第二样本数量之间的差值记录为样本差值;
数据生成模块80,用于通过训练完成的对抗网络生成数量与所述样本差值相等且与所述小样本标签关联的第二小样本医疗数据;其中,所述对抗网络是根据上述实施例中对抗网路训练方法得到的;所述感应网络模型根据所述医疗全数据集训练得到;
数据补充模块90,用于将生成的所述第二小样本医疗数据补充至所述医疗全数据集中。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图12所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储上述实施例中对抗网络训练方法或者医疗数据补充方法所使用到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种对抗网络训练方法,或者该计算机程序被处理器执行时以实现一种医疗数据补充方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中对抗网络训练方法,或者处理器执行计算机程序时实现上述实施例中医疗数据补充方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中对抗网络训练方法,或者计算机程序被处理器执行时实现上述实施例中医疗数据补充方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (8)

1.一种医疗数据补充方法,其特征在于,包括:
接收包含医疗全数据集的数据补充指令;所述医疗全数据集中包含多样本医疗数据以及第一小样本医疗数据;所述第一小样本医疗数据与小样本标签关联;
获取所述多样本医疗数据的第一样本数量以及所述第一小样本医疗数据的第二样本数量;所述第二样本数量小于所述第一样本数量;
将所述第一样本数量与所述第二样本数量之间的差值记录为样本差值;
通过训练完成的对抗网络生成数量与所述样本差值相等且与所述小样本标签关联的第二小样本医疗数据;
将生成的所述第二小样本医疗数据补充至所述医疗全数据集中;
其中,所述对抗网络根据下述对抗网络训练方法生成:
获取初始对抗网络,所述初始对抗网络包括含有初始参数的生成器模型以及训练完成的感应网络模型;所述感应网络模型根据全数据集训练得到;
将预设随机噪声输入至所述初始对抗网络,通过所述生成器模型生成与所述预设随机噪声对应的生成数据;
根据所述生成数据,通过所述感应网络模型确定所述生成器模型的总损失值;
在所述总损失值未达到预设的收敛条件时,更新迭代所述生成器模型的初始参数,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述初始对抗网络记录为对抗网络;
所述获取初始对抗网络之前,还包括:
获取全数据集,所述全数据集中包括若干分类对应的子数据集;一个所述子数据集关联一个子数据标签;
将各所述子数据集输入至所述感应网络模型中,通过所述感应网络模型中的编码器模块对各所述子数据集进行编码转换,得到与各所述子数据集对应的子数据向量;
通过所述感应网络模型中的感应模块将各所述子数据向量转化为与各子数据向量对应的类别向量;
通过所述感应网络模型中的相关性模块,确定与各所述类别向量对应的相关性函数;
将各所述相关性函数进行同维转换,确定各所述子数据集和与其对应的所述子数据标签之间的关系式;
在各所述关系式达到预设关系式标准之后,表征所述感应网络模型训练完成。
2.如权利要求1所述的医疗数据补充方法,其特征在于,所述根据所述生成数据,通过所述感应网络模型确定所述生成器模型的总损失值,包括:
通过所述感应网络模型输出所述生成数据与小样本数据之间的第一损失值;
通过所述感应网络模型输出所述生成数据与全数据集之间的第二损失值;
根据所述第一损失值以及所述第二损失值,通过所述感应网络模型确定所述生成器模型的总损失值。
3.如权利要求2所述的医疗数据补充方法,其特征在于,所述通过所述感应网络模型输出所述生成数据与所述小样本数据之间的第一损失值,包括:
获取与所述生成数据对应的生成标签,以及与所述小样本数据对应的样本标签;
根据所述小样本数据以及所述样本标签,确定所述感应网络模型中与所述小样本数据对应的第一关系式;
根据所述生成数据、生成标签以及所述第一关系式,确定所述第一损失值。
4.如权利要求3所述的医疗数据补充方法,其特征在于,所述通过所述感应网络模型输出所述生成数据与所述全数据集之间的第二损失值,包括:
获取与所述全数据集对应的全数据标签;
根据所述全数据集以及所述全数据标签,确定所述感应网络模型中与所述全数据集对应的第二关系式;
根据所述生成数据、生成标签以及所述第二关系式,确定所述第二损失值。
5.如权利要求2所述的医疗数据补充方法,其特征在于,所述根据所述第一损失值以及所述第二损失值,通过所述感应网络模型确定所述生成器模型的总损失值,包括:
通过如下损失函数确定所述生成器模型的总损失值:
LOSSG=-α*log(similarityall)-βlog(similaritypart)
其中,LOSSG为所述总损失值;
log(similaritypart)为所述第一损失值;
log(similarityall)为所述第二损失值;
α为所述第二损失值对应的权重;
β为所述第一损失值对应的权重。
6.一种医疗数据补充装置,其特征在于,包括:
补充指令接收模块,用于接收包含医疗全数据集的数据补充指令;所述医疗全数据集中包含多样本医疗数据以及第一小样本医疗数据;所述第一小样本医疗数据与小样本标签关联;
样本数量获取模块,用于获取所述多样本医疗数据的第一样本数量以及所述第一小样本医疗数据的第二样本数量;所述第二样本数量小于所述第一样本数量;
样本差值记录模块,用于将所述第一样本数量与所述第二样本数量之间的差值记录为样本差值;
数据生成模块,用于通过训练完成的对抗网络生成数量与所述样本差值相等且与所述小样本标签关联的第二小样本医疗数据;
数据补充模块,用于将生成的所述第二小样本医疗数据补充至所述医疗全数据集中;
其中,所述对抗网络通过对抗网络训练装置生成,所述对抗网络训练装置包括:
对抗网络获取模块,用于获取初始对抗网络,所述初始对抗网络包括含有初始参数的生成器模型以及训练完成的感应网络模型;
数据生成模块,用于将预设随机噪声输入至所述初始对抗网络,通过所述生成器模型生成与所述随机噪声对应的生成数据;
损失值确定模块,用于根据所述生成数据,通过所述感应网络模型确定所述生成器模型的总损失值;
收敛判断模块,用于在所述总损失值未达到预设的收敛条件时,更新迭代所述生成器模型的初始参数,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述初始对抗网络记录为对抗网络;
所述对抗网络训练装置还包括:
全数据集获取模块,用于获取全数据集,所述全数据集中包括若干分类对应的子数据集;一个所述子数据集关联一个子数据标签;
编码转换模块,用于将各所述子数据集输入至所述感应网络模型中,通过所述感应网络模型中的编码器模块对各所述子数据集进行编码转换,得到与各所述子数据集对应的子数据向量;
向量转化模块,用于通过所述感应网络模型中的感应模块将各所述子数据向量转化为与各子数据向量对应的类别向量;
相关性计算模块,用于通过所述感应网络模型中的相关性模块,确定与各所述类别向量对应的相关性函数;
维度转换模块,用于将各所述相关性函数进行同维转换,确定各所述子数据集和与其对应的所述子数据标签之间的关系式;
标准判定模块,用于在各所述关系式达到预设关系式标准之后,表征所述感应网络模型训练完成。
7.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述医疗数据补充方法。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述医疗数据补充方法。
CN202011140634.9A 2020-10-22 2020-10-22 对抗网络训练、医疗数据补充方法、装置、设备及介质 Active CN112259247B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011140634.9A CN112259247B (zh) 2020-10-22 2020-10-22 对抗网络训练、医疗数据补充方法、装置、设备及介质
PCT/CN2020/135342 WO2021189960A1 (zh) 2020-10-22 2020-12-10 对抗网络训练、医疗数据补充方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011140634.9A CN112259247B (zh) 2020-10-22 2020-10-22 对抗网络训练、医疗数据补充方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN112259247A CN112259247A (zh) 2021-01-22
CN112259247B true CN112259247B (zh) 2022-08-23

Family

ID=74264222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011140634.9A Active CN112259247B (zh) 2020-10-22 2020-10-22 对抗网络训练、医疗数据补充方法、装置、设备及介质

Country Status (2)

Country Link
CN (1) CN112259247B (zh)
WO (1) WO2021189960A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113239022B (zh) * 2021-04-19 2023-04-07 浙江大学 医疗诊断缺失数据补全方法及补全装置、电子设备、介质
CN114254739A (zh) * 2021-12-21 2022-03-29 南方电网数字电网研究院有限公司 多模态电力传感器的数据处理方法、装置和计算机设备
CN114548367B (zh) * 2022-01-17 2024-02-20 中国人民解放军国防科技大学 基于对抗网络的多模态数据的重构方法及装置
CN115062755A (zh) * 2022-04-22 2022-09-16 中国人民解放军国防科技大学 基于改进条件生成对抗网络的数据扩充方法和设置
CN115099300B (zh) * 2022-05-11 2024-08-06 合肥工业大学 多源异构数据处理方法和系统
CN117291252B (zh) * 2023-11-27 2024-02-20 浙江华创视讯科技有限公司 稳定视频生成模型训练方法、生成方法、设备及存储介质
CN117933250B (zh) * 2024-03-22 2024-06-18 南京泛美利机器人科技有限公司 一种基于改进生成对抗网络的新菜谱生成方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220600A (zh) * 2017-05-17 2017-09-29 清华大学深圳研究生院 一种基于深度学习的图片生成方法及生成对抗网络
CN108805418A (zh) * 2018-05-22 2018-11-13 福州大学 一种基于生成式对抗网络的交通数据填充方法
CN109522973A (zh) * 2019-01-17 2019-03-26 云南大学 基于生成式对抗网络与半监督学习的医疗大数据分类方法及系统
CN110070174A (zh) * 2019-04-10 2019-07-30 厦门美图之家科技有限公司 一种生成对抗网络的稳定训练方法
CN111275686A (zh) * 2020-01-20 2020-06-12 中山大学 用于人工神经网络训练的医学图像数据的生成方法及装置
CN111738346A (zh) * 2020-06-28 2020-10-02 辽宁大学 一种生成式对抗网络估值的不完整数据聚类方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4404111A3 (en) * 2018-07-30 2024-10-23 Memorial Sloan Kettering Cancer Center Multi-modal, multi-resolution deep learning neural networks for segmentation, outcomes prediction and longitudinal response monitoring to immunotherapy and radiotherapy
KR20200075344A (ko) * 2018-12-18 2020-06-26 삼성전자주식회사 검출기, 객체 검출 방법, 학습기 및 도메인 변환을 위한 학습 방법
CN109948717B (zh) * 2019-03-26 2023-08-18 江南大学 一种生成对抗网络的自生长训练方法
CN111797078A (zh) * 2019-04-09 2020-10-20 Oppo广东移动通信有限公司 数据清洗方法、模型训练方法、装置、存储介质及设备
CN110503187B (zh) * 2019-07-26 2024-01-16 深圳万知达科技有限公司 一种用于功能核磁共振成像数据生成的生成对抗网络模型的实现方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220600A (zh) * 2017-05-17 2017-09-29 清华大学深圳研究生院 一种基于深度学习的图片生成方法及生成对抗网络
CN108805418A (zh) * 2018-05-22 2018-11-13 福州大学 一种基于生成式对抗网络的交通数据填充方法
CN109522973A (zh) * 2019-01-17 2019-03-26 云南大学 基于生成式对抗网络与半监督学习的医疗大数据分类方法及系统
CN110070174A (zh) * 2019-04-10 2019-07-30 厦门美图之家科技有限公司 一种生成对抗网络的稳定训练方法
CN111275686A (zh) * 2020-01-20 2020-06-12 中山大学 用于人工神经网络训练的医学图像数据的生成方法及装置
CN111738346A (zh) * 2020-06-28 2020-10-02 辽宁大学 一种生成式对抗网络估值的不完整数据聚类方法

Also Published As

Publication number Publication date
CN112259247A (zh) 2021-01-22
WO2021189960A1 (zh) 2021-09-30

Similar Documents

Publication Publication Date Title
CN112259247B (zh) 对抗网络训练、医疗数据补充方法、装置、设备及介质
CN111767707B (zh) 雷同病例检测方法、装置、设备及存储介质
CN108563782B (zh) 商品信息格式处理方法、装置、计算机设备和存储介质
CN109325118B (zh) 不平衡样本数据预处理方法、装置和计算机设备
WO2021169364A1 (zh) 分析语义情感的方法、装置、设备及存储介质
CN110489622B (zh) 对象信息的分享方法、装置、计算机设备和存储介质
CN111476216A (zh) 人脸识别方法、装置、计算机设备和可读存储介质
CN111881737A (zh) 年龄预测模型的训练方法及装置、年龄预测方法及装置
CN110912908A (zh) 网络协议异常检测方法、装置、计算机设备和存储介质
CN113723070A (zh) 文本相似度模型训练方法、文本相似度检测方法及装置
CN113707296B (zh) 医疗方案数据处理方法、装置、设备及存储介质
CN113343711B (zh) 工单生成方法、装置、设备及存储介质
He et al. Estimating latent relative labeling importances for multi-label learning
CN114358249A (zh) 目标识别模型训练、目标识别方法及装置
CN113535582A (zh) 接口测试方法、装置、设备及计算机可读存储介质
CN110288002B (zh) 一种基于稀疏正交神经网络的图像分类方法
CN113947185B (zh) 任务处理网络生成、任务处理方法、装置、电子设备及存储介质
CN115358473A (zh) 基于深度学习的电力负荷预测方法及预测系统
CN115222112A (zh) 一种行为预测方法、行为预测模型的生成方法及电子设备
WO2023173546A1 (zh) 文本识别模型的训练方法、装置、计算机设备及存储介质
CN113688989A (zh) 深度学习网络加速方法、装置、设备及存储介质
CN112528662A (zh) 基于元学习的实体类别识别方法、装置、设备和存储介质
CN113011555B (zh) 一种数据处理方法、装置、设备及存储介质
CN112667394A (zh) 一种计算机资源利用率优化方法
CN112148902A (zh) 数据处理方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40040605

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant