CN116883786A - 图数据增广方法、装置、计算机设备及可读存储介质 - Google Patents
图数据增广方法、装置、计算机设备及可读存储介质 Download PDFInfo
- Publication number
- CN116883786A CN116883786A CN202310882485.0A CN202310882485A CN116883786A CN 116883786 A CN116883786 A CN 116883786A CN 202310882485 A CN202310882485 A CN 202310882485A CN 116883786 A CN116883786 A CN 116883786A
- Authority
- CN
- China
- Prior art keywords
- augmentation
- image
- graph
- strategy
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013434 data augmentation Methods 0.000 title claims abstract description 55
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000003416 augmentation Effects 0.000 claims abstract description 183
- 239000013598 vector Substances 0.000 claims abstract description 75
- 238000010801 machine learning Methods 0.000 claims abstract description 57
- 238000012549 training Methods 0.000 claims abstract description 52
- 230000003190 augmentative effect Effects 0.000 claims abstract description 17
- 238000012216 screening Methods 0.000 claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 238000009499 grossing Methods 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 9
- 230000005856 abnormality Effects 0.000 abstract description 8
- 230000006870 function Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 7
- 238000010191 image analysis Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000003321 amplification Effects 0.000 description 4
- 230000036541 health Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- UFYQLXOGDWQBGQ-UHFFFAOYSA-N 10-phenylspiro[acridine-9,9'-fluorene]-2',7'-dicarbonitrile Chemical compound C12=CC(C#N)=CC=C2C2=CC=C(C#N)C=C2C1(C1=CC=CC=C11)C2=CC=CC=C2N1C1=CC=CC=C1 UFYQLXOGDWQBGQ-UHFFFAOYSA-N 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/094—Adversarial learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图数据增广方法、装置、计算机设备及可读存储介质,涉及互联网技术及数字医疗领域,定义多个候选增广策略来模拟医疗图数据中存在的噪声或异常。通过执行候选增广策略,修改医疗原始图像的节点、边、图像特征或标签以增加增广医疗图数据的多样性和复杂性。所述方法包括:定义多个候选增广策略;响应于图数据增广指令,提取原始图像的统计特征,按照统计特征对多个候选增广策略进行策略筛选,得到增广策略向量;遍历增广策略向量中的每个元素,根据每个元素的元素值,确定全部指定候选增广策略并执行,对原始图像的节点、边、图像特征或标签进行修改或保留,得到目标图像;将目标图像和原始图像输入至图机器学习模型进行模型训练。
Description
技术领域
本申请涉及互联网技术及数字医疗领域,特别是涉及一种图数据增广方法、装置、计算机设备及可读存储介质。
背景技术
随着互联网技术及数字医疗领域的不断发展,出现了越来越多具备影像分析功能的医疗设备或医疗服务类APP。影像分析模型获取患者的医疗影像进行健康分析,以输出健康分析结果。影像分析模型在进行模型训练的过程中需要使用大量的医疗图像数据,而医疗图像数据往往是敏感且难以获取的。因此出现了图数据增广技术,图数据增广技术是一种通过修改或生成图数据来增加训练数据量的技术,以提高图机器学习模型的泛化能力和性能。现有的标签图数据增广方法,是通过伪标记或数据混合来扩充图数据,却忽略了不同程度和类型的噪声对图数据增广的影响。因此,亟需一种图数据增广方法可以在增广过程中模拟和引入图数据中可能存在的各种噪声、异常或攻击情况,进而提高图机器学习模型对于复杂和真实世界数据的鲁棒性和泛化能力。
发明内容
有鉴于此,本申请提供了一种图数据增广方法、装置、计算机设备及可读存储介质,主要目的在于解决目前标签图数据增广方法忽略了不同程度和类型的噪声对图数据增广影响的问题。
依据本申请第一方面,提供了一种图数据增广方法,该方法包括:
定义多个候选增广策略,所述多个候选增广策略用于模拟图数据中存在的噪声、异常或攻击,包括但不限于节点丢弃策略、边扰动策略、特征扰动策略和标签平滑策略;
响应于图数据增广指令,提取原始图像的统计特征,按照所述统计特征对所述多个候选增广策略进行策略筛选,得到增广策略向量;
遍历所述增广策略向量中的每个元素,根据每个所述元素的元素值,确定全部指定候选增广策略并执行,对所述原始图像的节点、边、图像特征或标签进行修改或保留,得到目标图像;
将所述目标图像和所述原始图像输入至图机器学习模型进行模型训练。
依据本申请第二方面,提供了一种图数据增广装置,该装置包括:
设置模块,用于定义多个候选增广策略,所述多个候选增广策略用于模拟图数据中存在的噪声、异常或攻击,包括但不限于节点丢弃策略、边扰动策略、特征扰动策略和标签平滑策略;
策略选择模块,用于响应于图数据增广指令,提取原始图像的统计特征,按照所述统计特征对所述多个候选增广策略进行策略筛选,得到增广策略向量;
策略执行模块,用于遍历所述增广策略向量中的每个元素,根据每个所述元素的元素值,确定全部指定候选增广策略并执行,对所述原始图像的节点、边、图像特征或标签进行修改或保留,得到目标图像;
自监督学习模块,用于将所述目标图像和所述原始图像输入至图机器学习模型进行模型训练。
依据本申请第三方面,提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面中任一项所述方法的步骤。
依据本申请第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一项所述的方法的步骤。
借由上述技术方案,本申请提供的一种图数据增广方法、装置、计算机设备及可读存储介质,本申请首先定义多个用于模拟图数据中存在的噪声、异常或攻击的候选增广策略。接下来,响应于图数据增广指令,提取原始图像的统计特征。进而按照统计特征对多个候选增广策略进行策略筛选,得到增广策略向量。进一步地,遍历增广策略向量中的每个元素,根据每个元素的元素值,确定全部指定候选增广策略并执行,对原始图像的节点、边、图像特征或标签进行修改或保留,得到目标图像。最后,将目标图像和原始图像输入至图机器学习模型进行模型训练。本申请实施例定义多个候选增广策略来模拟和引入图数据中可能存在的各种噪声、异常或攻击情况,通过执行这些候选增广策略,修改原始图像的节点、边、图像特征或标签从而增加增广图数据的多样性和复杂性。医疗图像机器学习模型在使用这些多样且复杂的训练样本进行训练时,可以提高模型在处理复杂和真实数据时的鲁棒性和泛化能力,进而提升医疗图像机器学习模型对不同场景的适应性。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请实施例提供的一种图数据增广方法流程示意图;
图2A示出了本申请实施例提供的一种图数据增广方法流程示意图;
图2B示出了本申请实施例提供的一种图数据增广方法流程示意图;
图3示出了本申请实施例提供的一种图数据增广装置的结构示意图;
图4示出了本申请实施例提供的一种计算机设备的装置结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
本申请实施例提供了一种图数据增广方法,如图1所示,该方法包括:
101、定义多个候选增广策略,多个候选增广策略用于模拟图数据中存在的噪声、异常或攻击,包括但不限于节点丢弃策略、边扰动策略、特征扰动策略和标签平滑策略。
随着互联网技术及数字医疗领域的不断发展,出现了越来越多具备影像分析功能的医疗设备或医疗服务类APP。影像分析模型获取患者的医疗影像进行健康分析,以输出健康分析结果。影像分析模型在进行模型训练的过程中需要使用大量的医疗图像数据,而医疗图像数据往往是敏感且难以获取的。因此出现了图数据增广技术,图数据增广技术是一种通过修改或生成图数据来增加训练数据量的技术,以提高图机器学习模型的泛化能力和性能。现有的标签图数据增广方法,是通过伪标记或数据混合来扩充图数据,却忽略了不同程度和类型的噪声对图数据增广的影响。因此,本申请提出了一种图数据增广方法、装置、计算机设备及可读存储介质,首先定义多个用于模拟图数据中存在的噪声、异常或攻击的候选增广策略。接下来,响应于图数据增广指令,提取原始图像的统计特征。进而按照统计特征对多个候选增广策略进行策略筛选,得到增广策略向量。进一步地,遍历增广策略向量中的每个元素,根据每个元素的元素值,确定全部指定候选增广策略并执行,对原始图像的节点、边、图像特征或标签进行修改或保留,得到目标图像。最后,将目标图像和原始图像输入至图机器学习模型进行模型训练。本申请实施例定义多个候选增广策略来模拟和引入图数据中可能存在的各种噪声、异常或攻击情况,通过执行这些候选增广策略,修改原始图像的节点、边、图像特征或标签从而增加增广图数据的多样性和复杂性。医疗图像机器学习模型在使用这些多样且复杂的训练样本进行训练时,可以提高模型在处理复杂和真实数据时的鲁棒性和泛化能力,进而提升医疗图像机器学习模型对不同场景的适应性。
在本申请实施例中,技术人员可以事先定义一组候选增广策略,如节点丢弃(nodedropping)、边扰动(edge perturbation)、特征扰动(feature perturbation)和标签平滑(label smoothing)。通过这些策略可以随机丢弃图数据的节点、干扰图数据中边的权重、扰动节点特征或减少标签的确定性。从而模拟图数据中可能存在的噪声、异常或攻击,使得医疗图像机器学习模型在利用增广图数据进行训练的过程中能够接触到更多的变化和挑战,进而使图机器学习模型更好地适应不同的实际情况,具备更强的鲁棒性,从而有效提高模型的性能和泛化能力。
102、响应于图数据增广指令,提取原始图像的统计特征,按照统计特征对多个候选增广策略进行策略筛选,得到增广策略向量。
在本申请实施例中,为了提高后续医疗图机器学习模型的性能和泛化能力,可以对医疗图机器学习模型对应的训练图像数据集进行图数据增广,提高训练图像数据集中图像样本的多样性和复杂性,将增广出的目标图像与训练样本数据集中的原始图像一同作为训练样本对医疗图机器学习模型进行模型训练。例如,使用图神经网络(GNN)来预测每个分子的性质,如溶解度、毒性等。训练图像集中的每个图表示一个分子结构,每个节点表示一个原子,每个边表示一个化学键,每个节点和边有相应的特征和标签,即获取训练图像集中的医疗原始图像为G=(V,E,X,Y),其中V是节点集合,E是边集合,X是特征矩阵,Y是标签向量。最终获取医疗原始图像G的统计特征f(如节点数、边数、平均度数等),根据统计特征,确定最优化的策略组合,得到增广策略向量,以便通过执行候选增广策略来对V,E,X,Y进行修改,以得到目标图像通过图数据增广,医疗图机器学习模型可以更好地适应不同的医疗图像情境,提高对医疗图像的分析和预测能力,从而为医疗诊断和决策提供更准确和可靠的支持。
103、遍历增广策略向量中的每个元素,根据每个元素的元素值,确定全部指定候选增广策略并执行,对原始图像的节点、边、图像特征或标签进行修改或保留,得到目标图像。
在本申请实施例中,图数据增广系统使用了一个对抗生成网络(GAN)作为增广策略执行模块。该GAN包括一个生成器和一个判别器,它们相互协作以执行增广策略并生成目标图像。具体地,生成器接收原始图像G和随机噪声向量z作为输入,并根据增广策略向量执行全部指定的候选增广策略,生成目标图像需要说明的是,生成器的目标是生成逼真的目标图像/>以尽可能欺骗判别器。判别器接收原始图像G或目标图像/>作为输入,并输出一个二值标量来表示输入图像的真实性。当判别器输出的二值标量接近于1时,意味着判别器认为输入是真实的图像。而当二值标量接近于0时,判别器认为输入是生成器生成的图像。在训练过程中,生成器和判别器通过对抗性的竞争进行优化。生成器试图生成逼真的目标图像/>而判别器试图准确地判断输入图像的真实性。生成器和判别器的优化过程是迭代的,通过反复训练和调整它们的参数,最终使生成器能够生成更加逼真的目标图像,并使判别器更加准确地判断真实和生成的图像。通过使用对抗生成网络作为增广策略执行模块,图数据增广系统可以根据增广策略向量生成目标图像,并通过判别器的反馈来指导生成器的优化过程。这样可以进一步增加训练图像数据集的多样性和复杂性,并提高医疗图机器学习模型的性能和泛化能力。
104、将目标图像和原始图像输入至图机器学习模型进行模型训练。
在本申请实施例中,可以将目标图像和原始图像加入训练集,从而扩充图机器学习模型的训练样本。在实际运行过程中,目标图像和原始图像将作为输入数据,用于模型的训练过程。根据训练目标,图机器学习模型将学习从输入图像中提取有价值的特征,并将这些特征与相应的标签进行关联。训练目标可以是各种医疗图像分析任务(如分类、分割、检测等),可以根据具体的应用场景和需求进行设定。通过将增广的目标图像和原始图像纳入训练集,图机器学习模型可以从更多多样化和复杂化的图像样本中进行学习,提高在医疗图像领域的表现,并为医疗诊断和决策等任务提供更准确和可靠的支持。
本申请实施例提供的方法,首先定义多个用于模拟图数据中存在的噪声、异常或攻击的候选增广策略。接下来,响应于图数据增广指令,提取原始图像的统计特征。进而按照统计特征对多个候选增广策略进行策略筛选,得到增广策略向量。进一步地,遍历增广策略向量中的每个元素,根据每个元素的元素值,确定全部指定候选增广策略并执行,对原始图像的节点、边、图像特征或标签进行修改或保留,得到目标图像。最后,将目标图像和原始图像输入至图机器学习模型进行模型训练。本申请实施例定义多个候选增广策略来模拟和引入图数据中可能存在的各种噪声、异常或攻击情况,通过执行这些候选增广策略,修改原始图像的节点、边、图像特征或标签从而增加增广图数据的多样性和复杂性。医疗图像机器学习模型在使用这些多样且复杂的训练样本进行训练时,可以提高模型在处理复杂和真实数据时的鲁棒性和泛化能力,进而提升医疗图像机器学习模型对不同场景的适应性。
本申请实施例提供了一种图数据增广方法,如图2A所示,该方法包括:
201、定义多个候选增广策略。
在本申请实施例中,技术人员可以事先定义一组候选增广策略,如节点丢弃(nodedropping)、边扰动(edgeperturbation)、特征扰动(featureperturbation)和标签平滑(labelsmoothing)。通过这些策略可以随机丢弃图数据的节点、干扰图数据中边的权重、扰动节点特征或减少标签的确定性。从而模拟图数据中可能存在的噪声、异常或攻击,使得医疗图像机器学习模型在利用增广图数据进行训练的过程中能够接触到更多的变化和挑战,进而使图机器学习模型更好地适应不同的实际情况,具备更强的鲁棒性,从而有效提高模型的性能和泛化能力。
202、响应于图数据增广指令,提取原始图像的统计特征。
在本申请实施例中,为了提高后续医疗图机器学习模型的性能和泛化能力,可以对医疗图机器学习模型对应的训练图像数据集进行图数据增广。
具体地,图数据增广系统响应于图数据增广指令,获取训练图像集中的医疗原始图像为G=(V,E,X,Y),其中V是节点集合,E是边集合,X是特征矩阵,Y是标签向量。将原始图像转换为待处理图像,并采用诸如边缘检测、基于阈值的分割等图像分割方法将待处理图像分割为多个图像区域,其中,待处理图像用于指示灰度图像或二值图像。依据原始图像G的V,E,X,Y,获取多个图像区域中每个图像区域对应的节点数、边数和平均度数,进而对多个图像区域对应的多个节点数、多个边数和多个平均度数进行统计计算,具体可以计算各个统计特征的平均值、标准差、最大值、最小值等,以得到医疗原始图像G的统计特征f。需要说明的是,统计特征包括但不限于节点数、边数、平均度数,在实际运行时可以根据实际需要计算如颜色特征、纹理特征等统计特征。
203、按照统计特征对多个候选增广策略进行策略筛选,得到增广策略向量。
在本申请实施例中,图数据增广系统在获取到原始图像的统计特征后,可以根据统计特征,确定最优化的策略组合,得到增广策略向量,以便通过执行候选增广策略来对V,E,X,Y进行修改,以得到目标图像通过图数据增广,医疗图机器学习模型可以更好地适应不同的医疗图像情境,提高对医疗图像的分析和预测能力,从而为医疗诊断和决策提供更准确和可靠的支持。
具体地,图数据增广系统中的增广策略选择模块使用一个元学习器(meta-learner),即一个多层感知器(MLP)作为选择器,元学习器以原始图G的统计特征f(如节点数、边数、平均度数等)作为输入,按照统计特征对多个候选增广策略进行策略筛选,输出增广策略向量s。系统还可以使用机器学习模型来学习从统计特征到增广策略选择的映射关系。实际运行时可以使用已有的数据集来训练模型,然后将统计特征作为输入,以预测最佳的增广策略。需要说明的是,元学习器的输入层和输出层分别如下述公式1和公式2所示。
公式1:
公式2:s=σ(W2·ReLU(W1·f+b1)+b2)∈{0,1}k
其中,φ是一个图统计特征提取函数;d是图统计特征的维度;σ是一个sigmoid函数;W1,W2,b1和b2是模型的可学习参数;ReLU是一种激活函数;k是候选增广策略的数量。元学习器使用强化学习(reinforcementlearning)进行训练,其奖励函数为下游任务(如节点分类、边预测等)在增广后新图上表现得到指标(如准确率、AUC等),奖励函数公式如下述公式3所示。元学习器使用策略梯度法(policygradientmethod)更新参数,参数更新公式如下述公式4所示。
公式3:
公式4:
其中,L是下游任务的损失函数,θ是下游任务的模型参数,α是学习率。元学习器可以通过计算多个候选增广策略中每个候选增广策略与统计特征之间的相关度,选取相关度满足预设相关度条件的候选增广策略作为指定候选增广策略。进而根据指定候选增广策略构建增广策略向量,具体地,可以按照预设排序规则或预设策略优先级对多个候选增广策略进行排序。再确定指定候选增广策略对应的指定排序序号,根据指定排序序号和指定候选增广策略对应的权重,将多个候选增广策略转换为向量,也即待优化的向量。比如,指定候选增广策略的数量为3个,其中选择第一个策略A和第三个策略C作为指定候选增广策略,可以设置执行向量【1、0、1】来表示第一个策略和第三个策略是被选中执行的策略。进而为执行向量【1、0、1】关联权重向量【0.4、0、0.6】,将关联有权重向量的执行向量作为待优化的向量。进一步地,为了根据下游任务的类型和目标对增广策略向量s进行微调和优化,使增广策略更加适应不同类型和目标的图机器学习任务,并提高模型在新图视图上的表现,在元学习器的输出层添加了一个注意力条件随机场,采用预设注意力条件随机场,按照图机器学习模型的训练目标,在待优化的向量中调整指定候选增广策略对应的权重,得到增广策略向量。具体地,注意力条件随机场的公式如下述公式5所示:
公式5:
其中ACRF是注意力条件随机场函数,T是下游任务的类型和目标信息,例如节点分类、边预测等,e是一个嵌入层(embeddinglayer),用于将离散信息转换成连续向量,lstm是一个长短期记忆网络(longshort-termmemorynetwork),用于捕获信息之间的时序依赖关系,h,g,f是三个多层感知器(MLP),用于分别计算节点或边之间的注意力权重、标签之间的转移概率和最优化标签序列。
204、遍历增广策略向量中的每个元素,根据每个元素的元素值,确定全部指定候选增广策略并执行,对原始图像的节点、边、图像特征或标签进行修改或保留,得到目标图像。
在本申请实施例中,图数据增广系统使用了一个对抗生成网络(GAN)作为增广策略执行模块。该GAN包括一个生成器和一个判别器,它们相互协作以执行增广策略并生成目标图像。生成器接收原始图像G和随机噪声向量z作为输入,并根据增广策略向量执行全部指定的候选增广策略,生成目标图像需要说明的是,生成器的目标是生成逼真的目标图像/>以尽可能欺骗判别器。判别器接收原始图像G或目标图像/>作为输入,并输出一个二值标量来表示输入图像的真实性。生成器和判别器的优化过程是迭代的,通过反复训练和调整它们的参数,最终使生成器能够生成更加逼真的目标图像,并使判别器更加准确地判断真实和生成的图像。对抗网络的目标函数如下述公式6所示:
其中pdata(G)是原始图G的数据分布,pz(z)是随机噪声向量z的先验分布。为了使生成器G能够根据增广策略向量s执行相应地操作。生成器输出层的掩码层可以根据增广策略向量s的值选择性地保留或修改节点、边、特征或标签。掩码层公式如下述公式7-11所示:
公式7:
公式8:
公式9:
公式10:
公式11:其中M是掩码层函数,⊙是哈达玛积(Hadamardproduct),1是全一矩阵,si是增广策略向量s的第i个元素,表示是否选择了第i种增广策略以及其权重,mi是随机生成的掩码矩阵或向量,表示对应地节点、边、特征或标签被保留或修改的概率。对于增广策略向量中的每个元素,根据元素的元素值确定元素对应的执行状态。若执行状态指示执行,则查询元素对应的指定候选增广策略以及指定权重,将指定权重映射为指定概率,以及执行指定候选增广策略,按照指定概率对原始图像的节点、边、图像特征或标签进行修改或保留。例如,如果s的第一个元素为1,则表示选择了节点丢弃(nodedropping)策略。掩码层按照指定概率选取第一指定节点,将第一指定节点的邻接矩阵的行列置零,将第一指定节点的特征矩阵的行置零;和/或,当指定候选增广策略为边扰动策略时,按照指定概率选取第二指定节点,修改第二指定节点的邻接矩阵。最终遍历增广策略向量中的每个元素,执行全部指定候选增广策略,得到目标图像。需要说明的是,为了使增广策略更加适应不同类型和目标的图机器学习任务,并提高模型在新图视图上的表现,在生成器的输入层也添加了一个注意力条件随机场,采用预设注意力条件随机场,按照图机器学习模型的训练目标,在待优化的向量中调整原始图像的图表现。具体地,注意力条件随机场的公式如下述公式12-16所示:
公式12:
公式13:
公式14:
公式15:
公式16:
其中,ACRF是注意力条件随机场函数,T是下游任务的类型和目标信息,例如节点分类、边预测等;e是一个嵌入层(embeddinglayer),用于将离散信息转换成连续向量;lstm是一个长短期记忆网络(longshort-termmemorynetwork),用于捕获信息之间的时序依赖关系;h,g,f是三个多层感知器(MLP),用于分别计算节点或边之间的注意力权重、标签之间的转移概率和最优化标签序列。
205、将目标图像和原始图像输入至图机器学习模型进行模型训练。
在本申请实施例中,考虑到对于复杂的任务和模型,有时候标注数据很难涵盖全部的变化和情况,容易导致过拟合。自监督训练可以通过大量的未标注数据进行训练,从而降低过拟合风险,提高模型的泛化能力。因此,图数据增广系统的增广表示学习模块与不同类型和层次的图表示学习方法进行无缝地集成和协作,并利用增广后的新图视图进行有效地自监督训练。
如图2B所示,在将原始图像输入至元学习器、对抗生成网络生成目标图像后,将原始图像G和目标图像输入至图表示学习方法,提取原始图像和目标图像的图表示,得到第一图表示hG和第二图表示/>并将第一图表示和第二图表示输入至自编码器的编码器,得到第一潜在表示zG、第二潜在表示/>进一步地,将第一潜在表示和第二潜在表示输入至自编码器的解码器,得到第一重构表示/>和第二重构表示/>随后,使用对比学习来优化潜在表示zG和/>之间的相似性。采用第一重构表示和第二重构表示优化第一图表示和第二图表示。具体地,定义一致性度量,以及为第一图表示确定第一对比样本,为第一重构表示确定第二对比样本。采用一致性度量计算第一图表示与第一对比样本之间的第一一致性损失,计算第一重构表示与第二对比样本之间的第二一致性损失,以及通过最小化第一一致性损失和第二一致性损失,优化第一图表示和第一重构表示之间的一致性。为第二图表示确定第三对比样本,为第二重构表示确定第四对比样本。采用一致性度量计算第二图表示与第三对比样本之间的第三一致性损失,计算第二重构表示与第四对比样本之间的第四一致性损失,以及通过最小化第三一致性损失和第四一致性损失,优化第二图表示和第二重构表示之间的一致性。接下来,采用图机器学习模型的有监督损失优化第一图表示hG和第二图表示/>以及将优化后的第一图表示和优化后的第二图表示输入至图机器学习模型。
需要说明的是,自编码器的编码器和解码器公式如下述公式17-20所示:
公式17:
公式18:
公式19:
公式20:
其中EG和DG分别是自编码器的编码器(encoder)和解码器(decoder),即两个多层感知器(MLP),m是潜在表示的维度,n是图表示的维度。自编码器的目标函数为如下述公式21-23所示:
公式21:LCAE=Lrec+Lcon
公式22:
公式23:
其中LCAE是对比自编码器的总损失函数,Lrec是重构损失函数,Lcon是对比损失函数,sim是一个相似度函数,如余弦相似度(cosinesimilarity),τ是一个温度参数(temperatureparameter),K是一个批次大小(batchsize),(zi,zi')是一对正样本(positivepair),即原始图和新图的潜在表示,(zi,zj')(i≠j)是一对负样本(negativepair),即不同图之间的潜在表示。
本申请实施例提供的方法,首先定义多个用于模拟图数据中存在的噪声、异常或攻击的候选增广策略。接下来,响应于图数据增广指令,提取原始图像的统计特征。进而按照统计特征对多个候选增广策略进行策略筛选,得到增广策略向量。进一步地,遍历增广策略向量中的每个元素,根据每个元素的元素值,确定全部指定候选增广策略并执行,对原始图像的节点、边、图像特征或标签进行修改或保留,得到目标图像。最后,将目标图像和原始图像输入至图机器学习模型进行模型训练。本申请实施例定义多个候选增广策略来模拟和引入图数据中可能存在的各种噪声、异常或攻击情况,通过执行这些候选增广策略,修改原始图像的节点、边、图像特征或标签从而增加增广图数据的多样性和复杂性。医疗图像机器学习模型在使用这些多样且复杂的训练样本进行训练时,可以提高模型在处理复杂和真实数据时的鲁棒性和泛化能力,进而提升医疗图像机器学习模型对不同场景的适应性。
进一步地,作为图1所述方法的具体实现,本申请实施例提供了一种图数据增广装置,如图3所示,所述装置包括:设置模块301、策略选择模块302、策略执行模块303、自监督学习模块304。
该设置模块301,用于定义多个候选增广策略,所述多个候选增广策略用于模拟图数据中存在的噪声、异常或攻击,包括但不限于节点丢弃策略、边扰动策略、特征扰动策略和标签平滑策略;
该策略选择模块302,用于响应于图数据增广指令,提取原始图像的统计特征,按照所述统计特征对所述多个候选增广策略进行策略筛选,得到增广策略向量;
该策略执行模块303,用于遍历所述增广策略向量中的每个元素,根据每个所述元素的元素值,确定全部指定候选增广策略并执行,对所述原始图像的节点、边、图像特征或标签进行修改或保留,得到目标图像;
该自监督学习模块304,用于将所述目标图像和所述原始图像输入至图机器学习模型进行模型训练。
在具体的应用场景中,该策略选择模块302,用于将所述原始图像转换为待处理图像,并将所述待处理图像分割为多个图像区域,所述待处理图像用于指示灰度图像或二值图像;统计所述多个图像区域中每个图像区域对应的节点数、边数和平均度数,对所述多个图像区域对应的多个节点数、多个边数和多个平均度数进行统计计算,得到所述原始图像的统计特征;计算所述多个候选增广策略中每个候选增广策略与所述统计特征之间的相关度,选取相关度满足预设相关度条件的候选增广策略作为指定候选增广策略;根据所述指定候选增广策略构建所述增广策略向量。
在具体的应用场景中,该策略选择模块302,用于按照预设排序规则或预设策略优先级对所述多个候选增广策略进行排序;确定所述指定候选增广策略对应的指定排序序号,根据所述指定排序序号和所述指定候选增广策略对应的权重,将所述多个候选增广策略转换为向量;采用预设注意力条件随机场,按照所述图机器学习模型的训练目标,在所述向量中调整所述指定候选增广策略对应的权重,得到所述增广策略向量。
在具体的应用场景中,该策略执行模块303,用于对于所述增广策略向量中的每个元素,根据所述元素的元素值确定所述元素对应的执行状态;若所述执行状态指示执行,则查询所述元素对应的指定候选增广策略以及指定权重,将所述指定权重映射为指定概率,以及执行所述指定候选增广策略,按照指定概率对所述原始图像的节点、边、图像特征或标签进行修改或保留;遍历所述增广策略向量中的每个元素,执行全部所述指定候选增广策略,得到所述目标图像。
在具体的应用场景中,该策略执行模块303,用于当所述指定候选增广策略为节点丢弃策略时,按照所述指定概率选取第一指定节点,将所述第一指定节点的邻接矩阵的行列置零,将所述第一指定节点的特征矩阵的行置零;和/或,当所述指定候选增广策略为边扰动策略时,按照所述指定概率选取第二指定节点,修改所述第二指定节点的邻接矩阵。
在具体的应用场景中,该自监督学习模块304,用于提取所述原始图像和所述目标图像的图表示,得到第一图表示和第二图表示,并将所述第一图表示和所述第二图表示输入至自编码器的编码器,得到第一潜在表示、第二潜在表示;将所述第一潜在表示和所述第二潜在表示输入至所述自编码器的解码器,得到第一重构表示和第二重构表示;采用所述第一重构表示和所述第二重构表示优化所述第一图表示和第二图表示,以及采用所述图机器学习模型的有监督损失优化所述第一图表示和第二图表示,以及将优化后的第一图表示和优化后的第二图表示输入至所述图机器学习模型。
在具体的应用场景中,该自监督学习模块304,用于定义一致性度量,以及为所述第一图表示确定第一对比样本,为所述第一重构表示确定第二对比样本;采用所述一致性度量计算所述第一图表示与所述第一对比样本之间的第一一致性损失,计算所述第一重构表示与所述第二对比样本之间的第二一致性损失,以及通过最小化所述第一一致性损失和所述第二一致性损失,优化所述第一图表示和所述第一重构表示之间的一致性;为所述第二图表示确定第三对比样本,为所述第二重构表示确定第四对比样本;采用所述一致性度量计算所述第二图表示与所述第三对比样本之间的第三一致性损失,计算所述第二重构表示与所述第四对比样本之间的第四一致性损失,以及通过最小化所述第三一致性损失和所述第四一致性损失,优化所述第二图表示和所述第二重构表示之间的一致性。
本申请实施例提供的装置,首先定义多个用于模拟图数据中存在的噪声、异常或攻击的候选增广策略。接下来,响应于图数据增广指令,提取原始图像的统计特征。进而按照统计特征对多个候选增广策略进行策略筛选,得到增广策略向量。进一步地,遍历增广策略向量中的每个元素,根据每个元素的元素值,确定全部指定候选增广策略并执行,对原始图像的节点、边、图像特征或标签进行修改或保留,得到目标图像。最后,将目标图像和原始图像输入至图机器学习模型进行模型训练。本申请实施例定义多个候选增广策略来模拟和引入图数据中可能存在的各种噪声、异常或攻击情况,通过执行这些候选增广策略,修改原始图像的节点、边、图像特征或标签从而增加增广图数据的多样性和复杂性。医疗图像机器学习模型在使用这些多样且复杂的训练样本进行训练时,可以提高模型在处理复杂和真实数据时的鲁棒性和泛化能力,进而提升医疗图像机器学习模型对不同场景的适应性。
需要说明的是,本申请实施例提供的一种图数据增广装置所涉及各功能单元的其他相应描述,可以参考图1和图2A至图2B中的对应描述,在此不再赘述。
基于上述如图1、图2A至图2B所示方法,相应的,本实施例还提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的图数据增广方法的步骤。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该待识别软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1、图2A至图2B所示的方法,以及图3所示的图数据增广装置实施例,为了实现上述目的,在示例性实施例中,参见图4,还提供了一种设备,该设备包括通信总线、处理器、存储器和通信接口,还可以包括输入输出接口和显示设备,其中,各个功能单元之间可以通过总线完成相互间的通信。该存储器存储有计算机程序,处理器,用于执行存储器上所存放的程序,执行上述实施例中的图数据增广方法。
可选的,该实体设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种图数据增广的实体设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述实体设备硬件和待识别软件资源的程序,支持信息处理程序以及其它待识别软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本申请的技术方案,首先定义多个用于模拟图数据中存在的噪声、异常或攻击的候选增广策略。接下来,响应于图数据增广指令,提取原始图像的统计特征。进而按照统计特征对多个候选增广策略进行策略筛选,得到增广策略向量。进一步地,遍历增广策略向量中的每个元素,根据每个元素的元素值,确定全部指定候选增广策略并执行,对原始图像的节点、边、图像特征或标签进行修改或保留,得到目标图像。最后,将目标图像和原始图像输入至图机器学习模型进行模型训练。与现有技术相比,本申请实施例定义多个候选增广策略来模拟和引入图数据中可能存在的各种噪声、异常或攻击情况,通过执行这些候选增广策略,修改原始图像的节点、边、图像特征或标签从而增加增广图数据的多样性和复杂性。医疗图像机器学习模型在使用这些多样且复杂的训练样本进行训练时,可以提高模型在处理复杂和真实数据时的鲁棒性和泛化能力,进而提升医疗图像机器学习模型对不同场景的适应性。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。
本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
Claims (10)
1.一种图数据增广方法,其特征在于,包括:
定义多个候选增广策略,所述多个候选增广策略用于模拟图数据中存在的噪声、异常或攻击,包括但不限于节点丢弃策略、边扰动策略、特征扰动策略和标签平滑策略;
响应于图数据增广指令,提取原始图像的统计特征,按照所述统计特征对所述多个候选增广策略进行策略筛选,得到增广策略向量;
遍历所述增广策略向量中的每个元素,根据每个所述元素的元素值,确定全部指定候选增广策略并执行,对所述原始图像的节点、边、图像特征或标签进行修改或保留,得到目标图像;
将所述目标图像和所述原始图像输入至图机器学习模型进行模型训练。
2.根据权利要求1所述的方法,其特征在于,所述响应于图数据增广指令,提取原始图像的统计特征,并按照所述统计特征对所述多个候选增广策略进行策略筛选,得到增广策略向量,包括:
将所述原始图像转换为待处理图像,并将所述待处理图像分割为多个图像区域,所述待处理图像用于指示灰度图像或二值图像;
统计所述多个图像区域中每个图像区域对应的节点数、边数和平均度数,对所述多个图像区域对应的多个节点数、多个边数和多个平均度数进行统计计算,得到所述原始图像的统计特征;
计算所述多个候选增广策略中每个候选增广策略与所述统计特征之间的相关度,选取相关度满足预设相关度条件的候选增广策略作为指定候选增广策略;
根据所述指定候选增广策略构建所述增广策略向量。
3.根据权利要求2所述的方法,其特征在于,所述根据所述指定候选增广策略构建所述增广策略向量,包括:
按照预设排序规则或预设策略优先级对所述多个候选增广策略进行排序;
确定所述指定候选增广策略对应的指定排序序号,根据所述指定排序序号和所述指定候选增广策略对应的权重,将所述多个候选增广策略转换为向量;
采用预设注意力条件随机场,按照所述图机器学习模型的训练目标,在所述向量中调整所述指定候选增广策略对应的权重,得到所述增广策略向量。
4.根据权利要求1所述的方法,其特征在于,所述遍历所述增广策略向量中的每个元素,根据每个所述元素的元素值,确定全部指定候选增广策略并执行,对所述原始图像的节点、边、图像特征或标签进行修改或保留,得到目标图像,包括:
对于所述增广策略向量中的每个元素,根据所述元素的元素值确定所述元素对应的执行状态;
若所述执行状态指示执行,则查询所述元素对应的指定候选增广策略以及指定权重,将所述指定权重映射为指定概率,以及执行所述指定候选增广策略,按照指定概率对所述原始图像的节点、边、图像特征或标签进行修改或保留;
遍历所述增广策略向量中的每个元素,执行全部所述指定候选增广策略,得到所述目标图像。
5.根据权利要求4所述的方法,其特征在于,所述查询所述元素对应的指定候选增广策略以及指定权重,将所述指定权重映射为指定概率,以及按照指定概率对所述原始图像的节点、边、图像特征或标签进行修改或保留,包括:
当所述指定候选增广策略为节点丢弃策略时,按照所述指定概率选取第一指定节点,将所述第一指定节点的邻接矩阵的行列置零,将所述第一指定节点的特征矩阵的行置零;和/或,
当所述指定候选增广策略为边扰动策略时,按照所述指定概率选取第二指定节点,修改所述第二指定节点的邻接矩阵。
6.根据权利要求1所述的方法,其特征在于,所述将所述目标图像和所述原始图像作为训练样本输入至图机器学习模型,包括:
提取所述原始图像和所述目标图像的图表示,得到第一图表示和第二图表示,并将所述第一图表示和所述第二图表示输入至自编码器的编码器,得到第一潜在表示、第二潜在表示;
将所述第一潜在表示和所述第二潜在表示输入至所述自编码器的解码器,得到第一重构表示和第二重构表示;
采用所述第一重构表示和所述第二重构表示优化所述第一图表示和第二图表示,以及采用所述图机器学习模型的有监督损失优化所述第一图表示和第二图表示,以及将优化后的第一图表示和优化后的第二图表示输入至所述图机器学习模型。
7.根据权利要求6所述的方法,其特征在于,所述采用所述第一重构表示和所述第二重构表示优化所述第一图表示和第二图表示,包括:
定义一致性度量,以及为所述第一图表示确定第一对比样本,为所述第一重构表示确定第二对比样本;
采用所述一致性度量计算所述第一图表示与所述第一对比样本之间的第一一致性损失,计算所述第一重构表示与所述第二对比样本之间的第二一致性损失,以及通过最小化所述第一一致性损失和所述第二一致性损失,优化所述第一图表示和所述第一重构表示之间的一致性;
为所述第二图表示确定第三对比样本,为所述第二重构表示确定第四对比样本;
采用所述一致性度量计算所述第二图表示与所述第三对比样本之间的第三一致性损失,计算所述第二重构表示与所述第四对比样本之间的第四一致性损失,以及通过最小化所述第三一致性损失和所述第四一致性损失,优化所述第二图表示和所述第二重构表示之间的一致性。
8.一种图数据增广装置,其特征在于,包括:
设置模块,用于定义多个候选增广策略,所述多个候选增广策略用于模拟图数据中存在的噪声、异常或攻击,包括但不限于节点丢弃策略、边扰动策略、特征扰动策略和标签平滑策略;
策略选择模块,用于响应于图数据增广指令,提取原始图像的统计特征,按照所述统计特征对所述多个候选增广策略进行策略筛选,得到增广策略向量;
策略执行模块,用于遍历所述增广策略向量中的每个元素,根据每个所述元素的元素值,确定全部指定候选增广策略并执行,对所述原始图像的节点、边、图像特征或标签进行修改或保留,得到目标图像;
自监督学习模块,用于将所述目标图像和所述原始图像输入至图机器学习模型进行模型训练。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310882485.0A CN116883786A (zh) | 2023-07-18 | 2023-07-18 | 图数据增广方法、装置、计算机设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310882485.0A CN116883786A (zh) | 2023-07-18 | 2023-07-18 | 图数据增广方法、装置、计算机设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116883786A true CN116883786A (zh) | 2023-10-13 |
Family
ID=88261767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310882485.0A Pending CN116883786A (zh) | 2023-07-18 | 2023-07-18 | 图数据增广方法、装置、计算机设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116883786A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117422206A (zh) * | 2023-12-18 | 2024-01-19 | 中国科学技术大学 | 提升工程问题决策和调度效率的方法、设备及存储介质 |
-
2023
- 2023-07-18 CN CN202310882485.0A patent/CN116883786A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117422206A (zh) * | 2023-12-18 | 2024-01-19 | 中国科学技术大学 | 提升工程问题决策和调度效率的方法、设备及存储介质 |
CN117422206B (zh) * | 2023-12-18 | 2024-03-29 | 中国科学技术大学 | 提升工程问题决策和调度效率的方法、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Feng et al. | Dmt: Dynamic mutual training for semi-supervised learning | |
CN109840531B (zh) | 训练多标签分类模型的方法和装置 | |
Memon et al. | Generalised fuzzy c‐means clustering algorithm with local information | |
CN110852447B (zh) | 元学习方法和装置、初始化方法、计算设备和存储介质 | |
Kim et al. | Curiosity-bottleneck: Exploration by distilling task-specific novelty | |
JP6897749B2 (ja) | 学習方法、学習システム、および学習プログラム | |
Alqahtani et al. | Pruning CNN filters via quantifying the importance of deep visual representations | |
CN111414946A (zh) | 基于人工智能的医疗影像的噪声数据识别方法和相关装置 | |
Lin et al. | Fairgrape: Fairness-aware gradient pruning method for face attribute classification | |
CN116883786A (zh) | 图数据增广方法、装置、计算机设备及可读存储介质 | |
CN109034218B (zh) | 模型训练方法、装置、设备及存储介质 | |
Rahkar Farshi | A multilevel image thresholding using the animal migration optimization algorithm | |
CN116151319A (zh) | 搜索神经网络集成模型的方法、装置和电子设备 | |
CN114708637A (zh) | 一种基于元学习的人脸动作单元检测方法 | |
Chen et al. | Learning to rank retargeted images | |
Palma et al. | A system-theoretic approach for image-based infectious plant disease severity estimation | |
CN112200862B (zh) | 目标检测模型的训练方法、目标检测方法及装置 | |
CN113033709A (zh) | 链路预测方法和装置 | |
Firouznia et al. | Adaptive chaotic sampling particle filter to handle occlusion and fast motion in visual object tracking | |
Yang et al. | A measurement for distortion induced saliency variation in natural images | |
Saranya et al. | FBCNN-TSA: An optimal deep learning model for banana ripening stages classification | |
CN114118345A (zh) | 生成对抗网络的训练方法、数据分类方法及相关设备 | |
Wang et al. | Blind quality assessment of multiply distorted images using deep neural networks | |
CN111429414A (zh) | 基于人工智能的病灶影像样本确定方法和相关装置 | |
CN116189130A (zh) | 基于图像标注模型的车道线分割方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |