CN116227573A - 分割模型训练方法、图像分割方法、装置及相关介质 - Google Patents
分割模型训练方法、图像分割方法、装置及相关介质 Download PDFInfo
- Publication number
- CN116227573A CN116227573A CN202310450254.2A CN202310450254A CN116227573A CN 116227573 A CN116227573 A CN 116227573A CN 202310450254 A CN202310450254 A CN 202310450254A CN 116227573 A CN116227573 A CN 116227573A
- Authority
- CN
- China
- Prior art keywords
- query
- support
- features
- image
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 118
- 238000012549 training Methods 0.000 title claims abstract description 87
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000003709 image segmentation Methods 0.000 title claims abstract description 37
- 238000004364 calculation method Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 15
- 238000000605 extraction Methods 0.000 claims description 49
- 230000002708 enhancing effect Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012360 testing method Methods 0.000 description 7
- 238000011176 pooling Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000010354 integration Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004195 computer-aided diagnosis Methods 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明涉及图像分割领域,公开了一种分割模型训练方法、图像分割方法、装置及相关设备,所述方法包括:分别对支持集的图像和查询集的图像进行特征提取,得到支持特征和查询特征;对支持特征和查询特征进行相似度计算,并根据得到的相似度确定先验知识;采用先验知识和支持特征,对所述查询特征进行增强处理,得到增强查询特征,并生成增强查询特征对应的查询掩码;对支持特征进行增强处理,得到增强支持特征,并生成增强支持特征对应的增强支持掩码;根据增强支持特征和增强支持掩码,判断是否满足训练结束条件,直到满足训练结束条件,得到分割模型,采用本发明提高医学图像分割场景下,对目标区域的分割准确率。
Description
技术领域
本发明涉及图像分割领域,尤其涉及一种分割模型训练方法、图像分割方法、装置及相关设备。
背景技术
医学图像是医生了解和分析疾病的重要参考,而医学图像分割则是医生在进行疾病分析的重要基础,其中,医学图像分割如视盘分割、血管检测、细胞分割、肺分割和肝脏分割等。
随着大规模数据集的出现,图像分割技术得到快速发展。而医学图像中的自动器官分割是许多临床应用的必要前提,如计算机辅助诊断和干预。但在实际医学场景中,大规模、高质量的图像并不容易获取,且图像的标注也需要消耗大量的人力和时间成本。为了摆脱对样本数量的依赖,小样本语义分割技术逐渐成为研究热点。
在医学图像分割场景中,小样本学习主要采用了深度学习网络的方法,例如半监督、弱监督、自监督或者基于图集的分割方法。但由于医学图像中不同组织之间存在低对比度、高相似性和不同尺度的特性,使得深度学习网络难以提取出有效的区别特征,从而导致难以准确分割医学图像的目标区域。
因此,现有的医学图像分割场景存在目标区域难以准确分割的技术问题。
发明内容
本发明实施例提供一种分割模型训练方法、图像分割方法、装置及相关设备,以提高医学图像分割场景下,对目标区域的分割准确率。
为了解决上述技术问题,本申请实施例提供一种分割模型训练方法,包括:
获取支持集和查询集,并将所述支持集和所述查询集输入待训练分割模型中,其中,所述支持集包括支持图像和所述支持图像对应的支持掩码,所述查询集包括查询图像,所述支持掩码为对应的支持图像经分割后得到的掩膜图。
分别对所述支持集的图像和所述查询集的图像进行特征提取,得到所述支持集对应的支持特征、所述查询集对应的查询特征。
对所述支持特征和所述查询特征进行相似度计算,并根据得到的相似度确定先验知识。
采用所述先验知识和所述支持特征,对所述查询特征进行增强处理,得到增强查询特征,并生成所述增强查询特征对应的查询掩码,其中,所述查询掩码为所述查询图像经分割后得到的掩膜图。
基于所述查询特征和所述查询掩码,对所述支持特征进行增强处理,得到增强支持特征,并生成所述增强支持特征对应的增强支持掩码,其中,所述增强支持掩码用于更新所述增强支持特征对应生成的支持图像的预测掩膜图。
根据所述增强支持特征和所述增强支持掩码,判断是否满足训练结束条件,当不满足所述训练结束条件时,将所述查询集和所述查询掩码加入支持集,形成新的支持集,并采用所述新的支持集和所述查询集对模型进行新一轮训练,直到满足训练结束条件,得到分割模型。
为了解决上述技术问题,本申请实施例提供一种图像分割方法,包括:
获取待分割图像。
将所述待分割图像输入分割模型中,输出所述待分割图像的分割结果,其中,所述分割模型根据分割模型训练方法训练得到。
为了解决上述技术问题,本申请实施例还提供一种分割模型训练装置,包括:
数据获取模块,用于获取支持集和查询集,并将所述支持集和所述查询集输入待训练分割模型中,其中,所述支持集包括支持图像和所述支持图像对应的支持掩码,所述查询集包括查询图像,所述支持掩码为对应的支持图像经分割后得到的掩膜图。
特征提取模块,用于分别对所述支持集的图像和所述查询集的图像进行特征提取,得到所述支持集对应的支持特征、所述查询集对应的查询特征。
先验知识确定模块,用于对所述支持特征和所述查询特征进行相似度计算,并根据得到的相似度确定先验知识。
查询特征增强模块,用于采用所述先验知识和所述支持特征,对所述查询特征进行增强处理,得到增强查询特征,并生成所述增强查询特征对应的查询掩码,其中,所述查询掩码为所述查询图像经分割后得到的掩膜图。
支持特征增强模块,用于基于所述查询特征和所述查询掩码,对所述支持特征进行增强处理,得到增强支持特征,并生成所述增强支持特征对应的增强支持掩码,其中,所述增强支持掩码用于更新所述增强支持特征对应生成的支持图像的预测掩膜图。
分割模型确定模块,用于根据所述增强支持特征和所述增强支持掩码,判断是否满足训练结束条件,当不满足所述训练结束条件时,将所述查询集和所述查询掩码加入支持集,形成新的支持集,并采用所述新的支持集和所述查询集对模型进行新一轮训练,直到满足训练结束条件,得到分割模型。
为了解决上述技术问题,本申请实施例还提供一种图像分割装置,包括:
待分割图像获取模块,用于获取待分割图像。
分割结果获取模块,用于将所述待分割图像输入分割模型中,输出所述待分割图像的分割结果,其中,所述分割模型根据分割模型训练方法训练得到。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述分割模型训练方法的步骤,或者,所述处理器执行所述计算机程序时实现上述图像分割方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述分割模型训练方法的步骤,或者,所述计算机程序被处理器执行时实现上述图像分割方法的步骤。
本发明实施例提供的分割模型训练方法、图像分割方法、装置及相关设备,通过将训练数据集分为支持集和查询集,查询集从相似的支持集中学习形状的先验知识,实现在查询集中可靠的分割出实例区域,生成查询掩码,查询集和其生成的查询掩码加入支持集,每一轮都会产生新的支持集,随着支持集的增多,分割精度也会随着增高,利用先验知识的小样本学习应用在医学图像上,提高医学图像分割场景下,对目标区域的分割准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的分割模型训练方法的一个实施例的流程图;
图2是本申请的图像分割方法的一个实施例的流程图;
图3是根据本申请的分割模型训练装置的一个实施例的结构示意图;
图4是根据本申请的图像分割装置的一个实施例的结构示意图;
图5是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1示出本发明实施例提供的一种分割模型训练方法,详述如下步骤S101至步骤S106:
S101、获取支持集和查询集,并将支持集和查询集输入待训练分割模型中,其中,支持集包括支持图像和支持图像对应的支持掩码,查询集包括查询图像,支持掩码为对应的支持图像经分割后得到的掩膜图。
需要说明的是,训练任务中的支持集和查询集用于模型参数的学习,在测试任务中,支持集用于模型参数的学习,而查询集用于模型的评估。
在训练阶段,每一轮次完成一个分割任务的训练和测试,因此,需要将训练数据集分为支持集和查询集,支持集中的样本与查询集的样本不重合。
在训练中,支持集包括K张支持图像和每张支持图像对应的支持掩码,K为正整数且K不超过训练数据集的样本数量,支持掩码也被称为支持图像的掩模,查询集包括1张查询图像。
在测试阶段,优选地,将历史选取出来的查询图像作为测试集,从测试集中随机采用测试图像,对训练好的分割模型进行测试,生成测试图像的掩码,并基于该掩码评估模型的分割精度。
上述待训练分割模型包括上下文提取骨干网络、先验知识支持单元和相似度指导对准单元,其中,上下文提取骨干网络用于提取支持集的图像和查询集的图像的特征,上述先验知识支持单元用于使得查询集从相似的支持集中学习先验知识,可以自适应地从支持特征中选择有意义的先验知识,并基于先验知识进行查询图像分割。该先验知识支持单元优选采用形状先验知识支持单元。上述相似度指导对准单元仅在训练阶段应用,用于产生新的支持集。
S102、分别对支持集的图像和查询集的图像进行特征提取,得到支持集对应的支持特征、查询集对应的查询特征。
具体地,基于上下文提取骨干网络,分别对支持集的图像和查询集的图像进行特征提取,得到支持集对应的支持特征、查询集对应的查询特征。
S103、对支持特征和查询特征进行相似度计算,并根据得到的相似度确定先验知识。
具体地,基于先验知识支持单元的支持特性集成分支,对支持特征和查询特征进行相似度计算,并根据得到的相似度确定先验知识。
其中,支持特性集成分支用于通过计算支持集和查询集中图像的相似性,学习相似支持集的支持特征。由于支持图像与查询图像具有相似的器官形态,支持特性集成分支能够通过计算支持集和查询集中图像的相似性,从而为查询图像的实例分割提供有意义的先验知识。
S104、采用先验知识和支持特征,对查询特征进行增强处理,得到增强查询特征,并生成增强查询特征对应的查询掩码,其中,查询掩码为查询图像经分割后得到的掩膜图。
具体地,基于先验知识支持单元查询特征细化分支,采用先验知识和支持特征,对查询特征进行增强处理,得到增强查询特征,并生成增强查询特征对应的查询掩码。
上述增强处理是指质量增强。增强查询特征是指经过质量增强后得到的查询特征。
上述查询特征细化分支用于对查询特征进行质量增强,从而增强待训练模型的小样本学习能力。
S105、基于查询特征和查询掩码,对支持特征进行增强处理,得到增强支持特征,并生成增强支持特征对应的增强支持掩码,其中,增强支持掩码用于更新增强支持特征对应生成的支持图像的预测掩膜图。
具体地,基于相似度指导对准单元,将查询特征和查询掩码作为新的支持数据,对支持集提取到的支持特征进行分割,通过将查询特征和查询掩码作为新的支持数据,来自查询集的信息会流回支持集,并被迫学习查询集和支持集之间的一致特征空间,从而得到增强支持特征,并生成增强支持特征对应的增强支持掩码。
上述相似度指导对准单元用于反向对小样本进行分割,其实质为相似引导对齐正则化算子,只应用于训练阶段,使得训练成功后得到的模型利用支持特征的先验知识为查询图像预测到一个良好的分割掩膜,也就是查询掩码,同时也可反向工作,将查询图像和其预测得到的查询掩码作为一个新的支持数据,用于对支持集中的图像进行分割,使得查询信息回流到支持特征,保证上下文提取骨干网络学习查询集合支持集之间的一致特征空间。
应理解,增强支持掩码是指用于对经过增强处理的支持图像进行分割后得到的掩膜。
S106、根据增强支持特征和增强支持掩码,判断是否满足训练结束条件,当不满足训练结束条件时,将查询集和查询掩码加入支持集,形成新的支持集,并采用新的支持集和查询集对模型进行新一轮训练,直到满足训练结束条件,得到分割模型。
具体地,上述训练结束条件可以是训练轮次达到预设轮次,或者训练结束条件为计算增强支持掩码与支持的支持掩码的比例,根据比例确定当前训练轮次分割模型的分割精度,该分割精度达到预设精度。
若不满足训练结束条件,则需要重新启动新一轮的训练,将查询集中的图像和该图像对应的查询掩码加入到支持集中,形成了新的支持集,每一轮训练过程都会产生新的支持集,随着支持集的增多,分割模型的精度也会逐渐提高,直达满足训练结束条件。
在本实施例中,将训练数据集分为支持集和查询集,查询集从相似的支持集中学习形状的先验知识,实现在查询集中可靠的分割出实例区域,生成查询掩码,查询集和其生成的查询掩码加入支持集,每一轮都会产生新的支持集,随着支持集的增多,分割精度也会随着增高,利用先验知识的小样本学习应用在医学图像上,提高医学图像分割场景下,对目标区域的分割准确率。
在本实施例的一些可选的实现方式中,步骤S102中,分别对支持集的图像和查询集的图像进行特征提取,得到支持集对应的支持特征、查询集对应的查询特征的步骤包括S1021至S1024:
S1021、基于上下文提取骨干网络,分别对支持集的图像和查询集的图像进行特征提取,得到支持集对应的支持特征、查询集对应的查询特征,其中,上下文提取骨干网络包括编码器、上下文提取模块和解码器。
S1022、编码器包括N个特征提取层,用于分别对支持集的图像和查询集的图像进行特征提取,得到支持集在每一个特征提取层对应的特征图、查询集在每一个特征提取层对应的特征图,N为正整数。
S1023、上下文提取模块包括密集扩张卷积单元和堆叠剩余池单元,密集扩张卷积单元用于学习深度特征,堆叠剩余池单元用于增强特征表示。
S1024、解码器用于确定支持集对应的支持特征、查询集对应的查询特征。
具体地,上述上下文提取骨干网络可解决由于二维医学图像中不同组织之间的低对比度、高相似性和不同尺度,导致在医学图像分割场景下,对目标区域的分割准确率不高的问题。
上下文提取骨干网络包括编码器、上下文提取模块和解码器。
编码器包括N个特征提取层,该特征提取层为残差扩张卷积块。编码器还包括初始卷积层。
优选地,编码器包含两个初始卷积层和四个用于特征提取的残差扩张卷积块。具体来说,两个初始卷积层可以从原始输入样本中提取高级特征,并利用一个最大池化模块来调整特征映射的大小。每个残差扩张卷积块由3个批处理归一化、非线性激活和3个×3个卷积层组成,用于提取多层次的层次特征。
上下文提取模块由密集扩张卷积单元(DDC,Dense dilated convolution block)和堆叠剩余池单元(SRP,stacked residual pooling)组成。
具体地,DDC模块包含四个级联分支,每个分支由不同的膨胀卷积组成。每个分支的感受野大小从上到下分别为3、7、9、13。如果将不同分支的3×3卷积直接映射到特征图上,则级联的特征图将变得非常厚。因此,在每个分支后面应用1个×1的卷积核,以减少特征图厚度的影响。最后,采用快捷连接将不同分支获得的特征与原始特征图进行集成,可以更好地恢复对象细节。DDC模块可以通过结合混合扩张卷积的四个级联分支,分层捕获大量的互补特征,有利于提取不同尺度的特征。SRP模块包含三个池化模块,池化大小分别为1、3和5。每个池化模块包含一个3×3卷积和最大池化层。SRP模块通过多个有效视野集成编码器细节特征,旨在产生更有区别的特征。它们可以提取全局上下文信息,为解码部分生成更有代表性的特征。
通过上下文提取模块,将编码器部分的输出特征作为输入,并为解码器部分提供全局上下文代表特征。
解码器由三个特殊的残差块模块组成,用于对之前获得的特征进行进一步的特征优化和任务处理,逐步实现每个像素的标记。
在本实施例中,通过该上下文提取骨干网络,能够更有效的提取图像特征,更准确的分割医学实例,从而提高医学图像分割场景下,对目标区域的分割准确率。
在本实施例的一些可选的实现方式中,步骤S103中,对支持特征和查询特征进行相似度计算,并根据得到的相似度确定先验知识的步骤包括S1031至S1033:
S1031、对支持特征和查询特征进行相似度计算,得到相似度。
S1032、计算支持特征的前景质量和背景质量。
S1033、基于相似度、支持特征的前景质量和支持特征的背景质量,确定先验知识。
在步骤S1031中,按照如下公式(1)计算支持特征和查询特征的相似度:
其中,k是指支持图像的张数,i∈[1,k],且i为正整数,j∈[1,c]表示该支持图像的第j个通道,c是指支持图像中包含的通道数,且j跟c均为正整数,Fq是指查询特征,是指第i个支持图像的支持特征,rsmi[i][j]是指第i个支持图像在j通道上的相似度。
在步骤S1032中,上述前景质量是指支持图像的支持特征落在该支持图像对应的支持掩码中的区域的质量。上述背景质量是指支持图像的支持特征未落在该支持图像对应的支持掩码中的区域的质量。
在步骤S1033中,基于相似性计算和质量评价,构建支持特性集成分支在选择相似的支持集中的先验形状知识,由于支持图像与查询图像具有相似的器官形态,能够为查询图像的分割提供有意义的先验知识。
在本实施例中,通过计算支持集和查询集中图像的相似性,和支持特征的前景质量和背景质量,确定出先验知识,从而提高对查询图像的实例分割的精度。
在本实施例的一些可选的实现方式中,步骤S104中,采用先验知识和支持特征,对查询特征进行增强处理,得到增强查询特征,并生成增强查询特征对应的查询掩码的步骤包括步骤S1041至步骤S1043:
S1041、将先验知识加入支持特征,得到细化支持特征。
S1042、将编码器每一个特征提取层提取到的查询特征图进行相加,并对相加得到的结果进行平均计算,得到概率图。
S1043、基于细化支持特征和概率图,对查询特征进行增强处理,得到增强查询特征,并生成增强查询特征对应的查询掩码。
在步骤S1041中,具体地,将先验知识与支持特征进行连接处理,得到细化支持特征。
在步骤S1042中,具体地,通过深度方向将编码器每一个特征提取层提取到的查询特征图进行相加,对相加得到的结果进行平均计算,得到概率图。
在步骤S1043中,其具体是,通过概率图对查询特征进行质量评分,通过分配低分数,有效地减少了低质量查询特征的负面影响,将细化支持特征与通过质量评分的查询特征进行连接,生成了增强查询特征。
在本实施例中,通过结合了先验知识和概率图,进一步提高了查询特征的质量,从而提高对查询图像的实例分割的精度。
在本实施例的一些可选的实现方式中,步骤S105中,基于查询特征和查询掩码,对支持特征进行增强处理,得到增强支持特征,并生成增强支持特征对应的增强支持掩码的步骤包括S1051至步骤S1053:
S1051、基于查询掩码,计算查询特征的前景质量和背景质量。
S1052、基于相似度、查询特征的前景质量和查询特征的背景质量,确定加权查询特征。
S1053、基于加权查询特征,对支持集中的每一张支持图像对应的支持特征进行增强处理,得到每一张支持图像对应的增强支持特征,并生成增强支持特征对应的增强支持掩码。
在步骤S1051中,上述前景质量是指查询图像的查询特征落在该查询图像对应的查询掩码中的区域的质量。上述背景质量是指查询图像的查询特征未落在该查询图像对应的查询掩码中的区域的质量。
在步骤S1052中,按照如下公式(2)计算得到上述加权查询特征:
在步骤S1053中,其具体是,将加权查询特征与支持集中的每一张支持图像对应的支持特征进行连接,得到每一张支持图像对应的增强支持特征,并生成增强支持特征对应的增强支持掩码。
在本实施例中,通过查询图像及其预测的掩码被视为一个新的支持集,用来对之前的支持图像进行分割,使信息流回支持特征,迫使骨干网络学习查询集和支持集之间的一致特征空间,生成增强支持特征,从而提高医学图像分割场景下,对目标区域的分割准确率。
请参阅图2,图2示出本发明实施例提供的一种图像分割方法,以该方法应用在图1训练得到的分割模型中进行说明,详述如下:
S201、获取待分割图像。
S202、将待分割图像输入分割模型中,输出待分割图像的分割结果,其中,分割模型根据分割模型训练方法训练得到。
在步骤S201中,上述待分割图像包括但不限于视盘分割图像、血管检测图像、细胞分割图像、肺分割图像和肝脏分割图像。
应理解,该待分割图像可根据具体应用场景进行具体限定。
在步骤S202,其具体是,将待分割图像输入分割模型中,基于分割模型的上下文提取骨干网络对待分割图像进行特征提取,得到图像特征,基于该图像特征,选取合适的形状先验知识,将该形状先验知识与图像特征进行融合,并对融合后的特征进分割,生成该待分割图像的分割掩码,该分割掩码用于分割该待分割图像,也就是说,该分割掩码为分割结果。
在本实施例中,通过分割模型对待分割图像进行分割处理,提高医学图像分割场景下,对目标区域的分割准确率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图3示出与上述实施例分割模型训练方法一一对应的分割模型训练装置的原理框图。如图3所示,该分割模型训练装置包括数据获取模块31、特征提取模块32、先验知识确定模块33、查询特征增强模块34、支持特征增强模块35和分割模型确定模块36。各功能模块详细说明如下:
数据获取模块31,用于获取支持集和查询集,并将支持集和查询集输入待训练分割模型中,其中,支持集包括支持图像和支持图像对应的支持掩码,查询集包括查询图像,支持掩码为对应的支持图像经分割后得到的掩膜图。
特征提取模块32,用于分别对支持集的图像和查询集的图像进行特征提取,得到支持集对应的支持特征、查询集对应的查询特征。
先验知识确定模块33,用于对支持特征和查询特征进行相似度计算,并根据得到的相似度确定先验知识。
查询特征增强模块34,用于采用先验知识和支持特征,对查询特征进行增强处理,得到增强查询特征,并生成增强查询特征对应的查询掩码,其中,查询掩码为查询图像经分割后得到的掩膜图。
支持特征增强模块35,用于基于查询特征和查询掩码,对支持特征进行增强处理,得到增强支持特征,并生成增强支持特征对应的增强支持掩码,其中,增强支持掩码用于更新增强支持特征对应生成的支持图像的预测掩膜图。
分割模型确定模块36,用于根据增强支持特征和增强支持掩码,判断是否满足训练结束条件,当不满足训练结束条件时,将查询集和查询掩码加入支持集,形成新的支持集,并采用新的支持集和查询集对模型进行新一轮训练,直到满足训练结束条件,得到分割模型。
在本实施例的一些可选的实现方式中,特征提取模块32包括:
特征提取单元,用于基于上下文提取骨干网络,分别对支持集的图像和查询集的图像进行特征提取,得到支持集对应的支持特征、查询集对应的查询特征,其中,上下文提取骨干网络包括编码器、上下文提取模块和解码器。
编码单元,用于编码器包括N个特征提取层,用于分别对支持集的图像和查询集的图像进行特征提取,得到支持集在每一个特征提取层对应的特征图、查询集在每一个特征提取层对应的特征图,N为正整数。
上下文提取单元,用于上下文提取模块包括密集扩张卷积单元和堆叠剩余池单元,密集扩张卷积单元用于学习深度特征,堆叠剩余池单元用于增强特征表示。
解码单元,用于解码器用于确定支持集对应的支持特征、查询集对应的查询特征。
在本实施例的一些可选的实现方式中,先验知识确定模块33包括:
相似度计算单元,用于对支持特征和查询特征进行相似度计算,得到相似度。
质量计算单元,用于计算支持特征的前景质量和背景质量。
先验知识确定单元,用于基于相似度、支持特征的前景质量和支持特征的背景质量,确定先验知识。
在本实施例的一些可选的实现方式中,查询特征增强模块34包括:
细化支持特征确定单元,用于将先验知识加入支持特征,得到细化支持特征。
概率图确定单元,用于将编码器每一个特征提取层提取到的查询特征图进行相加,并对相加得到的结果进行平均计算,得到概率图。
查询特征增强单元,用于基于细化支持特征和概率图,对查询特征进行增强处理,得到增强查询特征,并生成增强查询特征对应的查询掩码。
在本实施例的一些可选的实现方式中,支持特征增强模块35包括:
质量计算单元,用于基于查询掩码,计算查询特征的前景质量和背景质量。
加权查询特征计算单元,用于基于相似度、查询特征的前景质量和查询特征的背景质量,确定加权查询特征。
支持特征增强单元,用于基于加权查询特征,对支持集中的每一张支持图像对应的支持特征进行增强处理,得到每一张支持图像对应的增强支持特征,并生成增强支持特征对应的增强支持掩码。
关于分割模型训练装置的具体限定可以参见上文中对于分割模型训练方法的限定,在此不再赘述。上述分割模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图4示出与上述实施例图像分割方法一一对应的分图像分割装置的原理框图。如图4所示,该图像分割装置包括待分割图像获取模块51和分割结果获取模块52。各功能模块详细说明如下:
待分割图像获取模块51,用于获取待分割图像。
分割结果获取模块52,用于将待分割图像输入分割模型中,输出待分割图像的分割结果,其中,分割模型根据分割模型训练方法训练得到。
关于图像分割装置的具体限定可以参见上文中对于图像分割方法的限定,在此不再赘述。上述图像分割装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图5,图5为本实施例计算机设备基本结构框图。
所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件连接存储器41、处理器42、网络接口43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器 (Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。当然,所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如电子文件的控制的程序代码等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的程序代码或者处理数据,例如运行电子文件的控制的程序代码。
所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的分割模型训练方法的步骤,或者,以使所述至少一个处理器执行如上述的图像分割方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种分割模型训练方法,其特征在于,所述分割模型训练方法包括:
获取支持集和查询集,并将所述支持集和所述查询集输入待训练分割模型中,其中,所述支持集包括支持图像和所述支持图像对应的支持掩码,所述查询集包括查询图像,所述支持掩码为对应的支持图像经分割后得到的掩膜图;
分别对所述支持集的图像和所述查询集的图像进行特征提取,得到所述支持集对应的支持特征、所述查询集对应的查询特征;
对所述支持特征和所述查询特征进行相似度计算,并根据得到的相似度确定先验知识;
采用所述先验知识和所述支持特征,对所述查询特征进行增强处理,得到增强查询特征,并生成所述增强查询特征对应的查询掩码,其中,所述查询掩码为所述查询图像经分割后得到的掩膜图;
基于所述查询特征和所述查询掩码,对所述支持特征进行增强处理,得到增强支持特征,并生成所述增强支持特征对应的增强支持掩码,其中,所述增强支持掩码用于更新所述增强支持特征对应生成的支持图像的预测掩膜图;
根据所述增强支持特征和所述增强支持掩码,判断是否满足训练结束条件,当不满足所述训练结束条件时,将所述查询集和所述查询掩码加入支持集,形成新的支持集,并采用所述新的支持集和所述查询集对模型进行新一轮训练,直到满足训练结束条件,得到分割模型。
2.如权利要求1所述的分割模型训练方法,其特征在于,所述分别对所述支持集的图像和所述查询集的图像进行特征提取,得到所述支持集对应的支持特征、所述查询集对应的查询特征的步骤包括:
基于上下文提取骨干网络,分别对所述支持集的图像和所述查询集的图像进行特征提取,得到所述支持集对应的支持特征、所述查询集对应的查询特征,其中,所述上下文提取骨干网络包括编码器、上下文提取模块和解码器;
所述编码器包括N个特征提取层,用于分别对所述支持集的图像和所述查询集的图像进行特征提取,得到所述支持集在每一个特征提取层对应的特征图、所述查询集在每一个特征提取层对应的特征图,N为正整数;
所述上下文提取模块包括密集扩张卷积单元和堆叠剩余池单元,所述密集扩张卷积单元用于学习深度特征,所述堆叠剩余池单元用于增强特征表示;
所述解码器用于确定所述支持集对应的支持特征、所述查询集对应的查询特征。
3.如权利要求1所述的分割模型训练方法,其特征在于,所述对所述支持特征和所述查询特征进行相似度计算,并根据得到的相似度确定先验知识的步骤包括:
对所述支持特征和所述查询特征进行相似度计算,得到相似度;
计算所述支持特征的前景质量和背景质量;
基于所述相似度、所述支持特征的前景质量和所述支持特征的背景质量,确定先验知识。
4.如权利要求2所述的分割模型训练方法,其特征在于,所述采用所述先验知识和所述支持特征,对所述查询特征进行增强处理,得到增强查询特征,并生成所述增强查询特征对应的查询掩码的步骤包括:
将所述先验知识加入所述支持特征,得到细化支持特征;
将编码器每一个特征提取层提取到的查询特征图进行相加,并对相加得到的结果进行平均计算,得到概率图;
基于所述细化支持特征和所述概率图,对所述查询特征进行增强处理,得到增强查询特征,并生成所述增强查询特征对应的查询掩码。
5.如权利要求1所述的分割模型训练方法,其特征在于,所述基于所述查询特征和所述查询掩码,对所述支持特征进行增强处理,得到增强支持特征,并生成所述增强支持特征对应的增强支持掩码的步骤包括:
基于所述查询掩码,计算所述查询特征的前景质量和背景质量;
基于所述相似度、所述查询特征的前景质量和所述查询特征的背景质量,确定加权查询特征;
基于所述加权查询特征,对所述支持集中的每一张支持图像对应的支持特征进行增强处理,得到每一张支持图像对应的增强支持特征,并生成所述增强支持特征对应的增强支持掩码。
6.一种图像分割方法,其特征在于,所述图像分割方法包括:
获取待分割图像;
将所述待分割图像输入分割模型中,输出所述待分割图像的分割结果,其中,所述分割模型根据权利要求1至5任一项所述的分割模型训练方法训练得到。
7.一种分割模型训练装置,其特征在于,所述分割模型训练装置包括:
数据获取模块,用于获取支持集和查询集,并将所述支持集和所述查询集输入待训练分割模型中,其中,所述支持集包括支持图像和所述支持图像对应的支持掩码,所述查询集包括查询图像,所述支持掩码为对应的支持图像经分割后得到的掩膜图;
特征提取模块,用于分别对所述支持集的图像和所述查询集的图像进行特征提取,得到所述支持集对应的支持特征、所述查询集对应的查询特征;
先验知识确定模块,用于对所述支持特征和所述查询特征进行相似度计算,并根据得到的相似度确定先验知识;
查询特征增强模块,用于采用所述先验知识和所述支持特征,对所述查询特征进行增强处理,得到增强查询特征,并生成所述增强查询特征对应的查询掩码,其中,所述查询掩码为所述查询图像经分割后得到的掩膜图;
支持特征增强模块,用于基于所述查询特征和所述查询掩码,对所述支持特征进行增强处理,得到增强支持特征,并生成所述增强支持特征对应的增强支持掩码,其中,所述增强支持掩码用于更新所述增强支持特征对应生成的支持图像的预测掩膜图;
分割模型确定模块,用于根据所述增强支持特征和所述增强支持掩码,判断是否满足训练结束条件,当不满足所述训练结束条件时,将所述查询集和所述查询掩码加入支持集,形成新的支持集,并采用所述新的支持集和所述查询集对模型进行新一轮训练,直到满足训练结束条件,得到分割模型。
8.一种图像分割装置,其特征在于,所述图像分割装置包括:
待分割图像获取模块,用于获取待分割图像;
分割结果获取模块,用于将所述待分割图像输入分割模型中,输出所述待分割图像的分割结果,其中,所述分割模型根据权利要求1至5任一项所述的分割模型训练方法训练得到。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的分割模型训练方法,或者,所述处理器执行所述计算机程序时实现如权利要求6所述的图像分割方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的分割模型训练方法,或者,所述计算机程序被处理器执行时实现如权利要求6所述的图像分割方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310450254.2A CN116227573B (zh) | 2023-04-25 | 2023-04-25 | 分割模型训练方法、图像分割方法、装置及相关介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310450254.2A CN116227573B (zh) | 2023-04-25 | 2023-04-25 | 分割模型训练方法、图像分割方法、装置及相关介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116227573A true CN116227573A (zh) | 2023-06-06 |
CN116227573B CN116227573B (zh) | 2023-08-08 |
Family
ID=86589516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310450254.2A Active CN116227573B (zh) | 2023-04-25 | 2023-04-25 | 分割模型训练方法、图像分割方法、装置及相关介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116227573B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117593215A (zh) * | 2024-01-19 | 2024-02-23 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 一种生成模型增强的大规模视觉预训练方法及系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10762629B1 (en) * | 2019-11-14 | 2020-09-01 | SegAI LLC | Segmenting medical images |
CN111936989A (zh) * | 2018-03-29 | 2020-11-13 | 谷歌有限责任公司 | 相似医学图像搜索 |
CN113706487A (zh) * | 2021-08-17 | 2021-11-26 | 西安电子科技大学 | 基于自监督特征小样本学习的多器官分割方法 |
US20210397876A1 (en) * | 2020-06-19 | 2021-12-23 | Adobe Inc. | Similarity propagation for one-shot and few-shot image segmentation |
CN114022485A (zh) * | 2021-09-30 | 2022-02-08 | 天津中科智能识别产业技术研究院有限公司 | 一种基于小样本学习的结直肠癌的计算机辅助诊断方法 |
CN115049944A (zh) * | 2022-06-02 | 2022-09-13 | 北京航空航天大学 | 一种基于多任务优化的小样本遥感图像目标检测方法 |
CN115049603A (zh) * | 2022-06-07 | 2022-09-13 | 安徽大学 | 一种基于小样本学习的肠息肉分割方法及系统 |
CN115131558A (zh) * | 2022-06-10 | 2022-09-30 | 华南理工大学 | 一种少样本环境下的语义分割方法 |
CN115861617A (zh) * | 2022-12-12 | 2023-03-28 | 中国工商银行股份有限公司 | 语义分割模型训练方法、装置、计算机设备和存储介质 |
CN115908806A (zh) * | 2022-11-23 | 2023-04-04 | 南京邮电大学 | 基于轻量级多尺度特征增强网络的小样本图像分割方法 |
-
2023
- 2023-04-25 CN CN202310450254.2A patent/CN116227573B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111936989A (zh) * | 2018-03-29 | 2020-11-13 | 谷歌有限责任公司 | 相似医学图像搜索 |
US10762629B1 (en) * | 2019-11-14 | 2020-09-01 | SegAI LLC | Segmenting medical images |
US20210397876A1 (en) * | 2020-06-19 | 2021-12-23 | Adobe Inc. | Similarity propagation for one-shot and few-shot image segmentation |
CN113706487A (zh) * | 2021-08-17 | 2021-11-26 | 西安电子科技大学 | 基于自监督特征小样本学习的多器官分割方法 |
CN114022485A (zh) * | 2021-09-30 | 2022-02-08 | 天津中科智能识别产业技术研究院有限公司 | 一种基于小样本学习的结直肠癌的计算机辅助诊断方法 |
CN115049944A (zh) * | 2022-06-02 | 2022-09-13 | 北京航空航天大学 | 一种基于多任务优化的小样本遥感图像目标检测方法 |
CN115049603A (zh) * | 2022-06-07 | 2022-09-13 | 安徽大学 | 一种基于小样本学习的肠息肉分割方法及系统 |
CN115131558A (zh) * | 2022-06-10 | 2022-09-30 | 华南理工大学 | 一种少样本环境下的语义分割方法 |
CN115908806A (zh) * | 2022-11-23 | 2023-04-04 | 南京邮电大学 | 基于轻量级多尺度特征增强网络的小样本图像分割方法 |
CN115861617A (zh) * | 2022-12-12 | 2023-03-28 | 中国工商银行股份有限公司 | 语义分割模型训练方法、装置、计算机设备和存储介质 |
Non-Patent Citations (3)
Title |
---|
JIE LIU 等: "Dynamic Prototype Convolution Network for Few-Shot Semantic Segmentation", 《2022 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 * |
王廷银;林明贵;陈达;吴允平;: "基于北斗RDSS的核辐射监测应急通讯方法", 计算机系统应用, no. 12 * |
贾熹滨 等: "金字塔原型对齐的轻量级小样本语义分割网络", 《北京工业大学学报》, vol. 47, no. 5 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117593215A (zh) * | 2024-01-19 | 2024-02-23 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 一种生成模型增强的大规模视觉预训练方法及系统 |
CN117593215B (zh) * | 2024-01-19 | 2024-03-29 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 一种生成模型增强的大规模视觉预训练方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116227573B (zh) | 2023-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110175527B (zh) | 行人再识别方法及装置、计算机设备及可读介质 | |
CN109214238B (zh) | 多目标跟踪方法、装置、设备及存储介质 | |
CN109671020B (zh) | 图像处理方法、装置、电子设备和计算机存储介质 | |
CN113361578B (zh) | 图像处理模型的训练方法、装置、电子设备及存储介质 | |
CN110147878B (zh) | 数据处理方法、装置及设备 | |
KR102250728B1 (ko) | 샘플 처리 방법, 장치, 기기 및 저장 매체 | |
CN113706502B (zh) | 一种人脸图像质量评估方法及装置 | |
CN116227573B (zh) | 分割模型训练方法、图像分割方法、装置及相关介质 | |
CN111444807A (zh) | 目标检测方法、装置、电子设备和计算机可读介质 | |
CN109685805B (zh) | 一种图像分割方法及装置 | |
CN113298152B (zh) | 模型训练方法、装置、终端设备及计算机可读存储介质 | |
CN112712005B (zh) | 识别模型的训练方法、目标识别方法及终端设备 | |
CN111046969A (zh) | 数据筛选方法、装置、存储介质及电子设备 | |
CN114896067A (zh) | 任务请求信息的自动生成方法、装置、计算机设备及介质 | |
CN115457982A (zh) | 情感预测模型的预训练优化方法、装置、设备及介质 | |
CN114861635A (zh) | 一种中文拼写纠错方法、装置、设备及存储介质 | |
CN108460335B (zh) | 视频细粒度识别方法、装置、计算机设备及存储介质 | |
CN115908363B (zh) | 肿瘤细胞统计方法、装置、设备和存储介质 | |
CN116503608A (zh) | 基于人工智能的数据蒸馏方法及相关设备 | |
CN114241411B (zh) | 基于目标检测的计数模型处理方法、装置及计算机设备 | |
CN115861255A (zh) | 用于图像处理的模型训练方法、装置、设备、介质及产品 | |
CN110059180B (zh) | 文章作者身份识别及评估模型训练方法、装置及存储介质 | |
CN111460214B (zh) | 分类模型训练方法、音频分类方法、装置、介质及设备 | |
CN111291186B (zh) | 一种基于聚类算法的上下文挖掘方法、装置和电子设备 | |
CN113836297A (zh) | 文本情感分析模型的训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: No. 205, Building B1, Huigu Science and Technology Industrial Park, No. 336 Bachelor Road, Bachelor Street, Yuelu District, Changsha City, Hunan Province, 410000 Patentee after: Wisdom Eye Technology Co.,Ltd. Country or region after: China Address before: 410000 building 14, phase I, Changsha Zhongdian Software Park, No. 39, Jianshan Road, high tech Development Zone, Changsha City, Hunan Province Patentee before: Wisdom Eye Technology Co.,Ltd. Country or region before: China |