CN114170481A - 用于图像处理的方法、设备、存储介质和程序产品 - Google Patents

用于图像处理的方法、设备、存储介质和程序产品 Download PDF

Info

Publication number
CN114170481A
CN114170481A CN202210126764.XA CN202210126764A CN114170481A CN 114170481 A CN114170481 A CN 114170481A CN 202210126764 A CN202210126764 A CN 202210126764A CN 114170481 A CN114170481 A CN 114170481A
Authority
CN
China
Prior art keywords
image
training
segmentation model
determining
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210126764.XA
Other languages
English (en)
Other versions
CN114170481B (zh
Inventor
边成
杨延展
李永会
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202210126764.XA priority Critical patent/CN114170481B/zh
Publication of CN114170481A publication Critical patent/CN114170481A/zh
Application granted granted Critical
Publication of CN114170481B publication Critical patent/CN114170481B/zh
Priority to PCT/CN2023/074970 priority patent/WO2023151581A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

根据本公开的实施例,提供了一种用于图像处理的方法、设备、存储介质和程序产品。在此描述的方法包括:获取训练图像集,训练图像集包括一组强标注图像和一组弱标注图像;确定待训练的图像分割模型的第一梯度信息和第二梯度信息;基于第一梯度信息与第二梯度信息之间的相似性,确定与目标弱标注图像相关联的目标训练权重;以及利用一组强标注图像和一组弱标注图像来训练图像分割模型,其中目标弱标注图像对训练的影响基于目标训练权重而被确定。通过确定针对单个弱标注样本的训练权重,本公开的实施例能够提高图像分割模型的性能。

Description

用于图像处理的方法、设备、存储介质和程序产品
技术领域
本公开的各实现方式涉及计算机领域,更具体地,涉及图像处理的方法、设备、存储介质和计算机程序产品。
背景技术
图像分割是图像处理中的一类典型任务,基于机器学习的图像分割方法已经成为当前的主流之一。在基于机器学习的图像分割方法中,训练图像的标注准确性将极大地影响图像分割的准确程度。
在一些特定领域中,人们通常难以足够数量的高质量标注结果。尤其,在医学图像处理领域中,人们难以获得足够数量的像素级别标注结果,这将直接影响医学图像处理的准确性。
目前,如何利用弱标注图像与强标注图像的结合来训练图像处理模型已经成为当前的热点。弱标注图像通常包括例如基于预定的分割样式(例如,圆形样式、椭圆形样式、方形样式等)而被标注的图像,强标注图像通常包括例如基于逐像素而被标注的图像,因此强标注图像具有更加精确的标注信息。
发明内容
在本公开的第一方面,提供了一种用于图像处理的方法。该方法包括:获取训练图像集,训练图像集包括一组强标注图像和一组弱标注图像,一组强标注图像具有比一组弱标注图像更加精确的标注信息;确定待训练的图像分割模型的、与一组弱标注图像中目标弱标注图像相关联的第一梯度信息和与一组强标注图像相关联的第二梯度信息;基于第一梯度信息与第二梯度信息之间的相似性,确定与目标弱标注图像相关联的目标训练权重;以及利用一组强标注图像和一组弱标注图像来训练图像分割模型,其中目标弱标注图像对训练的影响基于目标训练权重而被确定。
在本公开的第二方面,提供了一种电子设备,包括:存储器和处理器;其中存储器用于存储一条或多条计算机指令,其中一条或多条计算机指令被处理器执行以实现根据本公开的第一方面的方法。
在本公开的第三方面,提供了一种计算机可读存储介质,其上存储有一条或多条计算机指令,其中一条或多条计算机指令被处理器执行实现根据本公开的第一方面的方法。
在本公开的第四方面,提供了一种计算机程序产品,其包括一条或多条计算机指令,其中一条或多条计算机指令被处理器执行实现根据本公开的第一方面的方法。
根据本公开的实施例,能够基于强标注样本来确定针对单个弱标注样本的训练权重。由此,本公开的实施例能够适应性地调整弱标准样本对于训练过程的影响,从而能够提高图像分割模型的性能。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素,其中:
图1示出了示例强标注图像和示例弱标注图像;
图2示出了能够实施本公开的一些实施例的计算设备的示意性框图;
图3示出了根据本公开的一些实施例的确定训练权重的示意图;
图4示出了根据本公开的一些实施例的训练图像分割模型的示意图;以及
图5示出了根据本公开的一些实施例的用于图像处理的示例方法的流程图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
如以上讨论的,在图像处理过程中,图像分割是一类重要的任务,其能够从图像中提取感兴趣目标所在的区域。随着人工智能技术的发展,基于机器学习的图像分割技术已经成为人们关注的焦点。
在基于机器学习的图像分割技术中,训练图像集的标注准确性将直接影响到图像分割模型的准确性。在本公开中,术语“模型”、“神经网络”、“学习模型”、“学习网络”、和“网络”可替换地使用。
在一些领域的图像处理中,通常很难获得足够数量的精确标注的训练图像样本。通常地,训练图像样本例如可以分为强标注图像和弱标注图像,其中强标注图像具有比弱标注图像更加精确的标注信息。
示例性地,弱标注图像通常包括例如基于预定的分割样式(例如,圆形样式、椭圆形样式、方形样式等)而被标注的图像,强标注图像通常包括例如基于逐像素而被标注的图像。
值得注意的是,在医学图像处理领域中,人们通常难以获得足够数量的强标注图像。图1示出了医学领域中示例性的强标注图像和弱标注图像。如图1所示,强标注图像100例如具有基于逐像素的标注信息120,其准确地标识了图像中病灶的轮廓。相反地,弱标注图像130-1至130-4所对应的标注信息140-1至140-4则无法精确地指示病灶的轮廓,其例如可以是基于预定的分割样式而被粗略地标注。
因此,人们期望能够利用强标注图像与弱标注图像的组合来协同地训练模型。然而,弱标注图像的使用也带来了模型下降的问题。这对于医学图像处理而言是无法接受的。
根据本公开的实现,提供了一种用于图像处理的方案。在该方案中,可以获取训练图像集,其中训练图像集包括一组强标注图像和一组弱标注图像。进一步地,可以确定待训练的图像分割模型的第一梯度信息和第二梯度信息,并基于第一梯度信息与第二梯度信息之间的相似性来确定与目标弱标注图像相关联的目标训练权重。第一梯度信息基于与一组弱标注图像中目标弱标注图像而被确定,第二梯度信息基于该组强标注图像而被确定。
进一步地,可以利用一组强标注图像和一组弱标注图像来训练图像分割模型,其中目标弱标注图像对训练的影响基于目标训练权重而被确定。
基于这样的方式,本公开的实施例能够基于强标注样本来确定针对单个弱标注样本的训练权重。由此,本公开的实施例能够适应性地调整弱标准样本对于训练过程的影响,从而能够提高图像分割模型的性能。
以下参考附图来说明本公开的基本原理和若干示例实现。
示例设备
图2示出了可以用来实施本公开的实施例的示例计算设备200的示意性框图。应当理解,图2所示出的设备200仅仅是示例性的,而不应当构成对本公开所描述的实现的功能和范围的任何限制。如图2所示,设备200的组件可以包括但不限于一个或多个处理器或处理单元210、存储器220、存储设备230、一个或多个通信单元240、一个或多个输入设备250以及一个或多个输出设备260。
在一些实施例中,设备200可以被实现为各种用户终端或服务终端。服务终端可以是各种服务提供方提供的服务器、大型计算设备等。用户终端诸如是任何类型的移动终端、固定终端或便携式终端,包括移动手机、多媒体计算机、多媒体平板、互联网节点、通信器、台式计算机、膝上型计算机、笔记本计算机、上网本计算机、平板计算机、个人通信系统(PCS)设备、个人导航设备、个人数字助理(PDA)、音频/视频播放器、数码相机/摄像机、定位设备、电视接收器、无线电广播接收器、电子书设备、游戏设备或者其任意组合,包括这些设备的配件和外设或者其任意组合。还可预见到的是,设备200能够支持任何类型的针对用户的接口(诸如“可佩戴”电路等)。
处理单元220可以是实际或虚拟处理器并且能够根据存储器220中存储的程序来执行各种处理。在多处理器系统中,多个处理单元并行执行计算机可执行指令,以提高设备200的并行处理能力。处理单元220也可以被称为中央处理单元(CPU)、微处理器、控制器、微控制器。
设备200通常包括多个计算机存储介质。这样的介质可以是设备200可访问的任何可以获得的介质,包括但不限于易失性和非易失性介质、可拆卸和不可拆卸介质。存储器220可以是易失性存储器(例如寄存器、高速缓存、随机访问存储器(RAM))、非易失性存储器(例如,只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、闪存)或其某种组合。存储器220可以包括一个或多个训练模块225,这些程序模块被配置为执行本文所描述的各种实现的功能。训练模块225可以由处理单元210访问和运行,以实现相应功能。存储设备230可以是可拆卸或不可拆卸的介质,并且可以包括机器可读介质,其能够用于存储信息和/或数据并且可以在设备200内被访问。
设备200的组件的功能可以以单个计算集群或多个计算机器来实现,这些计算机器能够通过通信连接进行通信。因此,设备200可以使用与一个或多个其他服务器、个人计算机(PC)或者另一个一般网络节点的逻辑连接来在联网环境中进行操作。设备200还可以根据需要通过通信单元240与一个或多个外部设备(未示出)进行通信,外部设备诸如数据库245、其他存储设备、服务器、显示设备等,与一个或多个使得用户与设备200交互的设备进行通信,或者与使得设备200与一个或多个其他计算设备通信的任何设备(例如,网卡、调制解调器等)进行通信。这样的通信可以经由输入/输出(I/O)接口(未示出)来执行。
输入设备250可以是一个或多个各种输入设备,例如鼠标、键盘、追踪球、语音输入设备、相机等。输出设备260可以是一个或多个输出设备,例如显示器、扬声器、打印机等。
在一些实施例中,如图2所示,设备200可以获取训练图像集270,该训练图像集270可以包括强一组标注图像272和一组弱标注图像274。在一些实施例中,该组强标注图像274可以基于逐像素而被标注,该组弱标注图像274可以基于预定的分割样式而被标注。
在一些实施例中,如图2所示,设备200可以基于该组训练图像集270来训练图像分割模型280。示例性地,该图像分割模型280的训练参数可以被提供被存储在存储设备230中,或者被提供至其他计算设备以用于部署图像分割模型280。
在一些实施例中,设备200还可以提供经训练的图像分割模型,以用于基于接收的输入图像来确定图像分割结果。示例性地,该输入图像例如可以是医学图像,图像分割模型280可以被配置用于确定与医学图像中的病灶部位相关联的分割信息。
基本原理
如参考图2介绍的,训练模块225可以获取训练图像集270(表示为
Figure 980511DEST_PATH_IMAGE001
),其例如可以包括一组强标注图像272和一组弱标注图像274。该组强标注图像272可以表示为:
Figure 366493DEST_PATH_IMAGE002
Figure 615072DEST_PATH_IMAGE003
,该组弱标注图像274可以表示为:
Figure 440640DEST_PATH_IMAGE004
Figure 723854DEST_PATH_IMAGE005
,其中
Figure 15158DEST_PATH_IMAGE006
表示尺寸为
Figure 751032DEST_PATH_IMAGE007
的输入图像,而
Figure 887616DEST_PATH_IMAGE008
则表示对应的标注信息,其为具有C个类别的对应掩码。在一些实施例中,训练图像集270中强标注图像的数目N可以原小于弱标注图像的数目M
由此,确定训练权重的问题可以表示为弱标注图像添加对应的指示符
Figure 25336DEST_PATH_IMAGE009
。在一些实施例中,训练模块225可以通过梯度下降的方法来确定训练权重,该问题可以表示为双层优化问题:
Figure 986076DEST_PATH_IMAGE010
(1)
其中
Figure 209247DEST_PATH_IMAGE011
表示图像分割模型的参数。进一步地,下层优化问题所对应的损失函数可以表示为:
Figure 415101DEST_PATH_IMAGE012
Figure 672907DEST_PATH_IMAGE013
(2)
在一些实施例中,训练模块225可以将训练分解为训练权重确定阶段和参数调整阶段。在训练权重确定阶段,训练模块225可以确定针对弱标注样本的训练权重,图像分割模型的参数不发生变化。在参数调整阶段,训练模块225可以基于所确定的训练权重来调整图像分割模型的参数。
在一些实施例中,训练模块225还可以交叠地执行训练权重确定阶段和参数调整阶段。例如,训练模块225可以在执行若干次参数调整迭代后,再根据调整后的模型参数执行权重确定;并基于所确定的权重再执行若干次参数调整迭代,并进一步根据更新的模型参数来执行权重确定。基于如此交叠的执行权重确定和参数调整,本公开的实施例可以进一步提高经训练的图像分割模型的性能。
确定训练权重
在一些实施例中,为了平衡强标注样本和弱标注样本对于模型训练的影响程度,训练模块225可以确定针对每个弱标注样本的训练权重。
对此公式(1)中的上次优化问题,训练模块225可以根据以下公式来确定上层梯度:
Figure 571593DEST_PATH_IMAGE014
(3)
其中,进一步地,公式(3)还可以表示为:
Figure 282060DEST_PATH_IMAGE015
(4)
其中,海森矩阵
Figure 26025DEST_PATH_IMAGE016
在一些实施例中,为了减少计算开销,训练模块225还可以利用单位矩阵I来近似逆海森矩阵:
Figure 138337DEST_PATH_IMAGE017
(5)
由此,公式(4)实际表征的是弱标注图像所对应的图像分割模型的梯度与强标注图像所对应的图像分割模型的梯度之间的相似性。当特定弱标注图像所对应的梯度与整体强标注图像所对应的梯度接近时,则该弱标注图像可以被确定为对模型的训练具有有利的作用,因而可以被分配具有较大的训练权重。
具体地,以下将参考图3来描述确定训练权重的示例过程。如图3所示,训练模块225可以将一组强标注图像272中的一个或多个强标注图像305输入至初始的图像分割模型315,从而确定第一预测结果
Figure 909722DEST_PATH_IMAGE018
320。进一步地,训练模块225可以基于与一个或多个强标注图像305对应的掩码信息
Figure 107485DEST_PATH_IMAGE019
340来确定对应的损失函数
Figure 655141DEST_PATH_IMAGE020
330,并从而可以确定与一个或多个强标注图像305所对应的梯度信息(也称为第二梯度信息):
Figure 621960DEST_PATH_IMAGE021
(6)
示例性地,与一个或多个强标注图像305所对应的梯度信息可以基于每个强标注图像的梯度的均值来确定。也即,训练模块225可以基多个强标注图像来确定图像分割模型的多个梯度,并基于该多个梯度的均值来确定该梯度信息。
进一步地,如图3所示,训练模块225还可以将目标弱标注图像310(表示为
Figure 862449DEST_PATH_IMAGE022
)输入至图像分割模型315,以确定第二预测结果
Figure 281929DEST_PATH_IMAGE023
325。进一步地,训练模块225可以基于与目标弱标注图像310对应的掩码信息
Figure 633276DEST_PATH_IMAGE024
345来确定对应的损失函数
Figure 953136DEST_PATH_IMAGE025
350,并从而可以确定与弱标注图像310所对应的梯度信息(也称为第一梯度信息):
Figure 364526DEST_PATH_IMAGE026
(7)
进一步地,训练模块225可以确定第一梯度信息和第二梯度信息之间的相似性350,其例如可以表示为:
Figure 271302DEST_PATH_IMAGE027
(8)
其中
Figure 160761DEST_PATH_IMAGE028
表示转置运算。
进一步地,训练模块225可以基于公式(8)所确定的相似性350来确定目标训练权重
Figure 102172DEST_PATH_IMAGE029
,该过程可以表示为:
Figure 153304DEST_PATH_IMAGE030
(9)
在一些实施例中,目标弱标注图像310可以被分配具有初始的训练权重,并根据(9)迭代地调整,以确定最终的目标训练权重。
根据这样的方式,本公开的实施例可以确定针对每个弱标注样本的训练权重,从而提高了混合样本训练中对于弱标注样本的控制粒度。
模型参数调整
训练模块225可以进一步基于所确定的训练权重来训练图像分割模型315。在一些实施例中,训练模块225例如可以基于公式(2)来调整图像分割模型315的参数。公式(2)包括与强标注图像所对应的第一损失部分:
Figure 547377DEST_PATH_IMAGE031
,还包括与弱标注图像所对应的第二损失部分:
Figure 744921DEST_PATH_IMAGE032
在一些实施例中,考虑到弱标注样本本身标注信息可能不够精确,训练模块225还可以基于伪标签来优化图像分割模型的训练。
具体地,以下将参考图4来描述调整模型参数的示例过程。如图4所示,训练模块225首先可以基于训练图像集270中的一对图像(即第一图像405和第二图像410)来构建混合图像415。构建混合图像415的过程可以表示为:
Figure 275259DEST_PATH_IMAGE033
(10)
其中
Figure 28452DEST_PATH_IMAGE034
表示混合图像415;
Figure 113082DEST_PATH_IMAGE035
表示第一图像;
Figure 609923DEST_PATH_IMAGE036
表示第一图像
Figure 260347DEST_PATH_IMAGE037
的标注信息;
Figure 918861DEST_PATH_IMAGE038
表示第二图像;c表示
Figure 51640DEST_PATH_IMAGE036
中的一个类别,其对应的二进制掩码为
Figure 86592DEST_PATH_IMAGE039
具体地,训练模块225可以基于与第一图像
Figure 60364DEST_PATH_IMAGE035
的第一掩码信息
Figure 686518DEST_PATH_IMAGE039
来确定第一图像
Figure 542478DEST_PATH_IMAGE035
的第一部分
Figure 381121DEST_PATH_IMAGE040
,其中第一掩码信息
Figure 740559DEST_PATH_IMAGE041
用于指示预定区域将被保留。
进一步地,训练模块225可以基于第一掩码信息
Figure 6455DEST_PATH_IMAGE041
,构建第二掩码信息
Figure 582667DEST_PATH_IMAGE042
,第二掩码信息用于指示预定区域外的区域将被保留。训练模块225还可以基于第二掩码信息
Figure 428264DEST_PATH_IMAGE042
,确定第二图像
Figure 907787DEST_PATH_IMAGE038
的第二部分
Figure 141322DEST_PATH_IMAGE043
进一步地,训练模块225可以基于第一部分
Figure 706295DEST_PATH_IMAGE044
和第二部分
Figure 90003DEST_PATH_IMAGE045
,构建混合图像
Figure 424033DEST_PATH_IMAGE034
在一些实施例中,第一图像405和第二图像410还可以基于不同的采样方法而从训练图像集270中被采样。示例性地,训练模块225可以基于训练图像集270中各图像的目标权重的大小来确定用于采样第一图像405的概率。应当理解,对于强标注图像,其权重大小可以被设置为预定的权重值(例如,1)。附加地,训练模块225例如可以基于均匀概率采样的方式来从训练图像集270中采样第二图像410。
进一步地,训练模块225可以确定用于训练的目标函数,目标函数包括与第一图像相关联的第一部分、与第二图像相关联的第二部分和与混合图像相关联的第三部分,第一部分基于第一图像的第一训练权重,第二部分基于第二图像的第二训练权重,第三部分基于第三训练权重,第三训练权重基于第一训练权重和第二训练权重而被确定。
在一些实施例中,该目标函数例如可以表示为:
Figure 828469DEST_PATH_IMAGE046
(11)
其中,
Figure 582536DEST_PATH_IMAGE047
表示第一部分,
Figure 301094DEST_PATH_IMAGE048
表示第二部分,
Figure 755209DEST_PATH_IMAGE049
表示第三部分,其中
Figure 533809DEST_PATH_IMAGE050
为超参数。
进一步地,训练模块225可以基于目标函数(11)来调整图像分割模型415的参数。
在一些实施例中,如图4所示,训练模块225可以利用双模型结构来执行模型训练过程。具体地,训练模块225可以构建与待训练的图像分割模型315(也称为主模型315)具有相同结构的辅模型420。在一些实施例中,主模型315和辅模型420例如可以具有不同的初始化参数。
如图4所示,在确定目标函数的第一部分
Figure 73375DEST_PATH_IMAGE047
时,训练模块225可以将第一图像405应用于主模型315,以确定预测结果425,并基于与标注信息460的差异来确定与第一图像405对应的损失445。该损失445可以用于确定目标函数的第一部分
Figure 392360DEST_PATH_IMAGE051
进一步地,训练模块225可以将第二图像410应用于辅模型420,以确定预测结果440,并基于与标注信息475的差异来确定与第二图像410对应的损失455。该损失455可以用于确定目标函数的第二部分
Figure 700982DEST_PATH_IMAGE052
如图4所示,在确定目标函数的第三部分
Figure 182359DEST_PATH_IMAGE053
时,训练模块225可以将混合图像415应用于主模型315以确定预测结果430,并将混合图像415应用于辅模型420以确定预测结果435。
在一些实施例中,训练模块225还可以基于第一预测结果与第一混合标注信息之间的差异,确定第三损失部分,第一混合标注信息是利用第二图像分割模型处理第一图像和第二图像而确定的。
进一步地,训练模块225还可以基于第二预测结果与第二混合标注信息之间的差异,确定第四损失部分,第二混合标注信息是利用第一图像分割模型处理第一图像和第二图像而确定的。
示例性地,第三损失部分可以表示为
Figure 209221DEST_PATH_IMAGE054
,第四损失部分可以表示为
Figure 535160DEST_PATH_IMAGE055
,其中
Figure 698288DEST_PATH_IMAGE056
Figure 818691DEST_PATH_IMAGE057
分别表示主模型315和辅模型420的参数,而
Figure 332849DEST_PATH_IMAGE058
Figure 400162DEST_PATH_IMAGE059
则表示与混合图像415所对应的伪标注信息465和伪标注信息470。具体地,
Figure 181911DEST_PATH_IMAGE060
可以表示为:
Figure 738794DEST_PATH_IMAGE061
(12)
其中
Figure 677931DEST_PATH_IMAGE062
Figure 345673DEST_PATH_IMAGE063
表示由主模型315生成的针对第一图像
Figure 217814DEST_PATH_IMAGE064
和第二图像
Figure 742336DEST_PATH_IMAGE065
的预测。应当理解,
Figure 168770DEST_PATH_IMAGE066
也可以类似地被确定。
在一些实施例中,训练模块225可以基于第三损失部分和第四损失部分来确定目标函数的第三部分。该过程例如可以表示为:
Figure 342000DEST_PATH_IMAGE067
(13)
基于这样的方式,本公开的实施例能够利用伪标签机制来进一步提取弱标注图像中的有用信息,从而提高训练得到的图像分割模型的性能。
迭代机制
在一些实施例中,如上文所讨论的,训练模块225可以迭代地执行训练权重确定阶段和模型参数调整阶段。
在一些实施例中,训练模块225可以基于目标训练权重,利用一组强标注图像和一组弱标注图像,对图像分割模型执行预定次数的参数调整,以确定更新图像分割模型。
附加地,训练模块225可以基于更新图像分割模型,确定针对目标弱标注图像的更新训练权重。进一步地,训练模块225可以基于更新训练权重,并利用一组强标注图像和一组弱标注图像训练更新图像分割模型。
示例性地,可以通过以下伪代码来反映本公开的迭代机制:
Figure 130964DEST_PATH_IMAGE068
示例过程
图5示出了根据本公开一些实现的用于图像处理的方法500的流程图。方法500可以由计算设备200来实现,例如可以被实现在计算设备200的存储器220中的训练模块225处。
如图5所示,在框510,计算设备200获取训练图像集,训练图像集包括一组强标注图像和一组弱标注图像,一组强标注图像具有比一组弱标注图像更加精确的标注信息。
在框520,计算设备200确定待训练的图像分割模型的、与一组弱标注图像中目标弱标注图像相关联的第一梯度信息和与一组强标注图像相关联的第二梯度信息。
在框530,计算设备200基于第一梯度信息与第二梯度信息之间的相似性,确定与目标弱标注图像相关联的目标训练权重。
在框540,计算设备200利用一组强标注图像和一组弱标注图像来训练图像分割模型,其中目标弱标注图像对训练的影响基于目标训练权重而被确定。
在一些实施例中,训练图像集包括多个医学图像,并且图像分割模型被配置用于确定与医学图像中的病灶部位相关联的分割信息。
在一些实施例中,一组强标注图像包括多个强标注图像,并且确定第二梯度信息包括:基于多个强标注图像,确定图像分割模型的多个梯度;以及基于多个梯度的均值,确定第二梯度信息。
在一些实施例中,确定与目标弱标注图像相关联的目标训练权重包括:确定与目标弱标注图像相关联的初始训练权重;以及基于相似性,调整初始训练权重以确定目标训练权重。
在一些实施例中,方法还包括:基于第二梯度信息的转置和第一梯度信息确定相似性。
在一些实施例中,利用一组强标注图像和一组弱标注图像来训练图像分割模型包括:基于一组强标注图像,确定与训练相关联的第一损失部分;基于一组弱标注图像和目标训练权重,确定与训练相关联的第二损失部分;以及基于第一损失部分和第二损失部分,调整图像分割模型的参数。
在一些实施例中,利用一组强标注图像和一组弱标注图像来训练图像分割模型包括:基于训练图像集中的第一图像和第二图像,构建混合图像;确定用于训练的目标函数,目标函数包括与第一图像相关联的第一部分、与第二图像相关联的第二部分和与混合图像相关联的第三部分,第一部分基于第一图像的第一训练权重,第二部分基于第二图像的第二训练权重,第三部分基于第三训练权重,第三训练权重基于第一训练权重和第二训练权重而被确定;以及基于目标函数,调整图像分割模型的参数。
在一些实施例中,构建混合图像包括:基于与第一图像的第一掩码信息,确定第一图像的第一部分,第一掩码信息用于指示预定区域将被保留;基于第一掩码信息,构建第二掩码信息,第二掩码信息用于指示预定区域外的区域将被保留;基于第二掩码信息,确定第二图像的第二部分;以及基于第一部分和第二部分,构建混合图像。
在一些实施例中,图像分割模型为第一图像分割模型,确定目标函数的第一部分和第二部分包括:将第一图像应用于第一图像分割模型,以确定目标函数的第一部分;以及将第二图像应用于与第一图像分割模型不同的第二图像分割模型,以确定目标函数的第二部分。
在一些实施例中,确定目标函数的第三部分包括:将混合图像应用于第一图像分割模型以确定第一预测结果,并应用于第二图像分割模型以确定第二预测结果;基于第一预测结果与第一混合标注信息之间的差异,确定第三损失部分,第一混合标注信息是利用第二图像分割模型处理第一图像和第二图像而确定的;基于第二预测结果与第二混合标注信息之间的差异,确定第四损失部分,第二混合标注信息是利用第一图像分割模型处理第一图像和第二图像而确定的;以及基于第三损失部分和第四损失部分,确定目标函数的第三部分。
在一些实施例中,利用一组强标注图像和一组弱标注图像来训练图像分割模型包括:基于目标训练权重,利用一组强标注图像和一组弱标注图像,对图像分割模型执行预定次数的参数调整,以确定更新图像分割模型;基于更新图像分割模型,确定针对目标弱标注图像的更新训练权重;以及基于更新训练权重,并利用一组强标注图像和一组弱标注图像训练更新图像分割模型。
在一些实施例中,方法还包括:提供经训练的图像分割模型,以用于基于接收的输入图像来确定图像分割结果。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)等等。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实现的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (16)

1.一种用于图像处理的方法,包括:
获取训练图像集,所述训练图像集包括一组强标注图像和一组弱标注图像,所述一组强标注图像具有比所述一组弱标注图像更加精确的标注信息;
确定待训练的图像分割模型的、与所述一组弱标注图像中目标弱标注图像相关联的第一梯度信息和与所述一组强标注图像相关联的第二梯度信息;
基于所述第一梯度信息与所述第二梯度信息之间的相似性,确定与所述目标弱标注图像相关联的目标训练权重;以及
利用所述一组强标注图像和所述一组弱标注图像来训练所述图像分割模型,其中所述目标弱标注图像对所述训练的影响基于所述目标训练权重而被确定。
2.根据权利要求1所述的方法,其中所述训练图像集包括多个医学图像,并且所述图像分割模型被配置用于确定与医学图像中的病灶部位相关联的分割信息。
3.根据权利要求1所述的方法,其中所述一组强标注图像包括多个强标注图像,并且确定所述第二梯度信息包括:
基于所述多个强标注图像,确定所述图像分割模型的多个梯度;以及
基于所述多个梯度的均值,确定所述第二梯度信息。
4.根据权利要求1所述的方法,其中确定与所述目标弱标注图像相关联的目标训练权重包括:
确定与所述目标弱标注图像相关联的初始训练权重;以及
基于所述相似性,调整所述初始训练权重以确定所述目标训练权重。
5.根据权利要求1所述的方法,还包括:
基于所述第二梯度信息的转置和所述第一梯度信息确定所述相似性。
6.根据权利要求1所述的方法,其中利用所述一组强标注图像和所述一组弱标注图像来训练所述图像分割模型包括:
基于所述一组强标注图像,确定与所述训练相关联的第一损失部分;
基于所述一组弱标注图像和所述目标训练权重,确定与所述训练相关联的第二损失部分;以及
基于所述第一损失部分和所述第二损失部分,调整所述图像分割模型的参数。
7.根据权利要求1所述的方法,其中利用所述一组强标注图像和所述一组弱标注图像来训练所述图像分割模型包括:
基于所述训练图像集中的第一图像和第二图像,构建混合图像;
确定用于所述训练的目标函数,所述目标函数包括与所述第一图像相关联的第一部分、与所述第二图像相关联的第二部分和与所述混合图像相关联的第三部分,所述第一部分基于所述第一图像的第一训练权重,所述第二部分基于所述第二图像的第二训练权重,所述第三部分基于第三训练权重,所述第三训练权重基于所述第一训练权重和所述第二训练权重而被确定;以及
基于所述目标函数,调整所述图像分割模型的参数。
8.根据权利要求7所述的方法,其中构建所述混合图像包括:
基于与所述第一图像的第一掩码信息,确定所述第一图像的第一部分,所述第一掩码信息用于指示预定区域将被保留;
基于所述第一掩码信息,构建第二掩码信息,所述第二掩码信息用于指示所述预定区域外的区域将被保留;
基于所述第二掩码信息,确定所述第二图像的第二部分;以及
基于所述第一部分和所述第二部分,构建所述混合图像。
9.根据权利要求8所述的方法,其中所述图像分割模型为第一图像分割模型,确定所述目标函数的所述第一部分和所述第二部分包括:
将所述第一图像应用于所述第一图像分割模型,以确定所述目标函数的所述第一部分;以及
将所述第二图像应用于与所述第一图像分割模型不同的第二图像分割模型,以确定所述目标函数的所述第二部分。
10.根据权利要求9所述的方法,其中确定所述目标函数的所述第三部分包括:
将所述混合图像应用于所述第一图像分割模型以确定第一预测结果,并应用于所述第二图像分割模型以确定第二预测结果;
基于所述第一预测结果与第一混合标注信息之间的差异,确定第三损失部分,所述第一混合标注信息是利用所述第二图像分割模型处理所述第一图像和所述第二图像而确定的;
基于所述第二预测结果与第二混合标注信息之间的差异,确定第四损失部分,所述第二混合标注信息是利用所述第一图像分割模型处理所述第一图像和所述第二图像而确定的;以及
基于所述第三损失部分和所述第四损失部分,确定所述目标函数的所述第三部分。
11.根据权利要求1所述的方法,其中利用所述一组强标注图像和所述一组弱标注图像来训练所述图像分割模型包括:
基于所述目标训练权重,利用所述一组强标注图像和所述一组弱标注图像,对所述图像分割模型执行预定次数的参数调整,以确定更新图像分割模型;
基于所述更新图像分割模型,确定针对所述目标弱标注图像的更新训练权重;以及
基于所述更新训练权重,并利用所述一组强标注图像和所述一组弱标注图像训练所述更新图像分割模型。
12.根据权利要求1所述的方法,还包括:
提供经训练的所述图像分割模型,以用于基于接收的输入图像来确定图像分割结果。
13.根据权利要求1所述的方法,其中所述一组强标注图像基于逐像素而被标注,所述一组弱标注图像基于预定的分割样式而被标注。
14.一种电子设备,包括:
存储器和处理器;
其中所述存储器用于存储一条或多条计算机指令,其中所述一条或多条计算机指令被所述处理器执行以实现根据权利要求1至13中任一项所述的方法。
15.一种计算机可读存储介质,其上存储有一条或多条计算机指令,其中所述一条或多条计算机指令被处理器执行以实现根据权利要求1至13中任一项所述的方法。
16.一种计算机程序产品,包括一条或多条计算机指令,其中所述一条或多条计算机指令被处理器执行以实现根据权利要求1至13中任一项所述的方法。
CN202210126764.XA 2022-02-10 2022-02-10 用于图像处理的方法、设备、存储介质和程序产品 Active CN114170481B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210126764.XA CN114170481B (zh) 2022-02-10 2022-02-10 用于图像处理的方法、设备、存储介质和程序产品
PCT/CN2023/074970 WO2023151581A1 (zh) 2022-02-10 2023-02-08 用于图像处理的方法、设备、存储介质和程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210126764.XA CN114170481B (zh) 2022-02-10 2022-02-10 用于图像处理的方法、设备、存储介质和程序产品

Publications (2)

Publication Number Publication Date
CN114170481A true CN114170481A (zh) 2022-03-11
CN114170481B CN114170481B (zh) 2022-06-17

Family

ID=80489735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210126764.XA Active CN114170481B (zh) 2022-02-10 2022-02-10 用于图像处理的方法、设备、存储介质和程序产品

Country Status (2)

Country Link
CN (1) CN114170481B (zh)
WO (1) WO2023151581A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023151581A1 (zh) * 2022-02-10 2023-08-17 北京字节跳动网络技术有限公司 用于图像处理的方法、设备、存储介质和程序产品

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184303A (zh) * 2015-04-23 2015-12-23 南京邮电大学 一种基于多模态深度学习的图像标注方法
CN109359666A (zh) * 2018-09-07 2019-02-19 佳都新太科技股份有限公司 一种基于多特征融合神经网络的车型识别方法及处理终端
CN109378052A (zh) * 2018-08-31 2019-02-22 透彻影像(北京)科技有限公司 图像标注的预处理方法及系统
CN110781934A (zh) * 2019-10-15 2020-02-11 深圳市商汤科技有限公司 监督学习、标签预测方法及装置、电子设备和存储介质
CN111951274A (zh) * 2020-07-24 2020-11-17 上海联影智能医疗科技有限公司 图像分割方法、系统、可读存储介质和设备
CN111968124A (zh) * 2020-10-26 2020-11-20 四川省肿瘤医院 基于半监督语义分割的肩部肌骨超声结构分割方法
CN111967459A (zh) * 2020-10-21 2020-11-20 北京易真学思教育科技有限公司 模型训练方法、图像识别方法、装置、设备及存储介质
CN112927172A (zh) * 2021-05-10 2021-06-08 北京市商汤科技开发有限公司 图像处理网络的训练方法和装置、电子设备和存储介质
US20210319262A1 (en) * 2020-12-18 2021-10-14 Beijing Baidu Netcom Science Technology Co., Ltd. Model training, image processing method, device, storage medium, and program product
US20210357747A1 (en) * 2020-05-18 2021-11-18 Microsoft Technology Licensing, Llc Joint learning from explicit and inferred labels
CN113724132A (zh) * 2021-11-03 2021-11-30 浙江宇视科技有限公司 图像风格迁移处理方法、装置、电子设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10430946B1 (en) * 2019-03-14 2019-10-01 Inception Institute of Artificial Intelligence, Ltd. Medical image segmentation and severity grading using neural network architectures with semi-supervised learning techniques
CN111932547B (zh) * 2020-09-24 2021-06-11 平安科技(深圳)有限公司 图像中目标物的分割方法、装置、电子设备及存储介质
CN114170481B (zh) * 2022-02-10 2022-06-17 北京字节跳动网络技术有限公司 用于图像处理的方法、设备、存储介质和程序产品

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184303A (zh) * 2015-04-23 2015-12-23 南京邮电大学 一种基于多模态深度学习的图像标注方法
CN109378052A (zh) * 2018-08-31 2019-02-22 透彻影像(北京)科技有限公司 图像标注的预处理方法及系统
CN109359666A (zh) * 2018-09-07 2019-02-19 佳都新太科技股份有限公司 一种基于多特征融合神经网络的车型识别方法及处理终端
CN110781934A (zh) * 2019-10-15 2020-02-11 深圳市商汤科技有限公司 监督学习、标签预测方法及装置、电子设备和存储介质
US20210357747A1 (en) * 2020-05-18 2021-11-18 Microsoft Technology Licensing, Llc Joint learning from explicit and inferred labels
CN111951274A (zh) * 2020-07-24 2020-11-17 上海联影智能医疗科技有限公司 图像分割方法、系统、可读存储介质和设备
CN111967459A (zh) * 2020-10-21 2020-11-20 北京易真学思教育科技有限公司 模型训练方法、图像识别方法、装置、设备及存储介质
CN111968124A (zh) * 2020-10-26 2020-11-20 四川省肿瘤医院 基于半监督语义分割的肩部肌骨超声结构分割方法
US20210319262A1 (en) * 2020-12-18 2021-10-14 Beijing Baidu Netcom Science Technology Co., Ltd. Model training, image processing method, device, storage medium, and program product
CN112927172A (zh) * 2021-05-10 2021-06-08 北京市商汤科技开发有限公司 图像处理网络的训练方法和装置、电子设备和存储介质
CN113724132A (zh) * 2021-11-03 2021-11-30 浙江宇视科技有限公司 图像风格迁移处理方法、装置、电子设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023151581A1 (zh) * 2022-02-10 2023-08-17 北京字节跳动网络技术有限公司 用于图像处理的方法、设备、存储介质和程序产品

Also Published As

Publication number Publication date
CN114170481B (zh) 2022-06-17
WO2023151581A1 (zh) 2023-08-17

Similar Documents

Publication Publication Date Title
US10565442B2 (en) Picture recognition method and apparatus, computer device and computer- readable medium
CN109117831B (zh) 物体检测网络的训练方法和装置
CN110363210B (zh) 一种图像语义分割模型的训练方法和服务器
US20200334449A1 (en) Object detection based on neural network
US11551027B2 (en) Object detection based on a feature map of a convolutional neural network
US20240004703A1 (en) Method, apparatus, and system for multi-modal multi-task processing
CN110852257B (zh) 一种人脸关键点的检测方法、装置及存储介质
CN111753863A (zh) 一种图像分类方法、装置、电子设备及存储介质
CN114170481B (zh) 用于图像处理的方法、设备、存储介质和程序产品
CN114332590B (zh) 联合感知模型训练、联合感知方法、装置、设备和介质
CN110135428B (zh) 图像分割处理方法和装置
CN111310590A (zh) 一种动作识别方法及电子设备
JP2021182441A (ja) 画像を処理するための方法、装置、機器、媒体およびプログラム
CN111815748B (zh) 一种动画处理方法、装置、存储介质及电子设备
CN110210314B (zh) 人脸检测方法、装置、计算机设备及存储介质
US20230401670A1 (en) Multi-scale autoencoder generation method, electronic device and readable storage medium
CN112150486B (zh) 图像处理方法及装置
CN111767710B (zh) 印尼语的情感分类方法、装置、设备及介质
CN109040774B (zh) 一种节目信息提取方法、终端设备、服务器及存储介质
CN110308905B (zh) 一种页面组件匹配方法及装置
CN114020192B (zh) 一种基于曲面电容实现非金属平面的互动方法和系统
Niu et al. Research on the Development and Application of Sports Video Analysis Platform in Sports Training
CN108875528B (zh) 一种人脸形状点定位方法及装置、存储介质
CN114117010A (zh) Nlp任务的处理方法、装置、终端设备和存储介质
WO2023211543A1 (en) Generating an inpainted image from a masked image using a patch-based encoder

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant