CN111814820A - 图像处理方法及装置 - Google Patents

图像处理方法及装置 Download PDF

Info

Publication number
CN111814820A
CN111814820A CN202010421250.8A CN202010421250A CN111814820A CN 111814820 A CN111814820 A CN 111814820A CN 202010421250 A CN202010421250 A CN 202010421250A CN 111814820 A CN111814820 A CN 111814820A
Authority
CN
China
Prior art keywords
target
image
detected
training
size range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010421250.8A
Other languages
English (en)
Inventor
张培圳
陈玉康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Megvii Technology Co Ltd
Original Assignee
Beijing Megvii Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Megvii Technology Co Ltd filed Critical Beijing Megvii Technology Co Ltd
Priority to CN202010421250.8A priority Critical patent/CN111814820A/zh
Publication of CN111814820A publication Critical patent/CN111814820A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种图像处理方法及装置,通过将数据库中所有训练图像中待检测目标的尺寸划分为至少两个尺寸范围;在采用训练图像对目标模型进行一次迭代处理的情况下,确定目标模型针对训练图像中目标尺寸范围的待检测目标的损失值,与总损失值之间的比值;在比值小于或等于预设比值的情况下,从数据库中选取多张目标训练图像,并对多张目标训练图像进行拼接,得到拼接图像,并将拼接图像作为目标模型下一次迭代处理的输入,本发明在进行需要代偿的下一次迭代处理时,通过拼接图像中数量较多的目标尺寸范围的待检测目标,提高目标模型对目标尺寸范围的待检测目标的训练权重,提高训练精度。

Description

图像处理方法及装置
技术领域
本发明属于计算机技术领域,特别是涉及一种图像处理方法及装置。
背景技术
在深度学习领域中,针对目标检测任务的模型训练过程中,需要针对训练数据库中的训练图像,按照多次迭代的方式实现模型训练。
在目前,为了保证训练效果,现有技术可以采用2种不同的图像增广方案,以保证对训练图像的充分利用。方案一为将训练图像中的物体进行尺寸归一化,并限定严格的范围之后以供训练。方案二为混合(mix up)方法,具体为将两张训练图像按和为1的系数相加后以供训练。
但是,方案一、方案二中,对训练图像所做的处理,易造成有价值样本的丢失,导致出现训练精度较低的技术问题。
发明内容
本发明提供一种图像处理方法、图像处理方法及装置,以便解决现有技术中易造成有价值样本的丢失,导致出现训练精度较低的技术问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种图像处理方法,该方法可以包括:
将数据库中所有训练图像中待检测目标的尺寸划分为至少两个尺寸范围;
在采用所述训练图像对目标模型进行一次迭代处理的情况下,确定所述目标模型针对所述训练图像中目标尺寸范围的待检测目标的损失值,与总损失值之间的比值,所述总损失值为所述训练图像中所有尺寸范围的待检测目标的损失值之和;
在所述比值小于或等于预设比值的情况下,从所述数据库中选取多张目标训练图像,并对多张所述目标训练图像进行拼接,得到拼接图像,并将所述拼接图像作为所述目标模型下一次迭代处理的输入。
第二方面,本发明实施例提供了一种图像处理装置,该图像处理装置可以包括:
划分模块,用于将数据库中所有训练图像中待检测目标的尺寸划分为至少两个尺寸范围;
评判模块,用于在采用所述训练图像对目标模型进行一次迭代处理的情况下,确定所述目标模型针对所述训练图像中目标尺寸范围的待检测目标的损失值,与总损失值之间的比值,所述总损失值为所述训练图像中所有尺寸范围的待检测目标的损失值之和;
拼接输入模块,用于在所述比值小于或等于预设比值的情况下,从所述数据库中选取多张目标训练图像,并对多张所述目标训练图像进行拼接,得到拼接图像,并将所述拼接图像作为所述目标模型下一次迭代处理的输入。
本发明实施例的第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述所述的图像处理方法的步骤。
本发明实施例的第四方面,提供了一种装置,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述所述的图像处理方法的步骤。
在本发明实施例中,本发明通过将数据库中所有训练图像中待检测目标的尺寸划分为至少两个尺寸范围;在采用训练图像对目标模型进行一次迭代处理的情况下,确定目标模型针对训练图像中目标尺寸范围的待检测目标的损失值,与总损失值之间的比值,总损失值为训练图像中所有尺寸范围的待检测目标的损失值之和;在比值小于或等于预设比值的情况下,从数据库中选取多张目标训练图像,并对多张目标训练图像进行拼接,得到拼接图像,并将拼接图像作为目标模型下一次迭代处理的输入,本发明通过在一次迭代处理中,当目标模型针对目标尺寸范围的待检测目标的损失值与总损失值之间的比值小于或等于预设比值的情况下,确定此次迭代处理对目标尺寸范围的待检测目标的训练效果较差,需要在下一次迭代处理时,有针对性的对目标尺寸范围的待检测目标进行代偿训练,并具体将多张目标训练图像拼接得到的拼接图像作为所述目标模型下一次迭代处理的输入,使得下一次迭代处理时,通过拼接图像中数量较多的目标尺寸范围的待检测目标,提高目标模型对目标尺寸范围的待检测目标的训练权重,提高训练精度。
附图说明
图1是本发明实施例提供的一种图像处理方法的步骤流程图;
图2是本发明实施例提供的一种训练图像;
图3是本发明实施例提供的一种拼接图像;
图4是本发明实施例提供的一种图像处理方法的具体步骤流程图;
图5是本发明实施例提供的一种图像处理装置的框图;
图6是本发明实施例提供的一种装置的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种图像处理方法的步骤流程图,如图1所示,该方法可以包括:
步骤101、将数据库中所有训练图像中待检测目标的尺寸划分为至少两个尺寸范围。
在本发明实施例中,训练图像可以为自然图像,在本发明实施例中,针对目标检测任务的模型训练场景,其训练需求是使得目标模型可以检测出图像中的目标待检测目标,针对这种需求,训练图像的内容中可以具有待检测目标,如人物、植物、衣帽服饰等,为了实现模型的训练,可以对训练图像中的待检测目标进行标注,该标注具体为对训练图像中的待检测目标标注一个矩形标注框体,该矩形标注框体能够覆盖整个待检测目标,不同尺寸的待检测目标可以具有不同尺寸的矩形标注框体,标注矩形标注框体之后,还可以为每个矩形标注框体中的待检测目标标注真实值。需要说明的是,标注操作可以采用相应的软件标注工具进行实现,或采用人工标注的方式实现。
进一步的,可以针对数据库中所有训练图像,将所有训练图像中待检测目标的尺寸划分为至少两个尺寸范围。
例如,设定0至a为第一尺寸范围;a至b为第一尺寸范围;b至c为第一尺寸范围。其中a、b、c的值可以根据实际情况设定,若一个训练图像中的一个待检测目标的尺寸落入第一尺寸范围,则该待检测目标对应第一尺寸范围。
需要说明的是,在一种实现方式中,待检测目标的尺寸可以为待检测目标在整个训练图像中所占据的像素的总面积,另外,在另一种实现方式中,待检测目标的尺寸也可以为待检测目标对应的矩形标注框体的总面积。
另外,训练图像存储于数据库中,数据库可以是设备本地的数据库,也可以为网络数据库,如云数据库。
具体的,参照图2,其示出了本发明实施例提供的一种训练图像,在训练图像10中,存在4个通过矩形标注框体标注的待检测目标:待检测目标11、待检测目标12、待检测目标13、待检测目标14。并且根据对数据库中所有训练图像中待检测目标的尺寸划分,得到小尺寸范围、中尺寸范围、大尺寸范围3种尺寸范围,训练图像10中待检测目标11落入小尺寸范围;待检测目标12、待检测目标131落入中尺寸范围;待检测目标14落入大尺寸范围。针对分类任务训练模型,待检测目标11对应标注的真实值为鸵鸟、待检测目标12对应标注的真实值为儿童、待检测目标13对应标注的真实值为儿童、待检测目标14对应标注的真实值为树木。
步骤102、在采用所述训练图像对目标模型进行一次迭代处理的情况下,确定所述目标模型针对所述训练图像中目标尺寸范围的待检测目标的损失值,与总损失值之间的比值,所述总损失值为所述训练图像中所有尺寸范围的待检测目标的损失值之和。
在本发明实施例中,针对目标检测任务的模型训练场景,目标模型需要通过多次迭代处理来完成训练,常规情况下,每一次迭代处理可以以一张训练图像为输入,使得目标模型输出训练图像中所有待检测目标对应的输出值,以及确定其中目标尺寸范围的待检测目标对应的输出值,根据输出值与待检测目标标注的真实值,可以计算得到待检测目标的损失值,目标模型的这一次迭代处理,即可以根据待检测目标的损失值和预设损失函数,来实现对目标模型参数的优化。
具体的,在一次迭代处理中确定了目标模型针对训练图像中所有尺寸范围的待检测目标的损失值之后,可以计算目标尺寸范围的待检测目标对应的输出值与总损失值之间的比值t,总损失值为训练图像中所有尺寸范围的待检测目标的损失值之和。该比值t越小,说明目标模型对目标尺寸范围的待检测目标的监督信号偏弱,使得对目标尺寸范围的待检测目标的训练效果较差;该比值t越大,说明目标模型对目标尺寸范围的待检测目标的监督信号正常,使得对目标尺寸范围的待检测目标的训练效果正常或较优。
例如,参照上述步骤101中图2的示例,为了实现对小尺寸范围的待检测目标识别分类的目的,目标尺寸范围可以为小尺寸范围,因此在一次迭代处理中,可以根据目标模型的输出,得到待检测目标11对应的损失值A,待检测目标12对应的损失值B,待检测目标13对应的损失值C,待检测目标14对应的损失值D,则目标尺寸范围的待检测目标的损失值与总损失值之间的比值t=A/(A+B+C+D)。
步骤103,在所述比值小于或等于预设比值的情况下,从所述数据库中选取多张目标训练图像,并对多张所述目标训练图像进行拼接,得到拼接图像,并将所述拼接图像作为所述目标模型下一次迭代处理的输入。
在本发明实施例中,可以根据实际训练精度的需求,设定一个预设比值τ,并比较步骤104求得的比值t与预设比值τ之间的大小,在比值t小于或等于预设比值τ的情况下,说明目标模型对目标尺寸范围的待检测目标的监督信号偏弱,使得对目标尺寸范围的待检测目标的训练效果较差,需要在下一次迭代处理时,有针对性的对目标尺寸范围的待检测目标中待检测目标进行代偿训练,以增加对目标尺寸范围的待检测目标中待检测目标的训练权重。
具体的,在比值t小于或等于预设比值τ的情况下,对目标尺寸范围的待检测目标进行代偿训练具体包括,从数据库中选取多张目标训练图像,并对多张目标训练图像进行拼接,得到拼接图像,并将拼接图像作为所述目标模型下一次迭代处理的输入,在拼接图像中,目标尺寸范围的待检测目标的数量提高的几率较大,使得在下一次迭代处理时,目标模型能够对较多数量的目标尺寸范围的待检测目标进行处理,增加了对目标尺寸范围的待检测目标中待检测目标的训练权重。
其中,拼接图像可以理解为拼接图像张量,即为多张目标训练图像的结构矩阵集合,拼接图像的尺寸可以与训练图像的尺寸一致,以保证目标模型处理数据的一致性。
例如,参照图3,其示出了本发明实施例提供的一种拼接图像,拼接图像20由四张目标训练图像30以2×2的形式拼接得到。
在一种实现情况下,拼接图像可以直接由4张原始尺寸的目标训练图像30拼接得到,其中,按照上述实施例划分的小尺寸范围、中尺寸范围、大尺寸范围3种尺寸范围,且目标尺寸范围为小尺寸范围,可以发现拼接图像张量中小尺寸范围的待检测目标的数量为4个,包括待检测目标21、待检测目标24、待检测目标27、待检测目标210,将该拼接图像作为目标模型下一次迭代处理的输入,可以使得在目标模型的下一次迭代处理中,能够对4个小尺寸范围的待检测目标进行处理,从而提高了对小尺寸范围的待检测目标的训练权重,提高了对小尺寸范围的待检测目标的训练精度。
在另一种实现情况下,拼接图像可以直接由4张面积缩小为原来四分之一的目标训练图像30拼接得到,拼接图像20的尺寸与原始训练图像的尺寸一致,以保证目标模型处理数据的一致性。其中,按照上述实施例划分的小尺寸范围、中尺寸范围、大尺寸范围3种尺寸范围,且目标尺寸范围为小尺寸范围,由于目标训练图像30经过尺寸缩减,可以发现拼接图像张量中原先处于大尺寸范围的待检测目标落入了中尺寸范围,原先处于中尺寸范围的待检测目标落入了小尺寸范围,小尺寸范围的待检测目标的数量为10个,包括待检测目标21、待检测目标22、待检测目标24、待检测目标25、待检测目标27、待检测目标28、待检测目标29、待检测目标210、待检测目标211、待检测目标212,将该拼接图像作为目标模型下一次迭代处理的输入,可以使得在目标模型的下一次迭代处理中,能够对10个小尺寸范围的待检测目标进行处理,相对于上一种实现情况,更大程度的提高了对小尺寸范围的待检测目标的训练权重,进一步提高了对小尺寸范围的待检测目标的训练精度。
需要说明的是,本发明实施例也可以选取中尺寸范围或大尺寸范围作为目标尺寸范围,以增加目标模型对中尺寸范围或大尺寸范围的待检测目标的训练精度。
综上,本发明实施例提供的一种图像处理方法,通过将数据库中所有训练图像中待检测目标的尺寸划分为至少两个尺寸范围;在采用训练图像对目标模型进行一次迭代处理的情况下,确定目标模型针对训练图像中目标尺寸范围的待检测目标的损失值,与总损失值之间的比值,总损失值为训练图像中所有尺寸范围的待检测目标的损失值之和;在比值小于或等于预设比值的情况下,从数据库中选取多张目标训练图像,并对多张目标训练图像进行拼接,得到拼接图像,并将拼接图像作为目标模型下一次迭代处理的输入,本发明通过在一次迭代处理中,当目标模型针对目标尺寸范围的待检测目标的损失值与总损失值之间的比值小于或等于预设比值的情况下,确定此次迭代处理对目标尺寸范围的待检测目标的训练效果较差,需要在下一次迭代处理时,有针对性的对目标尺寸范围的待检测目标进行代偿训练,并具体将多张目标训练图像拼接得到的拼接图像作为所述目标模型下一次迭代处理的输入,使得下一次迭代处理时,通过拼接图像中数量较多的目标尺寸范围的待检测目标,提高目标模型对目标尺寸范围的待检测目标的训练权重,提高训练精度。
图4是本发明实施例提供的一种图像处理方法的步骤流程图,如图4所示,该方法可以包括:
步骤201、将数据库中所有训练图像中待检测目标的尺寸划分为至少两个尺寸范围。
该步骤具体可以参照上述步骤101,此处不再赘述。
步骤202、在采用所述训练图像对目标模型进行一次迭代处理的情况下,确定所述目标模型针对所述训练图像中目标尺寸范围的待检测目标的损失值,与总损失值之间的比值,所述总损失值为所述训练图像中所有尺寸范围的待检测目标的损失值之和。
该步骤具体可以参照上述步骤102,此处不再赘述。
步骤203、在所述比值小于或等于预设比值的情况下,从所述数据库中选取多张目标训练图像,并将每个所述目标训练图像缩放后进行拼接,得到所述拼接图像。
可选的,每个所述训练图像的尺寸相同,所述拼接图像的尺寸与所述训练图像的尺寸相同。
在本发明实施例中,拼接图像可以直接由多张面积缩放后的目标训练图像拼接得到,缩放后的目标训练图像对目标模型的训练精度并未有太大影响,且能够使得拼接图像的尺寸不至于过大,避免目标模型无法处理太大尺寸的拼接图像。
另外,由于目标训练图像经过尺寸缩减,可以发现拼接图像张量中原先处于大尺寸范围的待检测目标落入了中尺寸范围,原先处于中尺寸范围的待检测目标落入了小尺寸范围,小尺寸范围的待检测目标的数量为10个,包括待检测目标21、待检测目标22、待检测目标24、待检测目标25、待检测目标27、待检测目标28、待检测目标29、待检测目标210、待检测目标211、待检测目标212,将该拼接图像作为目标模型下一次迭代处理的输入,可以使得在目标模型的下一次迭代处理中,能够对10个小尺寸范围的待检测目标进行处理,相对于上一种实现情况,更大程度的提高了对小尺寸范围的待检测目标的训练权重,进一步提高了对小尺寸范围的待检测目标的训练精度。
进一步的,目标模型的训练过程,若使用尺寸规格一致的训练图像,能够使得训练效果更好,可以使得每个训练图像的尺寸相同,且拼接图像的尺寸与训练图像的尺寸相同,以保证目标模型处理数据的一致性。
可选的,步骤203具体可以包括:
子步骤2031、从所述数据库中选取k2张目标训练图像。
子步骤2032、将每个所述目标训练图像的长和宽分别缩放为
Figure BDA0002497038900000081
子步骤2033、按照k×k的多个分块,将所有目标训练图像在空间维度上进行拼接,得到所述拼接图像。
在本发明实施例中,假设k=2,在选取4张目标训练图像,且将每个所述目标训练图像的长和宽分别缩放为二分之一后,则可以按照2×2的多个分块拼接得到如图3所示的拼接图像30,其中,拼接图像30的面积与一张目标训练图像的面积相同,且拼接图像30中,待检测目标具有对应的物体框。
进一步的,假设一张目标训练图像的长为w,宽为h,一张目标训练图像的张量表示为(n,c,h,w),则图3所示的拼接图像30可以具有k2个分块(k=2),每个分块的张量维度为(n,c,h/k,w/k),其中c为RGB三通道数,分块的数量k2与1个分块的张量维度(n,c,h/k,w/k)相乘,得到拼接图像30的张量表示为(n,c,h,w),由此可见,拼接图像30的张量表示与一张目标训练图像的张量表示相同,二者之间张量总元素数守恒,使得目标模型在采用拼接图像进行训练的迭代处理时,能够保证训练不失一般性,且不会增加额外的计算处理资源。
可选的,空间维度包括深度空间维度或平面空间维度。
具体的,图3所示的拼接图像是将多张目标训练图像按照平面空间维度拼接得到的,其可以被视为一张厚度为1的二维图像。另外也可以将k2个目标训练图像按照深度空间维度拼接,得到厚度为k2的拼接图像,该拼接图像可以被表示为(k2n,c,h/k,w/k),其与平面空间维度拼接得到的拼接图像之间张量总元素数守恒,即k2n×c×h/k×w/k=n×c×h×w。
可选的,在步骤202之后,所述方法还包括:
步骤204、在所述比值大于所述预设比值的情况下,将从所述数据库中选取的训练图像,作为所述目标模型下一次迭代处理的输入。
在本发明实施例中,比值大于预设比值的情况下,可以说明目标模型对目标尺寸范围的待检测目标的监督信号正常,使得对目标尺寸范围的待检测目标的训练效果正常或较优,则在目标模型下一次迭代处理时,可以按照正常流程,直接将训练图像进行输入。
可选的,在一种实现方式中,目标尺寸范围为所有所述尺寸范围中值最小的尺寸范围。例如,在图2中,目标尺寸范围可以为待检测目标11对应的小尺寸范围。在具体应用中,目标检测任务的模型训练场景,通常会对小尺寸范围的待检测目标的训练效果较差,针对小尺寸范围的待检测目标进行专项优化,能够有效改善该缺陷。
可选的,在另一种实现方式中,目标尺寸范围为所有所述尺寸范围中待检测目标的数量最小的尺寸范围。例如,在图2中,目标尺寸范围可以为待检测目标14对应的小尺寸范围或待检测目标15对应的大尺寸范围。在具体应用中,目标检测任务的模型训练场景,通常会对数量较小的待检测目标的训练效果较差,针对数量较小的待检测目标进行专项优化,能够有效改善该缺陷。
进一步的,本发明实施例提供一种具体示例,来对图像处理方法的具体应用进行说明:
S1,假设当前目标模型是特征提取网络为Res Net50(50层残差网络)的RetinaNet检测器。设定训练的最大迭代次数为T,并初始化迭代计数器,设定初次迭代的训练图像为常规的训练图像。
S2,当t<T时,t自增1,并按照上一次迭代处理所决定的训练图像,前向计算待检测目标的框回归损失,并进行后向梯度更新。在此次前向计算过程中,须统计出当前迭代批次的训练图像中,模型产生的目标尺寸范围的待检测目标的损失值占总损失值的比值r。若比值r<预设阈值R,则下一次迭代的训练图像将被设置为拼接图像,这是因为,比值r<预设阈值R的满足说明目标尺寸范围的待检测目标的监督信号偏弱,启动拼接图像的训练,能将数据集中训练图像里的目标尺寸范围的待检测目标的数量增多,达到有针对性的代偿训练的效果。
S3,当t=T时,检测模型训练完毕。进入测试评估阶段时,此时与一般测试范式无异,即在目标模型测试的时候,仅将常规自然图像输入检测模型,获得检测结果并评估。
综上所述,本发明实施例通过将数据库中所有训练图像中待检测目标的尺寸划分为至少两个尺寸范围;在采用训练图像对目标模型进行一次迭代处理的情况下,确定目标模型针对训练图像中目标尺寸范围的待检测目标的损失值,与总损失值之间的比值,总损失值为训练图像中所有尺寸范围的待检测目标的损失值之和;在比值小于或等于预设比值的情况下,从数据库中选取多张目标训练图像,并对多张目标训练图像进行拼接,得到拼接图像,并将拼接图像作为目标模型下一次迭代处理的输入,本发明通过在一次迭代处理中,当目标模型针对目标尺寸范围的待检测目标的损失值与总损失值之间的比值小于或等于预设比值的情况下,确定此次迭代处理对目标尺寸范围的待检测目标的训练效果较差,需要在下一次迭代处理时,有针对性的对目标尺寸范围的待检测目标进行代偿训练,并具体将多张目标训练图像拼接得到的拼接图像作为所述目标模型下一次迭代处理的输入,使得下一次迭代处理时,通过拼接图像中数量较多的目标尺寸范围的待检测目标,提高目标模型对目标尺寸范围的待检测目标的训练权重,提高训练精度。
图5是本发明实施例提供的一种图像处理装置的框图,如图5所示,该装置可以包括:
划分模块301,用于将数据库中所有训练图像中待检测目标的尺寸划分为至少两个尺寸范围;
评判模块302,用于在采用所述训练图像对目标模型进行一次迭代处理的情况下,确定所述目标模型针对所述训练图像中目标尺寸范围的待检测目标的损失值,与总损失值之间的比值,所述总损失值为所述训练图像中所有尺寸范围的待检测目标的损失值之和;
拼接输入模块303,用于在所述比值小于或等于预设比值的情况下,从所述数据库中选取多张目标训练图像,并对多张所述目标训练图像进行拼接,得到拼接图像,并将所述拼接图像作为所述目标模型下一次迭代处理的输入。
可选的,所述拼接输入模块303,包括:
缩放拼接子模块,用于从所述数据库中选取多张目标训练图像,并将每个所述目标训练图像缩放后进行拼接,得到所述拼接图像。
可选的,所述缩放拼接子模块,包括:
选取单元,用于从所述数据库中选取k2张目标训练图像;
缩放单元,用于将每个所述目标训练图像的长和宽分别缩放为
Figure BDA0002497038900000111
拼接单元,用于按照k×k的多个分块,将所有目标训练图像在空间维度上进行拼接,得到所述拼接图像。
可选的,每个所述训练图像的尺寸相同,所述拼接图像的尺寸与所述训练图像的尺寸相同。
可选的,所述空间维度包括深度空间维度或平面空间维度。
可选的,所述目标尺寸范围为所有所述尺寸范围中值最小的尺寸范围。
可选的,所述目标尺寸范围为所有所述尺寸范围中待检测目标的数量最小的尺寸范围。
可选的,所述装置还包括:
直接输入模块,用于在所述比值大于所述预设比值的情况下,将从所述数据库中选取的训练图像,作为所述目标模型下一次迭代处理的输入。
综上,本发明实施例提供的图像处理装置,通过将数据库中所有训练图像中待检测目标的尺寸划分为至少两个尺寸范围;在采用训练图像对目标模型进行一次迭代处理的情况下,确定目标模型针对训练图像中目标尺寸范围的待检测目标的损失值,与总损失值之间的比值,总损失值为训练图像中所有尺寸范围的待检测目标的损失值之和;在比值小于或等于预设比值的情况下,从数据库中选取多张目标训练图像,并对多张目标训练图像进行拼接,得到拼接图像,并将拼接图像作为目标模型下一次迭代处理的输入,本发明通过在一次迭代处理中,当目标模型针对目标尺寸范围的待检测目标的损失值与总损失值之间的比值小于或等于预设比值的情况下,确定此次迭代处理对目标尺寸范围的待检测目标的训练效果较差,需要在下一次迭代处理时,有针对性的对目标尺寸范围的待检测目标进行代偿训练,并具体将多张目标训练图像拼接得到的拼接图像作为所述目标模型下一次迭代处理的输入,使得下一次迭代处理时,通过拼接图像中数量较多的目标尺寸范围的待检测目标,提高目标模型对目标尺寸范围的待检测目标的训练权重,提高训练精度。
另外,本发明实施例还提供一种装置,具体可以参照图6,该装置600包括处理器610,存储器620以及存储在存储器620上并可在处理器610上运行的计算机程序,该计算机程序被处理器610执行时实现上述实施例的图像处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述的图像处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,可以为只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
本发明实施例还提供了一种计算机程序,该计算机程序可以存储在云端或本地的存储介质上。在该计算机程序被计算机或处理器运行时用于执行本发明实施例的图像处理方法的相应步骤,并且用于实现根据本发明实施例的图像处理装置中的相应模块。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (11)

1.一种图像处理方法,其特征在于,所述方法包括:
将数据库中所有训练图像中待检测目标的尺寸划分为至少两个尺寸范围;
在采用所述训练图像对目标模型进行一次迭代处理的情况下,确定所述目标模型针对所述训练图像中目标尺寸范围的待检测目标的损失值,与总损失值之间的比值,所述总损失值为所述训练图像中所有尺寸范围的待检测目标的损失值之和;
在所述比值小于或等于预设比值的情况下,从所述数据库中选取多张目标训练图像,并对多张所述目标训练图像进行拼接,得到拼接图像,并将所述拼接图像作为所述目标模型下一次迭代处理的输入。
2.根据权利要求1所述的方法,其特征在于,所述从所述数据库中选取多张目标训练图像,并对多张所述目标训练图像进行拼接,得到拼接图像,包括:
从所述数据库中选取多张目标训练图像,并将每个所述目标训练图像缩放后进行拼接,得到所述拼接图像。
3.根据权利要求2所述的方法,其特征在于,每个所述训练图像的尺寸相同,所述拼接图像的尺寸与所述训练图像的尺寸相同。
4.根据权利要求2所述的方法,其特征在于,所述从所述数据库中选取多张目标训练图像,并将每个所述目标训练图像缩放后进行拼接,得到所述拼接图像,包括:
从所述数据库中选取k2张目标训练图像;
将每个所述目标训练图像的长和宽分别缩放为
Figure FDA0002497038890000011
按照k×k的多个分块,将所有目标训练图像在空间维度上进行拼接,得到所述拼接图像。
5.根据权利要求4所述的方法,其特征在于,所述空间维度包括深度空间维度或平面空间维度。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述比值大于所述预设比值的情况下,将从所述数据库中选取的训练图像,作为所述目标模型下一次迭代处理的输入。
7.根据权利要求1所述的方法,其特征在于,所述目标尺寸范围为所有所述尺寸范围中值最小的尺寸范围。
8.根据权利要求1所述的方法,其特征在于,所述目标尺寸范围为所有所述尺寸范围中待检测目标的数量最小的尺寸范围。
9.一种图像处理装置,其特征在于,所述装置包括:
划分模块,用于将数据库中所有训练图像中待检测目标的尺寸划分为至少两个尺寸范围;
评判模块,用于在采用所述训练图像对目标模型进行一次迭代处理的情况下,确定所述目标模型针对所述训练图像中目标尺寸范围的待检测目标的损失值,与总损失值之间的比值,所述总损失值为所述训练图像中所有尺寸范围的待检测目标的损失值之和;
拼接输入模块,用于在所述比值小于或等于预设比值的情况下,从所述数据库中选取多张目标训练图像,并对多张所述目标训练图像进行拼接,得到拼接图像,并将所述拼接图像作为所述目标模型下一次迭代处理的输入。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的图像处理方法的步骤。
11.一种装置,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的图像处理方法的步骤。
CN202010421250.8A 2020-05-18 2020-05-18 图像处理方法及装置 Pending CN111814820A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010421250.8A CN111814820A (zh) 2020-05-18 2020-05-18 图像处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010421250.8A CN111814820A (zh) 2020-05-18 2020-05-18 图像处理方法及装置

Publications (1)

Publication Number Publication Date
CN111814820A true CN111814820A (zh) 2020-10-23

Family

ID=72848050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010421250.8A Pending CN111814820A (zh) 2020-05-18 2020-05-18 图像处理方法及装置

Country Status (1)

Country Link
CN (1) CN111814820A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418287A (zh) * 2020-11-16 2021-02-26 深圳市优必选科技股份有限公司 图像预标注方法、装置、电子设备及介质
CN112967187A (zh) * 2021-02-25 2021-06-15 深圳海翼智新科技有限公司 用于目标检测的方法和装置
CN115049165A (zh) * 2022-08-15 2022-09-13 北矿机电科技有限责任公司 基于深度学习的浮选精矿品位预测方法、装置及设备
CN112967187B (zh) * 2021-02-25 2024-05-31 深圳海翼智新科技有限公司 用于目标检测的方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180292787A1 (en) * 2017-04-06 2018-10-11 Electronics And Telecommunications Research Institute Method and apparatus for generating digital color hologram, and digital color holographic display device using tiling
CN111160406A (zh) * 2019-12-10 2020-05-15 北京达佳互联信息技术有限公司 图像分类模型的训练方法、图像分类方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180292787A1 (en) * 2017-04-06 2018-10-11 Electronics And Telecommunications Research Institute Method and apparatus for generating digital color hologram, and digital color holographic display device using tiling
CN111160406A (zh) * 2019-12-10 2020-05-15 北京达佳互联信息技术有限公司 图像分类模型的训练方法、图像分类方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘俊;张文风;: "基于YOLOv3算法的高速公路火灾检测", 上海船舶运输科学研究所学报, no. 04 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418287A (zh) * 2020-11-16 2021-02-26 深圳市优必选科技股份有限公司 图像预标注方法、装置、电子设备及介质
CN112418287B (zh) * 2020-11-16 2023-10-13 深圳市优必选科技股份有限公司 图像预标注方法、装置、电子设备及介质
CN112967187A (zh) * 2021-02-25 2021-06-15 深圳海翼智新科技有限公司 用于目标检测的方法和装置
CN112967187B (zh) * 2021-02-25 2024-05-31 深圳海翼智新科技有限公司 用于目标检测的方法和装置
CN115049165A (zh) * 2022-08-15 2022-09-13 北矿机电科技有限责任公司 基于深度学习的浮选精矿品位预测方法、装置及设备

Similar Documents

Publication Publication Date Title
CN106776842B (zh) 多媒体数据检测方法及装置
CN108491817A (zh) 一种事件检测模型训练方法、装置以及事件检测方法
US20190244362A1 (en) Differentiable Jaccard Loss Approximation for Training an Artificial Neural Network
CN111814902A (zh) 目标检测模型训练方法、目标识别方法、装置和介质
CN109118504B (zh) 一种基于神经网络的图像边缘检测方法、装置及其设备
CN111783779B (zh) 图像处理方法、装置和计算机可读存储介质
CN113239875B (zh) 人脸特征的获取方法、系统、装置及计算机可读存储介质
CN113469074B (zh) 基于孪生注意力融合网络的遥感图像变化检测方法及系统
Kundu et al. No-reference image quality assessment for high dynamic range images
CN111814820A (zh) 图像处理方法及装置
CN112836756A (zh) 图像识别模型训练方法、系统和计算机设备
CN114974421B (zh) 基于扩散-降噪的单细胞转录组测序数据补插方法及系统
CN112836820A (zh) 用于图像分类任务的深度卷积网络训方法、装置及系统
CN115631399A (zh) 图像质量评估模型的训练方法、图像质量评估方法及装置
EP2058741A2 (en) A method and apparatus for analysing a plurality of stored images
CN111325671B (zh) 网络训练方法、装置、图像处理方法及电子设备
CN112348808A (zh) 屏幕透图检测方法及装置
CN112116102A (zh) 一种域适应训练集的扩展方法及系统
CN111754518B (zh) 图像集合的扩充方法、装置及电子设备
CN115631192A (zh) 一种阀门试压机的控制方法、装置、设备及介质
CN113011468B (zh) 图像特征提取方法及装置
CN114998172A (zh) 图像处理方法及相关系统
CN112149745B (zh) 确定难例样本的方法、装置、设备及存储介质
CN114742774A (zh) 融合局部和全局特征的无参考图像质量评价方法及系统
CN112288748B (zh) 一种语义分割网络训练、图像语义分割方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination