CN110992297A - 多商品图像合成方法、装置、电子设备及存储介质 - Google Patents

多商品图像合成方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN110992297A
CN110992297A CN201911095132.6A CN201911095132A CN110992297A CN 110992297 A CN110992297 A CN 110992297A CN 201911095132 A CN201911095132 A CN 201911095132A CN 110992297 A CN110992297 A CN 110992297A
Authority
CN
China
Prior art keywords
commodity
image
images
main body
binary segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911095132.6A
Other languages
English (en)
Inventor
辛颖
韩树民
冯原
苑鹏程
王晓迪
刘静伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201911095132.6A priority Critical patent/CN110992297A/zh
Publication of CN110992297A publication Critical patent/CN110992297A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了多商品图像合成方法、装置、电子设备及存储介质,涉及深度学习领域,其中方法可包括:针对任一商品,采集商品的商品图像,对商品图像进行主体检测,根据主体检测结果以及所构建的采集场景背景图像确定出商品对应的二值分割图像;当需要合成多商品图像时,获取应用场景背景图像,将至少两张二值分割图像合成到应用场景背景图像上,并根据二值分割图像对应的商品图像以及应用场景背景图像中的对应像素点取值对二值分割图像中的像素点进行赋值。应用本申请所述方案,可节省人力成本,并提高处理效率等。

Description

多商品图像合成方法、装置、电子设备及存储介质
技术领域
本申请涉及计算机应用领域,特别涉及深度学习领域的多商品图像合成方法、装置、电子设备及存储介质。
背景技术
零售行业是一种人力密集型行业,其中的收银结算占据相当高的成本,尤其是人力成本。特别是在消费高峰时段,结算人力不足将严重影响人们的消费体验等。
随着深度学习技术的发展,借助计算机视觉在结算场景自动生成结算清单,即自助结算,从而实现零售行业的降本增效已是大势所趋。为保证自助结算的性能,需要大量与真实结算场景相同的训练数据来进行深度学习模型的训练。所述训练数据通常为多商品图像。
按照目前的处理方式,通常是通过人工采集不同场景的多商品图像,并对其进行人工标注等。这种方式需要耗费很大的人力成本,而且效率低下。
发明内容
有鉴于此,本申请提供了多商品图像合成方法、装置、电子设备及存储介质。
一种多商品图像合成方法,包括:
针对任一商品,采集所述商品的商品图像,对所述商品图像进行主体检测,根据主体检测结果以及所构建的采集场景背景图像确定出所述商品对应的二值分割图像;
当需要合成多商品图像时,获取应用场景背景图像,将至少两张所述二值分割图像合成到所述应用场景背景图像上,并根据所述二值分割图像对应的商品图像以及所述应用场景背景图像中的对应像素点取值对所述二值分割图像中的像素点进行赋值。
根据本申请一优选实施例,所述采集所述商品的商品图像包括:
利用N个图像采集单元,对放置在采集平台上且进行360度旋转的所述商品进行图像采集,得到所述商品图像;
其中,所述N为正整数,不同的图像采集单元分别位于不同的采集视角;所述旋转平台每旋转预定角度,每个图像采集单元则进行一次图像采集。
根据本申请一优选实施例,所述对所述商品图像进行主体检测包括:利用快速基于区域卷积神经网络算法对所述商品图像进行主体检测。
根据本申请一优选实施例,该方法进一步包括:若从所述商品图像中检测出多于一个主体,则选取其中面积最大的主体作为所述商品对应的主体。
根据本申请一优选实施例,所述根据主体检测结果以及所构建的采集场景背景图像确定出所述商品对应的二值分割图像包括:
根据所述主体检测结果,从所述商品图像中裁剪出包含所述商品的最小矩形区域,得到商品子图;
按照所述商品子图在所述商品图像中的位置,从所述采集场景背景图像中裁剪出同样位置的矩形区域,得到背景子图;
将所述商品子图与所述背景子图作差,得到差值子图,并对所述差值子图进行二值化处理,得到所述商品对应的二值分割图像。
根据本申请一优选实施例,所述采集场景背景图像包括:根据高斯混合模型算法构建出的采集场景背景图像。
根据本申请一优选实施例,所述根据所述二值分割图像对应的商品图像以及所述应用场景背景图像中的对应像素点取值对所述二值分割图像中的像素点进行赋值包括:
对于任一二值分割图像中的任一像素点,若所述像素点的取值为0,则将所述应用场景背景图像中同样位置的像素点的取值赋值给所述像素点,否则,将所述像素点在所述二值分割图像对应的商品图像中的取值赋值给所述像素点。
一种多商品图像合成装置,包括:预处理模块以及合成模块;
所述预处理模块,用于针对任一商品,采集所述商品的商品图像,对所述商品图像进行主体检测,根据主体检测结果以及所构建的采集场景背景图像确定出所述商品对应的二值分割图像;
所述合成模块,用于当需要合成多商品图像时,获取应用场景背景图像,将至少两张所述二值分割图像合成到所述应用场景背景图像上,并根据所述二值分割图像对应的商品图像以及所述应用场景背景图像中的对应像素点取值对所述二值分割图像中的像素点进行赋值。
根据本申请一优选实施例,所述预处理模块利用N个图像采集单元,对放置在采集平台上且进行360度旋转的所述商品进行图像采集,得到所述商品图像;其中,所述N为正整数,不同的图像采集单元分别位于不同的采集视角,所述旋转平台每旋转预定角度,每个图像采集单元则进行一次图像采集。
根据本申请一优选实施例,所述预处理模块利用快速基于区域卷积神经网络算法对所述商品图像进行主体检测。
根据本申请一优选实施例,所述预处理模块进一步用于,若从所述商品图像中检测出多于一个主体,则选取其中面积最大的主体作为所述商品对应的主体。
根据本申请一优选实施例,所述预处理模块根据所述主体检测结果,从所述商品图像中裁剪出包含所述商品的最小矩形区域,得到商品子图;按照所述商品子图在所述商品图像中的位置,从所述采集场景背景图像中裁剪出同样位置的矩形区域,得到背景子图;将所述商品子图与所述背景子图作差,得到差值子图,并对所述差值子图进行二值化处理,得到所述商品对应的二值分割图像。
根据本申请一优选实施例,所述采集场景背景图像包括:根据高斯混合模型算法构建出的采集场景背景图像。
根据本申请一优选实施例,所述合成模块针对任一二值分割图像中的任一像素点,若所述像素点的取值为0,则将所述应用场景背景图像中同样位置的像素点的取值赋值给所述像素点,否则,将所述像素点在所述二值分割图像对应的商品图像中的取值赋值给所述像素点。
一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如以上所述的方法。
一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如以上所述的方法。
上述申请中的一个实施例具有如下优点或有益效果:
可基于采集到的各商品的商品图像,通过一系列处理后,自动合成出多商品图像,从而无需人工进行多商品图像的采集,且合成多商品图像时,不同商品的位置及类型等都是已知的,因此也无需人工再进行标注,从而相比于现有方式节省了人力成本,并提高了处理效率等;
可利用图像采集单元对放置在采集平台上的商品进行图像采集,以得到商品图像,图像采集单元的光线稳定且统一,从而保证了采集到的商品图像的清晰度,进而确保了后续处理的准确性等;并且,可获取到不同采集视角以及不同旋转角度的商品图像,从而丰富了商品图像信息,进而提升了合成的多商品图像的多样性等;
可利用快速基于区域卷积神经网络算法对商品图像进行主体检测,并可在检测出多于一个主体时,基于面积选出商品对应的主体,从而提升了主体检测的稳定性和准确性等;
可根据高斯混合模型算法构建采集场景背景图像,从而可克服采集平台的旋转可能导致的背景轻微扰动等问题,进而提升了构建出的采集场景背景图像的准确性等;
在对合成的多商品图像中的商品各像素点进行赋值时,可结合商品图像以及应用场景背景图像中的对应像素点取值,从而确保了赋值结果的准确性等;
在实际生产生活中,商品种类繁多且会不断更新,不同应用场景又千差万别,穷尽所有的商品组合是不现实的,而按照本申请实施例所述方式,可合成得到各种各样的多商品图像,从而为模型训练提供了丰富的训练数据,进而提升了模型训练效果等;
上述可选方式所具有的其它效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请所述多商品图像合成方法实施例的流程图;
图2为本申请所述采集方式的示意图;
图3为本申请所述多商品图像合成方法的整体实现过程示意图;
图4为本申请所述合成后的多商品图像的示意图;
图5为本申请所述多商品图像合成装置500实施例的组成结构示意图;
图6为根据本申请实施例所述方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
另外,应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本申请所述多商品图像合成方法实施例的流程图。如图1所示,包括以下具体实现方式。
在101中,针对任一商品,采集商品的商品图像,对商品图像进行主体检测,根据主体检测结果以及所构建的采集场景背景图像确定出商品对应的二值分割图像。
在102中,当需要合成多商品图像时,获取应用场景背景图像,将至少两张二值分割图像合成到应用场景背景图像上,并根据二值分割图像对应的商品图像以及应用场景背景图像中的对应像素点取值对二值分割图像中的像素点进行赋值。
优选地,针对任一商品,在采集其商品图像时,可采用以下处理方式:利用N个图像采集单元,对放置在采集平台上且进行360度旋转的该商品进行图像采集,得到商品图像;其中,N为正整数,不同的图像采集单元分别位于不同的采集视角,且,旋转平台每旋转预定角度,每个图像采集单元则进行一次图像采集。
N的具体取值可根据实际需要而定。图像采集单元可为摄像头或相机等。
图2为本申请所述采集方式的示意图。如图2所示,假设共有4个相机,分别位于不同的采集视角,即0°、30°、60°、90°4个采集视角,可将商品放置在采集平台上,采集平台可进行360°旋转,对于每个采集视角下的相机,可每8°采集一张商品图像,这样,每个采集视角下可分别采集到45张商品图像,四个采集视角下共可采集到180张商品图像。
本实施例中,可将具有不同条形码的商品视为不同商品,针对不同商品,可分别按照上述方式得到180张商品图像。所述不同商品可涵盖个人护理用品、食品饮料、保健品、烟酒等各种类型。
可以看出,通过上述方式,可利用图像采集单元对放置在采集平台上的商品进行图像采集,以得到商品图像,图像采集单元的光线稳定且统一,从而保证了采集到的商品图像的清晰度,进而确保了后续处理的准确性等;并且,可获取到不同采集视角以及不同旋转角度的商品图像,从而丰富了商品图像信息,进而提升了合成的多商品图像的多样性等。
对于采集得到的商品图像,可分别对其进行主体检测。
由于本实施例中采集到的商品图像为单商品图像,商品信息在整张图像中的占比较少,因此为了保证商品信息的有效性,可对采集到的商品图像进行主体检测。主体检测是指在一张图像中自动检测出主体区域,从而突出主体的信息并有效的去除背景区域的干扰。
主体检测主要源于目标检测算法,早期的目标检测算法主要为基于人工选择特征的机器学习算法,近些年来,基于深度学习的目标检测算法掀起了研究热潮并开始广泛应用于各种场景。
目前,基于深度学习的目标检测算法主要分为两个大类,一种是以只需一次(YOLO,You Only Look Once)为代表的单阶段(One-Stage)目标检测算法,包括YOLO系列算法(如YOLOv2、YOLO9000、YOLOv3)和单发多盒检测(SSD,Single Shot MultiBox Detector)等,另一种是以快速基于区域卷积神经网络(Faster-RCNN,Faster Region-basedConvolutional Neural Networks)为代表的两阶段(Two-Stage)目标检测算法,包括R-CNN、空间金字塔池化网络(SPP-Net,Spatial Pyramid PoolingNet)、Faster-RCNN、特征金字塔网络(FPN,Feature Pyramid Network)等。单阶段目标检测算法具有速度快的优势,两阶段目标检测算法具有检测准确率高的特点。考虑到主体检测算法需要更为稳定且准确率更高,本实施例中可采用Faster-RCNN算法作为主体检测算法,即可利用Faster-RCNN算法对采集到的商品图像进行主体检测。Faster-RCNN算法整合了候选框提取、特征提取、分类和边框回归等各个部分,具体实现为现有技术。
按照上述图像采集方式可知,从商品图像中检测出的主体通常为一个,但某些情况下也可能为多个,如商品为洗衣机,除洗衣机外,将洗衣机上的某个图案也检测为主体,或者,将背景中的某部分错误检测为主体等。对于这种情况,即当从商品图像中检测出多于一个主体时,可选取其中面积最大的主体作为商品对应的主体,即将多于一个主体中面积最大的主体作为所需的主体。
上述方式中,可利用Faster-RCNN算法对商品图像进行主体检测,并可在检测出多于一个主体时,基于面积选出商品对应的主体,从而提升了主体检测的稳定性和准确性等。
之后,可根据主体检测结果以及所构建的采集场景背景图像确定出商品对应的二值分割图像。如可首先从商品图像中裁剪出包含商品的最小矩形区域,得到商品子图,之后可按照商品子图在商品图像中的位置,从采集场景背景图像中裁剪出同样位置的矩形区域,得到背景子图,进而可将商品子图与背景子图作差,得到差值子图,并可对差值子图进行二值化处理,从而得到商品对应的二值分割图像。
裁剪出的商品子图中通常还会包含一定的背景区域,可对其进行图像分割,将商品主体从背景中分割出来。
传统的图像分割算法主要基于传统的机器学习,较为成熟的算法有基于阈值的图像分割算法、基于区域的图像分割算法、基于边缘检测的图像分割算法、基于遗传算法的图像分割算法、基于聚类的图像分割算法以及基于图的图像分割算法等。随着深度学习技术的发展,近年来,兴起了多种基于深度学习的图像分割算法,如掩膜基于区域卷积神经网络(MaskR-CNN,Mask Region-based Convolutional Neural Networks)、基于区域全卷积神经网络(R-FCN,Region-based Fully Convolutional Networks)等。由于采集到的商品图像没有有效的标注信息,且考虑到前景与背景差异较大,因此本实施例中可采用背景差法来进行图像分割。
背景差法的关键在于建立鲁棒的背景模型,背景模型可分为单模态和多模态两种。在单模态场景中,背景像素点的颜色值分布比较集中,可以用单一分布的概率模型来描述,而在多模态场景中,背景像素点的颜色值分布非常分散,需要用多个分布的概率模型拟合描述。考虑到采集平台的旋转可能会导致背景轻微扰动,本实施例中采取多模态背景模型。在多模态背景模型中,高斯混合模型(GMM,Gaussian Mixture Model)算法效果最好。
高斯混合模型算法的基本思想是:对图像中每一个像素点的颜色值建立混合高斯模型,通过一段时间的采样观测,根据各个高斯分布的持续性和变动性的差异,判断哪一个高斯分布更加接近于真实背景,该高斯分布即作为背景模型。
因此,本实施例中所构建的采集场景背景图像可为根据高斯混合模型算法构建出的采集场景背景图像(即背景模型),从而可克服采集平台的旋转可能导致的背景轻微扰动等问题,进而提升了构建出的采集场景背景图像的准确性等。
针对每个采集视角,可分别基于在该采集视角下采集到的多幅商品图像,根据高斯混合模型算法构建出采集场景背景图像,具体实现为现有技术。
对于裁剪出来的商品子图,其在商品图像中的位置是已知的,那么可按照商品子图在商品图像中的位置,从采集场景背景图像中裁剪出同样位置的矩形区域,从而得到背景子图。其中,采集场景背景图像为采集商品子图对应的商品图像时的采集视角对应的采集场景背景图像。
可将商品子图与背景子图作差,即将两张子图中的对应像素点的取值相减,从而得到差值子图,进而可对差值子图进行二值化处理,如设定一个阈值,对于差值子图中的任一像素点,若其取值大于阈值,则将其设置为1(或255),否则设置为0,这样,可得到由0和1组成的二值分割图像。二值分割图像与商品子图的大小相同,但其中的像素点只有0和1两种取值。
针对采集得到的各商品图像,均可按照上述方式进行处理,从而得到对应的二值分割图像。
当需要合成多商品图像时,可获取应用场景背景图像,将至少两张二值分割图像合成到应用场景背景图像上,并可根据二值分割图像对应的商品图像以及应用场景背景图像中的对应像素点取值对二值分割图像中的像素点进行赋值。
应用场景背景图像可为预先针对不同的结算场景(如超市、餐饮)等拍摄到的背景图像,其中不包含商品。可根据实际需要从多张应用场景背景图像中选取一张应用场景背景图像,之后可随机地或按照预定策略将多个商品对应的二值分割图像合成到应用场景背景图像上。其中,对于任一二值分割图像中的任一像素点,若该像素点的取值为0,可将应用场景背景图像中同样位置的像素点的取值赋值给该像素点,即作为合成后的多商品图像中该像素点的取值,否则,若该像素点的取值为1,可将该像素点在该二值分割图像对应的商品图像中的取值赋值给该像素点。
即在对合成的多商品图像中的商品各像素点进行赋值时,可结合商品图像以及应用场景背景图像中的对应像素点取值,从而确保了赋值结果的准确性等。
综合上述介绍可以看出,本实施例所述方案中,可基于采集到的各商品的商品图像,通过一系列处理后,自动合成出多商品图像,从而无需人工进行多商品图像的采集,且合成多商品图像时,不同商品的位置及类型等都是已知的,因此也无需人工再进行标注,从而相比于现有方式节省了人力成本,并提高了处理效率等。
另外,在实际生产生活中,商品种类繁多且会不断更新,不同结算场景又千差万别,穷尽所有的商品组合是不现实的,而按照本实施例所述方案,可合成得到各种各样的多商品图像,从而为模型训练提供了丰富的训练数据,进而提升了模型训练效果等。
图3为本申请所述多商品图像合成方法的整体实现过程示意图。如图3所示,针对任一商品,可采集商品的商品图像,优选地,可利用N个图像采集单元,对放置在采集平台上且进行360度旋转的商品进行图像采集,得到商品图像,其中,N为正整数,不同的图像采集单元分别位于不同的采集视角,且,旋转平台每旋转预定角度,每个图像采集单元则可进行一次图像采集。可对采集到的商品图像进行主体检测,优选地,可利用基于区域卷积神经网络算法对商品图像进行主体检测,另外,若从商品图像中检测出多于一个主体,可选取其中面积最大的主体作为商品对应的主体。可从商品图像中裁剪出包含商品的最小矩形区域,得到商品子图。并可基于采集到的多幅商品图像进行背景建模,从而构建出采集场景背景图像,优选地,可根据高斯混合模型算法构建出采集场景背景图像。可按照商品子图在商品图像中的位置,从采集场景背景图像中裁剪出同样位置的矩形区域,得到背景子图,并可将商品子图与背景子图作差,得到差值子图,进而可对差值子图进行二值化处理,从而得到商品对应的二值分割图像。当需要合成多商品图像时,可获取应用场景背景图像,将至少两张二值分割图像合成到应用场景背景图像上,并可根据二值分割图像对应的商品图像以及应用场景背景图像中的对应像素点取值对二值分割图像中的像素点进行赋值,优选地,对于任一二值分割图像中的任一像素点,若该像素点的取值为0,则可将应用场景背景图像中同样位置的像素点的取值赋值给该像素点,否则,可将该像素点在该二值分割图像对应的商品图像中的取值赋值给该像素点。图4为本申请所述合成后的多商品图像的示意图。
需要说明的是,对于前述的方法实施例,为了简单描述,将其表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
以上是关于方法实施例的介绍,以下通过装置实施例,对本申请所述方案进行进一步说明。
图5为本申请所述多商品图像合成装置500实施例的组成结构示意图。如图5所示,包括:预处理模块501以及合成模块502。
预处理模块501,用于针对任一商品,采集商品的商品图像,对商品图像进行主体检测,根据主体检测结果以及所构建的采集场景背景图像确定出商品对应的二值分割图像。
合成模块502,用于当需要合成多商品图像时,获取应用场景背景图像,将至少两张二值分割图像合成到应用场景背景图像上,并根据二值分割图像对应的商品图像以及应用场景背景图像中的对应像素点取值对二值分割图像中的像素点进行赋值。
其中,预处理模块501可利用N个图像采集单元,对放置在采集平台上且进行360度旋转的商品进行图像采集,得到商品图像;其中,N为正整数,不同的图像采集单元分别位于不同的采集视角,旋转平台每旋转预定角度,每个图像采集单元则可进行一次图像采集。
N的具体取值可根据实际需要而定,如4。图像采集单元可为摄像头或相机等。
对于采集得到的商品图像,预处理模块501可分别对其进行主体检测。优选地,预处理模块501可利用快速基于区域卷积神经网络算法对商品图像进行主体检测。
从商品图像中检测出的主体通常为一个,但某些情况下也可能为多个,对于这种情况,即当从商品图像中检测出多于一个主体时,预处理模块501可选取其中面积最大的主体作为商品对应的主体。
预处理模块501还可根据主体检测结果,从商品图像中裁剪出包含商品的最小矩形区域,得到商品子图,并可按照商品子图在商品图像中的位置,从采集场景背景图像中裁剪出同样位置的矩形区域,得到背景子图,之后可将商品子图与背景子图作差,得到差值子图,并对差值子图进行二值化处理,从而得到商品对应的二值分割图像。
优选地,采集场景背景图像为根据高斯混合模型算法构建出的采集场景背景图像。另外,针对每个采集视角,可分别基于在该采集视角下采集到的多幅商品图像,根据高斯混合模型算法构建出采集场景背景图像,并在使用时,选取相应的采集场景背景图像进行使用。
当需要合成多商品图像时,合成模块502可获取应用场景背景图像,将至少两张二值分割图像合成到应用场景背景图像上,并可根据二值分割图像对应的商品图像以及应用场景背景图像中的对应像素点取值对二值分割图像中的像素点进行赋值。优选地,合成模块502针对任一二值分割图像中的任一像素点,若该像素点的取值为0,则可将应用场景背景图像中同样位置的像素点的取值赋值给该像素点,否则,可将该像素点在该二值分割图像对应的商品图像中的取值赋值给该像素点。
图5所示装置实施例的具体工作流程请参照前述方法实施例中的相关说明,不再赘述。
总之,根据本申请方法和装置实施例所述方案,至少可带来如下优点或有益效果:
可基于采集到的各商品的商品图像,通过一系列处理后,自动合成出多商品图像,从而无需人工进行多商品图像的采集,且合成多商品图像时,不同商品的位置及类型等都是已知的,因此也无需人工再进行标注,从而相比于现有方式节省了人力成本,并提高了处理效率等;
可利用图像采集单元对放置在采集平台上的商品进行图像采集,以得到商品图像,图像采集单元的光线稳定且统一,从而保证了采集到的商品图像的清晰度,进而确保了后续处理的准确性等;并且,可获取到不同采集视角以及不同旋转角度的商品图像,从而丰富了商品图像信息,进而提升了合成的多商品图像的多样性等;
可利用快速基于区域卷积神经网络算法对商品图像进行主体检测,并可在检测出多于一个主体时,基于面积选出商品对应的主体,从而提升了主体检测的稳定性和准确性等;
可根据高斯混合模型算法构建采集场景背景图像,从而可克服采集平台的旋转可能导致的背景轻微扰动等问题,进而提升了构建出的采集场景背景图像的准确性等;
在对合成的多商品图像中的商品各像素点进行赋值时,可结合商品图像以及应用场景背景图像中的对应像素点取值,从而确保了赋值结果的准确性等;
在实际生产生活中,商品种类繁多且会不断更新,不同应用场景又千差万别,穷尽所有的商品组合是不现实的,而按照本申请实施例所述方式,可合成得到各种各样的多商品图像,从而为模型训练提供了丰富的训练数据,进而提升了模型训练效果等。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图6所示,是根据本申请实施例所述方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,该电子设备包括:一个或多个处理器Y01、存储器Y02,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示图形用户界面的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器Y01为例。
存储器Y02即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的方法。
存储器Y02作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的方法对应的程序指令/模块(例如,附图X所示的xx模块X01、xx模块x02和xx模块x03)。处理器Y01通过运行存储在存储器Y02中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的方法。
存储器Y02可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器Y02可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器Y02可选包括相对于处理器Y01远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
电子设备还可以包括:输入装置Y03和输出装置Y04。处理器Y01、存储器Y02、输入装置Y03和输出装置Y04可以通过总线或者其他方式连接,图6中以通过总线连接为例。
输入装置Y03可接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置Y04可以包括显示设备、辅助照明装置和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器、发光二极管显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用集成电路、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,阴极射线管或者液晶显示器监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网、广域网和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (16)

1.一种多商品图像合成方法,其特征在于,包括:
针对任一商品,采集所述商品的商品图像,对所述商品图像进行主体检测,根据主体检测结果以及所构建的采集场景背景图像确定出所述商品对应的二值分割图像;
当需要合成多商品图像时,获取应用场景背景图像,将至少两张所述二值分割图像合成到所述应用场景背景图像上,并根据所述二值分割图像对应的商品图像以及所述应用场景背景图像中的对应像素点取值对所述二值分割图像中的像素点进行赋值。
2.根据权利要求1所述的方法,其特征在于,
所述采集所述商品的商品图像包括:
利用N个图像采集单元,对放置在采集平台上且进行360度旋转的所述商品进行图像采集,得到所述商品图像;
其中,所述N为正整数,不同的图像采集单元分别位于不同的采集视角;所述旋转平台每旋转预定角度,每个图像采集单元则进行一次图像采集。
3.根据权利要求1所述的方法,其特征在于,
所述对所述商品图像进行主体检测包括:利用快速基于区域卷积神经网络算法对所述商品图像进行主体检测。
4.根据权利要求1所述的方法,其特征在于,
该方法进一步包括:若从所述商品图像中检测出多于一个主体,则选取其中面积最大的主体作为所述商品对应的主体。
5.根据权利要求1所述的方法,其特征在于,
所述根据主体检测结果以及所构建的采集场景背景图像确定出所述商品对应的二值分割图像包括:
根据所述主体检测结果,从所述商品图像中裁剪出包含所述商品的最小矩形区域,得到商品子图;
按照所述商品子图在所述商品图像中的位置,从所述采集场景背景图像中裁剪出同样位置的矩形区域,得到背景子图;
将所述商品子图与所述背景子图作差,得到差值子图,并对所述差值子图进行二值化处理,得到所述商品对应的二值分割图像。
6.根据权利要求1所述的方法,其特征在于,
所述采集场景背景图像包括:根据高斯混合模型算法构建出的采集场景背景图像。
7.根据权利要求1所述的方法,其特征在于,
所述根据所述二值分割图像对应的商品图像以及所述应用场景背景图像中的对应像素点取值对所述二值分割图像中的像素点进行赋值包括:
对于任一二值分割图像中的任一像素点,若所述像素点的取值为0,则将所述应用场景背景图像中同样位置的像素点的取值赋值给所述像素点,否则,将所述像素点在所述二值分割图像对应的商品图像中的取值赋值给所述像素点。
8.一种多商品图像合成装置,其特征在于,包括:预处理模块以及合成模块;
所述预处理模块,用于针对任一商品,采集所述商品的商品图像,对所述商品图像进行主体检测,根据主体检测结果以及所构建的采集场景背景图像确定出所述商品对应的二值分割图像;
所述合成模块,用于当需要合成多商品图像时,获取应用场景背景图像,将至少两张所述二值分割图像合成到所述应用场景背景图像上,并根据所述二值分割图像对应的商品图像以及所述应用场景背景图像中的对应像素点取值对所述二值分割图像中的像素点进行赋值。
9.根据权利要求8所述的装置,其特征在于,
所述预处理模块利用N个图像采集单元,对放置在采集平台上且进行360度旋转的所述商品进行图像采集,得到所述商品图像;其中,所述N为正整数,不同的图像采集单元分别位于不同的采集视角,所述旋转平台每旋转预定角度,每个图像采集单元则进行一次图像采集。
10.根据权利要求8所述的装置,其特征在于,
所述预处理模块利用快速基于区域卷积神经网络算法对所述商品图像进行主体检测。
11.根据权利要求8所述的装置,其特征在于,
所述预处理模块进一步用于,若从所述商品图像中检测出多于一个主体,则选取其中面积最大的主体作为所述商品对应的主体。
12.根据权利要求8所述的装置,其特征在于,
所述预处理模块根据所述主体检测结果,从所述商品图像中裁剪出包含所述商品的最小矩形区域,得到商品子图;按照所述商品子图在所述商品图像中的位置,从所述采集场景背景图像中裁剪出同样位置的矩形区域,得到背景子图;将所述商品子图与所述背景子图作差,得到差值子图,并对所述差值子图进行二值化处理,得到所述商品对应的二值分割图像。
13.根据权利要求8所述的装置,其特征在于,
所述采集场景背景图像包括:根据高斯混合模型算法构建出的采集场景背景图像。
14.根据权利要求8所述的装置,其特征在于,
所述合成模块针对任一二值分割图像中的任一像素点,若所述像素点的取值为0,则将所述应用场景背景图像中同样位置的像素点的取值赋值给所述像素点,否则,将所述像素点在所述二值分割图像对应的商品图像中的取值赋值给所述像素点。
15.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法。
CN201911095132.6A 2019-11-11 2019-11-11 多商品图像合成方法、装置、电子设备及存储介质 Pending CN110992297A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911095132.6A CN110992297A (zh) 2019-11-11 2019-11-11 多商品图像合成方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911095132.6A CN110992297A (zh) 2019-11-11 2019-11-11 多商品图像合成方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN110992297A true CN110992297A (zh) 2020-04-10

Family

ID=70083753

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911095132.6A Pending CN110992297A (zh) 2019-11-11 2019-11-11 多商品图像合成方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN110992297A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113656630A (zh) * 2021-08-17 2021-11-16 北京百度网讯科技有限公司 检索图像的方法、装置和系统
CN114187488A (zh) * 2021-12-10 2022-03-15 北京百度网讯科技有限公司 图像处理方法、装置、设备、介质及程序产品

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104902189A (zh) * 2015-06-24 2015-09-09 小米科技有限责任公司 图片处理方法及装置
US20180018800A1 (en) * 2015-03-30 2018-01-18 Alibaba Group Holding Limited Efficient image synthesis
CN108961304A (zh) * 2017-05-23 2018-12-07 阿里巴巴集团控股有限公司 识别视频中运动前景的方法和确定视频中目标位置的方法
CN109361850A (zh) * 2018-09-28 2019-02-19 Oppo广东移动通信有限公司 图像处理方法、装置、终端设备及存储介质
CN109544496A (zh) * 2018-11-19 2019-03-29 南京旷云科技有限公司 训练数据的生成方法、对象检测模型的训练方法和装置
CN109727264A (zh) * 2019-01-10 2019-05-07 南京旷云科技有限公司 图像生成方法、神经网络的训练方法、装置和电子设备
CN109977983A (zh) * 2018-05-07 2019-07-05 广州逗号智能零售有限公司 获得训练图像的方法及装置
CN110111238A (zh) * 2019-04-24 2019-08-09 薄涛 图像处理方法、装置、设备及其存储介质
CN110147162A (zh) * 2019-04-17 2019-08-20 江苏大学 一种基于指尖特征的增强装配示教系统及其控制方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180018800A1 (en) * 2015-03-30 2018-01-18 Alibaba Group Holding Limited Efficient image synthesis
CN104902189A (zh) * 2015-06-24 2015-09-09 小米科技有限责任公司 图片处理方法及装置
CN108961304A (zh) * 2017-05-23 2018-12-07 阿里巴巴集团控股有限公司 识别视频中运动前景的方法和确定视频中目标位置的方法
CN109977983A (zh) * 2018-05-07 2019-07-05 广州逗号智能零售有限公司 获得训练图像的方法及装置
CN109361850A (zh) * 2018-09-28 2019-02-19 Oppo广东移动通信有限公司 图像处理方法、装置、终端设备及存储介质
CN109544496A (zh) * 2018-11-19 2019-03-29 南京旷云科技有限公司 训练数据的生成方法、对象检测模型的训练方法和装置
CN109727264A (zh) * 2019-01-10 2019-05-07 南京旷云科技有限公司 图像生成方法、神经网络的训练方法、装置和电子设备
CN110147162A (zh) * 2019-04-17 2019-08-20 江苏大学 一种基于指尖特征的增强装配示教系统及其控制方法
CN110111238A (zh) * 2019-04-24 2019-08-09 薄涛 图像处理方法、装置、设备及其存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PETER CHRISTIANSEN 等: "DeepAnomaly: Combining Background Subtraction and Deep Learning for Detecting Obstacles and Anomalies in an Agricultural Field" *
周明亮 等: "基于图割的图像抠像与合成算法" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113656630A (zh) * 2021-08-17 2021-11-16 北京百度网讯科技有限公司 检索图像的方法、装置和系统
CN114187488A (zh) * 2021-12-10 2022-03-15 北京百度网讯科技有限公司 图像处理方法、装置、设备、介质及程序产品
CN114187488B (zh) * 2021-12-10 2023-11-17 北京百度网讯科技有限公司 图像处理方法、装置、设备、介质

Similar Documents

Publication Publication Date Title
CN111259751B (zh) 基于视频的人体行为识别方法、装置、设备及存储介质
CN110532978A (zh) 仓储管理方法、装置、设备及存储介质
JP2019514123A (ja) 地理的領域におけるコンテナ内に格納された量の遠隔決定
CN111753727A (zh) 用于提取结构化信息的方法、装置、设备及可读存储介质
CN111738072A (zh) 目标检测模型的训练方法、装置及电子设备
CN112507949A (zh) 目标跟踪方法、装置、路侧设备以及云控平台
CN110675635B (zh) 相机外参的获取方法、装置、电子设备及存储介质
WO2013192253A1 (en) Self learning face recognition using depth based tracking for database generation and update
CN107918767B (zh) 目标检测方法、装置、电子设备及计算机可读介质
CN106663196A (zh) 视频中的计算机显著人物识别
CN111832568A (zh) 车牌识别方法、车牌识别模型的训练方法和装置
CN110717933B (zh) 针对运动物体漏检的后处理方法、装置、设备和介质
CN111539347B (zh) 用于检测目标的方法和装置
CN113724368A (zh) 图像采集系统、三维重建方法、装置、设备以及存储介质
CN110992297A (zh) 多商品图像合成方法、装置、电子设备及存储介质
CN111814633A (zh) 陈列场景检测方法、装置、设备以及存储介质
CN114581794B (zh) 地理数字孪生信息获取方法、装置、电子设备及存储介质
CN112581533A (zh) 定位方法、装置、电子设备及存储介质
CN111950345A (zh) 摄像头的识别方法、装置、电子设备和存储介质
CN112257604A (zh) 图像检测方法、装置、电子设备和存储介质
CN115761571A (zh) 基于视频的目标检索方法、装置、设备以及存储介质
CN113657398B (zh) 图像识别方法和装置
CN111275827A (zh) 基于边缘的增强现实三维跟踪注册方法、装置和电子设备
CN111339877A (zh) 盲区的长度检测方法、装置、电子设备及存储介质
CN114241012A (zh) 一种高空抛物的判定方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination