CN111310606A - 多张图片之间重复内容获取方法、系统、设备和介质 - Google Patents
多张图片之间重复内容获取方法、系统、设备和介质 Download PDFInfo
- Publication number
- CN111310606A CN111310606A CN202010072559.0A CN202010072559A CN111310606A CN 111310606 A CN111310606 A CN 111310606A CN 202010072559 A CN202010072559 A CN 202010072559A CN 111310606 A CN111310606 A CN 111310606A
- Authority
- CN
- China
- Prior art keywords
- training
- pictures
- mark
- model
- areas
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012549 training Methods 0.000 claims abstract description 135
- 238000001514 detection method Methods 0.000 claims description 28
- 238000013145 classification model Methods 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 11
- 230000003252 repetitive effect Effects 0.000 claims description 6
- 239000003550 marker Substances 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 10
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 7
- 238000002372 labelling Methods 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 4
- 241000531116 Blitum bonus-henricus Species 0.000 description 3
- 235000008645 Chenopodium bonus henricus Nutrition 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/30—Scenes; Scene-specific elements in albums, collections or shared content, e.g. social network photos or video
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本公开涉及图像处理技术领域,特别涉及一种多张图片之间重复内容获取方法、系统、设备和存储介质。所述方法通过构建包含多张训练图片的训练数据集,并利用训练数据集训练好一个能够检测和判别到多张训练图片中标记区域以及标记区域之间是否相同的模型,继而利用训练好的这个模型判别目标图片中被检测出来的的标记区域是否相同,最终依据检测出来的标记区域和判别结果快速找到目标图片之间的重复内容。
Description
技术领域
本公开涉及图像处理技术领域,特别涉及一种多张图片之间重复内容获取方法、系统、设备和存储介质。
背景技术
相机的成像范围可以通过不同的镜头来达到不同的效果。不过,当相机面临的取景区域面积较大,或者相机距离取景区域较近时,不论换成何种镜头,相机的成像范围总是难以完全覆盖取景区域。为了完全覆盖取景区域,不得不采用布设多组相机或者使用同一相机拍摄多张照片的方式来实现。
布设多组相机还是采用同一相机拍摄多张照片,最终的结果都是会产生多张图片。而对于完整的取景区域来说,只有把产生的多张图片进行拼接才能得到完整的取景区域。显然在拼接这些图片时需要考虑图片之间重复内容进行重叠才能实现图片的正确拼接。
在零售行业中,利用相机拍摄货柜上的货物图片,并利用人工智能技术去识别图像中不同的货物区域,最终形成关于货物售卖情况报表的方式正逐步得到应用。由于清晰度等客观要求的限制,拍摄多张货柜图像成为必要的步骤。如果想要利用这些图像拼接出一份完整的货柜图像,还需要利用人工识别出多张图像之间的重复内容,以便于做到精确拼接。
发明内容
本公开的一方面提供了一种获取多张图片之间重复内容的方法。所述方法包括如下步骤:
对多张训练图片进行区域标记,以得到包含有由多个标记框圈定的标记区域的训练数据集;其中所述标记区域之间建立有关联关系,并且不同的标记区域之间的关联关系不同于相同的所述标记区域之间的关联关系;
将所述训练数据集输入模型中进行训练,以得到能够检测出所述标记区域,并且能够判别每两个所述标记区域之间是否相同的检测分类模型;
将目标图片输入至所述检测分类模型中,以在检测出所述目标图片中的所述标记区域,并判别每两个所述标记区域之间是否相同后输出判别结果;
依据检测出的所述目标图片中的所述标记区域,以及所述判别结果,得到所述目标图片中的重复内容。
在一实施例中,所述对多张训练图片进行区域标记,以得到包含有由多个标记框圈定的标记区域的训练数据集;其中所述标记区域之间建立有关联关系,并且不同内容的标记区域之间的关联关系不同于相同内容的所述标记区域之间的关联关系步骤包括:
在多张所述训练图片上标记出能够覆盖所述训练图片的多个标记框,以形成带有标记框的一训练集;其中多个所述标记框在所述训练图片上间隔分布;
获取所述训练集中的所述标记区域,并在所述标记区域之间建立关联关系,其中
不同内容的标记区域之间的关联关系不同于相同内容的所述标记区域之间的关联关系。
在一实施例中,所述在多张训练图片上标记出能够覆盖训练图片的多个标记框,以形成带有标记框的训练集的步骤包括:
获取多张所述训练图片;
利用人工标记的方式将多个所述标记框间隔标记在所述训练图片上,得到所述训练集。
在一实施例中,所述获取所述训练集中的所述标记区域,并在所述标记区域之间建立关联关系的步骤包括:
利用人工确定所述训练集中的相同的标记区域;
建立标记区域之间的关联关系;
利用所述训练集中的所述标记区域和所述关联关系形成所述训练数据集。
在一实施例中,所述将训练数据集输入模型中进行训练,以得到能够检测出所述标记区域并且能够判别每两个所述标记区域之间是否相同的检测分类模型的步骤包括:
将所述训练集输入一模型中进行训练,以得到能够检测出所述标记区域的标记区域检测模型;
将所述训练数据集输入另一模型中进行训练,以得到能够判别所述标记区域是否相同的标记区域分类模型。
在一实施例中,所述将目标图片输入至检测分类模型中,以在检测出目标图片中的所述标记区域,并判别每两个所述标记区域之间是否相同后输出判别结果的步骤包括:
将所述目标图片输入所述标记区域检测模型中,以检测出所述目标图片中的所述标记区域;
将所述目标图片的所述标记区域输入所述标记区域分类模型中,以得到每两个所述标记区域之间是否的判定结果。
在一实施例中,所述一训练模型为Mask R-CNN模型、Faster R-CNN 模型、YOLO模型或SSD模型。
本公开的另一方面是提供了一种多张图片之间重复内容获取系统。所述多张图片之间重复区域获取系统用于实现如前所述的多张图片之间重复内容获取方法的步骤。所述多张图片之间重复内容获取系统包括:
数据获取模块,用于对多张训练图片进行区域标记,以得到包含有由多个标记框圈定的标记区域的训练数据集;其中所述标记区域之间建立有关联关系,并且不同内容的标记区域之间的关联关系不同于相同内容的所述标记区域之间的关联关系;
模型训练模块,用于将所述训练数据集输入模型中进行训练,以得到能够检测出所述标记区域并且能够判别每两个所述标记区域之间是否相同的检测分类模型;
图片识别模块,用于将目标图片输入至所述检测分类模型中,以在检测出所述目标图片中的所述标记区域,并判别每两个所述标记区域之间是否相同后输出判别结果;并且
依据检测出的所述目标图片中的所述标记区域,以及所述判别结果,得到所述目标图片中的相同标记区域。
本公开的再一方面还提供了一种多张图片之间重复内容获取设备。所述多张图片之间重复内容获取设备包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如本公开前一方面所述的多张图片之间重复内容获取方法的步骤。
本公开的最后一方面则是提供了一种计算机可读存储介质。所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述的多张图片之间重复内容获取方法的步骤。
在本公开提供的多张图片之间重复内容获取方法、系统、设备和存储介质中,通过构建包含多张训练图片的训练数据集,并利用训练数据集训练好一个能够检测和判别到多张训练图片中标记区域以及标记区域之间是否相同的模型,继而利用训练好的这个模型判别目标图片中被检测出来的的标记区域是否相同,最终依据检测出来的标记区域和判别结果快速找到目标图片之间的重复内容。
另一方面,本公开还可以利用标记框尽可能多地将重复内容标记出来,从而保证了最大范围的相同的内容可以被识别出来。
再一方面,本公开还利用人工标记的方式来制作训练数据集,从而大大提高了训练结果的精确度。
最后,本公开还分别利用不同的训练模型分别进行训练,进而通过两个训练好的模型组合使用,最终达到识别目标图片中的重复内容的目的。
附图说明
附图示例性地示出了实施例并且构成说明书地一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于示例的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
图1是本公开一实施例所展示的多张图片之间重复内容获取方法的步骤流程图;
图2是本公开一实施例提供的优选的多张图片之间重复内容获取方法的步骤流程图;
图3是本公开一实施例提供的标记框的方向设置示意图;
图4是本公开一实施例提供的优选的标记框的标记方法步骤流程图;
图5是本公开一实施例提供的优选的形成训练数据集的步骤流程图;
图6是本公开一实施例提供的多张图片之间重复内容获取系统的模块连接示意图;
图7是本公开一实施例提供的多张图片之间重复内容获取设备的结构示意图;
图8是本公开一实施例提供的计算机可读存储介质的结构示意图。
具体实施方式
通过上述说明可知,找到多张图像中存在的重复内容是人工智能领域非常重要的步骤。尤其对于零售领域来说,快速地找到多张图像中的重复内容有利于利用人工智能技术更快地获取更多地关于零售的信息。
在超市中,由于清晰度要求的限制,以及货架与货架之间的空间限制,导致相机通过一张图片来获取货架上所有的商品信息,几乎是无法实现的事情。不过,可以通过对同一货架拍摄多张图片的方式,来达到完全覆盖整个货架的区域。不同位置不同拍摄视觉得到的货架图片,难以满足特征点匹配的图像拼接方法的先决条件,即被拼接图片内容是同一个近似平面或图片投影点处于空间同一位置。传统的自动拼接方法难以满足要求。但是,可以利用人工将这些图片进行拼接对齐。在这个过程中,首先通过人工识别的方式将每张图片与其他图片存在的重复内容找出来,这样才有利于后续的拼接工作。事实上,货架上的货物每天都会更新,而且货架的数量也众多,因此最终拍摄货架产生的图片就非常多。显然,利用人工识别的方式来找出多张图片之间的重复内容,其需要投入的人力物力和时间都是巨大的。如何能够以更加高效的方式找到多张图片之间的重复内容,从而代替人工来识别重复内容,将有利于零售行业的快速发展。
为了解决现有技术存在的问题,提高获取多张图片之间重复内容的速度,降低人工投入成本和工作强度,发明人通过创造性的劳动提出了一种获取多张图片之间重复内容的方法、系统、设备和存储介质。值得说明的是,本公开提供的获取多张图片之间重复内容的方法,目的是方便找到多张图片之间存在的重复的内容或重复的区域,显然找到的重复内容后不仅仅可以应用到零售领域中的图片拼接,还可以应用到需要获得多张图片之间的重复内容而展开工作的其他方面。
以下结合附图和具体实施例对本公开提出的获取多张图片之间重复内容的方法、系统、设备及存储介质作进一步详细说明。根据权利要求书和下面说明,本公开的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本公开实施例的目的。
应当理解的内容是,说明书中的用辞仅用于描述特定的实施例,并不旨在限定本公开。说明书使用的所有术语(包括技术术语和科学术语)除非另有定义,均具有本领域技术人员通常理解的含义。为简明和/或清楚起见,公知的功能或结构不再详细说明。
关于多张图片之间重复内容获取方法的示例说明
请参阅图1,其展示了本公开一实施例中的多张图片之间重复内容获取方法的步骤流程图。
在这个实施例的步骤S001中,对多张训练图片进行区域标记,以得到包含有由多个标记框圈定的标记区域的训练数据集;其中所述标记区域之间建立有关联关系,并且不同内容的标记区域之间的关联关系不同于相同内容的所述标记区域之间的关联关系。
这里对训练图片进行标记,是为了让这些图片中的标记区域能够被需要训练的模型识别出来,以便于得到能够识别具有这些标记区域特征的目标图片上的相应区域。而标记区域之间的关联关系,则是为了“告知”被训练的模型两个什么样的标记区域之间是相同的或是不相同的。
另外,步骤S001中涉及的区域标记工作,以及使得标记区域之间的关联关系都是可以通过人工进行标记和设置来完成的。当然也可以采用本领域技术人员所理解的其他的合理方式来完成。
还有,有必要进一步说明本公开涉及的“相同标记区域”或“相同的标记区域”与“不相同标记区域”或“不相同的标记区域”。本公开涉及的相同的标记区域或不相同的标记区域,均指标记区域中的图像内容上的相同或不相同。另外,本领域技术人员容易理解,在计算机视觉识别领域,判断两张图片或者某两个区域中的图片内容是否相同可以通过一些网络模型来达到。而其中的“相同”却并不一定指两张图片(内容)或者某两个区域完全一致,而是两张图片或者某两个区域中的图片内容之间根据一定的判断规则来判断其相似程度达到了设定的阈值时,便可以认为两张图片或者某两个区域之间是“相同”的。这在机器识别和图像标记应用中是普遍存在的。
在步骤S002中,将所述训练数据集输入训练模型中进行训练,以得到能够检测出所述标记区域,并且能够判别每两个所述标记区域之间是否相同的检测分类模型。
对于步骤S002来说,通过将训练数据集输入至模型中进行训练,可以利用模型自身的特点自动的去寻找训练数据集中的特征(被标记框圈定的),并将这些特征归类,以便于模型在下一次遇到类似的特征时可以快速地做出判断。当然,具体的过程会随着网络模型的不同而出现一些差异,但是最终的目的是将检测模型训练好,以便于能够有效、精确识别出目标图片中相类似的特征。当然,为了检测训练好的模型的精确度,评估检测模型的识别效果,还可以制作一些检测数据集,利用检测数据集对训练好的模型进行检验。当出现不理想的状态时,可以更加有针对性地、及时地进行改进。
在步骤S003中,将目标图片输入至所述检测分类模型中,以在检测出所述目标图片中的所述标记区域,并判别每两个所述标记区域之间是否相同后输出判别结果。
在步骤S004中,依据检测出的所述目标图片中的所述标记区域,以及所述判别结果,得到所述目标图片中的重复内容。
可见,本公开通过上述实施例实施的多张图片之间重复内容获取方法,通过构建包含多张训练图片的训练数据集,并利用训练数据集训练好一个能够检测和判别到多张训练图片中标记区域以及标记区域之间是否相同的模型,继而利用训练好的这个模型判别目标图片中被检测出来的的标记区域是否相同,最终依据检测出来的标记区域和判别结果快速找到目标图片之间的重复内容。
在本公开的一实施例中,还说明了多张图片之间重复内容获取方法的优选实施方案。在图2中,展示了该实施例提供的优选的多张图片之间重复内容获取方法的步骤流程图。本实施例涉及的优选方案可以采用立式冷藏柜中货物摆放图片为例进行说明。现有条件下,安装在冷藏柜门上的摄像头很难在冷藏柜门的开合范围内拍摄到冷藏柜中的所有货物。因此为了拍摄到冷藏柜中的所有货物,会在冷藏柜门上的上下两处安装两个摄像头,通过两个摄像头的组合来实现拍摄到所有的货物。然而,两个摄像头必然会产生两张图片,还由于安装角度、拍摄时序等等客观存在的问题,会导致两张图片中出现一些相同的内容(重复内容)。如果需要拼接两张图片或者其他处理操作时,获取(或者说识别)两张图片中的重复内容便成为后续操作的前提。由于这里的两张图片是由上下两处的摄像头拍摄得到的。因此在货物的水平方向会出现重叠内容(这是因为冷藏柜的宽度较小,而高度较大。通常一个摄像头的拍摄区域能够覆盖冷藏柜的宽度范围,而难以覆盖冷藏柜的高度范围)。同理,如果两张图片是按照水平方向顺序拍摄的,那么两张图片之间的重复内容应该在货物的竖直方向出现。基于此,便可以利用这样的方向和重复内容的关系,来限定训练图片中的标记框的排列方式,以尽可能多地识别出两张图片之间的重复内容。如果出现其他地拍摄顺序时,标记框的排列方式也可以随之调整。总之,标记框的排列方式要使标记框能够尽可能地覆盖重复的内容。
在这个实施例的步骤S011中,在多张训练图片上标记出能够覆盖所述训练图片的多个标记框,以形成带有标记框的一训练集;其中多个所述标记框在所述训练图上间隔分布。如果图片时上述冷藏柜上采用上下两个摄像头拍摄的图片,那么按照通常的标记做法,如果利用长方形的标记框来标记上述训练图片时可以参照如图3中所示。长方形标记框的长度方向A 与第一方向B垂直。
在步骤S012中,获取所述训练集中的所述标记区域,并在所述标记区域之间建立关联关系,其中不同内容的标记区域之间的关联关系不同于相同内容的所述标记区域之间的关联关系。
通过步骤S012能够将训练图片中的标记区域之间建立关联关系,以便于告知后续需要训练的训练模型哪些标记区域是相同的,哪些标记区域是不同的。
在步骤S013中,将所述训练集输入一模型中进行训练,以得到能够检测出所述标记区域的标记区域检测模型。这里被用来训练的模型可以采用 Mask R-CNN模型、FasterR-CNN模型、YOLO模型或SSD模型。
在步骤S014中,将所述训练数据集输入另一模型中进行训练,以得到能够判别所述标记区域是否相同的标记区域分类模型。当然,这一步骤中被用来训练的模型可以采用孪生神经网络模型。
通过步骤S013和S014可知,利用单一的检测模型可以降低模型的训练难度,并且可以提高模型的识别经度。
在步骤S015中,将所述目标图片输入所述标记区域检测模型中,以检测出所述目标图片中的所述标记区域。
在步骤S016中,将所述目标图片的所述标记区域输入所述标记区域分类模型中,以得到每两个所述标记区域之间是否相同的判定结果。
基于上述步骤可知,多张图片之间的重复内容在经过标记、检测、识别(判定)等过程之后可以被快速精确得到。
在本公开的一实施例中,还进一步说明了关于“在训练图片上标记标记框”的优选方案。在图4中,展示了优选的标记框的标记方法步骤流程图。
在步骤S021中,获取多张所述训练图片。
在步骤S022中,利用人工标记的方式将多个所述标记框间隔标记在所述训练图片上,得到所述训练集。
通过上述方法进行标记的标记框,能够将标记框更好地覆盖到重复内容上,从而有利于提高模型识别的精确度。
在图5中,展示了本公开一实施例提供的优选的形成训练数据集的流程图。
在步骤S031中,利用人工确定所述训练集中的相同的标记区域。
在步骤S032中,建立标记区域之间的关联关系。
在步骤S033中,利用所述训练集和所述关联关系形成所述训练数据集。
基于上述的公开内容可知,在本公开提供的多张图片之间重复内容获取方法中,通过优选的方式构建包含多张训练图片的训练数据集,并利用训练数据集分别训练好两个能够检测和判别到多张训练图片中标记区域以及标记区域之间是否相同的模型,继而利用训练好的这两个模型分别检测标记区域和判别目标图片中被检测出来的的标记区域是否相同,最终依据检测出来的标记区域和判别结果快速找到目标图片之间的重复内容,大大提高了重复内容获取的速度和精度。
关于多张图片之间重复内容获取系统的示例说明
本公开的一实施例中还提供了一种多张图片之间重复内容获取系统。在图6中,展示了本公开一实施例提供的多张图片之间重复内容获取系统的模块连接示意图。该系统能够实现本公开中说明的多张图片之间重复内容获取方法。为了实现本公开说明的多张图片之间重复内容的获取方法,该系统包括:
数据获取模块501,用于对多张训练图片进行区域标记,以得到包含有由多个标记框圈定的标记区域的训练数据集;其中所述标记区域之间建立有关联关系,并且不同内容的标记区域之间的关联关系不同于相同内容的所述标记区域之间的关联关系;
模型训练模块502,用于将所述训练数据集输入模型中进行训练,以得到能够检测出所述标记区域并且能够判别每两个所述标记区域之间是否相同的检测分类模型;
图片识别模块503,用于将目标图片输入至所述检测分类模型中,以在检测出所述目标图片中的所述标记区域,并判别每两个所述标记区域之间是否相同后输出判别结果;并且依据检测出的所述目标图片中的所述标记区域,以及所述判别结果,得到所述目标图片中的相同标记区域。
关于多张图片之间重复内容获取设备的示例说明
本公开的一实施例中还提供了一种多张图片之间重复内容获取设备。所述多张图片之间重复内容获取设备包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现本公开中说明的多张图片之间重复内容获取方法的步骤。
本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
图7是本公开一实施例提供的多张图片之间重复内容获取设备的结构示意图。下面参照图7来详细描述根据本实施例中的实施方式实施的电子设备600。图7显示的电子设备600仅仅是一个示例,不应对本公开任何实施例的功能和使用范围带来任何限制。
如图7所示,电子设备600以通用计算设备的形式表现。电子设备600 的组建可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本实施例中上述重复内容获取方法部分中描述的根据本实施例中的实施步骤。例如,处理单元610可以执行如图1、图2、图 4和图5中所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取单元(RAM)和/或高速缓存存储单元,可以进一步包括只读存储单元 (ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序 /实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图像加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可以与一个或者多个使得用户与该电子设备600 交互的设备通信,和/或与使得该电子设备能与一个或多个其他计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN) 和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其他模块通信。应当明白,尽管图7中未示出,可以结合电子设备600使用其他硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
关于可读存储介质的示例说明
本公开的一个实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时能够实现上述公开中多张图片之间重复内容获取方法的步骤。尽管本实施例未详尽地列举其他具体的实施方式,但在一些可能的实施方式中,本公开说明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本公开中多张图片之间重复内容获取方法部分中描述的根据本公开各种实施例中实施方式的步骤。
如上说明之内容,该实施例提供的计算机可读存储介质中存储的计算机程序被执行时,通过提供的多张图片之间重复内容获取方法构建训练数据集,然后利用这些训练数据集训练出检测模型,最后利用这个检测模型来判断目标图片中是否存在重复内容。
图8是本公开一实施例提供的计算机可读存储介质的结构示意图。如图8所示,其中描述了根据本公开的实施方式中用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。当然,依据本实施例产生的程序产品不限于此,在本公开中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如C语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网 (LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上所述,在本公开提供的多张图片之间重复内容获取方法、系统、设备和存储介质中,在本公开提供的多张图片之间重复内容获取方法中,通过优选的方式构建包含多张训练图片的训练数据集,并利用训练数据集分别训练好两个能够检测和判别到多张训练图片中标记区域以及标记区域之间是否相同的模型,继而利用训练好的这两个模型分别检测标记区域和判别目标图片中中被检测出来的的标记区域是否相同,最终依据检测出来的标记区域和判别结果快速找到目标图片之间的重复内容,大大提高了重复内容获取的速度和精度。
另一方面,本公开还可以利用标记框尽可能多地将重复内容标记出来,从而保证了最大范围的相同的区域可以被识别出来。
再一方面,本公开还利用人工标记的方式来制作训练数据集,从而大大提高了训练结果的精确度。
最后,本公开还分别利用不同的训练模型分别进行训练,进而通过两个训练好的模型组合使用,最终达到识别目标图片中的重复内容的目的。
上述描述仅是对本公开较佳实施例的描述,并非对本公开范围的任何限定,本公开领域的普通技术人员根据上述揭示内容做的任何变更、修饰,均属于权利要求书的保护范围。
Claims (10)
1.一种多张图片之间重复内容获取方法,其特征在于,包括如下步骤:
对多张训练图片进行区域标记,以得到包含有由多个标记框圈定的标记区域的训练数据集;其中所述标记区域之间建立有关联关系,并且不同的标记区域之间的关联关系不同于相同的所述标记区域之间的关联关系;
将所述训练数据集输入模型中进行训练,以得到能够检测出所述标记区域,并且能够判别每两个所述标记区域之间是否相同的检测分类模型;
将目标图片输入至所述检测分类模型中,以在检测出所述目标图片中的所述标记区域,并判别每两个所述标记区域之间是否相同后输出判别结果;
依据检测出的所述目标图片中的所述标记区域,以及所述判别结果,得到所述目标图片中的重复内容。
2.如权利要求1所述的多张图片之间重复内容获取方法,其特征在于,所述对多张训练图片进行区域标记,以得到包含有由多个标记框圈定的标记区域的训练数据集;其中所述标记区域之间建立有关联关系,并且不同内容的标记区域之间的关联关系不同于相同内容的所述标记区域之间的关联关系步骤包括:
在多张所述训练图片上标记出能够覆盖所述训练图片的多个标记框,以形成带有标记框的一训练集;其中多个所述标记框在所述训练图片上间隔分布;
获取所述训练集中的所述标记区域,并在所述标记区域之间建立关联关系,其中
不同内容的标记区域之间的关联关系不同于相同内容的所述标记区域之间的关联关系。
3.如权利要求2所述多张图片之间重复内容获取方法,其特征在于,所述在多张训练图片上标记出能够覆盖训练图片的多个标记框,以形成带有标记框的训练集的步骤包括:
获取多张所述训练图片;
利用人工标记的方式将多个所述标记框间隔标记在所述训练图片上,得到所述训练集。
4.如权利要求2所述的多张图片之间重复内容获取方法,其特征在于,所述获取所述训练集中的所述标记区域,并在所述标记区域之间建立关联关系的步骤包括:
利用人工确定所述训练集中的相同的标记区域;
建立标记区域之间的关联关系;
利用所述训练集中的所述标记区域和所述关联关系形成所述训练数据集。
5.如权利要求2所述的多张图片之间重复内容获取方法,其特征在于,所述将训练数据集输入模型中进行训练,以得到能够检测出所述标记区域并且能够判别每两个所述标记区域之间是否相同的检测分类模型的步骤包括:
将所述训练集输入一模型中进行训练,以得到能够检测出所述标记区域的标记区域检测模型;
将所述训练数据集输入另一模型中进行训练,以得到能够判别所述标记区域是否相同的标记区域分类模型。
6.如权利要求5所述的多张图片之间重复内容获取方法,其特征在于,所述将目标图片输入至检测分类模型中,以在检测出目标图片中的所述标记区域,并判别每两个所述标记区域之间是否相同后输出判别结果的步骤包括:
将所述目标图片输入所述标记区域检测模型中,以检测出所述目标图片中的所述标记区域;
将所述目标图片的所述标记区域输入所述标记区域分类模型中,以得到每两个所述标记区域之间是否的判定结果。
7.如权利要求2所述的多张图片之间重复内容获取方法,其特征在于,所述一训练模型为Mask R-CNN模型、Faster R-CNN模型、YOLO模型或SSD模型。
8.一种多张图片之间重复内容获取系统,用于实现权利要求1至7中任一项所述的获取多张图片之间重复区域的方法的步骤,其特征在于,所述系统包括:
数据获取模块,用于对多张训练图片进行区域标记,以得到包含有由多个标记框圈定的标记区域的训练数据集;其中所述标记区域之间建立有关联关系,并且不同内容的标记区域之间的关联关系不同于相同内容的所述标记区域之间的关联关系;
模型训练模块,用于将所述训练数据集输入模型中进行训练,以得到能够检测出所述标记区域并且能够判别每两个所述标记区域之间是否相同的检测分类模型;
图片识别模块,用于将目标图片输入至所述检测分类模型中,以在检测出所述目标图片中的所述标记区域,并判别每两个所述标记区域之间是否相同后输出判别结果;并且
依据检测出的所述目标图片中的所述标记区域,以及所述判别结果,得到所述目标图片中的相同标记区域。
9.一种多张图片之间重复内容获取设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7中任一项所述的多张图片之间重复内容获取方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的多张图片之间重复内容获取方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010072559.0A CN111310606A (zh) | 2020-01-21 | 2020-01-21 | 多张图片之间重复内容获取方法、系统、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010072559.0A CN111310606A (zh) | 2020-01-21 | 2020-01-21 | 多张图片之间重复内容获取方法、系统、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111310606A true CN111310606A (zh) | 2020-06-19 |
Family
ID=71144915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010072559.0A Pending CN111310606A (zh) | 2020-01-21 | 2020-01-21 | 多张图片之间重复内容获取方法、系统、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111310606A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111784752A (zh) * | 2020-06-23 | 2020-10-16 | 哈尔滨工程大学 | 一种固定式多平台被动目标联合探测方法 |
CN112861713A (zh) * | 2021-02-06 | 2021-05-28 | 贵州博汇云技术开发有限公司 | 大型图纸多张局部放大对比分析系统 |
CN113781371A (zh) * | 2021-08-23 | 2021-12-10 | 南京掌控网络科技有限公司 | 一种货架图片识别结果去重及拼接的方法和设备 |
-
2020
- 2020-01-21 CN CN202010072559.0A patent/CN111310606A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111784752A (zh) * | 2020-06-23 | 2020-10-16 | 哈尔滨工程大学 | 一种固定式多平台被动目标联合探测方法 |
CN111784752B (zh) * | 2020-06-23 | 2023-07-21 | 哈尔滨工程大学 | 一种固定式多平台被动目标联合探测方法 |
CN112861713A (zh) * | 2021-02-06 | 2021-05-28 | 贵州博汇云技术开发有限公司 | 大型图纸多张局部放大对比分析系统 |
CN113781371A (zh) * | 2021-08-23 | 2021-12-10 | 南京掌控网络科技有限公司 | 一种货架图片识别结果去重及拼接的方法和设备 |
CN113781371B (zh) * | 2021-08-23 | 2024-01-30 | 南京掌控网络科技有限公司 | 一种货架图片识别结果去重及拼接的方法和设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10878372B2 (en) | Method, system and device for association of commodities and price tags | |
CN108647553B (zh) | 模型训练用图像的快速扩充方法、系统、设备及存储介质 | |
CN110706509B (zh) | 车位及其方向角度检测方法、装置、设备及介质 | |
US10691982B2 (en) | Method and apparatus for vehicle damage identification | |
CN111310606A (zh) | 多张图片之间重复内容获取方法、系统、设备和介质 | |
US11748399B2 (en) | System and method for training a damage identification model | |
US11676257B2 (en) | Method and device for detecting defect of meal box, server, and storage medium | |
TWI716012B (zh) | 樣本標註方法、裝置、儲存媒體和計算設備、損傷類別的識別方法及裝置 | |
JP2018163654A (ja) | 電気通信インベントリ管理のためのシステムおよび方法 | |
CN110264444B (zh) | 基于弱分割的损伤检测方法及装置 | |
CN111814850A (zh) | 缺陷检测模型训练方法、缺陷检测方法及相关装置 | |
CN111881894A (zh) | 采集货柜商品售卖信息的方法、系统、设备和存储介质 | |
CN111310826B (zh) | 样本集的标注异常检测方法、装置及电子设备 | |
CN112613569B (zh) | 图像识别方法、图像分类模型的训练方法及装置 | |
CN111797733A (zh) | 一种基于图像的行为识别方法、装置、设备和存储介质 | |
CN111178357A (zh) | 车牌识别方法、系统、设备和存储介质 | |
US20220114396A1 (en) | Methods, apparatuses, electronic devices and storage media for controlling image acquisition | |
CN112001219A (zh) | 一种多角度多人脸识别考勤方法及系统 | |
CN113971795A (zh) | 基于自驾车视觉感测的违规巡检系统及其方法 | |
CN115797736A (zh) | 目标检测模型的训练和目标检测方法、装置、设备和介质 | |
CN115884480A (zh) | 基于图像处理的多光轴云台灯控制方法、设备及存储介质 | |
CN111091104A (zh) | 一种目标物体的防护检测方法、装置、设备及存储介质 | |
US20220092756A1 (en) | Feature detection based on neural networks | |
EP3761228A1 (en) | Computer-implemented method | |
CN110728229B (zh) | 图像处理方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |