CN117372731A - 一种图像检测的方法、相关装置、设备以及存储介质 - Google Patents
一种图像检测的方法、相关装置、设备以及存储介质 Download PDFInfo
- Publication number
- CN117372731A CN117372731A CN202311438209.1A CN202311438209A CN117372731A CN 117372731 A CN117372731 A CN 117372731A CN 202311438209 A CN202311438209 A CN 202311438209A CN 117372731 A CN117372731 A CN 117372731A
- Authority
- CN
- China
- Prior art keywords
- image
- matched
- target
- sub
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 claims abstract description 119
- 238000005520 cutting process Methods 0.000 claims abstract description 45
- 238000012545 processing Methods 0.000 claims description 52
- 238000010586 diagram Methods 0.000 claims description 44
- 230000008447 perception Effects 0.000 claims description 36
- 239000011159 matrix material Substances 0.000 claims description 35
- 238000006243 chemical reaction Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 10
- 238000005516 engineering process Methods 0.000 abstract description 8
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 238000004422 calculation algorithm Methods 0.000 description 55
- 230000008569 process Effects 0.000 description 19
- 238000013461 design Methods 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 12
- 238000013527 convolutional neural network Methods 0.000 description 6
- 230000007547 defect Effects 0.000 description 5
- 210000003128 head Anatomy 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 238000010008 shearing Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000000887 face Anatomy 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/32—Normalisation of the pattern dimensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/467—Encoded features or binary features, e.g. local binary patterns [LBP]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种基于人工智能技术实现的图像检测方法,具体涉及计算机视觉技术。本申请方法包括:获取原始图像和目标图像;根据原始图像的版式,对目标图像进行尺寸调整,得到待匹配图像;基于待匹配图像,通过滑动窗口和预设滑动步长,对原始图像进行遍历处理,得到K个子图像;对待匹配图像和K个子图像进行哈希编码,得到至少一个相似度列表,每个相似度列表包括K个相似距离;根据至少一个相似度列表,确定目标最小距离;在目标最小距离小于或等于最小距离阈值的情况下,从原始图像中检测出与目标图像匹配成功的图像裁剪区域。本申请能够有效对抗图像拉伸和变型等干扰,从而提升图像匹配的准确率,进而能够准确地识别出图像裁剪位置。
Description
技术领域
本申请涉及计算机视觉技术领域,尤其涉及一种图像检测的方法、相关装置、设备以及存储介质。
背景技术
图像比例是指图像宽度与高度的比例,常见的图像比例有16:9、4:3、3:4等。若图像宽度与高度的比值大于1,则为横版图像。若图像宽度与高度的比值小于1,则为竖版图像。用户可通过剪裁的方式从横版图像中剪裁出竖版图像,并将竖版图像作为缩略图。在裁剪过程中,若造成关键信息残缺的情况,则会降低图像美感,影响信息传递效率。
目前,可采用模板匹配(matchTemplate)方法将竖版图像与横版图像进行匹配,如果匹配成功,则进一步确定竖版图像在横版图像中的位置,以此判断是否存在关键信息残缺的情况。在相关技术中,将模板图像在目标图像上滑动进行逐一对比,通过统计的基本方法(例如,方差校验、相关性校验等)进行匹配,以此寻找图像匹配结果。
发明人发现目前的方案中至少存在如下问题,目前所采用的模板匹配方法是在大图中使用滑动窗口匹配小图,因此,只能从大图中匹配完全一致的子图。然而,用户在制作竖版图像的过程中,通常会伴随着对竖版图像拉伸和变型等操作,因此,使用模板匹配方法会导致匹配结果误差较大,从而难以寻找竖版图像在横版图像中的位置。
发明内容
本申请实施例提供了一种图像检测的方法、相关装置、设备以及存储介质,由于采用图像哈希算法提取到的编码特征不受图像尺寸变化影响,因此,能够有效对抗图像拉伸和变型等干扰,从而提升图像匹配的准确率,进而能够准确地识别出图像裁剪位置。
有鉴于此,本申请一方面提供一种图像检测的方法,包括:
获取原始图像和目标图像,其中,原始图像与目标图像具有不同的版式;
根据原始图像的版式,对目标图像进行尺寸调整,得到待匹配图像,其中,待匹配图像与原始图像具有相等的宽度或高度;
基于待匹配图像,通过滑动窗口和预设滑动步长,对原始图像进行遍历处理,得到K个子图像,其中,滑动窗口的尺寸与待匹配图像的尺寸相同,每个子图像与待匹配图像具有相同尺寸,K为大于1的整数;
对待匹配图像和K个子图像进行哈希编码,得到至少一个相似度列表,其中,每个相似度列表包括K个相似距离,每个相似距离表示一个子图像与待匹配图像之间经过哈希编码后的相似程度,相似距离越小表示相似程度越高;
根据至少一个相似度列表,确定目标最小距离;
在目标最小距离小于或等于最小距离阈值的情况下,从原始图像中检测出与目标图像匹配成功的图像裁剪区域。
本申请另一方面提供一种图像检测装置,包括:
获取模块,用于获取原始图像和目标图像,其中,原始图像与目标图像具有不同的版式;
调整模块,用于根据原始图像的版式,对目标图像进行尺寸调整,得到待匹配图像,其中,待匹配图像与原始图像具有相等的宽度或高度;
处理模块,用于基于待匹配图像,通过滑动窗口和预设滑动步长,对原始图像进行遍历处理,得到K个子图像,其中,滑动窗口的尺寸与待匹配图像的尺寸相同,每个子图像与待匹配图像具有相同尺寸,K为大于1的整数;
编码模块,用于对待匹配图像和K个子图像进行哈希编码,得到至少一个相似度列表,其中,每个相似度列表包括K个相似距离,每个相似距离表示一个子图像与待匹配图像之间经过哈希编码后的相似程度,相似距离越小表示相似程度越高;
确定模块,用于根据至少一个相似度列表,确定目标最小距离;
检测模块,用于在目标最小距离小于或等于最小距离阈值的情况下,从原始图像中检测出与目标图像匹配成功的图像裁剪区域。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,原始图像的版式为横版版式,目标图像的版式为竖版版式,其中,横版版式表示图像宽度与图像高度之间比值大于1的版式,竖版版式表示图像宽度与图像高度之间比值小于1的版式;
调整模块,具体用于根据横版版式,对目标图像的尺寸进行等比例缩放,得到待匹配图像,其中,待匹配图像与原始图像具有相等的高度;
处理模块,具体用于基于待匹配图像的尺寸生成滑动窗口;
以由左至右或由右至左的顺序,通过滑动窗口和预设滑动步长,对原始图像进行遍历处理,得到K个子图像。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
检测模块,具体用于在以由左至右的顺序对原始图像进行遍历处理的情况下,获取目标最小距离所对应的左侧剪裁位置;
根据左侧剪裁位置和待匹配图像的宽度,确定右侧剪裁位置;
根据左侧剪裁位置和右侧剪裁位置,从原始图像中检测出与目标图像匹配成功的图像裁剪区域;
或者,
检测模块,具体用于在以由右至左的顺序对原始图像进行遍历处理的情况下,获取目标最小距离所对应的右侧剪裁位置;
根据右侧剪裁位置和待匹配图像的宽度,确定左侧剪裁位置;
根据右侧剪裁位置和左侧剪裁位置,从原始图像中检测出与目标图像匹配成功的图像裁剪区域。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,原始图像的版式为横版版式,目标图像的版式为竖版版式,其中,横版版式表示图像宽度与图像高度之间比值大于1的版式,竖版版式表示图像宽度与图像高度之间比值小于1的版式;
调整模块,具体用于根据竖版版式,对目标图像的尺寸进行等比例缩放,得到待匹配图像,其中,待匹配图像与原始图像具有相等的宽度;
处理模块,具体用于基于待匹配图像的尺寸生成滑动窗口;
以由上至下或由下至上的顺序,通过滑动窗口和预设滑动步长,对原始图像进行遍历处理,得到K个子图像。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
检测模块,具体用于在以由上至下的顺序对原始图像进行遍历处理的情况下,获取目标最小距离所对应的上方剪裁位置;
根据上方剪裁位置和待匹配图像的高度,确定下方剪裁位置;
根据上方剪裁位置和下方剪裁位置,从原始图像中检测出与目标图像匹配成功的图像裁剪区域;
或者,
检测模块,具体用于在以由下至上的顺序对原始图像进行遍历处理的情况下,获取目标最小距离所对应的下方剪裁位置;
根据下方剪裁位置和待匹配图像的高度,确定上方剪裁位置;
根据下方剪裁位置和上方剪裁位置,从原始图像中检测出与目标图像匹配成功的图像裁剪区域。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
编码模块,具体用于对待匹配图像和K个子图像进行感知哈希编码,得到图像感知相似列表,其中,图像感知相似列表属于至少一个相似度列表;
或者,
对待匹配图像和K个子图像进行均值哈希编码,得到图像均值相似列表,其中,图像均值相似列表属于至少一个相似度列表;
或者,
对待匹配图像和K个子图像进行差异哈希编码,得到图像差异相似列表,其中,图像差异相似列表属于至少一个相似度列表。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
确定模块,具体用于从图像感知相似列表所包括的K个相似距离中确定目标最小距离,其中,K个相似距离为K个感知相似距离,目标最小距离为K个感知相似距离中的最小感知相似距离;
或者,
从图像均值相似列表所包括的K个相似距离中确定目标最小距离,其中,K个相似距离为K个均值相似距离,目标最小距离为K个均值相似距离中的最小均值相似距离;
或者,
从图像差异相似列表所包括的K个相似距离中确定目标最小距离,其中,K个相似距离为K个差异相似距离,目标最小距离为K个差异相似距离中的最小差异相似距离。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,相似距离为感知相似距离;
编码模块,具体用于对待匹配图像和K个子图像进行尺寸缩放处理,得到缩放后的待匹配图像和缩放后的K个子图像;
对缩放后的待匹配图像和缩放后的K个子图像进行灰度转换处理,得到待匹配灰度图和K个灰度子图像;
对待匹配灰度图和K个灰度子图像进行离散余弦变换处理,得到待匹配灰度图所对应的数据矩阵和K个灰度子图像中每个灰度子图像的数据矩阵;
根据待匹配灰度图所对应的数据矩阵和每个灰度子图像的数据矩阵,确定待匹配灰度图所对应的平均值和每个灰度子图像的平均值;
根据待匹配灰度图所对应的平均值和每个灰度子图像的平均值,生成待匹配灰度图的感知哈希编码结果和每个灰度子图像的感知哈希编码结果;
计算待匹配灰度图的感知哈希编码结果与每个灰度子图像的感知哈希编码结果之间的汉明距离,得到图像感知相似列表,其中,图像感知相似列表包括K个感知相似距离。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,相似距离为均值相似距离;
编码模块,具体用于对待匹配图像和K个子图像进行尺寸缩放处理,得到缩放后的待匹配图像和缩放后的K个子图像;
对缩放后的待匹配图像和缩放后的K个子图像进行灰度转换处理,得到待匹配灰度图和K个灰度子图像;
对待匹配灰度图和K个灰度子图像进行像素点均值计算,得到待匹配灰度图所对应的像素平均值和K个灰度子图像中每个灰度子图像的像素平均值;
根据待匹配灰度图所对应的像素平均值和每个灰度子图像的像素平均值,生成待匹配灰度图的均值哈希编码结果和每个灰度子图像的均值哈希编码结果;
计算待匹配灰度图的均值哈希编码结果与每个灰度子图像的均值哈希编码结果之间的汉明距离,得到图像均值相似列表,其中,图像均值相似列表包括K个均值相似距离。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,相似距离为差异相似距离;
编码模块,具体用于对待匹配图像和K个子图像进行尺寸缩放处理,得到缩放后的待匹配图像和缩放后的K个子图像;
对缩放后的待匹配图像和缩放后的K个子图像进行灰度转换处理,得到待匹配灰度图和K个灰度子图像;
对待匹配灰度图的每行相邻像素点进行像素值比对,得到待匹配灰度图的差异哈希编码结果;
对K个灰度子图像中的每个灰度子图像的每行相邻像素点进行像素值比对,得到每个灰度子图像的差异哈希编码结果;
计算待匹配灰度图的差异哈希编码结果与每个灰度子图像的差异哈希编码结果之间的汉明距离,得到图像差异相似列表,其中,图像差异相似列表包括K个差异相似距离。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
编码模块,具体用于对待匹配图像和K个子图像进行感知哈希编码,得到图像感知相似列表,其中,图像感知相似列表属于至少一个相似度列表;
对待匹配图像和K个子图像进行均值哈希编码,得到图像均值相似列表,其中,图像均值相似列表属于至少一个相似度列表;
确定模块,具体用于根据图像感知相似列表和图像均值相似列表,生成第一综合列表,其中,第一综合列表包括K个第一综合距离,每个第一综合距离为根据对应的感知相似距离和均值相似距离计算得到的;
从第一综合列表所包括的K个第一综合距离中确定目标最小距离,其中,目标最小距离为K个第一综合距离中最小的第一综合距离。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
编码模块,具体用于对待匹配图像和K个子图像进行感知哈希编码,得到图像感知相似列表,其中,图像感知相似列表属于至少一个相似度列表;
对待匹配图像和K个子图像进行差异哈希编码,得到图像差异相似列表,其中,图像均值相似列表属于至少一个相似度列表;
确定模块,具体用于根据图像感知相似列表和图像差异相似列表,生成第二综合列表,其中,第二综合列表包括K个第二综合距离,每个第二综合距离为根据对应的感知相似距离和差异相似距离计算得到的;
从第二综合列表所包括的K个第二综合距离中确定目标最小距离,其中,目标最小距离为K个第二综合距离中最小的第二综合距离。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
编码模块,具体用于对待匹配图像和K个子图像进行均值哈希编码,得到图像均值相似列表,其中,图像均值相似列表属于至少一个相似度列表;
对待匹配图像和K个子图像进行差异哈希编码,得到图像差异相似列表,其中,图像均值相似列表属于至少一个相似度列表;
确定模块,具体用于根据图像均值相似列表和图像差异相似列表,生成第三综合列表,其中,第三综合列表包括K个第三综合距离,每个第三综合距离为根据对应的均值相似距离和差异相似距离计算得到的;
从第三综合列表所包括的K个第三综合距离中确定目标最小距离,其中,目标最小距离为K个第三综合距离中最小的第三综合距离。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
编码模块,具体用于对待匹配图像和K个子图像进行感知哈希编码,得到图像感知相似列表,其中,图像感知相似列表属于至少一个相似度列表;
对待匹配图像和K个子图像进行均值哈希编码,得到图像均值相似列表,其中,图像均值相似列表属于至少一个相似度列表;
对待匹配图像和K个子图像进行差异哈希编码,得到图像差异相似列表,其中,图像均值相似列表属于至少一个相似度列表;
确定模块,具体用于根据图像感知相似列表、图像均值相似列表和图像差异相似列表,生成第四综合列表,其中,第四综合列表包括K个第四综合距离,每个第四综合距离为根据对应的感知相似距离、均值相似距离和差异相似距离计算得到的;
从第四综合列表所包括的K个第四综合距离中确定目标最小距离,其中,目标最小距离为K个第四综合距离中最小的第四综合距离。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
获取模块,还用于获取原始图像和目标图像之后,获取图像标准尺寸,其中,图像标准尺寸包括标准宽度和标准高度;
调整模块,还用于根据图像标准尺寸,对目标图像的尺寸进行等比例缩放,得到目标缩放图像,其中,目标缩放图像的宽度与标准宽度相等,或,目标缩放图像的高度与标准高度相等;
处理模块,还用于在目标缩放图像满足图像拉伸条件的情况下,执行根据原始图像的版式,对目标图像进行尺寸调整,得到待匹配图像的步骤;
确定模块,还用于在目标缩放图像未满足图像拉伸条件的情况下,确定目标图像与原始图像匹配失败。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,目标缩放图像的宽度与标准宽度相等;
确定模块,还用于根据图像标准尺寸,对目标图像的尺寸进行等比例缩放,得到目标缩放图像之后,根据目标缩放图像的高度和标准高度,确定目标缩放图像的高度变化幅度;
确定模块,还用于若目标缩放图像的高度变化幅度小于或等于幅度阈值,则确定目标缩放图像满足图像拉伸条件;
确定模块,还用于若目标缩放图像的高度变化幅度大于幅度阈值,则确定目标缩放图像未满足图像拉伸条件。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,目标缩放图像的高度与标准高度相等;
确定模块,还用于根据图像标准尺寸,对目标图像的尺寸进行等比例缩放,得到目标缩放图像之后,根据目标缩放图像的宽度和标准宽度,确定目标缩放图像的宽度变化幅度;
确定模块,还用于若目标缩放图像的宽度变化幅度小于或等于幅度阈值,则确定目标缩放图像满足图像拉伸条件;
确定模块,还用于若目标缩放图像的宽度变化幅度大于幅度阈值,则确定目标缩放图像未满足图像拉伸条件。
本申请另一方面提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述各方面的方法。
本申请的另一方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方面的方法。
本申请的另一个方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方面的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例中,提供了一种图像检测的方法,首先,获取原始图像和目标图像。然后,根据原始图像的版式,对目标图像进行尺寸调整,得到待匹配图像。基于待匹配图像,通过滑动窗口和预设滑动步长,对原始图像进行遍历处理,得到K个子图像。接下来,对待匹配图像和K个子图像进行哈希编码,得到至少一个相似度列表,并根据至少一个相似度列表,确定目标最小距离。基于此,在目标最小距离小于或等于最小距离阈值的情况下,从原始图像中检测出与目标图像匹配成功的图像裁剪区域。通过上述方式,对待匹配图像以及K个子图像分别进行哈希编码,以此作为图像相似度匹配的依据,并在匹配成功的情况下,可进一步确定图像裁剪区域。由于采用图像哈希算法提取到的编码特征不受图像尺寸变化影响,因此,能够有效对抗图像拉伸和变型等干扰,从而提升图像匹配的准确率,进而能够准确地识别出图像裁剪位置。
附图说明
图1为本申请实施例中基于图像检测方法生成内容摘要的一个示意图;
图2为本申请实施例中基于图像检测方法生成头像的一个示意图;
图3为本申请实施例中基于图像检测方法生成待美化图像的一个示意图;
图4为本申请实施例中图像检测方法的一个实施环境示意图;
图5为本申请实施例中图像检测方法的一个流程示意图;
图6为本申请实施例中图像裁剪区域的检测结果的一个示意图;
图7为本申请实施例中裁剪位置检测效果的一个示意图;
图8为本申请实施例中对原始图像进行遍历处理的一个示意图;
图9为本申请实施例中基于由左至右的遍历顺序检测图像裁剪区域的一个示意图;
图10为本申请实施例中基于由右至左的遍历顺序检测图像裁剪区域的一个示意图;
图11为本申请实施例中对原始图像进行遍历处理的另一个示意图;
图12为本申请实施例中基于由上至下的遍历顺序检测图像裁剪区域的一个示意图;
图13为本申请实施例中基于由下至上的遍历顺序检测图像裁剪区域的一个示意图;
图14为本申请实施例中图像检测装置的一个示意图;
图15为本申请实施例中计算机设备的一个结构示意图。
具体实施方式
本申请实施例提供了一种图像检测的方法、相关装置、设备以及存储介质,由于采用图像哈希算法提取到的编码特征不受图像尺寸变化影响,因此,能够有效对抗图像拉伸和变型等干扰,从而提升图像匹配的准确率,进而能够准确地识别出图像裁剪位置。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应”于以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图像裁剪是指将图像的一部分或多个部分从原图中移除,留下需要的部分。这个过程通常使用专业的图像编辑软件完成,可以帮助用户获得所需的特定图像。通过图像裁剪,用户可以从图像中选取自己想要的元素,从而更好地满足特定需求。此外,图像裁剪还可以减少不必要的杂质和背景噪声,提高图像的清晰度和品质。在裁剪过程中,如果造成人脸残缺或者文字残缺等情况,会降低图像美感,影响对于用户的信息传递效率和准确率。因此,为了能够提升图像的剪裁质量,针对用户上传的原图和剪裁图像,需要审核剪裁图像是否由原图剪裁得到,并进一步检测出剪裁位置,以此作为后续元素(例如,人脸、文字等)完整性检测的基础。
然而,在实际应用中,用户还会根据需求对剪裁图像进行拉伸变形等操作,这就导致采用模板匹配的方法难以准确地匹配对剪裁图像与原图进行匹配。如果采用人工审核的方式,则会增加人工审核成本。
基于此,本申请提供了一种基于图像哈希编码的方法对剪裁图像与原图进行匹配。由于图像哈希编码在计算过程中不受图像的拉伸变形影响,因此,能够有效对抗拉伸变形等噪声干扰,从而提升图像匹配的准确率。针对本申请提供的图像检测方法,在应用时包括如下场景中的至少一种。
适用场景一:生成内容摘要;
在音视频平台展示视频或者专辑时,通常会使用封面图或者缩略图作为内容摘要呈现给观众。内容创作者在创作这些图像时,常会通过裁剪的方式由横版图像获得竖版图像,并将竖版图像作为缩略图或者专辑封面图等使用。
示例性地,为了便于理解,请参阅图1,图1为本申请实施例中基于图像检测方法生成内容摘要的一个示意图,如图1中的(A)图所示,A1用于指示内容创作者选择的横版图像。A2用于指示内容创作者选择的竖版图像。在图像选择完成之后,点击A3所指示的上传控件。为了提升平台视频创作质量,针对内容创作者上传的横版图像和竖版图像,可采用本申请提供的方法检测竖版图像是否由横版图像剪裁得到的,若是,还需要进一步检测出剪裁位置。再基于剪裁位置判断剪裁出的图像是否完整。
假设检测出A2所指示的竖版图像是完整的,则生成相应的封面图像。如图1中的(B)图所示,其中,A4用于指示音乐平台上展示的封面图像。
适用场景二:生成头像;
在社交平台展示用户头像时,可以从大图中剪裁出一个正方向区域作为头像。示例性地,为了便于理解,请参阅图2,图2为本申请实施例中基于图像检测方法生成头像的一个示意图,如图2中的(A)图所示,B1用于指示用户选择的横版图像。B2用于指示用户选择的头像。在图像选择完成之后,点击B3所指示的上传控件。针对用户上传的横版图像以及图像,可采用本申请提供的方法检测头像是否由横版图像剪裁得到的,若是,还需要进一步检测出剪裁位置。再基于剪裁位置判断剪裁出的图像是否完整。
假设检测出B2所指示的头像是完整的,则将作为用户在社交平台上展示的头像。如图2中的(B)图所示,其中,A4用于指示社交平台上展示的头像。
适用场景三:美化图像;
用户可以通过影像处理应用对图像进行美化。影像处理应用支持对不同版式的图像进行处理,因此,在图像处理之前,用户还可以剪裁出待美化图像。
示例性地,为了便于理解,请参阅图3,图3为本申请实施例中基于图像检测方法生成待美化图像的一个示意图,如图3中的(A)图所示,C1用于指示用户选择的竖版图像。C2用于指示用户选择的横版图像。在图像选择完成之后,点击C3所指示的上传控件。针对用户上传的竖版图像以及横版图像,可采用本申请提供的方法检测横版图像是否由竖版图像剪裁得到的,若是,还需要进一步检测出剪裁位置。再基于剪裁位置判断剪裁出的图像是否完整。
假设检测出C2所指示的横版图像是完整的,则将作为用户在影像处理应用中编辑的图像。如图3中的(B)图所示,其中,C4用于指示待美化的横版图像。
需要说明的是,上述应用场景仅为示例,本实施例提供的图像检测方法还可以应用于其他场景中,此处不做限定。
可以理解的是,计算机视觉(computer vision,CV)技术的核心手段包含但不仅限于特征提取、目标检测、图像分割、三维重建等。在本申请中,通过对剪裁图像进行目标检测,能够判定其关键内容的完整性。示例性地,如果确定剪裁图像为原图的一部分,则根据剪裁图像在原图中的位置标注出边界框(bounding box,bbox)的位置信息,即,bbox用于圈出剪裁图像在原图中的区域。其中,bbox位置信息可表示为(x,y,w,h),其中,x和y表示剪裁图像的左上角坐标,w表示剪裁图像的宽度,h表示剪裁图像的高度。基于此,将原图以及bbox位置信息作为目标检测模型的输入,通过目标检测模型输出图像完整性概率。如果图像完整性概率大于阈值(例如,0.9),则表示剪裁图像满足完整性要求,可以进行后续处理,反之,则会提示用户可重新进行图像裁剪。
需要说明的是,基于CV技术实现的目标检测模型包含但不仅限于区域卷积神经网络(region convolutional neural networks,R-CNN)、快速区域卷积神经网络(fastregion convolutional neural networks,Fast R-CNN)、你只看一次(you only lookonce,YOLO)网络以及单阶段目标检测器(single shot multibox detector,SSD)等。
可以理解的是,CV是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,CV研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。大模型技术为CV技术发展带来重要变革,摆动转换器(swin-transformer),视觉转换器(visualtransformer,ViT),视觉混合专家模型(vision mixture of experts,V-MOE),掩码自编码器(masked autoencoders,MAE)等视觉领域的预训练模型经过微调(fine tune)可以快速、广泛适用于下游具体任务。CV技术通常包括图像处理、图像识别、图像语义理解、图像检索、光学字符识别(optical character recognition,OCR)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、三维技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
本申请提供的方法可应用于图4所示的实施环境,该实施环境包括终端110和服务器120,且,终端110和服务器120之间可以通过通信网络130进行通信。其中,通信网络130使用标准通信技术和/或协议,通常为因特网,但也可以是任何网络,包括但不限于蓝牙、局域网(local area network,LAN)、城域网(metropolitan area network,MAN)、广域网(widearea network,WAN)、移动、专用网络或者虚拟专用网络的任何组合)。在一些实施例中,可使用定制或专用数据通信技术取代或者补充上述数据通信技术。
本申请涉及的终端110包括但不限于手机、平板电脑、笔记本电脑、桌上型电脑、智能语音交互设备、虚拟现实设备、智能家电、车载终端、飞行器等。其中,客户端部署于终端110上,客户端可以通过浏览器的形式运行于终端110上,也可以通过独立的应用程序(application,APP)或者小程序等形式运行于终端110上等。本申请涉及的服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,CDN)、以及大数据和人工智能(artificial intelligence,AI)平台等基础云计算服务的云服务器。需要说明的是,本申请以深度学习模型140的配置部署于服务器120为例进行说明,在一些实施例中,深度学习模型140的配置也可以部署于终端110。在一些实施例中,深度学习模型140的部分配置部署于终端110,部分配置部署于服务器120。
结合上述实施环境,在步骤S1中,终端110通过通信网络130向服务器120发送原始图像和目标图像。在步骤S2中,服务器120根据原始图像的版式,对目标图像进行尺寸调整,得到待匹配图像。在步骤S3中,服务器120可对待匹配图像进行哈希编码。在步骤S4中,服务器120通过滑动窗口和预设滑动步长对原始图像进行遍历处理,得到K个子图像,并对每个子图像也进行哈希编码,由此,根据待匹配图像的哈希编码结果与各个子图像的哈希编码结果,分别计算不同位置的子图像与待匹配图像之间的相似距离。在步骤S5中,找到距离最小的子图像所对应的目标最小距离。在步骤S6中,判断目标最小距离是否大于最小最小距离阈值,若是,则执行步骤S7,若否,则执行步骤S8。
如果目标最小距离大于最小距离阈值,则在步骤S7中,确定图像匹配失败。进一步地,在步骤S10中,服务器120可通过通信网络130向终端110反馈图像匹配失败的消息,用户可选择重新对图像进行剪裁。
如果目标最小距离小于或等于最小距离阈值,则在步骤S8中,确定图像匹配成功,并确定目标图像是原始图像在目标最小距离处剪裁得到的。进一步地,在步骤S9中,服务器120可通过通信网络130向终端110反馈继续进行后续处理的相关提醒。
需要说明的是,在实际应用中,步骤S2至步骤S7也可以由终端110独立完成,图5所示的交互关系仅为一个示意,不应理解为对本申请的限定。
结合上述介绍,下面将对本申请中的图像检测方法进行介绍,请参阅图5,本申请实施例中的图像检测方法可以由服务器独立完成,也可以由终端独立完成,还可以由终端与服务器配合完成,本申请方法包括:
210、获取原始图像和目标图像,其中,原始图像与目标图像具有不同的版式;
在一个或多个实施例中,获取具有不同版式的原始图像和目标图像,本申请中的“版式”具体包括横版版式和竖版版式,横版版式表示图像宽度与图像高度之间比值大于1的版式,而竖版版式表示图像宽度与图像高度之间比值小于1的版式。其中,图像宽度是指图像的横向长度,图像高度是指图像的纵向长度。
220、根据原始图像的版式,对目标图像进行尺寸调整,得到待匹配图像,其中,待匹配图像与原始图像具有相等的宽度或高度;
在一个或多个实施例中,可基于原始图像的版式对目标图像进行尺寸调整,得到与原始图像具有相等的宽度或高度的待匹配图像。如果原始图像为横版版式,则对目标图像进行等比例缩放,使得待匹配图像与原始图像具有相等的高度。如果原始图像为竖版版式,则对目标图像进行等比例缩放,使得待匹配图像与原始图像具有相等的宽度。
需要说明的是,由于在实际应用中,原始图像的尺寸通常比较大,例如,宽度可能达到1960的像素,而较大的图像会使得后续计算过程中的时间复杂度更高。由于对图像进行哈希编码时不依赖于图像中的细节信息(例如,角点、边缘、纹理等),因此,可以通过缩小图像来降低时间复杂度,提升算法效率。
以原始图像为横版版式为例,如果原始图像的宽度大于预设宽度阈值(Max_W),则可以将原始图像进行等比例缩小,使得原始图像的宽度等于Max_W。示例性地,Max_W可设置为512。如果原始图像的宽度小于Max_W,则无需调整原始图像的尺寸。
以原始图像为竖版版式为例,如果原始图像的高度大于预设竖版阈值(Max_H),则可以将原始图像进行等比例缩小,使得原始图像的高度等于Max_H。示例性地,Max_H可设置为512。如果原始图像的高度小于Max_H,则无需调整原始图像的尺寸。
230、基于待匹配图像,通过滑动窗口和预设滑动步长,对原始图像进行遍历处理,得到K个子图像,其中,滑动窗口的尺寸与待匹配图像的尺寸相同,每个子图像与待匹配图像具有相同尺寸,K为大于1的整数;
在一个或多个实施例中,使用与待匹配图像尺寸一致的窗口作为原始图像中划分子图像的滑动窗口,即,滑动窗口的宽度与待匹配图像的宽度相等,滑动窗口的高度与待匹配图像的高度也相等。基于此,使用滑动窗口对原始图像进行遍历处理,可以逐个像素点滑动,也可以每间隔多个像素点滑动。
具体地,如果逐个像素点滑动,则预设滑动步长取值为1(即,L=1)。按照预设滑动步长,使用滑动窗口依次从原始图像中取出相应的子图像,由此,得到K个子图像。可见,每个子图像与待匹配图像也具有相同的的尺寸,即,子图像的宽度与待匹配图像的宽度相等,子图像的高度与待匹配图像的高度也相等。
240、对待匹配图像和K个子图像进行哈希编码,得到至少一个相似度列表,其中,每个相似度列表包括K个相似距离,每个相似距离表示一个子图像与待匹配图像之间经过哈希编码后的相似程度,相似距离越小表示相似程度越高;
在一个或多个实施例中,在取出K个子图像之后,采用图像哈希算法分别对每个子图像以及待匹配图像进行哈希编码,得到每个子图像的哈希编码结果以及待匹配图像的哈希编码结果。其中,哈希编码结果表示为一串数字序列,将该数字序列代表图像本身,有效地降低了图像存储代价以及计算复杂度,实现图像数据的高效处理。
具体地,在得到每个子图像的哈希编码结果以及待匹配图像的哈希编码结果之后,可以分别计算每个子图像的哈希编码结果与待匹配图像的哈希编码结果之间的相似距离。其中,相似距离可以是汉明距离、欧式距离、余弦距离等,且,相似距离越小表示相似程度越高。本申请以采用汉明距离为例进行说明,但不应理解为对本申请的限定。经过相似距离的计算,可得到由K个相似距离构成的相似度列表。
需要说明的是,在实际应用中,可以采用不同类型的图像哈希算法分别对图像进行哈希编码,因此,针对每种类型的图像哈希算法会生成一个对应的相似度列表,即,得到至少一个相似度列表。
250、根据至少一个相似度列表,确定目标最小距离;
在一个或多个实施例中,可根据至少一个相似度列表,确定每个元素位置所对应的相似距离。如果只有一个相似度列表,则该相似度列表中最小的距离即为目标最小距离。如果有至少两个相似度列表,则结合这些相似度列表中的相同元素位置所对应的各个相似距离确定综合距离,再将最小的综合距离作为目标最小距离。
260、在目标最小距离小于或等于最小距离阈值的情况下,从原始图像中检测出与目标图像匹配成功的图像裁剪区域。
在一个或多个实施例中,在目标最小距离小于或等于最小距离阈值(例如,8)的情况下,通过目标最小距离的位置,可以从原始图像中检测出与目标图像匹配成功的图像裁剪区域。在目标最小距离大于最小距离阈值的情况下,则认为目标图像并非来源于原始图像。
具体地,在检测出图像裁剪区域之后,可作为后续文字、人脸、物体等裁剪的检测基础。为了便于理解,请参阅图6,图6为本申请实施例中图像裁剪区域的检测结果的一个示意图,如图6中的(A)图所示,该竖版图像是由横版图像剪裁得到的,剪裁过程中导致文字的残缺。如图6中的(B)图所示,该竖版图像也是由横版图像剪裁得到的,剪裁过程中导致人脸的残缺。
本申请提供的方法在实际检测中能够达到90%以上的检出率。请参阅图7,图7为本申请实施例中裁剪位置检测效果的一个示意图,如图所示,在实际应用中,可检测出竖版图像是否为横版图像剪裁得到的,并进一步提供竖版图像在横版图像中的剪裁位置。相应地,也可以检测出横版图像是否为竖版图像剪裁得到的,并进一步提供横版图像在竖版图像中的剪裁位置。
本申请实施例中,提供了一种图像检测的方法。通过上述方式,对待匹配图像以及K个子图像分别进行哈希编码,以此作为图像相似度匹配的依据,并在匹配成功的情况下,可进一步确定图像裁剪区域。由于采用图像哈希算法提取到的编码特征不受图像尺寸变化影响,因此,能够有效对抗图像拉伸和变型等干扰,从而提升图像匹配的准确率,进而能够准确地识别出图像裁剪位置。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,原始图像的版式为横版版式,目标图像的版式为竖版版式,其中,横版版式表示图像宽度与图像高度之间比值大于1的版式,竖版版式表示图像宽度与图像高度之间比值小于1的版式;
根据原始图像的版式,对目标图像进行尺寸调整,得到待匹配图像,具体包括:
根据横版版式,对目标图像的尺寸进行等比例缩放,得到待匹配图像,其中,待匹配图像与原始图像具有相等的高度;
基于待匹配图像,通过滑动窗口和预设滑动步长,对原始图像进行遍历处理,得到K个子图像,具体包括:
基于待匹配图像的尺寸生成滑动窗口;
以由左至右或由右至左的顺序,通过滑动窗口和预设滑动步长,对原始图像进行遍历处理,得到K个子图像。
在一个或多个实施例中,介绍了一种对目标图像进行尺寸调整的方式。由前述实施例可知,原始图像与目标图像具有不同版式,下面将以原始图像的版式为横版版式,目标图像的版式为竖版版式为例进行说明。
具体地,为了便于理解,请参阅图8,图8为本申请实施例中对原始图像进行遍历处理的一个示意图,如图所示,在给定原始图像(I_h)和目标图像(I_v)之后,可对原始图像进行等比例缩小,使得原始图像的宽度等于预设宽度阈值(Max_W)。或者,直接使用原始图像进行后续处理,故对于原始图像进行尺寸调整的步骤属于可选步骤。
由于目标图像的高度通常与原始图像的高度不一致,因此,还需要对目标图像的尺寸进行等比例缩放,由此,得到与原始图像具有相等高度的待匹配图像。其中,原始图像的宽度可记为“W_h”,原始图像的高度可记为“H_h”。待匹配图像的宽度可记为“W_v”,待匹配图像的高度可记为“H_v”。且,H_v=H_h。
基于此,一方面,需要采用图像哈希算法对待匹配图像进行哈希编码,得到待匹配图像的哈希编码结果(C_v)。另一方面,使用与待匹配图像尺寸一致的滑动窗口对原始图像进行遍历处理,即,按照由左至右或由右至左的顺序,采用滑动窗口和预设滑动步长,依次从原始图像中取出相应的子图像,由此得到K个子图像(即,I_1至I_K)。于是,采用图像哈希算法分别对每个子图像进行哈希编码,得到K个子图像的哈希编码结果(即,C_1至C_K)。最后,计算待匹配图像的哈希编码结果与每个子图像的哈希编码结果之间的相似距离(例如,汉明距离)。例如,待匹配图像的哈希编码结果与第x个子图像的哈希编码结果(C_x)之间的相似距离为dist_x。以此类推,得到dist=[dist_1,dist_2,…,dist_K]。
其次,本申请实施例中,提供了一种对目标图像进行尺寸调整的方式。通过上述方式,以横版版式的原始图像为准,对竖版版式的目标图像进行等比例缩放处理,以此得到与原始图像具有相等高度的待匹配图像。基于此,可采用滑窗方式从原始图像中取出不同位置对应的子图像,从而实现图像之间的相似度比对,由此,提升方案的可行性和可操作性。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,从原始图像中检测出与目标图像匹配成功的图像裁剪区域,具体包括:
在以由左至右的顺序对原始图像进行遍历处理的情况下,获取目标最小距离所对应的左侧剪裁位置;
根据左侧剪裁位置和待匹配图像的宽度,确定右侧剪裁位置;
根据左侧剪裁位置和右侧剪裁位置,从原始图像中检测出与目标图像匹配成功的图像裁剪区域;
或者,
从原始图像中检测出与目标图像匹配成功的图像裁剪区域,具体包括:
在以由右至左的顺序对原始图像进行遍历处理的情况下,获取目标最小距离所对应的右侧剪裁位置;
根据右侧剪裁位置和待匹配图像的宽度,确定左侧剪裁位置;
根据右侧剪裁位置和左侧剪裁位置,从原始图像中检测出与目标图像匹配成功的图像裁剪区域。
在一个或多个实施例中,介绍了一种检测图像剪裁区域的方式。由前述实施例可知,在目标最小距离小于或等于最小距离阈值的情况下,还可以根据目标最小距离所对应的滑动窗口位置,确定图像裁剪区域。下面将以预设滑动步长等于1为例,且,分别以由左至右以及由右至左的滑动顺序进行说明。
一、由左至右的顺序对原始图像进行遍历;
具体地,为了便于理解,请参阅图9,图9为本申请实施例中基于由左至右的遍历顺序检测图像裁剪区域的一个示意图,如图所示,D1用于指示基于滑动窗口提取的第1个子图像。D2用于指示基于滑动窗口提取的第2个子图像。D3用于指示基于滑动窗口提取的第3个子图像。D4用于指示基于滑动窗口提取的第4个子图像。D5用于指示基于滑动窗口提取的第5个子图像。D6用于指示基于滑动窗口提取的第6个子图像。D7用于指示基于滑动窗口提取的第7个子图像。D8用于指示基于滑动窗口提取的第8个子图像。
以滑动窗口的初始位置为“1”(即,从最左侧位置记为“1”)作为示例,直至达到W_h-W_v+1位置,可取出K个子图像,此时K=W_h-W_v+1。
示例性地,以图9为例,W_v=3,H_h=6。假设D7所指示的子图像与待匹配图像之间的相似距离为目标最小距离,且,该目标最小距离小于最小距离阈值,则在原始图像中确定左侧剪裁位置(x_min)为“7”,由于待匹配图像的宽度(W_v)为“3”,因此,右侧剪裁位置(x_min+W_v-1)为“9”。由此,得到D9所指示的图像裁剪区域。
二、由右至左的顺序对原始图像进行遍历;
具体地,为了便于理解,请参阅图10,图10为本申请实施例中基于由右至左的遍历顺序检测图像裁剪区域的一个示意图,如图所示,E1用于指示基于滑动窗口提取的第1个子图像。E2用于指示基于滑动窗口提取的第2个子图像。E3用于指示基于滑动窗口提取的第3个子图像。E4用于指示基于滑动窗口提取的第4个子图像。E5用于指示基于滑动窗口提取的第5个子图像。E6用于指示基于滑动窗口提取的第6个子图像。E7用于指示基于滑动窗口提取的第7个子图像。E8用于指示基于滑动窗口提取的第8个子图像。
以滑动窗口的初始位置为“1”(即,从最右侧位置记为“1”)作为示例,直至达到W_h-W_v+1位置,可取出K个子图像,此时K=W_h-W_v+1。
示例性地,以图10为例,W_v=3,H_h=6。假设E2所指示的子图像与待匹配图像之间的相似距离为目标最小距离,且,该目标最小距离小于最小距离阈值,则在原始图像中确定右侧剪裁位置(x_min)为“2”,由于待匹配图像的宽度(W_v)为“3”,因此,左侧剪裁位置(x_min+W_v-1)为“4”。由此,得到E9所指示的图像裁剪区域。
需要说明的是,在实际应用中,预设滑动步长还可以采用其他取值。此外,滑动方式不仅限于由左至右或者由右至左,例如,还可以随机采样等,此处不做限定。
再次,本申请实施例中,提供了一种检测图像剪裁区域的方式。通过上述方式,在目标最小距离小于或等于最小距离阈值的情况下,还可以进一步从原始图像中检测出目标图像所对应的图像剪裁区域。由此,能够为后续的CV处理提供可靠的依据,从而提升方案的可行性和可操作性。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,原始图像的版式为横版版式,目标图像的版式为竖版版式,其中,横版版式表示图像宽度与图像高度之间比值大于1的版式,竖版版式表示图像宽度与图像高度之间比值小于1的版式;
根据原始图像的版式,对目标图像进行尺寸调整,得到待匹配图像,具体包括:
根据竖版版式,对目标图像的尺寸进行等比例缩放,得到待匹配图像,其中,待匹配图像与原始图像具有相等的宽度;
基于待匹配图像,通过滑动窗口和预设滑动步长,对原始图像进行遍历处理,得到K个子图像,具体包括:
基于待匹配图像的尺寸生成滑动窗口;
以由上至下或由下至上的顺序,通过滑动窗口和预设滑动步长,对原始图像进行遍历处理,得到K个子图像。
在一个或多个实施例中,介绍了另一种对目标图像进行尺寸调整的方式。由前述实施例可知,原始图像与目标图像具有不同版式,下面将以原始图像的版式为竖版版式,目标图像的版式为横版版式为例进行说明。
具体地,为了便于理解,请参阅图11,图11为本申请实施例中对原始图像进行遍历处理的另一个示意图,如图所示,在给定原始图像(I_h)和目标图像(I_v)之后,可对原始图像进行等比例缩小,使得原始图像的高度等于预设竖版阈值(Max_H)。或者,直接使用原始图像进行后续处理,故对于原始图像进行尺寸调整的步骤属于可选步骤。
由于目标图像的宽度通常与原始图像的宽度不一致,因此,还需要对目标图像的尺寸进行等比例缩放,由此,得到与原始图像具有相等宽度的待匹配图像。其中,原始图像的宽度可记为“W_h”,原始图像的高度可记为“H_h”。待匹配图像的宽度可记为“W_v”,待匹配图像的高度可记为“H_v”。且,W_v=W_h。
基于此,一方面,需要采用图像哈希算法对待匹配图像进行哈希编码,得到待匹配图像的哈希编码结果(C_v)。另一方面,使用与待匹配图像尺寸一致的滑动窗口对原始图像进行遍历处理,即,按照由上至下或由下至上的顺序,采用滑动窗口和预设滑动步长,依次从原始图像中取出相应的子图像,由此得到K个子图像(即,I_1至I_K)。于是,采用图像哈希算法分别对每个子图像进行哈希编码,得到K个子图像的哈希编码结果(即,C_1至C_K)。最后,计算待匹配图像的哈希编码结果与每个子图像的哈希编码结果之间的相似距离(例如,汉明距离)。例如,待匹配图像的哈希编码结果与第x个子图像的哈希编码结果(C_x)之间的相似距离为dist_x。以此类推,得到dist=[dist_1,dist_2,…,dist_K]。
其次,本申请实施例中,提供了另一种对目标图像进行尺寸调整的方式。通过上述方式,以竖版版式的原始图像为准,对横版版式的目标图像进行等比例缩放处理,以此得到与原始图像具有相等宽度的待匹配图像。基于此,采用滑窗方式从原始图像中取出不同位置对应的子图像,从而实现图像之间的相似度比对,由此,提升方案的可行性和可操作性。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,从原始图像中检测出与目标图像匹配成功的图像裁剪区域,具体包括:
在以由上至下的顺序对原始图像进行遍历处理的情况下,获取目标最小距离所对应的上方剪裁位置;
根据上方剪裁位置和待匹配图像的高度,确定下方剪裁位置;
根据上方剪裁位置和下方剪裁位置,从原始图像中检测出与目标图像匹配成功的图像裁剪区域;
或者,
从原始图像中检测出与目标图像匹配成功的图像裁剪区域,具体包括:
在以由下至上的顺序对原始图像进行遍历处理的情况下,获取目标最小距离所对应的下方剪裁位置;
根据下方剪裁位置和待匹配图像的高度,确定上方剪裁位置;
根据下方剪裁位置和上方剪裁位置,从原始图像中检测出与目标图像匹配成功的图像裁剪区域。
在一个或多个实施例中,介绍了一种检测图像剪裁区域的方式。由前述实施例可知,在目标最小距离小于或等于最小距离阈值的情况下,还可以根据目标最小距离所对应的滑动窗口位置,确定图像裁剪区域。下面将以预设滑动步长等于1为例,且,分别以由上至下以及由下至上的滑动顺序进行说明。
一、由上至下的顺序对原始图像进行遍历;
具体地,为了便于理解,请参阅图12,图12为本申请实施例中基于由上至下的遍历顺序检测图像裁剪区域的一个示意图,如图所示,F1用于指示基于滑动窗口提取的第1个子图像。F2用于指示基于滑动窗口提取的第2个子图像。F3用于指示基于滑动窗口提取的第3个子图像。F4用于指示基于滑动窗口提取的第4个子图像。F5用于指示基于滑动窗口提取的第5个子图像。F6用于指示基于滑动窗口提取的第6个子图像。F7用于指示基于滑动窗口提取的第7个子图像。F8用于指示基于滑动窗口提取的第8个子图像。
以滑动窗口的初始位置为“1”(即,从最上方位置记为“1”)作为示例,直至达到H_h-H_v+1位置,可取出K个子图像,此时K=H_h-H_v+1。
示例性地,以图12为例,H_v=3,W_h=6。假设F3所指示的子图像与待匹配图像之间的相似距离为目标最小距离,且,该目标最小距离小于最小距离阈值,则在原始图像中确定上方剪裁位置(x_min)为“3”,由于待匹配图像的高度(H_v)为“3”,因此,下方剪裁位置(x_min+H_v-1)为“5”。由此,得到F9所指示的图像裁剪区域。
二、由下至上的顺序对原始图像进行遍历;
具体地,为了便于理解,请参阅图13,图13为本申请实施例中基于由下至上的遍历顺序检测图像裁剪区域的一个示意图,如图所示,G1用于指示基于滑动窗口提取的第1个子图像。G2用于指示基于滑动窗口提取的第2个子图像。G3用于指示基于滑动窗口提取的第3个子图像。G4用于指示基于滑动窗口提取的第4个子图像。G5用于指示基于滑动窗口提取的第5个子图像。G6用于指示基于滑动窗口提取的第6个子图像。G7用于指示基于滑动窗口提取的第7个子图像。G8用于指示基于滑动窗口提取的第8个子图像。
以滑动窗口的初始位置为“1”(即,从最下方位置记为“1”)作为示例,直至达到H_h-H_v+1位置,可取出K个子图像,此时K=H_h-H_v+1。
示例性地,以图13为例,H_v=3,W_h=6。假设G6所指示的子图像与待匹配图像之间的相似距离为目标最小距离,且,该目标最小距离小于最小距离阈值,则在原始图像中确定下方剪裁位置置(x_min)为“6”,由于待匹配图像的高度(H_v)为“3”,因此,上方剪裁位置(x_min+H_v-1)为“8”。由此,得到G9所指示的图像裁剪区域。
需要说明的是,在实际应用中,预设滑动步长还可以采用其他取值。此外,滑动方式不仅限于由上至下或者由下至上,例如,还可以随机采样等,此处不做限定。
再次,本申请实施例中,提供了另一种检测图像剪裁区域的方式。通过上述方式,在目标最小距离小于或等于最小距离阈值的情况下,还可以进一步从原始图像中检测出目标图像所对应的图像剪裁区域。由此,能够为后续的CV处理提供可靠的依据,从而提升方案的可行性和可操作性。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,对待匹配图像和K个子图像进行哈希编码,得到至少一个相似度列表,具体包括:
对待匹配图像和K个子图像进行感知哈希编码,得到图像感知相似列表,其中,图像感知相似列表属于至少一个相似度列表;
或者,
对待匹配图像和K个子图像进行均值哈希编码,得到图像均值相似列表,其中,图像均值相似列表属于至少一个相似度列表;
或者,
对待匹配图像和K个子图像进行差异哈希编码,得到图像差异相似列表,其中,图像差异相似列表属于至少一个相似度列表。
在一个或多个实施例中,介绍了一种基于图像哈希算法生成相似度列表的方式。由前述实施例可知,采用图像哈希算法可对待匹配图像以及各个子图像进行哈希编码,以此得到待匹配图像以及各个子图像的哈希编码结果,其中,哈希编码结果也可称为“图像指纹”。图像哈希算法包含但不仅限于感知哈希(perceptual hash,phash)算法、均值哈希(average hash,ahash)算法、差异哈希(difference hash,dhash)算法、基于径向变换计算哈希(radial variance hash)算法等。下面将分别介绍基于图像哈希算法构建相似度列表的方式。
一、phash算法;
具体地,采用phash算法分别对待匹配图像和K个子图像进行感知哈希编码,由此,得到待匹配图像的哈希编码结果和各个子图像的哈希编码结果。于是,计算待匹配图像的哈希编码结果与每个子图像的哈希编码结果之间的相似距离,由此,生成图像感知相似列表,其中,图像感知相似列表包括K个相似距离,该相似距离具体为感知相似距离。
二、ahash算法;
具体地,采用ahash算法分别对待匹配图像和K个子图像进行均值哈希编码,由此,得到待匹配图像的哈希编码结果和各个子图像的哈希编码结果。于是,计算待匹配图像的哈希编码结果与每个子图像的哈希编码结果之间的相似距离,由此,生成图像均值相似列表,其中,图像均值相似列表包括K个相似距离,该相似距离具体为均值相似距离。
三、dhash算法;
具体地,采用dhash算法分别对待匹配图像和K个子图像进行差异哈希编码,由此,得到待匹配图像的哈希编码结果和各个子图像的哈希编码结果。于是,计算待匹配图像的哈希编码结果与每个子图像的哈希编码结果之间的相似距离,由此,生成图像差异相似列表,其中,图像差异相似列表包括K个相似距离,该相似距离具体为差异相似距离。
需要说明的是,可采用跨平台的开源的计算机视觉处理代码库(open sourcecomputer vision library,OpenCV)中的图像哈希(img_hash)模块对图像进行哈希编码。也可以采用Python图像处理库(Python imaging library,PIL)模块对图像进行哈希编码。
其次,本申请实施例中,提供了一种基于图像哈希算法生成相似度列表的方式。通过上述方式,考虑到在实际业务场景中,待匹配图像可能存在拉伸变形的情况,因此,直接提取特征进行匹配会影响匹配效果。基于此,采用图像哈希算法能够评估图像之间的差异性,并且不受图像拉伸变形的影响,从而能够更好地应对业务场景。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,根据至少一个相似度列表,确定目标最小距离,具体包括:
从图像感知相似列表所包括的K个相似距离中确定目标最小距离,其中,K个相似距离为K个感知相似距离,目标最小距离为K个感知相似距离中的最小感知相似距离;
或者,
从图像均值相似列表所包括的K个相似距离中确定目标最小距离,其中,K个相似距离为K个均值相似距离,目标最小距离为K个均值相似距离中的最小均值相似距离;
或者,
从图像差异相似列表所包括的K个相似距离中确定目标最小距离,其中,K个相似距离为K个差异相似距离,目标最小距离为K个差异相似距离中的最小差异相似距离。
在一个或多个实施例中,介绍了一种基于单个相似度列表确定目标最小距离的方式。由前述实施例可知,相似度列表可以是图像感知相似列表、图像均值相似列表或者图像差异相似列表。下面将分别针对不同相似度列表进行说明。
一、图像感知相似列表;
具体地,图像感知相似列表中包括K个感知相似距离,每个感知相似距离表示待匹配图像的哈希编码结果与一个子图像的哈希编码结果之间的相似距离(例如,汉明距离)。假设有5个子图像(即,K=5),基于此,为了便于理解,请参阅表1,表1为图像感知相似列表的一个示意。
表1
子图像1 | 子图像2 | 子图像3 | 子图像4 | 子图像5 | |
感知相似距离 | 16 | 10 | 6 | 9 | 20 |
可见,“子图像3”的哈希编码结果与待匹配图像的哈希编码结果之间具有最小的感知相似距离,即,目标最小距离为6。
二、图像均值相似列表;
具体地,图像均值相似列表中包括K个均值相似距离,每个均值相似距离表示待匹配图像的哈希编码结果与一个子图像的哈希编码结果之间的相似距离(例如,汉明距离)。假设有5个子图像(即,K=5),基于此,为了便于理解,请参阅表2,表2为图像均值相似列表的一个示意。
表2
可见,“子图像1”的哈希编码结果与待匹配图像的哈希编码结果之间具有最小的均值相似距离,即,目标最小距离为4。
三、图像差异相似列表;
具体地,图像差异相似列表中包括K个差异相似距离,每个差异相似距离表示待匹配图像的哈希编码结果与一个子图像的哈希编码结果之间的相似距离(例如,汉明距离)。假设有5个子图像(即,K=5),基于此,为了便于理解,请参阅表3,表3为图像差异相似列表的一个示意。
表3
子图像1 | 子图像2 | 子图像3 | 子图像4 | 子图像5 | |
差异相似距离 | 17 | 20 | 10 | 8 | 13 |
可见,“子图像4”的哈希编码结果与待匹配图像的哈希编码结果之间具有最小的差异相似距离,即,目标最小距离为8。
再次,本申请实施例中,提供了一种基于单个相似度列表确定目标最小距离的方式。通过上述方式,可直接从相似度列表中选择最小值作为目标最小距离,从而提升方案实现的效率。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,相似距离为感知相似距离;
对待匹配图像和K个子图像进行感知哈希编码,得到图像感知相似列表,具体包括:
对待匹配图像和K个子图像进行尺寸缩放处理,得到缩放后的待匹配图像和缩放后的K个子图像;
对缩放后的待匹配图像和缩放后的K个子图像进行灰度转换处理,得到待匹配灰度图和K个灰度子图像;
对待匹配灰度图和K个灰度子图像进行离散余弦变换处理,得到待匹配灰度图所对应的数据矩阵和K个灰度子图像中每个灰度子图像的数据矩阵;
根据待匹配灰度图所对应的数据矩阵和每个灰度子图像的数据矩阵,确定待匹配灰度图所对应的平均值和每个灰度子图像的平均值;
根据待匹配灰度图所对应的平均值和每个灰度子图像的平均值,生成待匹配灰度图的感知哈希编码结果和每个灰度子图像的感知哈希编码结果;
计算待匹配灰度图的感知哈希编码结果与每个灰度子图像的感知哈希编码结果之间的汉明距离,得到图像感知相似列表,其中,图像感知相似列表包括K个感知相似距离。
在一个或多个实施例中,介绍了一种基于phash算法进行图像哈希编码的方式。由前述实施例可知,phash算法属于图像哈希算法的一种,通过计算离散余弦变换(discretecosine transform,DCT)得到图像的哈希值。
具体地,首先,对待匹配图像进行尺寸缩放,例如,缩放至32×32,得到由1024个像素点构成的缩放后的待匹配图像。接下来,对缩放后的待匹配图像进行灰度转换处理,即,将非单通道的图像转换为单通道灰度图,得到待匹配灰度图。然后,计算待匹配灰度图在DCT之后对应的数据矩阵,例如,得到32×32的数据矩阵。基于此,从待匹配灰度图所对应的数据矩阵中取出左上角的子矩阵,例如,得到8×8的子矩阵。再对子矩阵中的所有像素点求平均值,得到待匹配灰度图所对应的平均值。最后,按照从左到右的顺序逐行遍历子矩阵中的每个像素点,若像素点大于或等于该平均值,则记为“1”,若像素点小于该平均值,则记为“0”。由此,得到待匹配灰度图所对应的感知哈希编码结果。
类似地,对每个子图像先进行尺寸缩放,由此得到各个缩放后的子图像。接下来,对各个缩放后的子图像进行灰度转换处理,得到相应的灰度子图像。然后,计算每个灰度子图像在DCT之后对应的数据矩阵。基于此,从各个灰度子图像所对应的数据矩阵中分别取出左上角的子矩阵。再对每个子矩阵中的所有像素点求平均值,得到每个灰度子图像所对应的平均值。最后,按照从左到右的顺序逐行遍历各个灰度子图像的子矩阵中的每个元素,若像素点大于或等于对应灰度子图像的平均值,则记为“1”,若像素点小于对应灰度子图像的平均值,则记为“0”。由此,得到各个灰度子图像所对应的感知哈希编码结果。
需要说明的是,感知哈希编码结果可表示为64位的二进制数据。于是,分别计算待匹配灰度图的感知哈希编码结果与每个灰度子图像的感知哈希编码结果之间的汉明距离,从而得到K个汉明距离,这K个汉明距离作为图像感知相似列表中所包括的K个感知相似距离。其中,汉明距离表示两个相同长度的字符串对应位置的不同字符的数量,对两个字符串进行异或运算,并统计结果为1的个数,那么该个数就是汉明距离。
再次,本申请实施例中,提供了一种基于phash算法进行图像哈希编码的方式。通过上述方式,phash算法在计算过程中不受图像尺寸变化的影响,因此,可以对抗图像拉伸等噪声。此外,phash算法具有较高的精确度,由此能够提升图像匹配的准确度。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,相似距离为均值相似距离;
对待匹配图像和K个子图像进行均值哈希编码,得到图像均值相似列表,具体包括:
对待匹配图像和K个子图像进行尺寸缩放处理,得到缩放后的待匹配图像和缩放后的K个子图像;
对缩放后的待匹配图像和缩放后的K个子图像进行灰度转换处理,得到待匹配灰度图和K个灰度子图像;
对待匹配灰度图和K个灰度子图像进行像素点均值计算,得到待匹配灰度图所对应的像素平均值和K个灰度子图像中每个灰度子图像的像素平均值;
根据待匹配灰度图所对应的像素平均值和每个灰度子图像的像素平均值,生成待匹配灰度图的均值哈希编码结果和每个灰度子图像的均值哈希编码结果;
计算待匹配灰度图的均值哈希编码结果与每个灰度子图像的均值哈希编码结果之间的汉明距离,得到图像均值相似列表,其中,图像均值相似列表包括K个均值相似距离。
在一个或多个实施例中,介绍了一种基于ahash算法进行图像哈希编码的方式。由前述实施例可知,ahash算法属于图像哈希算法的一种,通过比较灰度图每个像素点与所有像素点的平均值来实现。
具体地,首先,对待匹配图像进行尺寸缩放,例如,缩放至8×8,得到由64个像素点构成的缩放后的待匹配图像。接下来,对缩放后的待匹配图像进行灰度转换处理,即,将非单通道的图像转换为单通道灰度图,得到待匹配灰度图。然后,计算待匹配灰度图中所有像素点的像素值平均值,得到待匹配灰度图所对应的像素平均值。最后,按照从左到右的顺序逐行遍历待匹配灰度图中的每个像素点,若像素点的灰度值大于或等于该像素平均值,则记为“1”,若像素点的灰度值小于该像素平均值,则记为“0”。由此,得到待匹配灰度图所对应的均值哈希编码结果。
类似地,对每个子图像先进行尺寸缩放,由此得到各个缩放后的子图像。接下来,对各个缩放后的子图像进行灰度转换处理,得到相应的灰度子图像。然后,计算每个灰度子图像中所有像素点的像素值平均值,得到每个灰度子图像所对应的像素平均值。最后,按照从左到右的顺序逐行遍历各个灰度子图像中的每个像素点,若像素点的灰度值大于或等于对应灰度子图像的像素平均值,则记为“1”,若像素点的灰度值小于对应灰度子图像的,则记为“0”。由此,得到各个灰度子图像所对应的均值哈希编码结果。
需要说明的是,均值哈希编码结果可表示为64位的二进制数据。由此,分别计算待匹配灰度图的均值哈希编码结果与每个灰度子图像的均值哈希编码结果之间的汉明距离,从而得到K个汉明距离,其中,K个汉明距离作为图像均值相似列表中所包括的K个均值相似距离。
再次,本申请实施例中,提供了一种基于ahash算法进行图像哈希编码的方式。通过上述方式,ahash算法在计算过程中不受图像尺寸变化的影响,因此,可以对抗图像拉伸等噪声。此外,ahash算法具有较快的速度,由此能够提升图像匹配的效率。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,相似距离为差异相似距离;
对待匹配图像和K个子图像进行差异哈希编码,得到图像差异相似列表,具体包括:
对待匹配图像和K个子图像进行尺寸缩放处理,得到缩放后的待匹配图像和缩放后的K个子图像;
对缩放后的待匹配图像和缩放后的K个子图像进行灰度转换处理,得到待匹配灰度图和K个灰度子图像;
对待匹配灰度图的每行相邻像素点进行像素值比对,得到待匹配灰度图的差异哈希编码结果;
对K个灰度子图像中的每个灰度子图像的每行相邻像素点进行像素值比对,得到每个灰度子图像的差异哈希编码结果;
计算待匹配灰度图的差异哈希编码结果与每个灰度子图像的差异哈希编码结果之间的汉明距离,得到图像差异相似列表,其中,图像差异相似列表包括K个差异相似距离。
在一个或多个实施例中,介绍了一种基于dhash算法进行图像哈希编码的方式。由前述实施例可知,dhash算法属于图像哈希算法的一种,通过逐像素点比对像素值的差异,即,得到当前像素点的像素值与右邻像素点的像素值的差值,得到一个图像差异矩阵。基于图像差异矩阵生成图像的哈希值。
具体地,首先,对待匹配图像进行尺寸缩放,例如,缩放至9×8,得到由72个像素点构成的缩放后的待匹配图像。接下来,对缩放后的待匹配图像进行灰度转换处理,即,将非单通道的图像转换为单通道灰度图,由此得到待匹配灰度图。然后,计算待匹配灰度图的每行相邻像素点之间的像素值差值,由此,9个像素点之前就会产生8个差异值,即,得到8×8的图像差异矩阵。再计算图像差异矩阵中所有像素点的像素值平均值,得到待匹配灰度图所对应的像素平均值。最后,按照从左到右的顺序逐行遍历图像差异矩阵中的每个像素点,若像素点大于或等于该像素平均值,则记为“1”,若元素小于该像素平均值,则记为“0”。由此,得到待匹配灰度图所对应的差异哈希编码结果。
类似地,对每个子图像先进行尺寸缩放,由此得到各个缩放后的子图像。接下来,对各个缩放后的子图像进行灰度转换处理,得到相应的灰度子图像。然后,计算各个灰度子图像的每行相邻像素点之间的像素值差值,得到每个灰度子图像的图像差异矩阵。再计算各个图像差异矩阵中所有像素点的像素值平均值,得到各个灰度子图像的像素平均值。最后,按照从左到右的顺序逐行遍历各个图像差异矩阵中的每个像素点,若像素点大于或等于对应灰度子图像的像素平均值,则记为“1”,若元素小于对应灰度子图像的像素平均值,则记为“0”。由此,得到待匹配灰度图所对应的差异哈希编码结果。
需要说明的是,差异哈希编码结果可表示为64位的二进制数据。由此,分别计算待匹配灰度图的差异哈希编码结果与每个灰度子图像的差异哈希编码结果之间的汉明距离,从而得到K个汉明距离,其中,K个汉明距离作为图像差异相似列表中所包括的K个差异相似距离。
再次,本申请实施例中,提供了一种基于dhash算法进行图像哈希编码的方式。通过上述方式,dhash算法在计算过程中不受图像尺寸变化的影响,因此,可以对抗图像拉伸等噪声。此外,ahash算法兼顾速度和精确度,由此不仅提升图像匹配的准确度,而且能够提升图像匹配的效率。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,对待匹配图像和K个子图像进行哈希编码,得到至少一个相似度列表,具体包括:
对待匹配图像和K个子图像进行感知哈希编码,得到图像感知相似列表,其中,图像感知相似列表属于至少一个相似度列表;
对待匹配图像和K个子图像进行均值哈希编码,得到图像均值相似列表,其中,图像均值相似列表属于至少一个相似度列表;
根据至少一个相似度列表,确定目标最小距离,具体包括:
根据图像感知相似列表和图像均值相似列表,生成第一综合列表,其中,第一综合列表包括K个第一综合距离,每个第一综合距离为根据对应的感知相似距离和均值相似距离计算得到的;
从第一综合列表所包括的K个第一综合距离中确定目标最小距离,其中,目标最小距离为K个第一综合距离中最小的第一综合距离。
在一个或多个实施例中,介绍了一种基于两个相似度列表共同确定目标最小距离的方式。由前述实施例可知,至少一个相似度列表包括图像感知相似列表以及图像均值相似列表。基于此,结合图像感知相似列表以及图像均值相似列表,可生成第一综合列表。
具体地,假设有5个子图像(即,K=5),且,感知相似距离的权重为0.5,均值相似距离的权重为0.5。基于此,为了便于理解,结合表1提供的图像感知相似列表以及表2提供的图像均值相似列表,请参阅表4,表4为第一综合列表的一个示意。
表4
子图像1 | 子图像2 | 子图像3 | 子图像4 | 子图像5 | |
感知相似距离 | 16 | 10 | 6 | 9 | 20 |
均值相似距离 | 4 | 11 | 15 | 9 | 9 |
第一综合距离 | 10 | 10.5 | 10.5 | 9 | 14.5 |
可见,“子图像4”与待匹配图像之间的第一综合距离最小,即,目标最小距离为9。
其次,本申请实施例中,提供了一种基于两个相似度列表共同确定目标最小距离的方式。通过上述方式,可综合两个相似度列表生成第一综合列表,并从第一综合列表中选择最小值作为目标最小距离。基于此,综合phash算法和ahash算法判定图像之间的相似度,从而进一步提升图像匹配的准确性。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,对待匹配图像和K个子图像进行哈希编码,得到至少一个相似度列表,具体包括:
对待匹配图像和K个子图像进行感知哈希编码,得到图像感知相似列表,其中,图像感知相似列表属于至少一个相似度列表;
对待匹配图像和K个子图像进行差异哈希编码,得到图像差异相似列表,其中,图像均值相似列表属于至少一个相似度列表;
根据至少一个相似度列表,确定目标最小距离,具体包括:
根据图像感知相似列表和图像差异相似列表,生成第二综合列表,其中,第二综合列表包括K个第二综合距离,每个第二综合距离为根据对应的感知相似距离和差异相似距离计算得到的;
从第二综合列表所包括的K个第二综合距离中确定目标最小距离,其中,目标最小距离为K个第二综合距离中最小的第二综合距离。
在一个或多个实施例中,介绍了另一种基于两个相似度列表共同确定目标最小距离的方式。由前述实施例可知,至少一个相似度列表包括图像感知相似列表以及图像差异相似列表。基于此,结合图像感知相似列表以及图像均值相似列表,可生成第二综合列表。
具体地,假设有5个子图像(即,K=5),且,感知相似距离的权重为0.5,差异相似距离的权重为0.5。基于此,为了便于理解,结合表1提供的图像感知相似列表以及表3提供的图像差异相似列表,请参阅表5,表5为第二综合列表的一个示意。
表5
子图像1 | 子图像2 | 子图像3 | 子图像4 | 子图像5 | |
感知相似距离 | 16 | 10 | 6 | 9 | 20 |
差异相似距离 | 17 | 20 | 10 | 8 | 13 |
第二综合距离 | 16.5 | 15 | 8 | 8.5 | 16.5 |
可见,“子图像3”与待匹配图像之间的第二综合距离最小,即,目标最小距离为8。
其次,本申请实施例中,提供了另一种基于两个相似度列表共同确定目标最小距离的方式。通过上述方式,可综合两个相似度列表生成第二综合列表,并从第二综合列表中选择最小值作为目标最小距离。基于此,综合phash算法和dhash算法判定图像之间的相似度,从而进一步提升图像匹配的准确性。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,对待匹配图像和K个子图像进行哈希编码,得到至少一个相似度列表,具体包括:
对待匹配图像和K个子图像进行均值哈希编码,得到图像均值相似列表,其中,图像均值相似列表属于至少一个相似度列表;
对待匹配图像和K个子图像进行差异哈希编码,得到图像差异相似列表,其中,图像均值相似列表属于至少一个相似度列表;
根据至少一个相似度列表,确定目标最小距离,具体包括:
根据图像均值相似列表和图像差异相似列表,生成第三综合列表,其中,第三综合列表包括K个第三综合距离,每个第三综合距离为根据对应的均值相似距离和差异相似距离计算得到的;
从第三综合列表所包括的K个第三综合距离中确定目标最小距离,其中,目标最小距离为K个第三综合距离中最小的第三综合距离。
在一个或多个实施例中,介绍了另一种基于两个相似度列表共同确定目标最小距离的方式。由前述实施例可知,至少一个相似度列表包括图像均值相似列表以及图像差异相似列表。基于此,结合图像均值相似列表以及图像均值相似列表,可生成第三综合列表。
具体地,假设有5个子图像(即,K=5),且,均值相似距离的权重为0.5,差异相似距离的权重为0.5。基于此,为了便于理解,结合表2提供的图像均值相似列表以及表3提供的图像差异相似列表,请参阅表6,表6为第三综合列表的一个示意。
表6
子图像1 | 子图像2 | 子图像3 | 子图像4 | 子图像5 | |
均值相似距离 | 4 | 11 | 15 | 9 | 9 |
差异相似距离 | 17 | 20 | 10 | 8 | 13 |
第三综合距离 | 10.5 | 15.5 | 12.5 | 8.5 | 11 |
可见,“子图像4”与待匹配图像之间的第三综合距离最小,即,目标最小距离为8.5。
其次,本申请实施例中,提供了另一种基于两个相似度列表共同确定目标最小距离的方式。通过上述方式,可综合两个相似度列表生成第三综合列表,并从第三综合列表中选择最小值作为目标最小距离。基于此,综合ahash算法和dhash算法判定图像之间的相似度,从而进一步提升图像匹配的准确性。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,对待匹配图像和K个子图像进行哈希编码,得到至少一个相似度列表,具体包括:
对待匹配图像和K个子图像进行感知哈希编码,得到图像感知相似列表,其中,图像感知相似列表属于至少一个相似度列表;
对待匹配图像和K个子图像进行均值哈希编码,得到图像均值相似列表,其中,图像均值相似列表属于至少一个相似度列表;
对待匹配图像和K个子图像进行差异哈希编码,得到图像差异相似列表,其中,图像均值相似列表属于至少一个相似度列表;
根据至少一个相似度列表,确定目标最小距离,具体包括:
根据图像感知相似列表、图像均值相似列表和图像差异相似列表,生成第四综合列表,其中,第四综合列表包括K个第四综合距离,每个第四综合距离为根据对应的感知相似距离、均值相似距离和差异相似距离计算得到的;
从第四综合列表所包括的K个第四综合距离中确定目标最小距离,其中,目标最小距离为K个第四综合距离中最小的第四综合距离。
在一个或多个实施例中,介绍了一种基于三个相似度列表共同确定目标最小距离的方式。由前述实施例可知,至少一个相似度列表包括图像感知相似列表、图像均值相似列表以及图像差异相似列表。基于此,结合图像感知相似列表、图像均值相似列表以及图像差异相似列表,可生成第四综合列表。
具体地,假设有5个子图像(即,K=5),且,感知相似距离的权重为0.3,均值相似距离的权重为0.3,异相似距离的权重为0.4。基于此,为了便于理解,结合表1提供的图像感知相似列表,表2提供的图像均值相似列表以及表3提供的图像差异相似列表,请参阅表7,表7为第四综合列表的一个示意。
表7
子图像1 | 子图像2 | 子图像3 | 子图像4 | 子图像5 | |
感知相似距离 | 16 | 10 | 6 | 9 | 20 |
均值相似距离 | 4 | 11 | 15 | 9 | 9 |
差异相似距离 | 17 | 20 | 10 | 8 | 13 |
第四综合距离 | 12.8 | 14.3 | 10.3 | 8.6 | 13.9 |
可见,“子图像4”与待匹配图像之间的第四综合距离最小,即,目标最小距离为8.6。
其次,本申请实施例中,提供了一种基于三个相似度列表共同确定目标最小距离的方式。通过上述方式,可综合三个相似度列表生成第四综合列表,并从第四综合列表中选择最小值作为目标最小距离。基于此,综合phash算法、ahash算法和dhash算法判定图像之间的相似度,从而进一步提升图像匹配的准确性。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,获取原始图像和目标图像之后,还可以包括:
获取图像标准尺寸,其中,图像标准尺寸包括标准宽度和标准高度;
根据图像标准尺寸,对目标图像的尺寸进行等比例缩放,得到目标缩放图像,其中,目标缩放图像的宽度与标准宽度相等,或,目标缩放图像的高度与标准高度相等;
在目标缩放图像满足图像拉伸条件的情况下,执行根据原始图像的版式,对目标图像进行尺寸调整,得到待匹配图像的步骤;
在目标缩放图像未满足图像拉伸条件的情况下,确定目标图像与原始图像匹配失败。
在一个或多个实施例中,介绍了一种对目标图像进行尺寸检测的方式。由前述实施例可知,为了提升图像匹配的准确性,还可以对用户上传的目标图像进行尺寸检测,对于存在严重变形的目标图像认为未满足图像拉伸条件,即,直接输出目标图像与原始图像匹配失败的结果。
具体地,预先定义一个图像标准尺寸,其中,图像标准尺寸包括标准宽度和标准高度。例如,标准宽度为400,标准高度为600。此时,对用户上传的目标图像进行等比例缩放,得到目标缩放图像。如果目标缩放图像的宽度与标准宽度的差异较小(例如,宽度差异在10%),或者,目标缩放图像的高度与标准高度的差异较小(例如,高度差异在10%),则认为目标缩放图像满足图像拉伸条件,由此,可继续执行后续的图像匹配流程。
其次,本申请实施例中,提供了一种对目标图像进行尺寸检测的方式。通过上述方式,对目标图像的拉伸变形程度进行检测,对于严重变形的目标图像而言,则不再进行后续的图像匹配。从而提升图像匹配的准确率和可靠性。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,目标缩放图像的宽度与标准宽度相等;
根据图像标准尺寸,对目标图像的尺寸进行等比例缩放,得到目标缩放图像之后,还可以包括:
根据目标缩放图像的高度和标准高度,确定目标缩放图像的高度变化幅度;
若目标缩放图像的高度变化幅度小于或等于幅度阈值,则确定目标缩放图像满足图像拉伸条件;
若目标缩放图像的高度变化幅度大于幅度阈值,则确定目标缩放图像未满足图像拉伸条件。
在一个或多个实施例中,介绍了一种基于图像高度判定是否满足图像拉伸条件的方式。由前述实施例可知,按照预先定义的图像标准尺寸,对用户上传的目标图像进行等比例缩放,得到目标缩放图像。下面将结合一个示例进行说明。
具体地,假设标准宽度为400,标准高度为600,目标图像的宽度为800,目标图像的高度为1000。基于此,对目标图像的尺寸进行等比例缩小,使得图像的宽度与标准宽度相等,由此,得到目标缩放图像。其中,目标缩放图像的的宽度等于400,目标缩放图像的的高度为500。由此,可采用如下方式计算目标缩放图像的高度变化幅度:
H_variety=|(H_target-H_standard)/H_standard×100%|;公式(1)
其中,H_variety表示高度变化幅度。H_target表示目标缩放图像的的高度。H_standard表示标准高度。|·|表示绝对值计算。
结合上述示例可知,H_target为500,H_standard为600。结合公式(1)计算得到高度变化幅度为16.7%。假设幅度阈值为10%,则高度变化幅度大于幅度阈值,因此,该目标缩放图像未满足图像拉伸条件。反之,如果高度变化幅度小于或等于幅度阈值,则认为目标缩放图像满足图像拉伸条件。
再次,本申请实施例中,提供了一种基于图像高度判定是否满足图像拉伸条件的方式。通过上述方式,为图像初步检测提供了具体实现手段,从而提升方案的可行性和可操作性。
可选地,在上述图5对应的一个或多个实施例的基础上,本申请实施例提供的另一个可选实施例中,目标缩放图像的高度与标准高度相等;
根据图像标准尺寸,对目标图像的尺寸进行等比例缩放,得到目标缩放图像之后,还可以包括:
根据目标缩放图像的宽度和标准宽度,确定目标缩放图像的宽度变化幅度;
若目标缩放图像的宽度变化幅度小于或等于幅度阈值,则确定目标缩放图像满足图像拉伸条件;
若目标缩放图像的宽度变化幅度大于幅度阈值,则确定目标缩放图像未满足图像拉伸条件。
在一个或多个实施例中,介绍了一种基于图像宽度判定是否满足图像拉伸条件的方式。由前述实施例可知,按照预先定义的图像标准尺寸,对用户上传的目标图像进行等比例缩放,得到目标缩放图像。下面将结合一个示例进行说明。
具体地,假设标准宽度为400,标准高度为600,目标图像的宽度为820,目标图像的高度为1200。基于此,对目标图像的尺寸进行等比例缩小,使得图像的高度与标准高度相等,由此,得到目标缩放图像。其中,目标缩放图像的的宽度等于410,目标缩放图像的的高度为600。由此,可采用如下方式计算目标缩放图像的宽度变化幅度:
W_variety=|(W_target-W_standard)/W_standard×100%|;公式(2)
其中,W_variety表示宽度变化幅度。W_target表示目标缩放图像的的宽度。W_standard表示标准宽度。|·|表示绝对值计算。
结合上述示例可知,W_target为410,W_standard为400。结合公式(2)计算得到宽度变化幅度为2.5%。假设幅度阈值为10%,则宽度变化幅度小于或等于幅度阈值,因此,该目标缩放图像满足图像拉伸条件。反之,如果宽度变化幅度大于幅度阈值,则认为目标缩放图像未满足图像拉伸条件。
再次,本申请实施例中,提供了一种基于图像宽度判定是否满足图像拉伸条件的方式。通过上述方式,为图像初步检测提供了具体实现手段,从而提升方案的可行性和可操作性。
下面对本申请中的图像检测装置进行详细描述,请参阅图14,图14为本申请实施例中图像检测装置的一个实施例示意图,图像检测装置30包括:
获取模块310,用于获取原始图像和目标图像,其中,原始图像与目标图像具有不同的版式;
调整模块320,用于根据原始图像的版式,对目标图像进行尺寸调整,得到待匹配图像,其中,待匹配图像与原始图像具有相等的宽度或高度;
处理模块330,用于基于待匹配图像,通过滑动窗口和预设滑动步长,对原始图像进行遍历处理,得到K个子图像,其中,滑动窗口的尺寸与待匹配图像的尺寸相同,每个子图像与待匹配图像具有相同尺寸,K为大于1的整数;
编码模块340,用于对待匹配图像和K个子图像进行哈希编码,得到至少一个相似度列表,其中,每个相似度列表包括K个相似距离,每个相似距离表示一个子图像与待匹配图像之间经过哈希编码后的相似程度,相似距离越小表示相似程度越高;
确定模块350,用于根据至少一个相似度列表,确定目标最小距离;
检测模块360,用于在目标最小距离小于或等于最小距离阈值的情况下,从原始图像中检测出与目标图像匹配成功的图像裁剪区域。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,原始图像的版式为横版版式,目标图像的版式为竖版版式,其中,横版版式表示图像宽度与图像高度之间比值大于1的版式,竖版版式表示图像宽度与图像高度之间比值小于1的版式;
调整模块320,具体用于根据横版版式,对目标图像的尺寸进行等比例缩放,得到待匹配图像,其中,待匹配图像与原始图像具有相等的高度;
处理模块330,具体用于基于待匹配图像的尺寸生成滑动窗口;
以由左至右或由右至左的顺序,通过滑动窗口和预设滑动步长,对原始图像进行遍历处理,得到K个子图像。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,
检测模块360,具体用于在以由左至右的顺序对原始图像进行遍历处理的情况下,获取目标最小距离所对应的左侧剪裁位置;
根据左侧剪裁位置和待匹配图像的宽度,确定右侧剪裁位置;
根据左侧剪裁位置和右侧剪裁位置,从原始图像中检测出与目标图像匹配成功的图像裁剪区域;
或者,
检测模块360,具体用于在以由右至左的顺序对原始图像进行遍历处理的情况下,获取目标最小距离所对应的右侧剪裁位置;
根据右侧剪裁位置和待匹配图像的宽度,确定左侧剪裁位置;
根据右侧剪裁位置和左侧剪裁位置,从原始图像中检测出与目标图像匹配成功的图像裁剪区域。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,原始图像的版式为横版版式,目标图像的版式为竖版版式,其中,横版版式表示图像宽度与图像高度之间比值大于1的版式,竖版版式表示图像宽度与图像高度之间比值小于1的版式;
调整模块320,具体用于根据竖版版式,对目标图像的尺寸进行等比例缩放,得到待匹配图像,其中,待匹配图像与原始图像具有相等的宽度;
处理模块330,具体用于基于待匹配图像的尺寸生成滑动窗口;
以由上至下或由下至上的顺序,通过滑动窗口和预设滑动步长,对原始图像进行遍历处理,得到K个子图像。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,
检测模块360,具体用于在以由上至下的顺序对原始图像进行遍历处理的情况下,获取目标最小距离所对应的上方剪裁位置;
根据上方剪裁位置和待匹配图像的高度,确定下方剪裁位置;
根据上方剪裁位置和下方剪裁位置,从原始图像中检测出与目标图像匹配成功的图像裁剪区域;
或者,
检测模块360,具体用于在以由下至上的顺序对原始图像进行遍历处理的情况下,获取目标最小距离所对应的下方剪裁位置;
根据下方剪裁位置和待匹配图像的高度,确定上方剪裁位置;
根据下方剪裁位置和上方剪裁位置,从原始图像中检测出与目标图像匹配成功的图像裁剪区域。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,
编码模块340,具体用于对待匹配图像和K个子图像进行感知哈希编码,得到图像感知相似列表,其中,图像感知相似列表属于至少一个相似度列表;
或者,
对待匹配图像和K个子图像进行均值哈希编码,得到图像均值相似列表,其中,图像均值相似列表属于至少一个相似度列表;
或者,
对待匹配图像和K个子图像进行差异哈希编码,得到图像差异相似列表,其中,图像差异相似列表属于至少一个相似度列表。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,
确定模块350,具体用于从图像感知相似列表所包括的K个相似距离中确定目标最小距离,其中,K个相似距离为K个感知相似距离,目标最小距离为K个感知相似距离中的最小感知相似距离;
或者,
从图像均值相似列表所包括的K个相似距离中确定目标最小距离,其中,K个相似距离为K个均值相似距离,目标最小距离为K个均值相似距离中的最小均值相似距离;
或者,
从图像差异相似列表所包括的K个相似距离中确定目标最小距离,其中,K个相似距离为K个差异相似距离,目标最小距离为K个差异相似距离中的最小差异相似距离。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,相似距离为感知相似距离;
编码模块340,具体用于对待匹配图像和K个子图像进行尺寸缩放处理,得到缩放后的待匹配图像和缩放后的K个子图像;
对缩放后的待匹配图像和缩放后的K个子图像进行灰度转换处理,得到待匹配灰度图和K个灰度子图像;
对待匹配灰度图和K个灰度子图像进行离散余弦变换处理,得到待匹配灰度图所对应的数据矩阵和K个灰度子图像中每个灰度子图像的数据矩阵;
根据待匹配灰度图所对应的数据矩阵和每个灰度子图像的数据矩阵,确定待匹配灰度图所对应的平均值和每个灰度子图像的平均值;
根据待匹配灰度图所对应的平均值和每个灰度子图像的平均值,生成待匹配灰度图的感知哈希编码结果和每个灰度子图像的感知哈希编码结果;
计算待匹配灰度图的感知哈希编码结果与每个灰度子图像的感知哈希编码结果之间的汉明距离,得到图像感知相似列表,其中,图像感知相似列表包括K个感知相似距离。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,相似距离为均值相似距离;
编码模块340,具体用于对待匹配图像和K个子图像进行尺寸缩放处理,得到缩放后的待匹配图像和缩放后的K个子图像;
对缩放后的待匹配图像和缩放后的K个子图像进行灰度转换处理,得到待匹配灰度图和K个灰度子图像;
对待匹配灰度图和K个灰度子图像进行像素点均值计算,得到待匹配灰度图所对应的像素平均值和K个灰度子图像中每个灰度子图像的像素平均值;
根据待匹配灰度图所对应的像素平均值和每个灰度子图像的像素平均值,生成待匹配灰度图的均值哈希编码结果和每个灰度子图像的均值哈希编码结果;
计算待匹配灰度图的均值哈希编码结果与每个灰度子图像的均值哈希编码结果之间的汉明距离,得到图像均值相似列表,其中,图像均值相似列表包括K个均值相似距离。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,相似距离为差异相似距离;
编码模块340,具体用于对待匹配图像和K个子图像进行尺寸缩放处理,得到缩放后的待匹配图像和缩放后的K个子图像;
对缩放后的待匹配图像和缩放后的K个子图像进行灰度转换处理,得到待匹配灰度图和K个灰度子图像;
对待匹配灰度图的每行相邻像素点进行像素值比对,得到待匹配灰度图的差异哈希编码结果;
对K个灰度子图像中的每个灰度子图像的每行相邻像素点进行像素值比对,得到每个灰度子图像的差异哈希编码结果;
计算待匹配灰度图的差异哈希编码结果与每个灰度子图像的差异哈希编码结果之间的汉明距离,得到图像差异相似列表,其中,图像差异相似列表包括K个差异相似距离。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,
编码模块340,具体用于对待匹配图像和K个子图像进行感知哈希编码,得到图像感知相似列表,其中,图像感知相似列表属于至少一个相似度列表;
对待匹配图像和K个子图像进行均值哈希编码,得到图像均值相似列表,其中,图像均值相似列表属于至少一个相似度列表;
确定模块350,具体用于根据图像感知相似列表和图像均值相似列表,生成第一综合列表,其中,第一综合列表包括K个第一综合距离,每个第一综合距离为根据对应的感知相似距离和均值相似距离计算得到的;
从第一综合列表所包括的K个第一综合距离中确定目标最小距离,其中,目标最小距离为K个第一综合距离中最小的第一综合距离。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,
编码模块340,具体用于对待匹配图像和K个子图像进行感知哈希编码,得到图像感知相似列表,其中,图像感知相似列表属于至少一个相似度列表;
对待匹配图像和K个子图像进行差异哈希编码,得到图像差异相似列表,其中,图像均值相似列表属于至少一个相似度列表;
确定模块350,具体用于根据图像感知相似列表和图像差异相似列表,生成第二综合列表,其中,第二综合列表包括K个第二综合距离,每个第二综合距离为根据对应的感知相似距离和差异相似距离计算得到的;
从第二综合列表所包括的K个第二综合距离中确定目标最小距离,其中,目标最小距离为K个第二综合距离中最小的第二综合距离。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,
编码模块340,具体用于对待匹配图像和K个子图像进行均值哈希编码,得到图像均值相似列表,其中,图像均值相似列表属于至少一个相似度列表;
对待匹配图像和K个子图像进行差异哈希编码,得到图像差异相似列表,其中,图像均值相似列表属于至少一个相似度列表;
确定模块350,具体用于根据图像均值相似列表和图像差异相似列表,生成第三综合列表,其中,第三综合列表包括K个第三综合距离,每个第三综合距离为根据对应的均值相似距离和差异相似距离计算得到的;
从第三综合列表所包括的K个第三综合距离中确定目标最小距离,其中,目标最小距离为K个第三综合距离中最小的第三综合距离。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,
编码模块340,具体用于对待匹配图像和K个子图像进行感知哈希编码,得到图像感知相似列表,其中,图像感知相似列表属于至少一个相似度列表;
对待匹配图像和K个子图像进行均值哈希编码,得到图像均值相似列表,其中,图像均值相似列表属于至少一个相似度列表;
对待匹配图像和K个子图像进行差异哈希编码,得到图像差异相似列表,其中,图像均值相似列表属于至少一个相似度列表;
确定模块350,具体用于根据图像感知相似列表、图像均值相似列表和图像差异相似列表,生成第四综合列表,其中,第四综合列表包括K个第四综合距离,每个第四综合距离为根据对应的感知相似距离、均值相似距离和差异相似距离计算得到的;
从第四综合列表所包括的K个第四综合距离中确定目标最小距离,其中,目标最小距离为K个第四综合距离中最小的第四综合距离。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,
获取模块310,还用于获取原始图像和目标图像之后,获取图像标准尺寸,其中,图像标准尺寸包括标准宽度和标准高度;
调整模块320,还用于根据图像标准尺寸,对目标图像的尺寸进行等比例缩放,得到目标缩放图像,其中,目标缩放图像的宽度与标准宽度相等,或,目标缩放图像的高度与标准高度相等;
处理模块330,还用于在目标缩放图像满足图像拉伸条件的情况下,执行根据原始图像的版式,对目标图像进行尺寸调整,得到待匹配图像的步骤;
确定模块350,还用于在目标缩放图像未满足图像拉伸条件的情况下,确定目标图像与原始图像匹配失败。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,目标缩放图像的宽度与标准宽度相等;
确定模块350,还用于根据图像标准尺寸,对目标图像的尺寸进行等比例缩放,得到目标缩放图像之后,根据目标缩放图像的高度和标准高度,确定目标缩放图像的高度变化幅度;
确定模块350,还用于若目标缩放图像的高度变化幅度小于或等于幅度阈值,则确定目标缩放图像满足图像拉伸条件;
确定模块350,还用于若目标缩放图像的高度变化幅度大于幅度阈值,则确定目标缩放图像未满足图像拉伸条件。
可选地,在上述图14所对应的实施例的基础上,本申请实施例提供的图像检测装置30的另一实施例中,目标缩放图像的高度与标准高度相等;
确定模块350,还用于根据图像标准尺寸,对目标图像的尺寸进行等比例缩放,得到目标缩放图像之后,根据目标缩放图像的宽度和标准宽度,确定目标缩放图像的宽度变化幅度;
确定模块350,还用于若目标缩放图像的宽度变化幅度小于或等于幅度阈值,则确定目标缩放图像满足图像拉伸条件;
确定模块350,还用于若目标缩放图像的宽度变化幅度大于幅度阈值,则确定目标缩放图像未满足图像拉伸条件。
图15是本申请实施例提供的一种计算机设备结构示意图,该计算机设备400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessing units,CPU)422(例如,一个或一个以上处理器)和存储器432,一个或一个以上存储应用程序442或数据444的存储介质430(例如一个或一个以上海量存储设备)。其中,存储器432和存储介质430可以是短暂存储或持久存储。存储在存储介质430的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对计算机设备中的一系列指令操作。更进一步地,中央处理器422可以设置为与存储介质430通信,在计算机设备400上执行存储介质430中的一系列指令操作。
计算机设备400还可以包括一个或一个以上电源426,一个或一个以上有线或无线网络接口450,一个或一个以上输入输出接口458,和/或,一个或一个以上操作系统441,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由计算机设备所执行的步骤可以基于该图15所示的计算机设备结构。
本申请实施例中还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现前述各个实施例描述方法的步骤。
本申请实施例中还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时,实现前述各个实施例描述方法的步骤。
可以理解的是,在本申请的具体实施方式中,涉及到用户信息、用户上传的图像等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是服务器或终端设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储计算机程序的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (20)
1.一种图像检测的方法,其特征在于,包括:
获取原始图像和目标图像,其中,所述原始图像与所述目标图像具有不同的版式;
根据所述原始图像的版式,对所述目标图像进行尺寸调整,得到待匹配图像,其中,所述待匹配图像与所述原始图像具有相等的宽度或高度;
基于所述待匹配图像,通过滑动窗口和预设滑动步长,对所述原始图像进行遍历处理,得到K个子图像,其中,所述滑动窗口的尺寸与所述待匹配图像的尺寸相同,每个子图像与所述待匹配图像具有相同尺寸,所述K为大于1的整数;
对所述待匹配图像和所述K个子图像进行哈希编码,得到至少一个相似度列表,其中,每个相似度列表包括K个相似距离,每个相似距离表示一个子图像与所述待匹配图像之间经过哈希编码后的相似程度,所述相似距离越小表示所述相似程度越高;
根据所述至少一个相似度列表,确定目标最小距离;
在所述目标最小距离小于或等于最小距离阈值的情况下,从所述原始图像中检测出与所述目标图像匹配成功的图像裁剪区域。
2.根据权利要求1所述的方法,其特征在于,所述原始图像的版式为横版版式,所述目标图像的版式为竖版版式,其中,所述横版版式表示图像宽度与图像高度之间比值大于1的版式,所述竖版版式表示图像宽度与图像高度之间比值小于1的版式;
所述根据所述原始图像的版式,对所述目标图像进行尺寸调整,得到待匹配图像,包括:
根据所述横版版式,对所述目标图像的尺寸进行等比例缩放,得到所述待匹配图像,其中,所述待匹配图像与所述原始图像具有相等的高度;
所述基于所述待匹配图像,通过滑动窗口和预设滑动步长,对所述原始图像进行遍历处理,得到K个子图像,包括:
基于所述待匹配图像的尺寸生成所述滑动窗口;
以由左至右或由右至左的顺序,通过所述滑动窗口和所述预设滑动步长,对所述原始图像进行遍历处理,得到所述K个子图像。
3.根据权利要求2所述的方法,其特征在于,所述从所述原始图像中检测出与所述目标图像匹配成功的图像裁剪区域,包括:
在以由左至右的顺序对所述原始图像进行遍历处理的情况下,获取所述目标最小距离所对应的左侧剪裁位置;
根据所述左侧剪裁位置和所述待匹配图像的宽度,确定右侧剪裁位置;
根据所述左侧剪裁位置和所述右侧剪裁位置,从所述原始图像中检测出与所述目标图像匹配成功的图像裁剪区域;
或者,
所述从所述原始图像中检测出与所述目标图像匹配成功的图像裁剪区域,包括:
在以由右至左的顺序对所述原始图像进行遍历处理的情况下,获取所述目标最小距离所对应的右侧剪裁位置;
根据所述右侧剪裁位置和所述待匹配图像的宽度,确定左侧剪裁位置;
根据所述右侧剪裁位置和所述左侧剪裁位置,从所述原始图像中检测出与所述目标图像匹配成功的图像裁剪区域。
4.根据权利要求1所述的方法,其特征在于,所述原始图像的版式为横版版式,所述目标图像的版式为竖版版式,其中,所述横版版式表示图像宽度与图像高度之间比值大于1的版式,所述竖版版式表示图像宽度与图像高度之间比值小于1的版式;
所述根据所述原始图像的版式,对所述目标图像进行尺寸调整,得到待匹配图像,包括:
根据所述竖版版式,对所述目标图像的尺寸进行等比例缩放,得到所述待匹配图像,其中,所述待匹配图像与所述原始图像具有相等的宽度;
所述基于所述待匹配图像,通过滑动窗口和预设滑动步长,对所述原始图像进行遍历处理,得到K个子图像,包括:
基于所述待匹配图像的尺寸生成所述滑动窗口;
以由上至下或由下至上的顺序,通过所述滑动窗口和所述预设滑动步长,对所述原始图像进行遍历处理,得到所述K个子图像。
5.根据权利要求4所述的方法,其特征在于,所述从所述原始图像中检测出与所述目标图像匹配成功的图像裁剪区域,包括:
在以由上至下的顺序对所述原始图像进行遍历处理的情况下,获取所述目标最小距离所对应的上方剪裁位置;
根据所述上方剪裁位置和所述待匹配图像的高度,确定下方剪裁位置;
根据所述上方剪裁位置和所述下方剪裁位置,从所述原始图像中检测出与所述目标图像匹配成功的图像裁剪区域;
或者,
所述从所述原始图像中检测出与所述目标图像匹配成功的图像裁剪区域,包括:
在以由下至上的顺序对所述原始图像进行遍历处理的情况下,获取所述目标最小距离所对应的下方剪裁位置;
根据所述下方剪裁位置和所述待匹配图像的高度,确定上方剪裁位置;
根据所述下方剪裁位置和所述上方剪裁位置,从所述原始图像中检测出与所述目标图像匹配成功的图像裁剪区域。
6.根据权利要求1所述的方法,其特征在于,所述对所述待匹配图像和所述K个子图像进行哈希编码,得到至少一个相似度列表,包括:
对所述待匹配图像和所述K个子图像进行感知哈希编码,得到图像感知相似列表,其中,所述图像感知相似列表属于所述至少一个相似度列表;
或者,
对所述待匹配图像和所述K个子图像进行均值哈希编码,得到图像均值相似列表,其中,所述图像均值相似列表属于所述至少一个相似度列表;
或者,
对所述待匹配图像和所述K个子图像进行差异哈希编码,得到图像差异相似列表,其中,所述图像差异相似列表属于所述至少一个相似度列表。
7.根据权利要求6所述的方法,其特征在于,所述根据所述至少一个相似度列表,确定目标最小距离,包括:
从所述图像感知相似列表所包括的K个相似距离中确定所述目标最小距离,其中,所述K个相似距离为K个感知相似距离,所述目标最小距离为所述K个感知相似距离中的最小感知相似距离;
或者,
从所述图像均值相似列表所包括的K个相似距离中确定所述目标最小距离,其中,所述K个相似距离为K个均值相似距离,所述目标最小距离为所述K个均值相似距离中的最小均值相似距离;
或者,
从所述图像差异相似列表所包括的K个相似距离中确定所述目标最小距离,其中,所述K个相似距离为K个差异相似距离,所述目标最小距离为所述K个差异相似距离中的最小差异相似距离。
8.根据权利要求6所述的方法,其特征在于,所述相似距离为感知相似距离;
所述对所述待匹配图像和所述K个子图像进行感知哈希编码,得到图像感知相似列表,包括:
对所述待匹配图像和所述K个子图像进行尺寸缩放处理,得到缩放后的待匹配图像和缩放后的K个子图像;
对所述缩放后的待匹配图像和所述缩放后的K个子图像进行灰度转换处理,得到待匹配灰度图和K个灰度子图像;
对所述待匹配灰度图和所述K个灰度子图像进行离散余弦变换处理,得到所述待匹配灰度图所对应的数据矩阵和所述K个灰度子图像中每个灰度子图像的数据矩阵;
根据所述待匹配灰度图所对应的数据矩阵和所述每个灰度子图像的数据矩阵,确定所述待匹配灰度图所对应的平均值和所述每个灰度子图像的平均值;
根据所述待匹配灰度图所对应的平均值和所述每个灰度子图像的平均值,生成所述待匹配灰度图的感知哈希编码结果和所述每个灰度子图像的感知哈希编码结果;
计算所述待匹配灰度图的感知哈希编码结果与所述每个灰度子图像的感知哈希编码结果之间的汉明距离,得到所述图像感知相似列表,其中,所述图像感知相似列表包括K个感知相似距离。
9.根据权利要求6所述的方法,其特征在于,所述相似距离为均值相似距离;
所述对所述待匹配图像和所述K个子图像进行均值哈希编码,得到图像均值相似列表,包括:
对所述待匹配图像和所述K个子图像进行尺寸缩放处理,得到缩放后的待匹配图像和缩放后的K个子图像;
对所述缩放后的待匹配图像和所述缩放后的K个子图像进行灰度转换处理,得到待匹配灰度图和K个灰度子图像;
对所述待匹配灰度图和所述K个灰度子图像进行像素点均值计算,得到所述待匹配灰度图所对应的像素平均值和所述K个灰度子图像中每个灰度子图像的像素平均值;
根据所述待匹配灰度图所对应的像素平均值和所述每个灰度子图像的像素平均值,生成所述待匹配灰度图的均值哈希编码结果和所述每个灰度子图像的均值哈希编码结果;
计算所述待匹配灰度图的均值哈希编码结果与所述每个灰度子图像的均值哈希编码结果之间的汉明距离,得到所述图像均值相似列表,其中,所述图像均值相似列表包括K个均值相似距离。
10.根据权利要求6所述的方法,其特征在于,所述相似距离为差异相似距离;
所述对所述待匹配图像和所述K个子图像进行差异哈希编码,得到图像差异相似列表,包括:
对所述待匹配图像和所述K个子图像进行尺寸缩放处理,得到缩放后的待匹配图像和缩放后的K个子图像;
对所述缩放后的待匹配图像和所述缩放后的K个子图像进行灰度转换处理,得到待匹配灰度图和K个灰度子图像;
对所述待匹配灰度图的每行相邻像素点进行像素值比对,得到所述待匹配灰度图的差异哈希编码结果;
对所述K个灰度子图像中的每个灰度子图像的每行相邻像素点进行像素值比对,得到所述每个灰度子图像的差异哈希编码结果;
计算所述待匹配灰度图的差异哈希编码结果与所述每个灰度子图像的差异哈希编码结果之间的汉明距离,得到所述图像差异相似列表,其中,所述图像差异相似列表包括K个差异相似距离。
11.根据权利要求1所述的方法,其特征在于,所述对所述待匹配图像和所述K个子图像进行哈希编码,得到至少一个相似度列表,包括:
对所述待匹配图像和所述K个子图像进行感知哈希编码,得到图像感知相似列表,其中,所述图像感知相似列表属于所述至少一个相似度列表;
对所述待匹配图像和所述K个子图像进行均值哈希编码,得到图像均值相似列表,其中,所述图像均值相似列表属于所述至少一个相似度列表;
所述根据所述至少一个相似度列表,确定目标最小距离,包括:
根据所述图像感知相似列表和所述图像均值相似列表,生成第一综合列表,其中,所述第一综合列表包括K个第一综合距离,每个第一综合距离为根据对应的感知相似距离和均值相似距离计算得到的;
从所述第一综合列表所包括的K个第一综合距离中确定所述目标最小距离,其中,所述目标最小距离为所述K个第一综合距离中最小的第一综合距离。
12.根据权利要求1所述的方法,其特征在于,所述对所述待匹配图像和所述K个子图像进行哈希编码,得到至少一个相似度列表,包括:
对所述待匹配图像和所述K个子图像进行感知哈希编码,得到图像感知相似列表,其中,所述图像感知相似列表属于所述至少一个相似度列表;
对所述待匹配图像和所述K个子图像进行差异哈希编码,得到图像差异相似列表,其中,所述图像均值相似列表属于所述至少一个相似度列表;
所述根据所述至少一个相似度列表,确定目标最小距离,包括:
根据所述图像感知相似列表和所述图像差异相似列表,生成第二综合列表,其中,所述第二综合列表包括K个第二综合距离,每个第二综合距离为根据对应的感知相似距离和差异相似距离计算得到的;
从所述第二综合列表所包括的K个第二综合距离中确定所述目标最小距离,其中,所述目标最小距离为所述K个第二综合距离中最小的第二综合距离。
13.根据权利要求1所述的方法,其特征在于,所述对所述待匹配图像和所述K个子图像进行哈希编码,得到至少一个相似度列表,包括:
对所述待匹配图像和所述K个子图像进行均值哈希编码,得到图像均值相似列表,其中,所述图像均值相似列表属于所述至少一个相似度列表;
对所述待匹配图像和所述K个子图像进行差异哈希编码,得到图像差异相似列表,其中,所述图像均值相似列表属于所述至少一个相似度列表;
所述根据所述至少一个相似度列表,确定目标最小距离,包括:
根据所述图像均值相似列表和所述图像差异相似列表,生成第三综合列表,其中,所述第三综合列表包括K个第三综合距离,每个第三综合距离为根据对应的均值相似距离和差异相似距离计算得到的;
从所述第三综合列表所包括的K个第三综合距离中确定所述目标最小距离,其中,所述目标最小距离为所述K个第三综合距离中最小的第三综合距离。
14.根据权利要求1所述的方法,其特征在于,所述对所述待匹配图像和所述K个子图像进行哈希编码,得到至少一个相似度列表,包括:
对所述待匹配图像和所述K个子图像进行感知哈希编码,得到图像感知相似列表,其中,所述图像感知相似列表属于所述至少一个相似度列表;
对所述待匹配图像和所述K个子图像进行均值哈希编码,得到图像均值相似列表,其中,所述图像均值相似列表属于所述至少一个相似度列表;
对所述待匹配图像和所述K个子图像进行差异哈希编码,得到图像差异相似列表,其中,所述图像均值相似列表属于所述至少一个相似度列表;
所述根据所述至少一个相似度列表,确定目标最小距离,包括:
根据所述图像感知相似列表、所述图像均值相似列表和所述图像差异相似列表,生成第四综合列表,其中,所述第四综合列表包括K个第四综合距离,每个第四综合距离为根据对应的感知相似距离、均值相似距离和差异相似距离计算得到的;
从所述第四综合列表所包括的K个第四综合距离中确定所述目标最小距离,其中,所述目标最小距离为所述K个第四综合距离中最小的第四综合距离。
15.根据权利要求1至14中任一项所述的方法,其特征在于,所述获取原始图像和目标图像之后,所述方法还包括:
获取图像标准尺寸,其中,所述图像标准尺寸包括标准宽度和标准高度;
根据所述图像标准尺寸,对所述目标图像的尺寸进行等比例缩放,得到目标缩放图像,其中,所述目标缩放图像的宽度与所述标准宽度相等,或,所述目标缩放图像的高度与所述标准高度相等;
在所述目标缩放图像满足图像拉伸条件的情况下,执行所述根据所述原始图像的版式,对所述目标图像进行尺寸调整,得到待匹配图像的步骤;
在所述目标缩放图像未满足所述图像拉伸条件的情况下,确定所述目标图像与所述原始图像匹配失败。
16.根据权利要求15所述的方法,其特征在于,所述目标缩放图像的宽度与所述标准宽度相等;
所述根据所述图像标准尺寸,对所述目标图像的尺寸进行等比例缩放,得到目标缩放图像之后,所述方法还包括:
根据所述目标缩放图像的高度和所述标准高度,确定所述目标缩放图像的高度变化幅度;
若所述目标缩放图像的高度变化幅度小于或等于幅度阈值,则确定所述目标缩放图像满足所述图像拉伸条件;
若所述目标缩放图像的高度变化幅度大于所述幅度阈值,则确定所述目标缩放图像未满足所述图像拉伸条件。
17.根据权利要求15所述的方法,其特征在于,所述目标缩放图像的高度与所述标准高度相等;
所述根据所述图像标准尺寸,对所述目标图像的尺寸进行等比例缩放,得到目标缩放图像之后,所述方法还包括:
根据所述目标缩放图像的宽度和所述标准宽度,确定所述目标缩放图像的宽度变化幅度;
若所述目标缩放图像的宽度变化幅度小于或等于幅度阈值,则确定所述目标缩放图像满足所述图像拉伸条件;
若所述目标缩放图像的宽度变化幅度大于所述幅度阈值,则确定所述目标缩放图像未满足所述图像拉伸条件。
18.一种图像检测装置,其特征在于,包括:
获取模块,用于获取原始图像和目标图像,其中,所述原始图像与所述目标图像具有不同的版式;
调整模块,用于根据所述原始图像的版式,对所述目标图像进行尺寸调整,得到待匹配图像,其中,所述待匹配图像与所述原始图像具有相等的宽度或高度;
处理模块,用于基于所述待匹配图像,通过滑动窗口和预设滑动步长,对所述原始图像进行遍历处理,得到K个子图像,其中,所述滑动窗口的尺寸与所述待匹配图像的尺寸相同,每个子图像与所述待匹配图像具有相同尺寸,所述K为大于1的整数;
编码模块,用于对所述待匹配图像和所述K个子图像进行哈希编码,得到至少一个相似度列表,其中,每个相似度列表包括K个相似距离,每个相似距离表示一个子图像与所述待匹配图像之间经过哈希编码后的相似程度,所述相似距离越小表示所述相似程度越高;
确定模块,用于根据所述至少一个相似度列表,确定目标最小距离;
检测模块,用于在所述目标最小距离小于或等于最小距离阈值的情况下,从所述原始图像中检测出与所述目标图像匹配成功的图像裁剪区域。
19.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至17中任一项所述的方法的步骤。
20.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至17中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311438209.1A CN117372731A (zh) | 2023-10-31 | 2023-10-31 | 一种图像检测的方法、相关装置、设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311438209.1A CN117372731A (zh) | 2023-10-31 | 2023-10-31 | 一种图像检测的方法、相关装置、设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117372731A true CN117372731A (zh) | 2024-01-09 |
Family
ID=89394475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311438209.1A Pending CN117372731A (zh) | 2023-10-31 | 2023-10-31 | 一种图像检测的方法、相关装置、设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117372731A (zh) |
-
2023
- 2023-10-31 CN CN202311438209.1A patent/CN117372731A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020192391A1 (zh) | 基于ocr的图像转档方法、装置、设备及可读存储介质 | |
CN109493350B (zh) | 人像分割方法及装置 | |
JP4545641B2 (ja) | 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体 | |
US9569855B2 (en) | Apparatus and method for extracting object of interest from image using image matting based on global contrast | |
CN110866896B (zh) | 基于k-means与水平集超像素分割的图像显著性目标检测方法 | |
US20100045663A1 (en) | Method and apparatus for identifying visual content foregrounds | |
CN104661037B (zh) | 压缩图像量化表篡改的检测方法和系统 | |
CN105550641B (zh) | 基于多尺度线性差分纹理特征的年龄估计方法和系统 | |
CN109886223B (zh) | 人脸识别方法、底库录入方法、装置及电子设备 | |
CN105335469A (zh) | 一种图像匹配、检索方法和装置 | |
WO2021175040A1 (zh) | 视频处理方法及相关装置 | |
CN104036280A (zh) | 基于感兴趣区域和聚类相结合的视频指纹方法 | |
US20190311744A1 (en) | Comparing frame data to generate a textless version of a multimedia production | |
CN111612004A (zh) | 一种基于语义内容的图像裁剪方法及装置 | |
WO2017070841A1 (zh) | 图像处理方法和装置 | |
CN113870283B (zh) | 人像抠图方法、装置、计算机设备及可读存储介质 | |
CN114494775A (zh) | 视频切分方法、装置、设备及存储介质 | |
CN113628181A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
JP6202938B2 (ja) | 画像認識装置および画像認識方法 | |
Yu et al. | Robust image hashing with saliency map and sparse model | |
CN110660091A (zh) | 一种图像配准处理方法、装置和拍照批改作业系统 | |
CN117372731A (zh) | 一种图像检测的方法、相关装置、设备以及存储介质 | |
JP6778625B2 (ja) | 画像検索システム、画像検索方法及び画像検索プログラム | |
EP2884427B1 (en) | Method and system for describing an image | |
KR101643550B1 (ko) | 비선형 공간에서 고속 선명도 확산 방법을 이용하여 색상불변 특성을 검출하고 표현하는 시스템 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |