CN114842342A - 一种基于人工智能的杂乱场景检测方法、装置及相关设备 - Google Patents

一种基于人工智能的杂乱场景检测方法、装置及相关设备 Download PDF

Info

Publication number
CN114842342A
CN114842342A CN202210530951.4A CN202210530951A CN114842342A CN 114842342 A CN114842342 A CN 114842342A CN 202210530951 A CN202210530951 A CN 202210530951A CN 114842342 A CN114842342 A CN 114842342A
Authority
CN
China
Prior art keywords
image
similarity value
similarity
style
regular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210530951.4A
Other languages
English (en)
Other versions
CN114842342B (zh
Inventor
王欢
李英杰
曾波
黎致斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nets Technology Group Co ltd
Original Assignee
Networks Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Networks Technology Co ltd filed Critical Networks Technology Co ltd
Priority to CN202210530951.4A priority Critical patent/CN114842342B/zh
Publication of CN114842342A publication Critical patent/CN114842342A/zh
Application granted granted Critical
Publication of CN114842342B publication Critical patent/CN114842342B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种基于人工智能的杂乱场景检测方法、装置及相关设备,该方法包括:通过检测模型对待检测的第一图像进行风格迁移,得到经过风格迁移的第二图像,并计算第一图像与第二图像的相似度值;基于该相似度值确定第一图像是否为杂乱场景;其中,该检测模型被配置为,具备对图像进行风格迁移的能力,且被标注为杂乱场景的第一杂乱图像,与对该第一杂乱图像进行风格迁移后得到的第二杂乱图像的相似度值落在预设的相似度范围之内;被标注为规整场景的第一规整图像,与对该第一规整图像进行风格迁移后得到的第二规整图像的相似度值落在该相似度范围之外。本申请通过训练后的检测模型对杂乱场景进行自动检测,相比于人工方式具有更高的检测效率。

Description

一种基于人工智能的杂乱场景检测方法、装置及相关设备
技术领域
本申请涉及场景检测技术领域,更具体地说,是涉及一种基于人工智能的杂乱场景检测方法、装置及相关设备。
背景技术
在物资富裕的时代,杂乱场景已经慢慢地入侵了我们的工作和生活中。例如,仓库摆放杂乱、车辆停放杂乱、机柜线缆杂乱等等,而物品摆放整齐是相当重要的。例如,对于仓库摆放来说,物品摆放杂乱会降低物品出库入库的效率,此外,还会造成消防隐患;对于车辆停放来说,车辆停放杂乱容易造成车场空间利用率低,甚至会造成部分车辆难以进出的后果;对于机柜的线缆来说,规范整齐的排布可以减少线缆空间的占用,使得设备散热气流通畅,以及使得管理和维护更加方便高效,在日后维护工作中可以快速对线缆走向进行定位和操作。
目前,普遍通过人工巡查或者通过人工对监控画面进行识别的方式来检测出场景是否杂乱,这种方式下存在耗时、效率低的问题,有必要设计一种对杂乱场景进行自动检测的技术方案。
发明内容
有鉴于此,本申请提供了一种基于人工智能的杂乱场景检测方法、装置及相关设备,以实现杂乱场景的自动检测。
为实现上述目的,本申请第一方面提供了一种基于人工智能的杂乱场景检测方法,包括:
通过检测模型对待检测的第一图像进行风格迁移,得到经过风格迁移的第二图像;
获取第一图像与第二图像的相似度值,所述相似度值用于衡量第一图像与第二图像的相似程度;
基于所述相似度值确定所述第一图像是否为杂乱场景;
其中,所述检测模型被配置为,具备对图像进行风格迁移的能力,且被标注为杂乱场景的第一杂乱图像,与对所述第一杂乱图像进行风格迁移后得到的第二杂乱图像的相似度值落在预设的相似度范围之内;被标注为规整场景的第一规整图像,与对所述第一规整图像进行风格迁移后得到的第二规整图像的相似度值落在所述相似度范围之外。
优选地,所述获取第一图像与第二图像的相似度值的过程,包括:
采用同样的划分方式,将待检测的第一图像划分成尺寸相等且互不重合的多个图像区域,以及将第二图像划分成尺寸相等且互不重合的多个迁移后图像区域;
针对每一图像区域,计算所述图像区域与跟所述图像区域对应的迁移后图像区域的特征差异,得到所述图像区域与所述迁移后图像区域的相似度值。
优选地,计算所述图像区域与跟所述图像区域对应的迁移后图像区域的特征差异,得到所述图像区域与所述迁移后图像区域的相似度值的过程,包括:
通过局部二值模式LBP算法提取所述图像区域的纹理特征,得到第一直方图;
通过LBP算法提取跟所述图像区域对应的迁移后图像区域的纹理特征,得到第二直方图;
利用预设的相似性度量函数计算第一直方图和第二直方图的相似程度,得到所述图像区域与所述迁移后图像区域的相似度值。
优选地,基于所述相似度值确定所述第一图像是否为杂乱场景的过程,包括:
获取相似度值落在所述相似度范围之内的各目标图像区域,并计算得到各目标图像区域相对于各图像区域的比值;
判断所述比值是否达到预设比值,若是,确定所述图像为杂乱场景。
优选地,得到所述图像区域与所述迁移后图像区域的相似度值之后,还包括:
判断所述图像区域与所述迁移后图像区域的相似度值是否落在所述相似度范围之内;
若是,确定所述图像区域为杂乱场景。
优选地,通过检测模型对待检测的第一图像进行风格迁移之前,还包括:
对待检测的第一图像进行灰度化处理。
优选地,所述检测模型的训练过程,包括:
获取风格图像、若干被标注为杂乱场景的第一杂乱图像以及若干被标注为规整场景的第一规则图像;
针对每一第一杂乱图像,通过所述检测模型将所述风格图像的风格特征迁移到所述第一杂乱图像中,得到经过风格迁移的第二杂乱图像,并计算得到所述第一杂乱图像与所述第二杂乱图像的第一相似度值;
针对每一第一规则图像,通过所述检测模型将所述风格图像的风格特征迁移到所述第一规则图像中,得到经过风格迁移的第二规则图像,并计算得到所述第一规则图像与所述第二规则图像的第二相似度值;
以所述第一相似度值趋近于所述相似度范围,所述第二相似度值远离所述相似度范围,以及所述检测模型的风格损失和内容损失最小化为目标,更新所述检测模型的风格参数。
本申请第二方面提供了一种基于人工智能的杂乱场景检测装置,包括:
风格迁移单元,用于通过检测模型对待检测的第一图像进行风格迁移,得到经过风格迁移的第二图像;
差异计算单元,用于获取第一图像与第二图像的相似度值,所述相似度值用于衡量第一图像与第二图像的相似程度;
杂乱判断单元,用于基于所述相似度值确定所述第一图像是否为杂乱场景;
其中,所述检测模型被配置为,具备对图像进行风格迁移的能力,且被标注为杂乱场景的第一杂乱图像,与对所述第一杂乱图像进行风格迁移后得到的第二杂乱图像的相似度值落在预设的相似度范围之内;被标注为规整场景的第一规整图像,与对所述第一规整图像进行风格迁移后得到的第二规整图像的相似度值落在所述相似度范围之外。
本申请第三方面提供了一种基于人工智能的杂乱场景检测设备,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现上述的基于人工智能的杂乱场景检测方法的各个步骤。
本申请第四方面提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述的基于人工智能的杂乱场景检测方法的各个步骤。
经由上述的技术方案可知,本申请首先准备好训练后的检测模型,其中,所述检测模型被配置为,具备对图像进行风格迁移的能力,且被标注为杂乱场景的第一杂乱图像,与对所述第一杂乱图像进行风格迁移后得到的第二杂乱图像的相似度值落在预设的相似度范围之内;被标注为规整场景的第一规整图像,与对所述第一规整图像进行风格迁移后得到的第二规整图像的相似度值落在所述相似度范围之外。接着,通过所述检测模型对待检测的第一图像进行风格迁移,得到经过风格迁移的第二图像。然后,获取第一图像与第二图像的相似度值,其中,所述相似度值用于衡量第一图像与第二图像的相似程度。由于所述检测模型对于杂乱场景的图像所计算得到的相似度值落在所述相似度范围之内,对于规则场景的图像所计算得到的相似度值落在所述相似度范围之外,因此,基于所述相似度值可以确定所述第一图像是否为杂乱场景。本申请通过训练后的检测模型对杂乱场景进行自动检测,相比于人工方式具有更高的检测效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例公开的基于人工智能的杂乱场景检测方法的示意图;
图2为本申请实施例公开的基于人工智能的杂乱场景检测方法的另一示意图;
图3示例了本申请实施例公开的图像区域及其迁移后图像区域的示意图;
图4示例了本申请实施例公开的直方图的示意图;
图5为本申请实施例公开的基于人工智能的杂乱场景检测装置的示意图;
图6为本申请实施例公开的基于人工智能的杂乱场景检测装置的另一示意图;
图7为本申请实施例公开的基于人工智能的杂乱场景检测装置的另一示意图;
图8为本申请实施例公开的基于人工智能的杂乱场景检测设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在一张图像中,各对象的排列规整可描述为线条、形状在方向、间隔和角度上相对一致。与之相对,则可以看作杂乱。从画面风格的角度来描述,杂乱可以看成是一种风格滤镜,可以通过神经网络将其中隐藏的特征提取出来,然后进一步分析计算。下面介绍本申请实施例提供的基于人工智能的杂乱场景检测方法。请参阅图1,本申请实施例提供的基于人工智能的杂乱场景检测方法可以包括如下步骤:
步骤S101,通过检测模型对待检测的第一图像进行风格迁移,得到经过风格迁移的第二图像。
其中,该检测是预训练的,经过训练后,该检测模型被配置为,具备对图像进行风格迁移的能力,且被标注为杂乱场景的第一杂乱图像,与对该第一杂乱图像进行风格迁移后得到的第二杂乱图像的相似度值落在预设的相似度范围之内;被标注为规整场景的第一规整图像,与对该第一规整图像进行风格迁移后得到的第二规整图像的相似度值落在该相似度范围之外。
该检测模型可以包含VGG19网络或者VGG16网络,将预先定义好的风格图像与该待检测的第一图像输入至该检测模型,则可以得到各层卷积层的特征图,结合该检测模型的风格参数,可以得到由这些特征图确定的输出,该输出即构成经过风格迁移的第二图像。
步骤S102,获取第一图像与第二图像的相似度值。
其中,该相似度值用于衡量第一图像与第二图像的相似程度。
步骤S103,基于该相似度值确定该第一图像是否为杂乱场景。
可以理解的是,当前面提及的预先定义好的风格图像为包含杂乱场景的风格图像时,通过检测模型将该包含杂乱场景的风格图像的风格迁移到第一图像后,所得到的第二图像也会具备杂乱风格的特征。这种情况下,假如第一图像与第二图像的相似程度比较大,即第一图像与第二图像的差异比较小,风格迁移这一操作对第一图像的更改比较小,意味着第一图像可能本身就包含杂乱场景。相反地,假如第一图像与第二图像的相似程度比较小,则意味着第一图像可能是一规则场景的图像。
本申请实施例首先获取训练后的检测模型,其中,该检测模型被配置为,具备对图像进行风格迁移的能力,且被标注为杂乱场景的第一杂乱图像,与对该第一杂乱图像进行风格迁移后得到的第二杂乱图像的相似度值落在预设的相似度范围之内;被标注为规整场景的第一规整图像,与对该第一规整图像进行风格迁移后得到的第二规整图像的相似度值落在该相似度范围之外。接着,通过该检测模型对待检测的第一图像进行风格迁移,得到经过风格迁移的第二图像。然后,获取第一图像与第二图像的相似度值,其中,该相似度值用于衡量第一图像与第二图像的相似程度。由于该检测模型对于杂乱场景的图像所计算得到的相似度值落在该相似度范围之内,对于规则场景的图像所计算得到的相似度值落在该相似度范围之外,因此,基于该相似度值可以确定该第一图像是否为杂乱场景。本申请实施例通过训练后的检测模型对杂乱场景进行自动检测,相比于人工方式具有更高的检测效率。
在本申请的一些实施例中,该检测模型的训练过程,可以包括:
S1,获取风格图像、若干被标注为杂乱场景的第一杂乱图像以及若干被标注为规整场景的第一规则图像。
例如,可以将一张包含典型杂乱场景的图像作为风格图像,该风格图像在风格迁移中用作风格参考,即,将该风格图像的风格迁移到待处理的图像中;可以准备第一杂乱图像及第一规则图像各10张,作为训练样本。
S2,针对每一第一杂乱图像,通过该检测模型将该风格图像的风格特征迁移到该第一杂乱图像中,得到经过风格迁移的第二杂乱图像,并计算得到该第一杂乱图像与该第二杂乱图像的第一相似度值。
可以理解的是,对于10张第一杂乱图像的情况,可以计算得到10个第一相似度值。
S3,针对每一第一规则图像,通过该检测模型将该风格图像的风格特征迁移到该第一规则图像中,得到经过风格迁移的第二规则图像,并计算得到该第一规则图像与该第二规则图像的第二相似度值。
同样地,对于10张第一规整图像的情况,可以计算得到10个第二相似度值。
S4,以该第一相似度值趋近于该相似度范围,该第二相似度值远离该相似度范围,以及该检测模型的风格损失和内容损失最小化为目标,更新该检测模型的风格参数。
具体地,该检测模型可以包含多个卷积层,每个卷积层里面有可以包含不同规则的卷积核。以上述S2的操作为例,将风格图像和作为内容图的第一杂乱图像作为输入,经过该检测模型,得到各层卷积层的特征图,在这些特征图中,层数越浅,记录内容图的特征图越具体,层数越深则越抽象;从风格图像的角度来说,层数越浅的特征图则记录着颜色纹理等信息,而层数越深的特征图则会记录更高级的信息。
假设在风格迁移过程中,在某一层得到的响应是
Figure BDA0003646459990000071
其中,Nl为l层的过滤器的个数,Ml为l层的过滤器的大小,
Figure BDA0003646459990000072
表示第l个过滤器在位置j的输出,p表示提供内容的图像(内容图像),x表示生成的图像(生成图像),Pl和Fl分别代表内容图像和生成图像对于l层的响应,那么,风格损失函数可以表示为:
Figure BDA0003646459990000073
内容损失函数可以表示为:
Figure BDA0003646459990000074
可以理解的是,风格参数可以包含卷积层的层数以及卷积层中的卷积核等组件的具体参数,例如输入矩阵的形状(shape),卷积核的宽(w)和高(h),输入矩阵pad的信息,输入矩阵的dilation信息等。第一相似度值与第二相似度值之间的差距越大,意味着风格参数越合适,检测模型能更有效地区分杂乱图像和规则图像。
在本申请的一些实施例中,请参阅图2,在上述步骤S101通过检测模型对待检测的第一图像进行风格迁移之前,还可以包括:
步骤S104,对待检测的第一图像进行灰度化处理。
通过对第一图像进行灰度化处理,过滤掉第一图像中的色彩特征,使得可以从图像的线条、角度等特征进行杂乱风格评估,有利于提高运算效率。
在本申请的一些实施例中,上述步骤S102获取第一图像与第二图像的相似度值的过程,可以包括:
S1,采用同样的划分方式,将待检测的第一图像划分成尺寸相等且互不重合的多个图像区域,以及将第二图像划分成尺寸相等且互不重合的多个迁移后图像区域。
示例性地,请参阅图3,假设第一图像的尺寸为100×100像素,将其划分为25个图像区域(A1~A5、B1~B5、…、E1~E5),每个图像区域的尺寸为20×20;同样地,将第二图像划分成25个尺寸为20×20的迁移后图像区域(a1~a5、b1~b5、…、e1~e5)。
S2,针对每一图像区域,计算该图像区域,与,跟该图像区域对应的迁移后图像区域的特征差异,得到该图像区域与该迁移后图像区域的相似度值。
具体地,如图3所示,对于图像区域A1,跟该图像区域对应的迁移后图像区域为a1,那么,计算图像区域A1与迁移后图像区域a1的特征差异,得到图像区域A1与迁移后图像区域a1的相似度值;对于图像区域A2,跟该图像区域对应的迁移后图像区域为a2,那么,计算图像区域A2与迁移后图像区域a2的特征差异,得到图像区域A2与迁移后图像区域a2的相似度值,以此类推。
在本申请的一些实施例中,上述S2计算该图像区域与跟所述图像区域对应的迁移后图像区域的特征差异,得到该图像区域与该迁移后图像区域的相似度值的过程,可以包括:
S21,通过局部二值模式(Local Binary Pattern,LBP)算法提取该图像区域的纹理特征,得到第一直方图。
S22,通过LBP算法提取跟该图像区域对应的迁移后图像区域的纹理特征,得到第二直方图。
S23,利用预设的相似性度量函数计算第一直方图和第二直方图的相似程度,得到该图像区域与该迁移后图像区域的相似度值。
其中,LBP是一种用来描述图像局部纹理特征的算子,其具有旋转不变性和灰度不变性等显著的优点,可以用于纹理特征的提取。
相似性度量(Similarity Measurement)函数用于计算两个比较对象之间的相似性,在本申请的一些实施例中,可以采用最大对数似然(log-Likelihood)方法来计算第一直方图和第二直方图的相似程度。
具体地,请参阅图4,假设第一直方图及第二直方图中的类别取值为p=1,2,…,P,那么,通过最大对数似然对第一直方图S和第二直方图M的相似度值G(S,M)可以表示为:
Figure BDA0003646459990000091
在本申请的一些实施例中,在上述S23得到该图像区域与该迁移后图像区域的相似度值之后,还可以包括:
S24,判断该图像区域与该迁移后图像区域的相似度值是否落在该相似度范围之内。
S25,若是,则确定该图像区域为杂乱场景。
通过直接将某图像区域确定为杂乱场景,可以将杂乱场景定位到具体的图像区域中,有利于后续对该图像区域内的场景进行相关处理。
在本申请的一些实施例中,上述步骤S103基于该相似度值确定该第一图像是否为杂乱场景的过程,可以包括:
S1,获取相似度值落在该相似度范围之内的各目标图像区域,并计算得到各目标图像区域相对于各图像区域的比值。
S2,判断该比值是否达到预设比值,若是,确定该图像为杂乱场景。
例如,可以将该预设比值设定为30%,由于相似度值落在该相似度范围之内意味着该图像区域为杂乱区域,那么,当达到30%的图像区域与相应的迁移后图像区域的相似度值落在该相似度范围之内,意味存在杂乱的区域达到30%之多,因此可以确定该图像为杂乱场景。
下面对本申请实施例提供的基于人工智能的杂乱场景检测装置进行描述,下文描述的基于人工智能的杂乱场景检测装置与上文描述的基于人工智能的杂乱场景检测方法可相互对应参照。
请参见图5,本申请实施例提供的基于人工智能的杂乱场景检测装置,可以包括:
风格迁移单元21,用于通过检测模型对待检测的第一图像进行风格迁移,得到经过风格迁移的第二图像;
差异计算单元22,用于获取第一图像与第二图像的相似度值,所述相似度值用于衡量第一图像与第二图像的相似程度;
杂乱判断单元23,用于基于所述相似度值确定所述第一图像是否为杂乱场景;
其中,所述检测模型被配置为,具备对图像进行风格迁移的能力,且被标注为杂乱场景的第一杂乱图像,与对所述第一杂乱图像进行风格迁移后得到的第二杂乱图像的相似度值落在预设的相似度范围之内;被标注为规整场景的第一规整图像,与对所述第一规整图像进行风格迁移后得到的第二规整图像的相似度值落在所述相似度范围之外。
在本申请的一些实施例中,请参阅图6,所述基于人工智能的杂乱场景检测装置还可以包括灰度处理单元24,所述灰度处理单元24用于在通过检测模型对待检测的第一图像进行风格迁移之前,对待检测的第一图像进行灰度化处理。
在本申请的一些实施例中,请参阅图7,所述基于人工智能的杂乱场景检测装置还可以包括模型训练单元25,用于对检测模型进行训练,模型训练单元25对所述检测模型进行训练的过程,可以包括:
获取风格图像、若干被标注为杂乱场景的第一杂乱图像以及若干被标注为规整场景的第一规则图像;
针对每一第一杂乱图像,通过所述检测模型将所述风格图像的风格特征迁移到所述第一杂乱图像中,得到经过风格迁移的第二杂乱图像,并计算得到所述第一杂乱图像与所述第二杂乱图像的第一相似度值;
针对每一第一规则图像,通过所述检测模型将所述风格图像的风格特征迁移到所述第一规则图像中,得到经过风格迁移的第二规则图像,并计算得到所述第一规则图像与所述第二规则图像的第二相似度值;
以所述第一相似度值趋近于所述相似度范围,所述第二相似度值远离所述相似度范围,以及所述检测模型的风格损失和内容损失最小化为目标,更新所述检测模型的风格参数。
在本申请的一些实施例中,差异计算单元22获取第一图像与第二图像的相似度值的过程,可以包括:
采用同样的划分方式,将待检测的第一图像划分成尺寸相等且互不重合的多个图像区域,以及将第二图像划分成尺寸相等且互不重合的多个迁移后图像区域;
针对每一图像区域,计算所述图像区域与跟所述图像区域对应的迁移后图像区域的特征差异,得到所述图像区域与所述迁移后图像区域的相似度值。
在本申请的一些实施例中,差异计算单元22计算所述图像区域与跟所述图像区域对应的迁移后图像区域的特征差异,得到所述图像区域与所述迁移后图像区域的相似度值的过程,可以包括:
通过局部二值模式LBP算法提取所述图像区域的纹理特征,得到第一直方图;
通过LBP算法提取跟所述图像区域对应的迁移后图像区域的纹理特征,得到第二直方图;
利用预设的相似性度量函数计算第一直方图和第二直方图的相似程度,得到所述图像区域与所述迁移后图像区域的相似度值。
在本申请的一些实施例中,差异计算单元22基于所述相似度值确定所述第一图像是否为杂乱场景的过程,可以包括:
获取相似度值落在所述相似度范围之内的各目标图像区域,并计算得到各目标图像区域相对于各图像区域的比值;
判断所述比值是否达到预设比值,若是,确定所述图像为杂乱场景。
在本申请的一些实施例中,在差异计算单元22得到所述图像区域与所述迁移后图像区域的相似度值之后,还可以包括:
判断所述图像区域与所述迁移后图像区域的相似度值是否落在所述相似度范围之内;
若是,确定所述图像区域为杂乱场景。
本申请实施例提供的基于人工智能的杂乱场景检测装置可应用于基于人工智能的杂乱场景检测设备,如计算机等。可选的,图8示出了基于人工智能的杂乱场景检测设备的硬件结构框图,参照图8,基于人工智能的杂乱场景检测设备的硬件结构可以包括:至少一个处理器31,至少一个通信接口32,至少一个存储器33和至少一个通信总线34。
在本申请实施例中,处理器31、通信接口32、存储器33、通信总线34的数量为至少一个,且处理器31、通信接口32、存储器33通过通信总线34完成相互间的通信;
处理器31可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路等;
存储器32可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;
其中,存储器33存储有程序,处理器31可调用存储器33存储的程序,所述程序用于:
通过检测模型对待检测的第一图像进行风格迁移,得到经过风格迁移的第二图像;
获取第一图像与第二图像的相似度值,所述相似度值用于衡量第一图像与第二图像的相似程度;
基于所述相似度值确定所述第一图像是否为杂乱场景;
其中,所述检测模型被配置为,具备对图像进行风格迁移的能力,且被标注为杂乱场景的第一杂乱图像,与对所述第一杂乱图像进行风格迁移后得到的第二杂乱图像的相似度值落在预设的相似度范围之内;被标注为规整场景的第一规整图像,与对所述第一规整图像进行风格迁移后得到的第二规整图像的相似度值落在所述相似度范围之外。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种存储介质,该存储介质可存储有适于处理器执行的程序,所述程序用于:
通过检测模型对待检测的第一图像进行风格迁移,得到经过风格迁移的第二图像;
获取第一图像与第二图像的相似度值,所述相似度值用于衡量第一图像与第二图像的相似程度;
基于所述相似度值确定所述第一图像是否为杂乱场景;
其中,所述检测模型被配置为,具备对图像进行风格迁移的能力,且被标注为杂乱场景的第一杂乱图像,与对所述第一杂乱图像进行风格迁移后得到的第二杂乱图像的相似度值落在预设的相似度范围之内;被标注为规整场景的第一规整图像,与对所述第一规整图像进行风格迁移后得到的第二规整图像的相似度值落在所述相似度范围之外。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
综上所述:
本申请实施例首先获取训练后的检测模型,其中,该检测模型被配置为,具备对图像进行风格迁移的能力,且被标注为杂乱场景的第一杂乱图像,与对该第一杂乱图像进行风格迁移后得到的第二杂乱图像的相似度值落在预设的相似度范围之内;被标注为规整场景的第一规整图像,与对该第一规整图像进行风格迁移后得到的第二规整图像的相似度值落在该相似度范围之外。接着,通过该检测模型对待检测的第一图像进行风格迁移,得到经过风格迁移的第二图像。然后,获取第一图像与第二图像的相似度值,其中,该相似度值用于衡量第一图像与第二图像的相似程度。由于该检测模型对于杂乱场景的图像所计算得到的相似度值落在该相似度范围之内,对于规则场景的图像所计算得到的相似度值落在该相似度范围之外,因此,基于该相似度值可以确定该第一图像是否为杂乱场景。本申请实施例通过训练后的检测模型对杂乱场景进行自动检测,相比于人工方式具有更高的检测效率。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种基于人工智能的杂乱场景检测方法,其特征在于,包括:
通过检测模型对待检测的第一图像进行风格迁移,得到经过风格迁移的第二图像;
获取第一图像与第二图像的相似度值,所述相似度值用于衡量第一图像与第二图像的相似程度;
基于所述相似度值确定所述第一图像是否为杂乱场景;
其中,所述检测模型被配置为,具备对图像进行风格迁移的能力,且被标注为杂乱场景的第一杂乱图像,与对所述第一杂乱图像进行风格迁移后得到的第二杂乱图像的相似度值落在预设的相似度范围之内;被标注为规整场景的第一规整图像,与对所述第一规整图像进行风格迁移后得到的第二规整图像的相似度值落在所述相似度范围之外。
2.根据权利要求1所述的方法,其特征在于,所述获取第一图像与第二图像的相似度值的过程,包括:
采用同样的划分方式,将待检测的第一图像划分成尺寸相等且互不重合的多个图像区域,以及将第二图像划分成尺寸相等且互不重合的多个迁移后图像区域;
针对每一图像区域,计算所述图像区域与跟所述图像区域对应的迁移后图像区域的特征差异,得到所述图像区域与所述迁移后图像区域的相似度值。
3.根据权利要求2所述的方法,其特征在于,计算所述图像区域与跟所述图像区域对应的迁移后图像区域的特征差异,得到所述图像区域与所述迁移后图像区域的相似度值的过程,包括:
通过局部二值模式LBP算法提取所述图像区域的纹理特征,得到第一直方图;
通过LBP算法提取跟所述图像区域对应的迁移后图像区域的纹理特征,得到第二直方图;
利用预设的相似性度量函数计算第一直方图和第二直方图的相似程度,得到所述图像区域与所述迁移后图像区域的相似度值。
4.根据权利要求2所述的方法,其特征在于,基于所述相似度值确定所述第一图像是否为杂乱场景的过程,包括:
获取相似度值落在所述相似度范围之内的各目标图像区域,并计算得到各目标图像区域相对于各图像区域的比值;
判断所述比值是否达到预设比值,若是,确定所述图像为杂乱场景。
5.根据权利要求2所述的方法,其特征在于,得到所述图像区域与所述迁移后图像区域的相似度值之后,还包括:
判断所述图像区域与所述迁移后图像区域的相似度值是否落在所述相似度范围之内;
若是,确定所述图像区域为杂乱场景。
6.根据权利要求1所述的方法,其特征在于,通过检测模型对待检测的第一图像进行风格迁移之前,还包括:
对待检测的第一图像进行灰度化处理。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述检测模型的训练过程,包括:
获取风格图像、若干被标注为杂乱场景的第一杂乱图像以及若干被标注为规整场景的第一规则图像;
针对每一第一杂乱图像,通过所述检测模型将所述风格图像的风格特征迁移到所述第一杂乱图像中,得到经过风格迁移的第二杂乱图像,并计算得到所述第一杂乱图像与所述第二杂乱图像的第一相似度值;
针对每一第一规则图像,通过所述检测模型将所述风格图像的风格特征迁移到所述第一规则图像中,得到经过风格迁移的第二规则图像,并计算得到所述第一规则图像与所述第二规则图像的第二相似度值;
以所述第一相似度值趋近于所述相似度范围,所述第二相似度值远离所述相似度范围,以及所述检测模型的风格损失和内容损失最小化为目标,更新所述检测模型的风格参数。
8.一种基于人工智能的杂乱场景检测装置,其特征在于,包括:
风格迁移单元,用于通过检测模型对待检测的第一图像进行风格迁移,得到经过风格迁移的第二图像;
差异计算单元,用于获取第一图像与第二图像的相似度值,所述相似度值用于衡量第一图像与第二图像的相似程度;
杂乱判断单元,用于基于所述相似度值确定所述第一图像是否为杂乱场景;
其中,所述检测模型被配置为,具备对图像进行风格迁移的能力,且被标注为杂乱场景的第一杂乱图像,与对所述第一杂乱图像进行风格迁移后得到的第二杂乱图像的相似度值落在预设的相似度范围之内;被标注为规整场景的第一规整图像,与对所述第一规整图像进行风格迁移后得到的第二规整图像的相似度值落在所述相似度范围之外。
9.一种基于人工智能的杂乱场景检测设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1~7中任一项所述的基于人工智能的杂乱场景检测方法的各个步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~7中任一项所述的基于人工智能的杂乱场景检测方法的各个步骤。
CN202210530951.4A 2022-05-16 2022-05-16 一种基于人工智能的杂乱场景检测方法、装置及相关设备 Active CN114842342B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210530951.4A CN114842342B (zh) 2022-05-16 2022-05-16 一种基于人工智能的杂乱场景检测方法、装置及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210530951.4A CN114842342B (zh) 2022-05-16 2022-05-16 一种基于人工智能的杂乱场景检测方法、装置及相关设备

Publications (2)

Publication Number Publication Date
CN114842342A true CN114842342A (zh) 2022-08-02
CN114842342B CN114842342B (zh) 2023-01-24

Family

ID=82569949

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210530951.4A Active CN114842342B (zh) 2022-05-16 2022-05-16 一种基于人工智能的杂乱场景检测方法、装置及相关设备

Country Status (1)

Country Link
CN (1) CN114842342B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109833025A (zh) * 2019-03-29 2019-06-04 广州视源电子科技股份有限公司 一种视网膜的异常检测方法、装置、设备和存储介质
CN110310222A (zh) * 2019-06-20 2019-10-08 北京奇艺世纪科技有限公司 一种图像风格迁移方法、装置、电子设备及存储介质
CN110490960A (zh) * 2019-07-11 2019-11-22 阿里巴巴集团控股有限公司 一种合成图像生成方法及装置
WO2021109876A1 (zh) * 2019-12-02 2021-06-10 Oppo广东移动通信有限公司 图像处理方法、装置、设备及存储介质
CN112990378A (zh) * 2021-05-08 2021-06-18 腾讯科技(深圳)有限公司 基于人工智能的场景识别方法、装置及电子设备
CN113592769A (zh) * 2021-06-23 2021-11-02 腾讯医疗健康(深圳)有限公司 异常图像的检测、模型的训练方法、装置、设备及介质
CN113869429A (zh) * 2021-09-29 2021-12-31 北京百度网讯科技有限公司 模型训练方法及图像处理方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109833025A (zh) * 2019-03-29 2019-06-04 广州视源电子科技股份有限公司 一种视网膜的异常检测方法、装置、设备和存储介质
CN110310222A (zh) * 2019-06-20 2019-10-08 北京奇艺世纪科技有限公司 一种图像风格迁移方法、装置、电子设备及存储介质
CN110490960A (zh) * 2019-07-11 2019-11-22 阿里巴巴集团控股有限公司 一种合成图像生成方法及装置
WO2021109876A1 (zh) * 2019-12-02 2021-06-10 Oppo广东移动通信有限公司 图像处理方法、装置、设备及存储介质
CN112990378A (zh) * 2021-05-08 2021-06-18 腾讯科技(深圳)有限公司 基于人工智能的场景识别方法、装置及电子设备
CN113592769A (zh) * 2021-06-23 2021-11-02 腾讯医疗健康(深圳)有限公司 异常图像的检测、模型的训练方法、装置、设备及介质
CN113869429A (zh) * 2021-09-29 2021-12-31 北京百度网讯科技有限公司 模型训练方法及图像处理方法

Also Published As

Publication number Publication date
CN114842342B (zh) 2023-01-24

Similar Documents

Publication Publication Date Title
CN112435215A (zh) 一种基于图像的车辆定损方法、移动终端、服务器
CN110751620B (zh) 估算体积和重量的方法、电子设备及计算机可读存储介质
CN111178394B (zh) 一种基于自适应图像信息熵的特征点提取方法
Medina-Carnicer et al. A novel histogram transformation to improve the performance of thresholding methods in edge detection
CN113012157A (zh) 一种设备缺陷视觉检测方法及系统
Abouelaziz et al. Blind 3D mesh visual quality assessment using support vector regression
CN111161346A (zh) 将商品在货架中进行分层的方法、装置和电子设备
Olugbara et al. Pixel intensity clustering algorithm for multilevel image segmentation
CN111144425B (zh) 检测拍屏图片的方法、装置、电子设备及存储介质
CN111383216B (zh) 图像间变化的检测方法及装置
CN113918744A (zh) 相似图像检索方法、装置、存储介质及计算机程序产品
CN112132892A (zh) 目标位置标注方法、装置及设备
CN107680246B (zh) 一种纸币图案中的曲线边界定位方法及设备
CN114842342B (zh) 一种基于人工智能的杂乱场景检测方法、装置及相关设备
CN110406539A (zh) 一种识别车辆载重状态的方法及装置
WO2024078112A1 (zh) 一种舾装件智能识别方法、计算机设备
CN114005120A (zh) 一种车牌字符切割方法、车牌识别方法、装置、设备及存储介质
CN112734747A (zh) 一种目标检测方法、装置、电子设备和存储介质
CN110321808B (zh) 遗留物与盗移物检测方法、设备和存储介质
CN116977271A (zh) 缺陷检测方法、模型训练方法、装置及电子设备
CN106971386A (zh) 判断图像完整度及页面加载度的方法、装置和客户端设备
CN104408720A (zh) 图像处理方法及图像处理装置
CN112487941A (zh) 染色体簇与染色体实例的识别方法、系统和存储介质
JP7201211B2 (ja) 物体検出方法及び物体検出装置
CN109523533B (zh) 一种图像质量评价方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20221223

Address after: Room 800, Room 406, No. 1 Yichuang Street, Huangpu District, Guangzhou City, Guangdong Province (Sino-Singapore Guangzhou Knowledge City) 510000

Applicant after: Nets Technology Group Co.,Ltd.

Address before: 510000 rooms 701 and 702, No. 1, Linjiang Avenue, Tianhe District, Guangzhou, Guangdong

Applicant before: Networks Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant