CN117809132A - 违规搭建识别模型训练方法、违规搭建识别方法及装置 - Google Patents
违规搭建识别模型训练方法、违规搭建识别方法及装置 Download PDFInfo
- Publication number
- CN117809132A CN117809132A CN202311824323.8A CN202311824323A CN117809132A CN 117809132 A CN117809132 A CN 117809132A CN 202311824323 A CN202311824323 A CN 202311824323A CN 117809132 A CN117809132 A CN 117809132A
- Authority
- CN
- China
- Prior art keywords
- image
- building
- violation
- rule
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 103
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000010276 construction Methods 0.000 title claims abstract description 54
- 238000001514 detection method Methods 0.000 claims abstract description 39
- 238000012937 correction Methods 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 31
- 230000015654 memory Effects 0.000 claims description 29
- 238000000605 extraction Methods 0.000 claims description 18
- 238000001914 filtration Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 2
- 230000036544 posture Effects 0.000 abstract description 5
- 239000000463 material Substances 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000007726 management method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明涉及图像识别技术领域,公开了违规搭建识别模型训练方法、违规搭建识别方法及装置,包括:获取违规搭建样本图像,对违规搭建样本图像中违规建筑进行标注,构建训练数据集;将训练数据集输入初始违规搭建识别模型,计算训练数据集的局灶性损失;基于局灶性损失,对初始违规搭建识别模型进行参数修正,得到目标违规搭建识别模型。本发明不仅限于正面违规搭建数据,对于多角度、多姿态、多场景下的违规搭建均可检测,对于违规搭建非法事件的检测清晰、明确,无需人工二次分类,大幅度提高了违规建筑识别效率,极大程度上节省了人力物力成本,提高了违规建筑的识别准确率。
Description
技术领域
本发明涉及图像识别技术领域,具体涉及违规搭建识别模型训练方法、违规搭建识别方法及装置。
背景技术
违规建筑是指未取得拟建工程规划许可证,在规划区以外建设,违反相关法律法规的规定动工建造的房屋及设施,存在侵占安全通道、影响城市公共空间等问题。
对于违规建筑的识别,目前通常是执法者人为进行现场查看,对于现场查看的方式,受限于人力资源、人的时间以及排查的范围等因素影响,这些都是导致违规建筑识别效率低下的原因。
因此,针对目前违规建筑的识别问题,亟需一种高效率的违规建筑识别方案。
发明内容
有鉴于此,本发明提供了一种违规搭建识别模型训练方法、违规搭建识别方法及装置,以解决人工识别违规建筑效率低的问题。
第一方面,本发明提供了一种违规搭建识别模型训练方法,方法包括:
获取违规搭建样本图像,对违规搭建样本图像中违规建筑进行标注,构建训练数据集;
将训练数据集输入初始违规搭建识别模型,计算训练数据集的局灶性损失;
基于局灶性损失,对初始违规搭建识别模型进行参数修正,得到目标违规搭建识别模型,目标违规搭建识别模型用于进行图像中的违规建筑识别。
在本发明中,通过利用实际场景下的违规搭建检测数据集,包括真实视频场景中采集的图像与公共数据集图像,构建训练集,通过利用局灶性损失,目标检测提取矩形框内的违规建筑,不仅限于正面违规搭建数据,对于多角度、多姿态、多场景下的违规搭建均可检测,对于违规搭建非法事件的检测清晰、明确,无需人工二次分类,大幅度提高了违规建筑识别效率,极大程度上节省了人力物力成本,与此同时,提高了违规建筑的识别准确率,进一步提高了执法人员的对违规建筑进行管理的及时性与准确性。
在一种可选的实施方式中,将训练数据集输入初始违规搭建识别模型,计算训练数据集的局灶性损失,包括:
将训练数据集进行裁剪,得到裁剪后的数据集;
将裁剪后的数据集输入初始违规搭建识别模型的特征提取网络,输出标注特征图像数据集;
将标注特征图像数据集输入初始违规搭建识别模型的目标检测网络,计算得到局灶性损失。
在该方式中,通过计算局灶性损失函数,利用局灶性损失函数进行训练,解决了训练过程中存在的类别不平衡问题,提升了模型的精度。
在一种可选的实施方式中,将裁剪后的数据集输入初始违规搭建识别模型的特征提取网络,输出标注特征图像数据集,包括:
将裁剪后的数据集输入初始违规搭建识别模型的特征提取网络,生成样本候选框;
对样本候选框进行分类,输出标注特征图像数据集。
在该方式中,通过利用样本候选框对模型进行训练,使得模型可以直接识别得到违规搭建矩形框,提取矩形框内违规搭建。
在一种可选的实施方式中,方法还包括:
将特征提取网络与目标检测网络的损失函数转换为三元损失函数,基于三元损失函数,对初始违规搭建识别模型进行训练。
在该方式中,利用三元损失函数,更适用于小数据集训练,提升模型在差异度较小的时候的识别精度,使得模型可以学习细粒度特征,进一步提升了模型的识别精度。
第二方面,本发明提供了一种违规搭建识别方法,方法包括:
获取待识别图像;
将待识别图像输入违规搭建识别模型,识别得到待识别图像中包含违规建筑的概率,基于待识别图像中包含违规建筑的概率,确定待识别图像中是否包含违规建筑,其中违规搭建识别模型是利用第一方面任意一项的违规搭建识别模型训练方法训练得到的。
在本发明中,通过利用训练得到的违规搭建识别模型,不仅限于正面违规搭建数据,对于多角度、多姿态、多场景下的违规搭建均可检测,对于违规搭建非法事件的检测清晰、明确,无需人工二次分类,大幅度提高了违规搭建的识别效率。
在一种可选的实施方式中,基于待识别图像中包含违规建筑的概率,确定待识别图像中是否包含违规建筑,包括:
对待识别图像中包含违规建筑的概率进行置信度过滤,筛选得到包含违规建筑的概率高于预设置信度阈值的待识别图像,确认包含违规建筑的概率高于预设置信度阈值的待识别图像中包含违规建筑。
在该方式中,通过对待识别图像进行置信度过滤及判断,过滤掉包含违规建筑的概率低的图片、模糊图片以及移动物体,尽可能地提高了识别精度,便于检测得到之前的违规搭建事件。
第三方面,本发明提供了一种违规搭建识别模型训练装置,装置包括:
第一图像获取模块,用于获取违规搭建样本图像,对违规搭建样本图像中违规建筑进行标注,构建训练数据集;
局灶性损失计算模块,用于将训练数据集输入初始违规搭建识别模型,计算训练数据集的局灶性损失;
模型参数修正模块,用于基于局灶性损失,对初始违规搭建识别模型进行参数修正,得到目标违规搭建识别模型,目标违规搭建识别模型用于进行图像中的违规建筑识别。
第四方面,本发明提供了一种违规搭建识别装置,装置包括:
第二图像获取模块,用于获取待识别图像;
违规搭建识别模块,用于将待识别图像输入违规搭建识别模型,识别得到待识别图像中包含违规建筑的概率,基于待识别图像中包含违规建筑的概率,确定待识别图像中是否包含违规建筑,其中违规搭建识别模型是利用第三方面的违规搭建识别模型训练装置训练得到的。
第五方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的违规搭建识别模型训练方法或者执行第二方面或其对应的任一实施方式的违规搭建识别方法。
第六方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的违规搭建识别模型训练方法或者执行第二方面或其对应的任一实施方式的违规搭建识别方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的违规搭建识别模型训练方法的流程示意图。
图2是根据本发明实施例的一种违规搭建模型的技术流程图。
图3a是根据本发明实施例的一种违规搭建事件检测结果。
图3b是根据本发明实施例的又一违规搭建事件检测结果。
图4是根据本发明实施例的另一违规搭建识别模型训练方法的流程示意图。
图5是根据本发明实施例的违规搭建识别方法的流程示意图。
图6是根据本发明实施例的违规搭建识别模型训练装置的结构框图。
图7是根据本发明实施例的违规搭建识别装置的结构框图。
图8是本发明实施例的计算机设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
相关技术中,对于违规建筑的识别,目前通常是执法者人为进行现场查看,对于现场查看的方式,受限于人力资源、人的时间以及排查的范围等因素影响,这些都是导致违规建筑识别效率低下的原因。因此,针对目前违规建筑的识别问题,亟需一种高效率的违规建筑识别方案。
为解决上述问题,本发明实施例中提供一种违规搭建识别模型训练方法,用于计算机设备中,需要说明的是,其执行主体可以是违规搭建识别模型训练装置,该装置可以通过软件、硬件或者软硬件结合的方式实现成为计算机设备的部分或者全部,其中,该计算机设备可以是终端或客户端或服务器,服务器可以是一台服务器,也可以为由多台服务器组成的服务器集群,本申请实施例中的终端可以是智能手机、个人电脑、平板电脑等其他智能硬件设备。下述方法实施例中,均以执行主体是计算机设备为例来进行说明。
本实施例中的计算机设备,适用于智慧城管,对违规建筑进行识别的使用场景。通过本发明提供违规搭建识别模型训练方法,通过利用实际场景下的违规搭建检测数据集,包括真实视频场景中采集的图像与公共数据集图像,构建训练集,通过利用局灶性损失,目标检测提取矩形框内的违规建筑,不仅限于正面违规搭建数据,对于多角度、多姿态、多场景下的违规搭建均可检测,对于违规搭建非法事件的检测清晰、明确,无需人工二次分类,大幅度提高了违规建筑识别效率,极大程度上节省了人力物力成本,与此同时,提高了违规建筑的识别准确率,进一步提高了执法人员的对违规建筑进行管理的及时性与准确性。
根据本发明实施例,提供了一种违规搭建识别模型训练方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种违规搭建识别模型训练方法,可用于上述的计算机设备,图1是根据本发明实施例的违规搭建识别模型训练方法的流程图,如图1所示,该流程包括如下步骤:
步骤S101,获取违规搭建样本图像,对违规搭建样本图像中违规建筑进行标注,构建训练数据集。
在一示例中,训练数据集的构建包括:采集实际城管场景下的违规搭建图像,从多个场景、多时间段采集多角度样本,每个图片要求目标清晰容易分辨,像素值大于100*100,构建大型违规搭建图片数据集。人工标定违规搭建矩形框,作为训练数据集。对训练数据集数据进行预处理,主要包括数据增强,方式有:随机旋转、随机模糊、随机颜色变换、归一化等。基于少量图片先进行box的标注不变,其中,违规搭建要标有彩钢棚,阳光房,板房,施工棚等多种样式。通过额外特征增加神经网络的精确率和召回率。
步骤S102,将训练数据集输入初始违规搭建识别模型,计算训练数据集的局灶性损失。
在一示例中,将数据增强后的图片及其标签送入网络,计算局灶性损失FocalLoss,公式可表示为:FL(pt)=-α(1-pt)^γ*log(pt)其中,pt是模型预测为正样本的概率,α是平衡因子,γ是调节因子,反向传播调整学习率,并再次循环训练步骤,以达到算法的拟合,训练出高精度模型。
步骤S103,基于局灶性损失,对初始违规搭建识别模型进行参数修正,得到目标违规搭建识别模型。
在本发明实施例中,目标违规搭建识别模型用于进行图像中的违规建筑识别。
在一示例中,使用网络mask-rcnn/htc。在mask后面额外进行分类网络。这个分类基于提取的mask进行。可以混合训练也可以分开训练。由于分辨率太大,导致显存暴涨,使用了retinaNet,目标检测后按照比率添加目标检测负样本1:1.2加入几个bottleneck模块可以对生成的mask进行分类处理(本质上为训练图像的注意力)。
在一实施场景中,图2是根据本发明实施例的一种违规搭建模型的技术流程图,如图2所示,违规搭建模型包括:视频流抽帧得到样本图像;将带有标注特征的图片经过结构化裁剪送入框架,框架选用RetinaResnest(何凯明特征提取网络),本框架提出了一种新的损失函数-Focal Loss,解决了一阶段检测器的精度不能和两阶段检测相比的原因训练过程中的类别不平衡问题;带有上述标注特征图片经过结构化裁剪送入mmDetection(考虑使用网络,retinaNet freeAnchor,SSD),选取RetinaNet(ResNet+FPN+FCN网络的组合)作为目标检测网络,损失函数为Focal loss也是one-stage(一次性检测完整张图片)的目标检测算法,最大的贡献就是解决了前景背景种类不均衡问题,让one-stage算法的精度也能达到two-stage(先由算法生成一系列作为样本的候选框,再通过卷积神经网络进行样本分类)的水平,输入Deeplabv3(语义分割模型)进行训练,该目标检测能更好的检出需求目标;在上述基础上,数据量比较少的情况下,考虑打开部分backbone骨干的权重,输入Bottleneck(一种轻量型网络,沙漏结构),参与训练,将网络损失函数改为tripletloss(三元损失函数),该损失函数的作用是用于训练差异性较小的样本,比如人脸,去区分相似的人脸图,适合使用小数据集训练,(reid方法自身增加数据集数量,并且度量学习可以学习细粒度特征);进行逻辑判断(去重,去模糊);将模型识别结果进行推送,图3a是根据本发明实施例的一种违规搭建事件检测结果,图3b是根据本发明实施例的又一违规搭建事件检测结果,识别结果如图3a及图3b所示。
本实施例提供的违规搭建识别模型训练方法,通过利用实际场景下的违规搭建检测数据集,包括真实视频场景中采集的图像与公共数据集图像,构建训练集,通过利用局灶性损失,目标检测提取矩形框内的违规建筑,不仅限于正面违规搭建数据,对于多角度、多姿态、多场景下的违规搭建均可检测,对于违规搭建非法事件的检测清晰、明确,无需人工二次分类,大幅度提高了违规建筑识别效率,极大程度上节省了人力物力成本,与此同时,提高了违规建筑的识别准确率,进一步提高了执法人员的对违规建筑进行管理的及时性与准确性。
在本实施例中提供了一种违规搭建识别模型训练方法,可用于上述的计算机设备,图4是根据本发明实施例的另一违规搭建识别模型训练方法的流程图,如图4所示,该流程包括如下步骤:
步骤S401,获取违规搭建样本图像,对违规搭建样本图像中违规建筑进行标注,构建训练数据集。详细请参见图1所示实施例的步骤S101,在此不再赘述。
步骤S402,将训练数据集输入初始违规搭建识别模型,计算训练数据集的局灶性损失。
具体地,上述步骤S402包括:
步骤S4021,将训练数据集进行裁剪,得到裁剪后的数据集。
步骤S4022,将裁剪后的数据集输入初始违规搭建识别模型的特征提取网络,输出标注特征图像数据集。
在一些可选的实施方式中,上述步骤S4022包括:
步骤a1,将裁剪后的数据集输入初始违规搭建识别模型的特征提取网络,生成样本候选框。
步骤a2,对样本候选框进行分类,输出标注特征图像数据集。
步骤S4023,将标注特征图像数据集输入初始违规搭建识别模型的目标检测网络,计算得到局灶性损失。
步骤S4024,将特征提取网络与目标检测网络的损失函数转换为三元损失函数,基于三元损失函数,对初始违规搭建识别模型进行训练。
在一示例中,违规搭建模型包括:视频流抽帧得到样本图像;将带有标注特征的图片经过结构化裁剪送入框架,框架选用RetinaResnest(何凯明特征提取网络),本框架提出了一种新的损失函数-Focal Loss,解决了一阶段检测器的精度不能和两阶段检测相比的原因训练过程中的类别不平衡问题;带有上述标注特征图片经过结构化裁剪送入mmDetection(考虑使用网络,retinaNet freeAnchor,SSD),选取RetinaNet(ResNet+FPN+FCN网络的组合)作为目标检测网络,损失函数为Focal loss也是one-stage(一次性检测完整张图片)的目标检测算法,最大的贡献就是解决了前景背景种类不均衡问题,让one-stage算法的精度也能达到two-stage(先由算法生成一系列作为样本的候选框,再通过卷积神经网络进行样本分类)的水平,输入Deeplabv3(语义分割模型)进行训练,该目标检测能更好的检出需求目标;在上述基础上,数据量比较少的情况下,考虑打开部分backbone骨干的权重,输入Bottleneck(一种轻量型网络,沙漏结构),参与训练,将网络损失函数改为tripletloss(三元损失函数),该损失函数的作用是用于训练差异性较小的样本,比如人脸,去区分相似的人脸图,适合使用小数据集训练,(reid方法自身增加数据集数量,并且度量学习可以学习细粒度特征);进行逻辑判断(去重,去模糊);将模型识别结果进行推送。
步骤S403,基于局灶性损失,对初始违规搭建识别模型进行参数修正,得到目标违规搭建识别模型。详细请参见图1所示实施例的步骤S103,在此不再赘述。
本实施例提供的违规搭建识别模型训练方法,通过计算局灶性损失函数,利用局灶性损失函数进行训练,解决了训练过程中存在的类别不平衡问题,提升了模型的精度。通过利用样本候选框对模型进行训练,使得模型可以直接识别得到违规搭建矩形框,提取矩形框内违规搭建。利用三元损失函数,更适用于小数据集训练,提升模型在差异度较小的时候的识别精度,使得模型可以学习细粒度特征,进一步提升了模型的识别精度。
在本实施例中提供了一种违规搭建识别方法,可用于上述的计算机设备,图5是根据本发明实施例的一种违规搭建识别方法的流程图,如图5所示,该流程包括如下步骤:
步骤S501,获取待识别图像。
步骤S502,将待识别图像输入违规搭建识别模型,识别得到待识别图像中包含违规建筑的概率,基于待识别图像中包含违规建筑的概率,确定待识别图像中是否包含违规建筑。
在本发明实施例中,违规搭建识别模型是利用上述实施例任意一项的违规搭建识别模型训练方法训练得到的。
具体地,上述步骤S502包括:
步骤S5021,对待识别图像中包含违规建筑的概率进行置信度过滤,筛选得到包含违规建筑的概率高于预设置信度阈值的待识别图像,确认包含违规建筑的概率高于预设置信度阈值的待识别图像中包含违规建筑。
在一示例中,违规搭建事件检测流程如下:
1.读入抽帧图片数据(获取算法检测数据)。
2.识别违规搭建(数据经过算法模型识别出违规搭建事件)。
3.逻辑判断(置信度过滤,过滤掉低概率的图片,模糊图片,以及移动物体)。
4.重复检测判断(iou过滤,利用目标之间的交并比,结合时间,控制每天只报一次事件。
本实施例提供的违规搭建识别方法,通过利用训练得到的违规搭建识别模型,不仅限于正面违规搭建数据,对于多角度、多姿态、多场景下的违规搭建均可检测,对于违规搭建非法事件的检测清晰、明确,无需人工二次分类,大幅度提高了违规搭建的识别效率。通过对待识别图像进行置信度过滤及判断,过滤掉包含违规建筑的概率低的图片、模糊图片以及移动物体,尽可能地提高了识别精度,便于检测得到之前的违规搭建事件。
在本实施例中还提供了一种违规搭建识别模型训练装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种违规搭建识别模型训练装置,如图6所示,包括:
第一图像获取模块601,用于获取违规搭建样本图像,对违规搭建样本图像中违规建筑进行标注,构建训练数据集。详细请参见图1所示实施例的步骤S101,在此不再赘述。
局灶性损失计算模块602,用于将训练数据集输入初始违规搭建识别模型,计算训练数据集的局灶性损失。详细请参见图1所示实施例的步骤S102,在此不再赘述。
模型参数修正模块603,用于基于局灶性损失,对初始违规搭建识别模型进行参数修正,得到目标违规搭建识别模型,目标违规搭建识别模型用于进行图像中的违规建筑识别。详细请参见图1所示实施例的步骤S103,在此不再赘述。
在一些可选的实施方式中,局灶性损失计算模块602包括:
图片裁剪单元,用于将训练数据集进行裁剪,得到裁剪后的数据集。
特征提取单元,用于将裁剪后的数据集输入初始违规搭建识别模型的特征提取网络,输出标注特征图像数据集。
局灶性损失计算单元,用于将标注特征图像数据集输入初始违规搭建识别模型的目标检测网络,计算得到局灶性损失。
在一些可选的实施方式中,局灶性损失计算单元包括:
特征提取子单元,用于将裁剪后的数据集输入初始违规搭建识别模型的特征提取网络,生成样本候选框。
样本分类子单元,用于对样本候选框进行分类,输出标注特征图像数据集。
在一些可选的实施方式中,局灶性损失计算模块602还包括:
模型训练单元,用于将特征提取网络与目标检测网络的损失函数转换为三元损失函数,基于三元损失函数,对初始违规搭建识别模型进行训练。
上述各个模块和单元的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本实施例中的违规搭建识别模型训练装置是以功能单元的形式来呈现,这里的单元是指ASIC(Application Specific Integrated Circuit,专用集成电路)电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
在本实施例中还提供了一种XX装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种违规搭建识别装置,如图7所示,包括:
第二图像获取模块701,用于获取待识别图像。详细请参见图5所示实施例的步骤S501,在此不再赘述。
违规搭建识别模块702,用于将待识别图像输入违规搭建识别模型,识别得到待识别图像中包含违规建筑的概率,基于待识别图像中包含违规建筑的概率,确定待识别图像中是否包含违规建筑。详细请参见图5所示实施例的步骤S502,在此不再赘述。
在一些可选的实施方式中,违规搭建识别模块702包括:
违规建筑确认单元,用于对待识别图像中包含违规建筑的概率进行置信度过滤,筛选得到包含违规建筑的概率高于预设置信度阈值的待识别图像,确认包含违规建筑的概率高于预设置信度阈值的待识别图像中包含违规建筑。
上述各个模块和单元的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本实施例中的违规搭建识别装置是以功能单元的形式来呈现,这里的单元是指ASIC(Application Specific Integrated Circuit,专用集成电路)电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
本发明实施例还提供一种计算机设备,具有上述图6所示的违规搭建识别模型训练装置与上述图7所示的违规搭建识别装置。
请参阅图8,图8是本发明可选实施例提供的一种计算机设备的结构示意图,如图8所示,该计算机设备包括:一个或多个处理器10、存储器20,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相通信连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在计算机设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在一些可选的实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个计算机设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图8中以一个处理器10为例。
处理器10可以是中央处理器,网络处理器或其组合。其中,处理器10还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路,可编程逻辑器件或其组合。上述可编程逻辑器件可以是复杂可编程逻辑器件,现场可编程逻辑门阵列,通用阵列逻辑或其任意组合。
其中,所述存储器20存储有可由至少一个处理器10执行的指令,以使所述至少一个处理器10执行实现上述实施例示出的方法。
存储器20可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器20可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些可选的实施方式中,存储器20可选包括相对于处理器10远程设置的存储器,这些远程存储器可以通过网络连接至该计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
存储器20可以包括易失性存储器,例如,随机存取存储器;存储器也可以包括非易失性存储器,例如,快闪存储器,硬盘或固态硬盘;存储器20还可以包括上述种类的存储器的组合。
该计算机设备还包括通信接口30,用于该计算机设备与其他设备或通信网络通信。
本发明实施例还提供了一种计算机可读存储介质,上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可记录在存储介质,或者被实现通过网络下载的原始存储在远程存储介质或非暂时机器可读存储介质中并将被存储在本地存储介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件的存储介质上的这样的软件处理。其中,存储介质可为磁碟、光盘、只读存储记忆体、随机存储记忆体、快闪存储器、硬盘或固态硬盘等;进一步地,存储介质还可以包括上述种类的存储器的组合。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件,当软件或计算机代码被计算机、处理器或硬件访问且执行时,实现上述实施例示出的方法。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (10)
1.一种违规搭建识别模型训练方法,其特征在于,所述方法包括:
获取违规搭建样本图像,对所述违规搭建样本图像中违规建筑进行标注,构建训练数据集;
将所述训练数据集输入初始违规搭建识别模型,计算所述训练数据集的局灶性损失;
基于所述局灶性损失,对所述初始违规搭建识别模型进行参数修正,得到目标违规搭建识别模型,所述目标违规搭建识别模型用于进行图像中的违规建筑识别。
2.根据权利要求1所述的方法,其特征在于,所述将所述训练数据集输入初始违规搭建识别模型,计算所述训练数据集的局灶性损失,包括:
将所述训练数据集进行裁剪,得到裁剪后的数据集;
将所述裁剪后的数据集输入所述初始违规搭建识别模型的特征提取网络,输出标注特征图像数据集;
将所述标注特征图像数据集输入所述初始违规搭建识别模型的目标检测网络,计算得到所述局灶性损失。
3.根据权利要求2所述的方法,其特征在于,所述将所述裁剪后的数据集输入所述初始违规搭建识别模型的特征提取网络,输出标注特征图像数据集,包括:
将所述裁剪后的数据集输入所述初始违规搭建识别模型的特征提取网络,生成样本候选框;
对所述样本候选框进行分类,输出标注特征图像数据集。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
将所述特征提取网络与所述目标检测网络的损失函数转换为三元损失函数,基于所述三元损失函数,对所述初始违规搭建识别模型进行训练。
5.一种违规搭建识别方法,其特征在于,所述方法包括:
获取待识别图像;
将所述待识别图像输入违规搭建识别模型,识别得到所述待识别图像中包含违规建筑的概率,基于所述待识别图像中包含违规建筑的概率,确定所述待识别图像中是否包含违规建筑,其中所述违规搭建识别模型是利用权利要求1-4任意一项所述的违规搭建识别模型训练方法训练得到的。
6.根据权利要求5所述的方法,其特征在于,所述基于所述待识别图像中包含违规建筑的概率,确定所述待识别图像中是否包含违规建筑,包括:
对所述待识别图像中包含违规建筑的概率进行置信度过滤,筛选得到包含违规建筑的概率高于预设置信度阈值的待识别图像,确认所述包含违规建筑的概率高于预设置信度阈值的待识别图像中包含违规建筑。
7.一种违规搭建识别模型训练装置,其特征在于,所述装置包括:
第一图像获取模块,用于获取违规搭建样本图像,对所述违规搭建样本图像中违规建筑进行标注,构建训练数据集;
局灶性损失计算模块,用于将所述训练数据集输入初始违规搭建识别模型,计算所述训练数据集的局灶性损失;
模型参数修正模块,用于基于所述局灶性损失,对所述初始违规搭建识别模型进行参数修正,得到目标违规搭建识别模型,所述目标违规搭建识别模型用于进行图像中的违规建筑识别。
8.一种违规搭建识别装置,其特征在于,所述装置包括:
第二图像获取模块,用于获取待识别图像;
违规搭建识别模块,用于将所述待识别图像输入违规搭建识别模型,识别得到所述待识别图像中包含违规建筑的概率,基于所述待识别图像中包含违规建筑的概率,确定所述待识别图像中是否包含违规建筑,其中所述违规搭建识别模型是利用权利要求6所述的违规搭建识别模型训练装置训练得到的。
9.一种计算机设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1至4中任一项所述的违规搭建识别模型训练方法或者执行权利要求5至6中任一项所述的违规搭建识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至4中任一项所述的违规搭建识别模型训练方法或者执行权利要求5至6中任一项所述的违规搭建识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311824323.8A CN117809132A (zh) | 2023-12-27 | 2023-12-27 | 违规搭建识别模型训练方法、违规搭建识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311824323.8A CN117809132A (zh) | 2023-12-27 | 2023-12-27 | 违规搭建识别模型训练方法、违规搭建识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117809132A true CN117809132A (zh) | 2024-04-02 |
Family
ID=90433140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311824323.8A Pending CN117809132A (zh) | 2023-12-27 | 2023-12-27 | 违规搭建识别模型训练方法、违规搭建识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117809132A (zh) |
-
2023
- 2023-12-27 CN CN202311824323.8A patent/CN117809132A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109255352B (zh) | 目标检测方法、装置及系统 | |
CN107862270B (zh) | 人脸分类器训练方法、人脸检测方法及装置、电子设备 | |
US11238310B2 (en) | Training data acquisition method and device, server and storage medium | |
CN108090458B (zh) | 人体跌倒检测方法和装置 | |
US11455805B2 (en) | Method and apparatus for detecting parking space usage condition, electronic device, and storage medium | |
CN110851835A (zh) | 图像模型检测方法、装置、电子设备及存储介质 | |
CN108875746B (zh) | 一种车牌识别方法、装置、系统及存储介质 | |
CN112200081A (zh) | 异常行为识别方法、装置、电子设备及存储介质 | |
CN111898581A (zh) | 动物检测方法、装置、电子设备及可读存储介质 | |
CN110969215A (zh) | 聚类处理方法和装置、存储介质及电子装置 | |
CN113095434A (zh) | 目标检测方法及装置、电子设备、存储介质 | |
CN105405130A (zh) | 基于聚类的证照图像高光检测方法及装置 | |
CN111291799A (zh) | 房间窗户分类模型构建方法、房间窗户分类方法及系统 | |
CN111353491A (zh) | 一种文字方向确定方法、装置、设备及存储介质 | |
CN116863286A (zh) | 一种双流目标检测方法及其模型搭建方法 | |
CN110737795A (zh) | 相册封面的确定方法、装置、设备及存储介质 | |
CN110119736B (zh) | 车牌位置识别方法、装置及电子设备 | |
CN112819509B (zh) | 自动筛选广告图片的方法、系统、电子设备和存储介质 | |
CN113688839A (zh) | 视频处理方法及装置、电子设备、计算机可读存储介质 | |
CN112396060B (zh) | 基于身份证分割模型的身份证识别方法及其相关设备 | |
CN112001300B (zh) | 基于按位置交叉熵的楼宇监控方法、装置和电子设备 | |
CN111062388B (zh) | 基于深度学习的广告文字的识别方法、系统、介质及设备 | |
CN115223022B (zh) | 一种图像处理方法、装置、存储介质及设备 | |
CN116630866A (zh) | 音视频雷达融合的异常事件监控方法、装置、设备及介质 | |
CN117809132A (zh) | 违规搭建识别模型训练方法、违规搭建识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |