CN113255670A - 非均衡小样本目标检测方法、装置和计算机设备 - Google Patents

非均衡小样本目标检测方法、装置和计算机设备 Download PDF

Info

Publication number
CN113255670A
CN113255670A CN202110721044.3A CN202110721044A CN113255670A CN 113255670 A CN113255670 A CN 113255670A CN 202110721044 A CN202110721044 A CN 202110721044A CN 113255670 A CN113255670 A CN 113255670A
Authority
CN
China
Prior art keywords
sensitive
data set
image
target detection
mark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110721044.3A
Other languages
English (en)
Inventor
郭建京
索红亮
周忠诚
段炼
张圣栋
黄九鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Xinghan Shuzhi Technology Co ltd
Original Assignee
Hunan Xinghan Shuzhi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Xinghan Shuzhi Technology Co ltd filed Critical Hunan Xinghan Shuzhi Technology Co ltd
Priority to CN202110721044.3A priority Critical patent/CN113255670A/zh
Publication of CN113255670A publication Critical patent/CN113255670A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/245Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及计算机视觉技术领域,提供了一种非均衡小样本目标检测方法、装置和计算机设备,所述方法包括:构建敏感标志图像数据集,计算敏感标志图像数据集中各类型敏感标志图像的数据分布权重;根据数据分布权重确定敏感标志图像数据集中各类型敏感标志图像对应的均衡化数量;基于各均衡化数量,分别对敏感标志图像数据集中各类型敏感标志图像进行数据均衡化,得到均衡敏感数据集;基于均衡敏感数据集对预训练模型进行训练,得到初始目标检测模型;对初始目标检测模型进行迭代的小样本学习,得到最终的目标检测模型,利用目标检测模型对包含敏感标志的图像进行检测。采用本方法能够提高非均衡小样本目标检测的准确率。

Description

非均衡小样本目标检测方法、装置和计算机设备
技术领域
本发明属于计算机视觉技术领域,尤其涉及一种非均衡小样本目标检测方法、装置和计算机设备。
背景技术
近年来,随着互联网飞速的发展,信息传播的速度也越来越快,使得人们能够通过互联网数据进行便捷快速的交流。但是,在给人们带来方便的同时,也存在一些非法人员和非法社会组织,通过借助互联网来发动和散布不实言论等负面消息,企图广泛传播以达到影响国家安全和社会安定的目的。经过大量的数据研究发现,负面消息的传播通常都携带有一定的敏感标志,比如敏感旗帜等。因此,现有大多采用目标检测识别技术检测识别敏感标志,从而有效的筛选出负面消息,以便能够及时的切断传播途径,追溯来源和分析。
然而,现有用于敏感标志的检测技术大多采用的是针对普通标志所用的检测技术。而敏感标志与普通标志是不同的,传统普通标志所在的图像背景简单、前景元素也比较单一,并且所占面积也比较大。敏感标志由于敏感问题和刻意的规避,通常分布不均匀、所占面积也极小,并且可能同时存在多个的现象,具备非均衡和小样本的特性。因此,利用普通标志的检测识别技术来检测敏感标志,降低了准确率。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高非均衡小样本目标检测准确率的非均衡小样本目标检测方法、装置和计算机设备。
本发明提供一种非均衡小样本目标检测方法,包括:
构建敏感标志图像数据集,计算所述敏感标志图像数据集中各类型敏感标志图像的数据分布权重;
根据所述数据分布权重确定所述敏感标志图像数据集中各类型敏感标志图像对应的均衡化数量;
基于各所述均衡化数量,分别对所述敏感标志图像数据集中各类型敏感标志图像进行数据均衡化,得到均衡敏感数据集;
基于所述均衡敏感数据集对预训练模型进行训练,得到初始目标检测模型;
对所述初始目标检测模型进行迭代的小样本学习,得到最终的目标检测模型,利用所述目标检测模型对包含敏感标志的图像进行检测。
在其中一个实施例中,基于各所述均衡化数量,分别对所述敏感标志图像数据集中各类型敏感标志图像进行数据均衡化,得到均衡敏感数据集,包括:
分别对各类型敏感标志图像进行数据模拟扩充,得到第一预设数量的模拟敏感标志图像;
分别对各类型敏感标志图像进行数据增强扩充,得到第二预设数量的增强敏感标志图像;所述第一预设数量与所述第二预设数量相加等于类型对应的所述均衡化数量;
将所述模拟敏感标志图像和所述增强敏感标志图像扩充到所述敏感标志图像数据集中,得到均衡敏感数据集。
在其中一个实施例中,所述分别对各类型敏感标志图像进行数据模拟扩充,得到第一预设数量的模拟敏感标志图像,包括:
分别提取各类型敏感标志图像中的敏感标志;
将各类型的所述敏感标志分别粘贴到预设背景图像上,构建第一预设数量的模拟敏感标志图像;
所述分别对各类型敏感标志图像进行数据增强扩充,得到第二预设数量的增强敏感标志图像,包括:
从各类型敏感标志图像中分别随机挑选敏感标志图像进行数据增强,得到第二预设数量的增强敏感标志图像。
在其中一个实施例中,获取各类型敏感标志的关键字;
根据各所述关键字收集各类型敏感标志对应的敏感标志图像构建得到敏感标志图像数据集。
在其中一个实施例中,所述基于所述均衡敏感数据集对预训练模型进行训练,得到初始目标检测模型,包括:
加载预训练模型;
基于迁移学习策略,利用所述均衡敏感数据集对所述预训练模型进行微调,得到初始目标检测模型。
在其中一个实施例中,所述对所述初始目标检测模型进行迭代的小样本学习,得到最终的目标检测模型,包括:
采集待检测敏感标志图像;
利用所述初始目标检测模型对所述待检测敏感标志图像进行敏感标志检测,获取所述初始目标检测模型判定为包括敏感标志的候选图像;
对所述候选图像进行筛选,将实际包括敏感标志的候选图像扩充到敏感标志图像数据集中,实际不包括敏感标志的候选图像扩充到预设背景图像中;
将所述初始目标检测模型更新为预训练模型,返回将所述敏感标志图像数据集进行数据均衡化的步骤,进行迭代训练,直至满足迭代结束条件,得到目标检测模型。
在其中一个实施例中,所述基于迁移学习策略,利用所述均衡敏感数据集对所述预训练模型进行微调,得到初始目标检测模型,包括:
将所述预训练模型中的特征提取层固化后,利用所述均衡敏感数据集对所述预训练模型中的全连接层进行训练;
当训练次数达到阈值时,将所述特征提取层解固,利用所述均衡敏感数据集对所述预训练模型的所有层进行训练,得到初始目标检测模型。
一种非均衡小样本目标检测装置,包括:
构建计算模块,用于构建敏感标志图像数据集,计算所述敏感标志图像数据集中各类型敏感标志图像的数据分布权重;
均衡数量确定模块,用于根据所述数据分布权重确定所述敏感标志图像数据集中各类型敏感标志图像对应的均衡化数量;
数据均衡化模块,用于基于各所述均衡化数量,分别对所述敏感标志图像数据集中各类型敏感标志图像进行数据均衡化,得到均衡敏感数据集;
训练模块,用于基于所述均衡敏感数据集对预训练模型进行训练,得到初始目标检测模型;
小样本学习模块,用于对所述初始目标检测模型进行迭代的小样本学习,得到最终的目标检测模型,利用所述目标检测模型对包含敏感标志的图像进行检测。
本发明还提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储由计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的非均衡小样本目标检测方法的步骤。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的非均衡小样本目标检测方法的步骤。
上述非均衡小样本目标检测方法、装置和计算机设备,首先构建敏感标志图像数据集且计算敏感标志图像数据集中各类型敏感标志图像的数据分布权重,从而根据数据分布权重确定敏感标志图像数据集中各类型敏感标志图像对应的均衡化数量;基于各均衡化数量,分别对敏感标志图像数据集中各类型敏感标志图像进行数据均衡化,得到均衡敏感数据集。然后基于均衡敏感数据集对预训练模型进行训练,得到初始目标检测模型,进而再对初始目标检测模型进行迭代的小样本学习,得到最终的目标检测模型,利用目标检测模型对包含敏感标志的图像进行检测。该方法通过对数据集计算数据分布权重确定均衡数量进行均衡化之后训练模型,并且在完成初始的训练之后加强模型的小样本学习能力,从而提高了非均衡小样本目标检测的准确率。
附图说明
图1为一个实施例中非均衡小样本目标检测方法的应用环境图。
图2为一个实施例中非均衡小样本目标检测方法的流程示意图。
图3为另一个实施例中非均衡小样本目标检测方法的流程示意图。
图4为一个实施例中非均衡小样本目标检测装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请提供的非均衡小样本目标检测方法,可以应用于如图1所示的应用环境中,该应用环境涉及终端102和服务器104。其中,终端102通过网络与服务器104进行通信。终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和携带式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
当终端102接收到相关指令时,可以由终端102单独实现上述非均衡小样本目标检测方法。也可以由终端102将指令发送给通信的服务器104,由服务器104实现上述非均衡小样本目标检测方法。以服务器104为例,具体的,服务器104构建敏感标志图像数据集,计算敏感标志图像数据集中各类型敏感标志图像的数据分布权重;服务器104根据数据分布权重确定敏感标志图像数据集中各类型敏感标志图像对应的均衡化数量;服务器104基于各均衡化数量,分别对敏感标志图像数据集中各类型敏感标志图像进行数据均衡化,得到均衡敏感数据集;服务器104基于均衡敏感数据集对预训练模型进行训练,得到初始目标检测模型;服务器104对初始目标检测模型进行迭代的小样本学习,得到最终的目标检测模型,利用目标检测模型对包含敏感标志的图像进行检测。
在一个实施例中,如图2所示,提供一种非均衡小样本目标检测方法,以该方法应用于服务器为例进行说明,包括以下步骤:
步骤S201,构建敏感标志图像数据集,计算敏感标志图像数据集中各类型敏感标志图像的数据分布权重。
其中,敏感标志图像数据集是构建的包括敏感标志的图像数据集,图像数据集中包括各种不同类型敏感标志的敏感标志图像,敏感标志可以是敏感旗帜等。但是应当理解的是,只要是具备非均衡以及小样本等特性的对象都属于本实施例所述的敏感标志,并不局限于敏感旗帜。数据分布权重用于表示敏感标志图像在敏感标志图像数据集中的分布情况。
具体的,服务器利用图片采集工具,根据各种不同类型敏感标志的关键字,收集包括敏感标志的敏感标志图像。以敏感旗帜为例,即根据敏感旗帜的关键字收集敏感旗帜图像。然后,将所收集的敏感标志图像返回给人工进行审核、过滤以及标注等操作处理。服务器最后将处理后的敏感标志图像构建成敏感标志图像数据集T={t1,t2,……,tn},其中,i∈(1,2,3……n),t i 表示第i种类型的敏感标志。
然后,服务器计算敏感标志图像数据集T中各个类型i的敏感标志图像的数据分布权重W={w1,wi,……,wn},数据分布权重的计算公式如下:
Figure 360638DEST_PATH_IMAGE002
步骤S202,根据数据分布权重确定敏感标志图像数据集中各类型敏感标志图像对应的均衡化数量。
其中,均衡化数量是指所确定的敏感标志图像所要增加的数量。数据扩充可以理解为是增加敏感标志图像的数量。
具体的,服务器计算得到数据分布权重W之后,根据各个类型敏感标志图像的数据分布权重W,计算各个类型i的敏感标志图像的均衡化数量D={d1,di,……,dn},均衡化数量D的计算公式如下:
Figure 74516DEST_PATH_IMAGE004
步骤S203,基于各均衡化数量,分别对敏感标志图像数据集中各类型敏感标志图像进行数据均衡化,得到均衡敏感数据集。
其中,数据均衡化是指对敏感标志图像数据集中各个不同类型的敏感标志图像的数量进行均衡化处理。
具体的,服务器构建得到敏感标志图像数据集之后,为了确保不同类型敏感标志图像数量比例均衡,服务器根据敏感标志图像数据集中各种不同类型的敏感标志图像的数量进行均衡化。例如,确定一个图像数量,以该图像数量为基准增加或减少敏感标志图像的数量。假设当确定的图像数量为125时,若敏感标志图像数据集中第i种类型的敏感标志图像为100张,则可以在增加25张该敏感标志图像至敏感标志图像数据集中。在本实施例中,服务器计算得到均衡化数量D之后,以该均衡化数量对各个类型的敏感标志图进行数据扩充,完成数据集的均衡,得到均衡敏感数据集。
步骤S204,基于均衡敏感数据集对预训练模型进行训练,得到初始目标检测模型。
其中,预训练模型为已存在且经过一定训练的模型,通过对该预训练模型进行敏感标志检测任务的微调训练即可得到初始目标检测模型。
具体的,当服务器对敏感标志图像数据集进行数据均衡化得到均衡敏感数据集之后,加载预训练模型。在均衡敏感数据集上对预训练模型进行敏感标志检测任务的微调训练,得到初始目标检测模型。
步骤S205,对初始目标检测模型进行迭代的小样本学习,得到最终的目标检测模型,利用目标检测模型对包含敏感标志的图像进行检测识别。
其中,由于敏感标志具备小样本的特性,所以本实施例中的小样本学习是指通过对初始目标检测模型进行迭代训练,提高模型的小样本检测能力的过程。
具体的,服务器得到初始目标检测模型之后,重新收集一批敏感标志图像作为待检测敏感标志图像。然后,利用初始目标检测模型对该待检测敏感标志图像进行敏感标志的检测,进而将检测得到的负样本作为训练样本重新对初始目标检测模型进行训练,以增强模型对小样本敏感标志的检测能力,得到最终的目标检测模型。服务器将最终训练得到的目标检测模型进行固化,后续需要对非均衡小样本目标进行检测时,调用该目标检测模型直接进行检测即可。
上述非均衡小样本目标检测方法,首先构建敏感标志图像数据集,且计算敏感标志图像数据集中各类型敏感标志图像的数据分布权重,从而根据数据分布权重确定敏感标志图像数据集中各类型敏感标志图像对应的均衡化数量;基于各均衡化数量,分别对敏感标志图像数据集进行数据均衡化,得到均衡敏感数据集。然后基于均衡敏感数据集对预训练模型进行训练,得到初始目标检测模型,进而再对初始目标检测模型进行迭代的小样本学习,得到最终的目标检测模型,利用目标检测模型对包含敏感标志的图像进行检测。该方法通过对数据集计算数据分布权重确定均衡数量进行均衡化之后训练模型,并且在完成初始的训练之后加强模型的小样本学习能力,从而提高了非均衡小样本目标的检测准确率。并且,通过计算数据集中各个类型敏感标志图像的数据分布权重,以数据分布权重确定均衡化数量进行数量扩充,能够确保各类型敏感标志图像数据均衡化的准确性,从而提高均衡化处理的准确性。
在一个实施例中,步骤S202,包括:计算敏感标志图像数据集中各类型敏感标志图像的数据分布权重;根据数据分布权重,确定敏感标志数据集中各类型敏感标志图像对应的均衡化数量;基于各均衡化数量,分别对各类型敏感标志图像进行数据扩充,得到均衡敏感数据集。
在一个实施例中,步骤S203,基于各均衡化数量,分别对敏感标志图像数据集中各类型敏感标志图像进行数据均衡化,得到均衡敏感数据集,包括:分别对各类型敏感标志图像进行数据模拟扩充,得到第一预设数量的模拟敏感标志图像;分别对各类型敏感标志图像进行数据增强扩充,得到第二预设数量的增强敏感标志图像;第一预设数量与第二预设数量相加等于类型对应的均衡化数量;将模拟敏感标志图像和增强敏感标志图像扩充到敏感标志图像数据集中,得到均衡敏感数据集。
其中,数据模拟扩充支线是指通过对图像进行模拟,生成新的图像来扩充该图像的数量。数据增强扩充支线则是通过对图像进行数据增强等处理来扩充该图像的数量。
具体的,基于均衡化数量D对敏感标志图像进行数据扩充时,本实施例分为两条支线,包括数据模拟扩充支线和数据增强扩充支线。这两条支线所得到的敏感标志图像的数量和等于均衡化数量。其中数据模拟扩充支线所需要扩充的数量为第一预设数量,另外数据增强扩充支线所需要扩充的数量为第二预设数量。比如,i类型的敏感标志图像对应的均衡化数量为25,则以两条支线对i类型的敏感标志图像进行数据扩充时,两条支线所得的图像的数量和为25张,也就是第一预设数量+第二预设数量=25。本实施例优选两条支线所扩充的图像数量进行均分,即每条支线所扩充的图像数量均为di/2。
在一个实施例中,分别对各类型敏感标志图像进行数据模拟扩充,得到第一预设数量的模拟敏感标志图像,包括:分别提取各类型敏感标志图像中的敏感标志;将各类型的敏感标志分别粘贴到预设背景图像上,构建第一预设数量的模拟敏感标志图像。
在一个实施例中,分别对各类型敏感标志图像进行数据增强扩充,得到第二预设数量的增强敏感标志图像,包括:从各类型敏感标志图像中分别随机挑选敏感标志图像进行数据增强,得到第二预设数量的增强敏感标志图像。
其中,预设背景图像是预先收集作为背景的图像,可以根据敏感标志实际经常所处背景的类型进行收集,得到与实际较为准确的背景图像。模拟敏感标志图像是通过粘贴敏感标志以达到模拟常规敏感标志图像目的所得到的图像。增强敏感标志图像是指通过对原始的敏感标志图像进行数据增强得到的图像。
这两条数据扩充支线,数据模拟扩充支线利用图像处理工具,将需要扩充的敏感标志图像中的敏感标志提取出来进行保存,保存格式可以是任意一种图像格式,例如PNG、JPG等。然后,从预设背景图像集中任意选择一张预设背景图像,并且随机从保存的敏感标志中任意选一张粘贴到选择的预设背景图像上,构建模拟生成的模拟敏感标志图像,所有的模拟敏感标志图像构成数据集可以记为T1。而数据增强扩充支线,即对需要进行扩充的敏感标志图像,随机选择一张图像且随机进行图像旋转、水平偏移、垂直偏移、水平镜像、垂直镜像、随机裁剪、随机通道转换等用于数据增强的图像处理操作,得到增强敏感标志图像,所有的增强敏感标志图像构成数据集可以记为T2
服务器完成两条支线的数据生成之后,将得到的图像数据扩充到敏感标志图像数据集中,也就是将数据集T1和数据集T2合并到原始的敏感图像数据集T中,得到扩充后处于均衡状态的均衡敏感数据集。例如,假设t1=50,t2=100,t3=30,t4=70,则共计250张图像。通过数据分布权重W和均衡化数量D的计算,能够得到d1=72,d2=25,d3=95,d4=55。进而通过数据扩充之后,t1=125,t2=125,t3=125,t4=125,即数据集中不同类型的敏感标志图像比例接近均衡。
本实施例中,通过两条不同支线进行数据扩充,不仅能够确保数据均衡,提高数据量,降低样本比例失衡的问题,还通过数据增强提高了数据的多样性。
在一个实施例中,步骤S204,包括:加载预训练模型;基于迁移学习策略,利用均衡敏感数据集对预训练模型进行微调,得到初始目标检测模型。
其中,预训练模型的网络结构可以选用现有任意一种神经网络的网络结构,比如SSD(Single Shot MultiBox Detector)网络、R-CNN(Region-Convolutional NeuralNetworks,区域卷积神经网络)、YOLO(You Only Look Once)系列网络等。本实施例优选YOLOv4的主干网络作为预训练模型的网络结构。
具体的,服务器首先加载预训练模型Minit,若本地存在Minit模型,则直接利用均衡敏感数据集微调Minit模型。若本地不存在Minit模型,则先在COCO数据集上对YOLOv4的主干网络进行训练,得到预训练模型Minit之后再对Minit模型进行微调。训练的损失函数可以采用YOLOv4默认的损失函数,并且设置Adam为模型的优化器。
服务器微调Minit模型时,按照一定比例(比如8:2)将均衡敏感数据划分为训练集Strain和测试集Stest。然后在训练集Strain上采用迁移学习策略对预训练网络进行敏感标志检测任务的微调训练。在整个的训练过程中,使用测试集Stest对训练过程中模型进行评测,选择评测结果最佳的模型作为此次训练的输出模型,即初始目标检测模型Mgood
在一个实施例中,基于迁移学习策略,利用均衡敏感数据集对预训练模型进行微调,得到初始目标检测模型,包括:将预训练模型中的特征提取层固化后,利用均衡敏感数据集对预训练模型中的全连接层进行训练;当训练次数达到阈值时,将特征提取层解固,利用均衡敏感数据集对预训练模型的所有层进行训练,得到初始目标检测模型。
具体的,服务器采用迁移学习策略对预训练模型Minit进行微调时,首先将预训练模型Minit中的特征提取层进行固化,通过固化,首先仅仅只训练全连接层。在训练达到预设次数之后,比如训练完成30个Epoch之后,服务器再将特征提取层解固,然后训练所有的参数,从而得到初始目标检测网络Mgood
本实施例中,以数据比例均衡的均衡敏感数据训练用于检测敏感标志的初始目标检测网络,从而能够提高检测的准确率。
在一个实施例中,步骤S205,包括:采集待检测敏感标志图像;利用初始目标检测模型对待检测敏感标志图像进行敏感标志检测,获取初始目标检测模型判定为包括敏感标志的候选图像;对候选图像进行筛选,将实际包括敏感标志的候选图像扩充到敏感标志图像数据集中,实际不包括敏感标志的候选图像扩充到预设背景图像中;将初始目标检测模型更新为预训练模型,返回将敏感标志图像数据集进行数据均衡化的步骤,进行迭代训练,直至满足迭代结束条件,得到目标检测模型。
具体的,服务器采集一定数量的图像作为待检测敏感标志图像,并使用初始目标检测模型Mgood对这一百万张的待检测敏感标志图像进行敏感标志的目标检测。将Mgood模型判断为包含敏感标志的候选图像进行保存,记为C。然后,服务器对图像集C进行筛选划分处理,确认其中实际包括敏感标志的候选图像和实际未包括敏感标志的候选图像。将实际包括敏感标志的候选图像扩充给敏感标志数据集,而实际不包含敏感标志的候选图像作为预设背景图像扩充给预设背景图像集。当候选图像筛选划分完成之后,服务器则将初始目标检测网络Mgood更新为预训练模型Minit,作为下一次迭代的预训练模型,返回到步骤S202进行迭代训练。直到满足迭代结束条件,比如迭代次数满足次数阈值,或者训练所得到的初始目标检测网络Mgood的性能满足要求。性能满足要求可以是Mgood模型的准确率达到了预设的标准值。当结束迭代之后,将最后一次训练得到的Mgood模型作为最终的目标检测网络。
本实施例中,通过对初始目标检测网络进行实际检测,并且将模型判断准确与不准确的候选图像分别扩充到敏感标志图像数据集和背景图像中,再进行迭代训练,从而能够提高模型识别小样本目标的准确率。
在一个实施例中,如图3所示,提供另一种非均衡小样本目标检测方法的流程图,以图3所示的流程图,以及敏感标志为敏感旗帜为例,对非均衡小样本目标检测方法进行解释说明。
具体的,参考图3,服务器首先构建包括不同类型敏感旗帜的图像的敏感旗帜图像数据集。然后,服务器将构建的敏感图像数据集进行数据均衡处理,先通过计算图像数据的数据分布权重W来计算得到不同类型敏感旗帜的均衡化数量D。再基于均衡化数量D进行数据模拟扩充支线和数据增强扩充支线这两条支线生成新的敏感旗帜图像数据,并将生成的敏感旗帜图像数据扩充到原始的敏感旗帜图像数据T中,以解决不同类型数据比例失衡问题,完成数据均衡化,得到均衡敏感数据集。
其次,服务器将均衡敏感数据集划分为训练集Strain和测试集Stest。利用得到的均衡敏感数据集对预训练模型进行训练得到初始目标检测模型。服务器先加载预训练模型Minit,如果存在预训练模型Minit,则直接加载Minit,以该预训练模型Minit保存时的Epoch为起始点,在训练集Strain上继续向后训练,并通过测试集Stest评测之后,选取准确率最佳的模型作为得到的初始目标检测网络Mgood。而如果预训练模型Minit不存在,表示为第一次进行迭代训练,则先利用COCO数据集,并且采用迁移学习的策略对YOLOv4的主干模型进行迭代训练得到预训练模型Minit。再在训练集Strain上对预训练模型Minit进行训练,测试集Stest上进行评测得到初始目标检测网络Mgood
最后,服务器继续加强初始目标检测网络Mgood的小样本检测能力,对初始目标检测网络Mgood进行小样本学习。即,首先采集海量的图像数据作为待检测敏感旗帜图像。然后利用初始目标检测网络Mgood对待检测敏感旗帜图像进行敏感旗帜的预测,通过人工标注的方式确定初始目标检测网络Mgood判定准确的候选图像和判定不准确的图像。服务器将初始目标检测网络Mgood判定准确的候选图像加入到原始的敏感旗帜图像数据集中,而判定错误的候选图像作为负样本扩充到预设背景图像中用于数据均衡处理。之后,服务器将当前得到的初始目标检测网络Mgood更新为预训练模型Minit,返回到数据均衡处理的步骤,对模型进行迭代优化。如果在优化的过程中,通过评测确定初始目标检测网络Mgood的性能,即准确率达到预设标准,比如准确率达到95 %以上时,即可确定模型达到了预期的准确率,输出该模型作为最终的目标检测模型。
在实际训练过程中,本实施例以一百万张待检测敏感旗帜图像为例,第一次迭代得到的初始目标检测网络Mgood输出了1260张候选图像,其中980张候选图像为判断正确的图像,280张图像为判断错误的候选图像,Mgood模型的准确率为65%,未达到预期的准确率。则将980张候选图像为判断正确的图像扩充到数据集T中,280张图像为判断错误的候选图像作为负样本扩充到背景图像中,返回进行第二次的迭代。经过第二次的迭代,第二次得到的初始目标检测网络Mgood检测正确的图像1265张,检测错误的图像129张图像,第二次得到的初始目标检测网络Mgood的准确率为83%,还是未达到预期的准确率,则同样将数据进行扩充之后进行第三次迭代。第三次迭代得到的Mgood模型检测正确的图像2106张,错误的图像42张,准确率为92%,继续进行图像扩充进行第四次迭代。第四次迭代得到的Mgood模型的准确率为96%,达到了预期的准确率95%,因此将第四次迭代的Mgood模型作为最终的目标检测模型。
应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供一种非均衡小样本目标检测装置,包括:构建模块401,均衡数量确定模块402,数据均衡化模块403,训练模块404以及小样本学习模块405。其中,
构建计算模块401,用于构建敏感标志图像数据集,计算敏感标志图像数据集中各类型敏感标志图像的数据分布权重;
均衡数量确定模块402,用于根据数据分布权重确定敏感标志图像数据集中各类型敏感标志图像对应的均衡化数量;
数据均衡化模块403,用于基于各所述均衡化数量,分别对敏感标志图像数据集中各类型敏感标志图像进行数据均衡化,得到均衡敏感数据集;
训练模块404,用于基于均衡敏感数据集对预训练模型进行训练,得到初始目标检测模型;
小样本学习模块405,用于对初始目标检测模型进行迭代的小样本学习,得到最终的目标检测模型,利用目标检测模型对包含敏感标志的图像进行检测。
在一个实施例中,数据均衡化模块403还用于分别对各类型敏感标志图像进行数据模拟扩充,得到第一预设数量的模拟敏感标志图像;分别对各类型敏感标志图像进行数据增强扩充,得到第二预设数量的增强敏感标志图像;第一预设数量与第二预设数量相加等于类型对应的均衡化数量;将模拟敏感标志图像和增强敏感标志图像扩充到敏感标志图像数据集中,得到均衡敏感数据集。
在一个实施例中,数据均衡化模块403还用于分别提取各类型敏感标志图像中的敏感标志;将各类型的敏感标志分别粘贴到预设背景图像上,构建第一预设数量的模拟敏感标志图像;从各类型敏感标志图像中分别随机挑选敏感标志图像进行数据增强,得到第二预设数量的增强敏感标志图像。
在一个实施例中,构建计算模块401还用于获取各类型敏感标志的关键字;根据各关键字收集各类型敏感标志对应的敏感标志图像构建得到敏感标志图像数据集。
在一个实施例中,训练模块404还用于加载预训练模型;基于迁移学习策略,利用均衡敏感数据集对预训练模型进行微调,得到初始目标检测模型。
在一个实施例中,小样本学习模块405还用于采集待检测敏感标志图像;利用初始目标检测模型对待检测敏感标志图像进行敏感标志检测,获取初始目标检测模型判定为包括敏感标志的候选图像;对候选图像进行筛选,将实际包括敏感标志的候选图像扩充到敏感标志图像数据集中,实际不包括敏感标志的候选图像扩充到预设背景图像中;将初始目标检测模型更新为预训练模型,返回将敏感标志图像数据集进行数据均衡化的步骤,进行迭代训练,直至满足迭代结束条件,得到目标检测模型。
在一个实施例中,训练模块404还用于将预训练模型中的特征提取层固化后,利用均衡敏感数据集对预训练模型中的全连接层进行训练;当训练次数达到阈值时,将特征提取层解固,利用均衡敏感数据集对预训练模型的所有层进行训练,得到初始目标检测模型。
关于非均衡小样本目标检测装置的具体限定可以参见上文中对于非均衡小样本目标检测方法的限定,在此不再赘述。上述非均衡小样本目标检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个非均衡小样本目标检测方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
在一个实施例中,提供一种计算机设备,该计算机设备可以是服务器,包括处理器,存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种非均衡小样本目标检测方法。示例性的,计算机程序可以被分割成一个或多个模块,一个或者多个模块被存储在存储器中,并由处理器执行以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
本领域技术人员可以理解,本实施例中所示出的计算机设备结构,仅仅是与本发明方案相关的部分结构,并不构成对本发明所应用于其上的计算机设备的限定,具体的计算机设备可以包括更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
构建敏感标志图像数据集,计算敏感标志图像数据集中各类型敏感标志图像的数据分布权重;
根据数据分布权重确定敏感标志图像数据集中各类型敏感标志图像对应的均衡化数量;
基于各所述均衡化数量,分别对敏感标志图像数据集中各类型敏感标志图像进行数据均衡化,得到均衡敏感数据集;
基于均衡敏感数据集对预训练模型进行训练,得到初始目标检测模型;
对初始目标检测模型进行迭代的小样本学习,得到最终的目标检测模型,利用目标检测模型对包含敏感标志的图像进行检测。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:分别对各类型敏感标志图像进行数据模拟扩充,得到第一预设数量的模拟敏感标志图像;分别对各类型敏感标志图像进行数据增强扩充,得到第二预设数量的增强敏感标志图像;第一预设数量与第二预设数量相加等于类型对应的均衡化数量;将模拟敏感标志图像和增强敏感标志图像扩充到敏感标志图像数据集中,得到均衡敏感数据集。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:分别提取各类型敏感标志图像中的敏感标志;将各类型的敏感标志分别粘贴到预设背景图像上,构建第一预设数量的模拟敏感标志图像;从各类型敏感标志图像中分别随机挑选敏感标志图像进行数据增强,得到第二预设数量的增强敏感标志图像。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取各类型敏感标志的关键字;根据各关键字收集各类型敏感标志对应的敏感标志图像构建得到敏感标志图像数据集。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:加载预训练模型;基于迁移学习策略,利用均衡敏感数据集对预训练模型进行微调,得到初始目标检测模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:采集待检测敏感标志图像;利用初始目标检测模型对待检测敏感标志图像进行敏感标志检测,获取初始目标检测模型判定为包括敏感标志的候选图像;对候选图像进行筛选,将实际包括敏感标志的候选图像扩充到敏感标志图像数据集中,实际不包括敏感标志的候选图像扩充到预设背景图像中;将初始目标检测模型更新为预训练模型,返回将敏感标志图像数据集进行数据均衡化的步骤,进行迭代训练,直至满足迭代结束条件,得到目标检测模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将预训练模型中的特征提取层固化后,利用均衡敏感数据集对预训练模型中的全连接层进行训练;当训练次数达到阈值时,将特征提取层解固,利用均衡敏感数据集对预训练模型的所有层进行训练,得到初始目标检测模型。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
构建敏感标志图像数据集,计算敏感标志图像数据集中各类型敏感标志图像的数据分布权重;
根据数据分布权重确定敏感标志图像数据集中各类型敏感标志图像对应的均衡化数量;
基于各所述均衡化数量,分别对敏感标志图像数据集中各类型敏感标志图像进行数据均衡化,得到均衡敏感数据集;
基于均衡敏感数据集对预训练模型进行训练,得到初始目标检测模型;
对初始目标检测模型进行迭代的小样本学习,得到最终的目标检测模型,利用目标检测模型对包含敏感标志的图像进行检测。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:分别对各类型敏感标志图像进行数据模拟扩充,得到第一预设数量的模拟敏感标志图像;分别对各类型敏感标志图像进行数据增强扩充,得到第二预设数量的增强敏感标志图像;第一预设数量与第二预设数量相加等于类型对应的均衡化数量;将模拟敏感标志图像和增强敏感标志图像扩充到敏感标志图像数据集中,得到均衡敏感数据集。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:分别提取各类型敏感标志图像中的敏感标志;将各类型的敏感标志分别粘贴到预设背景图像上,构建第一预设数量的模拟敏感标志图像;从各类型敏感标志图像中分别随机挑选敏感标志图像进行数据增强,得到第二预设数量的增强敏感标志图像。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取各类型敏感标志的关键字;根据各关键字收集各类型敏感标志对应的敏感标志图像构建得到敏感标志图像数据集。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:加载预训练模型;基于迁移学习策略,利用均衡敏感数据集对预训练模型进行微调,得到初始目标检测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:采集待检测敏感标志图像;利用初始目标检测模型对待检测敏感标志图像进行敏感标志检测,获取初始目标检测模型判定为包括敏感标志的候选图像;对候选图像进行筛选,将实际包括敏感标志的候选图像扩充到敏感标志图像数据集中,实际不包括敏感标志的候选图像扩充到预设背景图像中;将初始目标检测模型更新为预训练模型,返回将敏感标志图像数据集进行数据均衡化的步骤,进行迭代训练,直至满足迭代结束条件,得到目标检测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将预训练模型中的特征提取层固化后,利用均衡敏感数据集对预训练模型中的全连接层进行训练;当训练次数达到阈值时,将特征提取层解固,利用均衡敏感数据集对预训练模型的所有层进行训练,得到初始目标检测模型。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种非均衡小样本目标检测方法,其特征在于,包括:
构建敏感标志图像数据集,计算所述敏感标志图像数据集中各类型敏感标志图像的数据分布权重,数据分布权重W的计算公式如下:
Figure DEST_PATH_IMAGE002
其中,T为敏感标志图像数据集,t i 为第i种类型的敏感标志图像,w i 表示第i种类型的敏感标志图像对应的数据分布权重,i∈(1,2,3……n);
根据所述数据分布权重确定所述敏感标志图像数据集中各类型敏感标志图像对应的均衡化数量,均衡化数量D的计算公式如下:
Figure DEST_PATH_IMAGE004
其中, di为第i种类型的敏感标志图像对应的均衡化数量;
基于各所述均衡化数量,分别对所述敏感标志图像数据集中各类型敏感标志图像进行数据均衡化,得到均衡敏感数据集;
基于所述均衡敏感数据集对预训练模型进行训练,得到初始目标检测模型;
对所述初始目标检测模型进行迭代的小样本学习,得到最终的目标检测模型,利用所述目标检测模型对包含敏感标志的图像进行检测。
2.根据权利要求1所述的方法,其特征在于,基于各所述均衡化数量,分别对所述敏感标志图像数据集中各类型敏感标志图像进行数据均衡化,得到均衡敏感数据集,包括:
分别对各类型敏感标志图像进行数据模拟扩充,得到第一预设数量的模拟敏感标志图像;
分别对各类型敏感标志图像进行数据增强扩充,得到第二预设数量的增强敏感标志图像;所述第一预设数量与所述第二预设数量相加等于类型对应的所述均衡化数量;
将所述模拟敏感标志图像和所述增强敏感标志图像扩充到所述敏感标志图像数据集中,得到均衡敏感数据集。
3.根据权利要求2所述的方法,其特征在于,所述分别对各类型敏感标志图像进行数据模拟扩充,得到第一预设数量的模拟敏感标志图像,包括:
分别提取各类型敏感标志图像中的敏感标志;
将各类型的所述敏感标志分别粘贴到预设背景图像上,构建第一预设数量的模拟敏感标志图像;
所述分别对各类型敏感标志图像进行数据增强扩充,得到第二预设数量的增强敏感标志图像,包括:
从各类型敏感标志图像中分别随机挑选敏感标志图像进行数据增强,得到第二预设数量的增强敏感标志图像。
4.根据权利要求1所述的方法,其特征在于,所述构建敏感标志图像数据集,包括:
获取各类型敏感标志的关键字;
根据各所述关键字收集各类型敏感标志对应的敏感标志图像构建得到敏感标志图像数据集。
5.根据权利要求1所述的方法,其特征在于,所述基于所述均衡敏感数据集对预训练模型进行训练,得到初始目标检测模型,包括:
加载预训练模型;
基于迁移学习策略,利用所述均衡敏感数据集对所述预训练模型进行微调,得到初始目标检测模型。
6.根据权利要求1所述的方法,其特征在于,所述对所述初始目标检测模型进行迭代的小样本学习,得到最终的目标检测模型,包括:
采集待检测敏感标志图像;
利用所述初始目标检测模型对所述待检测敏感标志图像进行敏感标志检测,获取所述初始目标检测模型判定为包括敏感标志的候选图像;
对所述候选图像进行筛选,将实际包括敏感标志的候选图像扩充到敏感标志图像数据集中,实际不包括敏感标志的候选图像扩充到预设背景图像中;
将所述初始目标检测模型更新为预训练模型,返回将所述敏感标志图像数据集进行数据均衡化的步骤,进行迭代训练,直至满足迭代结束条件,得到目标检测模型。
7.根据权利要求5所述的方法,其特征在于,所述基于迁移学习策略,利用所述均衡敏感数据集对所述预训练模型进行微调,得到初始目标检测模型,包括:
将所述预训练模型中的特征提取层固化后,利用所述均衡敏感数据集对所述预训练模型中的全连接层进行训练;
当训练次数达到阈值时,将所述特征提取层解固,利用所述均衡敏感数据集对所述预训练模型的所有层进行训练,得到初始目标检测模型。
8.一种非均衡小样本目标检测装置,其特征在于,包括:
构建计算模块,用于构建敏感标志图像数据集,计算所述敏感标志图像数据集中各类型敏感标志图像的数据分布权重,数据分布权重W的计算公式如下:
Figure DEST_PATH_IMAGE002A
其中,T为敏感标志图像数据集,t i 为第i种类型的敏感标志图像,w i 表示第i种类型的敏感标志图像对应的数据分布权重,i∈(1,2,3……n);
均衡数量确定模块,用于根据所述数据分布权重确定所述敏感标志图像数据集中各类型敏感标志图像对应的均衡化数量,均衡化数量D的计算公式如下:
Figure DEST_PATH_IMAGE004A
其中, di为第i种类型的敏感标志图像对应的均衡化数量;
数据均衡化模块,用于基于各所述均衡化数量,分别对所述敏感标志图像数据集中各类型敏感标志图像进行数据均衡化,得到均衡敏感数据集;
训练模块,用于基于所述均衡敏感数据集对预训练模型进行训练,得到初始目标检测模型;
小样本学习模块,用于对所述初始目标检测模型进行迭代的小样本学习,得到最终的目标检测模型,利用所述目标检测模型对包含敏感标志的图像进行检测。
9.一种计算机设备,包括处理器和存储器,所述存储器存储有计算机程序,其特征在于,所述处理器用于执行所述计算机程序时实现权利要求1-7中任意一项所述的非均衡小样本目标检测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7中任意一项所述的非均衡小样本目标检测方法。
CN202110721044.3A 2021-06-28 2021-06-28 非均衡小样本目标检测方法、装置和计算机设备 Pending CN113255670A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110721044.3A CN113255670A (zh) 2021-06-28 2021-06-28 非均衡小样本目标检测方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110721044.3A CN113255670A (zh) 2021-06-28 2021-06-28 非均衡小样本目标检测方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN113255670A true CN113255670A (zh) 2021-08-13

Family

ID=77189886

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110721044.3A Pending CN113255670A (zh) 2021-06-28 2021-06-28 非均衡小样本目标检测方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN113255670A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117558000A (zh) * 2023-06-14 2024-02-13 北京数美时代科技有限公司 一种敏感标志的检测方法、系统、介质及设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1583024A2 (en) * 2004-03-26 2005-10-05 Sony Corporation Apparatus, method, computer program and computer readable storage medium for information prcessing
CN108628971A (zh) * 2018-04-24 2018-10-09 深圳前海微众银行股份有限公司 不均衡数据集的文本分类方法、文本分类器及存储介质
CN109472345A (zh) * 2018-09-28 2019-03-15 深圳百诺名医汇网络技术有限公司 一种权重更新方法、装置、计算机设备和存储介质
CN110569841A (zh) * 2019-09-02 2019-12-13 中南大学 基于卷积神经网络的接触网关键部件目标检测方法
CN111241969A (zh) * 2020-01-06 2020-06-05 北京三快在线科技有限公司 目标检测方法、装置及相应模型训练方法、装置
CN111860568A (zh) * 2020-05-13 2020-10-30 北京嘀嘀无限科技发展有限公司 数据样本的均衡分布方法、装置及存储介质
CN112102330A (zh) * 2020-08-12 2020-12-18 浙江工业大学 基于类别均衡小样本学习的新冠肺炎感染区域分割方法
CN112766379A (zh) * 2021-01-21 2021-05-07 中国科学技术大学 一种基于深度学习多权重损失函数的数据均衡方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1583024A2 (en) * 2004-03-26 2005-10-05 Sony Corporation Apparatus, method, computer program and computer readable storage medium for information prcessing
CN108628971A (zh) * 2018-04-24 2018-10-09 深圳前海微众银行股份有限公司 不均衡数据集的文本分类方法、文本分类器及存储介质
CN109472345A (zh) * 2018-09-28 2019-03-15 深圳百诺名医汇网络技术有限公司 一种权重更新方法、装置、计算机设备和存储介质
CN110569841A (zh) * 2019-09-02 2019-12-13 中南大学 基于卷积神经网络的接触网关键部件目标检测方法
CN111241969A (zh) * 2020-01-06 2020-06-05 北京三快在线科技有限公司 目标检测方法、装置及相应模型训练方法、装置
CN111860568A (zh) * 2020-05-13 2020-10-30 北京嘀嘀无限科技发展有限公司 数据样本的均衡分布方法、装置及存储介质
CN112102330A (zh) * 2020-08-12 2020-12-18 浙江工业大学 基于类别均衡小样本学习的新冠肺炎感染区域分割方法
CN112766379A (zh) * 2021-01-21 2021-05-07 中国科学技术大学 一种基于深度学习多权重损失函数的数据均衡方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117558000A (zh) * 2023-06-14 2024-02-13 北京数美时代科技有限公司 一种敏感标志的检测方法、系统、介质及设备

Similar Documents

Publication Publication Date Title
WO2020215571A1 (zh) 一种识别敏感数据的方法、装置、存储介质及计算机设备
CN109299258B (zh) 一种舆情事件检测方法、装置及设备
CN107423613B (zh) 依据相似度确定设备指纹的方法、装置及服务器
WO2021129145A1 (zh) 一种图像特征点过滤方法以及终端
CN107657048A (zh) 用户识别方法及装置
US20110150328A1 (en) Apparatus and method for blockiing objectionable image on basis of multimodal and multiscale features
CN106686308A (zh) 图像焦距检测方法和装置
CN108376164B (zh) 一种潜力主播的展示方法及装置
CN110070140B (zh) 基于多类别信息的用户相似性确定方法及装置
CN111914908B (zh) 一种图像识别模型训练方法、图像识别方法及相关设备
CN104657466B (zh) 一种基于论坛帖子特征的用户兴趣识别方法及装置
CN110852257A (zh) 一种人脸关键点的检测方法、装置及存储介质
CN113255670A (zh) 非均衡小样本目标检测方法、装置和计算机设备
CN114329022A (zh) 一种色情分类模型的训练、图像检测方法及相关装置
CN110046632B (zh) 模型训练方法和装置
CN108133234B (zh) 基于稀疏子集选择算法的社区检测方法、装置及设备
CN112035736B (zh) 信息推送方法、装置及服务器
KR102242042B1 (ko) 데이터 라벨링 방법, 시스템 및 컴퓨터 프로그램
CN113849679A (zh) 图像检索方法、装置、电子设备及存储介质
CN112148808A (zh) 关系构建方法、装置和电子设备
CN114756634A (zh) 兴趣点变化发现方法、装置、电子设备及存储介质
CN110309313B (zh) 生成事件转移图谱的方法及装置
US20200320090A1 (en) Method and device for data fusion, non-transitory storage medium and server
CN114510592A (zh) 图像分类方法、装置、电子设备及存储介质
CN117556079B (zh) 遥感影像内容检索方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210813

RJ01 Rejection of invention patent application after publication