CN111882508A - 一种包含多目标的图片数据集的生成方法及系统 - Google Patents

一种包含多目标的图片数据集的生成方法及系统 Download PDF

Info

Publication number
CN111882508A
CN111882508A CN202010556085.7A CN202010556085A CN111882508A CN 111882508 A CN111882508 A CN 111882508A CN 202010556085 A CN202010556085 A CN 202010556085A CN 111882508 A CN111882508 A CN 111882508A
Authority
CN
China
Prior art keywords
picture
target
target object
data set
target picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010556085.7A
Other languages
English (en)
Inventor
程德心
周风明
郝江波
周昭晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Kotei Informatics Co Ltd
Original Assignee
Wuhan Kotei Informatics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Kotei Informatics Co Ltd filed Critical Wuhan Kotei Informatics Co Ltd
Priority to CN202010556085.7A priority Critical patent/CN111882508A/zh
Publication of CN111882508A publication Critical patent/CN111882508A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • G06T2207/20032Median filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种包含多目标的图片数据集的生成方法及系统,基于网络爬虫爬取获得包含目标对象的各个目标图片;查找目标图片中的目标对象的轮廓,通过像素运算将目标对象从目标图片进行区分;根据需求图片的目标对象的数量进行图片合成结合计算机视觉技术,设定好识别目标图片的算法条件下,利用图片处理方法进行相应的图片预处理,提取和合成,生成对应的多目标图片数据集,相比于人工采集识别,提升了效率,降低了行业成本,针对不同环境下的图片都能灵活处理。

Description

一种包含多目标的图片数据集的生成方法及系统
技术领域
本发明涉及计算机视觉领域,尤其涉及一种包含多目标的图片数据集的生成方法及系统。
背景技术
目前在计算机视觉领域中,已有很多开放的数据集,例如人脸数据集、车牌数据集合交通标志牌数据集,但是只能根据现有数据集进行选择和使用,无法做到根据各种时刻方便的获取数据集。
比如想要获取单张图片包含多目标的数据集,可能需要利用双目摄像头单独去特定场景获取图片数据集。需要大量人工操作达到目的,同时也增加了行业成本。
发明内容
本发明针对现有技术中存在的技术问题,提供一种包含多目标的图片数据集的生成方法,解决现有技术中无法方便获取多目标图片的数据集的问题。
本发明解决上述技术问题的技术方案如下:一种包含多目标的图片数据集的生成方法,包括:
步骤1,基于网络爬虫爬取获得包含目标对象的各个目标图片;
步骤2,查找所述目标图片中的目标对象的轮廓,通过像素运算将所述目标对象从所述目标图片进行区分;
步骤3,根据需求图片的目标对象的数量进行图片合成。
一种包含多目标的图片数据集的生成系统,包括:目标图片查找模块、目标图片处理模块和图片合成模块;
所述目标图片查找模块,用于基于网络爬虫爬取获得包含目标对象的各个目标图片;
所述目标图片处理模块,用于查找所述目标图片中的目标对象的轮廓,通过像素运算将所述目标对象从所述目标图片进行区分;
所述图片合成模块,用于根据需求图片的目标对象的数量进行图片合成。
本发明的有益效果是:本发明提供的一种包含多目标的图片数据集的生成方法及系统,结合计算机视觉技术,设定好识别目标图片的算法条件下,利用图片处理方法进行相应的图片预处理,提取和合成,生成对应的多目标图片数据集,相比于人工采集识别,提升了效率,降低了行业成本,针对不同环境下的图片都能灵活处理。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述步骤1包括:
步骤101,采用广度优先的爬虫策略去爬取包含目标对象的图片;
步骤102,采用密度聚类算法对爬取的图片进行无监督簇聚类;
步骤103,采用特征识别的方法判断图片是否包含目标对象。
进一步,所述步骤1之后还包括使用计算机视觉库对图片进行预处理,包括:高斯模糊、图片灰度化、图片的边缘划分、二值化处理、膨胀腐蚀操作以及中值滤波。
进一步,所述利用sobel边缘检测方法进行图片的边缘划分,根据邻点加权差,在边缘处达到极值时进行检测。
进一步,所述步骤2中采用轮廓检测查找所述目标图片中的目标对象的轮廓轮廓,通过PIL将所述目标对象从所述目标图片进行区分,使所述目标图片中除了所述目标对象之外的区域的像素点的RGB值均为0。
进一步,所述步骤2还包括所述目标图片不需要保留多角度图片数据时对所述目标图片进行透视变换,将其他角度的所述目标对象进行平面化处理。
进一步,所述步骤3中,使用PIL进行图片合成后,对所述合成后的图片进行标签信息整合。
采用上述进一步方案的有益效果是:采用层级的目标图片检测方法,根据所需要目标对象进行相应的网络爬虫获取目标图片,通过简单的图片预处理之后判断图片中是否包含期望目标,保证了获取目标图片的速度和精度;获取目标图片后还包括使用计算机视觉库对图片进行预处理,包括:高斯模糊、图片灰度化、图片的边缘划分、二值化处理、膨胀腐蚀操作以及中值滤波,高斯模糊可以降低图片噪声点。将图片灰度化便于后续的sobel算子进行边缘检测;对检测完成的图片进行二值化处理,消除无关像素点的干扰,强调目标图片像素点区域。对二值化图片进行膨胀腐蚀操作,提高目标区域像素点的连通性;使用图形学处理的方法对图片进行预处理和轮廓提取,提取出图片中对应的目标图像,同时记录下标签信息。通过图像处理标准库进行图像拼接和整合处理,自动合成目标图像数据集,并且整合标签,实现图片的多目标整合和需求图片的生成。
附图说明
图1为本发明提供的一种包含多目标的图片数据集的生成方法的流程图;
图2为本发明提供的一种包含多目标的图片数据集的生成方法的实施例的流程图;
图3为本发明提供的一种包含多目标的图片数据集的生成系统的实施例的结构框图;
图4为本发明实施例提供的一种电子设备的实体结构示意图。
附图中,各标号所代表的部件列表如下:
101、目标图片查找模块,102、目标图片处理模块,103、图片合成模块,201、处理器,202、通信接口,203、存储器,204、通信总线。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示为本发明提供的一种包含多目标的图片数据集的生成方法的的流程图,由图1可知,该方法包括:
步骤1,基于网络爬虫爬取获得包含目标对象的各个目标图片。
步骤2,查找目标图片中的目标对象的轮廓,通过像素运算将目标对象从目标图片进行区分。
步骤3,根据需求图片的目标对象的数量进行图片合成。
本发明提供的一种包含多目标的图片数据集的生成方法,结合计算机视觉技术,设定好识别目标图片的算法条件下,利用图片处理方法进行相应的图片预处理,提取和合成,生成对应的多目标图片数据集,相比于人工采集识别,提升了效率,降低了行业成本,针对不同环境下的图片都能灵活处理。
实施例1
本发明提供的实施例1为本发明提供的一种包含多目标的图片数据集的生成方法的实施例,如图2所示为本发明提供的一种包含多目标的图片数据集的生成方法的实施例的流程图,由图2可知,该方法的实施例包括:
步骤1,基于网络爬虫爬取获得包含目标对象的各个目标图片。
优选的,步骤1包括:
步骤101,采用广度优先的爬虫策略去爬取包含目标对象的图片,这样可以获取大量的图片。
步骤102,采用密度聚类算法对爬取的图片进行无监督簇聚类。
具体地,密度聚类算法包括DBSCAN算法、FDBSCAN算法、RDBClustering算法、FRDBClustering算法、OPTICS算法、DENCLUE算法等。
步骤103,采用特征识别的方法判断图片是否包含目标对象。
进行特征识别之前还可以包括为对页面进行消除噪音,索引处理,提取图片等操作。
采用层级的目标图片检测方法,根据所需要目标对象进行相应的网络爬虫获取目标图片,通过简单的图片预处理之后判断图片中是否包含期望目标,保证了获取目标图片的速度和精度。
步骤1之后还包括:
使用计算机视觉库对图片进行预处理。
使用计算机视觉库对图片进行预处理的过程包括:高斯模糊、图片灰度化、图片的边缘划分、二值化处理、膨胀腐蚀操作以及中值滤波。
高斯模糊可以降低图片噪声点。将图片灰度化便于后续的sobel算子进行边缘检测。对检测完成的图片进行二值化处理,消除无关像素点的干扰,强调目标图片像素点区域。对二值化图片进行膨胀腐蚀操作,提高目标区域像素点的连通性。
具体的,利用sobel边缘检测方法进行图片的边缘划分,根据邻点加权差,在边缘处达到极值时进行检测。
步骤2,查找目标图片中的目标对象的轮廓,通过像素运算将目标对象从目标图片进行区分。
优选的,采用轮廓检测查找目标图片中的目标对象的轮廓轮廓,通过PIL(PythonImaging Library,图像处理标准库)将目标对象从目标图片进行区分,使目标图片中除了目标对象之外的区域的像素点的RGB值均为0。
轮廓检测findcontour是通过颜色寻找图像中物体的轮廓。
步骤2还包括目标图片不需要保留多角度图片数据时对目标图片进行透视变换,将其他角度的目标对象进行平面化处理。
若需保留多角度图像数据可不进行此操作。
步骤3,根据需求图片的目标对象的数量进行图片合成。
使用PIL进行图片合成后,对合成后的图片进行标签信息整合。
使用图形学处理的方法对图片进行预处理和轮廓提取,提取出图片中对应的目标图像,同时记录下标签信息。通过图像处理标准库进行图像拼接和整合处理,自动合成目标图像数据集,并且整合标签,实现图片的多目标整合和需求图片的生成。
实施例2
本发明提供的实施例2为本发明提供的一种包含多目标的图片数据集的生成系统的实施例,如图3所示为本发明提供的一种包含多目标的图片数据集的生成系统的实施例的结构框图,由图3可知,该系统包括:目标图片查找模块101、目标图片处理模块102和图片合成模块103。
目标图片查找模块101,用于基于网络爬虫爬取获得包含目标对象的各个目标图片。
目标图片处理模块102,用于查找目标图片中的目标对象的轮廓,通过像素运算将目标对象从目标图片进行区分。
图片合成模块103,用于根据需求图片的目标对象的数量进行图片合成。
图4为本发明实施例提供的一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器201、通信接口202、存储器203和通信总线204,其中,处理器201,通信接口202,存储器203通过通信总线204完成相间互的通信。处理器201可以调用存储在存储器203上并可在处理器201上运行的计算机程序,以执行上述各实施例提供的包含多目标的图片数据集的生成方法,例如包括:步骤1,基于网络爬虫爬取获得包含目标对象的各个目标图片;步骤2,查找目标图片中的目标对象的轮廓,通过像素运算将目标对象从目标图片进行区分;步骤3,根据需求图片的目标对象的数量进行图片合成。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的包含多目标的图片数据集的生成方法,例如包括:步骤1,基于网络爬虫爬取获得包含目标对象的各个目标图片;步骤2,查找目标图片中的目标对象的轮廓,通过像素运算将目标对象从目标图片进行区分;步骤3,根据需求图片的目标对象的数量进行图片合成。
以上仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种包含多目标的图片数据集的生成方法,其特征在于,所述方法包括:
步骤1,基于网络爬虫爬取获得包含目标对象的各个目标图片;
步骤2,查找所述目标图片中的目标对象的轮廓,通过像素运算将所述目标对象从所述目标图片进行区分;
步骤3,根据需求图片的目标对象的数量进行图片合成。
2.根据权利要求1所述的方法,其特征在于,所述步骤1包括:
步骤101,采用广度优先的爬虫策略去爬取包含目标对象的图片;
步骤102,采用密度聚类算法对爬取的图片进行无监督簇聚类;
步骤103,采用特征识别的方法判断图片是否包含目标对象。
3.根据权利要求1所述的方法,其特征在于,所述步骤1之后还包括使用计算机视觉库对图片进行预处理,包括:高斯模糊、图片灰度化、图片的边缘划分、二值化处理、膨胀腐蚀操作以及中值滤波。
4.根据权利要求3所述的方法,其特征在于,所述利用sobel边缘检测方法进行图片的边缘划分,根据邻点加权差,在边缘处达到极值时进行检测。
5.根据权利要求1所述的方法,其特征在于,所述步骤2中采用轮廓检测查找所述目标图片中的目标对象的轮廓轮廓,通过PIL将所述目标对象从所述目标图片进行区分,使所述目标图片中除了所述目标对象之外的区域的像素点的RGB值均为0。
6.根据权利要求1所述的方法,其特征在于,所述步骤2还包括所述目标图片不需要保留多角度图片数据时对所述目标图片进行透视变换,将其他角度的所述目标对象进行平面化处理。
7.根据权利要求1所述的方法,其特征在于,所述步骤3中,使用PIL进行图片合成后,对所述合成后的图片进行标签信息整合。
8.一种包含多目标的图片数据集的生成系统,其特征在于,所述系统包括:目标图片查找模块、目标图片处理模块和图片合成模块;
所述目标图片查找模块,用于基于网络爬虫爬取获得包含目标对象的各个目标图片;
所述目标图片处理模块,用于查找所述目标图片中的目标对象的轮廓,通过像素运算将所述目标对象从所述目标图片进行区分;
所述图片合成模块,用于根据需求图片的目标对象的数量进行图片合成。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述包含多目标的图片数据集的生成方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述包含多目标的图片数据集的生成方法的步骤。
CN202010556085.7A 2020-06-17 2020-06-17 一种包含多目标的图片数据集的生成方法及系统 Pending CN111882508A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010556085.7A CN111882508A (zh) 2020-06-17 2020-06-17 一种包含多目标的图片数据集的生成方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010556085.7A CN111882508A (zh) 2020-06-17 2020-06-17 一种包含多目标的图片数据集的生成方法及系统

Publications (1)

Publication Number Publication Date
CN111882508A true CN111882508A (zh) 2020-11-03

Family

ID=73157718

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010556085.7A Pending CN111882508A (zh) 2020-06-17 2020-06-17 一种包含多目标的图片数据集的生成方法及系统

Country Status (1)

Country Link
CN (1) CN111882508A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108492343A (zh) * 2018-03-28 2018-09-04 东北大学 一种扩充目标识别的训练数据的图像合成方法
CN111104534A (zh) * 2018-10-25 2020-05-05 国家新闻出版广电总局广播科学研究院 公开图像训练数据集的整合方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108492343A (zh) * 2018-03-28 2018-09-04 东北大学 一种扩充目标识别的训练数据的图像合成方法
CN111104534A (zh) * 2018-10-25 2020-05-05 国家新闻出版广电总局广播科学研究院 公开图像训练数据集的整合方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郭锋锋: "基于python的网络爬虫研究", 《佳木斯大学学报》 *

Similar Documents

Publication Publication Date Title
Marzougui et al. A lane tracking method based on progressive probabilistic Hough transform
Wu et al. Lane-mark extraction for automobiles under complex conditions
Wang et al. An effective method for plate number recognition
CN112336342B (zh) 手部关键点检测方法、装置及终端设备
CN109858438B (zh) 一种基于模型拟合的车道线检测方法
CN110390681B (zh) 一种基于深度相机的深度图物体轮廓快速提取方法及装置
CN106295640A (zh) 一种智能终端的物体识别方法和装置
Thajeel et al. A Novel Approach for Detection of Copy Move Forgery using Completed Robust Local Binary Pattern.
CN111027544A (zh) 一种基于视觉显著性检测的mser车牌定位方法及系统
CN115493612A (zh) 一种基于视觉slam的车辆定位方法及装置
CN104616019A (zh) 电力设备标牌图像的识别方法
CN114898321B (zh) 道路可行驶区域检测方法、装置、设备、介质及系统
CN111507340B (zh) 一种基于三维点云数据的目标点云数据提取方法
Jwaid et al. Study and analysis of copy-move & splicing image forgery detection techniques
US11256949B2 (en) Guided sparse feature matching via coarsely defined dense matches
CN110348363B (zh) 基于多帧角度信息融合消除相似车辆干扰的车辆跟踪方法
Chaturvedi et al. Automatic license plate recognition system using surf features and rbf neural network
Rahaman et al. Lane detection for autonomous vehicle management: PHT approach
CN111882508A (zh) 一种包含多目标的图片数据集的生成方法及系统
CN116052120A (zh) 基于图像增强和多传感器融合的挖掘机夜间物体检测方法
CN114359332A (zh) 基于深度图像的目标跟踪方法、装置、设备和介质
Moustafa et al. A new approach for license plate detection and localization: Between reality and applicability
Karavaev et al. LIGHT INVARIANT LANE DETECTION METHOD USINGADVANCED CLUSTERING TECHNIQUES
Quach et al. Low-level track finding and completion using random fields
CN118521945B (zh) 交通事件的识别方法、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201103

RJ01 Rejection of invention patent application after publication