CN111882508A - 一种包含多目标的图片数据集的生成方法及系统 - Google Patents
一种包含多目标的图片数据集的生成方法及系统 Download PDFInfo
- Publication number
- CN111882508A CN111882508A CN202010556085.7A CN202010556085A CN111882508A CN 111882508 A CN111882508 A CN 111882508A CN 202010556085 A CN202010556085 A CN 202010556085A CN 111882508 A CN111882508 A CN 111882508A
- Authority
- CN
- China
- Prior art keywords
- picture
- target
- target object
- data set
- target picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000009193 crawling Effects 0.000 claims abstract description 13
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 11
- 230000002194 synthesizing effect Effects 0.000 claims description 14
- 238000001514 detection method Methods 0.000 claims description 9
- 238000005260 corrosion Methods 0.000 claims description 6
- 230000007797 corrosion Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000003708 edge detection Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 6
- 238000003672 processing method Methods 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000004891 communication Methods 0.000 description 7
- 230000010354 integration Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20024—Filtering details
- G06T2207/20032—Median filtering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种包含多目标的图片数据集的生成方法及系统,基于网络爬虫爬取获得包含目标对象的各个目标图片;查找目标图片中的目标对象的轮廓,通过像素运算将目标对象从目标图片进行区分;根据需求图片的目标对象的数量进行图片合成结合计算机视觉技术,设定好识别目标图片的算法条件下,利用图片处理方法进行相应的图片预处理,提取和合成,生成对应的多目标图片数据集,相比于人工采集识别,提升了效率,降低了行业成本,针对不同环境下的图片都能灵活处理。
Description
技术领域
本发明涉及计算机视觉领域,尤其涉及一种包含多目标的图片数据集的生成方法及系统。
背景技术
目前在计算机视觉领域中,已有很多开放的数据集,例如人脸数据集、车牌数据集合交通标志牌数据集,但是只能根据现有数据集进行选择和使用,无法做到根据各种时刻方便的获取数据集。
比如想要获取单张图片包含多目标的数据集,可能需要利用双目摄像头单独去特定场景获取图片数据集。需要大量人工操作达到目的,同时也增加了行业成本。
发明内容
本发明针对现有技术中存在的技术问题,提供一种包含多目标的图片数据集的生成方法,解决现有技术中无法方便获取多目标图片的数据集的问题。
本发明解决上述技术问题的技术方案如下:一种包含多目标的图片数据集的生成方法,包括:
步骤1,基于网络爬虫爬取获得包含目标对象的各个目标图片;
步骤2,查找所述目标图片中的目标对象的轮廓,通过像素运算将所述目标对象从所述目标图片进行区分;
步骤3,根据需求图片的目标对象的数量进行图片合成。
一种包含多目标的图片数据集的生成系统,包括:目标图片查找模块、目标图片处理模块和图片合成模块;
所述目标图片查找模块,用于基于网络爬虫爬取获得包含目标对象的各个目标图片;
所述目标图片处理模块,用于查找所述目标图片中的目标对象的轮廓,通过像素运算将所述目标对象从所述目标图片进行区分;
所述图片合成模块,用于根据需求图片的目标对象的数量进行图片合成。
本发明的有益效果是:本发明提供的一种包含多目标的图片数据集的生成方法及系统,结合计算机视觉技术,设定好识别目标图片的算法条件下,利用图片处理方法进行相应的图片预处理,提取和合成,生成对应的多目标图片数据集,相比于人工采集识别,提升了效率,降低了行业成本,针对不同环境下的图片都能灵活处理。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述步骤1包括:
步骤101,采用广度优先的爬虫策略去爬取包含目标对象的图片;
步骤102,采用密度聚类算法对爬取的图片进行无监督簇聚类;
步骤103,采用特征识别的方法判断图片是否包含目标对象。
进一步,所述步骤1之后还包括使用计算机视觉库对图片进行预处理,包括:高斯模糊、图片灰度化、图片的边缘划分、二值化处理、膨胀腐蚀操作以及中值滤波。
进一步,所述利用sobel边缘检测方法进行图片的边缘划分,根据邻点加权差,在边缘处达到极值时进行检测。
进一步,所述步骤2中采用轮廓检测查找所述目标图片中的目标对象的轮廓轮廓,通过PIL将所述目标对象从所述目标图片进行区分,使所述目标图片中除了所述目标对象之外的区域的像素点的RGB值均为0。
进一步,所述步骤2还包括所述目标图片不需要保留多角度图片数据时对所述目标图片进行透视变换,将其他角度的所述目标对象进行平面化处理。
进一步,所述步骤3中,使用PIL进行图片合成后,对所述合成后的图片进行标签信息整合。
采用上述进一步方案的有益效果是:采用层级的目标图片检测方法,根据所需要目标对象进行相应的网络爬虫获取目标图片,通过简单的图片预处理之后判断图片中是否包含期望目标,保证了获取目标图片的速度和精度;获取目标图片后还包括使用计算机视觉库对图片进行预处理,包括:高斯模糊、图片灰度化、图片的边缘划分、二值化处理、膨胀腐蚀操作以及中值滤波,高斯模糊可以降低图片噪声点。将图片灰度化便于后续的sobel算子进行边缘检测;对检测完成的图片进行二值化处理,消除无关像素点的干扰,强调目标图片像素点区域。对二值化图片进行膨胀腐蚀操作,提高目标区域像素点的连通性;使用图形学处理的方法对图片进行预处理和轮廓提取,提取出图片中对应的目标图像,同时记录下标签信息。通过图像处理标准库进行图像拼接和整合处理,自动合成目标图像数据集,并且整合标签,实现图片的多目标整合和需求图片的生成。
附图说明
图1为本发明提供的一种包含多目标的图片数据集的生成方法的流程图;
图2为本发明提供的一种包含多目标的图片数据集的生成方法的实施例的流程图;
图3为本发明提供的一种包含多目标的图片数据集的生成系统的实施例的结构框图;
图4为本发明实施例提供的一种电子设备的实体结构示意图。
附图中,各标号所代表的部件列表如下:
101、目标图片查找模块,102、目标图片处理模块,103、图片合成模块,201、处理器,202、通信接口,203、存储器,204、通信总线。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示为本发明提供的一种包含多目标的图片数据集的生成方法的的流程图,由图1可知,该方法包括:
步骤1,基于网络爬虫爬取获得包含目标对象的各个目标图片。
步骤2,查找目标图片中的目标对象的轮廓,通过像素运算将目标对象从目标图片进行区分。
步骤3,根据需求图片的目标对象的数量进行图片合成。
本发明提供的一种包含多目标的图片数据集的生成方法,结合计算机视觉技术,设定好识别目标图片的算法条件下,利用图片处理方法进行相应的图片预处理,提取和合成,生成对应的多目标图片数据集,相比于人工采集识别,提升了效率,降低了行业成本,针对不同环境下的图片都能灵活处理。
实施例1
本发明提供的实施例1为本发明提供的一种包含多目标的图片数据集的生成方法的实施例,如图2所示为本发明提供的一种包含多目标的图片数据集的生成方法的实施例的流程图,由图2可知,该方法的实施例包括:
步骤1,基于网络爬虫爬取获得包含目标对象的各个目标图片。
优选的,步骤1包括:
步骤101,采用广度优先的爬虫策略去爬取包含目标对象的图片,这样可以获取大量的图片。
步骤102,采用密度聚类算法对爬取的图片进行无监督簇聚类。
具体地,密度聚类算法包括DBSCAN算法、FDBSCAN算法、RDBClustering算法、FRDBClustering算法、OPTICS算法、DENCLUE算法等。
步骤103,采用特征识别的方法判断图片是否包含目标对象。
进行特征识别之前还可以包括为对页面进行消除噪音,索引处理,提取图片等操作。
采用层级的目标图片检测方法,根据所需要目标对象进行相应的网络爬虫获取目标图片,通过简单的图片预处理之后判断图片中是否包含期望目标,保证了获取目标图片的速度和精度。
步骤1之后还包括:
使用计算机视觉库对图片进行预处理。
使用计算机视觉库对图片进行预处理的过程包括:高斯模糊、图片灰度化、图片的边缘划分、二值化处理、膨胀腐蚀操作以及中值滤波。
高斯模糊可以降低图片噪声点。将图片灰度化便于后续的sobel算子进行边缘检测。对检测完成的图片进行二值化处理,消除无关像素点的干扰,强调目标图片像素点区域。对二值化图片进行膨胀腐蚀操作,提高目标区域像素点的连通性。
具体的,利用sobel边缘检测方法进行图片的边缘划分,根据邻点加权差,在边缘处达到极值时进行检测。
步骤2,查找目标图片中的目标对象的轮廓,通过像素运算将目标对象从目标图片进行区分。
优选的,采用轮廓检测查找目标图片中的目标对象的轮廓轮廓,通过PIL(PythonImaging Library,图像处理标准库)将目标对象从目标图片进行区分,使目标图片中除了目标对象之外的区域的像素点的RGB值均为0。
轮廓检测findcontour是通过颜色寻找图像中物体的轮廓。
步骤2还包括目标图片不需要保留多角度图片数据时对目标图片进行透视变换,将其他角度的目标对象进行平面化处理。
若需保留多角度图像数据可不进行此操作。
步骤3,根据需求图片的目标对象的数量进行图片合成。
使用PIL进行图片合成后,对合成后的图片进行标签信息整合。
使用图形学处理的方法对图片进行预处理和轮廓提取,提取出图片中对应的目标图像,同时记录下标签信息。通过图像处理标准库进行图像拼接和整合处理,自动合成目标图像数据集,并且整合标签,实现图片的多目标整合和需求图片的生成。
实施例2
本发明提供的实施例2为本发明提供的一种包含多目标的图片数据集的生成系统的实施例,如图3所示为本发明提供的一种包含多目标的图片数据集的生成系统的实施例的结构框图,由图3可知,该系统包括:目标图片查找模块101、目标图片处理模块102和图片合成模块103。
目标图片查找模块101,用于基于网络爬虫爬取获得包含目标对象的各个目标图片。
目标图片处理模块102,用于查找目标图片中的目标对象的轮廓,通过像素运算将目标对象从目标图片进行区分。
图片合成模块103,用于根据需求图片的目标对象的数量进行图片合成。
图4为本发明实施例提供的一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器201、通信接口202、存储器203和通信总线204,其中,处理器201,通信接口202,存储器203通过通信总线204完成相间互的通信。处理器201可以调用存储在存储器203上并可在处理器201上运行的计算机程序,以执行上述各实施例提供的包含多目标的图片数据集的生成方法,例如包括:步骤1,基于网络爬虫爬取获得包含目标对象的各个目标图片;步骤2,查找目标图片中的目标对象的轮廓,通过像素运算将目标对象从目标图片进行区分;步骤3,根据需求图片的目标对象的数量进行图片合成。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的包含多目标的图片数据集的生成方法,例如包括:步骤1,基于网络爬虫爬取获得包含目标对象的各个目标图片;步骤2,查找目标图片中的目标对象的轮廓,通过像素运算将目标对象从目标图片进行区分;步骤3,根据需求图片的目标对象的数量进行图片合成。
以上仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种包含多目标的图片数据集的生成方法,其特征在于,所述方法包括:
步骤1,基于网络爬虫爬取获得包含目标对象的各个目标图片;
步骤2,查找所述目标图片中的目标对象的轮廓,通过像素运算将所述目标对象从所述目标图片进行区分;
步骤3,根据需求图片的目标对象的数量进行图片合成。
2.根据权利要求1所述的方法,其特征在于,所述步骤1包括:
步骤101,采用广度优先的爬虫策略去爬取包含目标对象的图片;
步骤102,采用密度聚类算法对爬取的图片进行无监督簇聚类;
步骤103,采用特征识别的方法判断图片是否包含目标对象。
3.根据权利要求1所述的方法,其特征在于,所述步骤1之后还包括使用计算机视觉库对图片进行预处理,包括:高斯模糊、图片灰度化、图片的边缘划分、二值化处理、膨胀腐蚀操作以及中值滤波。
4.根据权利要求3所述的方法,其特征在于,所述利用sobel边缘检测方法进行图片的边缘划分,根据邻点加权差,在边缘处达到极值时进行检测。
5.根据权利要求1所述的方法,其特征在于,所述步骤2中采用轮廓检测查找所述目标图片中的目标对象的轮廓轮廓,通过PIL将所述目标对象从所述目标图片进行区分,使所述目标图片中除了所述目标对象之外的区域的像素点的RGB值均为0。
6.根据权利要求1所述的方法,其特征在于,所述步骤2还包括所述目标图片不需要保留多角度图片数据时对所述目标图片进行透视变换,将其他角度的所述目标对象进行平面化处理。
7.根据权利要求1所述的方法,其特征在于,所述步骤3中,使用PIL进行图片合成后,对所述合成后的图片进行标签信息整合。
8.一种包含多目标的图片数据集的生成系统,其特征在于,所述系统包括:目标图片查找模块、目标图片处理模块和图片合成模块;
所述目标图片查找模块,用于基于网络爬虫爬取获得包含目标对象的各个目标图片;
所述目标图片处理模块,用于查找所述目标图片中的目标对象的轮廓,通过像素运算将所述目标对象从所述目标图片进行区分;
所述图片合成模块,用于根据需求图片的目标对象的数量进行图片合成。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述包含多目标的图片数据集的生成方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述包含多目标的图片数据集的生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010556085.7A CN111882508A (zh) | 2020-06-17 | 2020-06-17 | 一种包含多目标的图片数据集的生成方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010556085.7A CN111882508A (zh) | 2020-06-17 | 2020-06-17 | 一种包含多目标的图片数据集的生成方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111882508A true CN111882508A (zh) | 2020-11-03 |
Family
ID=73157718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010556085.7A Pending CN111882508A (zh) | 2020-06-17 | 2020-06-17 | 一种包含多目标的图片数据集的生成方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111882508A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108492343A (zh) * | 2018-03-28 | 2018-09-04 | 东北大学 | 一种扩充目标识别的训练数据的图像合成方法 |
CN111104534A (zh) * | 2018-10-25 | 2020-05-05 | 国家新闻出版广电总局广播科学研究院 | 公开图像训练数据集的整合方法及装置 |
-
2020
- 2020-06-17 CN CN202010556085.7A patent/CN111882508A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108492343A (zh) * | 2018-03-28 | 2018-09-04 | 东北大学 | 一种扩充目标识别的训练数据的图像合成方法 |
CN111104534A (zh) * | 2018-10-25 | 2020-05-05 | 国家新闻出版广电总局广播科学研究院 | 公开图像训练数据集的整合方法及装置 |
Non-Patent Citations (1)
Title |
---|
郭锋锋: "基于python的网络爬虫研究", 《佳木斯大学学报》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Marzougui et al. | A lane tracking method based on progressive probabilistic Hough transform | |
Wu et al. | Lane-mark extraction for automobiles under complex conditions | |
Wang et al. | An effective method for plate number recognition | |
CN112336342B (zh) | 手部关键点检测方法、装置及终端设备 | |
CN109858438B (zh) | 一种基于模型拟合的车道线检测方法 | |
CN110390681B (zh) | 一种基于深度相机的深度图物体轮廓快速提取方法及装置 | |
CN106295640A (zh) | 一种智能终端的物体识别方法和装置 | |
Thajeel et al. | A Novel Approach for Detection of Copy Move Forgery using Completed Robust Local Binary Pattern. | |
CN111027544A (zh) | 一种基于视觉显著性检测的mser车牌定位方法及系统 | |
CN115493612A (zh) | 一种基于视觉slam的车辆定位方法及装置 | |
CN104616019A (zh) | 电力设备标牌图像的识别方法 | |
CN114898321B (zh) | 道路可行驶区域检测方法、装置、设备、介质及系统 | |
CN111507340B (zh) | 一种基于三维点云数据的目标点云数据提取方法 | |
Jwaid et al. | Study and analysis of copy-move & splicing image forgery detection techniques | |
US11256949B2 (en) | Guided sparse feature matching via coarsely defined dense matches | |
CN110348363B (zh) | 基于多帧角度信息融合消除相似车辆干扰的车辆跟踪方法 | |
Chaturvedi et al. | Automatic license plate recognition system using surf features and rbf neural network | |
Rahaman et al. | Lane detection for autonomous vehicle management: PHT approach | |
CN111882508A (zh) | 一种包含多目标的图片数据集的生成方法及系统 | |
CN116052120A (zh) | 基于图像增强和多传感器融合的挖掘机夜间物体检测方法 | |
CN114359332A (zh) | 基于深度图像的目标跟踪方法、装置、设备和介质 | |
Moustafa et al. | A new approach for license plate detection and localization: Between reality and applicability | |
Karavaev et al. | LIGHT INVARIANT LANE DETECTION METHOD USINGADVANCED CLUSTERING TECHNIQUES | |
Quach et al. | Low-level track finding and completion using random fields | |
CN118521945B (zh) | 交通事件的识别方法、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201103 |
|
RJ01 | Rejection of invention patent application after publication |