CN110310278A - 基于余量切割法的滑动窗口扫描方法 - Google Patents
基于余量切割法的滑动窗口扫描方法 Download PDFInfo
- Publication number
- CN110310278A CN110310278A CN201910607654.3A CN201910607654A CN110310278A CN 110310278 A CN110310278 A CN 110310278A CN 201910607654 A CN201910607654 A CN 201910607654A CN 110310278 A CN110310278 A CN 110310278A
- Authority
- CN
- China
- Prior art keywords
- subgraph
- surplus
- big
- detection
- sliding window
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Library & Information Science (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于余量切割法的滑动窗口扫描方法,属于图形处理的技术领域。其技术方案为:包括以下步骤:步骤一:输入原始大图;步骤二:针对大图的余量切割;步骤三:针对子图的常规检测;步骤四:统一标注与日志归约。步骤五:完成整个扫描过程。本发明的有益效果为:将大图分割成相同尺寸的子图,保证了子图不会受损,同时避免保证小目标不失真;小目标在子图中变相地被“放大”,极大地降低了检测难度目标的检测精度,子图检测的中间结果不保存,只在规约阶段依据日志进行统一标注,因此虽然是切割检测,但不额外耗费内储,子图按照时间窗滑动顺序进行检测,这种取图方式可确保目标检测不重不漏。
Description
技术领域
本发明涉及图形处理的技术领域,尤其涉及基于余量切割法的滑动窗口扫描方法。
背景技术
传统的目标检测方法都是直接将原始图片作为输入,深度学习模型通过卷积算法提取提图片特征,对图片进行分类与标注,并将标注后的图片作为输出。输出的图片不仅还有目标类别信息,而且还包括该目标类别在图片中的具体坐标。
检测模型一般都只对固定尺寸(分辨率)的图片进行处理,虽然输入的原始图片大小不一,但检测模型一般都通过res ize处理,使之缩/放到某个固定尺寸,如果原图尺寸较大且包含较小的目标,则res ize后小目标像素丢失过多,而不能被准确识别,这就是“大图”检测的难点。“大图”检测之所以困难,究其原因是由于小目标被res ize后图像失真,因此,如何避免小目标过度res ize才是解决问题之道。一般而言,如果原始图片中含有长款均小于原图尺寸10%的目标对象,则称之为小目标。如图1,在该图中小目标尺寸过小,凭借传统的检测模型难以精准识别。据相关资料统计,小目标的识别精准率不足60%,即使一味地增加样本训练次数(如epoch>200)也不能提高精准率。
依据对小目标避免过度res ize原则,提出一种切割方法,即:先对原始大图进行均匀切割,将之分为若干个子图(小图)。如果切割的大小合理,子图上原始的小目标会完整地落在某个子图上,此时小目标相对于子图的尺寸能够满足大于10%的要求。但是由于武断地切分很容易导致小目标被切割,这种破坏同样会影响小目标的识别。
发明内容
本发明针对上述存在的问题,为了克服小目标被res ize后图像失真并且由于武断地切分很容易导致小目标被切割的缺陷,本发明提出一种基于余量切割法的滑动窗口扫描方法。
本发明的目的在于提供一种基于余量切割法的滑动窗口扫描方法,其特征在于,包括以下步骤:
步骤一:输入原始大图;
步骤二:针对大图的余量切割;
步骤三:针对子图的常规检测;
步骤四:统一标注与日志归约。
步骤五:完成整个扫描过程。
进一步的,针对大图的余量切割包括将原始大图切割成小图,保证合理的余量应大于最小目标尺寸,以确保即使小目标落在相邻两子图的边界,同样会被完整的保留,将原始大图切割成小图后生成子图列表。
进一步的,所述最小目标是指小图。
进一步的,子图的常规检测包括按照传统的检测过程,针对子图进行扫描,并且无需保存检测结果,只需记录。
进一步的,统一标注与日志归约包括利用子图标注结果,在原始大图上进行统一标注,标注将按子图的时间窗顺序逐一还原。
进一步的,大图还原借助子图的检测信息逐一在大图的相应位置区域进行目标标注,即可形成原始大图的标注结果,大图标注后即可保存并输出。
本发明的有益效果为:将大图分割成相同尺寸的子图,保证了子图不会受损,同时避免保证小目标不失真;小目标在子图中变相地被“放大”,极大地降低了检测难度目标的检测精度,子图检测的中间结果不保存,只在规约阶段依据日志进行统一标注,因此虽然是切割检测,但不额外耗费内储,子图按照时间窗滑动顺序进行检测,这种取图方式可确保目标检测不重不漏。
附图说明
图1为典型的小目标示例。
图2为本发明的总体流程图。
图3为余量切割示意图。
图4为原始大图标注的示意图。
图5为待切分大图图样。
图6针对图5的余量切割,生成子图序列。
图7为针对图6中F子图的二次切割法。
图8为小目标检测结果。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,对本方案进行阐述。
基于余量切割法的滑动窗口扫描方法,包括以下步骤:步骤一:输入原始大图;
步骤二:针对大图的余量切割;步骤三:针对子图的常规检测;步骤四:统一标注与日志归约。步骤五:完成整个扫描过程。
针对大图的余量切割包括将原始大图切割成小图,保证合理的余量应大于最小目标尺寸,以确保即使小目标落在相邻两子图的边界,同样会被完整的保留,将原始大图切割成小图后生成子图列表。
最小目标是指小图。
子图的常规检测包括按照传统的检测过程,针对子图进行扫描,并且无需保存检测结果,只需记录。
统一标注与日志归约包括利用子图标注结果,在原始大图上进行统一标注,标注将按子图的时间窗顺序逐一还原。
大图还原借助子图的检测信息逐一在大图的相应位置区域进行目标标注,即可形成原始大图的标注结果,大图标注后即可保存并输出。
如图2所示,整体的流程图是:
(1)将原始大图输入到检测模型,检测模型对原始图片进行尺寸检测,在原始大图中确定要检测得小目标。
(2)针对原始大图的余量切割:对原始大图进行均匀切割,将之分为若干个子图(小图),如果切割的大小合理,子图上原始的小目标会完整地落在某个子图上,此时小目标相对于子图的尺寸能够满足大于10%的要求。由于武断的切分很容易导致小目标被切割掉,这种破坏同样会影响小目标的识别。本发明采用余量切割手段,将原始大图切割成小图,切割成的小图前后、上下有重叠,重叠的宽度称之为余量,合理的余量一般应大于最小目标尺寸,以确保即使小目标落在相邻两子图的边界,同样会被完整的保留。
图3表达了大图的余量切割方案,横向相邻子图(m*n)之间有重叠,重叠的长为m*a%;纵向相邻子图(m*n)之间有重叠,重叠的宽为n*b%。如此构造的子图可组织成子图列表,以待检测。一般的,小目标尺寸要小于Min(m*a%,n*b%),以确保小目标必有机会完整地出现在某一子图中。
(3)针对子图的常规检测,大图被切分后生成众多子图,针对子图逐一检测必然会牺牲更多的资源,本专利发明滑动窗口扫描方法,即:针对子图只保留检测结果信息,不保存子图的检测图像,待所有子图检测完毕后,在原始大图上进行统一标注。
关于子图检测无需任何额外处理,按照传统的检测过程,针对子图进行扫描。唯一不同的是无需保存检测结果,只需记录即可,以节省资源。记录的格式为[子图编号,目标类型,目标坐标,置信度],子图与检测结果一一对应。
(4)统一标注与日志归约。利用子图标注结果,在原始大图上进行统一标注,标注将按子图的时间窗顺序逐一还原。
如图4所示,现有子图A、B、C、D,包含目标6个,余量切割导致子图B、C中的小目标切割受损(子图被cut),这样的目标由于被破坏均不能正确识别,但完整的小目标有机会出现在子图A、D中,可见余量切割可以保证小目标完整出现的机会。大图还原借助子图的检测信息逐一在大图的相应位置区域进行目标标注,即可形成原始大图的标注结果,大图标注后即可保存并输出。由于是针对时间窗的滑动窗口扫描,因此子图的扫描顺序是固定的,图4中四个子图按照A、B、C、D的顺序依次进行检测,即可保证大图的完整还原,亦可保证小目标不会重检。
为说明本专利的效果,本发明采用实际的样本进行完整切割与检测。图5为待切分大图样本,如图6针对图5的余量切割,生成子图序列(规模为12)。如图7所示,为了检测小目标,可以针对图6中的子图F进行更深的切割(300*300),以观察检测效果。如图8所示,针对图7中的二次切割图,可轻易检测小目标,依滑动窗口扫描顺序,小目标位于第10块子图。
滑动窗口取图:子图按照时间窗滑动顺序进行检测,这种取图方式可确保目标检测不重不漏。
本发明未经描述的技术特征可以通过或采用现有技术实现,在此不再赘述,当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的普通技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。
Claims (6)
1.基于余量切割法的滑动窗口扫描方法,其特征在于,包括以下步骤:
步骤一:输入原始大图;
步骤二:针对大图的余量切割;
步骤三:针对子图的常规检测;
步骤四:统一标注与日志归约;
步骤五:完成整个扫描过程。
2.根据权利要求1所述的基于余量切割法的滑动窗口扫描方法,其特征在于,针对大图的余量切割包括将原始大图切割成小图,保证合理的余量应大于最小目标尺寸,以确保即使小目标落在相邻两子图的边界,同样会被完整的保留,将原始大图切割成小图后生成子图列表。
3.根据权利要求2所述的基于余量切割法的滑动窗口扫描方法,其特征在于,所述最小目标是指小图。
4.根据权利要求1所述的基于余量切割法的滑动窗口扫描方法,其特征在于,子图的常规检测包括按照传统的检测过程,针对子图进行扫描,并且无需保存检测结果,只需记录。
5.根据权利要求1所述的基于余量切割法的滑动窗口扫描方法,其特征在于,统一标注与日志归约包括利用子图标注结果,在原始大图上进行统一标注,标注将按子图的时间窗顺序逐一还原。
6.根据权利要求5所述的基于余量切割法的滑动窗口扫描方法,其特征在于,大图还原借助子图的检测信息逐一在大图的相应位置区域进行目标标注,即可形成原始大图的标注结果,大图标注后即可保存并输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910607654.3A CN110310278A (zh) | 2019-07-08 | 2019-07-08 | 基于余量切割法的滑动窗口扫描方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910607654.3A CN110310278A (zh) | 2019-07-08 | 2019-07-08 | 基于余量切割法的滑动窗口扫描方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110310278A true CN110310278A (zh) | 2019-10-08 |
Family
ID=68079361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910607654.3A Pending CN110310278A (zh) | 2019-07-08 | 2019-07-08 | 基于余量切割法的滑动窗口扫描方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110310278A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111738070A (zh) * | 2020-05-14 | 2020-10-02 | 华南理工大学 | 一种多个小目标的自动准确检测方法 |
CN112287899A (zh) * | 2020-11-26 | 2021-01-29 | 山东捷讯通信技术有限公司 | 基于yolo v5的无人机航拍图像河流排污口检测方法及系统 |
CN113344948A (zh) * | 2021-07-06 | 2021-09-03 | 湖南博远翔电子科技有限公司 | 一种高分辨率图片识别小目标的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6317509B1 (en) * | 1998-02-11 | 2001-11-13 | Analogic Corporation | Computed tomography apparatus and method for classifying objects |
CN102542293A (zh) * | 2011-12-27 | 2012-07-04 | 上海交通大学 | 一种针对高分辨率sar图像场景解译的一类提取分类方法 |
CN109800716A (zh) * | 2019-01-22 | 2019-05-24 | 华中科技大学 | 一种基于特征金字塔的海面遥感图像船舶检测方法 |
-
2019
- 2019-07-08 CN CN201910607654.3A patent/CN110310278A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6317509B1 (en) * | 1998-02-11 | 2001-11-13 | Analogic Corporation | Computed tomography apparatus and method for classifying objects |
CN102542293A (zh) * | 2011-12-27 | 2012-07-04 | 上海交通大学 | 一种针对高分辨率sar图像场景解译的一类提取分类方法 |
CN109800716A (zh) * | 2019-01-22 | 2019-05-24 | 华中科技大学 | 一种基于特征金字塔的海面遥感图像船舶检测方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111738070A (zh) * | 2020-05-14 | 2020-10-02 | 华南理工大学 | 一种多个小目标的自动准确检测方法 |
CN112287899A (zh) * | 2020-11-26 | 2021-01-29 | 山东捷讯通信技术有限公司 | 基于yolo v5的无人机航拍图像河流排污口检测方法及系统 |
CN113344948A (zh) * | 2021-07-06 | 2021-09-03 | 湖南博远翔电子科技有限公司 | 一种高分辨率图片识别小目标的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110765770B (zh) | 一种合同自动生成方法及装置 | |
CN102800052B (zh) | 非标准地图的半自动数字化方法 | |
CN110310278A (zh) | 基于余量切割法的滑动窗口扫描方法 | |
Stenzel et al. | Remote sensing of scattered Natura 2000 habitats using a one-class classifier | |
CN104077401B (zh) | 用于数据库的数据迁移装置和数据迁移方法 | |
CN103942143B (zh) | 一种基于版本库比较的PC‑Lint代码检查结果筛选方法 | |
CN107239794A (zh) | 点云数据分割方法和终端 | |
CN106598846B (zh) | 应用界面测试方法和装置 | |
CN107229560A (zh) | 一种界面显示效果测试方法、图像样张获取方法及装置 | |
EP3605453A1 (en) | Convolutional neural network based inspection of blade-defects of a wind turbine | |
CN108388894A (zh) | 一种数字表读数的识别方法、装置及设备 | |
CN109101410A (zh) | 一种风险驱动测试方法和装置以及计算机可读存储介质 | |
CN103324361B (zh) | 触摸点定位的方法和系统 | |
Freeman et al. | Dealing with non-equilibrium bias and survey effort in presence-only invasive Species Distribution Models (iSDM); Predicting the range of muntjac deer in Britain and Ireland | |
CN1936956A (zh) | 一种针对dct域lsb隐写的隐写检测方法 | |
CN112632926B (zh) | 票据的数据处理方法、装置、电子设备及存储介质 | |
CN111198661B (zh) | 存储设备写入操作过程的还原方法、装置和设备 | |
da Silva et al. | Range maps and checklists provide similar estimates of taxonomic and phylogenetic alpha diversity, but less so for beta diversity, of Brazilian Atlantic Forest anurans | |
CN102706326B (zh) | 光束法空中三角测量文件数据处理方法 | |
CN115937555A (zh) | 一种基于标准化流模型的工业缺陷检测算法 | |
CN112612882B (zh) | 检阅报告生成方法、装置、设备和存储介质 | |
CN109308264A (zh) | 数据脱敏效果的评价方法及相应设备和存储介质 | |
CN103699482A (zh) | 控件合理性检测方法和装置 | |
CN106126696B (zh) | 基于版式关联模型的专题图件制作方法及系统 | |
CN107656187A (zh) | 一种差分线路测试信息确定方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191008 |
|
RJ01 | Rejection of invention patent application after publication |