CN103605497A - 一种二值图像连通域标记快速识别方法 - Google Patents
一种二值图像连通域标记快速识别方法 Download PDFInfo
- Publication number
- CN103605497A CN103605497A CN201310629835.9A CN201310629835A CN103605497A CN 103605497 A CN103605497 A CN 103605497A CN 201310629835 A CN201310629835 A CN 201310629835A CN 103605497 A CN103605497 A CN 103605497A
- Authority
- CN
- China
- Prior art keywords
- gpu
- scanning
- server
- scanning result
- pagesize
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
一种二值图像连通域标记快速识别方法,涉及一种用于裂纹识别、遥感图像的路径提取及形状的目标识别等图像识别方法,包括步骤:S1.CPU和GPU的初始化;S2.扫描图像;S3.将扫描结果保存在服务器环境的磁盘中;S4.对扫描过的结果合并处理;S5.判断是否迭代扫描:判断是否迭代扫描,如果是,则进入步骤S6,如果否,则重复步骤S1;S6.保存结果处理,结束。本发明可以提高系统整体性能,比较适用于对大图像实时处理。其扫描效率高,方法简单、便捷。
Description
技术领域
本发明涉及一种用于裂纹识别、遥感图像的路径提取及形状的目标识别等图像识别(目标提取)方法,特别是一种二值图像连通域标记快速识别方法。
背景技术
二值图像(binary image)是指每个像素不是黑就是白,其灰度值没有中间过渡的图像。其优点是占用空间少。缺点是当表示人物、风景的图像时,二值图像只能描述其轮廓,不能描述细节。传统的连通域标记方法有:
1. 连通逐点扫描法,该方法需要处理大量重复标记,逻辑复杂,效率较低。
2. 种子填充法,该方法效率较高,但不适合并行化。
以上两大类方法都是串行设计,不具备对大图像实时处理的条件。
统一计算设备架构(Compute Unified Device Architecture,CUDA),能够解决复杂的计算问题。例如,CUDA 能够加快AMBER这款分子动力学模拟程序的速度,全球已有知名制药公司的科研人员使用该程序来加速新药开发;在金融市场,Numerix和CompatibL已存在一款对手风险评估系统中支持CUDA,而且因此实现了18倍速度提升,因此,在机电领域CUDA是一个巨大的市场。
发明内容
本发明要解决的技术问题是:提供一种二值图像连通域标记快速识别方法,以解决现有技术存在的效率低、不适合并行化、不具备对大图像实时处理条件的不足之处。
解决上述技术问题的技术方案是:一种二值图像连通域标记快速识别方法,该方法包括以下步骤:
S1.CPU和GPU的初始化:
利用服务器环境建立虚拟图形工作站集群,所述服务器环境包括一台服务器计算机或服务器集群和主控服务器,所述服务器计算机或服务器集群上安装有多块CUDA架构的GPU显卡,该服务器计算机或服务器集群作为计算节点,所述的主控服务器负责对所有任务进行调度控制,并负责管理集群上各个节点的计算和对存储资源进行整合;
S2.扫描图像:
S2a.建立独立的图像标记缓存和连通关系数组,利用GPU的CUDA架构并行执行扫描,搜索邻域内最小标号值的像素点对连通域进行标记;
S2b.分配N个线程,每个线程扫描对应行目标像素,并对目标做标记,利用CUDA平台内置的blockIdx变量跟踪每个进程的运行,并且每个线程返回该行连通域的个数;
S2c.主控程序实现进程block间的同步;
S3.将扫描结果保存在服务器环境的磁盘中;
S4.对扫描过的结果合并处理;
S5.判断是否迭代扫描:判断是否迭代扫描,如果是,则进入步骤
S6,如果否,则重复步骤S1;
S6.保存结果处理,结束。
本发明的进一步技术方案是:在步骤中S1中,所述的虚拟图形工作站经过逻辑组合构成动态虚拟机,所述的各块GPU显卡之间通过SLI接口连接。
本发明的进一步技术方案是:所述的CUDA架构平台的块大小为256或512。
本发明的进一步技术方案是:在步骤S3中,设定连续地址空间每次的最大执行记录数PAGESIZE大小为8Kbytes,将扫描结果分割成pixSize/PAGESIZE个页面,pixSize为单个扫描结果的大小;对于不足PAGESIZE大小的文本将填充至PAGESIZE;对于一个扫描结果分割成M个PAGESIZE,第i页的最后maxPatternLength长度的内容和第i+1页的前面maxPatternLength长度的内容是一样的,i = 0,1,2,3…M-1,maxPatternLength为最长样本的长度;只需要保存每一个扫描结果对应于哪个存储空间,而且在以固定的缓冲大小传入GPU之前对文件的标识都采用链表和数组的形式,即链表的每一节点用固定大小的数组记录固定数量的扫描结果。
本发明的进一步技术方案是:所述步骤S4.对扫描过的结果合并处理包括以下步骤:
S4a. 利用GPU中的全局内存(Global Memory)对扫描结果的合并处理;每16个线程合并读取Global Memory中的一页存储页64B到共享内存中进行合并处理;
S4b.匹配完64B再去Global Memory取出存放入共享内存,如此循环。
由于采用上述结构,本发明之一种二值图像连通域标记快速识别方法与现有技术相比,具有以下有益效果:
1.适用于对大图像实时处理:
本发明利用GPU进行二值图像连通域标记识别,通过GPU的并行匹配技术的优势,将图像扫描与GPU有机结合起来,加速连通域识别算法,不仅可以提高系统整体性能,也为工业裂痕扫描、遥感图像的路径提取、生物信息分析、海量信息检索等领域提供了重要方法和工具,比较适用于对大图像实时处理。
2.效率高:
本发明利用CPU与 GPU可协同处理的特性,分配N个线程,每个线程扫描对应行目标像素,并对目标做标记,利用CUDA平台内置的blockIdx变量跟踪每个进程的运行,避免了传统扫描方法中“4连通”和“8连通”那些繁杂的判断,而且执行的效率不受连通域形状及数量的影响,大大提高了复杂图像扫描效率,其方法简单、便捷。
3.可适合并行化:
因为GPU设备的分支转移控制和数据缓存机制都非常弱,而且GPU与GPU全局内存之间的数据传输速率和CPU与CPU高速缓存之间的数据传输速率相比要慢很多,本发明相对合理地设计与实现数据存储和并行计算的模式,避免了GPU设备的分支转移控制和数据缓存机制较弱、GPU与GPU全局内存之间的数据传输速率较慢的问题。
下面,结合附图和实施例对本发明之一种二值图像连通域标记快速识别方法的技术特征作进一步的说明。
附图说明
图1:本发明之一种二值图像连通域标记快速识别方法的流程框图,
图2:实施例一所述图形工作站和服务器环境的连接关系示意图,
图3:图像扫描结果存储形式示意图,
图4:图像合并处理中GPU内存执行模型示意图。
具体实施方式
实施例一:
一种二值图像连通域标记快速识别方法,该方法包括以下步骤:
S1.CPU和GPU的初始化:
利用服务器环境建立虚拟图形工作站集群,该虚拟图形工作站1经过逻辑组合构成动态虚拟机,所述服务器环境包括服务器集群2和主控服务器3(参见图2),所述服务器计算机或服务器集群上安装有多块CUDA架构的GPU显卡,各块GPU显卡之间通过SLI接口(Scalable Link Interface的缩写,中文是可升级连接接口)连接,CUDA架构平台的块大小为256或512;该服务器计算机或服务器集群作为计算节点,所述的主控服务器负责对所有任务进行调度控制,并负责管理集群上各个节点的计算和对存储资源进行整合;
S2.扫描图像:
S2a.建立独立的图像标记缓存和连通关系数组,利用GPU的CUDA架构并行执行扫描,搜索邻域内最小标号值的像素点对连通域进行标记;
S2b.分配N个线程,每个线程扫描对应行目标像素,并对目标做标记,利用CUDA平台内置的blockIdx变量跟踪每个进程的运行,并且每个线程返回该行连通域的个数;
S2c.主控程序实现进程block间的同步;
S3.将扫描结果保存在服务器环境的磁盘中;
S4.对扫描过的结果合并处理;
S5.判断是否迭代扫描:判断是否迭代扫描,如果是,则进入步骤S6,如果否,则重复步骤S1;
S6.保存结果处理,结束。
在上述步骤S3中,设定连续地址空间每次的最大执行记录数PAGESIZE大小为8Kbytes,将扫描结果分割成pixSize/PAGESIZE个页面,pixSize为单个扫描结果的大小;对于不足PAGESIZE大小的文本将填充至PAGESIZE;对于一个扫描结果分割成M个PAGESIZE,第i页的最后maxPatternLength长度的内容和第i+1页的前面maxPatternLength长度的内容是一样的,i = 0,1,2,3…M-1,maxPatternLength为最长样本的长度;只需要保存每一个扫描结果对应于哪个存储空间,而且在以固定的缓冲大小传入GPU之前对文件的标识都采用链表和数组的形式,即链表的每一节点用固定大小的数组记录固定数量的扫描结果(图像扫描结果存储形式示意图参见图3)。
上述步骤S4.对扫描过的结果合并处理包括以下步骤:
S4a. 利用GPU中的全局内存(Global Memory)对扫描结果的合并处理;每16个线程合并读取Global Memory中的一页存储页64B到共享内存中进行合并处理;
S4b.匹配完64B再去Global Memory取出存放入共享内存,如此循环(图像合并处理中GPU内存执行模型示意图参见图4)。
作为本实施例一的一种变换,所述的服务器环境还可以是只包括一台服务器计算机,同样地,该服务器计算机上安装有多块CUDA架构的GPU显卡。
Claims (5)
1.一种二值图像连通域标记快速识别方法,其特征在于:该方法包括以下步骤:
S1.CPU和GPU的初始化:
利用服务器环境建立虚拟图形工作站集群,所述服务器环境包括一台服务器计算机或服务器集群和主控服务器,所述服务器计算机或服务器集群上安装有多块CUDA架构的GPU显卡,该服务器计算机或服务器集群作为计算节点,所述的主控服务器负责对所有任务进行调度控制,并负责管理集群上各个节点的计算和对存储资源进行整合;
S2.扫描图像:
S2a.建立独立的图像标记缓存和连通关系数组,利用GPU的CUDA架构并行执行扫描,搜索邻域内最小标号值的像素点对连通域进行标记;
S2b.分配N个线程,每个线程扫描对应行目标像素,并对目标做标记,利用CUDA平台内置的blockIdx变量跟踪每个进程的运行,并且每个线程返回该行连通域的个数;
S2c.主控程序实现进程block间的同步;
S3.将扫描结果保存在服务器环境的磁盘中;
S4.对扫描过的结果合并处理;
S5.判断是否迭代扫描:判断是否迭代扫描,如果是,则进入步骤
S6,如果否,则重复步骤S1;
S6.保存结果处理,结束。
2.根据权利要求1所述的一种二值图像连通域标记快速识别方法,其特征在于:在步骤中S1中,所述的虚拟图形工作站经过逻辑组合构成动态虚拟机,所述的各块GPU显卡之间通过SLI接口连接。
3.根据权利要求2所述的一种二值图像连通域标记快速识别方法,其特征在于:所述的CUDA架构平台的块大小为256或512。
4.根据权利要求1所述的一种二值图像连通域标记快速识别方法,其特征在于:在步骤S3中,设定连续地址空间每次的最大执行记录数PAGESIZE大小为8Kbytes,将扫描结果分割成pixSize/PAGESIZE个页面,pixSize为单个扫描结果的大小;对于不足PAGESIZE大小的文本将填充至PAGESIZE;对于一个扫描结果分割成M个PAGESIZE,第i页的最后maxPatternLength长度的内容和第i+1页的前面maxPatternLength长度的内容是一样的,i = 0,1,2,3…M-1,maxPatternLength为最长样本的长度;只需要保存每一个扫描结果对应于哪个存储空间,而且在以固定的缓冲大小传入GPU之前对文件的标识都采用链表和数组的形式,即链表的每一节点用固定大小的数组记录固定数量的扫描结果。
5.根据权利要求1所述的一种二值图像连通域标记快速识别方法,其特征在于:所述步骤S4.对扫描过的结果合并处理包括以下步骤:
S4a. 利用GPU中的全局内存对扫描结果的合并处理;每16个线程合并读取全局内存中的一页存储页64B到共享内存中进行合并处理;
S4b.匹配完64B再去全局内存取出存放入共享内存,如此循环。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310629835.9A CN103605497B (zh) | 2013-11-29 | 2013-11-29 | 一种二值图像连通域标记快速识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310629835.9A CN103605497B (zh) | 2013-11-29 | 2013-11-29 | 一种二值图像连通域标记快速识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103605497A true CN103605497A (zh) | 2014-02-26 |
CN103605497B CN103605497B (zh) | 2017-03-01 |
Family
ID=50123728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310629835.9A Active CN103605497B (zh) | 2013-11-29 | 2013-11-29 | 一种二值图像连通域标记快速识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103605497B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104036470A (zh) * | 2014-07-02 | 2014-09-10 | 厦门美图之家科技有限公司 | 一种消除二值化噪点的图像增强方法 |
CN104143096A (zh) * | 2014-07-22 | 2014-11-12 | 天津大学 | 基于地址事件表达的二值连通域标记方法 |
CN104503731A (zh) * | 2014-12-15 | 2015-04-08 | 柳州职业技术学院 | 二值图像连通域标记快速识别方法 |
CN106530285A (zh) * | 2016-10-21 | 2017-03-22 | 国网山东省电力公司电力科学研究院 | 一种基于gpu与cpu混合数据处理的输电线路部件识别方法 |
CN107945190A (zh) * | 2017-12-22 | 2018-04-20 | 成都华栖云科技有限公司 | 二值图像快速连通区域计算方法 |
CN107993246A (zh) * | 2018-01-19 | 2018-05-04 | 歌尔科技有限公司 | 图像处理设备及连通域标记方法、系统、装置、存储介质 |
CN108255551A (zh) * | 2017-12-20 | 2018-07-06 | 深圳市纽格力科技有限公司 | 一种gui内存优化方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070028003A1 (en) * | 2003-09-15 | 2007-02-01 | British Telecommunications Public Ltd Company | Inter-domain congestion charging |
CN101727654A (zh) * | 2009-08-06 | 2010-06-09 | 北京理工大学 | 一种并行流水线实现的点目标连通域实时标记与识别方法 |
-
2013
- 2013-11-29 CN CN201310629835.9A patent/CN103605497B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070028003A1 (en) * | 2003-09-15 | 2007-02-01 | British Telecommunications Public Ltd Company | Inter-domain congestion charging |
CN101727654A (zh) * | 2009-08-06 | 2010-06-09 | 北京理工大学 | 一种并行流水线实现的点目标连通域实时标记与识别方法 |
Non-Patent Citations (3)
Title |
---|
张健等: "连通域标记并行算法在多核处理器上的设计和实现", 《计算机系统应用》 * |
覃方涛等: "GPU加速的二值图连通域标记并行算法", 《计算机应用》 * |
马益杭等: "连通域标记算法的并行化研究", 《地理与地理信息科学》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104036470A (zh) * | 2014-07-02 | 2014-09-10 | 厦门美图之家科技有限公司 | 一种消除二值化噪点的图像增强方法 |
CN104036470B (zh) * | 2014-07-02 | 2017-04-12 | 厦门美图之家科技有限公司 | 一种消除二值化噪点的图像增强方法 |
CN104143096A (zh) * | 2014-07-22 | 2014-11-12 | 天津大学 | 基于地址事件表达的二值连通域标记方法 |
CN104143096B (zh) * | 2014-07-22 | 2017-06-20 | 天津大学 | 基于地址事件表达的二值连通域标记方法 |
CN104503731A (zh) * | 2014-12-15 | 2015-04-08 | 柳州职业技术学院 | 二值图像连通域标记快速识别方法 |
CN106530285A (zh) * | 2016-10-21 | 2017-03-22 | 国网山东省电力公司电力科学研究院 | 一种基于gpu与cpu混合数据处理的输电线路部件识别方法 |
CN106530285B (zh) * | 2016-10-21 | 2019-04-09 | 国网山东省电力公司电力科学研究院 | 一种基于gpu与cpu混合数据处理的输电线路部件识别方法 |
CN108255551A (zh) * | 2017-12-20 | 2018-07-06 | 深圳市纽格力科技有限公司 | 一种gui内存优化方法及系统 |
CN108255551B (zh) * | 2017-12-20 | 2021-05-28 | 深圳市纽格力科技有限公司 | 一种gui内存优化方法及系统 |
CN107945190A (zh) * | 2017-12-22 | 2018-04-20 | 成都华栖云科技有限公司 | 二值图像快速连通区域计算方法 |
CN107993246A (zh) * | 2018-01-19 | 2018-05-04 | 歌尔科技有限公司 | 图像处理设备及连通域标记方法、系统、装置、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103605497B (zh) | 2017-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103605497A (zh) | 一种二值图像连通域标记快速识别方法 | |
CN111898696B (zh) | 伪标签及标签预测模型的生成方法、装置、介质及设备 | |
CN104503731A (zh) | 二值图像连通域标记快速识别方法 | |
US9292767B2 (en) | Decision tree computation in hardware utilizing a physically distinct integrated circuit with on-chip memory and a reordering of data to be grouped | |
CN112016638B (zh) | 一种钢筋簇的识别方法、装置、设备及存储介质 | |
CN108520489B (zh) | Gpu中一种实现命令解析和顶点获取并行的装置和方法 | |
US20220415072A1 (en) | Image processing method, text recognition method and apparatus | |
CN106095966B (zh) | 一种用户可扩展的标签标注方法及系统 | |
CN111222454B (zh) | 训练多任务目标检测模型、多任务目标检测的方法及系统 | |
CN104020983A (zh) | 一种基于OpenCL的KNN-GPU加速方法 | |
JP2022091123A (ja) | 帳票情報抽出方法、装置、電子デバイス及び記憶媒体 | |
CN112732567A (zh) | 基于ip的mock数据测试方法、装置、电子设备及存储介质 | |
US20210374490A1 (en) | Method and apparatus of processing image, device and medium | |
Liang et al. | The design of objects bounding boxes non-maximum suppression and visualization module based on FPGA | |
CN105205476A (zh) | 一种基于lbp特征的人脸识别硬件架构 | |
Wang et al. | Cross-domain learning using optimized pseudo labels: toward adaptive car detection in different weather conditions and urban cities | |
CN111553442B (zh) | 一种分类器链标签序列的优化方法及系统 | |
CN116721104A (zh) | 实景三维模型缺陷检测方法、装置、电子设备及存储介质 | |
CN116415562A (zh) | 用于解析金融数据的方法、设备和介质 | |
CN114049640A (zh) | 一种票据文本检测方法、装置、电子设备及存储介质 | |
Lu et al. | A Traffic Sign Detection Network Based on PosNeg-Balanced Anchors and Domain Adaptation | |
Spagnolo et al. | Connected component analysis for traffic sign recognition embedded processing systems | |
CN113821555A (zh) | 一种智慧监管黑匣子的非结构化资料汇集处理方法 | |
CN113011223A (zh) | 一种图像识别方法、系统、设备和存储介质 | |
Zhang et al. | Efficient large-scale oblique image matching based on cascade hashing and match data scheduling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |