CN102842048A - 一种图像识别中群相关并行计算的硬件实现方法 - Google Patents
一种图像识别中群相关并行计算的硬件实现方法 Download PDFInfo
- Publication number
- CN102842048A CN102842048A CN2011101651519A CN201110165151A CN102842048A CN 102842048 A CN102842048 A CN 102842048A CN 2011101651519 A CN2011101651519 A CN 2011101651519A CN 201110165151 A CN201110165151 A CN 201110165151A CN 102842048 A CN102842048 A CN 102842048A
- Authority
- CN
- China
- Prior art keywords
- data
- template
- window
- implementation method
- hardware implementation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种图像识别中群相关并行计算的硬件实现方法,其包括以下步骤:步骤1)设置一个模板的大窗口,所述大窗口将模板中的所有窗口都包罗在内;步骤2)将模板存储器数据通路读出的数据送到所有运算器中;步骤3)各个运算器判断该数据是否属于本运算器负责的窗口中的数据,如果是,则该数据参加运算;如果不是,不预理睬,等待属于它的数据的到来。本发明在不增加访问存储器通路的情况下大大提高了计算的并行度,提高了计算速度。
Description
技术领域
本发明涉及计算机技术、图像识别处理技术领域,具体的涉及一种图像识别中群相关并行计算的硬件实现方法。
背景技术
图像识别是一项应用范围很广的技术。在图像识别的各种手段中,图像匹配是最基本的方法。而图像匹配的常用算法是计算两幅图像的相关系数,归一化相关系数的计算公式如下:
具体实施图像匹配计算时经常以窗口为单位,即用实时图的一个窗口与模板的一个窗口做相关系数计算,参见图1所示,Coef数值的大小反映了两个窗口图像的相似度。
因为相关计算是以像素为单位的,一幅图像的像素点很多,所以计算量很大。一般为了作出图像识别,一个实时图的窗口往往要与许多模板存储器的窗口做相关计算,即所谓的群相关计算。这里的群是指许多窗口的意思,如图2所示。
实时图的一个窗口要与模板中许多同尺寸、但位置不相同的窗口做计算,计算量巨大。用软件做上述计算的耗时是相当大的。
发明内容
为克服现有技术中的不足,本发明旨在提供一种图像识别中群相关并行计算的硬件实现方法,该方法可在不增加访问存储器通路的情况下大大提高群相关计算的速度。
为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
步骤1)设置一个模板的大窗口,所述大窗口将模板中的所有窗口都包罗在内;
步骤2)将模板存储器数据通路读出的数据送到所有运算器中;
步骤3)各个运算器判断该数据是否属于本运算器负责的窗口中的数据,如果是,则该数据参加运算;如果不是,不预理睬,等待属于它的数据的到来。
与现有技术相比,本发明具有以下有益效果:
1、使用两路存储器通道,完成n个窗口的相关计算(或点积计算等其它计算)所需的n个数据,从而大大减少了对存储器数据流量或芯片I/O引脚数的要求;
2、多个窗口的计算基本同步并行完成,而不是串行完成,大大提高了计算的并行度,提高了计算速度;
3、因为n个窗口是并行执行的,所以芯片内不需要大容量的缓冲器来顺序执行点积或相关计算。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。本发明的具体实施方式由以下实施例及其附图详细给出。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1表示以窗口为单位的相关比较。
图2表示窗口群示意图。
图3表示本发明的大窗口示意图。
图4表示本发明的一路模板数据由n个运算器公用的示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
使用硬件实现群相关计算的目的是为了加速,而加速计算的方法是并行计算。
本发明采用群内所有模板窗口同时与实时图的一个窗口做计算以实现提速,如此,如果采用n个窗口同时计算的话,那速度就提高n倍了。
采用n个运算器同时做计算的一个条件就是要有n个通道读出模板数据。当n较大时,硬件很难实现。比如n=49,数据宽度为16,按照现在的工艺水平,这是无法实现的。这是群相关并行计算的难点所在。
然而,从图2中可以得知,模板中众多窗口大部分区域都是重叠的,所以可充分利用从存储器读出的数据,使读出的数据可以被所有包含它的窗口共同使用。
按照上述思想:众多模板窗口的数据只用一路存储器读出通道与实时图的一路存储器通道就可以实现所有窗口相关并行计算的需要了。具体实施方法是这样的:
参见图3及图4所示,一种图像识别中群相关并行计算的硬件实现方法,其包括以下步骤:
步骤1)设置一个模板的大窗口,所述大窗口将模板中的所有窗口都包罗在内;
步骤2)将模板存储器数据通路读出的数据送到所有运算器中;
步骤3)各个运算器判断该数据是否属于本运算器负责的窗口中的数据,如果是,则该数据参加运算;如果不是,不预理睬,等待属于它的数据的到来。
进一步的,本发明的实现方法可以用于群相关计算,也可以用于其它计算,如矩阵的加减乘除等计算。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.一种图像识别中群相关并行计算的硬件实现方法,其特征在于,包括以下步骤:
步骤1)设置一个模板的大窗口,所述大窗口将模板中的所有窗口都包罗在内;
步骤2)将模板存储器数据通路读出的数据送到所有运算器中;
步骤3)各个运算器判断该数据是否属于本运算器负责的窗口中的数据,如果是,则该数据参加运算;如果不是,不预理睬,等待属于它的数据的到来。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101651519A CN102842048A (zh) | 2011-06-20 | 2011-06-20 | 一种图像识别中群相关并行计算的硬件实现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101651519A CN102842048A (zh) | 2011-06-20 | 2011-06-20 | 一种图像识别中群相关并行计算的硬件实现方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102842048A true CN102842048A (zh) | 2012-12-26 |
Family
ID=47369383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011101651519A Pending CN102842048A (zh) | 2011-06-20 | 2011-06-20 | 一种图像识别中群相关并行计算的硬件实现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102842048A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020211654A1 (zh) * | 2019-04-19 | 2020-10-22 | 北京灵汐科技有限公司 | 一种基于行缓冲Linebuffer的并行计算方法及计算设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090216996A1 (en) * | 2008-02-22 | 2009-08-27 | Isis Innovation Limited | Parallel Processing |
US20090226047A1 (en) * | 2008-03-04 | 2009-09-10 | Chi-Chang Yu | Apparatus and Method of Processing Image and Human Face Detection System using the smae |
CN101853491A (zh) * | 2010-04-30 | 2010-10-06 | 西安电子科技大学 | 基于并行稀疏谱聚类的sar图像分割方法 |
-
2011
- 2011-06-20 CN CN2011101651519A patent/CN102842048A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090216996A1 (en) * | 2008-02-22 | 2009-08-27 | Isis Innovation Limited | Parallel Processing |
US20090226047A1 (en) * | 2008-03-04 | 2009-09-10 | Chi-Chang Yu | Apparatus and Method of Processing Image and Human Face Detection System using the smae |
CN101853491A (zh) * | 2010-04-30 | 2010-10-06 | 西安电子科技大学 | 基于并行稀疏谱聚类的sar图像分割方法 |
Non-Patent Citations (3)
Title |
---|
余跃 等: "《一种面向实时图像处理应用的基于非共享存储的多DSP系统设计》", 《嵌入式技术》, 6 March 2009 (2009-03-06) * |
吕捷 等: "《MPI并行计算在图像处理方面的应用》", 《红外与激光工程》, 25 October 2004 (2004-10-25) * |
袁舒 等: "《Windows环境下的Matlab并行机群计算配置及应用》", 《计算机与现代化》, 15 May 2010 (2010-05-15) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020211654A1 (zh) * | 2019-04-19 | 2020-10-22 | 北京灵汐科技有限公司 | 一种基于行缓冲Linebuffer的并行计算方法及计算设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fec et al. | On the concept and existence of solution for impulsive fractional differential equations | |
CN102999756B (zh) | 基于gpu实现pso-svm对道路标志的识别方法 | |
CN102999926B (zh) | 一种基于底层特征融合的图像视觉显著性计算方法 | |
CN103049241A (zh) | 一种提高cpu+gpu异构装置计算性能的方法 | |
CN103745447B (zh) | 一种非局部均值滤波的快速并行实现方法 | |
CN109101539A (zh) | 业务数据质量评价方法、装置、存储介质及电子设备 | |
CN102842043B (zh) | 基于自动聚类的粒子群优化分类方法 | |
CN106168976A (zh) | 一种基于朴素贝叶斯算法的特定用户挖掘方法及系统 | |
CN105654511A (zh) | 一种弱小运动目标快速检测与跟踪方法 | |
CN101833084B (zh) | 一种基于dsp的高速恒定虚警率检测器及其检测方法 | |
CN201732161U (zh) | 一种基于数字信号处理器的高速恒定虚警率检测器 | |
Mikkelsen et al. | Analysis of the truncated SPIKE algorithm | |
CN102842048A (zh) | 一种图像识别中群相关并行计算的硬件实现方法 | |
CN103955443A (zh) | 一种基于gpu加速的蚁群算法优化方法 | |
CN106934757A (zh) | 基于cuda的监控视频前景提取加速方法 | |
Xie et al. | Global stability in a three‐species Lotka–Volterra cooperation model with seasonal succession | |
US20230072535A1 (en) | Error mitigation for sampling on quantum devices | |
Wei | Analysis and prediction of total trade potentials between China and five Central Asian countries based on gravity model | |
Garfinkel et al. | ACM TechBrief: Quantum computing and simulation | |
Barina et al. | Accelerating discrete wavelet transforms on GPUs | |
Fathi-Vajargah et al. | Evaluating wave random path using multilevel Monte Carlo | |
Hsu | The algorithm | |
Shafiei et al. | Simulation of two-dimensional elastodynamic problems using a new adaptive physics-based method | |
Xing et al. | Statistical-physical method for simulating the transport of microplastic-antibiotic compound pollutants in typical bay area | |
Deng et al. | Rényi information flow in the Ising model with single-spin dynamics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20121226 |