CN108564524A - 一种视觉图像的卷积计算优化方法 - Google Patents

一种视觉图像的卷积计算优化方法 Download PDF

Info

Publication number
CN108564524A
CN108564524A CN201810375397.0A CN201810375397A CN108564524A CN 108564524 A CN108564524 A CN 108564524A CN 201810375397 A CN201810375397 A CN 201810375397A CN 108564524 A CN108564524 A CN 108564524A
Authority
CN
China
Prior art keywords
image data
convolutional calculation
storage unit
described image
optimization method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810375397.0A
Other languages
English (en)
Inventor
张锐
王海涛
黄明飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Open Intelligent Machine (shanghai) Co Ltd
Original Assignee
Open Intelligent Machine (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Open Intelligent Machine (shanghai) Co Ltd filed Critical Open Intelligent Machine (shanghai) Co Ltd
Priority to CN201810375397.0A priority Critical patent/CN108564524A/zh
Publication of CN108564524A publication Critical patent/CN108564524A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/60Memory management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/28Indexing scheme for image data processing or generation, in general involving image processing hardware

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)

Abstract

本发明涉及一种图像处理技术,尤其涉及一种视觉图像的卷积计算优化方法,包括:步骤S1,将第一存储单元中的所有图像数据转化为矩阵形式并分成多个批次,并将卷积运算所需的过滤器模板数据加载至第一存储区内;步骤S2,将首个批次的图像数据写入单个第二存储区中;步骤S3,对新写入的图像数据和过滤器模板数据进行卷积计算,同时通过直接存储访问控制器将下一批次的图像数据写入其他第二存储区中;步骤S4,循环执行步骤S3直至完成所有批次的图像数据的卷积计算;在不增加额外的存储空间的前提下,能够充分利用图像数据的传输和运算的时间,具有较高的图像的卷积运算的效率。

Description

一种视觉图像的卷积计算优化方法
技术领域
本发明涉及一种图像处理技术,尤其涉及一种视觉图像的卷积计算优化方法。
背景技术
近些年随着AI(Artificial Intelligence人工智能,简称AI)技术的发展,越来越多的机器视觉算法被应用到实际应用场景中。
在实际应用过程中,由于每次卷积计算读取的数据不连续,导致图像数据的传输和卷积计算是分别进行的,卷积计算需要等待图像数据的传输完成后才能进行,以及图像数据的传输需要卷积计算完成后才能进行,从而大大增加了卷积计算所需时间。
发明内容
针对上述问题,本发明提出了一种视觉图像的卷积计算优化方法,应用于视觉机器人中的处理单元;
其中,所述处理单元分别连接一第一存储单元和一第二存储单元,所述第二存储单元的存取速率大于所述第一存储单元;
所述处理单元还通过一直接存储访问控制器与所述第二存储单元连接;
所述视觉机器人采集的图像数据预存储在所述第一存储单元中;
所述第二存储单元中包括一第一存储区和预设数量的第二存储区;
所述卷积计算优化方法包括:
步骤S1,将所述第一存储单元中的所有所述图像数据转化为矩阵形式并分成多个批次,并将卷积运算所需的过滤器模板数据加载至所述第一存储区内;
步骤S2,将首个批次的所述图像数据写入单个所述第二存储区中;
步骤S3,对新写入的所述图像数据和所述过滤器模板数据进行卷积计算,同时通过所述直接存储访问控制器将下一批次的所述图像数据写入其他所述第二存储区中;
步骤S4,循环执行所述步骤S3直至完成所有批次的所述图像数据的卷积计算。
上述的卷积计算优化方法,其中,所述图像数据的批次数量大于所述预设数量;
所述步骤S3中,于相应的所述第二存储区中存在所述图像数据时,采用新写入的所述图像数据覆盖已存在的所述图像数据。
上述的卷积计算优化方法,其中,所述预设数量等于2。
上述的卷积计算优化方法,其中,采用双倍速率随机存储器形成所述第一存储单元。
上述的卷积计算优化方法,其中,每个所述第二存储区的容量相同;
每个批次的所述图像数据的大小相同。
上述的卷积计算优化方法,其中,每个批次的所述图像数据的大小为通过应的所述第二存储区的容量除以单个图像的尺寸得到。
上述的卷积计算优化方法,其中,所述过滤器模板数据为矩阵形式的;
所述步骤S4中,将所述图像数据和所述过滤器模板数据进行卷积计算,具体包括:
将所述图像数据的每一列与作为卷积核的所述过滤器模板数据的每一行依次进行乘法运算,得到对应的矩阵结果。
有益效果:本发明提出的一种视觉图像的卷积计算优化方法,在不增加额外的存储空间的前提下,能够充分利用图像数据的传输和运算的时间,具有较高的图像的卷积运算的效率。
附图说明
图1为本发明一实施例中视觉图像的卷积计算优化方法的步骤流程图;
图2为本发明一实施例中第二存储单元的存储区的划分示意图;
图3为本发明一实施例中卷积计算的示意图。
具体实施方式
下面结合附图和实施例对本发明进行进一步说明。
在一个较佳的实施例中,如图1和图2所示,提出了一种视觉图像的卷积计算优化方法,可以应用于视觉机器人中的处理单元;
其中,处理单元分别连接一第一存储单元和一第二存储单元,第二存储单元的存取速率大于第一存储单元;
处理单元还通过一直接存储访问控制器与第二存储单元连接;
视觉机器人采集的图像数据预存储在第一存储单元中;
第二存储单元中包括一第一存储区R和预设数量的第二存储区L;
卷积计算优化方法可以包括:
步骤S1,将第一存储单元中的所有图像数据转化为矩阵形式并分成多个批次,并将卷积运算所需的过滤器模板数据加载至第一存储区R内;
步骤S2,将首个批次的图像数据写入单个第二存储区L中;
步骤S3,对新写入的图像数据和过滤器模板数据进行卷积计算,同时通过直接存储访问控制器将下一批次的图像数据写入其他第二存储区L中;
步骤S4,循环执行步骤S3直至完成所有批次的图像数据的卷积计算。
上述技术方案中,由于能够利用不同的第二存储区L循环进行图像数据的传输,同时对不在传输转态的第二存储区L内的图像数据进行卷积计算,从而使得图像数据的传输和卷积计算几乎同时进行,能够大幅度提高图像数据的处理的效率;处理单元可以是嵌入式向量处理单元;步骤S1中,将第一存储单元中的所有图像数据转化为矩阵形式后可以存储为一个数据库,且优选地,向该数据库输入数据时可以采用直接数据,不需要采用特定的输入规则,以简化操作流程。
在一个较佳的实施例中,图像数据的批次数量大于预设数量;
步骤S3中,于相应的第二存储区L中存在图像数据时,采用新写入的图像数据覆盖已存在的图像数据。
上述实施例中,优选地,预设数量等于2,即第二存储区L的数量为2个,这两个存储区轮流交叉进行图像数据的存储和卷积计算。
在一个较佳的实施例中,可以采用双倍速率随机存储器形成第一存储单元。
在一个较佳的实施例中,每个第二存储区L的容量可以是相同的;
每个批次的图像数据的大小可以是相同的,从而使得每一次传输的图像数据的大小是固定的。
在一个较佳的实施例中,每个批次的图像数据的大小为通过应的第二存储区L的容量除以单个图像的尺寸得到,以保证每次最大程度地传输尽量多的图像数据。
如图3所示,在一个较佳的实施例中,过滤器模板数据为矩阵形式的;
步骤S4中,将图像数据和过滤器模板数据进行卷积计算,具体包括:
将图像数据的每一列与作为卷积核的过滤器模板数据的每一行依次进行乘法运算,得到对应的矩阵结果。
综上所述,本发明提出的一种视觉图像的卷积计算优化方法,可以应用于视觉机器人中的处理单元;其中,处理单元分别连接一第一存储单元和一第二存储单元,第二存储单元的存取速率大于第一存储单元;处理单元还通过一直接存储访问控制器与第二存储单元连接;视觉机器人采集的图像数据预存储在第一存储单元中;第二存储单元中包括一第一存储区和预设数量的第二存储区;卷积计算优化方法可以包括:步骤S1,将第一存储单元中的所有图像数据转化为矩阵形式并分成多个批次,并将卷积运算所需的过滤器模板数据加载至第一存储区内;步骤S2,将首个批次的图像数据写入单个第二存储区中;步骤S3,对新写入的图像数据和过滤器模板数据进行卷积计算,同时通过直接存储访问控制器将下一批次的图像数据写入其他第二存储区中;步骤S4,循环执行步骤S3直至完成所有批次的图像数据的卷积计算;在不增加额外的存储空间的前提下,能够充分利用图像数据的传输和运算的时间,具有较高的图像的卷积运算的效率。
通过说明和附图,给出了具体实施方式的特定结构的典型实施例,基于本发明精神,还可作其他的转换。尽管上述发明提出了现有的较佳实施例,然而,这些内容并不作为局限。
对于本领域的技术人员而言,阅读上述说明后,各种变化和修正无疑将显而易见。因此,所附的权利要求书应看作是涵盖本发明的真实意图和范围的全部变化和修正。在权利要求书范围内任何和所有等价的范围与内容,都应认为仍属本发明的意图和范围内。

Claims (7)

1.一种视觉图像的卷积计算优化方法,应用于视觉机器人中的处理单元;
其特征在于,所述处理单元分别连接一第一存储单元和一第二存储单元,所述第二存储单元的存取速率大于所述第一存储单元;
所述处理单元还通过一直接存储访问控制器与所述第二存储单元连接;
所述视觉机器人采集的图像数据预存储在所述第一存储单元中;
所述第二存储单元中包括一第一存储区和预设数量的第二存储区;
所述卷积计算优化方法包括:
步骤S1,将所述第一存储单元中的所有所述图像数据转化为矩阵形式并分成多个批次,并将卷积运算所需的过滤器模板数据加载至所述第一存储区内;
步骤S2,将首个批次的所述图像数据写入单个所述第二存储区中;
步骤S3,对新写入的所述图像数据和所述过滤器模板数据进行卷积计算,同时通过所述直接存储访问控制器将下一批次的所述图像数据写入其他所述第二存储区中;
步骤S4,循环执行所述步骤S3直至完成所有批次的所述图像数据的卷积计算。
2.根据权利要求1所述的卷积计算优化方法,其特征在于,所述图像数据的批次数量大于所述预设数量;
所述步骤S3中,于相应的所述第二存储区中存在所述图像数据时,采用新写入的所述图像数据覆盖已存在的所述图像数据。
3.根据权利要求1所述的卷积计算优化方法,其特征在于,所述预设数量等于2。
4.根据权利要求1所述的卷积计算优化方法,其特征在于,采用双倍速率随机存储器形成所述第一存储单元。
5.根据权利要求1所述的卷积计算优化方法,其特征在于,每个所述第二存储区的容量相同;
每个批次的所述图像数据的大小相同。
6.根据权利要求1所述的卷积计算优化方法,其特征在于,每个批次的所述图像数据的大小为通过应的所述第二存储区的容量除以单个图像的尺寸得到。
7.根据权利要求1所述的卷积计算优化方法,其特征在于,所述过滤器模板数据为矩阵形式的;
所述步骤S4中,将所述图像数据和所述过滤器模板数据进行卷积计算,具体包括:
将所述图像数据的每一列与作为卷积核的所述过滤器模板数据的每一行依次进行乘法运算,得到对应的矩阵结果。
CN201810375397.0A 2018-04-24 2018-04-24 一种视觉图像的卷积计算优化方法 Pending CN108564524A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810375397.0A CN108564524A (zh) 2018-04-24 2018-04-24 一种视觉图像的卷积计算优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810375397.0A CN108564524A (zh) 2018-04-24 2018-04-24 一种视觉图像的卷积计算优化方法

Publications (1)

Publication Number Publication Date
CN108564524A true CN108564524A (zh) 2018-09-21

Family

ID=63536787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810375397.0A Pending CN108564524A (zh) 2018-04-24 2018-04-24 一种视觉图像的卷积计算优化方法

Country Status (1)

Country Link
CN (1) CN108564524A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110516799A (zh) * 2019-08-16 2019-11-29 浪潮电子信息产业股份有限公司 一种数据处理系统、方法及介质
CN111147691A (zh) * 2019-12-31 2020-05-12 上海联影医疗科技有限公司 图像处理方法、装置、设备和可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105653652A (zh) * 2015-12-28 2016-06-08 上海瀚银信息技术有限公司 一种数据同步方法及系统
US20160162402A1 (en) * 2014-12-04 2016-06-09 Nvidia Corporation Indirectly accessing sample data to perform multi-convolution operations in a parallel processing system
CN105869117A (zh) * 2016-03-28 2016-08-17 上海交通大学 一种针对深度学习超分辨率技术的gpu加速方法
CN106250103A (zh) * 2016-08-04 2016-12-21 东南大学 一种卷积神经网络循环卷积计算数据重用的系统
CN106529549A (zh) * 2016-10-31 2017-03-22 郑州轻工业学院 基于自适应特征和离散余弦变换的视觉显著性检测方法
CN106874219A (zh) * 2016-12-23 2017-06-20 深圳云天励飞技术有限公司 一种卷积神经网络的数据调度方法、系统及计算机设备
CN106970896A (zh) * 2017-03-30 2017-07-21 中国人民解放军国防科学技术大学 面向向量处理器的二维矩阵卷积的向量化实现方法
CN107832807A (zh) * 2017-12-07 2018-03-23 深圳联影医疗科技有限公司 一种图像处理方法和系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160162402A1 (en) * 2014-12-04 2016-06-09 Nvidia Corporation Indirectly accessing sample data to perform multi-convolution operations in a parallel processing system
CN105653652A (zh) * 2015-12-28 2016-06-08 上海瀚银信息技术有限公司 一种数据同步方法及系统
CN105869117A (zh) * 2016-03-28 2016-08-17 上海交通大学 一种针对深度学习超分辨率技术的gpu加速方法
CN106250103A (zh) * 2016-08-04 2016-12-21 东南大学 一种卷积神经网络循环卷积计算数据重用的系统
CN106529549A (zh) * 2016-10-31 2017-03-22 郑州轻工业学院 基于自适应特征和离散余弦变换的视觉显著性检测方法
CN106874219A (zh) * 2016-12-23 2017-06-20 深圳云天励飞技术有限公司 一种卷积神经网络的数据调度方法、系统及计算机设备
CN106970896A (zh) * 2017-03-30 2017-07-21 中国人民解放军国防科学技术大学 面向向量处理器的二维矩阵卷积的向量化实现方法
CN107832807A (zh) * 2017-12-07 2018-03-23 深圳联影医疗科技有限公司 一种图像处理方法和系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110516799A (zh) * 2019-08-16 2019-11-29 浪潮电子信息产业股份有限公司 一种数据处理系统、方法及介质
WO2021031351A1 (zh) * 2019-08-16 2021-02-25 浪潮电子信息产业股份有限公司 一种数据处理系统、方法及介质
CN111147691A (zh) * 2019-12-31 2020-05-12 上海联影医疗科技有限公司 图像处理方法、装置、设备和可读存储介质

Similar Documents

Publication Publication Date Title
CN108416436B (zh) 使用多核心处理模块进行神经网络划分的方法及其系统
CN106203327B (zh) 基于卷积神经网络的肺部肿瘤识别系统及方法
CN108665059A (zh) 基于现场可编程门阵列的卷积神经网络加速系统
CN107832804A (zh) 一种信息处理方法及相关产品
CN109388595A (zh) 高带宽存储器系统以及逻辑管芯
CN107862374A (zh) 基于流水线的神经网络处理系统和处理方法
CN110458280B (zh) 一种适用于移动端的卷积神经网络加速方法及系统
CN107392308A (zh) 一种基于可编程器件的卷积神经网络加速方法与系统
CN109902548A (zh) 一种对象属性识别方法、装置、计算设备及系统
CN110348574A (zh) 一种基于zynq的通用卷积神经网络加速结构及设计方法
CN110262901A (zh) 一种数据处理方法及数据处理系统
CN108694441B (zh) 一种网络处理器和网络运算方法
CN109685201A (zh) 运算方法、装置及相关产品
CN111047022B (zh) 一种计算装置及相关产品
CN108564524A (zh) 一种视觉图像的卷积计算优化方法
WO2022007880A1 (zh) 数据精度配置方法和装置、神经网络设备、介质
WO2022161059A1 (zh) 一种模型运行方法及相关装置
CN115249315B (zh) 面向异构计算设备的深度学习图像分类方法及装置
CN105786610B (zh) 计算密集型任务向云服务器中卸载的方法
CN108052894A (zh) 一种目标对象的多属性识别方法、设备、介质及神经网络
CN110532445A (zh) 提供类神经网络训练模型的云端交易系统及其方法
CN112799599A (zh) 一种数据存储方法、计算核、芯片和电子设备
CN109753319A (zh) 一种释放动态链接库的装置及相关产品
CN109643336A (zh) 人工智能处理装置设计模型建立方法、系统、存储介质、终端
CN111767243A (zh) 数据处理方法、相关设备及计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180921