CN106127204B - 一种全卷积神经网络的多方向水表读数区域检测算法 - Google Patents

一种全卷积神经网络的多方向水表读数区域检测算法 Download PDF

Info

Publication number
CN106127204B
CN106127204B CN201610515007.6A CN201610515007A CN106127204B CN 106127204 B CN106127204 B CN 106127204B CN 201610515007 A CN201610515007 A CN 201610515007A CN 106127204 B CN106127204 B CN 106127204B
Authority
CN
China
Prior art keywords
feature
meter reading
convolutional neural
image
neural networks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610515007.6A
Other languages
English (en)
Other versions
CN106127204A (zh
Inventor
金连文
刘孝睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Sign Digital Technology Co ltd
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201610515007.6A priority Critical patent/CN106127204B/zh
Publication of CN106127204A publication Critical patent/CN106127204A/zh
Application granted granted Critical
Publication of CN106127204B publication Critical patent/CN106127204B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/02Recognising information on displays, dials, clocks

Abstract

本发明公开的一种全卷积神经网络的多方向水表读数区域检测算法,包括以下步骤:S1、获取训练数据,包括水表图像以及读数区域的标注信息;S2、利用标注信息训练全卷积神经网络对水表图像进行多层级联特征提取,获取多通道特征图;S3、对特征图进行滑动窗扫描,以全连接神经网络为分类器和回归器,初步筛选出水表读数区域矩形候选窗;S4、依据候选窗的区域位置信息提取特征图上相应区域的特征,以第二个全连接神经网络作为分类器和回归器,获得水表读数区域的中心、长宽、角度信息;S5、最终以旋转矩形框的形式得到多方向水表读数区域的检测结果。本发明提供了一种准确、鲁棒、实用的多方向水表读数区域检测算法。

Description

一种全卷积神经网络的多方向水表读数区域检测算法
技术领域
本发明涉及计算机视觉领域,特别涉及一种全卷积神经网络的多方向水表读数区域检测算法。
背景技术
近几年来,随着移动互联网的发展和数字产品的普及,来自于不同设备(智能手机、数码相机,甚至自动驾驶街景车、无人机等摄像头)的图像数据持续爆发式地增长。这些海量的图像中,有相当一部分图像数据携带了文字信息,而文字信息通常蕴含着非常有益的语义信息。比如,这些文字信息可能是对建筑物、商店、交通牌、路牌、商品名称等的描述。因此,这些高层的语义信息可以广泛地应用于机器阅读、自动拍译、图像检索、视频检索、语言翻译、自动驾驶、机器人导航等场合。人类更加迫切地需要一种智能的视觉文字分析技术。视觉文字分析是从机器视觉的角度抽取和理解文字信息的一种技术。它涉及到图像处理、模式识别、计算机视觉、机器学习和心理学等一系列学科知识,一直以来都是相关领域的重要研究方向之一。
基于计算机视觉的水表自动读数就是视觉文字分析中的一个重要应用,它可以取代现有的人工水表读数方式,使得水表读数成为自动化流程。基于视觉的水表自动读数首要解决的问题就是读数区域的检测,目前主流的方法是基于图像处理的方法,通过图像去噪、基于颜色特征的图像二值化、基于线检测的方向检测、区域分割等步骤来确定读数区域。然而这种方法对各种复杂场景下的光照、形变、遮掩等条件适应性不好,容易受干扰,鲁棒性差。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种全卷积神经网络的多方向水表读数区域检测算法。
本发明的目的通过以下的技术方案实现:
一种全卷积神经网络的多方向水表读数区域检测算法,包含以下步骤:
S1、获取训练数据,通过摄像头拍摄水表图像,并对图像中的水表读数区域进行人工标注;
S2、设计一个全卷积神经网络,通过误差反向传播和随机梯度下降法优化全卷积神经网络的参数,从而对水表图像进行多层级联特征学习,获取多通道特征图;
S3、对多通道特征图进行滑动窗扫描,将单个滑动窗的多通道特征进行特征融合,通过分类和回归,获取每个滑动窗的显著性以及读数区域位置,从而初步筛选出水表读数区域矩形候选窗;
S4、依据候选窗的区域位置信息提取特征图上相应区域的特征,将特征进行定长尺度的池化并进行多通道的特征融合,再次通过分类和回归,获得水表读数区域的中心、长宽、角度信息;
S5、通过仿射变换最终以旋转矩形框的形式得到多方向水表读数区域的检测结果。
所述步骤S1具体为:
S1.1、通过RGB摄像头采集大量实际场景中的水表图像样本;
S1.2、对步骤S1.1中所获取的水表图像样本中的水表读数区域进行标注,标注水表读数区域的中心位置(x,y)、长度h、宽度w和角度a;
S1.3、对所有图像样本进行多次正负45度的随机角度旋转,并对相应的样本标注进行修正。以增强样本的多样性,提升多方向水表区域检测性能。
所述水表图像样本包括以下不同的参数:光照、视角、水表类型、水表受损程度。这样做是为了保证样本的多样性。
所述步骤S2具体为:
S2.1、设计一个全卷积神经网络,该卷积神经网络包括多个卷积层、池化层的级联,使得该深度卷积神经网络输入为三通道RGB图像,输出为多通道的特征图;
S2.2、通过误差反向传播和随机梯度下降法,利用S3和S4中损失函数所计算的误差,对全卷积神经网络的参数进行优化更新;
S2.3、误差计算所用的损失函数是多任务损失函数,包括步骤S3和步骤S4所产生的误差的加权和:
L=LS3+λ×LS4
其中λ为权重,LS3为步骤S3所产生的误差,LS4为步骤S4所产生的误差。
所述步骤S3具体为:
S3.1、对S2中图像样本通过全卷积神经网络计算后得到的多通道特征图进行滑动窗扫描,并将滑动窗内多通道特征图进行特征融合;
S3.2、以S3.1所得特征为输入,设计多个多层全连接神经网络,分别负责不同尺度下目标的检测和定位;其责任归属由水表读数区域的外接水平矩形框和设定的各种尺度的矩形框的重叠率Overlap决定:
当Overlap>0.7时,分类器将该特征作为正样本特征,回归器以该外接水平矩形框的中心、长度和宽度作为回归目标;
当Overlap<0.3时,分类器将该特征作为负样本特征,回归器不计算误差;
当0.7≥Overlap≥0.3时,分类器和回归器均不计算误差;
S3.3、S3.2中所采用的分类器输出为Sigmoid函数:
其中x为全卷积神经网络所提取的图像区域特征;
分类器损失函数为交叉熵损失函数:
其中x(i),y(i)分别为第i个图像区域的图像特征及类别标签,m为图像区域总数;
S3.4、S3.2中所采用的回归器损失函数为欧式距离损失函数:
其中分别为图像区域i的第j个目标预测值及目标真实值,m为图像区域总数。目标值包括目标的相对中心、长度、宽度、旋转角度的正切值;
S3.5、根据分类器输出的目标概率,筛选出概率大于0.5的候选窗,并根据回归器输出的目标矩形框参数对所筛选出的候选框进行极大化抑制,其具体做法如下:在重叠率大于0.5的目标框中只保留置信度最高的结果。
所述步骤S4具体为:
S4.1、依据S3.5所得目标候选窗,在多通道特征图上提取相应位置的特征,并进行定尺寸的空间金字塔池化,得到特征向量;
S4.2、特征向量经过分类器和回归器计算后得到目标的显著性以及矩形框,分类器和回归器损失函数与S3.3所述相同;
S4.3、对检测到的目标进行极大化抑制,得到检测目标。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明利用深度学习中的全卷积神经网络,自动学习文字信息特征提取,解决了水表自动读数中的首要难题,即多方向的水表读数区域检测,具有重大的应用前景。
2、本发明利用深度学习中的全卷积神经网络,自动学习水表读数区域信息特征提取,所提取的特征具有非常强的鲁棒性,能够适应不同光照、形变、遮挡等恶劣的复杂环境。另外本发明还能适应不同旋转方向、视角的场景。本发明解决了复杂场景下的多方向水表的读数区域检测问题,为进一步的读数识别提供了基础。
附图说明
图1为一种全卷积神经网络的多方向水表读数区域检测算法的流程图。
图2为图1所述算法的训练流程图。
图3为全卷积神经网络的结构示意图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
如图1所示,基于全卷积神经网络的多方向水表读数区域检测算法主要包括如下步骤:
S1、获取训练数据;训练过程如图2;
S1.1、通过RGB摄像头采集大量实际场景中的水表图像样本,包括各种各样的的光照、视角、水表类型、水表受损程度等,以保证样本的多样性;
S1.2、对S1.1中所获取的水表图像样本中的水表读数区域进行人为的标注,包括水表读数区域的中心位置(x,y)、长度(h)、宽度(w)和角度(a);
S1.3、对所有图像样本进行多次正负45度的随机角度旋转,并对相应的样本标注进行修正,以增强样本的多样性,提升多方向水表区域检测性能。
S2设计全卷积神经网络,进行特征提取;
S2.1、设计一个全卷积神经网络(如图3所示),该卷积神经网络包括多个卷积层、池化层的级联,使得该深度卷积神经网络输入为三通道RGB图像,输出为多通道的特征图;
S2.2、通过误差反向传播和随机梯度下降法,利用S3和S4中损失函数所计算的误差,对全卷积神经网络的参数进行优化更新;
S3特征图滑动窗扫描,获得目标区域候选窗;
S3.1、对S2中图像样本通过全卷积神经网络计算后得到的多通道特征图进行滑动窗扫描,并将滑动窗内多通道特征图进行特征融合;
S3.2、以S3.1所得特征为输入,设计多个多层全连接神经网络,分别负责不同尺度下目标的检测和定位。其责任归属由水表读数区域的外接水平矩形框和设定的各种尺度的矩形框的重叠率Overlap决定:
当Overlap>0.7时,分类器将该特征作为正样本特征,回归器以该外接水平矩形框的中心、长度和宽度作为回归目标;
当Overlap<0.3时,分类器将该特征作为负样本特征,回归器不计算误差;
当0.7≥Overlap≥0.3时,分类器和回归器均不计算误差;
S3.3、S3.2中所采用的分类器输出为Sigmoid函数,分类器损失函数为交叉熵损失函数,回归器损失函数为欧式距离损失函数;
S3.4、根据分类器输出的目标概率,筛选出概率大于0.5的候选窗,并根据回归器输出的目标矩形框参数对所筛选出的候选框进行极大化抑制。
S4进行特征映射,得到目标区域:
S4.1、依据S3.5所得目标候选窗,在多通道特征图上提取相应位置的特征,并进行定尺寸的空间金字塔池化,得到特征向量;
S4.2、特征向量经过分类器和回归器计算后得到目标的显著性以及矩形框,分类器和回归器损失函数与S3.3所述相同;
S4.3、对检测到的目标进行极大化抑制,得到检测目标。
S5、通过仿射变换最终以旋转矩形框的形式得到多方向水表读数区域的检测结果。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (4)

1.一种全卷积神经网络的多方向水表读数区域检测算法,其特征在于,包含以下步骤:
S1、获取训练数据,通过摄像头拍摄水表图像,并对图像中的水表读数区域进行人工标注;
S1.1、通过RGB摄像头采集大量实际场景中的水表图像样本;
S1.2、对步骤S1.1中所获取的水表图像样本中的水表读数区域进行标注,标注水表读数区域的中心位置(x,y)、长度h、宽度w和角度a;
S1.3、对所有图像样本进行多次正负45度的随机角度旋转,并对相应的样本标注进行修正;
所述水表图像样本包括以下不同的参数:光照、视角、水表类型、水表受损程度;
S2、设计一个全卷积神经网络,通过误差反向传播和随机梯度下降法优化全卷积神经网络的参数,从而对水表图像进行多层级联特征学习,获取多通道特征图;
S3、对多通道特征图进行滑动窗扫描,将单个滑动窗的多通道特征进行特征融合,通过分类和回归,获取每个滑动窗的显著性以及读数区域位置,从而初步筛选出水表读数区域矩形候选窗;
S4、依据候选窗的区域位置信息提取特征图上相应区域的特征,将特征进行定长尺度的池化并进行多通道的特征融合,再次通过分类和回归,获得水表读数区域的中心、长宽、角度信息;
S5、通过仿射变换最终以旋转矩形框的形式得到多方向水表读数区域的检测结果。
2.根据权利要求1所述全卷积神经网络的多方向水表读数区域检测算法,其特征在于,所述步骤S2具体为:
S2.1、设计一个全卷积神经网络,该卷积神经网络包括多个卷积层、池化层的级联,使得该卷积神经网络输入为三通道RGB图像,输出为多通道的特征图;
S2.2、通过误差反向传播和随机梯度下降法,利用S3和S4中损失函数所计算的误差,对全卷积神经网络的参数进行优化更新;
S2.3、误差计算所用的损失函数是多任务损失函数,包括步骤S3和步骤S4所产生的误差的加权和:
L=LS3+λ×LS4
其中λ为权重,LS3为步骤S3所产生的误差,LS4为步骤S4所产生的误差。
3.根据权利要求2所述全卷积神经网络的多方向水表读数区域检测算法,其特征在于,所述步骤S3具体为:
S3.1、对S2中图像样本通过全卷积神经网络计算后得到的多通道特征图进行滑动窗扫描,并将滑动窗内多通道特征图进行特征融合;
S3.2、以S3.1所得特征为输入,设计多个多层全连接神经网络,分别负责不同尺度下目标的检测和定位;其责任归属由水表读数区域的外接水平矩形框和设定的各种尺度的矩形框的重叠率Overlap决定:
当Overlap>0.7时,分类器将该特征作为正样本特征,回归器以该外接水平矩形框的中心、长度和宽度作为回归目标;
当Overlap<0.3时,分类器将该特征作为负样本特征,回归器不计算误差;
当0.7≥Overlap≥0.3时,分类器和回归器均不计算误差;
S3.3、S3.2中所采用的分类器输出为Sigmoid函数:
其中x为全卷积神经网络所提取的图像区域特征;
分类器损失函数为交叉熵损失函数:
其中x(i),y(i)分别为第i个图像区域的图像特征及类别标签,m为图像区域总数;
S3.4、S3.2中所采用的回归器损失函数为欧式距离损失函数:
其中xj (i),分别为图像区域i的第j个目标预测值及目标真实值,m为图像区域总数;目标值包括目标的相对中心、长度、宽度、旋转角度的正切值;
S3.5、根据分类器输出的目标概率,筛选出概率大于0.5的候选窗,并根据回归器输出的目标矩形框参数对所筛选出的候选框进行极大化抑制,其具体做法如下:在重叠率大于0.5的目标框中只保留置信度最高的结果。
4.根据权利要求3所述全卷积神经网络的多方向水表读数区域检测算法,其特征在于,所述步骤S4具体为:
S4.1、依据S3.5所得目标候选窗,在多通道特征图上提取相应位置的特征,并进行定尺寸的空间金字塔池化,得到特征向量;
S4.2、特征向量经过分类器和回归器计算后得到目标的显著性以及矩形框,分类器和回归器损失函数与S3.3相同;
S4.3、对检测到的目标进行极大化抑制,得到检测目标。
CN201610515007.6A 2016-06-30 2016-06-30 一种全卷积神经网络的多方向水表读数区域检测算法 Active CN106127204B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610515007.6A CN106127204B (zh) 2016-06-30 2016-06-30 一种全卷积神经网络的多方向水表读数区域检测算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610515007.6A CN106127204B (zh) 2016-06-30 2016-06-30 一种全卷积神经网络的多方向水表读数区域检测算法

Publications (2)

Publication Number Publication Date
CN106127204A CN106127204A (zh) 2016-11-16
CN106127204B true CN106127204B (zh) 2019-08-09

Family

ID=57468130

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610515007.6A Active CN106127204B (zh) 2016-06-30 2016-06-30 一种全卷积神经网络的多方向水表读数区域检测算法

Country Status (1)

Country Link
CN (1) CN106127204B (zh)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106803090A (zh) * 2016-12-05 2017-06-06 中国银联股份有限公司 一种图像识别方法和装置
CN106682664A (zh) * 2016-12-07 2017-05-17 华南理工大学 基于全卷积递归神经网络的水表圆盘区域检测方法
CN107103590B (zh) * 2017-03-22 2019-10-18 华南理工大学 一种基于深度卷积对抗生成网络的图像反射去除方法
CN106874894B (zh) * 2017-03-28 2020-04-14 电子科技大学 一种基于区域全卷积神经网络的人体目标检测方法
CN108734052A (zh) * 2017-04-13 2018-11-02 北京旷视科技有限公司 文字检测方法、装置和系统
CN107316058A (zh) * 2017-06-15 2017-11-03 国家新闻出版广电总局广播科学研究院 通过提高目标分类和定位准确度改善目标检测性能的方法
CN108229494B (zh) * 2017-06-16 2020-10-16 北京市商汤科技开发有限公司 网络训练方法、处理方法、装置、存储介质和电子设备
CN107341517B (zh) * 2017-07-07 2020-08-11 哈尔滨工业大学 基于深度学习层级间特征融合的多尺度小物体检测方法
CN107463896A (zh) * 2017-07-30 2017-12-12 合肥徽工工业自动化工程有限公司 一种应用于自动化系统的图像物体检测方法
CN107563381B (zh) * 2017-09-12 2020-10-23 国家新闻出版广电总局广播科学研究院 基于全卷积网络的多特征融合的目标检测方法
CN108108738B (zh) * 2017-11-28 2018-11-16 北京达佳互联信息技术有限公司 图像处理方法、装置及终端
CN108021901A (zh) * 2017-12-18 2018-05-11 北京小米移动软件有限公司 图像处理的方法、装置及计算机可读存储介质
CN108229470B (zh) 2017-12-22 2022-04-01 北京市商汤科技开发有限公司 文字图像处理方法、装置、设备及存储介质
CN108021914B (zh) * 2017-12-27 2020-07-28 清华大学 基于卷积神经网络的印刷品字符区域提取方法
WO2019127352A1 (zh) * 2017-12-29 2019-07-04 深圳达闼科技控股有限公司 基于拉曼光谱的物质识别方法及云端系统
CN108280455B (zh) * 2018-01-19 2021-04-02 北京市商汤科技开发有限公司 人体关键点检测方法和装置、电子设备、程序和介质
CN108268869B (zh) * 2018-02-13 2021-11-16 北京旷视科技有限公司 目标检测方法、装置及系统
CN108875537B (zh) * 2018-02-28 2022-11-08 北京旷视科技有限公司 对象检测方法、装置和系统及存储介质
CN108647686A (zh) * 2018-05-11 2018-10-12 同济大学 一种基于卷积神经网络的水表图像读数识别方法
CN108647665B (zh) * 2018-05-18 2021-07-27 西安电子科技大学 基于深度学习的航拍车辆实时检测方法
CN108960079A (zh) * 2018-06-14 2018-12-07 多伦科技股份有限公司 一种图像识别方法及装置
CN110619255B (zh) * 2018-06-19 2022-08-26 杭州海康威视数字技术股份有限公司 一种目标检测方法及其装置
CN109029641A (zh) * 2018-07-27 2018-12-18 华南理工大学 一种基于Faster-rcnn的水表自动检测方法
CN109271987A (zh) * 2018-08-28 2019-01-25 上海鸢安智能科技有限公司 一种数字电表读数方法、装置、系统、计算机设备及存储介质
CN109543688A (zh) * 2018-11-14 2019-03-29 北京邮电大学 一种新型的基于多层卷积神经网络的水表读数检测与识别的方法
CN109448458A (zh) * 2018-11-29 2019-03-08 郑昕匀 一种英语口语训练装置、数据处理方法及存储介质
CN109840497A (zh) * 2019-01-30 2019-06-04 华南理工大学 一种基于深度学习的指针式水表读数检测方法
CN109800735A (zh) * 2019-01-31 2019-05-24 中国人民解放军国防科技大学 一种船目标精确检测与分割方法
CN110569712B (zh) * 2019-07-19 2022-05-10 中国地质大学(武汉) 一种检测平面图图像中狭长墙体的方法
CN110675391B (zh) * 2019-09-27 2022-11-18 联想(北京)有限公司 图像处理方法、装置、计算设备以及介质
CN111161340B (zh) * 2019-12-02 2023-06-02 上海交通大学 基于深度特征提取的图像重定向方法及系统、终端
CN112947872B (zh) * 2019-12-10 2022-10-04 上海品奇科技有限公司 基于多层卷积神经网络的检测设备放置在显示屏上的方法
CN111027554B (zh) * 2019-12-27 2023-05-23 创新奇智(重庆)科技有限公司 商品价签文字精确检测定位系统及定位方法
CN111481208B (zh) * 2020-04-01 2023-05-12 中南大学湘雅医院 一种应用于关节康复的辅助系统、方法及存储介质
CN112084886B (zh) * 2020-08-18 2022-03-15 眸芯科技(上海)有限公司 提升检测神经网络目标检测性能的方法及装置
CN112115952B (zh) * 2020-08-25 2022-08-02 山东浪潮科学研究院有限公司 一种基于全卷积神经网络的图像分类方法、设备及介质
CN112017178A (zh) * 2020-09-08 2020-12-01 重庆市地理信息和遥感应用中心 一种基于双时相差值图像法的遥感图像区域变化检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104217225A (zh) * 2014-09-02 2014-12-17 中国科学院自动化研究所 一种视觉目标检测与标注方法
CN104680508A (zh) * 2013-11-29 2015-06-03 华为技术有限公司 卷积神经网络和基于卷积神经网络的目标物体检测方法
CN105260710A (zh) * 2015-09-28 2016-01-20 北京石油化工学院 基于图像处理的水表检定方法、装置及系统
CN105631519A (zh) * 2015-12-31 2016-06-01 北京工业大学 一种基于预决策的卷积神经网络加速方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104680508A (zh) * 2013-11-29 2015-06-03 华为技术有限公司 卷积神经网络和基于卷积神经网络的目标物体检测方法
CN104217225A (zh) * 2014-09-02 2014-12-17 中国科学院自动化研究所 一种视觉目标检测与标注方法
CN105260710A (zh) * 2015-09-28 2016-01-20 北京石油化工学院 基于图像处理的水表检定方法、装置及系统
CN105631519A (zh) * 2015-12-31 2016-06-01 北京工业大学 一种基于预决策的卷积神经网络加速方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Fast R-CNN;Ross Girshick et al;《The IEEE International Conference on Computer Vision 》;20151231;第1440-1448页 *
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks;Shaoqing Ren et al;《Advances in Neural Information Processing Systems 28 》;20151212;正文第3-4节 *
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition;Kaiming He et al;《European Conference on Computer Vision》;20141231;第346-361页 *

Also Published As

Publication number Publication date
CN106127204A (zh) 2016-11-16

Similar Documents

Publication Publication Date Title
CN106127204B (zh) 一种全卷积神经网络的多方向水表读数区域检测算法
WO2021142902A1 (zh) 基于DANet的无人机海岸线漂浮垃圾巡检系统
CN108427912B (zh) 基于稠密目标特征学习的光学遥感图像目标检测方法
CN105930868B (zh) 一种基于层次化增强学习的低分辨率机场目标检测方法
CN103679674B (zh) 一种无人飞行器实时图像拼接方法及系统
CN111368690B (zh) 基于深度学习的海浪影响下视频图像船只检测方法及系统
CN109740665A (zh) 基于专家知识约束的遮挡图像船只目标检测方法及系统
CN109241913A (zh) 结合显著性检测和深度学习的船只检测方法及系统
CN110147743A (zh) 一种复杂场景下的实时在线行人分析与计数系统及方法
CN108830188A (zh) 基于深度学习的车辆检测方法
CN109740413A (zh) 行人重识别方法、装置、计算机设备及计算机存储介质
CN110135296A (zh) 基于卷积神经网络的机场跑道fod检测方法
CN109559320A (zh) 基于空洞卷积深度神经网络实现视觉slam语义建图功能的方法及系统
CN109325395A (zh) 图像的识别方法、卷积神经网络模型的训练方法及装置
CN107346420A (zh) 一种基于深度学习的自然场景下文字检测定位方法
CN109583324A (zh) 一种基于单点多盒检测器的指针仪表读数自动识别方法
CN108960404B (zh) 一种基于图像的人群计数方法及设备
CN107016357A (zh) 一种基于时间域卷积神经网络的视频行人检测方法
CN109800624A (zh) 一种基于行人重识别的多目标跟踪方法
Fadaeddini et al. A deep residual neural network for low altitude remote sensing image classification
CN106408030A (zh) 基于中层语义属性和卷积神经网络的sar图像分类方法
CN106557740B (zh) 一种遥感图像中油库目标的识别方法
CN112560675B (zh) Yolo与旋转-融合策略相结合的鸟类视觉目标检测方法
CN110991257B (zh) 基于特征融合与svm的极化sar溢油检测方法
CN110348437A (zh) 一种基于弱监督学习与遮挡感知的目标检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220627

Address after: 401120 no.17-1, building 13, No.106, west section of Jinkai Avenue, Yubei District, Chongqing

Patentee after: CHONGQING AOS ONLINE INFORMATION TECHNOLOGY CO.,LTD.

Address before: 510640 South China University of technology, 381 Wushan Road, Tianhe District, Guangzhou City, Guangdong Province

Patentee before: SOUTH CHINA University OF TECHNOLOGY

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 401121 no.17-1, building 13, No.106, west section of Jinkai Avenue, Yubei District, Chongqing

Patentee after: Chongqing Sign Digital Technology Co.,Ltd.

Country or region after: China

Address before: 401120 no.17-1, building 13, No.106, west section of Jinkai Avenue, Yubei District, Chongqing

Patentee before: CHONGQING AOS ONLINE INFORMATION TECHNOLOGY CO.,LTD.

Country or region before: China