CN108154194A - 一种用基于张量的卷积网络提取高维特征的方法 - Google Patents
一种用基于张量的卷积网络提取高维特征的方法 Download PDFInfo
- Publication number
- CN108154194A CN108154194A CN201810049756.3A CN201810049756A CN108154194A CN 108154194 A CN108154194 A CN 108154194A CN 201810049756 A CN201810049756 A CN 201810049756A CN 108154194 A CN108154194 A CN 108154194A
- Authority
- CN
- China
- Prior art keywords
- tensor
- dimensional
- separation
- convolution
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种用基于张量的卷积网络提取高维特征的方法,可应用于多维信号的分类识别场景中。模型核心部分是分离-融合模块,而分离-融合模块则由可分离卷积组件和特征融合组件构成,其中,可分离卷积组件主要由多个可分离卷积层组成,特征融合组件主要由一个多维卷积核组成。那么,整个基于张量的N维卷积模型由多个N维分离-融合模块、池化层和全连接层组成,最后一个最大池化层输出的一组N阶张量通过向量化的操作转成一个向量输入到全连接层中,最终输出一个识别分类的概率向量。本发明所提的网络模型不仅和现有的优秀模型在识别精度上性能相当,并且模型的参数量比它们少很多。
Description
技术领域
本发明涉及一种用基于张量的卷积网络提取高维特征的方法,尤其涉及一种基于维度可分离和特征融合的卷积方法,可应用于多维信号的分类识别场景中。
背景技术
深度学习作为机器学习的一个分支,近些年来发展非常迅猛,尤其是在2012年,Krizhevsky等人提出的AlexNet在大型图像数据库ImageNet的图像分类竞赛中以准确度超越第二名11%的巨大优势夺得了冠军,使得卷积神经网络重新成为了学术界的焦点,在此之后,不断有新的卷积神经网络模型被提出,比如Google的GoogLeNet、牛津大学的VGG(Visual Geometry Group)、微软亚洲研究院的ResNet等,这些网络刷新了AlexNet在ImageNet上创造的纪录。并且,卷积神经网络不断与一些传统算法相融合,加上迁移学习方法的引入,使得卷积神经网络的应用领域获得了快速的扩展。从最初较为简单的手写字符识别应用,逐渐扩展到一些更加复杂的领域,如:行人检测、行为识别、人体姿势识别等。这些新的卷积神经网络模型的层数在逐渐加深,网络模型对输入图像的high level特征提取的能力也不断提升,然而这带来了模型参数冗余繁多的问题,这又直接导致了空间复杂度过高、实时性不好的问题,有些学者针对这方面的问题做了一些有意义的研究工作,LeCun等人在2014年NIPS会议上发表了一篇文章,该文章对卷积神经网络的参数冗余性进行研究,提出了卷积神经网络存在一定的线性结构的观点,他们在训练出网络模型之后,又用奇异值分解、低秩逼近等方法通过将卷积核分解后重新训练,在损失少量精度的条件下,大为减少了模型网络的权值参数个数,从而较好地缩短了模型做预测时的实时响应时间,减少了网络模型的空间复杂度,使得将卷积神经网络模型应用于手机、网络等场合成为可能。之后,有学者用张量分解的方法,包括张量的CP分解、Tucker分解,对卷积核进行分解后重新训练,在减少网络模型的时间和空间复杂度方面也取得了较好的效果。
然而,以上的这些网络压缩模型都是服从模型监督的思路,也就是先训练出一个参数冗余的模型,在此基础上再用降维、分解等方法去减少模型参数,实际上就是用一个轻量级的模型去逼近一个冗余的模型,让后者来监督约束前者,需要训练两次,这样的方法应用在二维图像上是没有什么问题的。但随着视频编码、虚拟现实等技术的发展,对于三维、甚至更高维度的图像数据的使用,逐渐流行起来,而这些方法是不能直接应用在高维度的图像数据场景的,因为在高维图像数据上直接训练一个高维卷积神经网络会遇到以下几个问题,(1)要训练的参数量是相当庞大;(2)计算复杂度也非常高;(3)高维样本比较稀缺。这几个问题都加大了训练高维卷积神经网络的难度。因此,需要绕过模型监督的这种思路,从而设计一种针对高维数据,参数量少、计算复杂度低、并且只需训练一次就能得到最终模型的高维卷积网络结构,才是解决高维图像场景上的有效方法。
实际上,多维信号的每个维度对应的物理属性和维度方向分布特性不尽相同,数据内部存在复杂的相关性。而张量是表示高维多维数据的有效工具,理论上,将多维信号组织成张量形式,研究张量空间的建模,才可能揭示多维信号的每个维度对应的物理属性和维度方向分布特性及各个维度间复杂的相关性。本发明采用不同维度的分治和融合策略,提出一种基于张量的卷积神经网络模型,通过该神经网络模型,张量数据不同维度的非线性关系被充分挖掘出来,从而多维信号高维特征也能很好的被提取出来。
深度学习作为机器学习的一个分支,近些年来发展非常迅猛,尤其是在2012年,Krizhevsky等人提出的AlexNet在大型图像数据库ImageNet的图像分类竞赛中以准确度超越第二名11%的巨大优势夺得了冠军,使得卷积神经网络重新成为了学术界的焦点,在此之后,不断有新的卷积神经网络模型被提出,比如Google的GoogLeNet、牛津大学的VGG(Visual Geometry Group)、微软亚洲研究院的ResNet等,这些网络刷新了AlexNet在ImageNet上创造的纪录。并且,卷积神经网络不断与一些传统算法相融合,加上迁移学习方法的引入,使得卷积神经网络的应用领域获得了快速的扩展。从最初较为简单的手写字符识别应用,逐渐扩展到一些更加复杂的领域,如:行人检测、行为识别、人体姿势识别等。这些新的卷积神经网络模型的层数在逐渐加深,网络模型对输入图像的high level特征提取的能力也不断提升,然而这带来了模型参数冗余繁多的问题,这又直接导致了空间复杂度过高、实时性不好的问题,有些学者针对这方面的问题做了一些有意义的研究工作,LeCun等人在2014年NIPS会议上发表了一篇文章,该文章对卷积神经网络的参数冗余性进行研究,提出了卷积神经网络存在一定的线性结构的观点,他们在训练出网络模型之后,又用奇异值分解、低秩逼近等方法通过将卷积核分解后重新训练,在损失少量精度的条件下,大为减少了模型网络的权值参数个数,从而较好地缩短了模型做预测时的实时响应时间,减少了网络模型的空间复杂度,使得将卷积神经网络模型应用于手机、网络等场合成为可能。之后,有学者用张量分解的方法,包括张量的CP分解、Tucker分解,对卷积核进行分解后重新训练,在减少网络模型的时间和空间复杂度方面也取得了较好的效果。
然而,以上的这些网络压缩模型都是服从模型监督的思路,也就是先训练出一个参数冗余的模型,在此基础上再用降维、分解等方法去减少模型参数,实际上就是用一个轻量级的模型去逼近一个冗余的模型,让后者来监督约束前者,需要训练两次,这样的方法应用在二维图像上是没有什么问题的。但随着视频编码、虚拟现实等技术的发展,对于三维、甚至更高维度的图像数据的使用,逐渐流行起来,而这些方法是不能直接应用在高维度的图像数据场景的,因为在高维图像数据上直接训练一个高维卷积神经网络会遇到以下几个问题,(1)要训练的参数量是相当庞大;(2)计算复杂度也非常高;(3)高维样本比较稀缺。这几个问题都加大了训练高维卷积神经网络的难度。因此,需要绕过模型监督的这种思路,从而设计一种针对高维数据,参数量少、计算复杂度低、并且只需训练一次就能得到最终模型的高维卷积网络结构,才是解决高维图像场景上的有效方法。
实际上,多维信号的每个维度对应的物理属性和维度方向分布特性不尽相同,数据内部存在复杂的相关性。而张量是表示高维多维数据的有效工具,理论上,将多维信号组织成张量形式,研究张量空间的建模,才可能揭示多维信号的每个维度对应的物理属性和维度方向分布特性及各个维度间复杂的相关性。本发明采用不同维度的分治和融合策略,提出一种基于张量的卷积神经网络模型,通过该神经网络模型,张量数据不同维度的非线性关系被充分挖掘出来,从而多维信号高维特征也能很好的被提取出来。
发明内容
本发明提出一种通用的利用基于张量的多维卷积轻量化网络提取高维图像数据特征的方案,多维信号的分类识别都可适用于本方案。
本发明涉及一种用基于张量的卷积网络提取高维特征的方法,尤其涉及一种基于维度可分离和特征融合的卷积方法,可应用于多维信号的分类识别场景中。
本发明提出的基于张量的多维卷积模型核心部分是分离-融合模块(SFModule),而分离-融合模块则由可分离卷积组件(separablecomponent)和特征融合组件(fusedcomponent)构成,其中,可分离卷积组件主要由多个可分离卷积层组成,如图1所示,特征融合组件主要由一个多维卷积核组成,如图2所示。那么,整个基于张量的N维卷积模型由多个N维分离-融合模块、池化层和全连接层组成,如图4所示,能够处理N维信号。首先卷积层参数均采用Xavier方法来初始化,当输入N维信号时,在经过每个分离-融合模块时,N维信号先按张量展开操作(按mode展开)展开成N组二维矩阵,每组二维矩阵输入到一个可分离卷积层中,各自执行一系列的一维卷积操作,将所得到的每组二维特征矩阵通过张量折叠操作(unfolding)折叠成一组N阶特征张量,那么每个可分离卷积层输出一组N阶特征张量,每个分离模块就输出N组N阶特征张量,这些N阶张量按照通道数级联起来,输入到融合模块中,经过一个N维的且每个维度的大小为1的卷积核做卷积运算,最终这个分离-融合模块输出一组N阶张量,接着将它们输入到每个维度感受野为2的N维最大池化层中进行下采样,输出一组每个维度大小减半的一组N阶张量,接着这组N阶张量作为新的N维信号输入到下一个分离-融合模块和最大池化层中,经过若干个这样的操作(操作次数与网络模型中所设置的分离-融合模块的个数相同,一般我们设置3到5个分离-融合模块)之后,最后一个最大池化层输出的一组N阶张量通过向量化的操作转成一个向量输入到全连接层中,最终输出一个识别分类的概率向量。
对于不同维度的信号的处理,要相应的选用不同维度的模型,比如,对于四维的光场数据,要用基于张量的四维卷积模型。一般的,整个基于张量的多维卷积模型的参数都通过Xavier方法来初始化,利用批量梯度下降的方法来训练模型参数,当一个N维模型训练结束后,就可以对相应的N维信号进行识别分类。由于分离-融合模块用一系列的一维卷积操作来模拟N维卷积操作,因此,基于张量的多维卷积网络是一种具备处理任何维度的数据的、轻量级的网络。
下面以三维视频信号为例,这里要选用基于张量的三维卷积模型,设定模型有3个分离-融合模块和3个最大池化层以及一个全连接层,所输入的三维视频信号依次经过分离-融合模块1、最大池化层1、分离-融合模块2、最大池化层2、分离-融合模块3、最大池化层3,、全连接层,三维视频信号每经过一个分离-融合模块就得到一组分辨率减半的三维视频信号,这样,最大池化层3就输出一组分辨率为输入信号的1/8的三维视频信号,这些信号经过向量化之后,输入到全连接层,最终模型输出该三维视频信号的识别分类概率向量。
为了验证所提方案的有效性,将所发明的模型和现有的优秀分类识别模型分别在二维图像信号数据库和三维视频信号数据库上做了比较,其中在二维上采用的是Cifar10和Mnist这两个数据集,在三维上采用的KTH数据集。在这两个二维图像数据集上,本发明所提的网络模型不仅和现有的优秀模型在识别精度上性能相当,并且模型的参数量比它们少很多。在三维图像数据集上,本发明所提的模型也达到了出色的识别精度,相比于其他传统的三维卷积模型,本模型更加轻量化。
附图说明
图1可分离卷积层
图2融合组件
图3分离-融合模块
图4基于张量的多维卷积网络
图5:分离-融合模块(SFModule)算法流程图
具体实施方式
1输入的多维信号(N阶张量),依次经过若干个分离-融合模块以及与之对应的池化层,一般地,我们设置三个分离-融合模块,在每个分离-融合模块后面设置一个最大池化层;
2在每个分离-融合模块中,输入的张量数据先按张量展开的操作展开成N个矩阵,每个矩阵被可分离卷积组件提取特征形成N组特征矩阵,对这些矩阵分别通过张量折叠操作可以得到N个N阶张量,接着N阶张量被输入到特征融合模块中,通过融合映射进行特征融合,最后输出一个N阶张量;
3分离-融合模块输出的特征通过最大池化层进行下采样;
4输入数据在经过所有的分离-融合模块和池化层之后,进入全连接层,最后输出识别分类的概率向量。
为了验证所提方案的有效性,将所发明的模型和现有的优秀分类识别模型分别在二维图像信号数据库和三维视频信号数据库上做了比较,其中在二维上采用的是Cifar10和Mnist这两个数据集,在三维上采用的KTH数据集。
表1:Cifar10上比较的结果
表2:Mnist上比较的结果
在这两个二维图像数据集上,本发明所提的网络模型不仅和现有的优秀模型在识别精度上性能相当,并且模型的参数量比它们少很多。
表3:KTH上比较的结果
在三维图像数据集上,本发明所提的模型也达到了出色的识别精度,相比于其他传统的三维卷积模型,本模型更加轻量化。
Claims (4)
1.一种用基于张量的卷积网络提取高维特征的方法,其特征在于:
建立基于张量的卷积网络:卷积网络核心部分是分离-融合模块,而分离-融合模块则由可分离卷积组件和特征融合组件构成,其中,可分离卷积组件包括多个可分离卷积层组成,特征融合组件包括一个多维卷积核;整个基于张量的N维卷积模型由多个N维分离-融合模块、池化层和全连接层组成;
首先卷积层参数初始化,当输入N维信号时,在经过每个分离-融合模块时,N维信号先按张量展开操作展开成N组二维矩阵,每组二维矩阵输入到一个可分离卷积层中,各自执行一系列的一维卷积操作,将所得到的每组二维特征矩阵通过张量折叠操作折叠成一组N阶特征张量,那么每个可分离卷积层输出一组N阶特征张量,每个分离模块就输出N组N阶特征张量,这些N阶张量按照通道数级联起来,输入到融合模块中,经过一个N维的且每个维度的大小为1的卷积核做卷积运算,最终这个分离-融合模块输出一组N阶张量,接着将它们输入到每个维度感受野为2的N维最大池化层中进行下采样,输出一组每个维度大小减半的N阶张量,接着这组N阶张量作为新的N维信号输入到下一个分离-融合模块和最大池化层中,经过若干个这样的操作之后,操作次数与网络模型中所设置的分离-融合模块的个数相同;最后一个最大池化层输出的一组N阶张量通过向量化的操作转成一个向量输入到全连接层中,最终输出一个识别分类的概率向量。
2.根据权利要求1所述的方法,其特征在于:整个基于张量的多维卷积模型的参数都通过Xavier方法来初始化。
3.根据权利要求1所述的方法,其特征在于:利用批量梯度下降的方法来训练模型参数。
4.根据权利要求1所述的方法,其特征在于:当处理三维视频信号时,这里要选用基于张量的三维卷积模型,设定模型有3个分离-融合模块和3个最大池化层以及一个全连接层,所输入的三维视频信号依次经过分离-融合模块1、最大池化层1、分离-融合模块2、最大池化层2、分离-融合模块3、最大池化层3,、全连接层,三维视频信号每经过一个分离-融合模块就得到一组分辨率减半的三维视频信号,这样,最大池化层3就输出一组分辨率为输入信号的1/8的三维视频信号,这些信号经过向量化之后,输入到全连接层,最终模型输出该三维视频信号的识别分类概率向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810049756.3A CN108154194B (zh) | 2018-01-18 | 2018-01-18 | 一种用基于张量的卷积网络提取高维特征的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810049756.3A CN108154194B (zh) | 2018-01-18 | 2018-01-18 | 一种用基于张量的卷积网络提取高维特征的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108154194A true CN108154194A (zh) | 2018-06-12 |
CN108154194B CN108154194B (zh) | 2021-04-30 |
Family
ID=62461918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810049756.3A Active CN108154194B (zh) | 2018-01-18 | 2018-01-18 | 一种用基于张量的卷积网络提取高维特征的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108154194B (zh) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109190758A (zh) * | 2018-09-04 | 2019-01-11 | 地平线(上海)人工智能技术有限公司 | 用于展开卷积神经网络的张量数据的方法和装置 |
CN109344698A (zh) * | 2018-08-17 | 2019-02-15 | 西安电子科技大学 | 基于可分离卷积和硬阈值函数的高光谱波段选择方法 |
CN109508461A (zh) * | 2018-12-29 | 2019-03-22 | 重庆猪八戒网络有限公司 | 基于中文自然语言处理的订单价格预测方法、终端及介质 |
CN109584244A (zh) * | 2018-11-30 | 2019-04-05 | 安徽海浪智能技术有限公司 | 一种基于序列学习的海马体分割方法 |
CN109919013A (zh) * | 2019-01-28 | 2019-06-21 | 浙江英索人工智能科技有限公司 | 视频图像中基于深度学习的人脸检测方法及装置 |
CN109978136A (zh) * | 2019-03-05 | 2019-07-05 | 厦门美图之家科技有限公司 | 一种训练目标网络的方法、计算设备及存储介质 |
CN110210439A (zh) * | 2019-06-10 | 2019-09-06 | 西北工业大学 | 基于轻量化三维卷积网络的行为识别方法 |
CN110245787A (zh) * | 2019-05-24 | 2019-09-17 | 阿里巴巴集团控股有限公司 | 一种目标群体预测方法、装置及设备 |
CN110334800A (zh) * | 2019-07-18 | 2019-10-15 | 南京风兴科技有限公司 | 一种用于视频识别的轻量级3d卷积网络系统 |
CN110598677A (zh) * | 2019-10-08 | 2019-12-20 | 电子科技大学 | 一种用于自动调制识别的时空多通道深度学习系统 |
CN110858323A (zh) * | 2018-08-23 | 2020-03-03 | 北京京东金融科技控股有限公司 | 基于卷积的图像处理方法、装置、介质及电子设备 |
WO2020088131A1 (zh) * | 2018-10-31 | 2020-05-07 | 北京嘉楠捷思信息技术有限公司 | 一种卷积神经网络计算加速方法及装置、设备、介质 |
CN111160517A (zh) * | 2018-11-07 | 2020-05-15 | 杭州海康威视数字技术股份有限公司 | 一种深度神经网络的卷积层量化方法及装置 |
CN111832335A (zh) * | 2019-04-15 | 2020-10-27 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置及电子设备 |
CN112052687A (zh) * | 2020-09-02 | 2020-12-08 | 厦门市美亚柏科信息股份有限公司 | 基于深度可分离卷积的语义特征处理方法、装置及介质 |
CN112069883A (zh) * | 2020-07-28 | 2020-12-11 | 浙江工业大学 | 一种融合一维二维卷积神经网络的深度学习信号分类方法 |
CN112257857A (zh) * | 2019-07-22 | 2021-01-22 | 中科寒武纪科技股份有限公司 | 张量处理方法及相关产品 |
US11037016B2 (en) | 2018-11-09 | 2021-06-15 | Institute For Information Industry | Feature determination apparatus and method adapted to multiple object sizes |
CN113344200A (zh) * | 2021-06-17 | 2021-09-03 | 阿波罗智联(北京)科技有限公司 | 用于训练可分离卷积网络的方法、路侧设备及云控平台 |
US11170300B2 (en) | 2020-01-23 | 2021-11-09 | UMNAI Limited | Explainable neural net architecture for multidimensional data |
CN114386597A (zh) * | 2021-12-31 | 2022-04-22 | 北京理工大学 | 一种轻量化的非侵入式负载分解方法 |
WO2023030507A1 (zh) * | 2021-09-03 | 2023-03-09 | 寒武纪(西安)集成电路有限公司 | 编译优化方法、装置、计算机设备以及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105160310A (zh) * | 2015-08-25 | 2015-12-16 | 西安电子科技大学 | 基于3d卷积神经网络的人体行为识别方法 |
CN105681628A (zh) * | 2016-01-05 | 2016-06-15 | 西安交通大学 | 一种卷积网络运算单元及可重构卷积神经网络处理器和实现图像去噪处理的方法 |
US20170091581A1 (en) * | 2015-09-30 | 2017-03-30 | Kabushiki Kaisha Toshiba | Computing device, computing method, and computer program product |
US20170256033A1 (en) * | 2016-03-03 | 2017-09-07 | Mitsubishi Electric Research Laboratories, Inc. | Image Upsampling using Global and Local Constraints |
CN107578091A (zh) * | 2017-08-30 | 2018-01-12 | 电子科技大学 | 一种基于轻量级深度网络的行人车辆实时检测方法 |
-
2018
- 2018-01-18 CN CN201810049756.3A patent/CN108154194B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105160310A (zh) * | 2015-08-25 | 2015-12-16 | 西安电子科技大学 | 基于3d卷积神经网络的人体行为识别方法 |
US20170091581A1 (en) * | 2015-09-30 | 2017-03-30 | Kabushiki Kaisha Toshiba | Computing device, computing method, and computer program product |
CN105681628A (zh) * | 2016-01-05 | 2016-06-15 | 西安交通大学 | 一种卷积网络运算单元及可重构卷积神经网络处理器和实现图像去噪处理的方法 |
US20170256033A1 (en) * | 2016-03-03 | 2017-09-07 | Mitsubishi Electric Research Laboratories, Inc. | Image Upsampling using Global and Local Constraints |
CN107578091A (zh) * | 2017-08-30 | 2018-01-12 | 电子科技大学 | 一种基于轻量级深度网络的行人车辆实时检测方法 |
Non-Patent Citations (1)
Title |
---|
ANDREW G..HOWARD ET AL: "《MobileNets:Efficient Convolutional Neural Networks for Mobile Vision Applications》", 《ARXIV PREPRINT ARXIV:1704.04861》 * |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109344698A (zh) * | 2018-08-17 | 2019-02-15 | 西安电子科技大学 | 基于可分离卷积和硬阈值函数的高光谱波段选择方法 |
CN109344698B (zh) * | 2018-08-17 | 2021-09-03 | 西安电子科技大学 | 基于可分离卷积和硬阈值函数的高光谱波段选择方法 |
CN110858323A (zh) * | 2018-08-23 | 2020-03-03 | 北京京东金融科技控股有限公司 | 基于卷积的图像处理方法、装置、介质及电子设备 |
CN109190758B (zh) * | 2018-09-04 | 2021-06-15 | 地平线(上海)人工智能技术有限公司 | 用于展开卷积神经网络的张量数据的方法和装置 |
CN109190758A (zh) * | 2018-09-04 | 2019-01-11 | 地平线(上海)人工智能技术有限公司 | 用于展开卷积神经网络的张量数据的方法和装置 |
WO2020088131A1 (zh) * | 2018-10-31 | 2020-05-07 | 北京嘉楠捷思信息技术有限公司 | 一种卷积神经网络计算加速方法及装置、设备、介质 |
CN111160517A (zh) * | 2018-11-07 | 2020-05-15 | 杭州海康威视数字技术股份有限公司 | 一种深度神经网络的卷积层量化方法及装置 |
CN111160517B (zh) * | 2018-11-07 | 2024-02-06 | 杭州海康威视数字技术股份有限公司 | 一种深度神经网络的卷积层量化方法及装置 |
US11037016B2 (en) | 2018-11-09 | 2021-06-15 | Institute For Information Industry | Feature determination apparatus and method adapted to multiple object sizes |
CN109584244A (zh) * | 2018-11-30 | 2019-04-05 | 安徽海浪智能技术有限公司 | 一种基于序列学习的海马体分割方法 |
CN109508461A (zh) * | 2018-12-29 | 2019-03-22 | 重庆猪八戒网络有限公司 | 基于中文自然语言处理的订单价格预测方法、终端及介质 |
CN109919013A (zh) * | 2019-01-28 | 2019-06-21 | 浙江英索人工智能科技有限公司 | 视频图像中基于深度学习的人脸检测方法及装置 |
CN109978136A (zh) * | 2019-03-05 | 2019-07-05 | 厦门美图之家科技有限公司 | 一种训练目标网络的方法、计算设备及存储介质 |
CN111832335A (zh) * | 2019-04-15 | 2020-10-27 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置及电子设备 |
CN110245787B (zh) * | 2019-05-24 | 2023-11-17 | 创新先进技术有限公司 | 一种目标群体预测方法、装置及设备 |
CN110245787A (zh) * | 2019-05-24 | 2019-09-17 | 阿里巴巴集团控股有限公司 | 一种目标群体预测方法、装置及设备 |
CN110210439A (zh) * | 2019-06-10 | 2019-09-06 | 西北工业大学 | 基于轻量化三维卷积网络的行为识别方法 |
CN110334800A (zh) * | 2019-07-18 | 2019-10-15 | 南京风兴科技有限公司 | 一种用于视频识别的轻量级3d卷积网络系统 |
CN112257857A (zh) * | 2019-07-22 | 2021-01-22 | 中科寒武纪科技股份有限公司 | 张量处理方法及相关产品 |
CN112257857B (zh) * | 2019-07-22 | 2024-06-04 | 中科寒武纪科技股份有限公司 | 张量处理方法及相关产品 |
CN110598677B (zh) * | 2019-10-08 | 2021-01-26 | 电子科技大学 | 一种用于自动调制识别的时空多通道深度学习系统 |
CN110598677A (zh) * | 2019-10-08 | 2019-12-20 | 电子科技大学 | 一种用于自动调制识别的时空多通道深度学习系统 |
US11170300B2 (en) | 2020-01-23 | 2021-11-09 | UMNAI Limited | Explainable neural net architecture for multidimensional data |
US11816587B2 (en) | 2020-01-23 | 2023-11-14 | UMNAI Limited | Explainable neural net architecture for multidimensional data |
CN112069883B (zh) * | 2020-07-28 | 2024-03-29 | 浙江工业大学 | 一种融合一维二维卷积神经网络的深度学习信号分类方法 |
CN112069883A (zh) * | 2020-07-28 | 2020-12-11 | 浙江工业大学 | 一种融合一维二维卷积神经网络的深度学习信号分类方法 |
CN112052687A (zh) * | 2020-09-02 | 2020-12-08 | 厦门市美亚柏科信息股份有限公司 | 基于深度可分离卷积的语义特征处理方法、装置及介质 |
CN112052687B (zh) * | 2020-09-02 | 2023-11-21 | 厦门市美亚柏科信息股份有限公司 | 基于深度可分离卷积的语义特征处理方法、装置及介质 |
CN113344200A (zh) * | 2021-06-17 | 2021-09-03 | 阿波罗智联(北京)科技有限公司 | 用于训练可分离卷积网络的方法、路侧设备及云控平台 |
CN113344200B (zh) * | 2021-06-17 | 2024-05-28 | 阿波罗智联(北京)科技有限公司 | 用于训练可分离卷积网络的方法、路侧设备及云控平台 |
WO2023030507A1 (zh) * | 2021-09-03 | 2023-03-09 | 寒武纪(西安)集成电路有限公司 | 编译优化方法、装置、计算机设备以及存储介质 |
CN114386597A (zh) * | 2021-12-31 | 2022-04-22 | 北京理工大学 | 一种轻量化的非侵入式负载分解方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108154194B (zh) | 2021-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108154194A (zh) | 一种用基于张量的卷积网络提取高维特征的方法 | |
CN108615010B (zh) | 基于平行卷积神经网络特征图融合的人脸表情识别方法 | |
CN109325443B (zh) | 一种基于多实例多标签深度迁移学习的人脸属性识别方法 | |
CN109034210A (zh) | 基于超特征融合与多尺度金字塔网络的目标检测方法 | |
CN106295507B (zh) | 一种基于集成卷积神经网络的性别识别方法 | |
CN108960288B (zh) | 基于卷积神经网络的三维模型分类方法及系统 | |
CN115331110A (zh) | 遥感高光谱图像与激光雷达图像融合分类方法及装置 | |
CN109726619A (zh) | 一种基于参数共享的卷积神经网络人脸识别方法及系统 | |
CN106529586A (zh) | 基于补充文本特征的图像分类方法 | |
CN111881716A (zh) | 一种基于多视角生成对抗网络的行人重识别方法 | |
CN114299542A (zh) | 一种基于多尺度特征融合的视频行人重识别方法 | |
CN106991385A (zh) | 一种基于特征融合的人脸表情识别方法 | |
Hu et al. | Lightweight multi-scale network with attention for facial expression recognition | |
CN110188820A (zh) | 基于深度学习子网络特征提取的视网膜oct图像分类方法 | |
CN114170659A (zh) | 一种基于注意力机制的面部情感识别方法 | |
Gao et al. | Natural scene recognition based on convolutional neural networks and deep Boltzmannn machines | |
Zhuang et al. | Appearance-based gaze estimation using separable convolution neural networks | |
CN114708617A (zh) | 行人重识别方法、装置及电子设备 | |
CN110826534A (zh) | 一种基于局部主成分分析的人脸关键点检测方法及系统 | |
Li et al. | Object matching between visible and infrared images using a Siamese network | |
CN116977822A (zh) | 一种融合CNN与Transformer模型的图像识别网络 | |
Gong et al. | Multi-feature fusion network for facial expression recognition in the wild | |
Hou et al. | Multilayer feature descriptors fusion CNN models for fine‐grained visual recognition | |
Liang et al. | Facial feature extraction method based on shallow and deep fusion CNN | |
Zhao et al. | Facial expression recognition based on visual transformers and local attention features network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |