CN113240083B - 一种数据处理方法、装置、电子设备及可读介质 - Google Patents
一种数据处理方法、装置、电子设备及可读介质 Download PDFInfo
- Publication number
- CN113240083B CN113240083B CN202110513544.8A CN202110513544A CN113240083B CN 113240083 B CN113240083 B CN 113240083B CN 202110513544 A CN202110513544 A CN 202110513544A CN 113240083 B CN113240083 B CN 113240083B
- Authority
- CN
- China
- Prior art keywords
- convolution
- frame number
- characteristic data
- convolution layer
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 14
- 238000000034 method Methods 0.000 claims abstract description 64
- 238000013528 artificial neural network Methods 0.000 claims abstract description 51
- 238000012545 processing Methods 0.000 claims abstract description 48
- 238000004364 calculation method Methods 0.000 claims abstract description 35
- 230000008569 process Effects 0.000 claims abstract description 26
- 238000013527 convolutional neural network Methods 0.000 claims description 37
- 239000011159 matrix material Substances 0.000 claims description 25
- 238000004891 communication Methods 0.000 claims description 19
- 230000001502 supplementing effect Effects 0.000 claims description 15
- 238000007667 floating Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 9
- 230000017105 transposition Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 17
- 230000009471 action Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Complex Calculations (AREA)
Abstract
本申请实施例提供了一种数据处理方法、装置、电子设备及可读介质。所述方法包括:获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小,根据预设帧数和卷积核大小,分别确定各个卷积层中对卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数,在对原始特征数据进行处理的过程中,根据目标帧数,调整各个卷积层待输入的特征数据,输入对应的所述卷积层,输出目标特征数据,使得不再需要对不必要的特征数据进行计算,克服了为了输入和输出的特征数据对应的帧数相等而带来的不必要的运算,减少了序列建模中卷积神经网络的计算量,提高了卷积神经网络的计算速度。
Description
技术领域
本申请涉及数据处理技术领域,特别是涉及数据处理方法、数据处理装置、电子设备、机器可读介质。
背景技术
音频播放的声音是随着时间生成的,所以很自然的被表示为一维时间序列,这样的数据称为序列数据。语言中的单词也是逐个出现的,这样的数据也是序列数据,它们都包含时间的概念。而将这样一段序列数据转换为一个固定长度向量表示的方法,称为序列建模(Sequence Models)。
目前,在音频数据的序列建模中,通常的计算过程是:将音频信号分帧加窗并提取特征,将若干帧(例如W=100帧)特征组成一个滑动窗口,作为一个整体,输入一个卷积神经网络进行计算,例如,TCN(Temporal Convolutional Network,时域卷积网络),并得到网络的输出(一般为1帧特征)作为该段特征序列的向量表示结果,当前滑动窗口向后滑动若干帧(例如H=10帧),即将当前滑动窗口的前面若干帧(例如H=10帧)移出滑动窗口,并在当前滑动窗口后面添加新的若干帧(例如H=10帧),组成下一个滑动窗口,重复向后滑动窗口,直至所有帧都计算完。
申请人经研究发现,卷积神经网络计算中存在一定程度的上下文依赖关系,在使用TCN模型进行序列建模这个场景中,传统的做法是对输入的所有特征帧进行计算,首先得到与输入帧数相等的输出帧,然后从输出帧中取最后一帧作为最终的向量表示结果。这样一来就出现了有些帧不是必要计算的问题,造成了计算资源的浪费。
发明内容
鉴于上述问题,本申请实施例提出了一种克服上述问题或者至少部分地解决上述问题的数据处理方法、数据处理装置、电子设备、机器可读介质,本申请实施例能够解决为了输入和输出的特征数据对应的帧数相等而带来的不必要的运算的问题。
为了解决上述问题,本申请公开了一种数据处理方法,包括:
获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小;
根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数;
在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述目标帧数,调整所述各个卷积层待输入的特征数据,输入对应的所述卷积层;
输出所述目标特征数据。
可选地,所述根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数包括:
对于每一卷积层,计算对应的卷积核大小减少预定值后和所述预设帧数之间的第一和值,以及之后的各个卷积层对应的卷积核大小减少所述预定值后和最后一个卷积层对应的卷积核大小之间的第二和值;所述预定值为正整数;
将所述第一和值和第二和值之中的较小值确定为所述目标帧数。
可选地,所述根据所述目标帧数,调整所述各个卷积层待输入的特征数据包括:
对于每一卷积层,若对应的所述目标帧数大于所述待输入的特征数据对应的帧数,则对所述待输入的特征数据进行补充,得到所述目标帧数对应的特征数据。
可选地,所述根据所述目标帧数,对所述各个卷积层待输入的特征数据调整包括:
对于每一卷积层,若对应的所述目标帧数小于或者等于前一卷积层输出的特征数据对应的帧数,则从所述前一卷积层输出的特征数据中提取所述目标帧数对应的特征数据。
可选地,所述方法还包括:
在所述卷积神经网络采用浮点数进行存储和计算时,记录每一卷积层输出的特征数据的最大值和最小值;
根据所述每一卷积层输出的特征数据的最大值和最小值,确定对应的卷积层采用定点数时的整数位数和小数位数;
在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述各个卷积层采用定点数时的整数位数和小数位数,在所述各个卷积层中采用定点数进行存储和计算。
可选地,在所述获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小之前,所述方法还包括:
对于每一卷积层,分别将对应于各个输出通道的卷积核依序排列,得到与输出通道对应的第一卷积核矩阵;
分别对各个输出通道对应的所述第一卷积核矩阵进行转置,得到第二卷积核矩阵;
将所述各个输出通道对应的所述第二卷积核矩阵依序排列后,存入内存。
本申请实施例还公开了一种数据处理装置,包括:
获取模块,用于获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小;
确定模块,用于根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数;
输入模块,用于在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述目标帧数,调整所述各个卷积层待输入的特征数据,输入对应的所述卷积层;
输出模块,用于输出所述目标特征数据。
可选地,所述确定模块包括:
计算子模块,用于对于每一卷积层,计算对应的卷积核大小减少预定值后和所述预设帧数之间的第一和值,以及之后的各个卷积层对应的卷积核大小减少所述预定值后和最后一个卷积层对应的卷积核大小之间的第二和值;所述预定值为正整数;
确定子模块,用于将所述第一和值和第二和值之中的较小值确定为所述目标帧数。
可选地,所述输入模块包括:
补充子模块,用于对于每一卷积层,若对应的所述目标帧数大于所述待输入的特征数据对应的帧数,则对所述待输入的特征数据进行补充,得到所述目标帧数对应的特征数据。
可选地,所述输入模块包括:
提取子模块,用于对于每一卷积层,若对应的所述目标帧数小于或者等于前一卷积层输出的特征数据对应的帧数,则从所述前一卷积层输出的特征数据中提取所述目标帧数对应的特征数据。
可选地,所述装置还包括:
记录模块,用于在所述卷积神经网络采用浮点数进行存储和计算时,记录每一卷积层输出的特征数据的最大值和最小值;
位数确定模块,用于根据所述每一卷积层输出的特征数据的最大值和最小值,确定对应的卷积层采用定点数时的整数位数和小数位数;
存储计算模块,用于在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述各个卷积层采用定点数时的整数位数和小数位数,在所述各个卷积层中采用定点数进行存储和计算。
可选地,所述装置还包括:
排列模块,用于在所述获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小之前,对于每一卷积层,分别将对应于各个输出通道的卷积核依序排列,得到与输出通道对应的第一卷积核矩阵;
转置模块,用于分别对各个输出通道对应的所述第一卷积核矩阵进行转置,得到第二卷积核矩阵;
存储模块,用于将所述各个输出通道对应的所述第二卷积核矩阵依序排列后,存入内存。
本申请实施例还公开了一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现如上述的方法步骤。
本申请实施例还公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如上述的数据处理方法。
本申请实施例包括以下优点:
综上所述,依据本申请实施例,通过获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小,根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数,在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述目标帧数,调整所述各个卷积层待输入的特征数据,输入对应的所述卷积层,输出所述目标特征数据,使得不再需要对不必要的特征数据进行计算,克服了为了输入和输出的特征数据对应的帧数相等而带来的不必要的运算,减少了序列建模中卷积神经网络的计算量,提高了卷积神经网络的计算速度。
附图说明
图1示出了本申请的一种数据处理方法实施例的步骤流程图;
图2-a示出了传统卷积神经网络的卷积层的输入输出的示意图;
图2-b示出了改进卷积神经网络的卷积层的输入输出的示意图;
图3示出了特征数据和卷积核的存储的示意图;
图4示出了本申请的一种数据处理方法实施例的步骤流程图;
图5示出了本申请的一种数据处理装置实施例的结构框图;
图6是根据一示例性实施例示出的一种电子设备的框图;
及图7是本申请的一些实施例中服务器的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
参照图1,示出了本申请的一种数据处理方法实施例的步骤流程图,具体可以包括如下步骤:
步骤101,获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小。
在本发明实施例中,序列数据包括音频数据等前后有顺序关系的数据,或者其他任意适用的数据,本发明实施例对此不做限制。在序列建模中,通常将序列数据进行分帧和加窗处理,并提取特征,得到原始特征数据。
在本发明实施例中,将预设帧数的序列数据对应的原始特征数据组成一个滑动窗口,作为一个整体,输入一个卷积神经网络进行计算,以得到网络的输出作为该段特征数据的向量表示结果。
步骤102,根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数。
在本发明实施例中,原始特征数据经过卷积神经网络的处理,最终输出的特征数据,记为目标特征数据。通常的卷积神经网络中,为了方便建模,要求每一卷积层输出的特征数据对应的帧数是相等的。如图2-a所示的传统卷积神经网络的卷积层的输入输出的示意图,在计算过程中,假设输入为N帧的序列数据对应的原始特征数据,有4层一维卷积层(1)-(4),卷积核大小分别为K1、K2、K3、K4,在输入特征的左侧补(K1-1)帧对应的特征数据,得到(N+(K1-1))帧对应的特征数据,计算卷积层(1),得到N帧结果R1;在结果R1的左侧补(K2-1)帧对应的特征数据,得到(N+(K2-1))帧对应的特征数据,计算卷积层(2),得到N帧结果R2;在结果R2的左侧补(K3-1)帧对应的特征数据,得到(N+(K3-1))帧对应的特征数据,计算卷积层(3),得到N帧结果R3;在结果R3的左侧补(K4-1)帧对应的特征数据,得到(N+(K4-1))帧对应的特征数据,计算卷积层(4),得到N帧结果R4;取结果R4的最后一帧为输出向量,即目标特征数据。传统方法需要计算的总帧数为图中阴影部分,即(N+(K1-1))+(N+(K2-1))+(N+(K3-1))+(N+(K4-1))帧。
对上述传统方法进行分析,输出的目标特征数据在卷积层(4)中实际用到的特征数据的帧数为K4,维卷积层(4)只需要计算最后K4帧,进而卷积层(3)只需要计算最后(K4+(K3-1))帧对应的特征数据,卷积层(2)只需要计算最后(K4+(K3-1)+(K2-1))帧对应的特征数据,卷积层(1)只需要计算最后(K4+(K3-1)+(K2-1)+(K1-1))帧对应的特征数据。
在本发明实施例中,根据预设帧数和卷积核大小,分别确定各个卷积层中对卷积神经网络输出目标特征数据实际用到的特征数据对应的帧数,记为目标帧数。具体实现方式可以包括:对于每一卷积层,计算对应的卷积核大小减一后和预设帧数之间的第一和值,以及之后的各个卷积层对应的卷积核大小减一后和最后一个卷积层对应的卷积核大小之间的第二和值,将第一和值和第二和值之中的较小值确定为目标帧数,或者其他任意适用的方式,本发明实施例对此不做限制。
步骤103,在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述目标帧数,调整所述各个卷积层待输入的特征数据,输入对应的所述卷积层。
在本发明实施例中,在卷积神经网络对原始特征数据进行处理的过程中,根据目标帧数,对各个卷积层待输入的特征数据进行调整,得到调整后的目标帧数对应的特征数据,再将目标帧数对应的特征数据输入对应的卷积层,进行卷积处理。
在本发明实施例中,根据所述目标帧数,对所述各个卷积层待输入的特征数据调整的具体实现方式包括:对于每一卷积层,若对应的所述目标帧数大于所述待输入的特征数据对应的帧数,则对所述待输入的特征数据进行补充,得到所述目标帧数对应的特征数据,或者对于每一卷积层,若对应的所述目标帧数不大于前一卷积层输出的特征数据对应的帧数,则从所述前一卷积层输出的特征数据中提取所述目标帧数对应的特征数据。
在本发明实施例中,可选地,所述根据所述目标帧数,调整所述各个卷积层待输入的特征数据的一种实现方式中,包括:对于每一卷积层,若对应的所述目标帧数大于所述待输入的特征数据对应的帧数,则对所述待输入的特征数据进行补充,得到所述目标帧数对应的特征数据。
对于第一个卷积层,若目标帧数大于预设帧数,则需要对待输入的特征数据进行补充,例如,对原始特征数据进行补零,以得到目标帧数对应的特征数据,然后输入第一个卷积层。对于之后的卷积层,若目标帧数大于上一卷积层输出的特征数据对应的帧数,则需要对待输入的特征数据进行补充,以得到目标帧数对应的特征数据,然后输入卷积层。
例如,如图2-b所示的改进卷积神经网络的卷积层的输入输出的示意图,对于卷积层(1),目标帧数为(N+(K1-1))或者(K4+(K3-1)+(K2-1)+(K1-1)),而原始特征数据对应的预设帧数为N帧,当目标帧数大于预设帧数时,需要对原始特征数据进行补充,通常在原始特征数据的前面补零,以凑齐目标帧数对应的特征数据。
在本发明实施例中,可选地,所述根据所述目标帧数,对所述各个卷积层待输入的特征数据调整的一种实现方式中,包括:对于每一卷积层,若对应的所述目标帧数小于或者等于前一卷积层输出的特征数据对应的帧数,则从所述前一卷积层输出的特征数据中提取所述目标帧数对应的特征数据。
对于每一卷积层,若对应的目标帧数不大于前一卷积层输出的特征数据对应的帧数,则直接从前一卷积层输出的特征数据中提取目标帧数对应的特征数据。
例如,如图2-b所示,对于卷积层(4),目标帧数为K4,当目标帧数不大于预设帧数时,从卷积层(3)的输出结果中提取目标帧数对应的特征数据,作为卷积层(4)的输入。
步骤104,输出所述目标特征数据。
在本发明实施例中,经过卷积神经网络对原始特征数据进行处理,最终输入目标特征数据。
综上所述,依据本申请实施例,通过获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小,根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数,在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述目标帧数,调整所述各个卷积层待输入的特征数据,输入对应的所述卷积层,输出所述目标特征数据,使得不再需要对不必要的特征数据进行计算,克服了为了输入和输出的特征数据对应的帧数相等而带来的不必要的运算,减少了序列建模中卷积神经网络的计算量,提高了卷积神经网络的计算速度。
在本发明实施例中,可选地,还可以包括:在所述卷积神经网络采用浮点数进行存储和计算时,记录每一卷积层输出的特征数据的最大值和最小值;根据所述每一卷积层输出的特征数据的最大值和最小值,确定对应的卷积层采用定点数时的整数位数和小数位数;在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述各个卷积层采用定点数时的整数位数和小数位数,在所述各个卷积层中采用定点数进行存储和计算。
传统的卷积神经网络都是使用浮点数进行存储和计算,虽然使用浮点数有较好的计算精度,但是在某些低资源的设备,或者不支持硬件浮点计算的设备上,使用浮点数就会造成计算速度大幅下降,甚至无法计算的情况出现。
为了将浮点数存储与计算的模型转换为定点数存储和计算,可以先在卷积神经网络采用浮点数进行存储和计算时,对每一卷积层输出的特征数据的最大值和最小值进行记录,然后根据每一卷积层输出的特征数据的最大值和最小值确定对应的定点数的整数位数和小数位数,之后将卷积神经网络的各个卷积层转换为定点数存储和计算,即采用根据每一卷积层输出的特征数据的最大值和最小值确定的定点数的整数位数和小数位数,从而减少了传统卷积神经网络的模型大小和计算量。
例如,假设输入为N帧序列数据对应的特征数据,有4层一维卷积层(1)-(4),卷积核大小分别为K1、K2、K3、K4。使用N帧输入的特征数据,添加适当的补帧,计算一维卷积层(1),得到结果R1,统计并记录R1的最大值和最小值,并根据最大值和最小值确定一维卷积层(1)采用的定点数整数位数和小数位数;使用结果1,添加适当的补帧,计算一维卷积层(2),得到结果R2,统计并记录R2的最大值和最小值,并根据最大值和最小值确定一维卷积层(2)采用的定点数整数位数和小数位数;使用结果2,添加适当的补帧,计算一维卷积层(3),得到结果R3,统计并记录R3的最大值和最小值,并根据最大值和最小值确定一维卷积层(3)采用的定点数整数位数和小数位数;使用结果3,添加适当的补帧,计算一维卷积层(4),得到结果R4,统计并记录R4的最大值和最小值,并根据最大值和最小值确定一维卷积层(4)采用的定点数整数位数和小数位数。按照浮点数转为定点数的规则,并根据上述确定的定点数的整数位数和小数位数,将一维卷积层(1)-(4)转换为定点数表示。
在本发明实施例中,可选地,在所述获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小之前,还可以包括:对于每一卷积层,分别将对应于各个输出通道的卷积核依序排列,得到与输出通道对应的第一卷积核矩阵,分别对各个输出通道对应的所述第一卷积核矩阵进行转置,得到第二卷积核矩阵,将所述各个输出通道对应的所述第二卷积核矩阵依序排列后,存入内存。
如图3所示的特征数据和卷积核的存储的示意图,通常序列数据的特征数据是按帧提取,存储特征时也是按照每一帧对应的特征数据为主序的方式进行存储,但是在计算卷积神经网络中的一维卷积时,卷积核计算和存储的主序是帧数,即以每一维特征为一个通道,在所有的输入帧上进行计算,这就出现了存储和计算主序不匹配的问题,如果不作处理,会造成计算时访存不连续、缓存缺失等问题,降低计算速度。
对于每一卷积层,将卷积核的权重进行转换,改变卷积核的权重在内存的存储顺序,使卷积核进行存储的主序与特征数据相匹配。具体可以将对应于各个输出通道的卷积核依序排列,得到与输出通道对应的第一卷积核矩阵,分别对各个输出通道对应的第一卷积核矩阵进行转置,得到第二卷积核矩阵,将各个输出通道对应的第二卷积核矩阵依序排列后,再存入内存,从而使得卷积核的计算和存储的主序与特征数据相一致,从而在卷积计算时避免对卷积核的访存不连续、缓存缺失等问题,提高计算速度。
例如,假设输入为N帧序列数据对应的特征数据,有4层一维卷积层(1)-(4),卷积核大小分别为K1、K2、K3、K4,输入输出通道数分别为IC1和OC1、IC2和OC2、IC3和OC3、IC4和OC4。卷积层(1)共有IC1×OC1个卷积核,每个卷积核的大小为K1,将IC1×OC1个卷积核按照如下方式排列:将对应于输出通道1的IC1个卷积核依序排列,得到一个大小为IC1×K1的矩阵(即第一卷积核矩阵),存储主序为卷积核的权重;将该矩阵进行转置,得到一个大小为K1×IC1的矩阵(即第二卷积核矩阵),存储主序为输入通道1;对于对应与输出通道2至OC1的卷积核,重复执行上述步骤,同样得到大小为K1×IC1的(OC1-1)个矩阵;将得到的OC1个大小为K1×IC1的矩阵依序排列,得到卷积层(1)转换后的卷积核权重。对卷积层(2)-(4),重复对卷积层(1)执行的步骤,得到一维卷积层(2)-(4)转换后的卷积核权重;然后将转换后的卷积核的权重都存入内存。
参照图4,示出了本申请的另一种数据处理方法实施例的步骤流程图,具体可以包括如下步骤:
步骤201,获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小。
在本发明实施例中,此步骤的具体实现方式可以参见前述实施例中的描述,此处不另赘述。
步骤202,对于每一卷积层,计算对应的卷积核大小减少预定值后和所述预设帧数之间的第一和值,以及之后的各个卷积层对应的卷积核大小减少所述预定值后和最后一个卷积层对应的卷积核大小之间的第二和值;所述预定值为正整数。
在本发明实施例中,对于每一卷积层,计算对应的卷积核大小减少预定值后和预设帧数之间的和值,记为第一和值,即传统卷积神经网络中确定的输入的特征数据对应的帧数。计算之后的各个卷积层对应的卷积核大小减少预定值后和最后一个卷积层对应的卷积核大小之间的和值,记为第二和值,即根据最终输出的目标特征数据推导出的所需特征数据对应的帧数。其中,预定值为正整数,例如,预定值为1。
例如,如图2-b所示,对于卷积层(1),计算(N+(K1-1))和(K4+(K3-1)+(K2-1)+(K1-1)),对于卷积层(2),计算(N+(K2-1))和(K4+(K3-1)+(K2-1)),对于卷积层(3),计算(N+(K3-1))和(K4+(K3-1)),对于卷积层(4),计算(N+(K4-1))和K4。
步骤203,将所述第一和值和第二和值之中的较小值确定为所述目标帧数。
在本发明实施例中,对于每一卷积层,输入第一和值或者第二和值对应的特征数据都可以得到目标特征数据,为了节约计算量,对于每一卷积层,在第一和值和第二和值之中取较小值,确定为目标帧数。
例如,如图2-b,对于卷积层(1),取(N+(K1-1))和(K4+(K3-1)+(K2-1)+(K1-1))中的较小值,计算卷积层(1),得到N或者(K4+(K3-1)+(K2-1))帧结果R1,对于卷积层(2),取(N+(K2-1))和(K4+(K3-1)+(K2-1))中的较小值,计算卷积层(2),得到N或者(K4+(K3-1))帧结果R2,对于卷积层(3),取(N+(K3-1))和(K4+(K3-1))中的较小值,计算卷积层(3),得到N或者K4帧结果R3,对于卷积层(4),取(N+(K4-1))和K4中的较小值,计算卷积层(4),得到N或者K4帧结果R4。
改进的卷积神经网络需要计算的总帧数为图中阴影部分,即(N+(K1-1))+(N+(K2-1))+(N+(K3-1))+(N+(K4-1))和(K4+(K3-1)+(K2-1)+(K1-1))+(K4+(K3-1)+(K2-1))+(K4+(K3-1))+K4帧中的较小值。经过简单计算可知,当满足4N>3K4+2K3+K2-2时,改进方法可以减少需要计算的帧数。
步骤204,在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述目标帧数,调整所述各个卷积层待输入的特征数据,输入对应的所述卷积层。
在本发明实施例中,此步骤的具体实现方式可以参见前述实施例中的描述,此处不另赘述。
步骤205,输出所述目标特征数据。
在本发明实施例中,此步骤的具体实现方式可以参见前述实施例中的描述,此处不另赘述。
综上所述,依据本申请实施例,通过获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小,对于每一卷积层,计算对应的卷积核大小减少预定值后和所述预设帧数之间的第一和值,以及之后的各个卷积层对应的卷积核大小减少预定值后和最后一个卷积层对应的卷积核大小之间的第二和值,预定值为正整数,将所述第一和值和第二和值之中的较小值确定为所述目标帧数,在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述目标帧数,调整所述各个卷积层待输入的特征数据,输入对应的所述卷积层,输出所述目标特征数据,使得不再需要对不必要的特征数据进行计算,克服了为了输入和输出的特征数据对应的帧数相等而带来的不必要的运算,减少了序列建模中卷积神经网络的计算量,提高了卷积神经网络的计算速度。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的运动动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的运动动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的运动动作并不一定是本申请实施例所必须的。
参照图5,示出了本申请的一种数据处理装置实施例的结构框图,具体可以包括:
获取模块301,用于获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小;
确定模块302,用于根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数;
输入模块303,用于在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述目标帧数,调整所述各个卷积层待输入的特征数据,输入对应的所述卷积层;
输出模块304,用于输出所述目标特征数据。
在本发明实施例中,可选地,所述确定模块包括:
计算子模块,用于对于每一卷积层,计算对应的卷积核大小减少预定值后和所述预设帧数之间的第一和值,以及之后的各个卷积层对应的卷积核大小减少所述预定值后和最后一个卷积层对应的卷积核大小之间的第二和值;所述预定值为正整数;
确定子模块,用于将所述第一和值和第二和值之中的较小值确定为所述目标帧数。
在本发明实施例中,可选地,所述输入模块包括:
补充子模块,用于对于每一卷积层,若对应的所述目标帧数大于所述待输入的特征数据对应的帧数,则对所述待输入的特征数据进行补充,得到所述目标帧数对应的特征数据。
在本发明实施例中,可选地,所述输入模块包括:
提取子模块,用于对于每一卷积层,若对应的所述目标帧数小于或者等于前一卷积层输出的特征数据对应的帧数,则从所述前一卷积层输出的特征数据中提取所述目标帧数对应的特征数据。
在本发明实施例中,可选地,所述装置还包括:
记录模块,用于在所述卷积神经网络采用浮点数进行存储和计算时,记录每一卷积层输出的特征数据的最大值和最小值;
位数确定模块,用于根据所述每一卷积层输出的特征数据的最大值和最小值,确定对应的卷积层采用定点数时的整数位数和小数位数;
存储计算模块,用于在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述各个卷积层采用定点数时的整数位数和小数位数,在所述各个卷积层中采用定点数进行存储和计算。
在本发明实施例中,可选地,所述装置还包括:
排列模块,用于在所述获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小之前,对于每一卷积层,分别将对应于各个输出通道的卷积核依序排列,得到与输出通道对应的第一卷积核矩阵;
转置模块,用于分别对各个输出通道对应的所述第一卷积核矩阵进行转置,得到第二卷积核矩阵;
存储模块,用于将所述各个输出通道对应的所述第二卷积核矩阵依序排列后,存入内存。
综上所述,依据本申请实施例,通过获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小,根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数,在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述目标帧数,调整所述各个卷积层待输入的特征数据,输入对应的所述卷积层,输出所述目标特征数据,使得不再需要对不必要的特征数据进行计算,克服了为了输入和输出的特征数据对应的帧数相等而带来的不必要的运算,减少了序列建模中卷积神经网络的计算量,提高了卷积神经网络的计算速度。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
图6是根据一示例性实施例示出的一种电子设备700的框图。例如,装置700可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,装置700可以包括以下一个或多个组件:处理组件702,存储器704,电源组件706,多媒体组件708,音频组件710,输入/输出(I/O)的接口712,传感器组件714,以及通信组件716。
处理组件702通常控制装置700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件702可以包括一个或多个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理部件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704被配置为存储各种类型的数据以支持在设备700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件706为装置700的各种组件提供电力。电源组件706可以包括电源管理系统,一个或多个电源,及其他与为装置700生成、管理和分配电力相关联的组件。
多媒体组件708包括在所述装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑行操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当设备700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当装置700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件714包括一个或多个传感器,用于为装置700提供各个方面的状态评估。例如,传感器组件714可以检测到设备700的打开/关闭状态,组件的相对定位,例如所述组件为装置700的显示器和小键盘,传感器组件714还可以检测装置700或装置700一个组件的位置改变,用户与装置700接触的存在或不存在,装置700方位或加速/减速和装置700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由装置700的处理器720执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图7是本申请的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(智能终端或者服务器)的处理器执行时,使得装置能够执行一种数据处理方法,所述方法包括:
获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小;
根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数;
在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述目标帧数,调整所述各个卷积层待输入的特征数据,输入对应的所述卷积层;
输出所述目标特征数据。
可选地,所述根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数包括:
对于每一卷积层,计算对应的卷积核大小减少预定值后和所述预设帧数之间的第一和值,以及之后的各个卷积层对应的卷积核大小减少所述预定值后和最后一个卷积层对应的卷积核大小之间的第二和值;所述预定值为正整数;
将所述第一和值和第二和值之中的较小值确定为所述目标帧数。
可选地,所述根据所述目标帧数,调整所述各个卷积层待输入的特征数据包括:
对于每一卷积层,若对应的所述目标帧数大于所述待输入的特征数据对应的帧数,则对所述待输入的特征数据进行补充,得到所述目标帧数对应的特征数据。
可选地,所述根据所述目标帧数,对所述各个卷积层待输入的特征数据调整包括:
对于每一卷积层,若对应的所述目标帧数小于或者等于前一卷积层输出的特征数据对应的帧数,则从所述前一卷积层输出的特征数据中提取所述目标帧数对应的特征数据。
可选地,所述方法还包括:
在所述卷积神经网络采用浮点数进行存储和计算时,记录每一卷积层输出的特征数据的最大值和最小值;
根据所述每一卷积层输出的特征数据的最大值和最小值,确定对应的卷积层采用定点数时的整数位数和小数位数;
在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述各个卷积层采用定点数时的整数位数和小数位数,在所述各个卷积层中采用定点数进行存储和计算。
可选地,在所述获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小之前,所述方法还包括:
对于每一卷积层,分别将对应于各个输出通道的卷积核依序排列,得到与输出通道对应的第一卷积核矩阵;
分别对各个输出通道对应的所述第一卷积核矩阵进行转置,得到第二卷积核矩阵;
将所述各个输出通道对应的所述第二卷积核矩阵依序排列后,存入内存。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种数据处理方法、一种数据处理装置、一种电子设备、一种机器可读介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (12)
1.一种数据处理方法,其特征在于,包括:
获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小;其中,所述序列数据为音频序列数据;
根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数;
在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述目标帧数,调整所述各个卷积层待输入的特征数据,输入对应的所述卷积层;
输出所述目标特征数据;
在所述获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小之前,所述方法还包括:
对于每一卷积层,分别将对应于各个输出通道的卷积核依序排列,得到与输出通道对应的第一卷积核矩阵;
分别对各个输出通道对应的所述第一卷积核矩阵进行转置,得到第二卷积核矩阵;
将所述各个输出通道对应的所述第二卷积核矩阵依序排列后,存入内存。
2.根据权利要求1所述的方法,其特征在于,所述根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数包括:
对于每一卷积层,计算对应的卷积核大小减少预定值后和所述预设帧数之间的第一和值,以及之后的各个卷积层对应的卷积核大小减少所述预定值后和最后一个卷积层对应的卷积核大小之间的第二和值;所述预定值为正整数;
将所述第一和值和第二和值之中的较小值确定为所述目标帧数。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标帧数,调整所述各个卷积层待输入的特征数据包括:
对于每一卷积层,若对应的所述目标帧数大于所述待输入的特征数据对应的帧数,则对所述待输入的特征数据进行补充,得到所述目标帧数对应的特征数据。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标帧数,对所述各个卷积层待输入的特征数据调整包括:
对于每一卷积层,若对应的所述目标帧数小于或者等于前一卷积层输出的特征数据对应的帧数,则从所述前一卷积层输出的特征数据中提取所述目标帧数对应的特征数据。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述卷积神经网络采用浮点数进行存储和计算时,记录每一卷积层输出的特征数据的最大值和最小值;
根据所述每一卷积层输出的特征数据的最大值和最小值,确定对应的卷积层采用定点数时的整数位数和小数位数;
在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述各个卷积层采用定点数时的整数位数和小数位数,在所述各个卷积层中采用定点数进行存储和计算。
6.一种数据处理装置,其特征在于,包括:
获取模块,用于获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小;其中,所述序列数据为音频序列数据;
确定模块,用于根据所述预设帧数和卷积核大小,分别确定所述各个卷积层中对所述卷积神经网络输出目标特征数据实际用到的特征数据对应的目标帧数;
输入模块,用于在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述目标帧数,调整所述各个卷积层待输入的特征数据,输入对应的所述卷积层;
输出模块,用于输出所述目标特征数据;
排列模块,用于在所述获取预设帧数的序列数据对应的原始特征数据,以及卷积神经网络的各个卷积层中的卷积核大小之前,对于每一卷积层,分别将对应于各个输出通道的卷积核依序排列,得到与输出通道对应的第一卷积核矩阵;
转置模块,用于分别对各个输出通道对应的所述第一卷积核矩阵进行转置,得到第二卷积核矩阵;
存储模块,用于将所述各个输出通道对应的所述第二卷积核矩阵依序排列后,存入内存。
7.根据权利要求6所述的装置,其特征在于,所述确定模块包括:
计算子模块,用于对于每一卷积层,计算对应的卷积核大小减少预定值后和所述预设帧数之间的第一和值,以及之后的各个卷积层对应的卷积核大小减少所述预定值后和最后一个卷积层对应的卷积核大小之间的第二和值;所述预定值为正整数;
确定子模块,用于将所述第一和值和第二和值之中的较小值确定为所述目标帧数。
8.根据权利要求6所述的装置,其特征在于,所述输入模块包括:
补充子模块,用于对于每一卷积层,若对应的所述目标帧数大于所述待输入的特征数据对应的帧数,则对所述待输入的特征数据进行补充,得到所述目标帧数对应的特征数据。
9.根据权利要求6所述的装置,其特征在于,所述输入模块包括:
提取子模块,用于对于每一卷积层,若对应的所述目标帧数小于或者等于前一卷积层输出的特征数据对应的帧数,则从所述前一卷积层输出的特征数据中提取所述目标帧数对应的特征数据。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
记录模块,用于在所述卷积神经网络采用浮点数进行存储和计算时,记录每一卷积层输出的特征数据的最大值和最小值;
位数确定模块,用于根据所述每一卷积层输出的特征数据的最大值和最小值,确定对应的卷积层采用定点数时的整数位数和小数位数;
存储计算模块,用于在所述卷积神经网络对所述原始特征数据进行处理的过程中,根据所述各个卷积层采用定点数时的整数位数和小数位数,在所述各个卷积层中采用定点数进行存储和计算。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
12.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至5中一个或多个所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110513544.8A CN113240083B (zh) | 2021-05-11 | 2021-05-11 | 一种数据处理方法、装置、电子设备及可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110513544.8A CN113240083B (zh) | 2021-05-11 | 2021-05-11 | 一种数据处理方法、装置、电子设备及可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113240083A CN113240083A (zh) | 2021-08-10 |
CN113240083B true CN113240083B (zh) | 2024-06-11 |
Family
ID=77133577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110513544.8A Active CN113240083B (zh) | 2021-05-11 | 2021-05-11 | 一种数据处理方法、装置、电子设备及可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113240083B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108766419A (zh) * | 2018-05-04 | 2018-11-06 | 华南理工大学 | 一种基于深度学习的非常态语音区别方法 |
CN111402130A (zh) * | 2020-02-21 | 2020-07-10 | 华为技术有限公司 | 数据处理方法和数据处理装置 |
CN111797971A (zh) * | 2020-05-27 | 2020-10-20 | 北京迈格威科技有限公司 | 应用卷积神经网络进行数据处理的方法、装置和电子系统 |
CN112199548A (zh) * | 2020-09-28 | 2021-01-08 | 华南理工大学 | 一种基于卷积循环神经网络的音乐音频分类方法 |
CN112291570A (zh) * | 2020-12-24 | 2021-01-29 | 浙江大学 | 一种基于轻量级可形变卷积神经网络的实时视频增强方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8874432B2 (en) * | 2010-04-28 | 2014-10-28 | Nec Laboratories America, Inc. | Systems and methods for semi-supervised relationship extraction |
-
2021
- 2021-05-11 CN CN202110513544.8A patent/CN113240083B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108766419A (zh) * | 2018-05-04 | 2018-11-06 | 华南理工大学 | 一种基于深度学习的非常态语音区别方法 |
CN111402130A (zh) * | 2020-02-21 | 2020-07-10 | 华为技术有限公司 | 数据处理方法和数据处理装置 |
CN111797971A (zh) * | 2020-05-27 | 2020-10-20 | 北京迈格威科技有限公司 | 应用卷积神经网络进行数据处理的方法、装置和电子系统 |
CN112199548A (zh) * | 2020-09-28 | 2021-01-08 | 华南理工大学 | 一种基于卷积循环神经网络的音乐音频分类方法 |
CN112291570A (zh) * | 2020-12-24 | 2021-01-29 | 浙江大学 | 一种基于轻量级可形变卷积神经网络的实时视频增强方法 |
Non-Patent Citations (2)
Title |
---|
High-parameter-efficiency convolutional neural networks;Lu, Y et al;《NEURAL COMPUTING & APPLICATIONS》;20200731;第32卷(第14期);.10633-10644 * |
基于深度可分离卷积的轻量级时间卷积网络设计;曹渝昆等;《计算机工程》;20200930;第46卷(第9期);95-100,109 * |
Also Published As
Publication number | Publication date |
---|---|
CN113240083A (zh) | 2021-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113538519B (zh) | 目标追踪方法及装置、电子设备和存储介质 | |
CN113766313B (zh) | 视频数据处理方法及装置、电子设备和存储介质 | |
CN107967459B (zh) | 卷积处理方法、装置及存储介质 | |
CN107590534B (zh) | 训练深度卷积神经网络模型的方法、装置及存储介质 | |
CN113361540A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
US20220188982A1 (en) | Image reconstruction method and device, electronic device, and storage medium | |
US20230386449A1 (en) | Method and apparatus for training neural network, and method and apparatus for audio processing | |
CN111985635A (zh) | 一种加速神经网络推理处理的方法、装置及介质 | |
CN112734627B (zh) | 图像风格迁移模型的训练方法、图像风格迁移方法及装置 | |
CN107730443B (zh) | 图像处理方法、装置及用户设备 | |
CN113139484A (zh) | 人群定位方法及装置、电子设备和存储介质 | |
CN110148424B (zh) | 语音处理方法、装置、电子设备及存储介质 | |
CN113240083B (zh) | 一种数据处理方法、装置、电子设备及可读介质 | |
CN107193530B (zh) | 一种生成随机数的方法和装置 | |
CN113204443B (zh) | 基于联邦学习框架的数据处理方法、设备、介质及产品 | |
CN112861145B (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN112861592B (zh) | 图像生成模型的训练方法、图像处理方法及装置 | |
EP3809336A1 (en) | Method, device and storage medium for processing overhead of memory access | |
CN112990208B (zh) | 一种文本识别方法及装置 | |
CN114154485A (zh) | 一种文本纠错方法和装置 | |
CN113240084B (zh) | 一种数据处理方法、装置、电子设备及可读介质 | |
CN112925644A (zh) | 深度学习算子优化方法、装置、设备及存储介质 | |
CN107992893B (zh) | 压缩图像特征空间的方法及装置 | |
CN107870932B (zh) | 一种用户词库优化方法、装置及电子设备 | |
CN107870931B (zh) | 一种优化用户词库的方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |