CN115759216A - 数据流映射方法、装置、存储介质及电子设备 - Google Patents
数据流映射方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN115759216A CN115759216A CN202211300010.8A CN202211300010A CN115759216A CN 115759216 A CN115759216 A CN 115759216A CN 202211300010 A CN202211300010 A CN 202211300010A CN 115759216 A CN115759216 A CN 115759216A
- Authority
- CN
- China
- Prior art keywords
- data
- output
- sub
- data stream
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Television Signal Processing For Recording (AREA)
Abstract
本申请公开了一种数据流映射方法、装置、存储介质及电子设备。其中,该数据流映射方法采用接收片上网络发送的待处理数据流,待处理数据流包括特征数据和残差数据;将特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据;对第一子待输出数据进行激活和池化处理,得到第二子待输出数据;将第二子待输出数据和残差数据进行拼接或求和,得到目标待输出数据。本方案可以降低神经网络芯片的功耗。
Description
技术领域
本申请涉及神经网络技术领域,具体涉及一种数据流映射方法、装置、存储介质及电子设备。
背景技术
卷积神经网络(Convolutional Neural Networks,CNN)是一种深度前馈人工神经网络,目前已被应用于诸多领域,比如图像识别、无人机、手机等。卷积神经网络在处理过程中会进行较为复杂的计算,主要包括卷积计算、批标准化计算、激活计算等。为了满足卷积神经网络计算的高效需求,在芯片上规划专用于神经网络计算的架构应运而生。
目前大部分神经网络芯片(Neural-network Processing Units,NPU)大都采用的是纯数字设计,但是纯数字设计的NPU功耗太大,导致在手机或无人驾驶上基本无法使用,并且,纯数字设计的NPU尺寸也很大,会占据大量空间。
发明内容
本申请提供了一种数据流映射方法、装置、存储介质及电子设备,可以降低NPU的功耗。
第一方面,本申请提供一种数据流映射方法,包括:
接收片上网络发送的待处理数据流,所述待处理数据流包括特征数据和残差数据;
将所述特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据;
对所述第一子待输出数据进行激活和池化处理,得到第二子待输出数据;
将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据。
在本申请提供的数据流映射方法中,所述特征数据包括若干特征图数据和若干权重数据,所述特征图数据和所述权重数据一一对应;
将所述特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据,包括:
将所述特征图数据和所述权重数据分别输入至对应的计算单元中;
分别对所述权重数据和所述特征图数据进行划窗处理,得到划窗权重数据和划窗特征图数据;
基于所述划窗权重数据和所述划窗特征图数据进行乘累加运算,得到第一子待输出数据。
在本申请提供的数据流映射方法中,所述基于所述划窗权重数据和所述划窗特征图数据进行乘累加运算,得到第一子待输出数据,包括:
对所述划窗权重数据和所述划窗特征图数据进行卷积处理,得到若干中间数据;
基于所述中间数据进行乘累加运算,得到第一子待输出数据。
在本申请提供的数据流映射方法中,在所述将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据之前,还包括:
将所述残差数据输入至延时缓冲单元;
对所述残差数据进行融合处理,得到融合残差数据;
所述将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据,包括:
将所述第二子待输出数据和所述融合残差数据进行拼接或求和,得到目标待输出数据。
在本申请提供的数据流映射方法中,在所述将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据之后,还包括:
对所述目标待输出数据进行压缩处理;
将压缩处理后的所述目标待输出数据发送至所述片上网络进行存储。
在本申请提供的数据流映射方法中,所述计算单元为集存储能力和计算能力于一体的存内计算单元。
第二方面,本申请提供了一种数据流映射装置,包括:
数据接收单元,用于接收片上网络发送的待处理数据流,所述待处理数据流包括特征数据和残差数据;
第一处理单元,用于将所述特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据;
第二处理单元,用于对所述第一子待输出数据进行激活和池化处理,得到第二子待输出数据;
数据拼接单元,用于将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据。
在本申请提供的数据流映射装置中,所述特征数据包括若干特征图数据和若干权重数据,所述特征图数据和所述权重数据一一对应;
所述第一处理单元用于:
将所述特征图数据和所述权重数据分别输入至对应的计算单元中;
分别对所述权重数据和所述特征图数据进行划窗处理,得到划窗权重数据和划窗特征图数据;
基于所述划窗权重数据和所述划窗特征图数据进行乘累加运算,得到第一子待输出数据。
第三方面,本申请提供了一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行上述任一项所述的数据流映射方法。
第四方面,本申请实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如以上任一项所述的数据流映射方法。
综上,本申请提供的数据流映射方法采用接收片上网络发送的待处理数据流,所述待处理数据流包括特征数据和残差数据;将所述特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据;对所述第一子待输出数据进行激活和池化处理,得到第二子待输出数据;将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据。本方案可以降低NPU的功耗。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的数据流映射方法的流程示意图。
图2是本申请实施例提供的数据流映射架构的结构示意图。
图3是本申请实施例提供的数据流映射装置的流程示意图。
图4是本申请实施例提供的电子设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素,此外,本申请不同实施例中具有同样命名的部件、特征、要素可能具有相同含义,也可能具有不同含义,其具体含义需以其在该具体实施例中的解释或者进一步结合该具体实施例中上下文进行确定。
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或者“单元”的后缀仅为了有利于本申请的说明,其本身没有特定的意义。因此,“模块”、“部件”或者“单元”可以混合地使用。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多该特征。在本申请实施例的描述中,“多个”、“若干”的含义是两个或两个以上,除非另有明确具体的限定。
传统纯数字设计的神经网络芯片功耗太大,尺寸也很大,业内现有的神经网络芯片一般能做到的能效比为4T/W。但是现有手机或无人驾驶对AI算力的要求一般都在几十T,甚至上百T的量级,这样导致功耗达到了几十瓦甚至上百瓦,导致现有的神经网络芯片在手机或无人驾驶上基本无法使用。
基于此,本申请实施例提供了一种数据流映射方法、装置、存储介质及电子设备,以下将分别进行详细说明。其中,本申请实施例提供的数据流映射装置可以集成于电子设备中,该电子设备可以为手机、平板电脑、笔记本电脑、无人机、车载电脑等终端设备。在本申请实施例中,该数据流映射装置可以为神经网络芯片。
需要说明的是,以下各个实施例的描述先后顺序并不构成对具体实施先后顺序的限定。
请参照图1,图1为本申请的数据流映射方法的流程示意图。该数据流映射方法的具体流程可以如下:
101、接收片上网络发送的待处理数据流,待处理数据流包括特征数据和残差数据。
其中,该特征数据可以包括若干特征图(Feature-Map)数据(和若干权重数据(Weights Data)。该特征图数据初始时是输入的原始图像数据,之后是对原始图像使用卷积神经网络处理后的图像数据。该权重数据是卷积神经网络的权重参数,可以通过训练得到。
需要说明的是,该特征图数据和权重数据一一对应。
102、将特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据。
具体的,可以将特征图数据和权重数据分别输入至对应的计算单元中;然后分别对权重数据和特征图数据进行划窗处理,得到划窗权重数据和划窗特征图数据;最后,基于划窗权重数据和划窗特征图数据进行乘累加运算,得到第一子待输出数据。
其中,划窗处理的窗口大小由网络参数决定,比如生成1*1,3*3,5*5, 7*7的数据,等等。
可以理解的是,相互对应的特征图数据和权重数据输入至同一计算单元中。在本申请实施例中,该计算单元为集存储能力和计算能力于一体的存内计算单元(Computing-in-Memory,CIM)。
在一些实施例中,步骤“基于划窗权重数据和划窗特征图数据进行乘累加运算,得到第一子待输出数据”可以包括:
对划窗权重数据和划窗特征图数据进行卷积处理,得到若干中间数据;
基于中间数据进行乘累加运算,得到第一子待输出数据。
在一些实施例中,当输入的特征图数据如图2所示包括多个通道时,可以将每个通道卷积得到的中间数据流进行乘累加后,得到第一待输出数据。举例来说,输入的特征图数据为416*416*3,其中,3代表3个通道,如果有16个卷积核,每个卷积核与一个通道的416*416特征图卷积后得到该通道的中间数据流(该卷积过程可以划分为多个部分并行进行),3个通道的中间数据流进行乘累加,得到一个416*416的特征图数据,16个卷积核得到16个特征图数据,即第一子待输出数据为416*416*16。
需要说明的是,卷积处理的具体过程为本领域的常用技术手段,在此不再一一赘述。
103、对第一子待输出数据进行激活和池化处理,得到第二子待输出数据。
需要说明的是,激活和池化处理的具体过程为本领域的常用技术手段,在此不再一一赘述。
在一些实施例中,当第一子待输出数据为416*416*16时,对其进行池化处理得到特征图数据为208*208*16,此时通道为16,如果有32个卷积核,每个卷积核与一个通道的208*208特征图数据卷积后得到该通道的中间数据流,16 个通道的中间数据流进行乘累加,得到一个208*208的特征图数据,32个卷积核得到32个特征图数据,即第二子待输出数据为208*208*32。
104、将第二子待输出数据和残差数据进行拼接或求和,得到目标待输出数据。
具体的,可以通过拼接函数concat()对第二子待输出数据和残差数据进行拼接或求和,从而得到目标待输出数据。
在一些实施例中,为了减小神经网络芯片的功耗,可以将残差数据输入至延时缓冲单元;对残差数据进行融合处理,得到融合残差数据。此时,可以将第二子待输出数据和融合残差数据进行拼接或求和,得到目标待输出数据。
在一些实施例中,为了进一步减小神经网络芯片的功耗,在步骤104之后还可以包括对目标待输出数据进行压缩处理;将压缩处理后的目标待输出数据发送至片上网络进行存储。
在本申请实施例中,通过将卷积处理、池化处理和激活处理分离并行进行,可以实现卷积神经网络的加速。并且,本申请通过将特征数据和残差数据分开处理,使得残差数据可以通过较小的延时缓冲单元(delay buffer)进行融合,无需通过较大的fm buffer,进而降低神经网络芯片的功耗。
由于CIM采用模数混合技术,单位算力面积比数字MAC小了接近10倍,因此同样实现一个8*8的MAC,用CIM可以比纯数字实现尺寸小十倍,这样最终的芯片尺寸会小很多,能效比也比纯数字实现高很多。CIM是存算一体架构,数据搬移直接在CIM之间通过linebuffer实现,相比于其他架构在SRAM 或DRAM进行数据搬移,功耗会极大的降低。
综上,本申请实施例提供的数据流映射方法采用接收片上网络发送的待处理数据流,待处理数据流包括特征数据和残差数据;将特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据;对第一子待输出数据进行激活和池化处理,得到第二子待输出数据;将第二子待输出数据和残差数据进行拼接或求和,得到目标待输出数据。本方案中,数据搬移全部在CIM 之间很小的line buffer上完成,使得最终输出的特征图数据所需存储空间也很小。也即,本方案可以降低神经网络芯片的功耗和尺寸。
为了更好地实施以上数据流映射方法,本申请实施例还提供一种数据流映射装置。其中名词的含义与上述数据流映射方法中相同,具体实现细节可以参考方法实施例中的说明。
比如,如图3所示,图3是本申请实施例提供的数据流映射装置的结构示意图,该数据流映射装置可以包括数据接收单元201、第一处理单元202、第二处理单元203和数据拼接单元204。其中,
数据接收单元201,用于接收片上网络发送的待处理数据流,待处理数据流包括特征数据和残差数据;
第一处理单元202,用于将特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据;
第二处理单元203,用于对第一子待输出数据进行激活和池化处理,得到第二子待输出数据;
数据拼接单元204,用于将第二子待输出数据和残差数据进行拼接或求和,得到目标待输出数据。
在一些实施例中,该特征数据包括若干特征图数据和若干权重数据,特征图数据和权重数据一一对应。该第一处理单元可以用于:
将特征图数据和权重数据分别输入至对应的计算单元中;
分别对权重数据和特征图数据进行划窗处理,得到划窗权重数据和划窗特征图数据;
基于划窗权重数据和划窗特征图数据进行乘累加运算,得到第一子待输出数据。
综上,本申请实施例提供的数据流映射装置可以通过数据接收单元201接收片上网络发送的待处理数据流,待处理数据流包括特征数据和残差数据;由第一处理单元202将特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据;由第二处理单元203对第一子待输出数据进行激活和池化处理,得到第二子待输出数据;由数据拼接单元204将第二子待输出数据和残差数据进行拼接或求和,得到目标待输出数据。本方案通过将特征数据和残差数据分开处理,使得残差数据可以通过较小的延时缓冲单元(delay buffer)进行融合,无需通过较大的fm buffer,进而降低神经网络芯片的功耗。
本申请实施例还提供一种电子设备,如图4所示,该电子设备可以包括射频(RF,Radio Frequency)电路401、包括有一个或一个以上计算机可读存储介质的存储器402、输入单元403、显示单元404、传感器405、音频电路406、无线保真(WiFi,Wireless Fidelity)模块407、包括有一个或者一个以上处理核心的处理器408、以及电源409等部件。本领域技术人员可以理解,图4中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路401可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器408处理;另外,将涉及上行的数据发送给基站。通常,RF电路401包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM,Subscriber Identity Module)卡、收发信机、耦合器、低噪声放大器(LNA,Low Noise Amplifier)、双工器等。此外,RF电路401还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统 (GSM,Global System of Mobile communication)、通用分组无线服务(GPRS, GeneralPacket Radio Service)、码分多址(CDMA,Code Division Multiple Access)、宽带码分多址(WCDMA,Wideband Code Division Multiple Access)、长期演进(LTE,Long TermEvolution)、电子邮件、短消息服务(SMS,Short Messaging Service)等。
存储器402可用于存储软件程序以及模块,处理器408通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器 402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据(比如音频数据、电话本等) 等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器408和输入单元 403对存储器402的访问。
输入单元403可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元403可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作 (比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器408,并能接收处理器408发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面,输入单元403还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元404可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元404可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid CrystalDisplay)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器408以确定触摸事件的类型,随后处理器408根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图4中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
电子设备还可以包括至少一种传感器405,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在电子设备移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于电子设备还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路406、扬声器,传声器可提供用户与电子设备之间的音频接口。音频电路406可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路406接收后转换为音频数据,再将音频数据输出处理器408处理后,经RF电路401以发送给比如另一电子设备,或者将音频数据输出至存储器402 以便进一步处理。音频电路406还可能包括耳塞插孔,以提供外设耳机与电子设备的通信。
WiFi属于短距离无线传输技术,电子设备通过WiFi模块407可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图4示出了WiFi模块407,但是可以理解的是,其并不属于电子设备的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器408是电子设备的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器408可包括一个或多个处理核心;优选的,处理器408可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器408中。
电子设备还可以包括给各个部件供电的电源409(比如电池),优选的,电源可以通过电源管理系统与处理器408逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源409还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,电子设备还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,电子设备中的处理器408会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器 408来运行存储在存储器402中的应用程序,从而实现各种功能:
接收片上网络发送的待处理数据流,待处理数据流包括特征数据和残差数据;
将特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据;
对第一子待输出数据进行激活和池化处理,得到第二子待输出数据;
将第二子待输出数据和残差数据进行拼接或求和,得到目标待输出数据。
以上操作具体可参见前面的实施例,在此不作赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种数据流映射中的步骤。例如,该指令可以执行如下步骤:
接收片上网络发送的待处理数据流,待处理数据流包括特征数据和残差数据;
将特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据;
对第一子待输出数据进行激活和池化处理,得到第二子待输出数据;
将第二子待输出数据和残差数据进行拼接或求和,得到目标待输出数据。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一数据流映射方法中的步骤,因此,可以实现本申请实施例所提供的任一数据流映射方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的数据流映射方法、系统和存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种数据流映射方法,其特征在于,包括:
接收片上网络发送的待处理数据流,所述待处理数据流包括特征数据和残差数据;
将所述特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据;
对所述第一子待输出数据进行激活和池化处理,得到第二子待输出数据;
将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据。
2.如权利要求1所述的数据流映射方法,其特征在于,所述特征数据包括若干特征图数据和若干权重数据,所述特征图数据和所述权重数据一一对应;
将所述特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据,包括:
将所述特征图数据和所述权重数据分别输入至对应的计算单元中;
分别对所述权重数据和所述特征图数据进行划窗处理,得到划窗权重数据和划窗特征图数据;
基于所述划窗权重数据和所述划窗特征图数据进行乘累加运算,得到第一子待输出数据。
3.如权利要求2所述的数据流映射方法,其特征在于,所述基于所述划窗权重数据和所述划窗特征图数据进行乘累加运算,得到第一子待输出数据,包括:
对所述划窗权重数据和所述划窗特征图数据进行卷积处理,得到若干中间数据;
基于所述中间数据进行乘累加运算,得到第一子待输出数据。
4.如权利要求1所述的数据流映射方法,其特征在于,在所述将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据之前,还包括:
将所述残差数据输入至延时缓冲单元;
对所述残差数据进行融合处理,得到融合残差数据;
所述将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据,包括:
将所述第二子待输出数据和所述融合残差数据进行拼接或求和,得到目标待输出数据。
5.如权利要求1所述的数据流映射方法,其特征在于,在所述将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据之后,还包括:
对所述目标待输出数据进行压缩处理;
将压缩处理后的所述目标待输出数据发送至所述片上网络进行存储。
6.如权利要求1-5所述的数据流映射方法,其特征在于,所述计算单元为集存储能力和计算能力于一体的存内计算单元。
7.一种数据流映射装置,其特征在于,包括:
数据接收单元,用于接收片上网络发送的待处理数据流,所述待处理数据流包括特征数据和残差数据;
第一处理单元,用于将所述特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据;
第二处理单元,用于对所述第一子待输出数据进行激活和池化处理,得到第二子待输出数据;
数据拼接单元,用于将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据。
8.如权利要求7所述的数据流映射装置,其特征在于,所述特征数据包括若干特征图数据和若干权重数据,所述特征图数据和所述权重数据一一对应;
所述第一处理单元用于:
将所述特征图数据和所述权重数据分别输入至对应的计算单元中;
分别对所述权重数据和所述特征图数据进行划窗处理,得到划窗权重数据和划窗特征图数据;
基于所述划窗权重数据和所述划窗特征图数据进行乘累加运算,得到第一子待输出数据。
9.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至6任一项所述的数据流映射方法。
10.一种电子设备,其特征在于,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的数据流映射方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211300010.8A CN115759216A (zh) | 2022-10-21 | 2022-10-21 | 数据流映射方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211300010.8A CN115759216A (zh) | 2022-10-21 | 2022-10-21 | 数据流映射方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115759216A true CN115759216A (zh) | 2023-03-07 |
Family
ID=85352830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211300010.8A Pending CN115759216A (zh) | 2022-10-21 | 2022-10-21 | 数据流映射方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115759216A (zh) |
-
2022
- 2022-10-21 CN CN202211300010.8A patent/CN115759216A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106919918B (zh) | 一种人脸跟踪方法和装置 | |
CN109768926B (zh) | 一种数据处理方法、终端设备及计算机可读存储介质 | |
CN106786962B (zh) | 充电控制方法、装置及终端 | |
CN108834132B (zh) | 一种数据传输方法及设备和相关介质产品 | |
CN105793837B (zh) | 具有用于处理数据的两个处理器的电子设备 | |
CN104007887A (zh) | 浮层显示的方法和终端 | |
CN110099434B (zh) | 一种功率调整方法、终端设备及计算机可读存储介质 | |
CN109688611B (zh) | 一种频段参数的配置方法、装置、终端和存储介质 | |
CN109698711B (zh) | 一种射频模组及终端设备 | |
CN109189576B (zh) | 基于Redis的请求处理方法、服务器及计算机可读存储介质 | |
CN111327343A (zh) | 一种共接收通道射频装置、方法及移动终端 | |
CN110717486B (zh) | 文本检测方法、装置、电子设备和存储介质 | |
WO2020007115A1 (zh) | 分屏退出方法、装置、存储介质和电子设备 | |
CN110891262A (zh) | 一种蓝牙配对的方法、系统和终端设备 | |
CN115759216A (zh) | 数据流映射方法、装置、存储介质及电子设备 | |
CN111308303B (zh) | 一种移动终端射频功率放大器检测方法及装置 | |
CN113991291A (zh) | 天线系统及移动终端 | |
CN110503189B (zh) | 一种数据处理方法以及装置 | |
CN112261634A (zh) | 一种蓝牙传输控制方法、装置、终端设备和存储介质 | |
CN112214699A (zh) | 一种页面处理的方法及相关装置 | |
CN117234137B (zh) | Mcu时钟频率切换电路、mcu和电子设备 | |
CN111954193B (zh) | 一种蓝牙设备连接检测方法、装置及移动终端 | |
CN111488123B (zh) | 存储空间管理方法、装置、存储介质及移动终端 | |
CN218383947U (zh) | 存储器件和智能终端 | |
CN109617660B (zh) | 载波聚合频段的设置方法、装置、存储介质及移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |