CN115952828A - 数据传输网络、数据处理方法、装置及芯片 - Google Patents
数据传输网络、数据处理方法、装置及芯片 Download PDFInfo
- Publication number
- CN115952828A CN115952828A CN202211459104.XA CN202211459104A CN115952828A CN 115952828 A CN115952828 A CN 115952828A CN 202211459104 A CN202211459104 A CN 202211459104A CN 115952828 A CN115952828 A CN 115952828A
- Authority
- CN
- China
- Prior art keywords
- node
- data
- storage unit
- network
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 94
- 238000003672 processing method Methods 0.000 title abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000007493 shaping process Methods 0.000 claims description 34
- 238000000034 method Methods 0.000 claims description 31
- 238000004364 calculation method Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 30
- 238000004891 communication Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 12
- 230000003068 static effect Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003924 mental process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本公开提供了一种数据传输网络、数据处理方法、装置及芯片,涉及计算机技术领域,尤其涉及人工智能及芯片技术领域。数据传输网络包括:第一节点层,第一节点层中的每个节点用于对该节点相对应的至少一个存储单元中任一存储单元进行数据读取和数据写入,第一节点层包括第一节点和第二节点;以及第二节点层,第二节点层包括第三节点和第四节点,第一节点和第二节点中的每个节点分别与第三节点和第四节点连接以形成第一级网络,以使目标数据可以经由第一级网络中的第一数据通路由源存储单元转存至目标存储单元中,其中,源存储单元和目标存储单元位于第一节点和第二节点相应的多个存储单元中。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及人工智能及芯片技术领域,具体涉及一种数据传输网络、数据处理方法、装置、芯片、电子设备、计算机可读存储介质和计算机程序产品。
背景技术
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
随着神经网络以及图形处理相关应用的普及,越来越多的企业开始自研神经网络处理器(Networks Processing Unit,NPU)或图形处理器(Graphics Processing Unit,GPU)等特定领域架构(Domain Specific Architecture,DSA)芯片,旨在对特定任务进行硬件并行加速,实现对应用业务的加速。
在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
发明内容
本公开提供了一种数据传输网络、数据处理方法、装置、芯片、电子设备、计算机可读存储介质和计算机程序产品。
根据本公开的一方面,提供了一种数据传输网络,包括:第一节点层,第一节点层中的每个节点用于对该节点相对应的至少一个存储单元中任一存储单元进行数据读取和数据写入,第一节点层包括第一节点和第二节点;以及第二节点层,第二节点层包括第三节点和第四节点,第一节点和第二节点中的每个节点分别与第三节点和第四节点连接以形成第一级网络,以使目标数据可以经由第一级网络中的第一数据通路由源存储单元转存至目标存储单元中,其中,源存储单元和目标存储单元位于第一节点和第二节点相应的多个存储单元中。
根据本公开的另一方面,提供了一种数据处理方法,方法包括:响应于接收到第一指令,使目标数据从源存储单元经由上述数据传输网络转存至目标存储单元,其中,第一指令包括源存储单元的地址信息和目标存储单元的地址信息。
根据本公开的另一方面,提供了一种数据处理装置,装置包括:转存单元,被配置为响应于接收到第一指令,使目标数据从源存储单元经由上述数据传输网络转存至目标存储单元,其中,第一指令包括源存储单元的地址信息和目标存储单元的地址信息。
根据本公开的另一方面,提供了一种芯片,包括上述数据传输网络和上述数据处理装置中的至少一者。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述数据处理方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行上述数据处理方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,计算机程序在被处理器执行时实现上述数据处理方法。
根据本公开的一个或多个实施例,能够在硬件实现中简化布线,降低功耗损失。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
图1示出了根据本公开的实施例的可以在其中实施本文描述的各种方法的示例性系统的示意图;
图2示出了根据本公开的示例性实施例的数据传输网络的结构示意图;
图3示出了相关技术中的一种数据整形操作示意图;
图4示出了根据本公开的示例性实施例的数据传输网络的结构示意图;
图5示出了根据本公开的示例性实施例的数据传输网络的结构示意图;
图6示出了根据本公开的示例性实施例的数据传输网络的结构示意图;
图7示出了根据本公开的示例性实施例的数据传输网络中的节点的结构示意图;
图8示出了根据本公开的示例性实施例的数据传输网络中的节点的结构示意图;
图9示出了根据本公开的示例性实施例的数据处理方法900的流程图;
图10示出了根据本公开的示例性实施例的数据处理方法1000的流程图;
图11示出了根据本公开的示例性实施例的数据处理装置的结构示意图;
图12A示出了根据本公开的示例性实施例的数据读取和写入的示意图;
图12B示出了根据本公开的示例性实施例的数据传输路线示意图;
图13示出了根据本公开示例性实施例的数据处理装置1300的结构框图;
图14示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个要素与另一要素区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
相关技术中,由于数据传输网络中的每个网络节点均是仅与其相应的上游节点连接,因此数据传输网络中的每条通路仅能支持其相应的存储区块的数据读写。而对于数据整形操作来说,只能应用额外的数据整形模块将数据读取至该模块中,进行整形操作后再将数据通过相应的数据通路传输至相应的存储地址中。数据整形模块的应用,导致数据整形操作占用较多带宽,同时,在硬件实现上增加了布线的复杂度,复杂的线路也进一步增加了功耗损失。
下面将结合附图详细描述本公开的实施例。
图1示出了根据本公开的实施例可以将本文描述的各种方法和装置在其中实施的示例性系统100的示意图。参考图1,该系统100包括一个或多个客户端设备101、102、103、104、105和106、服务器120以及将一个或多个客户端设备耦接到服务器120的一个或多个通信网络110。客户端设备101、102、103、104、105和106可以被配置为执行一个或多个应用程序。
在本公开的实施例中,服务器120可以运行使得能够执行上述数据处理方法的一个或多个服务或软件应用。
在某些实施例中,服务器120还可以提供其他服务或软件应用,这些服务或软件应用可以包括非虚拟环境和虚拟环境。在某些实施例中,这些服务可以作为基于web的服务或云服务提供,例如在软件即服务(SaaS)模型下提供给客户端设备101、102、103、104、105和/或106的用户。
在图1所示的配置中,服务器120可以包括实现由服务器120执行的功能的一个或多个组件。这些组件可以包括可由一个或多个处理器执行的软件组件、硬件组件或其组合。操作客户端设备101、102、103、104、105和/或106的用户可以依次利用一个或多个客户端应用程序来与服务器120进行交互以利用这些组件提供的服务。应当理解,各种不同的系统配置是可能的,其可以与系统100不同。因此,图1是用于实施本文所描述的各种方法的系统的一个示例,并且不旨在进行限制。
用户可以使用客户端设备101、102、103、104、105和/或106来下达数据处理指令。客户端设备可以提供使客户端设备的用户能够与客户端设备进行交互的接口。客户端设备还可以经由该接口向用户输出信息。尽管图1仅描绘了六种客户端设备,但是本领域技术人员将能够理解,本公开可以支持任何数量的客户端设备。
客户端设备101、102、103、104、105和/或106可以包括各种类型的计算机设备,例如便携式手持设备、通用计算机(诸如个人计算机和膝上型计算机)、工作站计算机、可穿戴设备、智能屏设备、自助服务终端设备、服务机器人、游戏系统、瘦客户端、各种消息收发设备、传感器或其他感测设备等。这些计算机设备可以运行各种类型和版本的软件应用程序和操作系统,例如MICROSOFT Windows、APPLE iOS、类UNIX操作系统、Linux或类Linux操作系统(例如GOOGLE Chrome OS);或包括各种移动操作系统,例如MICROSOFT WindowsMobile OS、iOS、Windows Phone、Android。便携式手持设备可以包括蜂窝电话、智能电话、平板电脑、个人数字助理(PDA)等。可穿戴设备可以包括头戴式显示器(诸如智能眼镜)和其他设备。游戏系统可以包括各种手持式游戏设备、支持互联网的游戏设备等。客户端设备能够执行各种不同的应用程序,例如各种与Internet相关的应用程序、通信应用程序(例如电子邮件应用程序)、短消息服务(SMS)应用程序,并且可以使用各种通信协议。
网络110可以是本领域技术人员熟知的任何类型的网络,其可以使用多种可用协议中的任何一种(包括但不限于TCP/IP、SNA、IPX等)来支持数据通信。仅作为示例,一个或多个网络110可以是局域网(LAN)、基于以太网的网络、令牌环、广域网(WAN)、因特网、虚拟网络、虚拟专用网络(VPN)、内部网、外部网、区块链网络、公共交换电话网(PSTN)、红外网络、无线网络(例如蓝牙、WIFI)和/或这些和/或其他网络的任意组合。
服务器120可以包括一个或多个通用计算机、专用服务器计算机(例如PC(个人计算机)服务器、UNIX服务器、中端服务器)、刀片式服务器、大型计算机、服务器群集或任何其他适当的布置和/或组合。服务器120可以包括运行虚拟操作系统的一个或多个虚拟机,或者涉及虚拟化的其他计算架构(例如可以被虚拟化以维护服务器的虚拟存储设备的逻辑存储设备的一个或多个灵活池)。在各种实施例中,服务器120可以运行提供下文所描述的功能的一个或多个服务或软件应用。
服务器120中的计算单元可以运行包括上述任何操作系统以及任何商业上可用的服务器操作系统的一个或多个操作系统。服务器120还可以运行各种附加服务器应用程序和/或中间层应用程序中的任何一个,包括HTTP服务器、FTP服务器、CGI服务器、JAVA服务器、数据库服务器等。
在一些实施方式中,服务器120可以包括一个或多个应用程序,以分析和合并从客户端设备101、102、103、104、105和/或106的用户接收的数据馈送和/或事件更新。服务器120还可以包括一个或多个应用程序,以经由客户端设备101、102、103、104、105和/或106的一个或多个显示设备来显示数据馈送和/或实时事件。
在一些实施方式中,服务器120可以为分布式系统的服务器,或者是结合了区块链的服务器。服务器120也可以是云服务器,或者是带人工智能技术的智能云计算服务器或智能云主机。云服务器是云计算服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器(VPS,Virtual Private Server)服务中存在的管理难度大、业务扩展性弱的缺陷。
系统100还可以包括一个或多个数据库130。在某些实施例中,这些数据库可以用于存储数据和其他信息。例如,数据库130中的一个或多个可用于存储诸如音频文件和视频文件的信息。数据库130可以驻留在各种位置。例如,由服务器120使用的数据库可以在服务器120本地,或者可以远离服务器120且可以经由基于网络或专用的连接与服务器120通信。数据库130可以是不同的类型。在某些实施例中,由服务器120使用的数据库例如可以是关系数据库。这些数据库中的一个或多个可以响应于命令而存储、更新和检索到数据库以及来自数据库的数据。
在某些实施例中,数据库130中的一个或多个还可以由应用程序使用来存储应用程序数据。由应用程序使用的数据库可以是不同类型的数据库,例如键值存储库,对象存储库或由文件系统支持的常规存储库。
图1的系统100可以以各种方式配置和操作,以使得能够应用根据本公开所描述的各种方法和装置。
图2示出了根据本公开的示例性实施例的数据传输网络的结构示意图。
根据一些实施例,如图2所示,提供了一种数据传输网络200,包括:第一节点层210,第一节点层210中的每个节点用于对该节点相对应的至少一个存储单元中任一存储单元进行数据读取和数据写入,第一节点层210包括第一节点211和第二节点212;以及第二节点层220,第二节点层220包括第三节点221和第四节点222,第一节点211和第二节点212中的每个节点分别与第三节点221和第四节点222连接以形成第一级网络,以使目标数据可以经由第一级网络中的第一数据通路由源存储单元转存至目标存储单元中,其中,源存储单元和目标存储单元位于第一节点211和第二节点212相应的多个存储单元中。
由此,能够在硬件实现中简化布线,降低功耗损失。
数据整形操作用于完成多维度数据之间的转换,例如矩阵转置、使矩阵旋转90°等,是一种数据预处理操作,通常用于将数据输入计算单元前。以下将以矩阵转置为例对具体实施例进行描述。
图3示出了相关技术中的一种数据整形操作示意图。
在静态存储空间中,矩阵的每一维往往是连续存储的,如图3所示,一个4×4的矩阵的数据(1~16)分别存储在多个存储区块中的不同存储单元中。不同数据之间只是存储地址不同而已,因而数据整形操作实质上就是静态存储空间中一个位置到另一个位置的数据搬运。
相关技术中,如图3所示,例如完成一个4×4矩阵的转置,首先需要将矩阵中的每个数据均读取到数据整形模块中,数据整形模块会按照一定的输出规则把不同维度的数据拼接成连续数据,随后再存储回静态存储空间中的相应存储单元中,随后再由计算单元从静态存储空间中读取整形后的数据以进行相应计算。
也即,在相关技术中,多级的数据传输网络仅用于数据读取和数据写入,数据传输网络中的每个节点都仅与其相应的一个上级节点和一个下级节点连接以完成单一方向的数据传输,而数据整形操作完全集中于数据整形模块进行。需要进行整形的数据量往往很大,并且片上的静态存储器也往往很大,这也造成数据读取和写入过程中的传输延时较高;同时,对于芯片设计来说是很大的面积消耗,数据移动造成的功耗也不利于低功耗设计。
在一些实施例中,如图2所示,以第一节点211为例,其被设计为分别连接第三节点221和第四节点222,从而能够与上述两个节点进行数据传输。其中,每个上述节点中包括至少一个缓冲寄存器,用于寄存该节点接收到的数据。
在一些实施例中,第一节点层210中的每个节点用于对该节点相对应的至少一个存储单元中任一存储单元进行数据读取和数据写入,其中,每个节点相应的至少一个存储单元可以构成一个存储区块,所有存储区块可以构成一个存储阵列。其中,每个存储区块中的至少一个存储单元具有相同的列地址以及各不相同的行地址。
如图2所示,第一节点211和第二节点212分别用于对存储区块230和存储区块240中每个存储单元进行数据的读取和写入。第一节点211和第二节点212中的每个节点分别与第三节点221和第四节点222连接以形成第一级网络,第一级网络中包括多条数据通路,存储于存储区块230、存储区块240中的任意一个数据可以经由该第一级网络中的某一条数据通路被存储至存储区块230或存储区块240中的任意存储单元中。
在一个示例中,目标数据的源存储单元231位于存储区块230中,目标存储单元241位于存储区块240中,响应于接收到用于对目标数据进行转存的指令,目标数据可以由第一节点211从源存储单元231中读取出来,并经过“第一节点211→第四节点222→第二节点212”这一第一数据通路,被存储至目标存储单元241中。其中,上述指令中可以包括目标数据的源存储单元和目标存储单元的地址信息,并且,上述第一数据通路以及该通路中每个节点是数据传输方向均基于上述源存储单元和目标存储单元的地址信息而确定。
由此,通过上述数据传输网络,可以实现对于两个存储区块中数据的整形操作。芯片中的相关控制器仅需基于数据整形指令,获取每个目标数据的目标地址和源地址,即可基于上述数据传输网络进行相应数据的整形操作,从而无需布置额外的数据整形单元,节省了芯片面积,降低了硬件设计的复杂度,降低了功耗损失。
图4示出了根据本公开的示例性实施例的数据传输网络的结构示意图。
在一些实施例中,如图4所示,为实现更多存储区块之间的数据传输,提供了一种数据传输网络400,其中,第一节点层410和第二节点层420之间可以包括多个第一级网络,第一节点层410和第二节点层420中的每个节点用于多个第一级网络中的一者(也即,每个节点仅用于构成一个第一级网络,不重复利用),多个第一级网络包括第一网络401和第二网络402。
数据传输网络400还可以包括:第三节点层430,第三节点层430包括第一节点组431和第二节点组432,第一节点组431和第二节点组432用于对第一网络401和第二网络402进行交叉连接以形成第二级网络,其中,第一节点组431包括与第一网络401中第二节点层420的多个节点对应的多个第五节点,第二节点组432包括与第二网络402中第二节点层420的多个节点对应的多个第六节点,交叉连接包括:将第一网络401中第二节点层420的多个节点分别与多个第五节点连接,并且分别与多个第六节点连接;以及将第二网络402中第二节点层420的多个节点分别与多个第五节点连接,并且分别与多个第六节点连接。
也即,对如上所述的两个第一级网络,第一网络401和第二网络402通过第三节点层430中的相应节点进行交叉连接。具体而言,可以将第一网络401中第二节点层420的多个节点(第三节点421和第四节点422)分别与多个第五节点(节点431-1、节点431-2)连接,同时,将第三节点421和第四节点422分别与多个第六节点(节点432-1、节点432-2)连接;类似的,将第二网络402中第二节点层420的多个节点(第三节点423和第四节点424)与上述第五节点和第六节点进行相应连接,从而构成第二级网络。
第二级网络中包括多条数据通路,存储于存储区块440、存储区块450、存储区块460、存储区块470中的任意一个数据可以经由该第二级网络404中的某一条数据通路被存储至存储区块440-存储区块470中任一存储区块的任意存储单元中。
在一个示例中,目标数据的源存储单元471位于存储区块470中,目标存储单元444位于存储区块440中,响应于接收到用于对目标数据进行转存的指令,目标数据可以由第二节点414从源存储单元471中读取出来,并经过“第二节点414→第三节点423→节点431-1→第三节点421→第一节点411”这一第二数据通路,被存储至目标存储单元444中。其中,上述指令中可以包括目标数据的源存储单元和目标存储单元的地址信息,并且,上述第一数据通路以及该通路中每个节点是数据传输方向均基于上述源存储单元和目标存储单元的地址信息而确定。
由此,当源存储单元和目标存储单元分别是不同第一级网络对应的存储单元时,通过利用第一级网络再上一层的节点,进行两个第一级网络之间的数据互联,从而使得数据能够在更多存储区块之间进行传输,使该网络能够支持更高维度矩阵的数据整形操作。
在一些实施例中,数据传输网络还可以包括:多个节点层,多个节点层包括第四节点层,第四节点层包括第三节点组和第四节点组,第三节点组和第四节点组用于对第三网络和第四网络进行交叉连接,第三网络和第四网络为第三节点组和第四节点组分别对应的下级网络。
由此,通过对数据传输网络进一步扩展,能够使该网络用于更高维度的数据整形中。
图5示出了根据本公开的示例性实施例的数据传输网络的结构示意图。
在一些示例性实施例中,为进一步对上述数据传输网络进行扩展,可以在第三节点层上进一步增加一个节点层520,则如上所述的两个第二级网络(网络511和网络512)即为该节点层520的下级网络。该节点层520中可以包括第三节点组521和第四节点组522,每组中的多个节点分别与网络511和网络512中的最高层数的节点(也即,每个第二级网络中第三节点层的节点)进行与上述类似的交叉连接,从而获得一个能够用于更高维度数据整形的数据传输矩阵。
数据整形操作往往处理较高维度的数据,例如对几百维的矩阵进行矩阵转置等。可以基于与上述类似的交叉连接的方法,进一步扩大数据传输网络的规模,从而使数据传输网络能够满足数据处理的需求。图6示出了根据本公开的示例性实施例的数据传输网络的结构示意图。如图6所示,该数据传输网络600例如可以实现32×32维矩阵的转置等整形操作。
上述网络中,由于大部分节点均是具有两路输入和两路输出,因此,当与节点相连的两个节点同时向该节点传输数据时,则会产生数据冲突。从而导致性能损失。
在一些实施例中,数据传输网络中的每个节点可以包括仲裁器和多个缓冲寄存器,仲裁器用于在多个缓冲寄存器中的至少二者中寄存有数据的情况下,确定该节点在下一时刻所要输出的数据。
由此,通过在每个节点中设置仲裁器,能够一定程度上解决数据冲突的问题。
图7示出了根据本公开的示例性实施例的数据传输网络中的节点的结构示意图。
如图7所示,节点内部例如可以包括缓冲寄存器701、缓冲寄存器702以及仲裁器703,当该节点的两个上游节点在同一时刻向该节点传输数据时,可以分别将两个数据寄存在缓冲寄存器701、缓冲寄存器702中,并基于仲裁器703确定在下一时刻该节点所要输出的数据,其中,仲裁器703具有两路输出,分别对应该节点的两个数据输出方向。其中,仲裁器例如可以为一个多路复用器。
为了进一步减少传输损失,可以进一步将仲裁窗口扩大。在一些实施例中,数据传输网络中的每个节点可以包括多个一级仲裁器和两个二级仲裁器,多个一级仲裁器中的每个一级仲裁器分别与多个缓冲寄存器相连,并且每个一级仲裁器分别与两个二级仲裁器相连,两个二级仲裁器的数据输出方向分别对应该节点的两个数据输出方向,并且其中,多个一级仲裁器用于在多个一级仲裁器的相应缓冲寄存器中的至少二者中寄存有数据的情况下,基于每个数据的数据传输方向,确定多个一级仲裁器中每一者在下一时刻输出的数据以及该数据的输出方向,其中,数据传输方向基于该数据的目标存储单元的地址信息确定;并且,两个二级仲裁器中的每个二级仲裁器用于执行下述操作:在下一时刻该二级仲裁器接收到一个数据的情况下,将该数据依据相应的数据输出方向传输给下一节点;以及在下一时刻该二级仲裁器接收到多个数据的情况下,在多个数据中选择第一数据,以将第一数据依据相应的数据输出方向传输给下一节点。
由此,通过进一步扩大仲裁窗口,从而进一步降低数据冲突的概率,提升数据传输质量和效率。
图8示出了根据本公开的示例性实施例的数据传输网络中的节点的结构示意图。
在一些示例性实施例中,节点内部例如可以包括一级仲裁器821和一级仲裁器822,其中,一级仲裁器821分别与缓冲寄存器811、缓冲寄存器812连接,一级仲裁器822分别与缓冲寄存器813和缓冲寄存器814连接。同时,节点内部还包括二级仲裁器831和二级仲裁器832,一级仲裁器821和一级仲裁器822中的每一者分别与二级仲裁器831和二级仲裁器832连接,并且,二级仲裁器831和二级仲裁器832的数据输出方向对应于该节点的数据输出方向,也即两个二级仲裁器可以分别将数据输出给该节点所连接的两个下游节点。
在实际数据传输过程中,可能存在某一时刻上述四个缓冲寄存器中均寄存有数据的情况,则在下一时刻,可以首先基于每个数据的数据传输方向(由该数据的目标存储地址决定),通过一级仲裁器决定将哪个数据传送给相应的二级仲裁器,例如,缓冲寄存器811、缓冲寄存器812、缓冲寄存器813和缓冲寄存器814中的数据的传输方向分别为方向801、方向802、方向801和方向801,则一级仲裁器822可以选择缓冲寄存器813和缓冲寄存器814中任一数据传输给二级仲裁器831,以基于二级仲裁器831将该数据输送给相应的下游节点;而一级仲裁器821则可以基于每个数据的传输方向,选择不会引起数据冲突(也即,两个一级仲裁器将数据同时发送给相同的二级仲裁器)的数据进行传输,对于本示例,该一级仲裁器821则可以选择缓冲寄存器812中的数据(传输方向为方向802)传输给二级仲裁器832,以基于二级仲裁器832将该数据输送给相应的下游节点。由此,即可避免数据冲突的产生,提升数据传输网络的整体性能。
在一些情况下,当两个一级仲裁器不可避免的将数据同时发送给同一二级仲裁器时,则可以通过二级仲裁器选择其中一个数据继续向下传输,未成功传输的数据可以继续寄存于相应寄存器中,从而避免数据错误和丢失。
由此可以看出,对于上述示例性实施例中的网络节点而言,只有在四个缓冲寄存器中的数据的传输方向均相同时,才会造成一定的性能损失,其发生概率仅占所有情况中的1/16;并且,在实际应用场景中,每个节点在绝大多数的情况下同一时刻仅会接收到1-2个数据,因此,上述实施例中的网络节点结构能够有效的避免数据冲突的发生,从而提升数据传输网络的整体性能。
图9示出了根据本公开的示例性实施例的数据处理方法900的流程图。
在一些实施例中,如图9所示,方法900包括:
步骤901、响应于接收到第一指令,使目标数据从源存储单元经由上述数据传输网络转存至目标存储单元,其中,第一指令包括源存储单元的地址信息和目标存储单元的地址信息。
由此,通过应用如上的数据传输网络,仅需确定每个数据的源地址以及数据整形后的目的地址,即可基于该数据传输网络完成数据整形,从而避免数据整形占用过多带宽,同时在硬件实现中简化布线,降低功耗损失。
图10示出了根据本公开的示例性实施例的数据处理方法1000的流程图。
在一些实施例中,如图10所示,方法1000包括:
步骤1001、响应于接收到第二指令,使至少一个目标数据中的每个目标数据从相应的源存储单元经由数据传输网络传输至计算单元中的相应寄存器中,以使计算单元进行相应计算后,将该目标数据相应的计算结果经由数据传输网络存储至相应的目标存储单元中,其中,第二指令包括至少一个目标数据中的每个目标数据相应的源存储单元的地址信息和目标存储单元的地址信息。
相关技术中,数据整形与并行计算是串行执行的,也即数据整形模块将数据从静态存储空间中读取出来,再将整形后的数据存储回静态存储空间中,随后计算单元再对整形后的数据进行读取,并将计算结果相应的存储回静态存储空间。这种流水线的操作所需时间较长,并且,数据整形模块和计算单元对于静态存储空间的访问将会占用大量的访存带宽,影响其他模块的访问带宽,进而影响芯片的整体性能。
图11示出了根据本公开的示例性实施例的数据处理装置的结构示意图。
根据一些示例性实施例,如图11所示,上述数据传输网络可以被设置于静态存储器和计算单元之间,从而使得计算单元在获取计算指令(第二指令)中的每个目标数据及其相应的源存储单元和目标存储单元的地址信息,即可将相应地址中的数据经由该数据传输网络中的相应数据通路读取至计算单元中的相应寄存器中,以基于该数据进行计算,并将计算结果直接保存至相应的目标存储单元中。
由此,将上述数据传输网络应用于计算过程中,计算单元获取计算指令,从而获取每个计算需要的数据的源地址和目的地址,能够使计算单元直接获取到经过整形后的数据,并将计算结果存储在相应存储地址中,从而能够降低数据整形对访存带宽的占用,节省模块同步的时间,提升数据处理的整体效率。
为进一步确保数据传输性能,避免数据冲突的发生,在一些实施例中,上述数据处理方法还可以包括:接收第三指令,第三指令用于对多个目标数据进行数据整形,第三指令包括多个目标数据中每个目标数据的源存储单元的地址信息,多个目标数据分别存储于第一存储区块和第二存储区块中;以及解析第三指令,以确定目标数据读取顺序,目标数据读取顺序用于使第一节点和第二节点按照预设规则从相应存储区块中读取数据,预设规则包括在同一时刻,第一节点读取的数据与第二节点读取的数据具有不同的行地址。
其中,数据传输网络包括第一节点和第二节点,第一节点和第二节点分别对应存储阵列中的第一存储区块和第二存储区块,第一存储区块和第二存储区块中的每个存储区块包括至少一个存储单元,每个存储区块中的每个存储单元的列地址相同而行地址各不相同,第一节点和第二节点中的每个节点用于对该节点相对应的存储区块中的任一存储单元进行数据读取和数据写入。
图12A示出了根据本公开的示例性实施例的数据读取和写入的示意图。图12B示出了根据本公开的示例性实施例的数据传输路线示意图。
在一些示例性实施例中,如图12A所示,对于一个4×4的矩阵转置操作而言,每次第一节点层中的各节点在相同时刻读取相应存储区块中的数据时,选择不同行地址的数据进行读取,例如分别读取存储区块1210中的存储单元1212(存储数据为5)、存储区块1220中的存储单元1221(存储数据为2)、存储区块1230中的存储单元1234(存储数据为15)以及存储区块1240中的存储单元1243(存储数据为12)中的数据,该四个数据的数据传输路线即可如图12B所示,其中,四条数据传输路线在任何一个节点处均不会发生数据冲突的情况。由此,能够通过确定数据读取的顺序,从而避免数据冲突的问题。
图13示出了根据本公开示例性实施例的数据处理装置1300的结构框图。
在一些实施例中,如图13所示,数据处理装置1300包括:转存单元1310,被配置为响应于接收到第一指令,使目标数据从源存储单元经由上述数据传输网络转存至目标存储单元,其中,第一指令包括源存储单元的地址信息和目标存储单元的地址信息。
数据处理装置1300的单元1310的操作与前面描述的方法900中步骤S901的操作类似,在此不作赘述。
在一些实施例中,数据处理装置还可以包括:传输单元,被配置为响应于接收到第二指令,使至少一个目标数据中的每个目标数据从相应的源存储单元经由数据传输网络传输至计算单元中的相应寄存器中,以使计算单元进行相应计算后,将该目标数据相应的计算结果经由数据传输网络存储至相应的目标存储单元中,其中,第二指令包括至少一个目标数据中的每个目标数据相应的源存储单元的地址信息和目标存储单元的地址信息。
在一些实施例中,数据传输网络包括第一节点和第二节点,第一节点和第二节点分别对应存储阵列中的第一存储区块和第二存储区块,第一存储区块和第二存储区块中的每个存储区块包括至少一个存储单元,每个存储区块中的每个存储单元的列地址相同而行地址各不相同,第一节点和第二节点中的每个节点用于对该节点相对应的存储区块中的任一存储单元进行数据读取和数据写入。
数据处理装置还可以包括:接收单元,被配置为接收第三指令,第三指令用于对多个目标数据进行数据整形,第三指令包括多个目标数据中每个目标数据的源存储单元的地址信息,多个目标数据分别存储于第一存储区块和第二存储区块中;以及解析单元,被配置为解析第三指令,以使第一节点和第二节点在同一时刻按照预设规则从相应存储区块中读取数据,预设规则包括在同一时刻,第一节点读取的数据与第二节点读取的数据具有不同的行地址。
根据本公开的实施例,还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
参考图14,现将描述可以作为本公开的服务器或客户端的电子设备1400的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图14所示,电子设备1400包括计算单元1401,其可以根据存储在只读存储器(ROM)1402中的计算机程序或者从存储单元1408加载到随机访问存储器(RAM)1403中的计算机程序,来执行各种适当的动作和处理。在RAM 1403中,还可存储电子设备1400操作所需的各种程序和数据。计算单元1401、ROM 1402以及RAM 1403通过总线1404彼此相连。输入/输出(I/O)接口1405也连接至总线1404。
电子设备1400中的多个部件连接至I/O接口1405,包括:输入单元1406、输出单元1407、存储单元1408以及通信单元1409。输入单元1406可以是能向电子设备1400输入信息的任何类型的设备,输入单元1406可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入,并且可以包括但不限于鼠标、键盘、触摸屏、轨迹板、轨迹球、操作杆、麦克风和/或遥控器。输出单元1407可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元1408可以包括但不限于磁盘、光盘。通信单元1409允许电子设备1400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙TM设备、802.11设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元1401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1401的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1401执行上文所描述的各个方法和处理,例如方法900。例如,在一些实施例中,方法900可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1408。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1402和/或通信单元1409而被载入和/或安装到电子设备1400上。当计算机程序加载到RAM 1403并由计算单元1401执行时,可以执行上文描述的方法900的一个或多个步骤。备选地,在其他实施例中,计算单元1401可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法900。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行、也可以顺序地或以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
虽然已经参照附图描述了本公开的实施例或示例,但应理解,上述的方法、系统和设备仅仅是示例性的实施例或示例,本发明的范围并不由这些实施例或示例限制,而是仅由授权后的权利要求书及其等同范围来限定。实施例或示例中的各种要素可以被省略或者可由其等同要素替代。此外,可以通过不同于本公开中描述的次序来执行各步骤。进一步地,可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进,在此描述的很多要素可以由本公开之后出现的等同要素进行替换。
Claims (15)
1.一种数据传输网络,包括:
第一节点层,所述第一节点层中的每个节点用于对该节点相对应的至少一个存储单元中任一存储单元进行数据读取和数据写入,所述第一节点层包括第一节点和第二节点;以及
第二节点层,所述第二节点层包括第三节点和第四节点,所述第一节点和所述第二节点中的每个节点分别与所述第三节点和所述第四节点连接以形成第一级网络,以使目标数据可以经由所述第一级网络中的第一数据通路由源存储单元转存至目标存储单元中,其中,所述源存储单元和所述目标存储单元位于所述第一节点和所述第二节点相应的多个存储单元中。
2.根据权利要求1所述的网络,其中,所述第一节点层和所述第二节点层之间包括多个第一级网络,所述第一节点层和所述第二节点层中的每个节点用于所述多个第一级网络中的一者,所述多个第一级网络包括第一网络和第二网络,所述网络还包括:
第三节点层,所述第三节点层包括第一节点组和第二节点组,所述第一节点组和所述第二节点组用于对所述第一网络和所述第二网络进行交叉连接以形成第二级网络,其中,所述第一节点组包括与第一网络中第二节点层的多个节点对应的多个第五节点,所述第二节点组包括与第二网络中第二节点层的多个节点对应的多个第六节点,所述交叉连接包括:
将所述第一网络中第二节点层的多个节点分别与所述多个第五节点连接,并且分别与所述多个第六节点连接;以及
将所述第二网络中第二节点层的多个节点分别与所述多个第五节点连接,并且分别与所述多个第六节点连接。
3.根据权利要求2所述的网络,所述网络还包括:
多个节点层,所述多个节点层包括第四节点层,所述第四节点层包括第三节点组和第四节点组,所述第三节点组和所述第四节点组用于对第三网络和第四网络进行所述交叉连接,所述第三网络和所述第四网络为所述第三节点组和所述第四节点组分别对应的下级网络。
4.根据权利要求1-3中任一项所述的网络,所述数据传输网络中的每个节点包括仲裁器和多个缓冲寄存器,所述仲裁器用于在所述多个缓冲寄存器中的至少二者中寄存有数据的情况下,确定该节点在下一时刻所要输出的数据。
5.根据权利要求1-3中任一项所述的网络,所述数据传输网络中的每个节点包括多个一级仲裁器和两个二级仲裁器,所述多个一级仲裁器中的每个一级仲裁器分别与多个缓冲寄存器相连,并且每个一级仲裁器分别与所述两个二级仲裁器相连,所述两个二级仲裁器的数据输出方向分别对应该节点的两个数据输出方向,并且其中,
所述多个一级仲裁器用于在所述多个一级仲裁器的相应缓冲寄存器中的至少二者中寄存有数据的情况下,基于每个数据的数据传输方向,确定所述多个一级仲裁器中每一者在下一时刻输出的数据以及该数据的输出方向,其中,所述数据传输方向基于该数据的目标存储单元的地址信息确定;并且,
所述两个二级仲裁器中的每个二级仲裁器用于执行下述操作:
在所述下一时刻该二级仲裁器接收到一个数据的情况下,将该数据依据相应的数据输出方向传输给下一节点;以及
在所述下一时刻该二级仲裁器接收到多个数据的情况下,在所述多个数据中选择第一数据,以将所述第一数据依据相应的数据输出方向传输给下一节点。
6.一种数据处理方法,所述方法包括:
响应于接收到第一指令,使目标数据从源存储单元经由如权利要求1-5中任一项所述的数据传输网络转存至目标存储单元,其中,所述第一指令包括所述源存储单元的地址信息和所述目标存储单元的地址信息。
7.根据权利要求6所述的方法,还包括:
响应于接收到第二指令,使至少一个目标数据中的每个目标数据从相应的源存储单元经由所述数据传输网络传输至计算单元中的相应寄存器中,以使所述计算单元进行相应计算后,将该目标数据相应的计算结果经由所述数据传输网络存储至相应的目标存储单元中,其中,所述第二指令包括所述至少一个目标数据中的每个目标数据相应的源存储单元的地址信息和目标存储单元的地址信息。
8.根据权利要求6或7所述的方法,所述数据传输网络包括第一节点和第二节点,所述第一节点和所述第二节点分别对应存储阵列中的第一存储区块和第二存储区块,所述第一存储区块和所述第二存储区块中的每个存储区块包括至少一个存储单元,每个存储区块中的每个存储单元的列地址相同而行地址各不相同,所述第一节点和所述第二节点中的每个节点用于对该节点相对应的存储区块中的任一存储单元进行数据读取和数据写入,所述方法还包括:
接收第三指令,所述第三指令用于对多个目标数据进行数据整形,所述第三指令包括所述多个目标数据中每个目标数据的源存储单元的地址信息,所述多个目标数据分别存储于所述第一存储区块和所述第二存储区块中;以及
解析所述第三指令,以确定目标数据读取顺序,所述目标数据读取顺序用于使所述第一节点和所述第二节点按照预设规则从相应存储区块中读取数据,所述预设规则包括在同一时刻,所述第一节点读取的数据与所述第二节点读取的数据具有不同的行地址。
9.一种数据处理装置,所述装置包括:
转存单元,被配置为响应于接收到第一指令,使目标数据从源存储单元经由如权利要求1-5中任一项所述的数据传输网络转存至目标存储单元,其中,所述第一指令包括所述源存储单元的地址信息和所述目标存储单元的地址信息。
10.根据权利要求9所述的装置,还包括:
传输单元,被配置为响应于接收到第二指令,使至少一个目标数据中的每个目标数据从相应的源存储单元经由所述数据传输网络传输至计算单元中的相应寄存器中,以使所述计算单元进行相应计算后,将该目标数据相应的计算结果经由所述数据传输网络存储至相应的目标存储单元中,其中,所述第二指令包括所述至少一个目标数据中的每个目标数据相应的源存储单元的地址信息和目标存储单元的地址信息。
11.根据权利要求9或10所述的装置,所述数据传输网络包括第一节点和第二节点,所述第一节点和所述第二节点分别对应存储阵列中的第一存储区块和第二存储区块,所述第一存储区块和所述第二存储区块中的每个存储区块包括至少一个存储单元,每个存储区块中的每个存储单元的列地址相同而行地址各不相同,所述第一节点和所述第二节点中的每个节点用于对该节点相对应的存储区块中的任一存储单元进行数据读取和数据写入,所述装置还包括:
接收单元,被配置为接收第三指令,所述第三指令用于对多个目标数据进行数据整形,所述第三指令包括所述多个目标数据中每个目标数据的源存储单元的地址信息,所述多个目标数据分别存储于所述第一存储区块和所述第二存储区块中;以及
解析单元,被配置为解析所述第三指令,以使所述第一节点和所述第二节点在同一时刻按照预设规则从相应存储区块中读取数据,所述预设规则包括在同一时刻,所述第一节点读取的数据与所述第二节点读取的数据具有不同的行地址。
12.一种芯片,包括下述中的至少一者:
如权利要求1-5中任一项所述的数据传输网络;以及
如权利要求9-11中任一项所述的装置。
13.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求6-8中任一项所述的方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求6-8中任一项所述的方法。
15.一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现权利要求6-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211459104.XA CN115952828A (zh) | 2022-11-21 | 2022-11-21 | 数据传输网络、数据处理方法、装置及芯片 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211459104.XA CN115952828A (zh) | 2022-11-21 | 2022-11-21 | 数据传输网络、数据处理方法、装置及芯片 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115952828A true CN115952828A (zh) | 2023-04-11 |
Family
ID=87296116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211459104.XA Pending CN115952828A (zh) | 2022-11-21 | 2022-11-21 | 数据传输网络、数据处理方法、装置及芯片 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115952828A (zh) |
-
2022
- 2022-11-21 CN CN202211459104.XA patent/CN115952828A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113986788B (zh) | 数据处理方法和装置、芯片、电子设备及介质 | |
CN114743196B (zh) | 文本识别的方法及装置、神经网络的训练方法 | |
WO2023231350A1 (zh) | 利用整数规划求解器实现的任务处理方法、设备和介质 | |
CN116028605B (zh) | 逻辑表达式生成方法、模型训练方法、装置及介质 | |
CN111966361A (zh) | 用于确定待部署模型的方法、装置、设备及其存储介质 | |
CN112784985A (zh) | 神经网络模型的训练方法及装置、图像识别方法及装置 | |
CN114861910A (zh) | 神经网络模型的压缩方法及装置、设备和介质 | |
CN113688069B (zh) | 数据处理方法、装置、电子设备及介质 | |
CN116029346A (zh) | 用于深度学习模型推理的方法、装置、设备和介质 | |
CN115952828A (zh) | 数据传输网络、数据处理方法、装置及芯片 | |
CN115797660A (zh) | 图像检测方法、装置、电子设备和存储介质 | |
CN115600646A (zh) | 语言模型的训练方法、装置、介质及设备 | |
CN115170887A (zh) | 目标检测模型训练方法、目标检测方法及其装置 | |
CN114429678A (zh) | 模型训练方法及装置、电子设备和介质 | |
CN112784912A (zh) | 图像识别方法及装置、神经网络模型的训练方法及装置 | |
CN114117046B (zh) | 数据处理方法、装置、电子设备及介质 | |
CN114860836B (zh) | 失效兴趣点的挖掘方法及装置、设备和介质 | |
KR20240077474A (ko) | 데이터 전송 방법, 장치, 기기 및 매체 | |
CN114548261A (zh) | 数据处理方法、装置、电子设备以及存储介质 | |
CN114491319A (zh) | 信息排序方法及装置、电子设备和存储介质 | |
CN113836021A (zh) | 测试方法、装置、电子设备及介质 | |
CN115455244A (zh) | 图数据的处理方法、装置、设备和介质 | |
CN116129245A (zh) | 图像反卷积方法及装置、设备和介质 | |
CN113420227A (zh) | 点击率预估模型的训练方法、预估点击率的方法、装置 | |
CN116860328A (zh) | 生成指令数据的方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: CW District, 4th floor, building 1, No. 10, Shangdi 10th Street, Haidian District, Beijing 100101 Applicant after: Kunlun core (Beijing) Technology Co.,Ltd. Address before: Baidu building, No. 10, Shangdi 10th Street, Haidian District, Beijing 100086 Applicant before: Kunlun core (Beijing) Technology Co.,Ltd. |