CN109542830A - 一种数据处理系统及数据处理方法 - Google Patents

一种数据处理系统及数据处理方法 Download PDF

Info

Publication number
CN109542830A
CN109542830A CN201811391431.XA CN201811391431A CN109542830A CN 109542830 A CN109542830 A CN 109542830A CN 201811391431 A CN201811391431 A CN 201811391431A CN 109542830 A CN109542830 A CN 109542830A
Authority
CN
China
Prior art keywords
processor
data
memory
processors
processing system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811391431.XA
Other languages
English (en)
Other versions
CN109542830B (zh
Inventor
冯杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ling Xi Technology Co Ltd
Beijing Lynxi Technology Co Ltd
Original Assignee
Beijing Ling Xi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ling Xi Technology Co Ltd filed Critical Beijing Ling Xi Technology Co Ltd
Priority to CN201811391431.XA priority Critical patent/CN109542830B/zh
Publication of CN109542830A publication Critical patent/CN109542830A/zh
Priority to PCT/CN2019/116653 priority patent/WO2020103706A1/zh
Application granted granted Critical
Publication of CN109542830B publication Critical patent/CN109542830B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/167Interprocessor communication using a common memory, e.g. mailbox

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)
  • Advance Control (AREA)

Abstract

本发明为一种数据处理系统及数据处理方法,公开一种高算力低功耗处理方法、系统及设备。所述处理系统包括:存储器和若干个处理器,每个所述处理器均具有运算功能和控制功能;任意处理器分别与其它任一处理器和所述存储器相连;所述处理器可以为同构,也可以为异构;所述处理器包括路由处理器,用于接收数据源发送的数据和发送数据到数据目的地;神经网络处理器,用于执行神经网络运算算法;中央处理器,用于控制神经网络处理器进行运算。通过对处理器灵活的配备,既保持对各种算法极高的支持度,又能高效的发挥有效算力,是一种在同等工艺条件下节省功耗的高算力低功耗芯片架构。

Description

一种数据处理系统及数据处理方法
技术领域
本发明涉及人工智能芯片领域,尤其涉及一种高算力低功耗的数据处理系统。
背景技术
当今时代,人工智能技术日新月异,澎湃发展,从各方面影响着人们的生产和生活,推动着世界的发展和进步。数据、算法和算力,被喻为推动人工智能快速发展的三大要素。其中,算力是处理数据和运行算法的核心动力。众所周知,算力是由芯片提供,所以如何在花费适当代价的前提下,提升芯片应对各种人工智能的有效算力,并且节省功耗,成为人工智能芯片领域专家们共同努力的目标。
当前,芯片处理器(如图1所示实框内结构)一般主要由运算器和控制器组成,存储器是外置的。当处理器开始计算时,由控制器通知输入设备将输入数据传送到存储器中;然后通知运算器到存储器中取数,进行运算,且将运算结果存入存储器中;最后通知输出设备接收输出结果。其存在的缺点有:运算过程中需要用到的数据,均依赖于外部存储器,从而算力受存储带宽限制而无法有效的提高,成为传统架构最大的瓶颈之一;运算器能单独或者组合执行各种运算,但是无法实现控制等功能;控制器集中控制所有模块,效率低;运算并行度低,通常需要增加任务的流水级数以提高运算单元的利用率,增加了电路的复杂度,对片上存储器的管理成为算力发挥的难点和瓶颈。
另外,现有技术中也有采用存储器内置的方式,在一个处理器(如图2所示实框内结构)中包含有控制器、运算器和存储器。当核开始计算时,由控制器通知输入设备将输入数据传送到存储器中;然后通知运算器到存储器中取数,进行运算,且将运算结果存入存储器中;最后通知输出设备接收输出结果。这种处理器一般用于多核或者众核架构,所以运算器的功能一般比较简单,不能完成复杂的运算功能,灵活性受限;运算器仅能完成简单的运算功能,无法实现控制等功能;控制器集中控制所有模块,效率低。
本发明提供一种既保持对各种算法极高的支持度,又能高效的发挥有效算力,还能在同等工艺条件下节省功耗的高算力低功耗芯片架构。
发明内容
本发明提供了一种处理系统,所述处理系统包括:存储器和若干个处理器,每个所述处理器均具有运算功能和控制功能;所述若干个处理器中的每一个处理器分别与所述若干个处理器中的其他处理器和所述存储器相连;所述若干个处理器中的第一处理器用于接收数据源发送的数据和发送数据到数据目的地。
在本发明中,处理器同时具有运算功能和控制功能,即处理器可以根据需求进行相应的运算,也可以控制其他处理器进行相应的运算。处理器之间相互连接,既可以传输数据,也可以传输控制信息,实现了处理器之间相互配合,具有极高的灵活度。若干处理器均和内部存储器连接,共用一个内部存储器,即可以从处理系统中内置的存储器中读取运行所需的指令和参数,节省了传统架构需要从外面拿数浪费的功耗,同时也节省了从外部读取数据的时间,能把充分发挥处理器的算力。
根据本发明的一个实施方案,所述处理系统中所述若干个处理器为相同结构。
根据本发明的一个实施方案,所述处理系统中所述若干个处理器为不同结构。
根据本发明的一个实施方案,所述处理系统中所述若干个处理器中的第一处理器为路由处理器。
根据本发明的一个实施方案,所述处理系统中所述若干个处理器包括神经网络处理器和中央处理器。
根据本发明的一个实施方案,所述处理系统中所述神经网络处理器执行神经网络算法的运算。
根据本发明的一个实施方案,所述处理系统中所述神经网络算法包括:人工神经网络算法或神经动力学算法。
根据本发明的一个实施方案,所述处理系统中所述中央处理器选包括:ARM、X86或RISCV。
根据本发明的一个实施方案,所述处理系统中所述存储器中存有所述若干个处理器中任意一个处理器的运行指令和需要用于计算的参数。
根据本发明的一个实施方案,所述处理系统中所述若干个处理器执行相同功能或执行不同功能。
本发明提供了一种众核系统,其特征在于:包括外部处理系统,和上述的处理系统;
所述外部处理系统控制所述处理系统执行相应的操作。
本发明提供了一种数据处理方法,用于包括若干个处理器和存储器的处理系统中,所述数据处理方法包括:
所述若干个处理器中的第一处理器接收数据源发送的数据,对所述数据进行第一数据处理并将所述第一数据处理后的第一数据处理结果发送至第二处理器;
所述若干个处理器中的所述第二处理器对所述第一数据结果进行第二数据处理;
所述第一处理器接收所述第二数据处理的第二数据处理结果,将所述第二数据处理结果发送至数据目的地;
所述若干个处理器中的第三处理器控制各处理器运行,所述第三处理器向所述第一处理器和所述第二处理器发送指令控制所述第一处理器和所述第二处理器的运行;
所述若干个处理器的至少一个处理器读取所述存储器存储的数据和/或向所述存储器中写入所述至少一个处理器的数据处理结果,所述若干个处理器的所述至少一个处理器读取所述存储器中的运行指令及参数,进行相应的运算。
根据本发明的一个实施方案,所述数据处理方法包括:
所述第一处理器将所述第一数据处理结果存入所述存储器中;
所述第二处理器从所述存储器中读取经所述第一数据处理结果,进行所述第二数据处理。
根据本发明的一个实施方案,所述数据处理方法包括:
所述第一处理器将所述第一数据处理结果直接发送给所述第二处理器,进行所述第二数据处理。
根据本发明的一个实施方案,所述数据处理方法中,所述第二处理器将所述第二数据处理结果直接传输给所述第一处理器,所述第一处理器将所述第二数据处理结果传输给所述数据目的地。
根据本发明的一个实施方案,所述数据处理方法中,所述第二处理器将所述第二数据处理结果存储于所述存储器,所述第一处理器从所述存储器中读取所述第二数据处理结果,经所述第二数据处理结果传输给所述数据目的地。
本发明提供了一种运算处理设备,所述运算处理设备包括:N个处理器;所述N个处理器共用的存储器;
所述存储器上存储有计算机程序指令,所述计算机程序指令被执行时,所述N个处理器执行上述数据处理方法任一所述方法。
本发明提供了一种计算机可读写存储介质,其上存储有计算机程序指令,所述计算机程序指令被执行时,处理器执行如上述数据处理方法任一所述的方法。
本发明提供了一种众核处理设备,所述众核处理设备包括:外部处理器;N个处理器;
所述外部存储器存储计算机程序指令,所述计算机程序指令被执行时,所述N个处理器执行所述上述数据处理方法任一项所述的方法。
本发明所述若干,为1以上自然数。
本发明去除了传统架构的外部存储带宽限制,核内有多个处理器,各处理器均有运算功能和控制功能。各处理器具有高度的独立性,且能并行运行,能同时处理不同的任务,从而大大提高了核的有效算力;核内各处理器的结构,可以是同构的,也可以是异构的,所以核有极高的灵活度;核内处理器异构时,可以有专门的处理器或者电路进行数据的输入输出控制;核内各处理器之间可以直接进行数据交换;核内各处理器之间可以互相控制,互相配合,完成复杂的处理功能。
附图说明
图1示出了本领域现有技术1的示意图;
图2示出了本领域现有技术2的示意图;
图3示出了本发明结构示意图;
图4示出了本发明一个具体实施例结构示意图;
图5示出了本发明的一个具体实施例在多核网络中应用的示意图。
具体实施方式
以下基于实施例对本申请进行描述,但是本申请并不仅仅限于这些实施例。在下文对本申请的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本申请。为了避免混淆本申请的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。
此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。
除非上下文明确要求,否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
在本申请的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,表示多个中的任意一个,而不能理解为指示或暗示相对重要性,也不代表顺序。此外,在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
以下采用实施例和附图来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。
实施例1
本发明实施例的处理系统为一个芯片结构,例如可以作为单核处理系统,可以为众核系统中的一个核。
如图3所示,本发明的处理系统括:多个处理器1-N,存储器;多个处理器1-N和存储器设置在同一块芯片上,多个处理器1-N共用一个存储器。
多个处理器1-N均具有基本运算和控制功能,且处理器1-N的物理位置可以互换。多个处理器1-N中的每一个处理器分别与多个处理器1-N中的其他处理器和所述存储器相连;多个处理器1-N可以是相同结构,也可以是不同结构;处理器1-N的功能可以相同也可以不同,例如,处理器可以作为数据路由处理器用于接收和发送数据,可以根据配置用于神经网络运算和/或数据处理,还可以根据配置作为中央处理器用于控制其他处理器,进行指令的执行和数据的运算。
存储器用于存储数据、各处理器的运行指令和用于计算的其他参数,这些参数和指令在芯片初始化时均已保存好。
多个处理器1-N可以分别读取存储器中对应的运行指令和计算参数,进行相应的运算。多个处理器1-N之间可以直接进行数据交换,进行相应的运算;
多个处理器1-N中可以将其中的一个处理器作为控制处理器,对其他处理器进行控制;多个处理器1-N之间也可以相互控制、相互配合,还可以对存储器进行控制。
多个处理器1-N中的至少一个处理器包括自用存储器。
根据本发明的一个实施方式,多个处理器1-N中的一个处理器可作为数据路由处理器,用于接收数据源发送的数据和/或指令、发送处理后的数据和/或指令至数据目的地。该处理器主要用于数据收发和计算,将从外部数据源收到的数据发送给其他处理器或发送给存储器,将从其他处理器接收到的处理完毕的数据结果发送到数据目的地,或从存储器中读取经其它处理器处理完毕的数据结果发送到数据目的地。
根据本发明的一个实施方式,多个处理器1-N中的部分处理器均可可以作为运算处理单元,用于执行数据的运算处理功能。该部分处理器可以为一个或多个,用于根据从存储器中读入的指令和计算参数,执行指令和参数对应的算法,以实现特定的功能。
根据本发明的一个实施方式,多个处理器1-N中的一个处理器可以作为中央控制处理器,用于控制其他处理器,协调数据的收发、存储。本发明的优点在于,单个核进行计算时,不和外部存储器进行数据交换,只使用芯片的内部存储器,算力不再受外部存储带宽的限制,消除了由于与外部存储器进行数据交换带来的功耗;核中有多个处理器,每个处理器都有运算电路和控制电路,有极高的自主性,所以各处理器可以独立互不干扰的并行工作;核中各处理器可以是同构的,也可以是异构的,能实现相同或者不同的任务;同构处理器上也可以执行不同的程序或指令,实现不同的功能。
本发明通过核内处理器的灵活配置,独立运行,大幅提高了核的有效算力;通过处理器的互相控制,互相配合,完成复杂的处理功能;包含了足够大的内部存储器,能满足计算时所需的参数或数据的存储需要,同时消除了与外部存储器数据交换带来的功耗,实现了低功耗、高算力的处理功能。
实施例2
如图4所示,本发明处理系统第一处理器可以为路由处理器,用于数据收发,能够实现数据/指令的接收和发送。第二处理器可以为神经网络处理器,用于执行神经网络算法的运算,其中神经网络处理器可以支持的神经网络算法包括人工神经网络算法或神经动力学算法等各种常用的神经网络算法,其中,人工神经网络算法例如CNN,神经动力学算法例如:SNN。本发明实施例可以包括多个第二处理器,根据计算需要,进行不同的神经网络运算,提高运算速度,也可以一个神经网络处理器同时支持多个神经网络算法。
第三处理器可以为通用中央处理器,也可以是具有基本运算和控制功能的其他处理器或电路。该中央处理器可以为ARM、X86、RISCV或者其他CPU。本发明实施例优选采用RISCV。
数据源将数据发送给路由处理器;路由处理器接收数据,进行相应的处理;路由处理器将处理后的数据存入存储器;中央处理器通知神经网络处理器进行计算;神经网络处理器从存储器读入数据和进行神经网络计算需要的参数,进行神经网络计算,计算完毕将计算结果存入存储器,且通知路由处理器计算已经完成;路由处理器将计算结果经过处理后发送给数据目的地。
在本实施例中,本发明应用于人工智能领域,通过多个不同构处理器的灵活组合应用和相互配合提高了处理系统的运行效率,通过多个运算处理器的应用,提高了在进行神经网络运算时的运算能力,处理器和芯片内的存储器进行数据传输,降低了运行功耗,实现了高算力,低功耗的处理功能。
实施例3
在现有技术的常用多核处理架构中,多个核可以是同构,也可以是异构,但多核中的单个核只有运算功能,或者只有控制功能,且多个核不管为同构还是异构,其数量有限,算力有限,灵活度有限。
本发明实施例为由多个实施例1和/或实施例2的处理系统构成的众核系统。众核系统中的每个核均采用本发明所述的处理系统,既每个核都由多个同构和/或异构处理器,还有存储器组成。每个处理器均具备运算和控制功能,即每个处理器既能并行独立工作,充分发挥算力,又能互相配合工作,灵活完成比较复杂的工作。多个采用本发明所述处理系统的单核构成的众核系统既有强大的算力,又有很高的算力发挥效率。
如图5所示,众核系统即由多个实施例1或2的处理系统构成,每个处理系统作为众核系统的一个核(Cn),通过NOC(Network On Chip)片上网络互联,组成多核或者众核芯片,以实现更强大的处理性能。
示例性方法
本发明提供了一种处理系统,所述处理系统包括:
第一处理器,第二处理器,第三处理器,存储器。
所述处理系统采用如下数据处理方法:
方法1
所述第一处理器接收数据源发送的数据,对所述数据进行第一数据处理,将经过第一数据处理后的第一数据处理结果存入存储器;从存储器读取经过第二数据处理后的第二数据处理结果,并将第二数据处理结果发送给数据目的地;所述第二处理器从所述存储器读取经过第一数据处理后的第一数据处理结果并进行第二数据处理,并将第二数据处理结果存入存储器;所述第三处理器向所述第一处理器和第二处理器发送指令控制所述第一处理器和所述第二处理器的运行。
方法2
根据本发明的一个实施方式,所述处理系统采用如下数据处理方法:所述第一处理器接收数据源发送的数据,对所述数据进行第一数据处理;从所述第二处理器读取经过第二数据处理后的第二数据处理结果,并将第二数据处理结果发送给数据目的地;第二处理器,所述第二处理器从所述第一处理器读取第一数据处理结果并进行第二数据处理器;第三处理器,所述第三处理器向所述第一处理器和第二处理器发送指令控制所述第一处理器和所述第二处理器的运行。
根据本发明的一个实施方式,上述两种数据处理方法可以结合使用,处理器和处理器之间可以通过存储器交换数据,也可以不通过存储器直接交换数据。
根据本发明的一个实施方式,可以由第三处理器作为控制处理器,向第一处理器和第二处理器发送控制指令,控制第一处理和第二处理器进行数据处理,也可以由处理器之间直接发送控制指令,实现相互控制,相互配合,更高效率的完成数据运算。
根据本发明的一个实施方式,本发明的处理系统中所述存储器中存有所述第一处理器、第二处理器以及第三处理器的运行指令,并且存有所述第一处理器、第二处理器以及第三处理器需要用于计算的参数。
根据本发明的一个实施方式,本发明的处理系统中所述第一处理器为路由处理器,主要用于数据的整理与输入输出,数据源不需要等待由控制器发来的通知信号即可发送数据到路由处理器中,这样可以不需要复杂的内存管理及控制;此处理器将数据做相应的处理后存入存储器中。
根据本发明的一个实施方式,本发明的处理系统中所述第三处理器为中央处理器,会控制第一处理器读取数据和控制第二处理器开始相应的运算;所述中央处理器可以选自ARM、X86或RISCV。
根据本发明的一个实施方式,本发明的处理系统中第二处理器为运算处理器,运算处理器从本地存储器读入指令,以及运算所需要的数据和参数,进行具体的运算;进行运算的处理器计算完毕后,将计算结果存入存储器,且通知路由处理器,或直接将数据传输给路由处理器;路由处理器将结果发送给数据目的地。
根据本发明的一个实施方式,本发明的处理系统中运算处理器可以是神经网络处理器,用于执行神经网络算法,例如人工神经网络算法或神经动力学算法。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的用于推荐系统的数据处理方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的用于推荐系统的数据处理方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (19)

1.一种处理系统,其特征在于:
所述处理系统包括若干个处理器和存储器,所述若干个处理器具有运算功能和控制功能;
所述若干个处理器中的每一个处理器分别与所述若干个处理器中的其他处理器和所述存储器相连;
所述若干个处理器中的第一处理器用于接收数据源发送的数据和发送数据到数据目的地。
2.根据权利要求1的所述处理系统,所述若干个处理器为相同结构。
3.根据权利要求1的所述处理系统,所述若干个处理器为不同结构。
4.根据权利要求1-3中任一项所述处理系统,所述若干个处理器中的所述第一处理器为路由处理器。
5.根据权利要求1-3任一项所述处理系统,所述若干个处理器包括神经网络处理器和中央处理器。
6.根据权利要求5的所述处理系统,所述神经网络处理器执行神经网络算法的运算。
7.根据权利要求6的所述处理系统,所述神经网络算法包括:人工神经网络算法或神经动力学算法。
8.根据权利要求5-7任一项的所述处理系统,所述中央处理器选包括:ARM、X86或RISCV。
9.根据权利要求1-8任一项所述处理系统,所述存储器中存有所述若干个处理器中任意一个处理器的运行指令和需要用于计算的参数。
10.根据权利要求1-3任一项所述处理系统,所述若干个处理器执行相同功能或执行不同功能。
11.一种众核系统,其特征在于:包括外部处理系统,和如权利要求1-10任一项所述的处理系统;
所述外部处理系统控制所述处理系统执行相应的操作。
12.一种数据处理方法,用于包括若干个处理器和存储器的处理系统中,其特征在于,包括:
所述若干个处理器中的第一处理器接收数据源发送的数据,对所述数据进行第一数据处理并将所述第一数据处理后的第一数据处理结果发送至第二处理器;
所述若干个处理器中的所述第二处理器对所述第一数据结果进行第二数据处理;
所述第一处理器接收所述第二数据处理的第二数据处理结果,将所述第二数据处理结果发送至数据目的地;
所述若干个处理器中的第三处理器控制各处理器运行,所述第三处理器向所述第一处理器和所述第二处理器发送指令控制所述第一处理器和所述第二处理器的运行;
所述若干个处理器的至少一个处理器读取所述存储器存储的数据和/或向所述存储器中写入所述至少一个处理器的数据处理结果,所述若干个处理器的所述至少一个处理器读取所述存储器中的运行指令及参数,进行相应的运算。
13.根据权利要求11所述数据处理方法,其特征在于,还包括:
所述第一处理器将所述第一数据处理结果存入所述存储器中;
所述第二处理器从所述存储器中读取所述第一数据处理结果,进行所述第二数据处理。
14.根据权利要求11所述数据处理方法,其特征在于,还包括:
所述第一处理器将所述第一数据处理结果直接发送给所述第二处理器,进行所述第二数据处理。
15.根据权利要求12或13所述数据处理方法,其特征在于:
所述第二处理器将所述第二数据处理结果直接传输给所述第一处理器,所述第一处理器将所述第二数据处理结果传输给所述数据目的地。
16.根据权利要求12或13所述数据处理方法,其特征在于:
所述第二处理器将所述第二数据处理结果存储于所述存储器,所述第一处理器从所述存储器中读取所述第二数据处理结果,将所述第二数据处理结果传输给所述数据目的地。
17.一种运算处理设备,其特征在于,包括:
N个处理器;
所述N个处理器共用的存储器;
所述存储器上存储有计算机程序指令,所述计算机程序指令被执行时,所述N个处理器执行所述权利要求12-16任一项所述方法。
18.一种计算机可读写存储介质,其上存储有计算机程序指令,其特征在于:该计算机程序指令被执行时,处理器执行如权利要求12-16任一项所述的方法。
19.一种众核处理设备,其特征在于,包括:外部处理器;N个处理器;
所述外部存储器存储计算机程序指令,所述计算机程序指令被执行时,所述N个处理器执行所述权利要求12-16任一项所述的方法。
CN201811391431.XA 2018-11-21 2018-11-21 一种数据处理系统及数据处理方法 Active CN109542830B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811391431.XA CN109542830B (zh) 2018-11-21 2018-11-21 一种数据处理系统及数据处理方法
PCT/CN2019/116653 WO2020103706A1 (zh) 2018-11-21 2019-11-08 一种数据处理系统及数据处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811391431.XA CN109542830B (zh) 2018-11-21 2018-11-21 一种数据处理系统及数据处理方法

Publications (2)

Publication Number Publication Date
CN109542830A true CN109542830A (zh) 2019-03-29
CN109542830B CN109542830B (zh) 2022-03-01

Family

ID=65850061

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811391431.XA Active CN109542830B (zh) 2018-11-21 2018-11-21 一种数据处理系统及数据处理方法

Country Status (2)

Country Link
CN (1) CN109542830B (zh)
WO (1) WO2020103706A1 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110213165A (zh) * 2019-06-05 2019-09-06 北京灵汐科技有限公司 一种异构协同系统及其通信方法
WO2020103706A1 (zh) * 2018-11-21 2020-05-28 北京灵汐科技有限公司 一种数据处理系统及数据处理方法
CN111723907A (zh) * 2020-06-11 2020-09-29 浪潮电子信息产业股份有限公司 一种模型训练设备、方法、系统及计算机可读存储介质
CN111723913A (zh) * 2020-06-19 2020-09-29 浪潮电子信息产业股份有限公司 一种数据处理方法、装置、设备及可读存储介质
CN112069324A (zh) * 2020-08-27 2020-12-11 北京灵汐科技有限公司 一种分类标签添加方法、装置、设备及存储介质
CN112259071A (zh) * 2020-09-22 2021-01-22 北京百度网讯科技有限公司 语音处理系统、语音处理方法、电子设备和可读存储介质
CN112416854A (zh) * 2020-11-20 2021-02-26 北京灵汐科技有限公司 一种抗干扰计算方法、装置、计算芯片及存储介质
WO2021045676A1 (en) * 2019-09-03 2021-03-11 Agency For Science, Technology And Research Neural network processor system and methods of operating and forming thereof
CN112766470A (zh) * 2019-10-21 2021-05-07 地平线(上海)人工智能技术有限公司 特征数据处理方法、指令序列生成方法、装置及设备
CN112835510A (zh) * 2019-11-25 2021-05-25 北京灵汐科技有限公司 一种片上存储资源存储格式的控制方法及装置
CN113449874A (zh) * 2020-03-25 2021-09-28 北京灵汐科技有限公司 样本数据生成方法、系统、电子设备及计算机可读介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1286442A (zh) * 1999-08-31 2001-03-07 皇家菲利浦电子有限公司 具有共享一个共用存储器的多个处理器的装置
CN101187908A (zh) * 2007-09-27 2008-05-28 上海大学 单芯片多处理器共享数据存储空间的访问方法
CN101346700A (zh) * 2005-12-26 2009-01-14 安泰科技有限公司 便携式装置和用于控制便携式装置中的共享存储器的方法
CN101349996A (zh) * 2007-07-20 2009-01-21 英特尔公司 在低功耗模式下保留被缓存的信息的技术
US7483430B1 (en) * 2003-02-28 2009-01-27 Cisco Technology, Inc. Hierarchical hash method for performing forward route lookup
CN101882127A (zh) * 2010-06-02 2010-11-10 湖南大学 一种多核心处理器
CN102497411A (zh) * 2011-12-08 2012-06-13 南京大学 面向密集运算的层次化异构多核片上网络架构
CN103714039A (zh) * 2013-12-25 2014-04-09 中国人民解放军国防科学技术大学 通用计算数字信号处理器
CN107688551A (zh) * 2016-12-23 2018-02-13 北京国睿中数科技股份有限公司 主处理器与协处理器之间的数据交互控制方法及系统
CN107688853A (zh) * 2016-08-05 2018-02-13 北京中科寒武纪科技有限公司 一种用于执行神经网络运算的装置及方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100887417B1 (ko) * 2007-04-11 2009-03-06 삼성전자주식회사 멀티 프로세서 시스템에서 불휘발성 메모리의 공유적사용을 제공하기 위한 멀티패쓰 억세스블 반도체 메모리장치
CN102567275B (zh) * 2010-12-08 2014-01-08 中国科学院声学研究所 一种多核处理器上多个操作系统间内存访问的方法及系统
CN104462008A (zh) * 2014-12-05 2015-03-25 三星半导体(中国)研究开发有限公司 共享物理内存的多处理器通信系统及其通信方法
CN106933692B (zh) * 2017-03-14 2020-06-09 哈尔滨工业大学 一种基于处理器阵列的航天器星载计算机系统及故障处理方法
CN109542830B (zh) * 2018-11-21 2022-03-01 北京灵汐科技有限公司 一种数据处理系统及数据处理方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1286442A (zh) * 1999-08-31 2001-03-07 皇家菲利浦电子有限公司 具有共享一个共用存储器的多个处理器的装置
US7483430B1 (en) * 2003-02-28 2009-01-27 Cisco Technology, Inc. Hierarchical hash method for performing forward route lookup
CN101346700A (zh) * 2005-12-26 2009-01-14 安泰科技有限公司 便携式装置和用于控制便携式装置中的共享存储器的方法
CN101349996A (zh) * 2007-07-20 2009-01-21 英特尔公司 在低功耗模式下保留被缓存的信息的技术
CN101187908A (zh) * 2007-09-27 2008-05-28 上海大学 单芯片多处理器共享数据存储空间的访问方法
CN101882127A (zh) * 2010-06-02 2010-11-10 湖南大学 一种多核心处理器
CN102497411A (zh) * 2011-12-08 2012-06-13 南京大学 面向密集运算的层次化异构多核片上网络架构
CN103714039A (zh) * 2013-12-25 2014-04-09 中国人民解放军国防科学技术大学 通用计算数字信号处理器
CN107688853A (zh) * 2016-08-05 2018-02-13 北京中科寒武纪科技有限公司 一种用于执行神经网络运算的装置及方法
CN107688551A (zh) * 2016-12-23 2018-02-13 北京国睿中数科技股份有限公司 主处理器与协处理器之间的数据交互控制方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
E. BEIGNE等: ""An asynchronous NOC architecture providing low latency service and its multi-level design framework"", 《11TH IEEE INTERNATIONAL SYMPOSIUM ON ASYNCHRONOUS CIRCUITS AND SYSTEMS》 *
奚杰等: ""高性能同构多核媒体处理器"", 《哈尔滨工业大学学报》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020103706A1 (zh) * 2018-11-21 2020-05-28 北京灵汐科技有限公司 一种数据处理系统及数据处理方法
CN110213165A (zh) * 2019-06-05 2019-09-06 北京灵汐科技有限公司 一种异构协同系统及其通信方法
WO2021045676A1 (en) * 2019-09-03 2021-03-11 Agency For Science, Technology And Research Neural network processor system and methods of operating and forming thereof
CN112766470B (zh) * 2019-10-21 2024-05-07 地平线(上海)人工智能技术有限公司 特征数据处理方法、指令序列生成方法、装置及设备
CN112766470A (zh) * 2019-10-21 2021-05-07 地平线(上海)人工智能技术有限公司 特征数据处理方法、指令序列生成方法、装置及设备
CN112835510B (zh) * 2019-11-25 2022-08-26 北京灵汐科技有限公司 一种片上存储资源存储格式的控制方法及装置
CN112835510A (zh) * 2019-11-25 2021-05-25 北京灵汐科技有限公司 一种片上存储资源存储格式的控制方法及装置
WO2021104179A1 (zh) * 2019-11-25 2021-06-03 北京灵汐科技有限公司 片上存储资源的存储格式的控制方法及装置
US11455108B2 (en) 2019-11-25 2022-09-27 Lynxi Technologies Co., Ltd. Method and device for controlling storage format of on-chip storage resource
CN113449874A (zh) * 2020-03-25 2021-09-28 北京灵汐科技有限公司 样本数据生成方法、系统、电子设备及计算机可读介质
CN111723907B (zh) * 2020-06-11 2023-02-24 浪潮电子信息产业股份有限公司 一种模型训练设备、方法、系统及计算机可读存储介质
CN111723907A (zh) * 2020-06-11 2020-09-29 浪潮电子信息产业股份有限公司 一种模型训练设备、方法、系统及计算机可读存储介质
CN111723913A (zh) * 2020-06-19 2020-09-29 浪潮电子信息产业股份有限公司 一种数据处理方法、装置、设备及可读存储介质
CN112069324A (zh) * 2020-08-27 2020-12-11 北京灵汐科技有限公司 一种分类标签添加方法、装置、设备及存储介质
CN112259071A (zh) * 2020-09-22 2021-01-22 北京百度网讯科技有限公司 语音处理系统、语音处理方法、电子设备和可读存储介质
CN112416854A (zh) * 2020-11-20 2021-02-26 北京灵汐科技有限公司 一种抗干扰计算方法、装置、计算芯片及存储介质

Also Published As

Publication number Publication date
CN109542830B (zh) 2022-03-01
WO2020103706A1 (zh) 2020-05-28

Similar Documents

Publication Publication Date Title
CN109542830A (zh) 一种数据处理系统及数据处理方法
Liu et al. Hybrid whale optimization algorithm enhanced with Lévy flight and differential evolution for job shop scheduling problems
US10783437B2 (en) Hybrid aggregation for deep learning neural networks
WO2020134824A1 (zh) 一种类脑计算系统
CN105579959B (zh) 硬件加速器虚拟化
CN104049712B (zh) 用于计算机系统的功率管理方法和系统
Ma et al. BaGuaLu: targeting brain scale pretrained models with over 37 million cores
CN110222005A (zh) 用于异构架构的数据处理系统及其方法
CN108416436A (zh) 使用多核心处理模块进行神经网络划分的方法及其系统
KR20170124995A (ko) 자율 메모리 아키텍처
CN108694089A (zh) 使用非贪婪调度算法的并行计算架构
Kaur et al. An energy-efficient load balancing approach for scientific workflows in fog computing
US11748156B1 (en) System and method for maximizing processor and server use
CN111126590A (zh) 一种人工神经网络运算的装置及方法
Vasiljevic et al. Compute substrate for software 2.0
CN108702339A (zh) 结构架构中用于基于服务质量进行节流的技术
Tian et al. Deadlock-free migration for virtual machine consolidation using chicken swarm optimization algorithm
Narantuya et al. Multi-Agent Deep Reinforcement Learning-Based Resource Allocation in HPC/AI Converged Cluster.
Fox et al. Software frameworks for deep learning at scale
Xu et al. Recent advances in the artificial endocrine system
CN103677996B (zh) 用于平衡工作负荷分布的协作方法和系统
US20190272460A1 (en) Configurable neural network processor for machine learning workloads
CN107305486A (zh) 一种神经网络maxout层计算装置
Lin et al. swFLOW: A dataflow deep learning framework on sunway taihulight supercomputer
Meng et al. How to efficiently train your ai agent? characterizing and evaluating deep reinforcement learning on heterogeneous platforms

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant