CN112486575A - 一种共享加速运算部件的电力人工智能芯片及应用方法 - Google Patents
一种共享加速运算部件的电力人工智能芯片及应用方法 Download PDFInfo
- Publication number
- CN112486575A CN112486575A CN202011439665.4A CN202011439665A CN112486575A CN 112486575 A CN112486575 A CN 112486575A CN 202011439665 A CN202011439665 A CN 202011439665A CN 112486575 A CN112486575 A CN 112486575A
- Authority
- CN
- China
- Prior art keywords
- complex operation
- complex
- instruction
- processor core
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/3001—Arithmetic instructions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/30029—Logical and Boolean instructions, e.g. XOR, NOT
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30098—Register arrangements
- G06F9/3012—Organisation of register space, e.g. banked or distributed register file
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30145—Instruction analysis, e.g. decoding, instruction word fields
Abstract
本发明公开了一种共享加速运算部件的电力人工智能芯片及应用方法,其芯片包括:处理器核、运算加速部件;处理器核对待执行指令进行译码得到运算标识,确定译码得到的运算标识为预设复杂运算标识用译码得到的运算标识,处理器核将所生成的复杂运算指令添加到复杂运算指令队列;运算加速部件从复杂运算指令队列中选取复杂运算指令,运算加速部件以所选取的复杂运算指令执行所选取的复杂运算指令的复杂运算得到运算结果,与运算加速部件将得到的运算结果作为复杂运算结果写入复杂运算结果队列。本发明引入运算加速部件执行复杂运算,通过处理器核共享一个运算加速部件,运算加速部件中有多个运算单元,多个运算单元并行执行复杂运算操作。
Description
技术领域
本发明涉及人工智能芯片技术领域,具体涉及了一种共享加速运算部件的电力人工智能芯片及应用方法。
背景技术
人工智能芯片为专门用于处理人工智能应用中的大量计算任务的模块,其复杂运算过程虽可以用基本运算指令实现,但是会降低运算的执行效率,其电力工程中此类复杂运算较多,故对人工智能芯片要求更高。
电力行业的智能终端设备牵涉大量模拟量运算的部件,因此电力智能终端设备应用的芯片需要执行较复杂且精密的电流、电压、尤其是一些瞬态量的量测与运算处理。
发明内容
本发明的目的在于克服现有技术的不足,本发明提供了一种共享加速运算部件的电力人工智能芯片及应用方法,引入运算加速部件执行复杂运算,通过处理器核共享一个运算加速部件,运算加速部件中有多个运算单元,多个运算单元并行执行复杂运算操作。
为了解决上述技术问题,本发明实施例提供了一种共享加速运算部件的电力人工智能芯片,其特征在于,所述电力人工智能芯片包括:处理器核、运算加速部件、储存模块;
所述处理器核对待执行指令进行译码得到运算标识,确定译码得到的运算标识为预设复杂运算标识用译码得到的运算标识,所述处理器核将所生成的复杂运算指令添加到复杂运算指令队列;
所述运算加速部件从复杂运算指令队列中选取复杂运算指令,所述运算加速部件以所选取的复杂运算指令执行所选取的复杂运算指令的复杂运算得到运算结果,与所述运算加速部件将得到的运算结果作为复杂运算结果写入复杂运算结果队列。
所述复杂运算指令队列和所述复杂运算结果队列存储在所述储存模块。
所述运算加速部件由算术逻辑运算部件ALU、寄存器、移位电路、计数器、门电路组成。
优选的,所述算术逻辑运算部件ALU主要完成加减法算术运算及逻辑运算,还包含有快速进位电路;三个寄存器(A,B,C),当执行加减运算和逻辑运算时,只用到A,B两个寄存器,当执行乘除法时,用到三个寄存器,计数器是用来控制乘/除法运算是否结束,在运算开始时,置n值,每进行一次加、减和移位操作后计数器一1,当减到0时,表示乘、除法运算结束。
在所述运算加速部件中与所选取的复杂运算指令中的复杂运算标识对应的运算单元中,以所选取的复杂运算指令中的操作数为输入参数执行所选取的复杂运算指令中的复杂运算标识所指示的复杂运算。
所述目标处理器核从所述复杂运算结果队列中选取处理器核标识为所述目标处理器核标识的复杂运算结果中的运算结果写入所述目标处理器核中的结果寄存器或所述人工智能芯片的所述储存模块。
一种共享加速运算部件的电力人工智能芯片应用方法,其方法,包括:
处理器核中的目标处理器接对待执行指令进行译码,得到运算标识和操作数;
目标处理器核响应于确定译码得到的运算标识为预设复杂运算标识、用译码得到的运算标识和操作数生成复杂运算指令;
目标处理器核将所生成的复杂运算指令添加到复杂运算指令队列;
运算加速部件从复杂运算指令队列中选取复杂运算指令;
运算加速部件以所选取的复杂运算指令中的操作数为输入参数执行所选取的复杂运算指令中的复杂运算标识所指示的复杂运算,得到运算结果;
运算加速部件将得到的运算结果作为复杂运算结果写入复杂运算结果队列。
优选的,所述复杂运算指令队列和所述复杂运算结果队列存储在储存模块。
优选的,在所述运算加速部件中与所选取的复杂运算指令中的复杂运算标识对应的运算单元中,以所选取的复杂运算指令中的操作数为输入参数执行所选取的复杂运算指令中的复杂运算标识所指示的复杂运算。
优选的,所述目标处理器核从所述复杂运算结果队列中选取处理器核标识为所述目标处理器核标识的复杂运算结果中的运算结果写入所述目标处理器核中的结果寄存器或所述人工智能芯片的储存模块。
本发明提供的一种共享加速运算部件的电力人工智能芯片及应用方法,引入运算加速部件执行复杂运算,提高了AI芯片处理复杂运算的能力和效率;由至少一个处理器核共享一个运算加速部件,降低了AI芯片中复杂运算带来的面积开销和功耗开销;由于运算加速部件中有多个运算单元,多个运算单元并行执行复杂运算操作,因此,在无数据冒险的情况下,复杂运算的时间开销可以被后续指令所掩盖。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是一种共享加速运算部件的电力人工智能芯片的结构示意图。
图2是一种共享加速运算部件的电力人工智能芯片应用方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例
参阅图1,图1是一种共享加速运算部件的电力人工智能芯片的结构示意图。
一种共享加速运算部件的电力人工智能芯片,其特征在于,所述电力人工智能芯片包括:处理器核101、运算加速部件102、储存模块103;
所述处理器核101对待执行指令进行译码得到运算标识,确定译码得到的运算标识为预设复杂运算标识用译码得到的运算标识,所述处理器核101将所生成的复杂运算指令添加到复杂运算指令队列;
所述运算加速部件102从复杂运算指令队列中选取复杂运算指令,所述运算加速部件102以所选取的复杂运算指令执行所选取的复杂运算指令的复杂运算得到运算结果,与所述运算加速部件102将得到的运算结果作为复杂运算结果写入复杂运算结果队列。
所述复杂运算指令队列和所述复杂运算结果队列存储在所述储存模块103。
所述运算加速部件102由算术逻辑运算部件ALU、寄存器、移位电路、计数器、门电路组成。
优选的,所述算术逻辑运算部件ALU主要完成加减法算术运算及逻辑运算,还包含有快速进位电路;三个寄存器(A,B,C),当执行加减运算和逻辑运算时,只用到A,B两个寄存器,当执行乘除法时,用到三个寄存器,计数器是用来控制乘/除法运算是否结束,在运算开始时,置n值,每进行一次加、减和移位操作后计数器一1,当减到0时,表示乘、除法运算结束。
在所述运算加速部件102中与所选取的复杂运算指令中的复杂运算标识对应的运算单元中,以所选取的复杂运算指令中的操作数为输入参数执行所选取的复杂运算指令中的复杂运算标识所指示的复杂运算。
所述目标处理器核101从所述复杂运算结果队列中选取处理器核101标识为所述目标处理器核101标识的复杂运算结果中的运算结果写入所述目标处理器核101中的结果寄存器或所述人工智能芯片的所述储存模块103。
本发明中人工智能芯片包括至少一个处理器核101和与至少一个处理器核101中各个处理器核101连接的运算加速部件102,通过由目标处理器核101响应于确定待执行指令所要执行的运算是预设复杂运算,对待执行指令进行译码,得到复杂运算标识和操作数,用复杂运算标识和操作数生成复杂运算指令以及将所生成的复杂运算指令添加到复杂运算指令队列,再由运算加速部件102从复杂运算指令队列中选取复杂运算指令,以所选取的复杂运算指令中的操作数为输入参数执行所选取的复杂运算指令中的复杂运算标识所指示的复杂运算,得到运算结果,以及将得到的运算结果作为复杂运算结果写入复杂运算结果队列,从而有效利用了运算加速部件102进行复杂运算;通过处理器核101对待执行指令进行译码得到运算标识、确定译码得到的运算标识为预设复杂运算标识用译码得到的运算标识、处理器核101将所生成的复杂运算指令添加到复杂运算指令队列、运算加速部件102从复杂运算指令队列中选取复杂运算指令、运算加速部件102以所选取的复杂运算指令执行所选取的复杂运算指令的复杂运算得到运算结果与运算加速部件将得到的运算结果作为复杂运算结果写入复杂运算结果队列,实现将人工智能芯片应用于电力行业中,将相应的人工智能芯片安装在相应的电子元件上。
参阅图2,图2是一种共享加速运算部件的电力人工智能芯片应用方法的流程示意图。
一种共享加速运算部件的电力人工智能芯片应用方法,其方法,包括:
S201处理器核中的目标处理器接对待执行指令进行译码,得到运算标识和操作数。至少一个处理器核和与至少一个处理器核中各个处理器核连接的运算加速部件,通过由目标处理器核响应于确定待执行指令所要执行的运算是预设复杂运算,对待执行指令进行译码,得到多个复杂运算标识和多个操作数。
S202目标处理器核响应于确定译码得到的运算标识为预设复杂运算标识、用译码得到的运算标识和操作数生成复杂运算指令。复杂运算标识和操作数用复杂运算标识和操作数生成复杂运算指令以及将所生成的复杂运算指令。
S203目标处理器核将所生成的复杂运算指令添加到复杂运算指令队列。
S204运算加速部件从复杂运算指令队列中选取复杂运算指令。
S205算加速部件以所选取的复杂运算指令中的操作数为输入参数执行所选取的复杂运算指令中的复杂运算标识所指示的复杂运算,得到运算结果。运算加速部件以所选取的复杂运算指令中的至少一个操作数为输入参数执行所选取的复杂运算指令中的复杂运算标识所指示的复杂运算,得到运算结果。
S206运算加速部件将得到的运算结果作为复杂运算结果写入复杂运算结果队列。
优选的,所述复杂运算指令队列和所述复杂运算结果队列存储在储存模块。
优选的,在所述运算加速部件中与所选取的复杂运算指令中的复杂运算标识对应的运算单元中,以所选取的复杂运算指令中的操作数为输入参数执行所选取的复杂运算指令中的复杂运算标识所指示的复杂运算。
优选的,所述目标处理器核从所述复杂运算结果队列中选取处理器核标识为所述目标处理器核标识的复杂运算结果中的运算结果写入所述目标处理器核中的结果寄存器或所述人工智能芯片的储存模块。
本发明提供的一种共享加速运算部件的电力人工智能芯片及应用方法,引入运算加速部件执行复杂运算,提高了AI芯片处理复杂运算的能力和效率;由至少一个处理器核共享一个运算加速部件,降低了AI芯片中复杂运算带来的面积开销和功耗开销;由于运算加速部件中有多个运算单元,多个运算单元并行执行复杂运算操作,因此,在无数据冒险的情况下,复杂运算的时间开销可以被后续指令所掩盖。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,存储介质可以包括:只读储存模块(ROM,Read Only Memory)、随机存取储存模块(RAM,RandomAccess Memory)、磁盘或光盘等。
另外,以上对本发明实施例所提供的一种共享加速运算部件的电力人工智能芯片及应用方法进行了详细介绍,本文中应采用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种共享加速运算部件的电力人工智能芯片,其特征在于,所述电力人工智能芯片包括:处理器核、运算加速部件、储存模块;
所述处理器核对待执行指令进行译码得到运算标识,确定译码得到的运算标识为预设复杂运算标识用译码得到的运算标识,所述处理器核将所生成的复杂运算指令添加到复杂运算指令队列;
所述运算加速部件从复杂运算指令队列中选取复杂运算指令,所述运算加速部件以所选取的复杂运算指令执行所选取的复杂运算指令的复杂运算得到运算结果,与所述运算加速部件将得到的运算结果作为复杂运算结果写入复杂运算结果队列。
2.根据权利要求1所述的电力人工智能芯片,其特征在于,所述复杂运算指令队列和所述复杂运算结果队列存储在所述储存模块。
3.根据权利要求1所述的电力人工智能芯片,其特征在于,所述运算加速部件由算术逻辑运算部件ALU、寄存器、移位电路、计数器、门电路组成。
4.根据权利要求3所述的电力人工智能芯片,其特征在于,所述算术逻辑运算部件ALU主要完成加减法算术运算及逻辑运算,还包含有快速进位电路;
三个寄存器(A,B,C),当执行加减运算和逻辑运算时,只用到A,B两个寄存器,当执行乘除法时,用到三个寄存器,计数器是用来控制乘/除法运算是否结束,在运算开始时,置n值,每进行一次加、减和移位操作后计数器一1,当减到0时,表示乘、除法运算结束。
5.根据权利要求1所述的电力人工智能芯片,其特征在于,在所述运算加速部件中与所选取的复杂运算指令中的复杂运算标识对应的运算单元中,以所选取的复杂运算指令中的操作数为输入参数执行所选取的复杂运算指令中的复杂运算标识所指示的复杂运算。
6.根据权利要求1所述的电力人工智能芯片,其特征在于,所述目标处理器核从所述复杂运算结果队列中选取处理器核标识为所述目标处理器核标识的复杂运算结果中的运算结果写入所述目标处理器核中的结果寄存器或所述人工智能芯片的所述储存模块。
7.一种共享加速运算部件的电力人工智能芯片应用方法,其特征在于,所述方法,包括:
处理器核中的目标处理器接对待执行指令进行译码,得到运算标识和操作数;
目标处理器核响应于确定译码得到的运算标识为预设复杂运算标识、用译码得到的运算标识和操作数生成复杂运算指令;
目标处理器核将所生成的复杂运算指令添加到复杂运算指令队列;
运算加速部件从复杂运算指令队列中选取复杂运算指令;
运算加速部件以所选取的复杂运算指令中的操作数为输入参数执行所选取的复杂运算指令中的复杂运算标识所指示的复杂运算,得到运算结果;
运算加速部件将得到的运算结果作为复杂运算结果写入复杂运算结果队列。
8.根据权利要求7所述的方法,其特征在于,所述复杂运算指令队列和所述复杂运算结果队列存储在储存模块。
9.根据权利要求7所述的方法,其特征在于,在所述运算加速部件中与所选取的复杂运算指令中的复杂运算标识对应的运算单元中,以所选取的复杂运算指令中的操作数为输入参数执行所选取的复杂运算指令中的复杂运算标识所指示的复杂运算。
10.根据权利要求7所述的方法,其特征在于,所述目标处理器核从所述复杂运算结果队列中选取处理器核标识为所述目标处理器核标识的复杂运算结果中的运算结果写入所述目标处理器核中的结果寄存器或所述人工智能芯片的储存模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011439665.4A CN112486575A (zh) | 2020-12-07 | 2020-12-07 | 一种共享加速运算部件的电力人工智能芯片及应用方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011439665.4A CN112486575A (zh) | 2020-12-07 | 2020-12-07 | 一种共享加速运算部件的电力人工智能芯片及应用方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112486575A true CN112486575A (zh) | 2021-03-12 |
Family
ID=74941450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011439665.4A Pending CN112486575A (zh) | 2020-12-07 | 2020-12-07 | 一种共享加速运算部件的电力人工智能芯片及应用方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112486575A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101165655A (zh) * | 2006-10-20 | 2008-04-23 | 国际商业机器公司 | 多处理器计算系统及其任务分配方法 |
GB201213318D0 (en) * | 2011-10-03 | 2012-09-05 | Ibm | Managing a register cache based on an architected computer instruction set |
CN110825436A (zh) * | 2018-08-10 | 2020-02-21 | 北京百度网讯科技有限公司 | 应用于人工智能芯片的计算方法和人工智能芯片 |
-
2020
- 2020-12-07 CN CN202011439665.4A patent/CN112486575A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101165655A (zh) * | 2006-10-20 | 2008-04-23 | 国际商业机器公司 | 多处理器计算系统及其任务分配方法 |
GB201213318D0 (en) * | 2011-10-03 | 2012-09-05 | Ibm | Managing a register cache based on an architected computer instruction set |
CN110825436A (zh) * | 2018-08-10 | 2020-02-21 | 北京百度网讯科技有限公司 | 应用于人工智能芯片的计算方法和人工智能芯片 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10795653B2 (en) | Target architecture determination | |
US10140251B2 (en) | Processor and method for executing matrix multiplication operation on processor | |
CN109240746B (zh) | 一种用于执行矩阵乘运算的装置和方法 | |
WO2013101069A1 (en) | Core switching accelaration in asymmetric multiprocessor system | |
CN110825436B (zh) | 应用于人工智能芯片的计算方法和人工智能芯片 | |
CN110851246A (zh) | 一种批量任务处理方法、装置、系统及存储介质 | |
CN114924748A (zh) | 编译方法、装置及设备 | |
KR20180034508A (ko) | 데이터 처리 | |
KR101862981B1 (ko) | 명령어 기반 카운터를 통한 성능 및 전력량 예측 시스템 및 방법 | |
CN112486575A (zh) | 一种共享加速运算部件的电力人工智能芯片及应用方法 | |
US3665402A (en) | Computer addressing apparatus | |
US9256398B2 (en) | Device and method of increasing dynamically-typed software efficiency | |
CN113220368B (zh) | 一种存储客户端资源隔离方法、系统、终端及存储介质 | |
WO2022134426A1 (zh) | 可重构处理器中的指令分发方法、系统以及存储介质 | |
CN113591031A (zh) | 低功耗矩阵运算方法及装置 | |
CN110058881B (zh) | 一种定点累加运算的处理方法、装置和电子设备 | |
US20140237216A1 (en) | Microprocessor | |
US20150293766A1 (en) | Processor and method | |
JP2525492B2 (ja) | プログラマブルコントロ―ラ | |
CN117389512B (zh) | 一种算术逻辑单元alu系统、电子设备和存储介质 | |
CN114721725B (zh) | 一种分支指令执行方法、装置、电子设备及存储介质 | |
US20140281368A1 (en) | Cycle sliced vectors and slot execution on a shared datapath | |
CN117971431A (zh) | 一种基于虚拟化的任务执行方法、装置、设备及存储介质 | |
CN118012508A (zh) | 一种处理器可变指令的架构方法 | |
CN115033385A (zh) | 一种处理方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210312 |