CN111651202A - 一种用于执行向量逻辑运算的装置 - Google Patents

一种用于执行向量逻辑运算的装置 Download PDF

Info

Publication number
CN111651202A
CN111651202A CN202010608257.0A CN202010608257A CN111651202A CN 111651202 A CN111651202 A CN 111651202A CN 202010608257 A CN202010608257 A CN 202010608257A CN 111651202 A CN111651202 A CN 111651202A
Authority
CN
China
Prior art keywords
vector
instruction
logic
address
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010608257.0A
Other languages
English (en)
Inventor
罗韬
支天
刘少礼
陈天石
陈云霁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cambricon Technologies Corp Ltd
Original Assignee
Cambricon Technologies Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cambricon Technologies Corp Ltd filed Critical Cambricon Technologies Corp Ltd
Priority to CN202010608257.0A priority Critical patent/CN111651202A/zh
Priority to CN201610267024.2A priority patent/CN107315568B/zh
Publication of CN111651202A publication Critical patent/CN111651202A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands
    • G06F9/30036Instructions to perform operations on packed data, e.g. vector operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands
    • G06F9/30029Logical and Boolean instructions, e.g. XOR, NOT
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/3004Arrangements for executing specific machine instructions to perform operations on memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computer systems based on biological models
    • G06N3/02Computer systems based on biological models using neural network models

Abstract

本发明提供了一种执行向量逻辑运算的装置及方法,用于配合一套指令集,令执行向量逻辑运算,装置包括存储单元和向量逻辑运算单元,存储单元中存储有向量,向量逻辑运算单元根据配套指令获取向量地址,然后,根据该向量地址在存储单元中获取相应的向量,接着,根据获取的向量进行向量逻辑运算,得到运算结果。本发明将参与计算的向量数据暂存在高速暂存存储器上,使得向量逻辑运算过程中可以更加灵活有效地支持不同宽度的数据,提升包含大量向量逻辑运算应用的执行性能。

Description

一种用于执行向量逻辑运算的装置
技术领域
本发明涉及一种向量逻辑运算装置及方法,用于根据向量逻辑运算指令高效灵活地执行向量逻辑运算,能够很好地解决当前计算机领域越来越多的算法包含大量向量逻辑运算的问题。
背景技术
在已有的计算机领域应用中,与向量运算相关的应用十分普遍。以目前的热门应用领域人工智能中的主流算法机器学习算法为例,几乎所有已有的经典算法中都含有大量与本发明相关的向量逻辑运算。向量逻辑运算是指向量间与、内与、间或和内或这四种运算,其中,对于两个向量a=[a1,a2,…,an]和b=[b1,b2,…,bn],间与运算定义为:[a1&b1,a2&b2,…,an&bn];向量a的内与运算定义为:a1&a2&…&an;向量间或运算定义为:[a1||b1,a2||b2,…,an||bn];向量a的内或定义为:a1||a2||…||an。
在现有技术中,一种进行向量逻辑运算的已知方案是使用通用处理器,该方法通过通用寄存器堆和通用功能部件来执行通用指令,从而执行向量逻辑运算。然而,该方法的缺点之一是单个通用处理器多用于标量计算,在进行向量逻辑运算时运算性能较低。而使用多个通用处理器并行执行时,通用处理器之间的相互通讯又有可能成为性能瓶颈。在另一种现有技术中,使用图形处理器(GPU)来进行向量计算,其中,通过使用通用寄存器堆和通用流处理单元执行通用SIMD指令来进行向量逻辑运算。然而,上述方案中,GPU片上缓存太小,在进行大规模向量逻辑运算时需要不断进行片外数据搬运,片外带宽成为了主要性能瓶颈。在另一种现有技术中,使用专门定制的向量逻辑运算装置来进行向量计算,其中,使用定制的寄存器堆和定制的处理单元进行向量逻辑运算。然而,目前已有的专用向量逻辑运算装置受限于寄存器堆,不能够灵活地支持不同长度的向量逻辑运算。
发明内容
(一)要解决的技术问题
本发明的目的在于,提供一种向量逻辑运算装置及方法,解决现有技术中存在的受限于片间通讯、片上缓存不够、支持的向量长度不够灵活等问题。
(二)技术方案
本发明提供一种向量逻辑运算装置,用于根据向量逻辑运算指令执行向量逻辑运算,包括:
存储单元,用于存储向量;
寄存器单元,用于存储向量地址,其中,向量地址为向量在存储单元中存储的地址;
向量逻辑运算单元,用于获取向量逻辑运算指令,根据向量逻辑运算指令在寄存器单元中获取向量地址,然后,根据该向量地址在存储单元中获取相应的向量,接着,根据获取的向量进行向量逻辑运算,得到向量逻辑运算结果。
本发明还提供一种向量逻辑运算方法,用于根据向量逻辑运算指令执行向量逻辑运算,方法包括:
S1,存储向量;
S2,存储向量地址;
S3,获取向量逻辑运算指令,根据向量逻辑运算指令获取向量地址,然后,根据该向量地址获取存储的向量,接着,根据获取的向量进行向量逻辑运算,得到向量逻辑运算结果。
(三)有益效果
本发明提供的向量逻辑运算装置及方法,将参与计算的向量数据暂存在高速暂存存储器(Scratchpad Memory)上。在仅发送同一条指令的情况下,向量逻辑运算单元中可以更加灵活有效地支持不同宽度的数据,并可以解决数据存储中的相关性问题,从而提升了包含大量向量计算任务的执行性能,本发明采用的指令具有精简的格式,使得指令集使用方便、支持的向量长度灵活。
本发明可以应用于以下(包括但不限于)场景中:数据处理、机器人、电脑、打印机、扫描仪、电话、平板电脑、智能终端、手机、行车记录仪、导航仪、传感器、摄像头、云端服务器、相机、摄像机、投影仪、手表、耳机、移动存储、可穿戴设备等各类电子产品;飞机、轮船、车辆等各类交通工具;电视、空调、微波炉、冰箱、电饭煲、加湿器、洗衣机、电灯、燃气灶、油烟机等各类家用电器;以及包括核磁共振仪、B超、心电图仪等各类医疗设备。
附图说明
图1是本发明提供的向量逻辑运算装置的结构示意图。
图2是本发明提供的指令集的格式示意图。
图3是本发明实施例提供的向量逻辑运算装置的结构示意图。
图4是本发明实施例提供的向量逻辑运算装置执行向量逻辑指令的流程图。
图5为本发明实施例提供的向量逻辑运算单元的结构示意图。
具体实施方式
本发明提供一种向量逻辑运算装置及配套指令集,包括存储单元、寄存器单元和向量逻辑运算单元,存储单元中存储有向量,寄存器单元中存储有向量存储的地址向量逻辑运算单元根据向量逻辑运算指令在寄存器单元中获取向量地址,然后,根据该向量地址在存储单元中获取相应的向量,接着,根据获取的向量进行向量逻辑运算,得到向量逻辑运算结果。本发明将参与计算的向量数据暂存在高速暂存存储器上,使得向量逻辑运算过程中可以更加灵活有效地支持不同宽度的数据,提升包含大量向量计算任务的执行性能。
图1是本发明提供的向量逻辑运算装置的结构示意图,如图1所示,向量逻辑运算装置包括:
存储单元,用于存储向量,在一种实施方式中,该存储单元可以是高速暂存存储器,能够支持不同大小的向量数据;本发明将必要的计算数据暂存在高速暂存存储器(Scratchpad Memory)上,使本运算装置在进行向量逻辑运算过程中可以更加灵活有效地支持不同宽度的数据。存储单元可以通过各种不同存储器件(SRAM、eDRAM、DRAM、忆阻器、3D-DRAM或非易失存储等)实现。
寄存器单元,用于存储向量起始地址,其中,向量起始地址为向量在存储单元中存储的地址;在一种实施方式中,寄存器单元可以是标量寄存器堆,提供运算过程中所需的标量寄存器,标量寄存器存放向量起始地址。
向量逻辑运算单元,用于获取向量逻辑运算指令,根据向量逻辑运算指令在所述寄存器单元中获取向量起始地址,然后,根据该向量起始地址在存储单元中获取相应的向量,接着,根据获取的向量进行向量逻辑运算,得到向量逻辑运算结果,并将向量逻辑运算结果存储于存储单元中。向量逻辑运算单元包含包括向量逻辑间与部件、向量逻辑内与部件、向量逻辑间或部件和向量逻辑内或部件,并且,向量逻辑运算单元为多流水级结构,其中,间与部件和间或部件处于第一流水级,内或部件和内与部件处于第二流水级。这些单元处于不同的流水级,当连续串行的多条向量逻辑运算指令的先后次序与相应单元所在流水级顺序一致时,可以更加高效地实现这一连串向量逻辑运算指令所要求的操作。
根据本发明的一种实施方式,向量逻辑运算装置还包括:指令缓存单元,用于存储待执行的向量逻辑运算指令。指令在执行过程中,同时也被缓存在指令缓存单元中,当一条指令执行完之后,如果该指令同时也是指令缓存单元中未被提交指令中最早的一条指令,该指令将被提交,一旦提交,该条指令进行的操作对装置状态的改变将无法撤销。在一种实施方式中,指令缓存单元可以是重排序缓存。
根据本发明的一种实施方式,向量逻辑运算装置还包括:指令处理单元,用于从指令缓存单元获取向量逻辑运算指令,并对该向量逻辑运算指令进行处理后,提供给所述向量逻辑运算单元。其中,指令处理单元包括:
取指模块,用于从指令缓存单元中获取向量逻辑运算指令;
译码模块,用于对获取的向量逻辑运算指令进行译码;
指令队列,用于对译码后的向量逻辑运算指令进行顺序存储。向量逻辑运算单元能够根据指令队列中的向量逻辑运算指令进行向量逻辑运算,
进一步地,考虑到不同指令在包含的寄存器上有可能存在依赖关系,用于缓存译码后的指令,当依赖关系被满足之后发射指令。根据本发明的一种实施方式,向量逻辑运算装置还包括:依赖关系处理单元,用于在向量逻辑运算单元获取向量逻辑运算指令前,判断该向量逻辑运算指令与前一向量逻辑运算指令是否访问相同的向量,若是,将该向量逻辑运算指令存储在一存储队列中,待前一向量逻辑运算指令执行完毕后,将存储队列中的该向量逻辑运算指令提供给所述向量逻辑运算单元;否则,直接将该向量逻辑运算指令提供给所述向量逻辑运算单元。具体地,向量逻辑运算指令访问高速暂存存储器时,前后指令可能会访问同一块存储空间,为了保证指令执行结果的正确性,当前指令如果被检测到与之前的指令的数据存在依赖关系,该指令必须在存储队列内等待至依赖关系被消除。
根据本发明的一种实施方式,向量逻辑运算装置还包括:输入输出单元,用于将向量存储于存储单元,或者,从存储单元中获取向量逻辑运算结果。其中,输入输出单元可直接存储单元,负责从内存中读取向量数据或写入向量数据。
本发明还提供一种向量逻辑运算方法,用于根据向量逻辑运算指令执行向量逻辑运算,方法包括:
S1,存储向量;
S2,存储向量起始地址,向量起始地址指示相应向量在步骤S1中所存储的位置;
S3,获取向量逻辑运算指令,根据向量逻辑运算指令获取向量起始地址,然后,根据该向量起始地址获取存储的向量,接着,根据获取的向量进行向量逻辑运算,得到向量逻辑运算结果。
根据本发明的一种实施方式,在步骤S3之前还包括:
存储向量逻辑运算指令;
获取存储的向量逻辑运算指令;
对获取的向量逻辑运算指令进行译码;
对译码后的向量逻辑运算指令进行顺序存储。
根据本发明的一种实施方式,在步骤S3之前还包括:
判断该向量逻辑运算指令与前一向量逻辑运算指令是否访问相同的向量,若是,将该向量逻辑运算指令存储在一存储队列中,待前一向量逻辑运算指令执行完毕后,再执行步骤S3;否则,直接执行步骤S3。
根据本发明的一种实施方式,方法还包括,存储所述向量逻辑运算结果。
根据本发明的一种实施方式,步骤S1包括,将向量存储至一高速暂存存储器中。
根据本发明的一种实施方式,所述向量逻辑运算指令包括一操作码和至少一操作域,其中,所述操作码用于指示该向量运算指令的功能,操作域用于指示该向量逻辑运算指令的数据信息。
根据本发明的一种实施方式,向量逻辑运算包括向量间与运算、向量内与运算、向量间或运算和向量内或运算。
根据本发明的一种实施方式,向量运算单元为多流水级结构,包括第一流水级和第二流水级,其中,在第一流水级执行向量间与运算和向量间或运算,在第二流水级执行向量内或运算和向量内与运算。
本发明指令集采用Load/Store结构,向量逻辑运算单元不会对内存中的数据进行操作。本指令集采用精简指令集架构,指令集只提供最基本的向量逻辑运算操作,复杂的向量逻辑运算都由这些简单指令通过组合进行模拟,使得可以在高时钟频率下单周期执行指令。另外,本指令集同时采用定长指令,使得本发明提出的向量逻辑运算装置在上一条指令的译码阶段对下一条指令进行取指。
在本装置执行向量逻辑运算的过程中,装置取出指令进行译码,然后送至指令队列存储,根据译码结果,获取指令中的各个参数,这些参数可以是直接写在指令的操作域中,也可以是根据指令操作域中的寄存器号从指定的寄存器中读取。这种使用寄存器存储参数的好处是无需改变指令本身,只要用指令改变寄存器中的值,就可以实现大部分的循环,因此大大节省了在解决某些实际问题时所需要的指令条数。依赖关系处理单元会判断指令实际需要使用的数据与之前指令中是否存在依赖关系,这决定了这条指令是否可以被立即发送至运算单元中执行。一旦发现与之前的数据之间存在依赖关系,则该条指令必须等到它依赖的指令执行完毕之后才可以送至运算单元执行。在定制的运算单元中,该条指令将快速执行完毕,并将结果,即生成的向量逻辑运算结果写回至指令提供的地址,该条指令执行完毕。
图2是本发明提供的指令集的格式示意图,如图2所示,向量逻辑运算指令包括1个操作码和至少一个操作域,其中,操作码用于指示该向量逻辑运算指令的功能,向量逻辑运算单元通过识别该操作码可进行向量逻辑运算,操作域用于指示该向量逻辑运算指令的数据信息,其中,数据信息可以是寄存器号,例如,要获取一个向量时,根据寄存器号可以在相应的寄存器中获取向量起始地址和向量长度,再根据向量起始地址和向量长度在存储单元中获取相应地址存放的向量。
指令集包含有不同功能的向量逻辑运算指令:
向量间与指令(VAV)。根据该指令,装置从高速暂存存储器的指定地址取出分别取出指定大小的向量数据,在向量运算单元中将两向量对位相与,并将结果写回至高速暂存存储器的指定地址;
向量内与指令(VAND)。根据该指令,装置从高速暂存存储器的指定地址取出指定大小的向量数据,在向量运算单元中向量中每一位相与,并将结果写回至标量寄存器堆的指定地址;
向量间或指令(VOV)。根据该指令,装置从高速暂存存储器的指定地址取出分别取出指定大小的向量数据,在向量运算单元中将两向量对位相或,并将结果写回至高速暂存存储器的指定地址;
向量内或指令(VOR)。根据该指令,装置从高速暂存存储器的指定地址取出指定大小的向量数据,在向量运算单元中向量中每一位相或,并将结果写回至标量寄存器堆的指定地址;
向量检索指令(VR)。根据该指令,装置从高速暂存存储器的指定地址取出指定大小的向量数据,在向量计算单元中根据指定位置取出向量中的相应元素作为输出,并将结果写回至标量寄存器堆的指定地址;
向量加载指令(VLOAD)。根据该指令,装置从指定外部源地址载入指定大小的向量数据至高速暂存存储器的指定地址;
向量存储指令(VS)。根据该指令,装置将高速暂存存储器的指定地址的指定大小的向量数据存至外部目的地址处;
向量搬运指令(VMOVE)。根据该指令,装置将高速暂存存储器的指定地址的指定大小的向量数据存至高速暂存存储器的另一指定地址处。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
图3是本发明实施例提供的向量逻辑运算装置的结构示意图,如图3所示,装置包括取指模块、译码模块、指令队列、标量寄存器堆、依赖关系处理单元、存储队列、重排序缓存、向量逻辑运算单元、高速暂存器、IO内存存取模块;
取指模块,该模块负责从指令序列中取出下一条将要执行的指令,并将该指令传给译码模块;
译码模块,该模块负责对指令进行译码,并将译码后指令传给指令队列;
指令队列,考虑到不同指令在包含的标量寄存器上有可能存在依赖关系,用于缓存译码后的指令,当依赖关系被满足之后发射指令;
标量寄存器堆,提供装置在运算过程中所需的标量寄存器;
依赖关系处理单元,该模块处理处理指令与前一条指令可能存在的存储依赖关系。向量逻辑运算指令会访问高速暂存存储器,前后指令可能会访问同一块存储空间。为了保证指令执行结果的正确性,当前指令如果被检测到与之前的指令的数据存在依赖关系,该指令必须在存储队列内等待至依赖关系被消除。
存储队列,该模块是一个有序队列,与之前指令在数据上有依赖关系的指令被存储在该队列内直至存储关系被消除;
重排序缓存,指令在执行过程中,同时也被缓存在给模块中,当一条指令执行完之后,如果该指令同时也是重排序缓存中未被提交指令中最早的一条指令,该指令将背提交。一旦提交,该条指令进行的操作对装置状态的改变将无法撤销;
向量逻辑运算单元,该模块负责装置的所有向量逻辑运算,向量逻辑运算指令被送往该运算单元执行;
高速暂存器,该模块是向量数据专用的暂存存储装置,能够支持不同大小的向量数据;
IO内存存取模块,该模块用于直接访问高速暂存存储器,负责从高速暂存存储器中读取数据或写入数据。
图4是本发明实施例提供的向量逻辑运算装置执行向量间与运算指令的流程图,如图4所示,执行向量逻辑运算间与指令的过程包括:
S1,取指模块取出该条间与向量逻辑指令,并将该指令送往译码模块。
S2,译码模块对指令译码,并将向量间与指令送往指令队列。
S3,在指令队列中,该向量间与逻辑指令需要从标量寄存器堆中获取指令中四个操作域所对应的标量寄存器里的数据,包括向量vin0的起始地址、向量vin0的长度、向量vin1的起始地址、向量vin1的长度。
S4,在取得需要的标量数据后,该指令被送往依赖关系处理单元。依赖关系处理单元分析该指令与前面的尚未执行结束的指令在数据上是否存在依赖关系。该条指令需要在存储队列中等待至其与前面的未执行结束的指令在数据上不再存在依赖关系为止。
S5:依赖关系不存在后,该条向量间与指令被送往向量逻辑运算单元。向量逻辑运算单元根据所需数据的地址和长度从数据暂存器中取出需要的向量,然后在向量逻辑运算单元中完成间与运算。
S6,运算完成后,将结果写回至高速暂存存储器的指定地址,同时提交重排序缓存中的该向量间与逻辑指令。
图5为本发明实施例提供的向量逻辑运算单元的结构示意图,如图5所示,向量逻辑运算单元内包含向量间与部件、向量内与部件、向量间或部件和向量内或部件,并且,向量逻辑运算单元为多流水级结构,其中,向量间或部件和向量间与部件处于流水级1,向量内或部件和向量内与部件处于流水级2。这些单元处于不同的流水级,当连续串行的多条向量逻辑运算指令的先后次序与相应单元所在流水级顺序一致时,可以更加高效地实现这一连串向量逻辑运算指令所要求的操作。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (19)

1.一种向量逻辑运算装置,用于根据向量逻辑运算指令执行向量逻辑运算,包括:
存储单元,用于存储向量;
向量逻辑运算单元,用于获取向量逻辑运算指令;其中,所述向量逻辑运算指令包括:用于操作码和操作域,所述操作域包括向量起始地址、向量长度和输出向量地址;
所述向量逻辑运算单元还用于,根据所述向量起始地址和所述向量长度从所述存储单元中获取指定大小的向量,根据所述操作码对获取的向量进行向量逻辑运算,得到向量逻辑运算结果,并将所述向量逻辑运算结果写回至所述输出向量地址。
2.根据权利要求1所述的方法,其特征在于,所述向量逻辑运算指令包括向量内与指令、向量内或指令;
所述向量逻辑运算单元用于根据所述向量内与指令的向量起始地址和向量长度,从所述存储单元中取出指定大小的向量数据,并对所述向量中的每一位相与,获得向量内与运算结果;或者,
所述向量逻辑运算单元用于根据所述向量内或指令的向量起始地址和向量长度,从所述存储单元取出指定大小的向量数据,并对所述向量中的每一位相或,获得向量内或运算结果。
3.根据权利要求1所述的方法,其特征在于,所述向量逻辑运算指令为向量间与指令;所述向量间与指令的操作域包括第一向量的起始地址、第一向量的长度、第二向量的起始地址以及第二向量的长度;
所述向量逻辑运算单元用于根据所述第一向量的起始地址、所述第一向量的长度、所述第二向量的起始地址以及所述第二向量的长度,从所述存储单元中分别取出至指定大小的第一向量和第二向量,并将所述第一向量和所述第二向量对位相与,得到向量间与运算结果。
4.根据权利要求1所述的方法,其特征在于,所述向量逻辑运算指令包括向量间或指令;所述向量间或指令的操作域包括第一向量的起始地址、第一向量的长度、第二向量的起始地址以及第二向量的长度;
所述向量逻辑运算单元用于根据所述第一向量的起始地址、所述第一向量的长度、所述第二向量的起始地址以及所述第二向量的长度,从所述存储单元中分别取出至指定大小的第一向量和第二向量,并将所述第一向量和所述第二向量对位相或,得到向量间或运算结果。
5.根据权利要求1所述的向量逻辑运算装置,其特征在于,所述向量逻辑运算指令还包括向量检索指令,所述向量检索指令的操作域还包括位置参数;
所述向量逻辑运算单元还用于根据所述向量检索指令的向量起始地址和向量长度取出指定大小的向量数据,并根据所述位置参数从指定位置取出向量中的相应元素作为输出。
6.根据权利要求1所述的向量逻辑运算装置,其特征在于,所述向量逻辑运算指令还包括向量加载指令、向量存储指令和向量搬运指令:
所述向量逻辑运算单元还用于根据该所述向量加载指令的向量起始地址和向量长度载入指定大小的向量数据至所述输出向量地址;其中,所述向量起始地址为外部源地址,所述输出向量地址为所述存储单元的指定地址;
所述向量逻辑运算单元还用于根据向量存储指令的向量起始地址和向量长度,将指定大小的向量数据存至所述输出向量地址;其中,所述向量起始地址为所述存储单元的指定地址,所述向量输出地址为外部源地址;
所述向量逻辑运算单元还用于根据所述向量搬运指令的向量起始地址和向量长度,将指定大小的向量数据存至输出向量地址;其中,所述向量起始地址和所述向量输出地址均为所述存储单元的指定地址。
7.根据权利要求1所述的向量逻辑运算装置,其特征在于,还包括:指令缓存单元,用于存储待执行的向量逻辑运算指令。
8.根据权利要求7所述的向量逻辑运算装置,其特征在于,还包括用于对所述向量逻辑运算指令进行处理的指令处理单元;所述指令处理单元包括:
取指模块,用于从指令缓存单元中获取向量逻辑运算指令;
译码模块,用于对获取的向量逻辑运算指令进行译码;
指令队列,用于对译码后的向量逻辑运算指令进行顺序存储;所述向量逻辑运算单元能够根据所述指令队列中存储的向量逻辑运算指令进行运算。
9.根据权利要求1所述的向量逻辑运算装置,其特征在于,还包括依赖关系处理单元和存储队列:
所述依赖关系处理单元用于在向量逻辑运算单元获取向量逻辑运算指令前,判断该向量逻辑运算指令与前一向量逻辑运算指令是否访问相同的向量,若是,将该向量逻辑运算指令存储在一存储队列中,待前一向量逻辑运算指令执行完毕后,将存储队列中的该向量逻辑运算指令提供给所述向量逻辑运算单元;否则,直接将该向量逻辑运算指令提供给所述向量逻辑运算单元。
10.根据权利要求1所述的向量逻辑运算装置,其特征在于,所述存储单元还用于存储所述向量逻辑运算结果;
所述存储单元为高速暂存存储器。
11.根据权利要求10所述的向量逻辑运算装置,其特征在于,还包括:
输入输出单元,用于将向量存储于所述存储单元,或者,从所述存储单元中获取向量逻辑运算结果。
12.根据权利要求1所述的向量逻辑运算装置,其特征在于,所述装置还包括寄存器单元,用于存储向量起始地址;
所述操作域为寄存器单元编号,所述向量逻辑运算单元根据该寄存器单元编号访问所述寄存器单元,并获取向量起始地址和向量长度。
13.根据权利要求1-12任一项所述的向量逻辑运算装置,其特征在于,所述向量逻辑运算单元包括向量间与部件、向量内与部件、向量间或部件和向量内或部件;
所述向量间与部件和所述向量间或部件处于第一流水级,所述向量内或部件和所述向量内与部件处于第二流水级。
14.一种向量逻辑运算方法,用于根据向量逻辑运算指令执行向量逻辑运算,所述方法包括:
获取向量逻辑运算指令;其中,所述向量逻辑运算指令包括用于指示所述向量逻辑运算指令功能的操作码和用于指示所述向量逻辑运算指令的操作域,所述操作域包括向量起始地址、向量长度和输出向量地址;
根据所述向量起始地址和所述向量长度从所述存储单元中获取指定大小的向量;
根据所述操作码对获取的向量进行向量逻辑运算,得到向量逻辑运算结果,并将所述向量逻辑运算结果写回至所述输出向量地址。
15.根据权利要求14所述的向量逻辑运算方法,其特征在于,所述向量逻辑运算指令包括向量内与指令、向量内或指令、向量加载指令、向量存储指令和向量搬运指令:
根据所述操作码对获取的向量进行向量逻辑运算,得到向量逻辑运算结果,包括:
根据向量间与指令的操作码对所述向量中的每一位相与,获得向量内与运算结果;或者,
根据向量间或指令的操作码对所述向量中的每一位相或,获得向量内或运算结果;或者
根据该所述向量加载指令的操作码载入指定大小的向量数据至所述输出向量地址;其中,所述向量起始地址为外部源地址,所述输出向量地址为所述存储单元的指定地址;或者,
根据向量存储指令的操作码将指定大小的向量数据存至所述输出向量地址;其中,所述向量起始地址为所述存储单元的指定地址,所述向量输出地址为外部源地址;或者
根据所述向量搬运指令的操作码将指定大小的向量数据存至输出向量地址;其中,所述向量起始地址和所述向量输出地址均为所述存储单元的指定地址。
16.根据权利要求14所述的向量逻辑运算方法,其特征在于,所述向量逻辑运算指令包括向量间与指令或向量间或指令;所述向量间与指令和所述向量间或指令的操作域包括第一向量的起始地址、第一向量的长度、第二向量的起始地址以及第二向量的长度;
根据所述向量起始地址和所述向量长度从所述存储单元中获取指定大小的向量;根据所述操作码对获取的向量进行向量逻辑运算,得到向量逻辑运算结果,包括:
根据所述第一向量的起始地址、所述第一向量的长度、所述第二向量的起始地址以及所述第二向量的长度,从所述存储单元中分别取出至指定大小的第一向量和第二向量,并将所述第一向量和所述第二向量对位相与,得到向量逻辑与运算结果;或者,
根据所述第一向量的起始地址、所述第一向量的长度、所述第二向量的起始地址以及所述第二向量的长度,从所述存储单元中分别取出至指定大小的第一向量和第二向量,并将所述第一向量和所述第二向量对位相或,得到向量间或运算结果。
17.根据权利要求14所述的向量逻辑运算方法,其特征在于,所述向量逻辑运算指令包括向量检索指令,所述向量检索指令的操作域还包括位置参数;
根据所述向量起始地址和所述向量长度从所述存储单元中获取指定大小的向量;根据所述操作码对获取的向量进行向量逻辑运算,得到向量逻辑运算结果,包括:
根据所述向量检索指令的向量起始地址和向量长度取出指定大小的向量数据,并根据所述位置参数从指定位置取出向量中的相应元素作为输出。
18.根据权利要求14所述的向量逻辑运算方法,其特征在于,获取向量逻辑运算指令之前,所述方法还包括:
获取存储的向量逻辑运算指令;
对获取的向量逻辑运算指令进行译码;
对译码后的向量逻辑运算指令进行顺序存储。
19.根据权利要求14或18所述的向量逻辑运算方法,其特征在于,所述方法还包括:
判断该向量逻辑运算指令与前一向量逻辑运算指令是否访问相同的向量,若是,将该向量逻辑运算指令存储在一存储队列中,待前一向量逻辑运算指令执行完毕后,再执行所述获取向量逻辑运算指令;否则,直接执行所述获取向量逻辑运算指令。
CN202010608257.0A 2016-04-26 2016-04-26 一种用于执行向量逻辑运算的装置 Pending CN111651202A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010608257.0A CN111651202A (zh) 2016-04-26 2016-04-26 一种用于执行向量逻辑运算的装置
CN201610267024.2A CN107315568B (zh) 2016-04-26 2016-04-26 一种用于执行向量逻辑运算的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010608257.0A CN111651202A (zh) 2016-04-26 2016-04-26 一种用于执行向量逻辑运算的装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201610267024.2A Division CN107315568B (zh) 2016-04-26 2016-04-26 一种用于执行向量逻辑运算的装置

Publications (1)

Publication Number Publication Date
CN111651202A true CN111651202A (zh) 2020-09-11

Family

ID=60161748

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010608257.0A Pending CN111651202A (zh) 2016-04-26 2016-04-26 一种用于执行向量逻辑运算的装置
CN201610267024.2A Active CN107315568B (zh) 2016-04-26 2016-04-26 一种用于执行向量逻辑运算的装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201610267024.2A Active CN107315568B (zh) 2016-04-26 2016-04-26 一种用于执行向量逻辑运算的装置

Country Status (4)

Country Link
US (2) US20190073219A1 (zh)
EP (1) EP3451159B1 (zh)
CN (2) CN111651202A (zh)
WO (1) WO2017185404A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111651202A (zh) 2016-04-26 2020-09-11 中科寒武纪科技股份有限公司 一种用于执行向量逻辑运算的装置
CN111079910B (zh) * 2018-10-19 2021-01-26 中科寒武纪科技股份有限公司 运算方法、装置及相关产品
CN111079912B (zh) * 2018-10-19 2021-02-12 中科寒武纪科技股份有限公司 运算方法、系统及相关产品

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5838984A (en) * 1996-08-19 1998-11-17 Samsung Electronics Co., Ltd. Single-instruction-multiple-data processing using multiple banks of vector registers
CN1142484C (zh) * 2001-11-28 2004-03-17 中国人民解放军国防科学技术大学 微处理器向量处理方法
US7730266B2 (en) * 2007-03-31 2010-06-01 Intel Corporation Adaptive range snoop filtering methods and apparatuses
US20120137090A1 (en) * 2010-11-29 2012-05-31 Sukalpa Biswas Programmable Interleave Select in Memory Controller
CN102156637A (zh) * 2011-05-04 2011-08-17 中国人民解放军国防科学技术大学 向量交叉多线程处理方法及向量交叉多线程微处理器
CN102262525B (zh) * 2011-08-29 2014-11-19 孙瑞玮 基于矢量运算的矢量浮点运算装置及方法
SE536462C2 (sv) * 2011-10-18 2013-11-26 Mediatek Sweden Ab Digital signalprocessor och basbandskommunikationsanordning
GB2519108A (en) * 2013-10-09 2015-04-15 Advanced Risc Mach Ltd A data processing apparatus and method for controlling performance of speculative vector operations
US9836277B2 (en) * 2014-10-01 2017-12-05 Samsung Electronics Co., Ltd. In-memory popcount support for real time analytics
CN111651202A (zh) 2016-04-26 2020-09-11 中科寒武纪科技股份有限公司 一种用于执行向量逻辑运算的装置

Also Published As

Publication number Publication date
EP3451159A4 (en) 2020-04-01
US11126429B2 (en) 2021-09-21
CN107315568A (zh) 2017-11-03
US20190073219A1 (en) 2019-03-07
EP3451159B1 (en) 2021-05-26
US20190171454A1 (en) 2019-06-06
WO2017185404A1 (zh) 2017-11-02
EP3451159A1 (en) 2019-03-06
CN107315568B (zh) 2020-08-07

Similar Documents

Publication Publication Date Title
CN107315715B (zh) 一种用于执行矩阵加/减运算的装置和方法
CN106990940B (zh) 一种向量计算装置及运算方法
CN107315575B (zh) 一种用于执行向量合并运算的装置和方法
WO2017185395A1 (zh) 一种用于执行向量比较运算的装置和方法
CN107315568B (zh) 一种用于执行向量逻辑运算的装置
EP3451156B1 (en) Apparatus and method for executing vector circular shift operation
CN107315718B (zh) 一种用于执行向量内积运算的装置和方法
CN107315717B (zh) 一种用于执行向量四则运算的装置和方法
CN107315716B (zh) 一种用于执行向量外积运算的装置和方法
CN107315567B (zh) 一种用于执行向量最大值最小值运算的装置和方法
CN107305486B (zh) 一种神经网络maxout层计算装置
WO2018024094A1 (zh) 一种运算装置及其操作方法
WO2017185388A1 (zh) 一种用于生成服从一定分布的随机向量的装置和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination