CN115993949A - 一种面向多核处理器的向量数据的处理方法及装置 - Google Patents

一种面向多核处理器的向量数据的处理方法及装置 Download PDF

Info

Publication number
CN115993949A
CN115993949A CN202310277393.XA CN202310277393A CN115993949A CN 115993949 A CN115993949 A CN 115993949A CN 202310277393 A CN202310277393 A CN 202310277393A CN 115993949 A CN115993949 A CN 115993949A
Authority
CN
China
Prior art keywords
vector
operation code
vector operation
processing
instruction queue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310277393.XA
Other languages
English (en)
Other versions
CN115993949B (zh
Inventor
孔令军
王贤坤
邹晓峰
庞兆春
林宁亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202310277393.XA priority Critical patent/CN115993949B/zh
Publication of CN115993949A publication Critical patent/CN115993949A/zh
Application granted granted Critical
Publication of CN115993949B publication Critical patent/CN115993949B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Advance Control (AREA)

Abstract

本发明提出一种面向多核处理器的向量数据的处理方法、装置、设备及介质。方法包括:混合指令队列确认对接收的向量操作码处理的优先级,按照所述处理优先级依次获取执行所述向量操作码的向量计算单元的当前状态;根据所述当前状态判断是否将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算,以及判断是否继续将所述向量计算单元执行的向量操作码下发给所述混合指令队列。本发明公开的方案提高了对向量数据处理的效率,同时保障了时效性和计算速度。

Description

一种面向多核处理器的向量数据的处理方法及装置
技术领域
本发明涉及数据处理领域,尤其涉及一种面向多核处理器的向量数据的处理方法及装置。
背景技术
向量处理单元可以处理向量数据,向量处理单元通常包括一个向量寄存器和多个向量计算单元,比如向量加法单元、乘法单元、浮点数单元等。
在面向多核处理器的向量数据处理的相关领域,向量处理单元一般只面向单个的处理器进行处理或者直接挂接在总线上被多个核心处理器通过总线命令使用,由于向量处理单元的利用率和规模的限制,在面向多核处理器的向量数据处理的处理过程中受限于单个单核处理器的面积或者总线速度,而无法保障处理速度和时效性,影响对向量数据处理的效率。
发明内容
有鉴于此,本发明提出了一种面向多核处理器的向量数据的处理方法及装置,其中,本发明提出的一种面向多核处理器的向量数据的处理方法解决了现有技术中在面向多核处理器的向量数据处理的处理过程中,受限于单个单核处理器的面积或者总线速度,而无法保障处理速度和时效性,影响对向量数据处理的效率的问题。
基于以上目的,本发明的实施例的一个方面提供了一种面向多核处理器的向量数据的处理方法,包括:混合指令队列确认对接收的向量操作码处理的优先级,按照所述处理优先级依次获取执行所述向量操作码的向量计算单元的当前状态;根据所述当前状态判断是否将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算,以及判断是否继续将所述向量计算单元执行的向量操作码下发给所述混合指令队列。
在一些实施例中,所述混合指令队列确认对接收的向量操作码处理的优先级的步骤包括:所述混合指令队列按照接收向量操作码的时间顺序确认对接收的向量操作码处理的优先级。
在一些实施例中,所述混合指令队列按照接收向量操作码的时间顺序确认对接收的向量操作码处理的优先级的步骤包括:对所述混合指令队列配置先进先出缓存区,并基于所述先进先出缓存区对接收的向量操作码按照先进先出的顺序确认对接收的向量操作码处理的优先级。
在一些实施例中,所述混合指令队列确认对接收的向量操作码处理的优先级的步骤还包括:响应于接收到来自多个核心处理器的相同向量操作码,按照接收所述相同向量操作码的时间顺序确认对所述相同向量操作码处理的优先级。
在一些实施例中,所述执行所述向量操作码的向量计算单元的当前状态包括:空闲状态或忙状态。
在一些实施例中,所述根据所述当前状态判断是否将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算的步骤包括:响应于当前状态为空闲状态,将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算。
在一些实施例中,所述根据所述当前状态判断是否将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算的步骤还包括:响应于当前状态为忙状态,等待执行所述向量操作码的向量计算单元转变为空闲状态。
在一些实施例中,所述判断是否继续将所述向量计算单元执行的向量操作码下发给所述混合指令队列的步骤包括:响应于所述向量操作码所属的核心处理器检测到执行所述向量操作码的向量计算单元为空闲状态,所述向量操作码所属的核心处理器继续向所述混合指令队列下发所述向量计算单元执行的向量操作码。
在一些实施例中,所述判断是否继续将所述向量计算单元执行的向量操作码下发给所述混合指令队列的步骤还包括:响应于所述向量操作码所属的核心处理器检测到执行所述向量操作码的向量计算单元为忙状态且超过阈值时间,通过所述向量计算单元向所述混合指令队列反馈满信号。
在一些实施例中,还包括:通过每个核心处理器的取指单元获取待执行指令,并经由所述取指单元发送给解码单元进行解码后输出对应的向量操作码。
在一些实施例中,还包括:通过向量操作码发射单元接收所述解码单元输出的向量操作码,并经由所述向量操作码发射单元发送给所述混合指令队列。
在一些实施例中,还包括:通过所述向量操作码所属的核心处理器的指令提交单元向所述向量操作码所属的核心处理器的向量操作码发射单元反馈执行所述向量操作码的向量计算单元的状态。
本发明实施例的另一个方面,还提供了一种面向多核处理器的向量数据的处理装置,包括:第一模块,配置用于混合指令队列确认对接收的向量操作码处理的优先级,按照所述处理优先级依次获取执行所述向量操作码的向量计算单元的当前状态;第二模块,配置用于根据所述当前状态判断是否将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算,以及判断是否继续将所述向量计算单元执行的向量操作码下发给所述混合指令队列。
在一些实施例中,所述第一模块进一步配置用于:所述混合指令队列按照接收向量操作码的时间顺序确认对接收的向量操作码处理的优先级。
在一些实施例中,所述第一模块进一步配置用于:对所述混合指令队列配置先进先出缓存区,并基于所述先进先出缓存区对接收的向量操作码按照先进先出的顺序确认对接收的向量操作码处理的优先级。
在一些实施例中,所述第一模块进一步配置用于:响应于接收到来自多个核心处理器的相同向量操作码,按照接收所述相同向量操作码的时间顺序确认对所述相同向量操作码处理的优先级。
在一些实施例中,所述执行所述向量操作码的向量计算单元的当前状态包括:空闲状态或忙状态。
在一些实施例中,所述第二模块进一步配置用于:响应于当前状态为空闲状态,将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算。
在一些实施例中,所述第二模块进一步配置用于:响应于当前状态为忙状态,等待执行所述向量操作码的向量计算单元转变为空闲状态。
在一些实施例中,所述第二模块进一步配置用于:响应于所述向量操作码所属的核心处理器检测到执行所述向量操作码的向量计算单元为空闲状态,所述向量操作码所属的核心处理器继续向所述混合指令队列下发所述向量计算单元执行的向量操作码。
在一些实施例中,所述第二模块进一步配置用于:响应于所述向量操作码所属的核心处理器检测到执行所述向量操作码的向量计算单元为忙状态且超过阈值时间,通过所述向量计算单元向所述混合指令队列反馈满信号。
在一些实施例中,所述装置还包括:第三模块,配置用于通过每个核心处理器的取指单元获取待执行指令,并经由所述取指单元发送给解码单元进行解码后输出对应的向量操作码。
在一些实施例中,所述装置还包括:第四模块,配置用于通过向量操作码发射单元接收所述解码单元输出的向量操作码,并经由所述向量操作码发射单元发送给所述混合指令队列。
在一些实施例中,所述装置还包括:第五模块,通过所述向量操作码所属的核心处理器的指令提交单元向所述向量操作码所属的核心处理器的向量操作码发射单元反馈执行所述向量操作码的向量计算单元的状态。
本发明实施例的另一方面,还提供一种计算机设备,包括至少一个处理器;以及存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现上述任一方法的步骤。
本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现如上任一方法步骤的计算机程序。
基于多核处理器对向量数据处理的过程中,对向量数据处理的向量计算单元受限于单个核心处理器的面积或者依附于总线而受限于总线计算速度,本发明提出一种面向多核处理器的向量数据的处理方法,为多核处理器提供共用的向量计算单元,不受限于单个核心处理器的面积限制或者依附于总线与多核处理器进行交互。具体地,在将来自多个核心处理器的向量操作码发送给对应的计算单元进行计算之前,通过混合指令队列确定对其进行处理的优先级,可以对多个核心处理器的数据按序进行处理且不会受限于单个核心处理器的面积;同时在将其发送给对应的计算单元之前会根据对应计算单元的状态以判断是否进行发送,提供对向量数据进行处理的一整套完整的处理流程,对于多个核心处理器而言,所共用的向量计算单元都是面向自己本身的,因此不会对计算速度造成影响。
本发明至少具有以下有益效果:本发明提出一种面向多核处理器的向量数据的处理方法、装置、设备及介质,其中,本发明提出的一种面向多核处理器的向量数据的处理方案可以实现多个核心处理器通过混合指令队列共用一个向量处理单元,各个核心处理器可以通过向量操作码直接与向量操作码对应的计算单元交互,提高了对向量数据处理的效率,同时保障了时效性和计算速度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的实施例。
图1示出的为本发明实施例提供的一种面向多核处理器的向量数据的处理方法的流程图;
图2示出的为本发明实施例提供的面向多核处理器的向量操作码调度流程图;
图3示出的为本发明提供的一种面向多核处理器的向量数据的处理装置的结构示意图;
图4示出了本发明提供的一种计算机设备的结构示意图;
图5示出了本发明提供的一种计算机可读存储介质的结构示意图。
具体实施方式
以下描述了本发明的实施例。然而,应该理解,所公开的实施例仅仅是示例,并且其它实施例可以采取各种替代形式。
此外,需要说明的是术语“包括”、“包含”或其任何其它变形旨在涵盖非排他性的包括,以使包含一系列要素的过程、方法、物品或装置不仅包括那些要素,也可以包括未明确列出的或这些过程、方法、物品或装置所固有的要素。
下面将结合附图说明本申请的一个或多个实施例。
基于以上目的,本发明实施例的第一个方面,提出了一种面向多核处理器的向量数据的处理方法的实施例。图1示出的是本发明实施例提供的一种面向多核处理器的向量数据的处理方法的实施例的流程图。如图1所示,本发明实施例的一种面向多核处理器的向量数据的处理方法包括以下步骤:
S1、混合指令队列确认对接收的向量操作码处理的优先级,按照所述处理优先级依次获取执行所述向量操作码的向量计算单元的当前状态;
S2、根据所述当前状态判断是否将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算,以及判断是否继续将所述向量计算单元执行的向量操作码下发给所述混合指令队列。
根据本发明的若干实施例,混合指令队列确认对接收的向量操作码处理的优先级的步骤包括:混合指令队列按照接收向量操作码的时间顺序确认对接收的向量操作码处理的优先级。
根据本发明的若干实施例,混合指令队列按照接收向量操作码的时间顺序确认对接收的向量操作码处理的优先级的步骤包括:对混合指令队列配置先进先出缓存区,并基于先进先出缓存区对接收的向量操作码按照先进先出的顺序确认对接收的向量操作码处理的优先级。
根据本发明的若干实施例,混合指令队列确认对接收的向量操作码处理的优先级的步骤还包括:响应于接收到来自多个核心处理器的相同向量操作码,按照接收相同向量操作码的时间顺序确认对相同向量操作码处理的优先级。
根据本发明的若干实施例,执行向量操作码的向量计算单元的当前状态包括:空闲状态或忙状态。
根据本发明的若干实施例,根据当前状态判断是否将向量操作码发送给执行向量操作码的向量计算单元进行计算的步骤包括:响应于当前状态为空闲状态,将向量操作码发送给执行向量操作码的向量计算单元进行计算。
根据本发明的若干实施例,根据当前状态判断是否将向量操作码发送给执行向量操作码的向量计算单元进行计算的步骤还包括:响应于当前状态为忙状态,等待执行向量操作码的向量计算单元转变为空闲状态。
根据本发明的若干实施例,判断是否继续将向量计算单元执行的向量操作码下发给混合指令队列的步骤包括:响应于向量操作码所属的核心处理器检测到执行向量操作码的向量计算单元为空闲状态,向量操作码所属的核心处理器继续向混合指令队列下发向量计算单元执行的向量操作码。
根据本发明的若干实施例,判断是否继续将向量计算单元执行的向量操作码下发给混合指令队列的步骤还包括:响应于向量操作码所属的核心处理器检测到执行向量操作码的向量计算单元为忙状态且超过阈值时间,通过向量计算单元向混合指令队列反馈满信号。
根据本发明的若干实施例,还包括:通过每个核心处理器的取指单元获取待执行指令,并经由取指单元发送给解码单元进行解码后输出对应的向量操作码。
根据本发明的若干实施例,还包括:通过向量操作码发射单元接收解码单元输出的向量操作码,并经由向量操作码发射单元发送给混合指令队列。
根据本发明的若干实施例,还包括:通过向量操作码所属的核心处理器的指令提交单元向向量操作码所属的核心处理器的向量操作码发射单元反馈执行向量操作码的向量计算单元的状态。
以下为本发明提供的一种面向多核处理器的向量数据的处理方法的另一实施例。
图2示出的为本发明实施例提供的面向多核处理器的向量操作码调度流程图,如图2所示,在本实施例中,两个核心处理器共用向量处理单元,在向量处理单元的输入端有面向核心1和核心2的混合指令队列,核心1和核心2分别有各自的取指单元、解码单元、发射单元、标量处理单元以及指令提交单元,对于每个核心处理器而言,向量处理单元都是面向自己的,因此向量处理单元不受限于单个核心处理器的面积,也不会存在重复的向量处理单元进一步占据系统的有限面积,因此可以在向量处理单元内部的寄存器中部署面向对应核心处理器的功能性部件进行使用而不会占据系统的有限面积。
在对向量数据处理的过程中,取指单元接收到待执行指令并发送给解码单元进行解码得到向量操作码,然后将向量操作码发送到本核心处理器的发射单元中等待发送到混合指令队列中。当有向量操作码在发射队列,指令提交单元反馈为空,即该向量操作码对应的计算单元处于空闲状态,则将该向量操作码从发射单元发送到混合指令队列中。混合指令队列接收到向量操作码后,将来自不同核心的向量操作码在对应的指令队列按照接收的时间顺序判断处理的优先级。只有当向量操作码对应计算单元处于空闲时,混合指令队列将其发送给对应的计算单元执行该向量操作码的指令。当该计算单元执行完成,将完成标志提交给对应核心的指令提交单元,以通过该指令提交单元反馈给发射单元可以开始发射向量操作码。如果两个核心向量执行单元发射相同的向量操作码,比如加法,但是向量计算单元只有一个加法计算单元的情况下,混合指令队列配置了一个先进先出的缓存器,当向量操作码到来后,先进入的向量操作码来源处理器对应的指令队列,当向量执行单元判断向量操作码所对应的执行单元空闲后,再发射该条指令,即保证了由处理器过来的向量操作码不会丢失,也避免了冲突。也就是说,每个核心处理器发送给向量处理单元的向量操作码在执行之前,会按照混合指令队列对其接收的时间顺序确认对其进行处理的优先级,只有在处理到当前向量操作码对应的向量计算单元为空闲状态时,才会将当前向量操作码发送给该向量计算单元进行计算,否则会在混合指令队列中进行等待,直到其对应的计算单元转换为空闲状态再发送给该计算单元。按照以上对多核处理器的向量操作码的处理方式,可以避免来自多核处理器的相同操作码之间的冲突问题,同时这种处理方式不依附于总线与多个核心处理器进行交互,可以大大提高对向量数据的处理速度。
同时,为每个处理器核心也都配置了对应的独立向量寄存器,对于每一个核心处理器,都独立拥有一个向量寄存器文件,每个向量寄存器文件都保存32个向量,也就是说,对于每一个核心处理器都可以拥有32个向量,可以解决对于多核处理器存在的寄存器冲突问题,具体而言,在向量处理单元中配置面向对应核心处理器的向量寄存器文件,在对向量操作码进行处理的过程中,避免来自多个核心处理器的向量操作码同时用一个寄存器而产生冲突的问题。
本发明的实施例的第二个方面,提出了一种面向多核处理器的向量数据的处理装置。图3示出的是本发明提供的一种面向多核处理器的向量数据的处理装置的结构示意图。如图3所示,本发明提供的一种面向多核处理器的向量数据的处理装置包括:第一模块11,配置用于混合指令队列确认对接收的向量操作码处理的优先级,按照所述处理优先级依次获取执行所述向量操作码的向量计算单元的当前状态;第二模块12,配置用于根据所述当前状态判断是否将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算,以及判断是否继续将所述向量计算单元执行的向量操作码下发给所述混合指令队列。
根据本发明的若干实施例,所述第一模块进一步配置用于:所述混合指令队列按照接收向量操作码的时间顺序确认对接收的向量操作码处理的优先级。
根据本发明的若干实施例,所述第一模块进一步配置用于:对所述混合指令队列配置先进先出缓存区,并基于所述先进先出缓存区对接收的向量操作码按照先进先出的顺序确认对接收的向量操作码处理的优先级。
根据本发明的若干实施例,所述第一模块进一步配置用于:响应于接收到来自多个核心处理器的相同向量操作码,按照接收所述相同向量操作码的时间顺序确认对所述相同向量操作码处理的优先级。
根据本发明的若干实施例,所述执行所述向量操作码的向量计算单元的当前状态包括:空闲状态或忙状态。
根据本发明的若干实施例,所述第二模块进一步配置用于:响应于当前状态为空闲状态,将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算。
根据本发明的若干实施例,所述第二模块进一步配置用于:响应于当前状态为忙状态,等待执行所述向量操作码的向量计算单元转变为空闲状态。
根据本发明的若干实施例,所述第二模块进一步配置用于:响应于所述向量操作码所属的核心处理器检测到执行所述向量操作码的向量计算单元为空闲状态,所述向量操作码所属的核心处理器继续向所述混合指令队列下发所述向量计算单元执行的向量操作码。
根据本发明的若干实施例,所述第二模块进一步配置用于:响应于所述向量操作码所属的核心处理器检测到执行所述向量操作码的向量计算单元为忙状态且超过阈值时间,通过所述向量计算单元向所述混合指令队列反馈满信号。
根据本发明的若干实施例,所述装置还包括:第三模块,配置用于通过每个核心处理器的取指单元获取待执行指令,并经由所述取指单元发送给解码单元进行解码后输出对应的向量操作码。
根据本发明的若干实施例,所述装置还包括:第四模块,配置用于通过向量操作码发射单元接收所述解码单元输出的向量操作码,并经由所述向量操作码发射单元发送给所述混合指令队列。
根据本发明的若干实施例,所述装置还包括:第五模块,通过所述向量操作码所属的核心处理器的指令提交单元向所述向量操作码所属的核心处理器的向量操作码发射单元反馈执行所述向量操作码的向量计算单元的状态。
基于以上目的,本发明实施例的第三个方面,提出了一种计算机设备,图4示出的是本发明提供的一种计算机设备的结构示意图。如图4所示,本发明提供的一种计算机设备的实施例,包括以下模块:至少一个处理器21;以及存储器22,存储器22存储有可在处理器21上运行的计算机指令23,该计算机指令23由处理器21执行时实现如上所述的方法的步骤,其中所述步骤包括:混合指令队列确认对接收的向量操作码处理的优先级,按照所述处理优先级依次获取执行所述向量操作码的向量计算单元的当前状态;根据所述当前状态判断是否将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算,以及判断是否继续将所述向量计算单元执行的向量操作码下发给所述混合指令队列。
在一些实施例中,所述混合指令队列确认对接收的向量操作码处理的优先级的步骤包括:所述混合指令队列按照接收向量操作码的时间顺序确认对接收的向量操作码处理的优先级。
在一些实施例中,所述混合指令队列按照接收向量操作码的时间顺序确认对接收的向量操作码处理的优先级的步骤包括:对所述混合指令队列配置先进先出缓存区,并基于所述先进先出缓存区对接收的向量操作码按照先进先出的顺序确认对接收的向量操作码处理的优先级。
在一些实施例中,所述混合指令队列确认对接收的向量操作码处理的优先级的步骤还包括:响应于接收到来自多个核心处理器的相同向量操作码,按照接收所述相同向量操作码的时间顺序确认对所述相同向量操作码处理的优先级。
在一些实施例中,所述执行所述向量操作码的向量计算单元的当前状态包括:空闲状态或忙状态。
在一些实施例中,所述根据所述当前状态判断是否将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算的步骤包括:响应于当前状态为空闲状态,将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算。
在一些实施例中,所述根据所述当前状态判断是否将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算的步骤还包括:响应于当前状态为忙状态,等待执行所述向量操作码的向量计算单元转变为空闲状态。
在一些实施例中,所述判断是否继续将所述向量计算单元执行的向量操作码下发给所述混合指令队列的步骤包括:响应于所述向量操作码所属的核心处理器检测到执行所述向量操作码的向量计算单元为空闲状态,所述向量操作码所属的核心处理器继续向所述混合指令队列下发所述向量计算单元执行的向量操作码。
在一些实施例中,所述判断是否继续将所述向量计算单元执行的向量操作码下发给所述混合指令队列的步骤还包括:响应于所述向量操作码所属的核心处理器检测到执行所述向量操作码的向量计算单元为忙状态且超过阈值时间,通过所述向量计算单元向所述混合指令队列反馈满信号。
在一些实施例中,还包括:通过每个核心处理器的取指单元获取待执行指令,并经由所述取指单元发送给解码单元进行解码后输出对应的向量操作码。
在一些实施例中,还包括:通过向量操作码发射单元接收所述解码单元输出的向量操作码,并经由所述向量操作码发射单元发送给所述混合指令队列。
在一些实施例中,还包括:通过所述向量操作码所属的核心处理器的指令提交单元向所述向量操作码所属的核心处理器的向量操作码发射单元反馈执行所述向量操作码的向量计算单元的状态。
本发明还提供了一种计算机可读存储介质。图5示出的是本发明提供的一种计算机可读存储介质的结构示意图。如图5所示,计算机可读存储介质31存储有被处理器执行时执行如上所述的方法的步骤的计算机程序32。
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,设置系统参数的方法的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,程序的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
此外,根据本发明实施例公开的方法还可以被实现为由处理器执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被处理器执行时,执行本发明实施例公开的方法中限定的上述功能。
此外,上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
在一个或多个示例性设计中,功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(DSL)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、DOL或诸如红外线、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(CD)、激光盘、光盘、数字多功能盘(DVD)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (15)

1.一种面向多核处理器的向量数据的处理方法,其特征在于,包括:
混合指令队列确认对接收的向量操作码处理的优先级,按照所述处理优先级依次获取执行所述向量操作码的向量计算单元的当前状态;
根据所述当前状态判断是否将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算,以及判断是否继续将所述向量计算单元执行的向量操作码下发给所述混合指令队列。
2.根据权利要求1所述的方法,其特征在于,所述混合指令队列确认对接收的向量操作码处理的优先级的步骤包括:
所述混合指令队列按照接收向量操作码的时间顺序确认对接收的向量操作码处理的优先级。
3.根据权利要求2所述的方法,其特征在于,所述混合指令队列按照接收向量操作码的时间顺序确认对接收的向量操作码处理的优先级的步骤包括:
对所述混合指令队列配置先进先出缓存区,并基于所述先进先出缓存区对接收的向量操作码按照先进先出的顺序确认对接收的向量操作码处理的优先级。
4.根据权利要求3所述的方法,其特征在于,所述混合指令队列确认对接收的向量操作码处理的优先级的步骤还包括:
响应于接收到来自多个核心处理器的相同向量操作码,按照接收所述相同向量操作码的时间顺序确认对所述相同向量操作码处理的优先级。
5.根据权利要求1所述的方法,其特征在于,所述执行所述向量操作码的向量计算单元的当前状态包括:空闲状态或忙状态。
6.根据权利要求5所述的方法,其特征在于,所述根据所述当前状态判断是否将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算的步骤包括:
响应于当前状态为空闲状态,将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算。
7.根据权利要求5所述的方法,其特征在于,所述根据所述当前状态判断是否将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算的步骤还包括:
响应于当前状态为忙状态,等待执行所述向量操作码的向量计算单元转变为空闲状态。
8.根据权利要求5所述的方法,其特征在于,所述判断是否继续将所述向量计算单元执行的向量操作码下发给所述混合指令队列的步骤包括:
响应于所述向量操作码所属的核心处理器检测到执行所述向量操作码的向量计算单元为空闲状态,所述向量操作码所属的核心处理器继续向所述混合指令队列下发所述向量计算单元执行的向量操作码。
9.根据权利要求5所述的方法,其特征在于,所述判断是否继续将所述向量计算单元执行的向量操作码下发给所述混合指令队列的步骤还包括:
响应于所述向量操作码所属的核心处理器检测到执行所述向量操作码的向量计算单元为忙状态且超过阈值时间,通过所述向量计算单元向所述混合指令队列反馈满信号。
10.根据权利要求1-9的任一所述的方法,其特征在于,还包括:
通过每个核心处理器的取指单元获取待执行指令,并经由所述取指单元发送给解码单元进行解码后输出对应的向量操作码。
11.根据权利要求10所述的方法,其特征在于,还包括:
通过向量操作码发射单元接收所述解码单元输出的向量操作码,并经由所述向量操作码发射单元发送给所述混合指令队列。
12.根据权利要求11所述的方法,其特征在于,还包括:
通过所述向量操作码所属的核心处理器的指令提交单元向所述向量操作码所属的核心处理器的向量操作码发射单元反馈执行所述向量操作码的向量计算单元的状态。
13.一种面向多核处理器的向量数据的处理装置,其特征在于,包括:
第一模块,配置用于混合指令队列确认对接收的向量操作码处理的优先级,按照所述处理优先级依次获取执行所述向量操作码的向量计算单元的当前状态;
第二模块,配置用于根据所述当前状态判断是否将所述向量操作码发送给执行所述向量操作码的向量计算单元进行计算,以及判断是否继续将所述向量计算单元执行的向量操作码下发给所述混合指令队列。
14. 一种计算机设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求1-12任意一项所述方法的步骤。
15.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-12任意一项所述方法的步骤。
CN202310277393.XA 2023-03-21 2023-03-21 一种面向多核处理器的向量数据的处理方法及装置 Active CN115993949B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310277393.XA CN115993949B (zh) 2023-03-21 2023-03-21 一种面向多核处理器的向量数据的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310277393.XA CN115993949B (zh) 2023-03-21 2023-03-21 一种面向多核处理器的向量数据的处理方法及装置

Publications (2)

Publication Number Publication Date
CN115993949A true CN115993949A (zh) 2023-04-21
CN115993949B CN115993949B (zh) 2023-07-14

Family

ID=85992287

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310277393.XA Active CN115993949B (zh) 2023-03-21 2023-03-21 一种面向多核处理器的向量数据的处理方法及装置

Country Status (1)

Country Link
CN (1) CN115993949B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5511217A (en) * 1992-11-30 1996-04-23 Hitachi, Ltd. Computer system of virtual machines sharing a vector processor
CN101278293A (zh) * 2005-09-21 2008-10-01 英特尔公司 多处理器系统的性能仿真
CN104391821A (zh) * 2014-11-20 2015-03-04 天津大学 一种多核共享simd协处理器的系统级模型构建方法
US20160188531A1 (en) * 2014-12-24 2016-06-30 Samsung Electronics Co., Ltd. Operation processing apparatus and method
CN114518941A (zh) * 2020-11-19 2022-05-20 北京希姆计算科技有限公司 任务调度电路、方法、电子设备及计算机可读存储介质
US20220197858A1 (en) * 2020-12-18 2022-06-23 Red Hat, Inc. Dynamic allocation of arithmetic logic units for vectorized operations
CN115640052A (zh) * 2022-10-24 2023-01-24 金陵科技学院 用于图形处理器中多核多流水线并行执行优化方法
CN115756767A (zh) * 2022-12-06 2023-03-07 山东云海国创云计算装备产业创新中心有限公司 一种用于多核cpu原子操作内存的装置及方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5511217A (en) * 1992-11-30 1996-04-23 Hitachi, Ltd. Computer system of virtual machines sharing a vector processor
CN101278293A (zh) * 2005-09-21 2008-10-01 英特尔公司 多处理器系统的性能仿真
CN104391821A (zh) * 2014-11-20 2015-03-04 天津大学 一种多核共享simd协处理器的系统级模型构建方法
US20160188531A1 (en) * 2014-12-24 2016-06-30 Samsung Electronics Co., Ltd. Operation processing apparatus and method
CN114518941A (zh) * 2020-11-19 2022-05-20 北京希姆计算科技有限公司 任务调度电路、方法、电子设备及计算机可读存储介质
US20220197858A1 (en) * 2020-12-18 2022-06-23 Red Hat, Inc. Dynamic allocation of arithmetic logic units for vectorized operations
CN115640052A (zh) * 2022-10-24 2023-01-24 金陵科技学院 用于图形处理器中多核多流水线并行执行优化方法
CN115756767A (zh) * 2022-12-06 2023-03-07 山东云海国创云计算装备产业创新中心有限公司 一种用于多核cpu原子操作内存的装置及方法

Also Published As

Publication number Publication date
CN115993949B (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
US11188380B2 (en) Method and apparatus for processing task in smart device
CN109376861B (zh) 一种用于执行全连接层神经网络训练的装置和方法
US20180095738A1 (en) Method, device, and system for creating a massively parallilized executable object
GB2380834A (en) Thread ending method
CN110659142A (zh) 消息队列处理方法及装置、电子设备、存储介质
US11016769B1 (en) Method and apparatus for processing information
CN111176806A (zh) 一种业务处理方法、装置及计算机可读存储介质
CN110609755A (zh) 跨区块链节点的消息处理方法及装置、设备、介质
CN115481058A (zh) 内存原子操作指令的执行方法、装置、访问模块及系统
EP2751668B1 (en) Digital signal processor and baseband communication device
CN115993949B (zh) 一种面向多核处理器的向量数据的处理方法及装置
CN109032665B (zh) 微处理器中指令输出处理方法及装置
US11055100B2 (en) Processor, and method for processing information applied to processor
CN113419841A (zh) 消息调度方法、装置、电子设备和计算机可读介质
CN114518917B (zh) 算法模块调度方法、算法模块调度装置以及可读存储介质
CN108628639B (zh) 处理器和指令调度方法
CN112418389A (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
CN115981893A (zh) 消息队列任务处理方法、装置、服务器及存储介质
CN107077381B (zh) 异步指令执行装置和方法
US20130151817A1 (en) Method, apparatus, and computer program product for parallel functional units in multicore processors
CN111431892B (zh) 一种加速器管理架构、方法及加速器接口控制器
CN110825342A (zh) 存储调度器件和用于处理信息的系统、方法及装置
CN114153573A (zh) 一种基于单线程池的多任务处理的方法及相关装置
CN112445587A (zh) 一种任务处理的方法以及任务处理装置
CN111861853A (zh) 用于处理数据的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant