WO2022001317A1

WO2022001317A1 - 芯片仿真方法、装置、设备、系统及存储介质

Info

Publication number: WO2022001317A1
Application number: PCT/CN2021/089017
Authority: WO
Inventors: 徐帮元
Original assignee: 中兴通讯股份有限公司
Priority date: 2020-06-28
Filing date: 2021-04-22
Publication date: 2022-01-06
Also published as: EP4170538A4; CN113849951A; EP4170538A1

Abstract

一种芯片仿真方法、装置、设备、系统及存储介质，属于芯片仿真技术领域。该方法包括：将芯片仿真对应的矢量型待处理数据发送至预置的矢量执行模块(S101)；获取矢量执行模块对矢量型待处理数据进行数据处理的第一数据处理结果，以根据第一数据处理结果生成芯片仿真对应的仿真结果(S102)。

Description

芯片仿真方法、装置、设备、系统及存储介质

相关申请的交叉引用

本申请基于申请号为202010599906.5、申请日为2020年6月28日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本发明实施例涉及芯片仿真技术领域，具体公开了一种芯片仿真方法、装置、设备、系统及存储介质。

背景技术

随着科技的发展，对芯片(如CPU芯片)的处理能力要求越来越高，这使得对芯片进行仿真变得非常重要。以CPU芯片为例，通过搭建相应的CPU芯片仿真环境对CPU芯片进行仿真。目前，CPU芯片仿真环境的搭建主要有两种方法：一种是直接使用硬件描述语言对CPU芯片仿真算法进行实现，综合到专用集成电路中进行仿真环境的搭建；另一种是使用高级语言对CPU芯片进行抽象，建立面向对象的CPU芯片仿真系统。

在进行CPU芯片仿真中，需要执行相关标量和矢量运算，这会影响CPU芯片仿真的运行速度，尤其是矢量运算会严重降低CPU芯片仿真的运行速度，从而导致CPU芯片仿真的效率不高。

发明内容

本发明实施例提供了一种芯片仿真方法、装置、设备、系统及存储介质。

第一方面，本发明实施例提供了一种芯片仿真方法，包括：将芯片仿真对应的矢量型待处理数据发送至预置的矢量执行模块；获取矢量执行模块对矢量型待处理数据进行数据处理的第一数据处理结果，以根据第一数据处理结果生成芯片仿真对应的仿真结果。

第二方面，本发明实施例提供了一种计算机设备，计算机设备包括存储器和处理器；存储器被设置为存储计算机程序；处理器，被设置为执行计算机程序并在执行计算机程序时实现如上述的芯片仿真方法。

第三方面，本发明实施例提供了一种芯片仿真方法，包括：获取标量执行模块发送的芯片仿真对应的矢量型待处理数据；对矢量型待处理数据进行数据处理，获得第一数据处理结果，以供标量执行模块根据第一数据处理结果生成芯片仿真对应的仿真结果。

第四方面，本发明实施例提供了一种芯片仿真装置，芯片仿真装置包括存储器和处理器；存储器被设置为存储计算机程序；处理器，被设置为执行计算机程序并在执行计算机程序时实现如上述的芯片仿真方法。

第五方面，本发明实施例还提供了一种芯片仿真系统，芯片仿真系统包括如上述的计算机设备和如上述的芯片仿真装置，计算机设备与芯片仿真装置通信连接。

第六方面，本发明实施例还提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时使处理器实现如上述的芯片仿真方法。

附图说明

图1是本发明实施例提供的一种芯片仿真系统的示意性框图；

图2是本发明实施例提供的一种计算机设备的示意性框图；

图3是本发明实施例提供的一种芯片仿真装置的示意性框图；

图4是本发明实施例提供的一种芯片仿真方法的步骤示意流程图；

图5是本发明实施例提供的另一种芯片仿真方法的步骤示意流程图；

图6是本发明实施例提供的CPU芯片仿真的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

附图中所示的流程图仅是示例说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解、组合或部分合并，因此实际执行的顺序有可能根据实际情况改变。

应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

在后续的描述中，使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明实施例的说明，其本身没有特有的意义。因此，“模块”、“部件”或“单元”可以混合地使用。

本发明的实施例提供了一种芯片仿真方法、装置、设备、系统及存储介质，以实现提高芯片仿真的效率。其中，芯片包括但不限于CPU芯片，例如还可以包括其他的集成芯片，本发明中以CPU芯片为例对本发明的各实施例进行解释说明。

请参阅图1，图1是本发明实施例提供的一种芯片仿真系统的示意性框图。该芯片仿真系统100包括计算机设备10、以及芯片仿真装置20。其中，计算机设备10和芯片仿真装置20之间建立有线或无线通信连接。

计算机设备10，包括标量执行模块11，其中，标量执行模块11包括软仿单元111；芯片仿真装置20，包括矢量执行模块21，其中，矢量执行模块21包括矢量核单元211。标量执行模块11通过高级语言设计实现，矢量执行模块21通过在半定制化硬件系统上设计实现，加速矢量运算的运行。

在一些示例中，矢量执行模块21包括但不限于现场可编程门阵列(Field-Programmable Gate Array，FPGA)、图形处理器(Graphics Processing Unit，GPU)等可以提供矢量运算优化的硬件系统。

矢量核单元211是专为矢量运算进行优化的硬件执行系统，可以根据CPU芯片仿真的标矢量部署情况对CPU仿真中的矢量运算进行加速，同时可以保证标量执行模块11的灵活构建。

标量执行模块11向矢量执行模块21发送CPU芯片仿真对应的配置信息，矢量执行模块21接收到该配置信息后，根据该配置信息完成矢量核单元211的配置，并在矢量核单元211配置完成后，发送相应的配置完成信息至标量执行模块11，标量执行模块11在接收到矢量执行模块21发送的配置完成信息之后，软仿单元111开始进行CPU芯片系统仿真，不断地往矢量执行模块21发送矢量型待处理数据、以及矢量型待处理数据对应的数据参数，其中，数据参数包括但不限于数据大小、数据属性、数据操作类型等等。矢量核单元211不断地获取矢量型待处理数据和对应的数据参数进行数据处理并反馈结果至标量执行模块11；标量执行模块11根据反馈的结果决定是否结束仿真给出仿真结果。

在一些示例中，标量执行模块11还包括调度单元112以及消息传输单元113，矢量执行模块21还包括共享存储单元212以及缓存标识符单元213。

在确定CPU芯片仿真的标矢量部署之后，调度单元112根据部署情况确定矢量核单元211的构建方式，并发送相应脚本文件至矢量执行模块21，矢量执行模块21根据脚本文件构建矢量核单元211。

消息传输单元113不断地给矢量执行模块21发送矢量型待处理数据和对应的数据参数，矢量核单元211不断地获取矢量型待处理数据和对应的数据参数进行处理并返回结果。进一步地，

消息传输单元113可优化标量和矢量划分粒度，也即对矢量型待处理数据和标量型待处理数据的划分粒度进行优化配置，从而充分发挥标矢量分离的性能，提升仿真效率。

共享存储单元212通过物理连接的方式与标量执行模块11进行连接，例如通过相应的物理接口与标量执行模块11连接，在共享存储单元212中存储矢量型待处理数据。

缓存标识符单元213被设置为存储矢量型待处理数据对应的物理地址以及数据参数，矢量核单元211根据缓存标识符单元213中缓存的物理地址在共享存储单元212中进行数据索引，获取对应的矢量型待处理数据并进行数据处理。

标量执行模块11和矢量执行模块21通过物理地址映射的共享内存方式进数据的传输，降低数据搬移次数，进一步可以提升CPU芯片仿真的效率。

在一些示例中，矢量核单元211和软仿单元111的仿真运算可以并行进行，也即一边通过软仿单元111对标量型待处理数据进行数据处理，另一边通过矢量核单元211对矢量型待处理数据进行数据处理，从而提升CPU芯片仿真系统的运行效率。

请参阅图2，图2是本发明实施例提供的一种计算机设备的示意性框图。该计算机设备200包括处理器201和存储器202，其中，处理器201和存储器202通过总线连接。

其中，存储器202可以包括非易失性存储介质和内存储器。

非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令，该程序指令被执行时，可使得处理器执行任意一种芯片仿真方法。

处理器201被设置为提供计算和控制能力，支撑整个终端设备的运行。

内存储器为非易失性存储介质中的计算机程序的运行提供环境，该计算机程序被处理器执行时，可使得处理器执行任意一种芯片仿真方法。

可以理解，图2中示出的结构，仅仅是与本发明实施例方案相关的部分结构的框图，并不构成对本发明实施例方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

应当理解的是，处理器201可以是中央处理单元(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

其中，在一些实施例中，处理器被设置为运行存储在存储器中的计算机程序，以实现如下步骤：

将芯片仿真对应的矢量型待处理数据发送至预置的矢量执行模块；

获取矢量执行模块对矢量型待处理数据进行数据处理的第一数据处理结果，以根据第一数据处理结果生成芯片仿真对应的仿真结果。

在一些实施例中，处理器在实现将芯片仿真对应的矢量型待处理数据发送至预置的矢量执行模块之前，还用于实现：将芯片仿真对应的配置信息发送至矢量执行模块，以供矢量执行模块根据配置信息配置矢量核单元，通过矢量核单元对矢量型待处理数据进行数据处理。

在一些实施例中，矢量执行模块包括共享存储单元，处理器在实现将芯片仿真对应的矢量型待处理数据发送至预置的矢量执行模块时，被设置为实现：

将矢量型待处理数据发送至共享存储单元，以供矢量核单元从共享存储单元中获取矢量型待处理数据；

处理器在实现获取矢量执行模块对矢量型待处理数据进行数据处理的第一数据处理结果时，被设置为实现：

获取共享存储单元中保存的第一数据处理结果。

在一些实施例中，矢量执行模块还包括缓存标识符单元，处理器还被设置为实现：

将矢量型待处理数据对应的数据参数发送至缓存标识符单元，以供矢量核单元从缓存标识符单元获取数据参数，并根据数据参数确定矢量型待处理数据的处理方式，对矢量型待处理数据进行处理方式的数据处理。

在一些实施例中，处理器还被设置为实现：对芯片仿真对应的标量型待处理数据进行数据处理，获得第二数据处理结果；

处理器在实现获取矢量执行模块对矢量型待处理数据进行数据处理的第一数据处理结果之后，还被设置为实现：

根据第一数据处理结果和第二数据处理结果，生成仿真结果。

在一些实施例中，处理器还被设置为实现：对矢量型待处理数据和标量型待处理数据的划分粒度进行配置。

请参阅图3，图3是本发明实施例提供的一种芯片仿真装置的示意性框图。该芯片仿真装置300包括处理器301和存储器302，其中，处理器3301和存储器302通过总线连接。

其中，存储器302可以包括非易失性存储介质和内存储器。

处理器301被设置为提供计算和控制能力，支撑整个终端设备的运行。

可以理解，图3中示出的结构，仅仅是与本发明实施例方案相关的部分结构的框图，并不构成对本发明实施例方案所应用于其上的芯片仿真装置的限定，具体的芯片仿真装置可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

应当理解的是，处理器301可以是中央处理单元(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

获取标量执行模块发送的芯片仿真对应的矢量型待处理数据；

对矢量型待处理数据进行数据处理，获得第一数据处理结果，以供标量执行模块根据第一数据处理结果生成芯片仿真对应的仿真结果。

在一些实施例中，处理器在实现获取标量执行模块发送的芯片仿真对应的矢量型待处理数据时，被设置为实现：

获取缓存标识符单元中保存的矢量型待处理数据对应的物理地址；

根据物理地址在共享存储单元中进行数据索引，获取矢量型待处理数据，其中，标量执行模块将矢量型待处理数据发送至共享存储单元。

在一些实施例中，处理器在实现对矢量型待处理数据进行数据处理时，被设置为实现：

获取缓存标识符单元中保存的矢量型待处理数据对应的数据参数，其中，标量执行模块将数据参数发送至缓存标识符单元；

根据数据参数确定矢量型待处理数据的处理方式，并对矢量型待处理数据进行处理方式的数据处理。

在一些实施例中，处理器在实现对矢量型待处理数据进行数据处理，获得第一数据处理结果之后，还被设置为实现：

将第一数据处理结果保存至共享存储单元，并将第一数据处理结果对应的物理地址保存至缓存标识符单元。

为了便于理解，以下将结合图1中的芯片仿真系统、图2中的计算机设备和图3中的芯片仿真装置，对本发明的实施例提供的芯片仿真方法进行详细介绍。需知，上述的芯片仿真系统、计算机设备和芯片仿真装置并不构成对本发明实施例提供的芯片仿真方法应用场景的限定。

如图4所示，图4是本发明实施例提供的一种芯片仿真方法的步骤示意流程图。该方法可以用于上述计算机设备中，以实现提高芯片仿真的效率。

具体地，如图4所示，该方法包括步骤S101至步骤S102。

S101、将芯片仿真对应的矢量型待处理数据发送至预置的矢量执行模块。

在进行CPU芯片仿真中，标量和矢量运算对应相应的标量型待处理数据和矢量型待处理数据，在进行标量和矢量运算之前，先将标量型待处理数据和矢量型待处理数据进行区分，将确定的矢量型待处理数据发送至预置的矢量执行模块。其中，矢量执行模块通过在半定制化硬件系统上设计实现，可加速矢量运算的运行。

在一些示例中，矢量执行模块包括但不限于FPGA、GPU等硬件系统，可以提供矢量运算功能。

矢量执行模块在接收获取到矢量型待处理数据后，对矢量型待处理数据进行相应的数据处理。其中，数据处理包括数据时域/频域转换、数据编解码等操作。

在一些实施例中，在步骤S101之前还可以包括：将芯片仿真对应的配置信息发送至矢量执行模块，以供矢量执行模块根据配置信息配置矢量核单元，通过矢量核单元对矢量型待处理数据进行数据处理。

在进行仿真之前，先对矢量执行模块的矢量核单元进行配置，其中，矢量核单元是矢量执行模块的核心单元，专为矢量运算进行优化的硬件执行系统，被设置为对矢量型待处理数据进行数据处理，可以对CPU仿真中的矢量运算进行加速。

在一些示例中，将CPU芯片仿真对应的配置信息发送至矢量执行模块，矢量执行模块接收到该配置信息后，根据该配置信息配置矢量执行模块的矢量核单元。例如，以配置数字信号处理(Digital Signal Processing，DSP)核执行单元为例，通过发送面向通信应用芯片仿真的DSP核配置信息至矢量执行模块，矢量执行模块根据配置信息构建DSP核执行单元，被设置为处理移动通信中大规模的矢量运算。

在一些示例中，在确定CPU芯片仿真的标矢量部署之后，根据部署情况确定矢量执行模块中矢量核单元的构建方式，并发送相应的脚本文件至矢量执行模块。矢量执行模块在接收到脚本文件后，根据该脚本文件配置矢量核单元。

在矢量核单元配置完成后，矢量执行模块反馈相应的配置完成信息，接收到该配置完成信息后，开始进行CPU芯片仿真，将相应的矢量型待处理数据发送至矢量执行模块，矢量执行模块在接收获取到矢量型待处理数据后，通过配置好的矢量核单元对矢量型待处理数据进行相应的数据处理，获得对应的数据处理结果。为了便于描述，下文把对矢量型待处理数据进行数据处理获得的数据处理结果称为第一数据处理结果。

S102、获取矢量执行模块对矢量型待处理数据进行数据处理的第一数据处理结果，以根据第一数据处理结果生成芯片仿真对应的仿真结果。

通过矢量核单元对矢量型待处理数据进行相应的数据处理，获得第一数据处理结果后，获取该第一数据处理结果。例如，在进行数据处理获得第一数据处理结果后，矢量执行模块将第一数据处理结果返回，直接接收获取到矢量执行模块返回的第一数据处理。

又如，在进行数据处理获得第一数据处理结果后，矢量执行模块将第一数据处理结果保存至相应的存储装置，因此，通过查询存储装置即可获得第一数据处理结果。

第一数据处理结果作为进行CPU芯片仿真获得的中间信息，基于第一数据处理结果，确定本次CPU芯片仿真是否完成，并生成对应的仿真结果。

在一些实施例中，将矢量型待处理数据发送至矢量执行模块的同时，对相应的标量型待处理数据进行数据处理，获得标量型待处理数据对应的数据处理结果。为了便于描述，下文把对标量型待处理数据进行数据处理获得的数据处理结果称为第二数据处理结果。

也即，一边通过矢量执行模块对矢量型待处理数据进行数据处理，一边通过自身对标量型待处理数据进行数据处理，并获得矢量型待处理数据对应的第一数据处理结果，以及标量型待处理数据对应的第二数据处理结果。

根据获得的第一数据处理结果和第二数据处理结果，对第一数据处理结果和第二数据处理结果进行综合分析，生成CPU芯片仿真对应的仿真结果。

在一些实施例中，矢量执行模块还包括共享存储单元，被设置为存储待处理数据以及待处理数据对应的数据处理结果。将芯片仿真对应的矢量型待处理数据发送至预置的矢量执行模块可以包括：将矢量型待处理数据发送至共享存储单元，以供矢量核单元从共享存储单元中获取矢量型待处理数据；获取矢量执行模块对矢量型待处理数据进行数据处理的第一数据处理结果可以包括：获取共享存储单元中保存的第一数据处理结果。

通过将矢量型待处理数据发送至矢量执行模块的共享存储单元，由共享存储单元保存矢量型待处理数据，矢量核单元可以直接从共享存储单元中获取保存的矢量型待处理数据，对获取到的矢量型待处理数据进行数据处理，获得对应的第一数据处理结果，并将该第一数据处理结果保存至共享存储单元。之后，即可通过访问共享存储单元获取矢量型待处理数据对应的第一数据处理结果。

在一些实施例中，矢量执行模块还包括缓存标识符单元，缓存标识符单元可被设置为存储矢量型待处理数据对应的数据参数，其中，数据参数包括但不限于数据大小、数据属性、数据操作类型等等。在将矢量型待处理数据发送至共享存储单元的同时，将矢量型待处理数据对应的数据参数发送至缓存标识符单元。矢量核单元从共享存储单元中获取保存的矢量型待处理数据，并从缓存标识符单元中获取矢量型待处理数据对应的数据参数，根据矢量型待处理数据对应的数据参数，确定出矢量型待处理数据的处理方式，然后对矢量型待处理数据进行该处理方式的数据处理。

在一些实施例中，将共享存储单元中存储的矢量型待处理数据对应的物理地址保存于缓存标识符单元中。矢量核单元通过获取缓存标识符单元中保存的矢量型待处理数据对应的物理地址，即可根据物理地址在共享存储单元中进行数据索引，获取对应的矢量型待处理数据，进而对矢量型待处理数据进行数据处理。也即，通过物理地址映射的共享内存方式进数据传输，降低了数据搬移次数，从而提升了仿真的运行速度。

在一些实施例中，也可以将矢量型待处理数据对应的数据参数、以及矢量型待处理数据一起发送至共享存储单元，在共享存储单元中关联保存矢量型待处理数据、以及矢量型待处理数据对应的数据参数。矢量核单元可以从共享存储单元中获取关联保存的矢量型待处理数据、以及矢量型待处理数据对应的数据参数，根据矢量型待处理数据对应的数据参数，确定出矢量型待处理数据的处理方式，然后对矢量型待处理数据进行该处理方式的数据处理。

在一些实施例中，定时或在当前达到预设条件时，对矢量型待处理数据和标量型待处理数据的划分粒度进行配置，也即对标量和矢量划分粒度进行优化设置。例如，如果每次缓存标识符单元调用消耗的时间相同，则整合标量和矢量流程，优化标量和矢量划分粒度，减少缓存标识符单元的调用次数。

如图5所示，图5是本发明的又一实施例提供的一种芯片仿真方法的示意流程图。该芯片仿真方法可以应用于芯片仿真装置中，包括步骤S201和步骤S202。

S201、获取标量执行模块发送的芯片仿真对应的矢量型待处理数据。

在进行CPU芯片仿真中，进行标量和矢量运算之前，先通过计算机设备中配置的标量执行模块将标量型待处理数据和矢量型待处理数据进行区分，将确定的矢量型待处理数据发送至芯片仿真装置。其中，标量执行模块通过高级语言设计实现。在一些示例中，芯片仿真装置中预置有矢量执行模块，其中，矢量执行模块通过在半定制化硬件系统上设计实现，可加速矢量运算的运行。在一些示例中，矢量执行模块包括但不限于FPGA、GPU等硬件系统，可以提供矢量运算功能。芯片仿真装置通过矢量执行模块接收获取到标量执行模块发送的矢量型待处理数据。

在一些示例中，矢量执行模块包括矢量核单元，通过矢量核单元接收获取到标量执行模块发送的矢量型待处理数据。

在一些实施例中，获取标量执行模块发送的芯片仿真对应的矢量型待处理数据可以包括：获取缓存标识符单元中保存的矢量型待处理数据对应的物理地址；根据物理地址在共享存储单元中进行数据索引，获取矢量型待处理数据，其中，标量执行模块将矢量型待处理数据发送至共享存储单元。

其中，矢量执行模块还包括共享存储单元和缓存标识符单元，共享存储单元中存储矢量型待处理数据，缓存标识符单元存储矢量型待处理数据对应的物理地址。通过获取缓存标识符单元中保存的矢量型待处理数据对应的物理地址，之后基于矢量型待处理数据对应的物理地址在共享存储单元中进行数据索引，获取对应的矢量型待处理数据。也即，通过物理地址映射的共享内存方式进数据传输，降低了数据搬移次数，从而提升了仿真的运行速度。

S202、对矢量型待处理数据进行数据处理，获得第一数据处理结果，以供标量执行模块根据第一数据处理结果生成芯片仿真对应的仿真结果。

在获取到矢量型待处理数据后，对矢量型待处理数据进行数据处理，获得矢量型待处理数据对应的数据处理结果。为了便于描述，下文将矢量型待处理数据对应的数据处理结果称为第一数据处理结果。

在一些实施例中，对矢量型待处理数据进行数据处理可以包括：获取缓存标识符单元中保存的矢量型待处理数据对应的数据参数，其中，标量执行模块将数据参数发送至缓存标识符单元；根据数据参数确定矢量型待处理数据的处理方式，并对矢量型待处理数据进行处理方式的数据处理。

其中，矢量型待处理数据对应的数据参数包括但不限于数据大小、数据属性、数据操作类型等等。缓存标识符单元还可被设置为存储矢量型待处理数据对应的数据参数。标量执行模块在将矢量型待处理数据发送至共享存储单元的同时，将矢量型待处理数据对应的数据参数发送至缓存标识符单元。通过从共享存储单元中获取保存的矢量型待处理数据，并从缓存标识符单元中获取矢量型待处理数据对应的数据参数，根据矢量型待处理数据对应的数据参数，确定出矢量型待处理数据的处理方式，然后对矢量型待处理数据进行该处理方式的数据处理。

在一些实施例中，对矢量型待处理数据进行数据处理，获得第一数据处理结果之后可以包括：将第一数据处理结果保存至共享存储单元，并将第一数据处理结果对应的物理地址保存至缓存标识符单元。

在进行数据处理获得矢量型待处理数据对应的第一数据处理结果后，并不直接将该第一数据处理结果返回至标量执行模块，而是将第一数据处理结果保存至共享存储单元，并将第一数据处理结果保存于共享存储单元对应的物理地址，保存至缓存标识符单元。之后，标量执行模块通过获取缓存标识符单元中保存的第一数据处理结果对应的物理地址，在共享存储单元中进行数据索引，即可获取到该第一数据处理结果。

标量执行模块根据该第一数据处理结果生成CPU芯片仿真对应的仿真结果。在一些示例中，标量执行模块对相应的标量型待处理数据进行数据处理，获得标量型待处理数据对应的数据处理结果。为了便于描述，下文把对标量型待处理数据进行数据处理获得的数据处理结果称为第二数据处理结果。也即，一边通过矢量执行模块对矢量型待处理数据进行数据处理，一边通过标量执行模块对标量型待处理数据进行数据处理，并获得矢量型待处理数据对应的第一数据处理结果，以及标量型待处理数据对应的第二数据处理结果。标量执行模块根据获得的第一数据处理结果和第二数据处理结果，对第一数据处理结果和第二数据处理结果进行综合分析，生成CPU芯片仿真对应的仿真结果。

如图6所示，CPU芯片仿真的详细流程如下：

Step1：标量执行模块发送配置信息至矢量执行模块；

Step2：矢量执行模块根据配置信息，完成矢量核单元配置；

Step3：标量执行模块不断地更新发送矢量型待处理数据、以及对应的数据参数；

Step4：矢量核单元不断地获取矢量型待处理数据、以及对应的数据参数；

Step5：矢量核单元对矢量型待处理数据进行数据处理，并反馈结果至标量执行模块；

Step6：标量执行模块根据反馈结果，确定仿真是否完成；若是，则执行Step7；反之，则返回执行Step3；

Step7：输出仿真结果。

上述实施例中通过将芯片仿真对应的矢量型待处理数据发送至预置的矢量执行模块，通过矢量执行模块对矢量型待处理数据进行数据处理，获得相应的第一数据处理结果，基于第一数据处理结果，生成芯片仿真对应的仿真结果，也即，将芯片仿真中的矢量运算分离出来进行独立处理，因而提高了芯片仿真的效率。

本发明的实施例中还提供一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序中包括程序指令，处理器执行程序指令，实现本发明实施例提供的任一项芯片仿真方法。

例如，该计算机程序被处理器加载，可以执行如下步骤：

本发明实施例公开了一种芯片仿真方法、装置、设备及存储介质，通过将芯片仿真对应的矢量型待处理数据发送至预置的矢量执行模块，通过矢量执行模块对矢量型待处理数据进行数据处理，获得相应的第一数据处理结果，基于第一数据处理结果，生成芯片仿真对应的仿真结果，也即，将芯片仿真中的矢量运算分离出来进行独立处理，因而提高了芯片仿真的效率。

其中，计算机可读存储介质可以是前述实施例的芯片仿真系统的内部存储单元，例如芯片仿真系统的硬盘或内存。计算机可读存储介质也可以是芯片仿真系统的外部存储设备，例如芯片仿真系统上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

一种芯片仿真方法，包括：

将芯片仿真对应的矢量型待处理数据发送至预置的矢量执行模块；

获取所述矢量执行模块对所述矢量型待处理数据进行数据处理的第一数据处理结果，以根据所述第一数据处理结果生成芯片仿真对应的仿真结果。
根据权利要求1所述的芯片仿真方法，其中，所述将芯片仿真对应的矢量型待处理数据发送至预置的矢量执行模块之前，包括：

将所述芯片仿真对应的配置信息发送至所述矢量执行模块，以供所述矢量执行模块根据所述配置信息配置矢量核单元，通过所述矢量核单元对所述矢量型待处理数据进行数据处理。
根据权利要求2所述的芯片仿真方法，其中，所述矢量执行模块包括共享存储单元，所述将芯片仿真对应的矢量型待处理数据发送至预置的矢量执行模块，包括：

将所述矢量型待处理数据发送至所述共享存储单元，以供所述矢量核单元从所述共享存储单元中获取所述矢量型待处理数据；

所述获取所述矢量执行模块对所述矢量型待处理数据进行数据处理的第一数据处理结果，包括：

获取所述共享存储单元中保存的所述第一数据处理结果。
根据权利要求3所述的芯片仿真方法，其中，所述矢量执行模块还包括缓存标识符单元，所述方法还包括：

将所述矢量型待处理数据对应的数据参数发送至所述缓存标识符单元，以供所述矢量核单元从所述缓存标识符单元获取所述数据参数，并根据所述数据参数确定所述矢量型待处理数据的处理方式，对所述矢量型待处理数据进行所述处理方式的数据处理。
根据权利要求1至4任一项所述的芯片仿真方法，还包括：

对所述芯片仿真对应的标量型待处理数据进行数据处理，获得第二数据处理结果；

所述获取所述矢量执行模块对所述矢量型待处理数据进行数据处理的第一数据处理结果之后，包括：

根据所述第一数据处理结果和所述第二数据处理结果，生成所述仿真结果。
根据权利要求5所述的芯片仿真方法，还包括：

对所述矢量型待处理数据和所述标量型待处理数据的划分粒度进行配置。
一种芯片仿真方法，包括：

获取标量执行模块发送的芯片仿真对应的矢量型待处理数据；

对所述矢量型待处理数据进行数据处理，获得第一数据处理结果，以供所述标量执行模块根据所述第一数据处理结果生成所述芯片仿真对应的仿真结果。
根据权利要求7所述的芯片仿真方法，其中，所述获取标量执行模块发送的芯片仿真对应的矢量型待处理数据，包括：

获取缓存标识符单元中保存的所述矢量型待处理数据对应的物理地址；

根据所述物理地址在共享存储单元中进行数据索引，获取所述矢量型待处理数据，其中，所述标量执行模块将所述矢量型待处理数据发送至所述共享存储单元。
根据权利要求8所述的芯片仿真方法，其中，所述对所述矢量型待处理数据进行数据处理，包括：

获取所述缓存标识符单元中保存的所述矢量型待处理数据对应的数据参数，其中，所述标量执行模块将所述数据参数发送至所述缓存标识符单元；

根据所述数据参数确定所述矢量型待处理数据的处理方式，并对所述矢量型待处理数据进行所述处理方式的数据处理。
根据权利要求8或9所述的芯片仿真方法，其中，所述对所述矢量型待处理数据进行数据处理，获得第一数据处理结果之后，包括：

将所述第一数据处理结果保存至所述共享存储单元，并将所述第一数据处理结果对应的物理地址保存至所述缓存标识符单元。
一种计算机设备，所述计算机设备包括存储器和处理器；其中，

所述存储器被设置为存储计算机程序；

所述处理器，被设置为执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至6中任一项所述的芯片仿真方法。
一种芯片仿真装置，包括存储器和处理器；其中，

存储器被设置为存储计算机程序；

处理器，被设置为执行计算机程序并在执行计算机程序时实现如权利要求7至10中任一项的芯片仿真方法。
一种芯片仿真系统，包括如权利要求11的计算机设备和如权利要求12的芯片仿真装置，其中，所述计算机设备与所述芯片仿真装置通信连接。
一种计算机可读存储介质，存储有计算机程序，其中，所述计算机程序被处理器执行时使所述处理器实现如权利要求1至6中任一项所述的芯片仿真方法；或者实现如权利要求7至10中任一项的芯片仿真方法。