CN115130675B

CN115130675B - 一种量子随机电路的多振幅模拟方法和装置

Info

Publication number: CN115130675B
Application number: CN202211068173.8A
Authority: CN
Inventors: 刘鑫; 刘勇; 宋佳伟; 陈垚键; 史新民; 彭达佳; 郭楚; 付昊桓; 吴汶钊; 杨雨灵; 赵朋朋
Original assignee: National Supercomputing Center In Wuxi; Zhejiang Lab
Current assignee: National Supercomputing Center In Wuxi; Zhejiang Lab
Priority date: 2022-09-02
Filing date: 2022-09-02
Publication date: 2023-01-24
Anticipated expiration: 2042-09-02
Also published as: CN115130675A

Abstract

本发明涉及量子随机电路计算模拟技术领域，尤其涉及一种量子随机电路的多振幅模拟方法和装置，该方法包括：步骤一：根据芯片片上存储的最大存储容量以及张量网络收缩路径中每一步张量的最大维数确定进行算子融合的起始位置至结束位置；步骤二：在起始位置，分别将片外存储中的两个张量读取到片上存储并进行相应的转置，再进行融合；步骤三：将融合的结果进行转置后储存，用于在下一位置与所读取后转置的张量进行融合；步骤四：重复上述步骤三，直到算子融合到结束位置，将最终的融合的结果写回到片外存储。本发明可以有效减少片上存储和片外存储之间的数据访问次数，一方面提高多振幅计算模拟的并行度，另一方面提升多振幅计算模拟的效率。

Description

一种量子随机电路的多振幅模拟方法和装置

技术领域

本发明涉及量子随机电路计算模拟技术领域，尤其涉及一种量子随机电路的多振幅模拟方法和装置。

背景技术

量子随机电路计算模拟作为现阶段量子计算领域一个重要的研究内容，对于促进量子计算的发展有着重要意义。目前量子随机电路的计算模拟大多采用张量网络方法，其核心思想是将量子电路转化成张量网络，并将整个张量网络按照特定的路径进行张量收缩计算。由于张量网络中每一个张量的维度是有限的，可以被经典计算机存储，因此可以利用经典计算机，尤其是超算系统的强大运算能力，对量子随机电路进行计算模拟。

当前量子随机电路计算模拟主要分为单振幅计算模拟和多振幅计算模拟。单振幅模拟通过优化后的高维张量运算库进行计算，可以获得较高的运算效率。多振幅模拟目前主要根据随机采样的数量进行串行模拟，当采样数量较大时，效率往往较低。当前多振幅模拟主要是基于单振幅模拟的串行实现，并行度低；同时单个振幅模拟中每一步张量收缩都存在片上存储和片外存储之间的数据访问，当采样数量较多时，频繁的数据访问会严重影响采样的效率。

发明内容

为了解决现有技术中存在的上述问题，本发明提出了一种量子随机电路的多振幅模拟方法，从张量收缩过程中的某一步开始，通过减少片上存储和片外存储之间的数据访问次数，同时根据片上计算核心的数量对多个振幅并行计算，即增加任务的并行度，以提高量子随机电路多振幅计算模拟的效率，其具体技术方案如下：

一种量子随机电路的多振幅模拟方法，包括以下步骤：

步骤一：根据芯片片上存储的最大存储容量以及张量网络收缩路径中每一步张量的最大维数确定进行算子融合的起始位置至结束位置；

步骤二：在起始位置，分别将片外存储中的两个张量读取到片上存储并进行相应的转置，再进行融合；

步骤三：将融合的结果进行转置后储存，用于在下一位置与所读取后转置的张量进行融合；

步骤四：重复上述步骤三，直到算子融合到结束位置，将最终的融合的结果写回到片外存储。

进一步的，所述步骤一，具体为：当维数最大的张量所需的存储空间小于片上存储的最大存储容量的三分之一时，则这一步的张量网络收缩可进行算子融合，即可得到进行算子融合的起始位置至结束位置。

进一步的，所述张量网络是由多个张量按照收缩规则构成的网络模型。

进一步的，所述步骤二具体包括以下子步骤：

步骤2.1：在起始位置，通过直接存储器访问读取方式将片外存储中的张量B读取到片上存储的本地数据内存ldmC位置，在片上存储中对张量B进行转置，将转置后的结果存放到片上存储的本地数据内存ldmB位置；

步骤2.2：通过直接存储器访问读取方式将片外存储中的张量A1读取到片上存储的本地数据内存ldmC位置，在片上存储中对张量A1进行转置，将转置后的结果存放到片上存储的本地数据内存ldmA位置；

步骤2.3：在片上存储中完成张量A1和张量B的融合，将融合的结果存放到片上存储的本地数据内存ldmC位置。

进一步的，所述步骤三具体包括以下子步骤：

步骤3.1：在片上存储中对融合的结果即存放在片上存储的本地数据内存ldmC位置的融合结果进行转置，将转置后的结果存放到片上存储的本地数据内存ldmB位置；

步骤3.2：在下一个位置，通过直接存储器访问读取方式从片外存储中将张量A2读取到片上存储的本地数据内存ldmC位置，在片上存储中对张量A2进行转置，将转置后的结果存放到片上存储的本地数据内存ldmA位置；

步骤3.3：在片上存储中完成张量A2和张量B的融合，将融合结果存放到片上存储的本地数据内存ldmC位置。

进一步的，所述步骤四具体为：重复上述步骤三，直到算子融合到结束位置，将存放在本地数据内存ldmC位置的融合结果通过直接存储器访问写入方式写回到片外存储张量C位置。

一种量子随机电路的多振幅模拟装置，包括一个或多个处理器，用于实现所述的一种量子随机电路的多振幅模拟方法。

一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时，实现所述的一种量子随机电路的多振幅模拟方法。

有益效果：

本发明可以有效减少片上存储和片外存储之间的数据访问次数，同时极大提高多振幅模拟的并行度，大大提高多振幅模拟的效率。

附图说明

图1是本发明的一种量子随机电路的多振幅模拟方法流程示意图；

图2是本发明实施例的算子融合的原理图；

图3是本发明实施例的一种量子随机电路的多振幅模拟装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和技术效果更加清楚明白，以下结合说明书附图，对本发明作进一步详细说明。

本发明的一种量子随机电路的多振幅模拟方法，如图1所示，包括以下步骤：

步骤一：根据芯片片上存储的最大存储容量以及张量收缩路径中每一步张量的最大维数确定进行算子融合的起始位置至结束位置。

假设张量网络收缩中的任意一步为张量A和张量B进行张量收缩得到张量C，张量A的维数为M，张量B的维数为N，张量C的维数为K，则存储张量A、B、C需要的内存大小分别为8*(2^M)字节、8*(2^N)字节和8*(2^K)字节，当A、B、C中维数最大的张量所需的存储空间小于片上最大存储容量的三分之一时，则这一步张量收缩满足进行算子融合的要求。由于不同芯片的片上最大存储容量不同，进行算子融合的起始位置和结束位置也不同，对所有张量网络收缩的情况，可以根据不同芯片的片上存储的最大存储容量动态调整本发明算子融合的起始位置，适用于内存需求小于片上存储最大容量的任意维度张量收缩，以及根据张量收缩路径中每一步张量的最大维数确定执行算子融合的起始位置和结束位置，在起始位置和结束位置之间的所有张量收缩直接调用本发明的方法，其具体原理如图2所示。

步骤二：在起始位置，分别将片外存储中的两个张量读取到片上存储并进行相应的转置，再进行融合；具体的，包括以下子步骤：

步骤2.1：在起始位置，通过直接存储器访问读取方式DMA_GET将片外存储中的张量B读取到片上存储的本地数据内存ldmC位置，在片上存储中对张量B进行转置，将转置后的结果存放到片上存储的本地数据内存ldmB位置。

步骤2.2：通过直接存储器访问读取方式DMA_GET将片外存储中的张量A1读取到片上存储的本地数据内存ldmC位置，在片上存储中对张量A1进行转置，将转置后的结果存放到片上存储的本地数据内存ldmA位置。

步骤2.3：在片上存储中完成张量A1和张量B的融合，将融合结果存放到片上存储的本地数据内存ldmC位置。

步骤三：将融合结果进行转置后储存，用于在下一位置与所读取后转置的张量进行融合；具体的，包括以下子步骤：

步骤3.1：在片上存储中对所述融合结果即存放在片上存储的本地数据内存ldmC位置的计算结果进行转置，将转置后的结果存放到片上存储的本地数据内存ldmB位置。

步骤3.2：在下一个位置，通过直接存储器访问读取方式DMA_GET从片外存储中将张量A2读取到片上存储的本地数据内存ldmC位置，在片上存储中对张量A2进行转置，将转置后的结果存放到片上存储的本地数据内存ldmA位置。

具体的，重复上述步骤三，直到算子融合到结束位置，将存放在本地数据内存ldmC位置的计算结果通过直接存储器访问写入方式DMA_PUT写回到片外存储张量C位置。

通过上述方法，可以有效减少片上存储和片外存储之间的数据访问次数，同时由于该方法可以在1个计算核心中运行，极大地提高了任务的并行度，在多振幅模拟时可以极大地提高模拟效率，大大降低多振幅模拟的时间开销。

与前述一种量子随机电路的多振幅模拟方法的实施例相对应，本发明还提供了一种量子随机电路的多振幅模拟装置的实施例。

参见图3，本发明实施例提供的一种量子随机电路的多振幅模拟装置，包括一个或多个处理器，用于实现上述实施例中的一种量子随机电路的多振幅模拟方法。

本发明一种量子随机电路的多振幅模拟装置的实施例可以应用在任意具备数据处理能力的设备上，该任意具备数据处理能力的设备可以为诸如计算机等设备或装置。装置实施例可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在任意具备数据处理能力的设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言，如图3所示，为本发明一种量子随机电路的多振幅模拟装置所在任意具备数据处理能力的设备的一种硬件结构图，除了图3所示的处理器、内存、网络接口、以及非易失性存储器之外，实施例中装置所在的任意具备数据处理能力的设备通常根据该任意具备数据处理能力的设备的实际功能，还可以包括其他硬件，对此不再赘述。

上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程，在此不再赘述。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

本发明实施例还提供一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时，实现上述实施例中的一种量子随机电路的多振幅模拟方法。

所述计算机可读存储介质可以是前述任一实施例所述的任意具备数据处理能力的设备的内部存储单元，例如硬盘或内存。所述计算机可读存储介质也可以是外部存储设备，例如所述设备上配备的插接式硬盘、智能存储卡（Smart Media Card，SMC）、SD卡、闪存卡（Flash Card）等。进一步的，所述计算机可读存储介质还可以既包括任意具备数据处理能力的设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述任意具备数据处理能力的设备所需的其他程序和数据，还可以用于暂时地存储已经输出或者将要输出的数据。

以上所述，仅为本发明的优选实施案例，并非对本发明做任何形式上的限制。虽然前文对本发明的实施过程进行了详细说明，对于熟悉本领域的人员来说，其依然可以对前述各实例记载的技术方案进行修改，或者对其中部分技术特征进行同等替换。凡在本发明精神和原则之内所做修改、同等替换等，均应包含在本发明的保护范围之内。

Claims

1.一种量子随机电路的多振幅模拟方法，其特征在于，包括以下步骤：

步骤一：根据芯片片上存储的最大存储容量以及张量网络收缩路径中每一步张量的最大维数确定进行算子融合的起始位置至结束位置，具体为：当维数最大的张量所需的存储空间小于片上存储的最大存储容量的三分之一时，则这一步的张量网络收缩可进行算子融合，即可得到进行算子融合的起始位置至结束位置；

步骤二：在起始位置，分别将片外存储中的两个张量读取到片上存储并进行相应的转置，再进行融合，具体包括以下子步骤：

步骤2.3：在片上存储中完成张量A1和张量B的融合，将融合的结果存放到片上存储的本地数据内存ldmC位置；

步骤三：将融合的结果进行转置后储存，用于在下一位置与所读取后转置的张量进行融合，具体包括以下子步骤：

步骤3.3：在片上存储中完成张量A2和张量B的融合，将融合结果存放到片上存储的本地数据内存ldmC位置；

2.如权利要求1所述的一种量子随机电路的多振幅模拟方法，其特征在于，所述张量网络是由多个张量按照收缩规则构成的网络模型。

3.如权利要求1所述的一种量子随机电路的多振幅模拟方法，其特征在于，所述步骤四具体为：重复上述步骤三，直到算子融合到结束位置，将存放在本地数据内存ldmC位置的融合结果通过直接存储器访问写入方式写回到片外存储张量C位置。

4.一种量子随机电路的多振幅模拟装置，其特征在于，包括一个或多个处理器，用于实现权利要求1-3中任一项所述的一种量子随机电路的多振幅模拟方法。

5.一种计算机可读存储介质，其特征在于，其上存储有程序，该程序被处理器执行时，实现权利要求1-3中任一项所述的一种量子随机电路的多振幅模拟方法。