CN117787248A

CN117787248A - 量子自注意力文本处理方法、装置、量子设备及存储介质

Info

Publication number: CN117787248A
Application number: CN202410199691.6A
Authority: CN
Inventors: 吕金虎; 高庆; 郑瑾; 王薇
Original assignee: Hangzhou Innovation Research Institute of Beihang University
Current assignee: Hangzhou Innovation Research Institute of Beihang University
Priority date: 2024-02-23
Filing date: 2024-02-23
Publication date: 2024-03-29
Anticipated expiration: 2044-02-23
Also published as: CN117787248B

Abstract

本申请提供一种量子自注意力文本处理方法、装置、量子设备及存储介质，涉及量子机器学习领域。获取待处理文本，并编码到多个第一量子比特、多个第二量子比特以及多个第三量子比特，以得到第一量子态；通过注意力得分线路作用于多个第一量子比特、多个第二量子比特，得到演化的第二量子态；通过权重分配线路作用于多个第二量子比特与多个第三量子比特，得到演化的第三量子态；通过全连接线路作用于多个第三量子比特，得到演化的第四量子态，并测量出待处理文本的情感分类结果。如此，通过量子线路模拟自注意力机制对待处理文本进行分析，从而充分利用量子计算的特有优势提高文本识别效率与准确率。

Description

量子自注意力文本处理方法、装置、量子设备及存储介质

技术领域

本申请涉及量子机器学习领域，具体而言，涉及一种量子自注意力文本处理方法、装置、量子设备及存储介质。

背景技术

在信息技术的飞速发展下，数据的类型、结构以及生成速率呈爆炸式增长，从而加剧了大规模和复杂任务处理的挑战性。作为机器学习的关键技术之一，神经网络在许多领域证明了其显著的效能。然而，面对大型复杂任务时，神经网络的开发和训练所需的计算资源量非常庞大。随着摩尔定律的逐渐衰退及经典计算的物理边界限制，使得传统计算设备处理这些高需求任务的能力日益受到制约。

在此背景下，量子计算以其独特的计算范式脱颖而出，根据量子力学的基本原理，并通过量子态的叠加与纠缠特性，提供了与传统计算截然不同的处理方式。量子计算不仅指数级增加了存储容量，而且通过极高的并行计算能力，显著超越了传统计算机的效能，为解决机器学习算法中的复杂问题开辟了新的途径。此外，随着噪音中等规模量子处理器稳定计算性能的突破，量子机器学习和量子神经网络已经成为了本领域关注的热点。这些技术整合了机器学习的高效性能和量子系统的强大计算能力，展示出在推动人工智能发展方面的巨大潜力。

然而，当前量子神经网络在图像处理领域的应用较多，但其在文本数据处理方面的研究相对缺乏。文本数据因其固有的结构复杂性、高维度特性和丰富的语义层次，使其处理难度显著增加，尤其面向大规模复杂文本数据的处理，对传统机器学习算法构成了巨大挑战。因此，如何通过基于量子线路的神经网络对文本数据进行有效处理，以成为亟待解决的技术问题。

发明内容

为了克服现有技术中的至少一个不足，本申请提供一种量子自注意力文本处理方法、装置、量子设备及存储介质，具体包括：

第一方面，本申请提供一种量子自注意力文本处理方法，所述方法包括：

获取待处理文本；

将所述待处理文本编码到多个第一量子比特、多个第二量子比特以及多个第三量子比特，以使所述多个第一量子比特、多个第二量子比特以及多个第三量子比特处于第一量子态；

通过注意力得分线路作用于所述多个第一量子比特、所述多个第二量子比特，将所述第一量子态演化为第二量子态，其中，所述注意力得分线路用于模拟自注意力机制中的注意力得分操作；

通过权重分配线路作用于所述多个第二量子比特与所述多个第三量子比特，将所述第二量子态演化为第三量子态，其中，所述权重分配线路用于模拟自注意力机制中的权重分配操作；

通过全连接线路作用于所述多个第三量子比特，将所述第三量子态演化为第四量子态；

对所述多个第三量子比特进行测量，得到所述待处理文本的情感分类结果。

结合第一方面的可选实施方式，所述注意力得分线路包括多个纠缠子线路，用于分别作用于不同的第一量子对，每个所述第一量子对包括来自于所述多个第一量子比特的第一纠缠量子比特与来自于所述多个第二量子比特的第二纠缠量子比特，所述第一纠缠量子比特与所述第二纠缠量子比特具有相同的序列位置；

所述通过注意力得分线路作用于所述第一量子比特、所述第二量子比特，将所述第一量子态演化为第二量子态，包括：

对于每个所述第一量子对，所述第一量子对的纠缠子线路包括第一旋转单元、第二旋转单元、第一CNOT门、第二CNOT门，并通过以下顺序作用于所述第一量子对，将所述第一量子态演化为第二量子态：

通过所述第一旋转单元作用于所述第一量子对中的第一纠缠量子比特，并通过所述第二旋转单元作用于所述第一量子对中的第二纠缠量子比特；

通过所述第一CNOT门作用于所述第一纠缠量子比特与所述第二纠缠量子比特，其中，第一纠缠量子比特为控制比特；

通过所述第二CNOT门作用于所述第一纠缠量子比特与所述第二纠缠量子比特，其中，所述第二纠缠量子比特为控制比特。

结合第一方面的可选实施方式，所述权重分配线路包括多个权重子线路，用于分别作用于不同的第二量子对，每个所述第二量子对包括来自于所述多个第二量子比特的第一权重量子比特与来自于所述多个第三量子比特的第二权重量子比特，所述第一权重量子比特与所述第二权重量子比特具有相同的序列位置；

通过权重分配线路作用于所述第二量子比特与所述第三量子比特，将所述第二量子态演化为第三量子态，包括：

对于每个所述第二量子对，所述第二量子对的权重子线路包括：

第三旋转单元、R_z门、第四旋转单元；

第五旋转单元、第一R_y门、第二R_y门、第六旋转单元；

第三CNOT门、第四CNOT门、第五CNOT门；

通过以下顺序作用于所述第二量子对，将所述第二量子态演化为第三量子态：

通过所述第三旋转单元作用于所述第二量子对中的第一权重量子比特，并通过所述第四旋转单元作用于所述第二量子对中的第二权重量子比特；

通过第三CNOT门作用于第一权重量子比特与所述第二权重量子比特，其中，所述第二权重量子比特为控制比特；

通过所述R_z门作用于所述第一权重量子比特，并通过所述第一R_y门作用于所述第二权重量子比特；

通过所述第四CNOT门作用于第一权重量子比特与所述第二权重量子比特，其中，所述第一权重量子比特为控制比特；

通过所述第二R_y门作用于所述第二权重量子比特；

通过第五CNOT门作用于第一权重量子比特与所述第二权重量子比特，其中，所述第二权重量子比特为控制比特；

通过所述第五旋转单元作用于所述第二量子对中的第一权重量子比特，并通过所述第六旋转单元作用于所述第二量子对中的第二权重量子比特。

结合第一方面的可选实施方式，所述通过全连接线路作用于多个第三量子比特，将所述第三量子态演化为第四量子态，包括：

所述全连接线路包括为每个所述第三量子比特提供的第七旋转单元以及为每对相邻的所述第三量子比特提供的第六CNOT门，并通过以下顺序作用于所述多个第三量子比特，将所述第三量子态演化为第四量子态：

通过每个所述第三量子比特对应的第七旋转单元作用于所述第三量子比特；

依次通过每个所述第六CNOT门作用于对应的第三量子比特。

结合第一方面的可选实施方式，每个所述旋转单元包括多个量子旋转门，按照作用顺序依次为R_z门、R_y门与R_z门。

结合第一方面的可选实施方式，所述将所述待处理文本编码到多个第一量子比特、多个第二量子比特以及多个第三量子比特，包括：

根据所述待处理文本的向量维度，制备出所述多个第一量子比特；

将所述待处理文本编码到所述多个第一量子比特，其中，多个第一量子比特用于表征自注意力机制中的查询信息；

将所述多个第一量子比特进行扩增，得到所述多个第二量子比特以及所述多个第三量子比特，其中，所述多个第二量子比特与所述多个第三量子比特用于表征自注意力机制中的键-值信息。

结合第一方面的可选实施方式，所述将所述待处理文本进行编码到所述多个第一量子比特，包括：

将所述待处理文本转换为多个词向量；

将所述多个词向量通过幅值编码的方式，转化为所述多个第一量子比特的量子态。

第二方面，本申请还提供一种量子自注意力文本处理装置，所述装置包括：

文本转换模块，用于获取待处理文本；将所述待处理文本编码到多个第一量子比特、多个第二量子比特以及多个第三量子比特，以使所述多个第一量子比特、多个第二量子比特以及多个第三量子比特处于第一量子态；

量子演化模块，用于通过注意力得分线路作用于所述多个第一量子比特、所述多个第二量子比特，将所述第一量子态演化为第二量子态，其中，所述注意力得分线路用于模拟自注意力机制中的注意力得分操作；

所述量子演化模块，还用于通过权重分配线路作用于所述多个第二量子比特与所述多个第三量子比特，将所述第二量子态演化为第三量子态，其中，所述权重分配线路用于模拟自注意力机制中的权重分配操作；

所述量子演化模块，还用于通过全连接线路作用于所述多个第三量子比特，将所述第三量子态转换为第四量子态；

量子测量模块，用于对所述多个第三量子比特进行测量，得到所述待处理文本的情感分类结果。

结合第二方面的可选实施方式，所述注意力得分线路包括多个纠缠子线路，用于分别作用于不同的第一量子对，每个所述第一量子对包括来自于所述多个第一量子比特的第一纠缠量子比特与来自于所述多个第二量子比特的第二纠缠量子比特，所述第一纠缠量子比特与所述第二纠缠量子比特具有相同的序列位置；

所述量子演化模块还具体用于：

结合第二方面的可选实施方式，所述权重分配线路包括多个权重子线路，用于分别作用于不同的第二量子对，每个所述第二量子对包括来自于所述多个第二量子比特的第一权重量子比特与来自于所述多个第三量子比特的第二权重量子比特，所述第一权重量子比特与所述第二权重量子比特具有相同的序列位置；

所述量子演化模块还具体用于：

对于每个所述第二量子对，所述第二量子对的权重子线路包括第三旋转单元、R_z门、第四旋转单元、第五旋转单元、第一R_y门、第二R_y门、第六旋转单元、第三CNOT门、第四CNOT门、第五CNOT门，并通过以下顺序作用于所述第二量子对，将所述第二量子态演化为第三量子态：

通过所述第二R_y门作用于所述第二权重量子比特；

结合第二方面的可选实施方式，所述量子演化模块还具体用于：

所述全连接线路包括为每个所述第三量子比特提供的第七旋转单元以及为任意相邻的所述第三量子比特提供的第六CNOT门，并通过以下顺序作用于所述多个第三量子比特，将所述第三量子态转换为第四量子态：

依次通过每个所述第六CNOT门作用于对应的第三量子比特。

结合第二方面的可选实施方式，每个所述旋转单元包括多个量子旋转门，按照作用顺序依次为R_z门、R_y门与R_z门。

结合第二方面的可选实施方式，所述文本转换模块还具体用于：

将所述待处理文本转换为多个词向量；

第三方面，本申请还提供一种量子设备，所述量子设备包括处理器以及存储器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，实现所述的量子自注意力文本处理方法。

第四方面面，本申请还提供一种存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时，实现所述的量子自注意力文本处理方法。

相对于现有技术而言，本申请具有以下有益效果：

本申请提供一种量子自注意力文本处理方法、装置、量子设备及存储介质。该方法中，获取待处理文本，并编码到多个第一量子比特、多个第二量子比特以及多个第三量子比特，以使多个第一量子比特、多个第二量子比特以及多个第三量子比特处于第一量子态；通过注意力得分线路作用于多个第一量子比特、多个第二量子比特，得到演化的第二量子态；通过权重分配线路作用于多个第二量子比特与多个第三量子比特，得到演化的第三量子态；通过全连接线路作用于多个第三量子比特，得到演化的第四量子态，并测量出待处理文本的情感分类结果。如此，通过量子线路模拟自注意力机制对待处理文本进行分析，从而充分利用量子计算的特有优势提高文本识别效率与准确率。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1A为本申请实施例提供的CNOT门的示意图之一；

图1B为本申请实施例提供的CNOT门的示意图之二；

图2为本申请实施例提供的量子自注意力文本处理方法的流程图；

图3为本申请实施例提供的量子自注意力神经网络模型的结构示意图；

图4为本申请实施例提供的注意力得分线路的结构示意图；

图5为本申请实施例提供的权重分配线路的结构示意图；

图6为本申请实施例提供的全连接线路的结构示意图；

图7为本申请实施例提供的量子自注意力文本处理装置的结构示意图；

图8为本申请实施例提供的量子设备的结构示意图。

图标：101-纠缠子线路；102-权重子线路；201-文本转换模块；202-量子演化模块；203-量子测量模块；301-存储器；302-处理器；303-通信单元；304-系统总线。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

在本申请的描述中，需要说明的是，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。此外，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

基于以上声明，正如背景技术中所介绍的，当前量子神经网络在图像处理领域的应用较多，但其在文本数据处理方面的研究相对缺乏。因此，如何通过基于量子线路的神经网络对文本数据进行有效处理，以成为亟待解决的技术问题。

考虑到本实施例需要通过量子电路来实现自注意力机制，涉及到量子计算与自注意力机制相关的技术信息，为使后续介绍的实施例更易于理解，先对量子计算与自注意力机制进行说明。

（1）量子计算，量子计算是一种利用量子力学原理进行信息处理的技术。在经典计算中，信息的最小单位是比特，它只能处于0或1的状态。然而，在量子计算中，最小的信息单位是量子比特。量子比特与经典比特的不同之处在于，量子比特可以同时存在于0和1的叠加态。这意味着一个量子比特可以同时代表0和1，而不仅仅是其中一个。当我们有多个量子比特时，这种叠加态的能力会指数级增长，因为每个量子比特都可以同时处于多种状态的叠加。

（2）量子比特，量子计算的基本单元。其中，相较于传统计算机使用0和1作为二进制的基本单元，与之不同的是，量子计算可以同时处理0和1，使得系统可以处于0和1的线性叠加态:，其中，代表系统在0和1上的复数概率幅，它们的模平方分别代表处于0和1的概率。

（3）量子线路，量子通用计算机的一种抽象表示，它描述了量子算法或程序在量子门模型下的具体硬件实现。在量子计算中，量子门是基本的构建块，用于执行量子操作，类似于经典计算中的逻辑门。量子线路由一系列量子门组成，这些量子门按照特定的顺序排列，用于处理量子比特上的信息。参数化的量子线路是指在量子线路中包含了一些可调节的控制量子门的参数。这些参数可以调整量子门的操作，从而改变量子线路的行为。通过调整这些参数，可以优化量子算法的执行，提高计算效率，或者实现特定的量子操作。参数化的量子线路在量子优化问题、机器学习等领域有广泛的应用。

（4）量子门，量子门是量子计算中的基本操作，它们对量子比特的状态进行变换。在数学上，量子门通常用酉矩阵来表示。酉矩阵是一种复数方阵，其特点是，它们的逆矩阵等于它们的共轭转置矩阵。对于操作个量子比特的量子门，可以用的酉矩阵表示。量子门的操作可以通过将代表量子门的酉矩阵与代表量子比特状态的列向量进行矩阵乘法来实现。量子比特的状态通常用态向量来表示，态向量的每个元素对应于量子比特在特定基态上的概率幅。当量子门作用在量子比特上时，态向量会按照量子门的酉矩阵进行变换。根据作用量子比特的数量，可以分为单量子比特门，例如，Hadamard门、旋转门；双量子比特门，例如，CNOT门、SWAP门；三量子比特门，例如，Toffoli门、Fredkin门。

（5）旋转门，旋转门是量子门的一种，是一组三个的酉矩阵（又名幺正厄米复矩阵）。包括旋转X门、旋转Y门以及旋转Z门。

其中，旋转X门(又名R_x门)可以表示为：

；

旋转Y门(又名R_y门)可以表示为：

；

旋转Z门(又名R_z门)可以表示为：

；

（6）CNOT门，用于对两个量子比特进行操作，其中一个量子比特作为控制比特，另一个作为目标比特。CNOT门的基本功能是，当控制比特为时，翻转目标比特的状态；如果控制比特为，则目标比特的状态保持不变。

CNOT门可以表示为以下酉矩阵:

在量子线路中，CNOT门有图1A-图1B两种表示方式，图中任意两量子比特之间，较小的圆形图案（未标记有符号“+”）表示控制比特，较大的圆形图案（标记有符号“+”）表示目标比特；CNOT门的含义是当控制比特为态时，目标比特不发生改变；当控制比特为态时，对目标比特执行量子非门操作，从而实现量子比特之间的量子纠缠。

（7）量子测量，量子测量是量子力学中的概念，描述了在特定条件下，量子系统的某个属性被确定性地获取的过程。在测量之前，量子系统处于多个可能状态的叠加，测量操作会使波函数坍缩到某个特定的本征态，这个状态对应于测量结果。由于测量过程使量子系统从可能性的叠加进入了确定性的现实，从而使得量子系统按照测量结果表现出经典物理学的特性，因此，量子测量常被用于将量子态转换为经典数据。

（8）自注意力机制是一种用于处理序列数据的重要机制，广泛应用于自然语言处理、计算机视觉等领域。其核心思想是在处理序列数据时，能够自动地捕捉序列内部的关系，从而更好地理解数据。自注意力机制的基本原理如下：

查询（Query）、键（Key）和值（Value）：自注意力机制将序列中的每个元素都表示为一个向量，并将这些向量分为三组，分别称为查询（Query）、键（Key）和值（Value）。

相似度计算：对于序列中的每个元素，自注意力机制会计算其与其他所有元素的相似度，这通常是通过计算查询向量和键向量之间的点积来实现的。

权重分配：根据相似度计算结果，自注意力机制会为每个元素分配一个权重，权重的大小表示该元素与其他元素的相关性。

加权求和：自注意力机制会根据权重对值向量进行加权求和，得到最终的输出向量，这个输出向量包含了该元素与其他元素之间的关系信息。

自注意力机制的主要优点是它能够同时考虑序列中的所有元素，从而捕捉到长距离依赖关系。这使得它在处理长文本、语音等序列数据时具有优势。此外，自注意力机制的计算复杂度较低，可以并行化处理，提高了计算效率。因此，自注意力机制被应用于很多著名的神经网络模型中，例如，Transformer模型、BERT模型等。这些模型在自然语言处理、机器翻译、文本生成等任务中取得了显著的成果。

具体而言，自注意力机制中，将“查询（Query）”和相关的“键-值（Key-Value）对”映射为一个输出向量。该输出通过对“值”向量的加权求和产生，其中权重基于“查询”和对应“键”之间的兼容性函数分配，即给定一个包含个单词的输入序列，其中表示单词的维度，每个单词通过与三个权重矩阵分别相乘，将得到的结果分别命名为“查询（）”、“键（）”和“值（）”。

然后，基于上述“查询（）”、“键（）”和“值（）”，通过缩放点积函数计算兼容性分数，表达式为：

；

基于兼容性分数，进一步计算注意力权重，注意力权重表示序列中不同单词间的相关性，表达式为：

；

最后，通过上述注意力权重，构造输出表示，。

上述注意力机制的实现过程可概述为对于文本序列中的每个单词，计算它与其他所有单词的注意力得分，用以衡量在当前单词的上下文中，其他单词对其重要性或相关性。将这些注意力得分归一化后然后通过对每个单词分配加权的上下文表示，从而捕捉文本内单词间的细微关系与语义信息。

基于上述相关术语的介绍，需要注意的是，以上现有技术中的方案所存在的缺陷，是发明人在经过实践并仔细研究后得出的结果，因此，上述问题的发现过程以及下文中本申请实施例针对上述问题所提出的解决方案，都应该是发明人在发明创造过程中对本申请做出的贡献，而不应当理解为本领域技术人员所公知的技术内容。

鉴于上述问题，本实施例提供一种量子自注意力文本处理方法。该方法中，获取待处理文本；将待处理文本编码到多个第一量子比特、多个第二量子比特以及多个第三量子比特，以使多个第一量子比特、多个第二量子比特以及多个第三量子比特处于第一量子态；通过注意力得分线路作用于多个第一量子比特、多个第二量子比特，将第一量子态演化为第二量子态，其中，注意力得分线路用于模拟自注意力机制中的注意力得分操作；通过权重分配线路作用于多个第二量子比特与多个第三量子比特，将第二量子态演化为第三量子态，其中，权重分配线路用于模拟自注意力机制中的权重分配操作；通过全连接线路作用于多个第三量子比特，将第三量子态演化为第四量子态；对多个第三量子比特进行测量，得到待处理文本的情感分类结果。如此，通过量子线路模拟自注意力机制对待处理文本进行分析，从而充分利用量子计算的特有优势提高文本识别效率与准确率。

为使本实施例提供的方案更加清楚，下面结合图2对该方法的各个步骤进行详细阐述。但应该理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其他操作，也可以从流程图中移除一个或多个操作。如图2所示，该方法包括：

S101，获取待处理文本。

本实施例中，该待处理文本可以来自于网页和特定的社交媒体平台，这些数据大多为半结构化形式，包含嵌套的层次化结构、多样的主题和丰富的语义信息。

S102，将待处理文本编码到多个第一量子比特、多个第二量子比特以及多个第三量子比特，以使多个第一量子比特、多个第二量子比特以及多个第三量子比特处于第一量子态。

需要说明的是，本实施例将多个第一量子比特、多个第二量子比特以及多个第三量子比整体视为量子系统，第一量子态表征该量子系统的状态，量子系统中任意一个或者多个量子比特的状态发生变化，均会导致量子系统从第一量子态变为其他量子态。基于上述关于第一量子态的说明，本实施例提供步骤S102的以下可选实施方式：

S102-1，根据待处理文本的向量维度，制备出多个第一量子比特；

S102-2，将待处理文本编码到多个第一量子比特。

应理解的是，由于量子线路仅能对量子比特进行处理，因此，需要将经典计算机处理的二进制数据转化为量子态。因此，步骤S102-2的可选实施方式中，可以将待处理文本转换为多个词向量；将多个词向量通过幅值编码的方式，转化为多个第一量子比特的量子态。

具体而言，对于待处理文本，先通过去除标点符号、大小写规范化、分词、去除停用词和词形还原等文本预处理方法对待处理文本进行清洗。然后，通过Word2Vec模型，基于文本中单词的上下文关系，将预处理后的待处理文本转换为表达单词语义的多维向量表示。其中，Word2Vec是一种计算模型，能够捕捉到单词之间的语义和语法关系，使得语义上相似的单词在向量空间中彼此靠近，因此，能够用于将单词或短语转换为向量。基于Word2Vec模型，待处理文本的词向量转换过程如下：

（1）假定输入Word2Vec模型的是文本中个单词的one-hot表示。例如，对于单词，其one-hot表示为向量，其中，，其他为0，则表示词汇的最大数量。

（2）初始化Word2Vec模型中输入层和隐藏层之间的权重矩阵，其中，表示隐藏层的维度。以及，初始化隐藏层和输出层之间的权重矩阵。

（3）在输出层应用softmax函数，以获得给定其上下文单词的目标单词的概率分布。

然后，输入文本进行训练，训练目标是调整两个矩阵的权重以最大化给定其上下文单词的目标单词的可能性。最终，将优化后的权重作为待处理文本中单词的词向量。需要说明是的，上述示例为本实施例提供的一种可选实施方式，但不应视为对本申请的限定。技术人员在实施本方案时，还可以根据需要采取其他词向量转换工具对待处理文本进行处理。

将待处理文本转换为词向量后，鉴于幅值编码是将经典数据编码为量子数据的一种有效方法，因此，可以将上述实施例得到的词向量编码为量子态的概率幅。需要说明的是，利用量子比特处于叠加态的特性，可以将维的向量用个量子比特进行表示。具体地，一个维的经典向量，通过幅值编码的方式可编码成量子态，其中，为归一化常数，。例如，向量可被编码为。

由此，基于幅值编码方法，制备相应数量的第一量子比特，然后，通过特定量子线路将待处理文本的词向量转换为第一量子比特的量子态，从而以完成输入向量的量子态制备。

基于上述实施例对多个第一量子比特的介绍，上述步骤S102还包括：

S102-3，将多个第一量子比特进行扩增，得到多个第二量子比特以及多个第三量子比特。

对此，应理解的是，由自注意力机制的原理可知，自注意力机制将序列中的每个元素都表示为一个向量，并将这些向量设置为三组，分别称为查询（Query）、键（Key）和值（Value）。因此，为了通过量子线路模拟这一过程，本实施例将待处理文本编码到所需的多个第一量子比特，并对多个第一量子比特进行扩增，得到多个第二量子比特以及多个第三量子比特。基于这些量子比特，先通过注意力得分线路作用于多个第一量子比特与多个第二量子比特，以模拟注意力得分的运算过程；然后，通过权重分配线路作用于多个第二量子比特与多个第三量子比特，以模拟权重分配的运算过程。因此，继续参见图2，本实施例提供的量子自注意力文本处理方法，还包括：

S103，通过注意力得分线路作用于多个第一量子比特、多个第二量子比特，将第一量子态演化为第二量子态。

其中，注意力得分线路用于模拟自注意力机制中的注意力得分操作。本实施例中，注意力得分线路包括多个纠缠子线路，用于分别作用于不同的第一量子对，每个第一量子对包括来自于多个第一量子比特的第一纠缠量子比特与来自于多个第二量子比特的第二纠缠量子比特，第一纠缠量子比特与第二纠缠量子比特具有相同的序列位置。

对于每个第一量子对，第一量子对的纠缠子线路包括第一旋转单元、第二旋转单元、第一CNOT门、第二CNOT门，并通过以下顺序作用于第一量子对，将第一量子态演化为第二量子态：

通过第一旋转单元作用于第一量子对中的第一纠缠量子比特，并通过第二旋转单元作用于第一量子对中的第二纠缠量子比特；

通过第一CNOT门作用于第一纠缠量子比特与第二纠缠量子比特，其中，第一纠缠量子比特为控制比特；

通过第二CNOT门作用于第一纠缠量子比特与第二纠缠量子比特，其中，第二纠缠量子比特为控制比特。

示例性的，如图3所示，对于量子自注意力神经网络模型的输入，将多个第一量子比特表示为，将多个第二量子比特表示为，将多个第三量子比特表示为，这些量子比特作为本实施例提供的量子自注意力神经网络模型的输入。并且，本实施例提供的量子自注意力神经网络模型包括量子自注意力线路、全连接线路与测量线路，其中，量子自注意力线路包括注意力得分线路与权重分配线路。

本实施例中，通过注意力得分线路作用于多个第一量子比特与多个第二量子比特，从而模拟自注意力机制中的注意力得分计算过程。为了达到这一目的，本实施例提供了如图4所示的注意力得分线路。由图4可以看出，多个第一量子比特与多个第二量子比特具有相同的数量。为了便于描述，将多个第一量子比特表示为，将多个第二量子比特表示为，表示量子比特的序列号。注意力得分线路中，将同一序列位置的两个量子比特称为第一量子对，并为每对第一量子对提供有纠缠子线路101，例如，为组成的第一量子对提供有一个纠缠子线路101，为组成的第一量子对提供有一个纠缠子线路101（图中未示出）。

继续参见图4，每个纠缠子线路101中包括相同结构的第一旋转单元与第二旋转单元（每个旋转单元又被称为通用单量子比特门）。每个旋转单元均包括多个量子旋转门，按照作用顺序依次为R_z门、R_y门与R_z门。以组成的第一量子对为例，纠缠子线路101的对的演化过程如下：

第一旋转单元作用于，第二旋转单元作用于；然后，再通过第一CNOT门同时作用于，其中，为控制比特；最后，再通过第二CNOT门同时作用于，其中，为控制比特。对于图4中同一序列位置的其他第一量子对，对应纠缠子线路101对其中第一纠缠量子比特与第二纠缠量子比特的演化方式一致，因此，本实施例不再进行赘述。

基于上述注意力得分线路对多个第一量子比特与多个第二量子比特的演化，将演化后的多个第二量子比特进一步与多个第三量子比特做进一步演化，因此，本实施例提供的量子自注意力文本处理方法，还包括：

S104，通过权重分配线路作用于多个第二量子比特与多个第三量子比特，将第二量子态演化为第三量子态。

其中，权重分配线路用于模拟自注意力机制中的权重分配操作。本实施例中，权重分配线路包括多个权重子线路，用于分别作用于不同的第二量子对，每个第二量子对包括来自于多个第二量子比特的第一权重量子比特与来自于多个第三量子比特的第二权重量子比特，第一权重量子比特与第二权重量子比特具有相同的序列位置。

对于每个第二量子对，第二量子对的权重子线路包括第三旋转单元、R_z门、第四旋转单元、第五旋转单元、第一R_y门、第二R_y门、第三CNOT门、第四CNOT门、第五CNOT门、第六旋转单元，并通过以下顺序作用于第二量子对，将第二量子态演化为第三量子态：

通过第三旋转单元作用于第二量子对中的第一权重量子比特，并通过第四旋转单元作用于第二量子对中的第二权重量子比特；

通过第三CNOT门作用于第一权重量子比特与第二权重量子比特，其中，第二权重量子比特为控制比特；

通过R_z门作用于第一权重量子比特，并通过第一R_y门作用于第二权重量子比特；

通过第四CNOT门作用于第一权重量子比特与第二权重量子比特，其中，第一权重量子比特为控制比特；

通过第二R_y门作用于第二权重量子比特；

通过第五CNOT门作用于第一权重量子比特与第二权重量子比特，其中，第二权重量子比特为控制比特；

通过第五旋转单元作用于第二量子对中的第一权重量子比特，并通过第六旋转单元作用于第二量子对中的第二权重量子比特。

示例性的，继续参见图3，多个第一量子比特、多个第二量子比特、多个第三量子比特构成的量子系统从第一量子态演化为第二量子态后，进一步通过权重分配线路作用于多个第二量子比特与多个第三量子比特，从而模拟自注意力机制中的权重分配计算过程。为了达到这一目的，本实施例提供了如图5所示的权重分配线路。由图5可以看出，多个第二量子比特与多个第三量子比特具有相同的数量。为了便于描述，将多个第二量子比特继续表示为，将多个第三量子比特表示为，表示量子比特的序列号。在权重分配线路中，将同一序列位置的两个量子比特称为第二量子对，并为每对第二量子对提供有权重子线路102，例如，为组成的第二量子对提供有一个权重子线路102，为组成的第二量子对提供有一个权重子线路102（图中未示出）。

继续参见图5，与纠缠子线路101一样，每个权重子线路102同样包括相同结构的第三旋转单元、第四旋转单元、第五旋转单元以及第六旋转单元，每个旋转单元均包括多个量子旋转门，按照作用顺序依次为R_z门、R_y门与R_z门。以组成的第二量子对为例，权重子线路102对的演化过程如下：

第三旋转单元作用于，第四旋转单元作用于；然后，再通过第三CNOT门同时作用于，其中，为控制比特；然后，再通过R_z门作用于，第一R_y门作用于；然后，再通过第四CNOT门同时作用于，其中，为控制比特；然后，再通过第二R_y门作用于；然后，在通过第五CNOT门同时作用于，为控制比特；最后，再通过第五旋转单元作用于，第六旋转单元作用于。对于图5中同一序列位置的其他第二量子对，对应权重子线路102对其中第一权重量子比特与第二权重量子比特的演化方式一致，因此，本实施例不再进行赘述。

通过上述注意力得分线路、权重分配线路模拟经典自注意力机制的计算过程，不仅可以高效地完成自注意力运算，而且能够深入捕捉文本中单词间的复杂相互作用，确保每个单词都综合了上下文信息，丰富其语义表达力；从而将第二量子态演化为第三量子态后，继续参见图2，本实施例提供的量子自注意力文本处理方法还包括：

S105，通过全连接线路作用于多个第三量子比特，将第三量子态转换为第四量子态。

S106，对多个第三量子比特进行测量，得到待处理文本的情感分类结果。

如图6所示，全连接线路包括为每个第三量子比特提供的第七旋转单元以及为每对相邻的第三量子比特提供的第六CNOT门，并通过以下顺序作用于多个第三量子比特，将第三量子态转换为第四量子态：

通过每个第三量子比特对应的第七旋转单元作用于第三量子比特；

依次通过每个第六CNOT门作用于对应的一对第三量子比特。

最后，对处于第四量子态的多个第三量子比特进行测量，从而得到待处理文本的情感分类结果。

继续参见图6，需要说明的是，全连接线路构建于量子自注意力层之后，用于深度整合和融合每个单词的表示，以形成整个文本的全局表示。第七旋转单元，包括多个量子旋转门，按照作用顺序依次为Rz门、Ry门与Rz门，分别作用于已获得丰富上下文信息的第三量子比特上，然后，利用第六CNOT门对相邻的第三量子比特进行连接，形成一个闭环的量子电路，通过上述设计进一步强化了单词间的语义联系，将单词层面的局部信息融合成文本的整体语义表示。

综上所述，本实施例提供的量子自注意力神经网络模型能够充分利用量子计算的特有优势，在处理文本数据类型任务方面展现出显著能力，突破了量子神经网络仅限于处理图像类型数据的局限，大幅度拓展了当前量子神经网络的应用领域。此外，量子自注意力神经网络模型是基于量子线路构建而成，采用注意力得分线路和权重分配线路作为量子自注意力层，使得自注意力机制在模型中更加直观和可解释。模型能够有效地分析和挖掘文本数据中的深层语义关系和结构特征，实现对大规模、复杂文本数据的高效处理。该量子自注意力神经网络模型能够适应各类长度与复杂度的文本数据处理需求，并可依据各种自然语言处理任务的特定需求进行个性化定制和模块化扩展，从而使得模型能够在广泛的应用场景下维持其高效的文本数据处理和分析能力。

上述实施例描述了预先训练的量子自注意力神经网络模型对量子比特的演化过程。但应理解的是，与经典自注意力神经网络模型类似，量子自注意力神经网络模型也需要经过训练后，才能用于对待处理文本进行情感分类。

本实施例中，利用均方误差损失函数来指导量子自注意力神经网络模型进行参数更新和优化，该函数评估的是量子自注意力神经网络模型的输出结果与训练数据所对应的目标标签之间的误差。该均方误差损失函数定义为：

；

式中，表示训练集中的目标输出，表示训练集的规模大小，表示模型的输出，该输出通过测量层对量子比特进行测量获得。在量子计算中，量子测量操作可从量子数据中提取经典信息。其中，投影测量是最常用的量子测量方式，假设一个量子可观测量，其可用一个厄米算符表示。测量结果表示为该量子比特上的期望值，的表达式为：

；

式中，，表示量子自注意力神经网络模型的输入量子态，表示量子自注意力神经网络模型的整个酉操作，表示模型的参数向量，向量中的每个元素对应于一个单量子比特旋转门，表达式为：

；

式中，表示单量子比特门，每个的数据表达式为泡利矩阵：

；

本实施例中，对采用测量，可确保期望值在的范围内，因此，对于文本数据的二分类任务，能够直接将其作为量子自注意力神经网络模型的目标函数。

在模型训练过程中，利用的计算结果，采用适用于参数化量子线路的梯度计算方法以及梯度下降优化算法，更新模型中的可调参数，已达到最小化的目的，从而获得具有最优性能的量子自注意力神经网络模型。梯度计算与参数更新具体实现步骤包括：

（1）计算的梯度

本实施中，采用参数偏移法则和链式法则来计算的梯度。以为例，其计算方式为：

式中，表示一个特定的向量，该向量除了第个元素为1，其余都为0。

（2）更新模型参数

利用随机梯度优化算法，根据的下降方向更新量子自注意力神经网络的参数，计算表达式为：

；

式中，表示学习率，用于可控制参数更新的步长大小。通过上述计算方式对量子自注意力神经网络模型的参数进行迭代，从而使得模型的输出结果更加接近训练数据的目标标签。

基于与本实施例所提供量子自注意力文本处理方法相同的发明构思，本实施例还提供一种量子自注意力文本处理装置，该装置包括至少一个可以软件形式存储于存储器或固化在量子设备中的软件功能模块。量子设备中的处理器用于执行存储器中存储的可执行模块。例如，量子自注意力神经网络处理文本的装置所包括的软件功能模块及计算机程序等。请参照图7，从功能上划分，量子自注意力神经网络处理文本的装置可以包括：

文本转换模块201，用于获取待处理文本；将待处理文本编码到多个第一量子比特、多个第二量子比特以及多个第三量子比特，以使多个第一量子比特、多个第二量子比特以及多个第三量子比特处于第一量子态；

量子演化模块202，用于通过注意力得分线路作用于多个第一量子比特、多个第二量子比特，将第一量子态演化为第二量子态，其中，注意力得分线路用于模拟自注意力机制中的注意力得分操作；

量子演化模块202，还用于通过权重分配线路作用于多个第二量子比特与多个第三量子比特，将第二量子态演化为第三量子态，其中，权重分配线路用于模拟自注意力机制中的权重分配操作；

量子演化模块202，还用于通过全连接线路作用于多个第三量子比特，将第三量子态转换为第四量子态；

量子测量模块203，用于对多个第三量子比特进行测量，得到待处理文本的情感分类结果。

本实施例中，文本转换模块201用于实现图2中的步骤S101、S102，量子演化模块202用于实现图2中的步骤S203、S104、S105，量子测量模块203用于实现图2中步骤S106。因此，对于上述各模块的详细描述可以参见对应步骤的具体实施方式，本实施不再进行赘述。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

还应理解的是，以上实施方式如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本申请各个实施例所述方法的全部或部分步骤。

因此，本实施例还提供一种存储介质，该存储介质为计算机可读存储介质。该存储介质存储有计算机程序，该计算机程序被处理器执行时，实现本实施例提供的量子自注意力神经网络处理文本数据的方法。其中，该存储介质可以是U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

本实施例提供的一种实施上述量子自注意力文本处理方法的量子设备，该量子设备可以是，但不限于，超导量子计算机、离子阱量子计算机、光量子计算机以及核磁共振量子计算机等。如图8所示，该量子设备可包括处理器302及存储器301。并且，存储器301存储有计算机程序，处理器通过读取并执行存储器301中与以上实施方式对应的计算机程序，实现本实施例所提供的量子自注意力神经网络处理文本数据的方法。

继续参见图8，该量子设备还包括有通信单元303。该存储器301、处理器302以及通信单元303各元件相互之间通过系统总线304直接或间接地电性连接，以实现数据的传输或交互。

其中，该存储器301可以是基于任何电子、磁性、光学或其它物理原理的信息记录装置，用于记录执行指令、数据等。在一些实施方式中，该存储器301可以是，但不限于，易失存储器、非易失性存储器、存储驱动器等。

在一些实施方式中，该易失存储器可以是随机存取存储器（Random AccessMemory，RAM）；在一些实施方式中，该非易失性存储器可以是只读存储器（Read OnlyMemory，ROM）、可编程只读存储器（Programmable Read-Only Memory，PROM）、可擦除只读存储器（Erasable Programmable Read-Only Memory，EPROM）、电可擦除只读存储器（Electric Erasable Programmable Read-Only Memory，EEPROM）、闪存等；在一些实施方式中，该存储驱动器可以是磁盘驱动器、固态硬盘、任何类型的存储盘（如光盘、DVD等），或者类似的存储介质，或者它们的组合等。

该通信单元303用于通过网络收发数据。在一些实施方式中，该网络可以包括有线网络、无线网络、光纤网络、远程通信网络、内联网、因特网、局域网（Local Area Network，LAN）、广域网（Wide Area Network，WAN）、无线局域网（Wireless Local Area Networks，WLAN）、城域网（Metropolitan Area Network，MAN）、广域网（Wide Area Network，WAN）、公共电话交换网（Public Switched Telephone Network，PSTN）、蓝牙网络、ZigBee网络、或近场通信（Near Field Communication，NFC）网络等，或其任意组合。在一些实施例中，网络可以包括一个或多个网络接入点。例如，网络可以包括有线或无线网络接入点，例如基站和/或网络交换节点，服务请求处理系统的一个或多个组件可以通过该接入点连接到网络以交换数据和/或信息。

该处理器302可能是一种集成电路芯片，具有信号的处理能力，并且，该处理器可以包括一个或多个处理核（例如，单核处理器或多核处理器）。仅作为举例，上述处理器可以包括量子处理器、中央处理单元（Central Processing Unit，CPU）、专用集成电路（Application Specific Integrated Circuit，ASIC）、专用指令集处理器（ApplicationSpecific Instruction-set Processor，ASIP）、图形处理单元（Graphics ProcessingUnit，GPU）、物理处理单元（Physics Processing Unit，PPU）、数字信号处理器 (DigitalSignal Processor，DSP)、现场可编程门阵列(Field Programmable Gate Array，FPGA)、可编程逻辑器件(Programmable Logic Device，PLD)、控制器、微控制器单元、简化指令集计算机(Reduced Instruction Set Computing，RISC)、或微处理器等，或其任意组合。

可以理解，图8所示的结构仅为示意。量子设备还可以具有比图8所示更多或者更少的组件，或者具有与图8所示不同的配置。图8所示的各组件可以采用硬件、软件或其组合实现。

应该理解到的是，在上述实施方式中所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

以上所述，仅为本申请的各种实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种量子自注意力文本处理方法，其特征在于，所述方法包括：

获取待处理文本；

将所述待处理文本编码到多个第一量子比特、多个第二量子比特以及多个第三量子比特，以使所述多个第一量子比特、所述多个第二量子比特以及所述多个第三量子比特处于第一量子态；

2.根据权利要求1所述的量子自注意力文本处理方法，其特征在于，所述注意力得分线路包括多个纠缠子线路，用于分别作用于不同的第一量子对，每个所述第一量子对包括来自于所述多个第一量子比特的第一纠缠量子比特与来自于所述多个第二量子比特的第二纠缠量子比特，所述第一纠缠量子比特与所述第二纠缠量子比特具有相同的序列位置；

3.根据权利要求1所述的量子自注意力文本处理方法，其特征在于，所述权重分配线路包括多个权重子线路，用于分别作用于不同的第二量子对，每个所述第二量子对包括来自于所述多个第二量子比特的第一权重量子比特与来自于所述多个第三量子比特的第二权重量子比特，所述第一权重量子比特与所述第二权重量子比特具有相同的序列位置；

第三旋转单元、R_z门、第四旋转单元；

第五旋转单元、第一R_y门、第二R_y门、第六旋转单元；

第三CNOT门、第四CNOT门、第五CNOT门；

通过所述第二R_y门作用于所述第二权重量子比特；

4.根据权利要求1所述的量子自注意力文本处理方法，其特征在于，所述通过全连接线路作用于多个第三量子比特，将所述第三量子态演化为第四量子态，包括：

依次通过每个所述第六CNOT门作用于对应的第三量子比特。

5.根据权利要求2-4任意一项所述的量子自注意力文本处理方法，其特征在于，每个所述旋转单元包括多个量子旋转门，按照作用顺序依次为R_z门、R_y门与R_z门。

6.根据权利要求1所述的量子自注意力文本处理方法，其特征在于，所述将所述待处理文本编码到多个第一量子比特、多个第二量子比特以及多个第三量子比特，包括：

7.根据权利要求6所述的量子自注意力文本处理方法，其特征在于，所述将所述待处理文本进行编码到所述多个第一量子比特，包括：

将所述待处理文本转换为多个词向量；

8.一种量子自注意力文本处理装置，其特征在于，所述装置包括：

9.一种量子设备，其特征在于，所述量子设备包括处理器以及存储器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，实现权利要求1-7任意一项所述的量子自注意力文本处理方法。

10.一种存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时，实现权利要求1-7任意一项所述的量子自注意力文本处理方法。