CN114676837A - 基于量子模拟器的进化量子神经网络架构搜索方法 - Google Patents

基于量子模拟器的进化量子神经网络架构搜索方法 Download PDF

Info

Publication number
CN114676837A
CN114676837A CN202210362448.2A CN202210362448A CN114676837A CN 114676837 A CN114676837 A CN 114676837A CN 202210362448 A CN202210362448 A CN 202210362448A CN 114676837 A CN114676837 A CN 114676837A
Authority
CN
China
Prior art keywords
quantum
neural network
chromosome
gate
logic gate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210362448.2A
Other languages
English (en)
Inventor
李阳阳
郝晓斌
赵裴翔
刘睿娇
焦李成
尚荣华
马文萍
缑水平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202210362448.2A priority Critical patent/CN114676837A/zh
Publication of CN114676837A publication Critical patent/CN114676837A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N10/00Quantum computing, i.e. information processing based on quantum-mechanical phenomena
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Optimization (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Analysis (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于量子模拟器的进化量子神经网络架构搜索方法,主要解决现有技术设计的量子神经网络模型精度低、复杂度高的问题。其实现方案为:对图像数据进行量子化编码;设计量子神经网络基本框架;利用量子编码后的图像数据采用量子进化算法搜索量子神经网络基本框架下的最优结构参数,在量子进化算法中,量子神经网络被编码为量子染色体,利用量子观测、量子旋转门更新、全干扰交叉操作寻找最优结构参数;基于最优结构参数构建最优量子神经网络。本发明搜索得到的量子神经网络具有更高的模型精度和更低的复杂度,并能将其部署在量子模拟器或者真实的量子系统上,充分利用量子计算的并行优势,提高模型的推理速度,可用于图像分类。

Description

基于量子模拟器的进化量子神经网络架构搜索方法
技术领域
本发明属于量子计算技术领域,特别涉及一种进化量子神经网络架构搜索方法,可用于图像分类。
背景技术
量子模拟器是经典计算机上实现对量子计算机的模拟。在量子模拟器中,量子比特、量子线路以及量子环境都将模拟真实的量子计算机。为了使研究者更便捷地研究和设计量子算法,许多公司和机构设计并开发了大量的量子模拟器,由Google开发的Cirq便是其中之一。Cirq为用户提供了大量的量子逻辑门接口以及操作量子比特的方法,可以使得用户对量子线路精准地控制,进而构建量子神经网络。TensorFlow Quantum(TFQ)是谷歌研究人员开发的开源软件框架用于Python语言下量子机器学习算法的设计。TFQ专为解决NISQ时代的量子机器学习问题而设计。它将诸如构建量子线路之类的量子计算原语带入了TensorFlow生态系统。此外,它还提供了将Cirq中设计的量子算法和逻辑与TensorFlow框架进行结合的工具。
量子神经网络QNN作为量子计算和神经网络的结合是人工神经网络理论发展的前沿技术,量子的高效并行计算和神经网络结构的逼近能力可以形成一种更高效、更通用的信息处理方法,量子神经网络为解决了模式识别和图像分类问题提供了一种新的高效的计算范式。现有的量子神经网络大多都是在量子模拟器中以量子线路的方式构建而成的。量子神经网络的性能的优劣取决于量子神经网络的结构,优秀的量子神经网络架构所带来的特征提取能力是提高模型性能的关键因素,因此设计什么样的量子神经网络结构,以及怎样设计量子神经网络结构是神经网络设计的重点和难点。
现有的神经网络结构的设计主要分为人工设计的方法和传统的神经网络架构搜索的方法。人工设计的神经网络架构往往依赖大量的人工经验作为指导,例如LeNet、AlexNet、ResNet、DenseNet等。随着深度学习的不断发展,深度神经网络的网络规模不断增大,在深度甚至宽度上的不断增多以及网络模型内部特征提取和推理过程的不可解释性,都使得人为设计优秀的神经网络结构变得困难且具有较大的局限性。对于量子神经网络的人工设计的研究相对滞后,2018年,Google的Farhi等人提出了一种通用量子神经网络框架,但针对这样的量子神经网络框架,并没有给出任意其他的量子神经网络具体结构的设计思想和方法。对于量子神经网络的电路设计没有明确的指导经验,人工设计量子神经网络的方法更加束手无策,现有的基于人工设计的量子神经网络图像分类精度低、模型复杂度高难以在量子模拟器或真实量子计算机上部署。
神经网络架构搜索NAS旨在一定的搜索空间中,使用有效的搜索策略来搜索网络结构,并以适当的评估策略来评估当前搜索到的神经网络的性能。传统的神经网络架构搜索方法根据不同的搜索策略大致可分为基于强化学习、基于进化、基于梯度三种搜索策略。基于强化学习和基于进化的方法可以搜索更有效、不同于人工设计的网络架构,但同时具有更高的时间成本。基于梯度的方法使用梯度下降优化策略来减少搜索的时间开销,但更容易陷入局部最优。对于量子神经网络神经架构搜索,传统神经网络架构搜索方法无法完全利用量子的并行特性,不能完全在量子模拟器或量子电路中运行,因而在无法完全移植到量子计算机中,其次基于进化的神经网络架构搜索方法的种群多样性和收敛性在种群迭代的后期得不到保证,局部搜索能力不足。另外由于量子神经网络还处于探索阶段,并未具有统一公认的结构,因此还并未有针对量子神经网络的架构搜索方法以及相关理论。
发明内容
本发明的目的在于针对上述现有技术的不足,提出一种基于量子模拟器的进化量子神经网络架构搜索方法,以提高搜索能力、降低量子神经网络的线路复杂度、提高量子神经网络的图像分类精度。
本发明的技术方案是这样实现的:
一.技术原理
本发明所提出的量子神经网络架构搜索方法的理论基础为进化算法和量子进化算法,以下对其进行简要介绍。
进化算法EA是研究者根据自然界中生物进化过程和机理所提出的解决优化问题的一类智能计算方法。该算法是以孟德尔遗传变异理论和达尔文自然选择理论为基础,以种群、个体进化更新的生物模型来进行启发式搜索最优解的一类算法。这类算法通常采用某种编码来表达复杂的结构,并将每个单独的编码序列称为一个个体,由多个个体所形成的编码序列集合称为种群,对种群进行交叉、变异、选择等生物操作进行不断的迭代更新最优个体。
量子进化算法QEA,将量子理论与进化算法的特性相结合,充分利用量子计算中量子态的叠加、纠缠的特性为数据表达和计算方法提供了新的范式。量子进化算法由于量子比特染色体可以代表叠加态,量子进化算法具有更好的种群多样性和良好的收敛性,理论上能够部署在日益复杂的量子计算设备中,充分利用量子系统的并行计算能力,从而使量子神经结构搜索算法能够完全在量子设备的量子电路中运行。
二.基于上述原理,本发明的技术方案包括如下:
(1)采用Qubit-Lattice的编码方式对图像数据进行量子化编码:
(1a)对图像进行灰度化处理,生成RGB三通道彩色图像所对应的单通道灰度图像,表示为Im*n={p11,p12…p1n,p21…pij…pmn},其中m和n是图像中像素的行数和列数,pij是第i行和第j列位置的像素值;
(1b)将灰度图像的每一个像素用一个量子比特表示,其包括用量子态的基态所表示的灰度图像像素位置,及用量子态的概率振幅表示的图像像素值,得到量子编码后的量子图像数据|ψ>:
|ψ>=|ψ11>+|ψ12>+…+|ψ1n>+|ψ21>+|ψij>+…+|ψmn>
其中,|ψij>=αij|0>+βij|1>表示量子图像第i行和第j列的像素位置,αij和βij分别表示量子比特在不同基态|0>和|1>上的概率振幅,两者共同表示该位置的像素值;
(2)设计量子神经网络基本框架:
(2a)设辅助量子比特的初始状态为1,将其与上述编码后的k位量子图像数据|ψ>进行拼接,得到k+1位的量子输入状态|ψ,1>,其中k的大小由原始图像分辨率所决定;
(2b)设计量子逻辑门数量,即对k+1位的量子输入状态中的k位数据量子比特的每一位设计m个量子逻辑门,并将其依次作用于k位数据量子比特和辅助量子比特上,得到m*k个待设计的量子逻辑门;
(2c)设计量子逻辑门种类,即设待选的量子逻辑门类型数为t,得到tm*k种量子神经网络的结构;
(3)搜索上述量子神经网络基本框架下的最优结构:
(3a)设计量子神经网络结构的搜索空间:
设计量子输入状态共有k位量子比特,对每一位量子比特执行2次量子逻辑门变换操作,设计所采用的量子逻辑门类型为XX门、YY门、ZZ门以及用于恒等变换的量子逻辑门I门,得到由量子神经网络所有结构所组成大小为42k的搜索空间;
(3b)采用量子进化算法QEA作为搜索策略对搜索空间进行搜索得到最优结构参数p″best
Figure BDA0003584469760000031
p″best是一个二进制编码的染色体,其中,
Figure BDA0003584469760000032
为第j个量子逻辑门的类型对应的二进制串染色体基因,
Figure BDA0003584469760000041
n为量子逻辑门数量;
(4)基于最优结构参数p″best构建最优量子神经网络QNN:
(4a)对p″best进行解码得到二进制串染色体n个基因对应的n个量子逻辑门的组合,其中第j个量子逻辑门的确定规则如下:
Figure BDA0003584469760000042
解码得到n个量子逻辑门共同构成一个最优量子神经网络结构;
(4b)将n个量子逻辑门构建在对应的输入数据量子比特和辅助量子比特所在线路上,即在量子输入状态每一个量子比特的线路上构建2个量子逻辑门,得到最优量子神经网络。
本发明与现有技术相比,具有以下优点:
1.本发明通过量子进化算法自动搜索设计量子神经网络的结构,搜索得到的量子神经网络比现有的人工设计的量子神经网络性能更好、图像分类准确率更高。
2.本发明将量子进化策略引入量子神经网络架构搜索方法中,改善传统进化算法种群多样性和表达能力不足的问题,提高了搜索性能。
3.本发明通过设计量子逻辑门种类,将代表恒等映射的量子逻辑门I门引入搜索空间,减少了不必要的量子逻辑门和量子比特数量,降低了量子神经网络的线路复杂度。
4.本发明由于采用量子进化算法作为搜索策略,根据量子进化算法采用量子系统的观测与量子旋转操作,因而理论上可将量子进化算法部署在日益复杂的量子计算设备中,使量子进化算法和基于量子线路的量子神经网络同时运行在量子计算环境中,充分利用量子计算的并行优势,使量子进化算法具有更低的时间复杂度。
附图说明
图1为本发明的实现流程图;
图2为本发明设计量子神经网络基本框架使用的量子神经网络线路参考图;
图3为本发明中设计量子逻辑门使用的量子状态bloch球面图;
图4为本发明设计搜索空间中的量子逻辑门与量子染色体映射图;
图5为本发明搜索到的用于MNIST图像分类任务的最优量子神经网络结构图;
图6为移除图5中代表恒等映射的I门后的量子神经网络结构;
图7为本发明和现有基于进化的神经网络架构搜索方法进行MNIST图像分类的准确率对比图。
具体实施方式
以下结合附图对本发明的实施例和效果作进一步详细描述。
参照图1,本实施例实现步骤如下:
步骤1,对图像数据进行量子化编码。
量子计算机无法直接处理传统图像,需要将其量化和编码。本实例采用Qubit-Lattice的编码方式对图像数据进行量子化编码,具体操作如下:
(1.1)对图像进行灰度化处理,生成RGB三通道彩色图像所对应的单通道灰度图像,表示为Im*n={p11,p12…p1n,p21…pij…pmn},其中pij是第i行和第j列位置的像素值,i∈[1,m],j∈[1,n],m和n是图像中像素的行数和列数;
(1.2)将灰度图像的每一个像素用一个量子比特表示,其包括用量子态的基态所表示的灰度图像像素位置,及用量子态的概率振幅表示的图像像素值,得到量子编码后的量子图像数据|ψ>:
|ψ>=|ψ11>+|ψ12>+…+|ψ1n>+|ψ21>+|ψij>+…+|ψmn>
其中,|ψij>=αij|0>+βij|1>表示量子图像第i行和第j列的像素位置,αij和βij分别表示量子比特在不同基态|0>和|1>上的概率振幅,两者共同表示该位置的像素值。
步骤2,设计量子神经网络基本框架。
本实例设计的量子神经网络基本框架基于Google在2018年提出的量子神经网络模型,如图2所示,量子神经网络的量子电路由一个辅助量子比特和16个数据量子比特组成,其仅由XX、ZZ量子逻辑门构成,网络中的每个数据量子比特经过两个量子逻辑门,同时将其作用于辅助量子比特。该模型给出了量子神经网络中量子线路的初步设计思想,但对于量子逻辑门的数量和种类的选择排列方式并未给出严格的指导意见,在不同任务中需要人为设计其量子线路结构,本实例针对图像分类任务设计量子神经网络基本框架,具体操作如下:
(2.1)设辅助量子比特的初始状态为1,将其与上述编码后的k位量子图像数据|ψ>进行拼接,得到k+1位的量子输入状态|ψ,1>,其中k的大小由原始图像分辨率所决定;
(2.2)设计量子逻辑门数量,即对k+1位的量子输入状态中的k位数据量子比特的每一位设计m个量子逻辑门,并将其依次作用于k位数据量子比特和辅助量子比特上,得到m*k个待设计的量子逻辑门;
(2.3)设计量子逻辑门种类,即设待选的量子逻辑门类型数为t,得到tm*k种量子神经网络的结构。
步骤3,设计量子神经网络结构的搜索空间。
参照图3,在量子系统中,量子比特可以映射到一个bloch球面上,根据映射到bloch球面上的不同状态来实现量子比特的旋转操作。Bloch球面上的点与x轴或y轴的夹角θ和与z轴的夹角
Figure BDA0003584469760000067
共同决定量子比特的状态。对于改变量子比特状态的操作,在bloch球面上实质是一种量子旋转变换操作,这种量子旋转变换分为三种旋转操作,基于X轴、基于Y轴、基于Z轴旋转。本实例通过分析构建量子神经网络所需的量子逻辑门,基于上述原理,设计量子神经网络架构搜索的搜索空间,具体实现如下:
(3.1)设计量子输入状态共有k位量子比特,对每一位量子比特执行2次量子逻辑门变换操作,公式如下:
Figure BDA0003584469760000061
其中|ψ′>为量子比特执行2次量子逻辑门变换操作后得到的量子比特状态,|ψ〉为单量子比特,U11)和U22)分别表示两个量子逻辑门变换操作,θ1和θ2分别为对应量子逻辑门的旋转角度参数,其决定量子逻辑门的变换方向和在该方向上的变换程度;
(3.2)设计所采用的量子逻辑门类型为XX门、YY门、ZZ门以及用于恒等变换的量子逻辑门I门,即根据量子旋转变换分为基于X轴、基于Y轴、基于Z轴这三种旋转操作,将其对应的量子逻辑门为Xθ、Yθ、Zθ分别与其自身进行张量积运算,得到同时作用于两个量子比特上的双比特量子逻辑门为XX、YY、ZZ:
Figure BDA0003584469760000062
Figure BDA0003584469760000063
Figure BDA0003584469760000064
其中
Figure BDA0003584469760000065
ω=eiπθ
Figure BDA0003584469760000066
为张量积运算,θ为控制量子逻辑门XX、YY以及ZZ的旋转角度;
(3.3)受到ResNet中提出的跳跃连接的启发,将用于恒等变换的量子逻辑门I门表示为:
Figure BDA0003584469760000071
该I门没有参数,代表一种恒等映射变换,这将有助于减少不必要的量子逻辑门数量,甚至降低所需的量子比特数目;
(3.4)将在bloch球面上改变量子状态的上述量子逻辑门加入到量子神经网络架构搜索空间中,得到由量子神经网络所有结构所组成大小为42k的搜索空间。
步骤4,设计搜索策略对搜索空间进行搜索。
现有的神经网络架构搜索策略大致可分为基于强化学习、基于进化、基于梯度三种,本实例将量子计算理论引入进化算法中,以提高种群多样性和搜索能力,采用量子进化算法QEA作为搜索策略对搜索空间进行搜索得到最优结构参数,实现如下:
(4.1)根据量子逻辑门的类型,通过两个量子比特对搜索空间中的量子逻辑门进行编码:
参照图4,量子逻辑门XX门,YY门,ZZ门,I门由两个量子比特所编码,量子染色体由编码量子逻辑门的2*m*k个量子比特所组成,编码规则如下:
Figure BDA0003584469760000072
(4.2)确定量子进化算法QEA的超参数:设种群大小为N,精英保留策略比例为ER,全干扰交叉概率为PC,最大迭代次数为T;
(4.3)初始化量子种群Qt={q1,q2,…,qi,…,qN},其中qi为第i个量子染色体个体,
Figure BDA0003584469760000073
Figure BDA0003584469760000074
为第i个量子染色体上第j个量子逻辑门的类型对应的量子基因,
Figure BDA0003584469760000075
Figure BDA0003584469760000076
ψ1和ψ2表示两个量子比特,ψ1=α1|0>+β1|1>,ψ2=α2|0>+β2|1>,α12分别表示在ψ1,ψ2的基态|0>上的概率振幅,β12分别表示在ψ1,ψ2的基态|1>上的概率振幅,n为该量子染色体编码的量子逻辑门总数,当前迭代次数为t=0;
(4.4)对qi进行观测,得到确定状态的二进制串染色体pi
Figure BDA0003584469760000077
其中
Figure BDA0003584469760000081
为第i个二进制串染色体上第j个量子逻辑门的类型对应的二进制基因,
Figure BDA0003584469760000082
(4.5)对Qt中所有量子染色体q1,q2,…,qi,…,qN执行(4.4)的观测操作,得到确定状态的二进制串染色体种群Pt={p1,p2,…,pi,…,pN};
(4.6)对Pt进行个体适应度评估:
(4.6.1)对Pt中的所有二进制染色体p1,p2,…,pi,…,pN进行解码,得到对应的量子神经网络结构A={A1,A2,…,Ai,…,AN},其中第i个染色体pi解码得到的第i个量子神经网络结构Ai
表示如下:
Figure BDA0003584469760000083
Ai由n个量子逻辑门组成。
(4.6.2)将Ai的n个量子逻辑门构建在对应的输入数据量子比特和辅助量子比特所在线路上,即在量子输入状态每一个量子比特的线路上构建2个量子逻辑门,得到量子神经网络NWi
(4.6.3)对A中所有量子神经网络结构A1,A2,…,Ai,…,AN执行(4.6.2)得到量子神经网络NW={NW1,NW2,…,NWi,…,NWN},其中NWi为基于第i个量子神经网络结构Ai构建的量子神经网络;
(4.6.4)对图像数据进行量子化编码得到量子图像数据|ψ>;
(4.6.5)对N个量子神经网络NW中的所有量子逻辑门旋转参数θ进行随机初始化,并基于随机梯度下降优化器使用量子图像数据|ψ>对N个量子神经网络分别进行L=10次迭代训练,得到训练好的量子神经网络NW;
(4.6.6)将量子图像数据|ψ〉和辅助量子比特|1>拼接,得到的量子输入状态|ψ,1>,将其输入到训练好的量子神经网络NW,并使用Pauli-Z门读出辅助量子比特的期望,得到量子神经网络的分类结果;
(4.6.7)将量子神经网络的图像分类结果与已知的图像分类标签进行对比,得到分类准确率:ACC={ACC1,ACC2,…,ACCi,…,ACCN},其中ACCi表示第i个量子神经网络NWi的准确率;
(4.6.8)将模型准确率ACC作为个体适应度F={F1,F2,Fi,…,FN},即F=ACC,
其中,Fi表示Pt中第i个染色体pi的适应度值,并令Pt中适应度最高的个体表示为pbest,其适应度值表示为Fbest
(4.7)更新量子种群:
(4.7.1)定义量子旋转门:
Figure BDA0003584469760000091
其中,旋转变换的角度θi由量子染色体qi、与qi对应的二进制串染色体pi、最高适应度的染色体pbest、染色体pi的适应度值Fi以及最高适应度值Fbest共同确定其方向和大小,其确定规则如表1所示;
表1量子旋转门角度变化表
Figure BDA0003584469760000092
表1中
Figure BDA0003584469760000093
为二进制串染色体pi的第j个基因位,
Figure BDA0003584469760000094
为最高适应度的染色体pbest的第j个基因位,
Figure BDA0003584469760000095
表示量子染色体qi的第j个量子比特在基态|0>上的概率振幅,
Figure BDA0003584469760000096
表示量子染色体qi的第j个量子比特在基态|1>上的概率振幅,
Figure BDA0003584469760000097
表示旋转角度的方向;
(4.7.2)使用量子旋转门变换作为变异算子,将其作用于Qt={q1,q2,…,qi,…,qN}的每个量子染色体上,得到中间状态量子种群:Q′t={q1′,q2′,…,qi′,…,qN′};
(4.7.3)依据全干扰交叉概率PC对Q′t中的每个量子染色体进行全干扰交叉,即将Q′t中所有量子染色体展开,并按对角线重新排列组合其基因位,如表2所示:
表2中,设当前种群大小为5,量子染色体长度为8,每个大写字母代表交叉后的一条新染色体,如E(1)-E(2)-E(3)-E(4)-E(5)-E(6)-E(7)-E(8),这种量子全干扰交叉方法可以尽可能充分利用群体中的染色体信息,改进普通交叉算子的局部性和片面性,可以有效跳出局部最优,避免早熟现象。得到最终状态量子种群:Q″t={q″1,q″2,…,q″i,…,q″N}:
其中q″i为第i个量子染色体个体,
Figure BDA0003584469760000101
Figure BDA0003584469760000102
为第i个量子染色体上第j个量子逻辑门的类型对应的量子基因,
Figure BDA0003584469760000103
ψ1″和ψ2″表示两个量子比特,ψ1″=α1″|0>+β1″|1>,ψ2″=α2″|0>+β2″|1>,α1″,α2″分别表示在ψ1″,ψ2″的基态|0>上的概率振幅,β1″,β2″分别表示在ψ″12″的基态|1〉上的概率振幅,n为该量子染色体编码的量子逻辑门总数;
表2全干扰交叉
Figure BDA0003584469760000104
(4.7.4)基于步骤(4.4)的观测规则,观测最终状态量子种群Q″t,得到处于确定状态的二进制串染色体种群P″t={p″1,p″2,…,p″i,…,p″N},其中
Figure BDA0003584469760000105
表示种群P″t中的第i个二进制串染色体,
Figure BDA0003584469760000106
为最终状态量子种群Q″t中第i个二进制串染色体上第j个量子逻辑门的类型对应的二进制基因,
Figure BDA0003584469760000107
(4.7.5)对Pt″基于步骤(4.6)进行个体适应度评估,得到对应的适应度集合:
F″={F″1,F″2,…,F″i,…,F″N},
其中,F″i表示Pt″中第i个染色体P″i的适应度值,并令p″best=Pt″中适应度最高的个体;
(4.7.6)判断t=T是否成立:
若是,则将p″best作为最优结构参数输出:
Figure BDA0003584469760000111
其中,p″best为处于确定状态的二进制串染色体种群P″t中适应度最高的个体,
Figure BDA0003584469760000112
为p″best中第j个量子逻辑门的类型对应的二进制基因,
Figure BDA0003584469760000113
n为量子逻辑门数量,结束搜索;
否则,根据Pt″的适应度排序结果F″,执行精英保留策略,即选择Pt″中适应度最高的N*ER个精英染色体个体作为Pt,选择Qt″中对应的N*ER个量子染色体作为Qt,选择F″中对应的N*ER个适应度作为F,令t=t+1,返回步骤(4.4)。
步骤5,基于最优结构参数p″best构建最优量子神经网络QNN。
(5.1)对p″best进行解码得到二进制串染色体n个基因位对应的n个量子逻辑门的组合,其中第i个量子逻辑门的确定规则如下:
Figure BDA0003584469760000114
(5.2)将n个量子逻辑门构建在对应的输入数据量子比特和辅助量子比特所在线路上,即在量子输入状态每一个量子比特的线路上构建2个量子逻辑门,得到最优量子神经网络,具体实现如下:
(5.2.1)在Cirq框架中创建量子虚拟环境,根据经过量子编码后的量子图像数据搭建用于表示量子图像的量子线路,并在每一条量子线路上分配两个量子逻辑门构成量子神经网络;
(5.2.2)在TFQ框架中对量子神经网络的量子线路进行张量化处理,并采用SGD优化器对量子神经网络进行训练,得到训练后的最优量子神经网络。
以下通过实验仿真对本发明的效果进行说明:
1.实验仿真环境:
量子神经网络的量子线路由Cirq框架搭建,量子神经网络的训练以及评估是在量子模拟器TensorFlow-quantum以及Cirq上运行的,该模拟器模拟了量子计算设备的运行环境,比如有噪声的中间尺度量子NISQ设备。量子进化算法由Python语言编写,使用了Numpy等科学计算框架,实验所需的硬件环境如表3所示。
表3硬件环境
名称 型号
处理器 Intel Core i7-7800X@3.50GHz
内存 64GB
显卡 Nvidia GeForce GTX2080
硬盘 2.2TB
2.实验设置:
为了将经典数字图像在量子系统中进行表达,采用qubit-lattice的编码方式,将传统图像归一化后采用16位量子比特来表示图像数据,一位辅助量子比特表示输出数据,观测输出量子比特的状态来得到当前图像分类的结果。
量子神经网络的线路搭建采用Cirq框架,训练和优化采用TFQ框架。具体地,首先在Cirq框架中创建量子虚拟环境,搭建用于表示量子图像的量子线路以及量子神经网络的量子线路,并在TFQ框架中对量子线路进行张量化处理,然后使用SGD优化器进行训练。对于量子神经网络架构搜索中的量子进化算法而言,量子种群数目设置为10,进化轮数设置为50,量子旋转门参数的更新如表1所示,全干扰交叉的触发概率为0.3。
3.实验内容:
仿真实验1,在上述仿真环境和实验设备条件下,使用MNIST数据集中的“3”和“6”类作为最终数据集,针对该数据集的分类任务,用本发明对其搜索得到量子神经网络如图5所示,由于I门代表一种恒等映射,因此对图5量子神经网络需要进行精简,移除图5中I门,得到如图6所示的最终量子神经网络。
分别用图6所示的量子神经网络与如图2所示的Farhi等人提出的人工设计的量子神经网络进行图像分类,对其分类精度和复杂度进行比较,结果如表4所示;
表4模型分类精度与复杂度对比
网络模型 量子比特数 量子逻辑门数 参数量 分类精度
现有人工设计的QNN 17 32 32 88.51%
本发明搜索得到的QNN 16 25 25 93.82%
通过对比图5和图2可以看到,相比人工设计的量子神经网络,搜索得到的量子神经网络的量子逻辑门更具无序性,并且图5中(1,0)这一位量子比特的线路上只存在恒等变换I门,因此该量子比特未参与量子神经网络的训练,总量子比特数由17减少为16。通过对比图6和图2,结合表4可以看到,本发明提出的方法自动搜索量子神经网络相比人为设计的量子神经网络不仅在分类精度上有所提升,而且量子逻辑门数量以及参数量从32减小到了25,减小比例为21.88%,因此本发明搜索得到的量子神经网络具有更低的复杂度,降低了模型部署与量子系统制备的实际难度。
仿真实验2,在上述仿真环境和实验设备条件下,使用MNIST数据集中的“3”和“6”类作为最终数据集,分别用本发明中QEA搜索得到的量子神经网络和现有基于进化的神经网络架构搜索方法EA搜索得到的量子神经网络进行图像分类,其最佳分类精度的搜索过程如图7所示,QEA和EA的最佳分类精度分别为93.82%、91.69%。
将上述两种搜索策略分别独立运行30次进行观察,对其平均分类精度、标准差进行比较,结果如表5所示。
表5搜索策略对比
搜索策略 平均分类精度 标准差
QEA 93.29% 0.40
EA 90.67% 0.68
对比表5,并结合图7,可以看到本发明使用的量子染色体由于其在表征能力上的优势,因而QEA比EA更容易在巨大的离散的搜索空间中找到更优秀的量子神经网络,其图像分类精度更高。更重要的是,理论上QEA可以经过改良部署至量子线路当中,使得QEA和QNN可以同时运行在量子计算机中,充分利用量子计算的并行优势,使量子进化算法具有更低的时间复杂度。表明本发明使用QEA作为量子神经网络架构搜索的搜索策略比现有技术EA更可行且更有效。

Claims (6)

1.一种基于量子模拟器的进化量子神经网络架构搜索方法,其特征在于,包括如下:
(1)采用Qubit-Lattice的编码方式对图像数据进行量子化编码:
(1a)对图像进行灰度化处理,生成RGB三通道彩色图像所对应的单通道灰度图像,表示为Im*n={p11,p12...p1n,p21...pij...pmn},其中m和n是图像中像素的行数和列数,pij是第i行和第j列位置的像素值;
(1b)将灰度图像的每一个像素用一个量子比特表示,其包括用量子态的基态所表示的灰度图像像素位置,及用量子态的概率振幅表示的图像像素值,得到量子编码后的量子图像数据|ψ>:
|ψ>=|ψ11>+|ψ12>+…+|ψ1n>+|ψ21>+|ψij>+…+|ψmn>
其中,|ψij>=αij|0>+βij|1>表示量子图像第i行和第j列的像素位置,αij和βij分别表示量子比特在不同基态|0>和|1>上的概率振幅,两者共同表示该位置的像素值;
(2)设计量子神经网络基本框架:
(2a)设辅助量子比特的初始状态为1,将其与上述编码后的k位量子图像数据|ψ>进行拼接,得到k+1位的量子输入状态|ψ,1>,其中k的大小由原始图像分辨率所决定;
(2b)设计量子逻辑门数量,即对k+1位的量子输入状态中的k位数据量子比特的每一位设计m个量子逻辑门,并将其依次作用于k位数据量子比特和辅助量子比特上,得到m*k个待设计的量子逻辑门;
(2c)设计量子逻辑门种类,即设待选的量子逻辑门类型数为t,得到tm*k种量子神经网络的结构;
(3)搜索上述量子神经网络基本框架下的最优结构:
(3a)设计量子神经网络结构的搜索空间:
设计量子输入状态共有k位量子比特,对每一位量子比特执行2次量子逻辑门变换操作,设计所采用的量子逻辑门类型为XX门、YY门、ZZ门以及用于恒等变换的量子逻辑门I门,得到由量子神经网络所有结构所组成大小为42k的搜索空间;
(3b)采用量子进化算法QEA作为搜索策略对搜索空间进行搜索得到最优结构参数p″best
Figure FDA0003584469750000021
p″best是一个二进制编码的染色体,其中,
Figure FDA0003584469750000022
为第j个量子逻辑门的类型对应的二进制串染色体基因,
Figure FDA0003584469750000023
n为量子逻辑门数量;
(4)基于最优结构参数p″best构建最优量子神经网络QNN:
(4a)对p″best进行解码得到二进制串染色体n个基因对应的n个量子逻辑门的组合,其中第j个量子逻辑门的确定规则如下:
Figure FDA0003584469750000024
解码得到n个量子逻辑门共同构成一个最优量子神经网络结构;
(4b)将n个量子逻辑门构建在对应的输入数据量子比特和辅助量子比特所在线路上,即在量子输入状态每一个量子比特的线路上构建2个量子逻辑门,得到最优量子神经网络。
2.根据权利要求1所述的方法,其特征在于,所述(3a)中对每一位量子比特执行2次量子逻辑门变换操作,公式如下:
Figure FDA0003584469750000025
其中|ψ′>为量子比特执行2次量子逻辑门变换操作后得到的量子比特状态,|ψ>为单量子比特,U11)和U22)分别表示两个量子逻辑门变换操作,θ1和θ2分别为对应量子逻辑门的旋转角度参数,其决定量子逻辑门的变换方向和在该方向上的变换程度。
3.根据权利要求1所述的方法,其特征在于,所述(3a)中设计量子逻辑门类型XX门、YY门、ZZ门以及用于恒等变换的量子逻辑门I门,实现如下:
(3a1)根据量子旋转变换分为基于X轴、基于Y轴、基于Z轴这三种旋转操作,将其对应的量子逻辑门为Xθ、Yθ、Zθ分别和自身进行张量积运算,得到同时作用于两个量子比特上的双比特量子逻辑门为XX、YY、ZZ:
Figure FDA0003584469750000031
Figure FDA0003584469750000032
Figure FDA0003584469750000033
其中
Figure FDA0003584469750000034
ω=eiπθ
Figure FDA0003584469750000035
为张量积运算,θ为控制量子逻辑门XX、YY以及ZZ的旋转角度;
(3a2)将用于恒等变换的量子逻辑门I门表示为:
Figure FDA0003584469750000036
该I门没有参数,代表一种恒等映射变换。
4.根据权利要求1所述的方法,其特征在于,所述(3b)中采用量子进化算法QEA对搜索空间进行搜索,实现如下:
(3b1)根据量子逻辑门的类型,使用两个量子比特对搜索空间中的量子逻辑门按如下规则进行编码:
Figure FDA0003584469750000037
(3b2)确定量子进化算法QEA的超参数:设种群大小为N,精英保留策略比例为ER,全干扰交叉概率为PC,最大迭代次数为T;
(3b3)初始化量子种群Qt={q1,q2,...,qi,...,qN},其中qi为第i个量子染色体个体,
Figure FDA0003584469750000038
Figure FDA0003584469750000039
为第i个量子染色体上第j个量子逻辑门的类型对应的量子基因位,
Figure FDA00035844697500000310
ψ1和ψ2表示两个量子比特,ψ1=α1|0>+β1|1>,ψ2=α2|0>+β2|1>,α1,α2分别表示在ψ1,ψ2的基态|0>上的概率振幅,β1,β2分别表示在ψ1,ψ2的基态|1>上的概率振幅,n为该量子染色体编码的量子逻辑门总数,当前迭代次数为t=0;
(3b4)对qi进行观测,得到确定状态的二进制串染色体pi
Figure FDA0003584469750000041
其中
Figure FDA0003584469750000042
为第i个二进制串染色体上第j个量子逻辑门的类型对应的二进制基因位,
Figure FDA0003584469750000043
(3b5)对Qt中所有量子染色体q1,q2,...,qi,...,qN执行(3b4)的观测操作,得到确定状态的二进制串染色体种群Pt={p1,p2,...,pi,...,pN};
(3b6)对Pt进行个体适应度评估,得到当前种群对应的适应度集合:
F={F1,F2,...,Fi,...,FN},
其中,Fi表示Pt中第i个染色体pi的适应度值,并令Pt中适应度最高的个体表示为pbest,其适应度值表示为Fbest
(3b7)定义量子旋转门:
Figure FDA0003584469750000044
其中,旋转变换的角度θ由量子染色体qi、与qi对应的二进制串染色体pi、最高适应度的染色体pbest、染色体pi的适应度值Fi以及最高适应度值Fbest共同决定其方向和大小;
(3b8)使用量子旋转门变换作为变异算子,将其作用于Qt={q1,q2,...,qi,...,qN}的每个量子染色体上,得到中间状态量子种群:Q′t={q1′,q2′,...,qi′,...,qN′};
(3b9)依据全干扰交叉概率PC对Q′t中的每个量子染色体进行全干扰交叉,即将Q′t中所有量子染色体展开,并按对角线重新排列组合其基因位,得到最终状态量子种群Q″t={q″1,q″2,...,q″i,...,q″N};
(3b10)基于(3b4)的观测规则,观测最终状态量子种群Q″t,得到处于确定状态的二进制串染色体种群P″t={p″1,p″2,...,p″i,...,p″N};
(3b11)对Pt″进行个体适应度评估,得到对应的适应度集合:
F″={F″1,F″2,...,F″i,...,F″N},
其中,F″i表示Pt″中第i个染色体p″i的适应度值,并令p″best=Pt″中适应度最高的个体;
(3b12)判断t=T是否成立:
若是,则将p″best作为最优结构参数输出,结束搜索;
否则,根据Pt″的适应度排序结果F″,选择Pt″中适应度最高的N*ER个精英染色体个体作为Pt,选择Qt″中对应的N*ER个量子染色体作为Qt,选择F″中对应的N*ER个适应度作为F,令t=t+1,返回(3b4)。
5.根据权利要求1所述的方法,其特征在于,所述(4b)中将n个量子逻辑门构建在对应的输入数据量子比特和辅助量子比特所在线路上,得到最优量子神经网络,实现如下:
(4b1)在Cirq框架中创建量子虚拟环境,根据经过量子编码后的量子图像数据搭建用于表示量子图像的量子线路,并在每一条量子线路上分配两个量子逻辑门构成量子神经网络;
(4b2)在TFQ框架中对量子神经网络的量子线路进行张量化处理,并采用SGD优化器对量子神经网络进行训练,得到最优量子神经网络。
6.根据权利要求4所述方法,其特征在于,所述(3b6)对当前种群Pt进行个体适应度评估,得到当前种群对应的适应度集合F,实现如下:
(3b6a)对Pt中的所有二进制染色体p1,p2,...,pi,...,pN根据如下规则进行解码,得到对应的量子神经网络结构A={A1,A2,...,Ai,...,AN},其中第i个染色体pi解码得到的第i个量子神经网络结构Ai表示如下:
Figure FDA0003584469750000051
(3b6b)基于量子神经网络结构A构建量子神经网络的量子逻辑门线路,得到量子神经网络NW={NW1,NW2,...,NWi,...,NWN},其中NWi为基于第i个量子神经网络结构Ai构建的量子神经网络;
(3b6c)对图像数据进行量子化编码得到量子图像数据|ψ>;
(3b6d)对N个量子神经网络NW中的所有量子逻辑门旋转参数θ进行随机初始化,并基于随机梯度下降优化器使用量子图像数据|ψ>对N个量子神经网络分别进行L次迭代训练;
(3b6e)将量子图像数据|ψ>和辅助量子比特|1>拼接,得到的量子输入状态|ψ,1>,将其输入训练好的量子神经网络NW,最终使用Pauli-Z门读出辅助量子比特的期望,得到量子神经网络的分类结果,再将其与已知的图像分类标签进行对比,得到分类准确率ACC={ACC1,ACC2,...,ACCi,...,ACCN},其中ACCi表示第i个量子神经网络NWi的准确率;
(3b6f)将模型准确率ACC作为个体适应度F={F1,F2,Fi,...,FN},即F=ACC。
CN202210362448.2A 2022-04-07 2022-04-07 基于量子模拟器的进化量子神经网络架构搜索方法 Pending CN114676837A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210362448.2A CN114676837A (zh) 2022-04-07 2022-04-07 基于量子模拟器的进化量子神经网络架构搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210362448.2A CN114676837A (zh) 2022-04-07 2022-04-07 基于量子模拟器的进化量子神经网络架构搜索方法

Publications (1)

Publication Number Publication Date
CN114676837A true CN114676837A (zh) 2022-06-28

Family

ID=82078526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210362448.2A Pending CN114676837A (zh) 2022-04-07 2022-04-07 基于量子模拟器的进化量子神经网络架构搜索方法

Country Status (1)

Country Link
CN (1) CN114676837A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115375942A (zh) * 2022-08-25 2022-11-22 中国银行股份有限公司 一种图像分类模型训练方法和系统、电子设备、存储介质
CN116384498A (zh) * 2023-06-07 2023-07-04 上海微观纪元数字科技有限公司 变分量子算法线路的并行训练方法及存储介质
WO2023202137A1 (zh) * 2022-04-22 2023-10-26 苏州浪潮智能科技有限公司 一种图像识别分类的方法、系统、设备以及介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023202137A1 (zh) * 2022-04-22 2023-10-26 苏州浪潮智能科技有限公司 一种图像识别分类的方法、系统、设备以及介质
CN115375942A (zh) * 2022-08-25 2022-11-22 中国银行股份有限公司 一种图像分类模型训练方法和系统、电子设备、存储介质
CN116384498A (zh) * 2023-06-07 2023-07-04 上海微观纪元数字科技有限公司 变分量子算法线路的并行训练方法及存储介质
CN116384498B (zh) * 2023-06-07 2023-08-18 上海微观纪元数字科技有限公司 变分量子算法线路的并行训练方法及存储介质

Similar Documents

Publication Publication Date Title
CN113159239B (zh) 一种量子图卷积神经网络处理图数据的方法
CN114676837A (zh) 基于量子模拟器的进化量子神经网络架构搜索方法
WO2022179533A1 (zh) 一种量子卷积操作器
Tacchino et al. Variational learning for quantum artificial neural networks
Liao et al. Generative AI design for building structures
Qin et al. Harmony search algorithm and related variants: A systematic review
CN114821217B (zh) 一种基于量子经典混合神经网络的图像识别方法及装置
Cintas et al. Automatic feature extraction and classification of Iberian ceramics based on deep convolutional networks
CN110659725A (zh) 神经网络模型的压缩与加速方法、数据处理方法及装置
CN114792378B (zh) 一种量子图像识别方法及装置
Henderson et al. Methods for accelerating geospatial data processing using quantum computers
Cullell-Dalmau et al. Convolutional neural network for skin lesion classification: understanding the fundamentals through hands-on learning
CN114358295B (zh) 基于机器学习框架的二分类方法及相关装置
CN111753995A (zh) 一种基于梯度提升树的局部可解释方法
Li et al. EQNAS: Evolutionary quantum neural architecture search for image classification
Peng et al. An industrial-grade solution for agricultural image classification tasks
KR102363370B1 (ko) UX-bit 및 몬테카를로 트리 탐색을 이용한 자동 디자인 생성 인공신경망 장치 및 방법
CN117253037A (zh) 语义分割模型结构搜索方法、自动语义分割方法及系统
CN114550849A (zh) 基于量子图神经网络解决化学分子性质预测的方法
CN114511092A (zh) 一种基于量子线路的图注意力机制实现方法
CN112216353A (zh) 一种用于预测药物-靶标相互作用关系的方法和设备
CN116976405A (zh) 基于免疫优化算法的变分阴影量子神经网络
Kashyap et al. Quantum convolutional neural network architecture for multi-class classification
CN116611504A (zh) 一种基于进化的神经架构搜索方法
CN114511097A (zh) 基于量子线路的互学习方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination