CN113412492A - 用于量子玻尔兹曼机的监督训练的量子算法 - Google Patents
用于量子玻尔兹曼机的监督训练的量子算法 Download PDFInfo
- Publication number
- CN113412492A CN113412492A CN202080013408.6A CN202080013408A CN113412492A CN 113412492 A CN113412492 A CN 113412492A CN 202080013408 A CN202080013408 A CN 202080013408A CN 113412492 A CN113412492 A CN 113412492A
- Authority
- CN
- China
- Prior art keywords
- quantum
- harmony
- tree
- boltzmann machine
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 39
- 238000004422 calculation algorithm Methods 0.000 title abstract description 26
- 238000000034 method Methods 0.000 claims abstract description 109
- 241000121629 Majorana Species 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims 4
- 239000013598 vector Substances 0.000 description 47
- 230000006870 function Effects 0.000 description 41
- 238000012545 processing Methods 0.000 description 37
- 230000008569 process Effects 0.000 description 34
- 238000005457 optimization Methods 0.000 description 19
- 230000015654 memory Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 15
- 238000005259 measurement Methods 0.000 description 15
- 239000002096 quantum dot Substances 0.000 description 15
- 238000003860 storage Methods 0.000 description 15
- 238000000137 annealing Methods 0.000 description 13
- 238000013528 artificial neural network Methods 0.000 description 13
- 230000000875 corresponding effect Effects 0.000 description 13
- 239000000945 filler Substances 0.000 description 12
- 230000008901 benefit Effects 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 11
- 238000002922 simulated annealing Methods 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 238000013459 approach Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000004088 simulation Methods 0.000 description 7
- 230000001149 cognitive effect Effects 0.000 description 6
- 238000012937 correction Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 238000013507 mapping Methods 0.000 description 6
- 230000001133 acceleration Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000012552 review Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 238000005094 computer simulation Methods 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 229910003460 diamond Inorganic materials 0.000 description 3
- 239000010432 diamond Substances 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000001537 neural effect Effects 0.000 description 3
- 238000003325 tomography Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 241000022852 Letis Species 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000005283 ground state Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000005610 quantum mechanics Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 101100460704 Aspergillus sp. (strain MF297-2) notI gene Proteins 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000002816 gill Anatomy 0.000 description 1
- BTIJJDXEELBZFS-UHFFFAOYSA-K hemin Chemical compound [Cl-].[Fe+3].[N-]1C(C=C2C(=C(C)C(C=C3C(=C(C)C(=C4)[N-]3)C=C)=N2)C=C)=C(C)C(CCC(O)=O)=C1C=C1C(CCC(O)=O)=C(C)C4=N1 BTIJJDXEELBZFS-UHFFFAOYSA-K 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000005040 ion trap Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 238000005272 metallurgy Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000005624 perturbation theories Effects 0.000 description 1
- 230000000135 prohibitive effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N10/00—Quantum computing, i.e. information processing based on quantum-mechanical phenomena
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Devices For Executing Special Programs (AREA)
- Machine Translation (AREA)
Abstract
一种训练量子计算机的方法采用量子算法。该方法包括:将量子玻尔兹曼机的描述加载到量子计算机中,并且根据协议来训练量子玻尔兹曼机,其中分类误差被用作针对协议的度量。
Description
技术领域
本申请一般涉及量子计算。
发明内容
在本公开中,示例实施例用于提供允许人们将语言处理中的问题嵌入到小型量子设备中的语言结构的表示(在本文中被称为“福克(Fock)空间表示”)。还公开了用于理解经典和量子语言问题的形式体系。这两个问题都被称为可以在量子计算机上求解的和谐(harmony)优化问题,这表明这与使用量子玻尔兹曼机对向量进行分类相关。还公开了一种用于学习对语言进行描述的量子和谐算符的新的训练方法。这提供了用于训练不需要近似值的量子玻尔兹曼机的新的示例技术,并且在隐藏单元存在的情况下工作。结果还表明量子语言处理是BQP完全(BQP-complete)的,这意指它与量子计算的电路模型是多项式等价的,这意味着除非BPP=BQP,否则量子语言模型比经典模型更丰富。这也意味着,在某些情形中,量子玻尔兹曼机比经典玻尔兹曼机更具表达力。最后,检查示例实施例的性能。在该检查中,结果表明示例方法能够快速解析甚至非平凡的语法。
在特定实施例中,公开了一种用于训练被称为量子玻尔兹曼机的一类量子神经网络的新方法的实施例。在特定示例中,公开了使用量子状态的集合来对量子玻尔兹曼机进行监督训练的方法,玻尔兹曼机被训练以进行复制。与现有的玻尔兹曼训练方法不同,本文所公开的示例实施例即使在仅知道量子示例(而不是来自状态集合的量子测量值的概率)的情况下也允许监督训练。此外,这种方法不需要使用近似值,诸如戈尔登-汤普森(Golden-Thompson)不等式。
附图说明
图1示出了示例解析树的示意框图。
图2是表面代码补丁的示意框图,其中圆圈标示针对Fock空间表示的占用状态。
图3是示出了通过必须查询和谐函数以找到An:Bn语法的最大和谐树的次数来测量的退火复杂性的图。
图4是示出了最佳和谐解析树的示例的示意框图。
图5示出了示意框图,其图示了在Gosset中使用的所构造的电路哈密顿量。
图6是示出了用于找到玻尔兹曼机的参数梯度的示例方法的流程图,玻尔兹曼机被用来对本文所公开的机器学习算法训练所用的量子数据进行建模。
图7-图8示出了本文所述的用于找到期望值的示例过程。
图9图示了其中可以实现所描述的实施例的各方面的合适的经典计算环境的一般化示例。
图10是用于实现根据所公开技术的系统的可能网络拓扑结构(例如,客户端-服务器网络)的示例。
图11是用于实现根据所公开技术的系统的可能网络拓扑结构(例如,分布式计算环境)的另一个示例。
图12示出了用于实现所公开技术的示例性系统。
图13是示出了所公开技术的另一个示例实施例的流程图。
具体实施方式
一.一般考虑
如在本申请中使用的,除非上下文另有明确规定,否则单数形式“一”、“一个”和“该”包括复数形式。此外,术语“包括”意指“包含”。此外,术语“耦合”不排除耦合项之间存在中间元素。此外,如本文中所使用的,术语“和/或”意指该短语中的任何一项或任何项的组合。
尽管为了方便呈现,以特定的、连续的顺序描述了一些所公开的方法的操作,但是应当理解,除非以下阐述的特定语言要求特定的排序,否则这种描述方式包括重新安排。例如,顺序描述的操作在一些情况下可以被重新安排或被同时执行。此外,为了简单起见,附图可能未示出所公开的系统、方法和装置可以与其他系统、方法和装置结合使用的各种方式。此外,描述有时使用诸如“产生”和“提供”之类的术语来描述所公开的方法。这些术语是所执行的实际操作的高级抽象。对应于这些术语的实际操作将根据特定实现而变化,并且本领域普通技术人员很容易辨别。
二.介绍
本文开发了一种用于量子计算的自然语言处理方法。该方法基于人工神经网络,因为像量子计算机一样,神经网络计算机是动态系统,其中状态空间是高维向量空间。这里所提议的方法遵循被称为梯度符号计算(GSC)的用于人工智能和认知科学的通用神经网络框架。参见,例如Paul Smolensky和Geraldine Legendre的“The harmonic mind:Fromneural computation to Optimality-Theoretic grammar”,第2卷(马萨诸塞州,剑桥,麻省理工学院出版社,2006年);Paul Smolensky、Matthew Goldrick和Donald Mathis的“Optimization and quantization in Gradient Symbol Systems:Aframework forintegrating the continuous and the discrete in cognition”,认知科学,38(6):1102-1138(2014年)。由于GSC以量子力学为出发点,因此这项工作相当于一个概念圈的终结。
量子计算近年来已被应用于解决密码学、物理系统的模拟和机器学习中的许多问题。这些方法的优势源于许多不同的来源,包括量子计算机有效操纵指数级大状态向量和操纵量子干扰以改善统计采样技术的能力。虽然诸如量子梯度下降和幅度放大之类的技术可以被用来为语言处理执行梯度符号计算而提供优势,但是该应用仍然不发达,而且在量子计算机上准备必要状态的挑战使得这些技术的直接应用具有挑战性。出于这个原因,语言处理中的应用非常需要新的语言表示。
本公开涉及语言处理的至少两个方面:语法符号序列(连同它们的组成结构解析树)的生成,以及给定语法的给定符号序列的语法性的确定。在本公开中,在第三节总结了梯度符号计算的相关方面之后,在第四节中提出了一种用于在量子计算机中对解析树进行编码的表示模式,它识别语言处理和量子纠错之间的连接。在第五节中,所提出的量子计算机的哈密顿量(一种玻尔兹曼机类型)与其处理的语法相关。然后第八节讨论了学习根据未知语法进行处理的量子计算机的参数的问题。处理无监督和监督学习问题,并呈现了所提出的学习算法的复杂性。第六节呈现了以形式语言生成句子的数值模拟,这些句子由给定的符号重写规则集合来指定。这相当于一个优化问题,因为在梯度符号计算中,符合语法的句子是那些使被称为和谐的形式良好的测量最大化的符合语法的句子。和谐值在物理上被实现为量子计算机的负哈密顿量的期望值。
应该强调的是,这里所呈现的监督学习的分析(特别是定理4中的梯度的计算和定理5中的复杂性结果)不限于语言处理:它们适用于任何量子玻尔兹曼机的监督训练。
三.张量积表示
这里所部署的神经网络框架的核心,梯度符号计算(GSC),是一种被称为张量积表示(TPR)的通用技术,用于在向量空间中嵌入复杂的符号结构。参见,例如Paul Smolensky的“Tensor product variable binding and the representation of symbolicstructures in connectionist systems”,人工智能,46(1-2):159-216(1990)。对于语言应用,相关类型的符号结构是二叉解析树,其是这样一种结构:其明确将单词分组为小短语,将较小的短语分组为较大的短语,以这种推,递归地直到完整句子的级别,如[S[NPthis][VP[Vis][NP[Detan][AP[AEnglish][Nsentence]]]]]。Dan Jurafsky和James HMartin,语音和语言处理,第3卷,Pearson London,第2版(2014年)。这个带括号的字符串标示图1中所示的二叉树。树中的每个被标记节点都是一个组分。特别地,图1示出了针对this is anEnglish sentence(这是一个英语句子)的解析树的示意框图100;在此示例解析树中,S=sentence,N=noun,V=verb,Det=determiner,A=adjective,P=phrase(S=句子,N=名词,V=动词,Det=限定词,A=形容词,P=短语)。
在一种使用“位置角色”的TPR嵌入中,嵌入符号结构(S)的向量是嵌入所有结构组分的向量的叠加,而嵌入成分的向量——用符号标记的树节点——是嵌入符号(si)的向量与嵌入树内的节点位置的向量的张量积二叉树中的位置可以用位串来标识,以使得011标示树根的右子的右子(1)的左子(0)。(“独子”被任意视为左子,并且根用空字符串ε来标识。)因此,在这个位置角色TPR中,针对this is an Englishsentence的嵌入解析树的向量以狄拉克符号表示为:
|ψ>=|S>|ε>+|NP>|0>+|this>|00>+|VP>|1>+|V>|01>+|is>|001>+|NP>|11>+…(1)
向量{|S>,|NP>,|this>,...}位于承载被嵌入符号的向量空间VS中,而向量|ε>,|0>,|1>,|01>,...位于承载被嵌入节点的向量空间VN中;然后|ψ>位于树嵌入空间中。令节点的嵌入是递归的,具有|101>=|0>|1>|1>。因此,令V0是由|0>,|1>跨越的向量空间,具有类似地,所有节点的嵌入的向量空间VN是包含所有深度的嵌入节点的向量的向量空间的直接和:
已经表明,使用这种TPR和纯神经网络计算,可以计算递归符号函数族,其将二叉树映射到与语言处理相关的二叉树。例如,参见Paul Smolensky的“Symbolic functionsfrom neural computation”,皇家学会哲学汇刊-A:数学、物理和工程科学,(2012年)出版。(也就是说,对于这样的函数f,神经网络可以将树T的嵌入映射到树f(T)的嵌入。)对于作为原始树操纵操作的闭包的函数族——提取左/右子树,将两棵子树合并为单各树——线性神经网络就足够了:这样的函数可以通过单个矩阵乘法来计算。参见Paul Smolensky和Geraldine Legendre的“The harmonic mind:From neural computation to Optimality-Theoretic grammar”,第2卷。马萨诸塞州剑桥:麻省理工学院出版社(2006年)。
VT中的一般状态不是单个树的嵌入,而是树的嵌入的加权叠加。因此,如果|ψ>是等式1中给出的this is an English sentence的解析树的嵌入,并且|φ>是this is anAmerican sentence的对应解析树,那么VT中的一个状态是|χ>嵌入梯度符号结构,其是this is an 1/2(English+American)sentence的解析树;这里,节点00111由两个梯度符号的混合来标记:1/2英语和1/2美国。在一般梯度符号结构中,节点由符号的线性组合来标记。
在梯度符号计算中,语法是测量神经网络中的状态的形式良好程度的函数;这是一个李雅普诺夫函数。在Hopfield网络中,网络动力学最小化了一个被称为“能量”的函数;在GSC中,网络动态最大化了被称为“和谐”的函数H。参见John J Hopfield的“Neuralnetworks and physical systems with emergent collective computationalabilities”,美国国家科学院院刊,79(8):2554-2558(1982);Paul Smolensky的“Information processing in dynamical systems:Foundations of Harmony Theory”,并行分布式处理:认知微观结构中的探索,卷1,第194-281页,麻省理工学院出版社(1986年)。
网络格式良好的函数H和语法之间的联系源自H是语法约束函数fC的线性组合,每个语法约束函数都测量状态违反语法要求的程度:这样的H被称为调和语法(HarmonicGrammar)。参见Geraldine Legendre、Yoshiro Miyata和Paul Smolensky的“Harmonicgrammar-a formal multi-level connectionist theory of linguistic well-formedness:Theoretical foundations”,认知科学学会第12次会议的会议记录,第388-395页(1990年)。因此,给定约束C1:=‘a sentence has asubject’,嵌入is an Englishsentence的解析树的向量|ξ>违反了C1一次,因此参见Jane Grimshaw和Vieri Samek-Lodovici,Optimal subjects and subject universals。P.Barbosa、D.Fox、P.Hagstrom、M.McGinnis和D.Pesetsky为编辑,“Is the Best Good Enough?Optimalityand Competition in Syntax”,第193-219页,麻省理工学院出版社,马萨诸塞州剑桥(1998年)。H中的的系数,是一个负数,因此缺失的主体使和谐降低这是调和语法H中的约束C1的强度。调和语法已被证明在分析自然语言方面很有价值。参见Joe Pater,“Weighted constraints in generative linguistics”,认知科学,33(6):999-1035(2009)。特别有价值的是特殊的调和语法,其中每个都超过了从所有弱于Ck的约束的线性组合中所产生的最大可能的和谐惩罚:这些是最优理论的语法。参见,例如AlanPrince和Paul Smolensky,“Optimality Theory:Constraint interaction ingenerative grammar”,技术报告,罗格斯大学和科罗拉多大学博尔德分校,1993,1993/2004,罗格斯最优档案537,2002,由布莱克威尔发布的修订版(2004);Alan Prince和PaulSmolensky,“Optimality:From neural networks to universal grammar”,《科学》,275(5306):1604-1610(1997)。在这样的语法中,不再需要数值加权:只有约束从最强到最弱的排名对用于计算两个结构中的哪一个具有更高的和谐而言是重要的。如果没有其他结构具有更高的和谐,则结构是最佳的——最符合语法的。
形式良好的——例如,符合语法的——句子是具有全局最大和谐的句子。在神经网络中,这些可以经由模拟退火而被计算,其中随机网络状态遵循玻尔兹曼分布pT(x)∝eH (x)/T;在计算过程中,T→0。(这种网络是玻尔兹曼机或和谐网络。)参见,例如David HAckley、Geoffrey E Hinton和Terrence J Sejnowski的“A learning algorithm forBoltzmann machines”,认知科学,9(1):147-169(1985));PyeongWhanCho、MatthewGoldrick和Paul Smolensky,“Incremental parsing in a continuous dynamicalsystem:Sentence processing in Gradient Symbolic Computation”,LinguisticsVanguard,3(2017年)。这种玻尔兹曼分布还描述了调和语法H的量子模拟中的感兴趣状态。
除了描述自然语言之外,调和语法还可以描述形式语言,也就是说,通过重复应用诸如之类的重写规则而导出的符号序列集合,其生成形式语言(具有解析树T1:={[Sa[Sa…[Sa.b]b]…b]})。与相对应的调和语法将在下面精确地进行定义,但简单地说,将负和谐指派给as和bs的所有不符合语法的序列,并将最大和谐—H=0—指派给所有符合语法的解析树,T1。一组约束将负和谐指派给a或b的存在,而另一组约束将正和谐指派给符合语法重写规则的树配置,例如,母节点被标记为S且女节点为a的母/左女对。负和谐约束的贡献仅针对语法树而被正和谐约束的贡献所抵消。
TPR提供了高度通用的框架,用于嵌入到几乎任何类型的向量空间符号结构中,而不仅仅是树。一般来说,一种类型的符号结构的特点是一组角色,每个角色都可以被绑定到填充符。在目前讨论的TPR方案中,填充符是符号,角色是树节点,即树中的位置。这是位置角色的一个实例。还有另一种部署TPR的模式,其引起了量子计算的兴趣:这种方法部署了“上下文角色”。不是通过符号所占据的位置来表征符号在结构中的角色,而是说可以通过它周围符号的上下文来表征符号的角色——例如,γ=2。对于序列abcd,不是将b识别为第二个位置中的符号,而是说现在可以将其标识为前面有a后面跟c的符号。所以abcd的嵌入不再是|a>|1>+|b>|2>+|c>|3>+|d>|4>而是|abc>+|bcd>=|a>|b>|c>+|b>|c>|d>。对于神经网络,当符号数量很大(诸如英语单词的数量)时,这种上下文角色方案很快就会变得令人望而却步。
在限制中,被用来表征符号的角色的上下文大小γ足够大以包含整个结构。在这个限制中,对于二叉树,树的位置被枚举—(pk)k=1,2,...:=(∈,0,1,00,01,10,11,...)—并且然后在位置(pk)中具有符号(sk)的树被嵌入为向量|s1 s2 s3...>=|s1>|s2>|s3>…。正是这种最大上下文角色TPR在下面被部署用于量子计算。
尽管上下文角色所需的状态空间通常比位置角色所需的状态空间大得多,但是上下文角色方案与位置方案相比具有显著优势:叠加可以保持身份。如果在位置方案中,叠加|abc>和|xyz>,则失去两个序列的身份,从那时起|abc>+|xyz>=(|a>+|x>)|1>+(|b>+|y>)|2>+(|c>+|z>)|3>=|ayz>+|xbc>=|xbz>+|ayc>=…。但在上下文方案中,|abc>+|xyz>=|a>|b>|c>+|x>|y>|z>,这是明确的。
四、FOCK空间表示
尽管存在由语言的位置角色张量积表示(pTPR)利用的张量积结构,但是直接在量子计算机上实现它们可能是一个挑战。这是因为pTPR的自然表示将作为量子状态向量。虽然可以使用非常少量的量子位来表达这样的量子状态向量,但操纵这些状态向量以最大化和谐所需的操纵是非线性的。由于量子计算机无法确定性地对状态应用非线性变换,因此这种优化涉及非确定性的操作,该操作可能需要大量的后选择以便应用。
为此,提出了在量子计算机中使用部署最大上下文角色的TPR来编码语言结构。这将被称为Fock空间表示。Fock空间背后的想法是,人们将表示内可以填充的每个角色视为通过此空间分解而构建的结构内的张量因子。这与pTPR结构不同,在pTPR结构中使用张量积的线性组合来表示符号结构。在此,使用更简单术语的张量积来描述角色和填充符的每一种可能组合。例如,如果有R个角色,那么这个Fock空间的基础可以用狄拉克符号表达为:
|v>=|f1>…|fR>, (3)
其中每个fi是绑定到位置角色ri的填充符(符号),角色r1,...,rR的排序已经被强加。因此|abc>=|a>|b>|c>。
存在可以定义基础的多种方式。这里提出了以下约定。令|0>表示没有填充符的位置角色,或者等效地令|0>表示用空符号“0”填充的位置角色。接下来,令是在位置角色r中存储填充符f的向量。这意味着R角色上的填充符空间中的任何基向量都可以写成
这里每个都是绑定算符,其作用与量子力学中的创生(creation)算符完全类似。类似地,将每个定义为对应的解绑定算符,它将绑定角色映射回未绑定角色,并且是的厄密共轭(Hermitian)转置。下面总结了绑定和解绑算符的属性。
尽管Fock空间表示需要使用经典绑定算符,但实际上经典绑定算符是特殊的,因为Fock空间表示通常需要非经典(或量子)绑定算符。这在下面的定理中正式显示。
定理1.经典Fock空间表示在以下意义上来说是pTPR的推广:对于使用正交角色和填充符向量的有限集来编码结构的任何pTPR编码,在该结构中每个角色都被指派了唯一的填充符,存在从pTPR空间到Fock空间表示的单射映射,而不存在双射映射。
证明.不失一般性,假设在pTPR中不存在任何递归结构。这可以通过扩展张量积并重新定义角色来完成,因为对于表单的任何分量。由于在TPR中角色和填充符的数量有限,为了具体起见,假设存在N个可能的填充符{Aj:j=1,...,N}和M个可能的角色{rk:k=1,...,M}。类似地,令s:{1,...,M}→1,...,N是用于表示固定但任意的pTPR的填充符序列,诸如
另一方面,满射不可能存在。为了看到这一点,让我们检查一下pTPR的维度。已经假设pTPR存在于维度为MN的向量空间中,这遵循唯一绑定假设。另一方面,Fock表示的向量空间的维度是(N+1)M(由于真空符号0的存在,基数是N+1而不是N)。由于空间的维度不同,不可能构建从pTPR到Fock空间表示的满射映射,除非对Fock空间表示允许的向量做出进一步限制。这完成了Fock空间表示是pTPR的推广的证明。
乍一看,上述定理的证明似乎暗示Fock空间表示不如pTPR有效。事实上,即使pTPR的Fock空间等价所在的向量空间呈指数级大,存储表示给定结构的向量所需的存储也是等价的。事实上,单射映射的存在表明pTPR可以很容易地以这种形式表达,这表明在原则上两者所需的存储没有区别。
然而,Fock空间表示所在的指数级大的空间使其成为一种更方便的语言来描述TPR上的分布或指派到给定角色的填充符中的不确定性。正如在中n位上的概率分布一样,具有在指数级大空间中工作的能力可以方便地表达绑定指派中的不确定性。这一属性还允许人们通过绑定来表示量子分布,这进一步使得这种表示在查看量子计算机上的语言处理时必不可少。
五.和谐算符
在梯度符号计算中,和谐函数被优化以确定句子是否符合语法。该框架内的目标是通过全局优化和谐来找到符合语法的句子,和谐是对句子结构良好程度的衡量。按照惯例,负和谐与不符合语法的句子相关联,零和谐与符合语法的句子相关联。
作为示例,考虑以下具有填充符{S,A,B,.}的语法,其生成形式为An.Bn的字符串以用于任何整数n,其中S是起始符号,{A,.,B}是终止符号。可以通过构建采用鱼骨形式的三叉树并将角色{c0,l1,c1,r1,l2,c2,r2,...}指派给填充符来表示这一点(其中l,c,s表示“左、中、右”子节点)。由语法生成的最简单的这种树采用的pTPR的形式。一个适用于此的和谐函数选择将和谐-3指派给角色c0中的S,将和谐-4指派给放置在cd中的S;d>1,并且用于所有其他符号的和谐惩罚为-1。如果 或中的任何一个以及都被绑定,则获得+2的和谐奖励。这种树的和谐是0,因此它是符合语法的。相同的规则可以很容易地推广到此语法的任意长的示例。
在Fock空间表示中,也有和谐的概念,但是和谐的概念在这个框架中需要更普遍。这源于这样一个事实:对于Fock空间表示,和谐的自然泛化是算符而不是函数,如下所见。
作为这种和谐算符的特定示例,让我们考虑之前讨论的An.Bn语法。用于任意深度句子的和谐算符可以表达为
注意,在这个特定的上下文中,和谐算符可以被认为是函数而不是算符,因为和谐算符是数字算符的总和,每个算符都可以被表示为对角矩阵。因此,和谐算符可以(在概念层面上)被函数替换,该函数为系统的每个可能的配置产生和谐。
一般情况下不必如此。有可能出现非经典效果的设置。在最量子力学的解释下,孤立态的相位没有可观察的结果,-|ψ>和|ψ>具有相同的解释。然后,|ψ+>:=(|J>+|K>)|Subject>+|left>|verb>和|ψ->:=(|J>-|K>)|Subject>+|left>|verb>也有相同的解释,是解释“Jay left”和“Kay left”的模棱两可的混合。然而是明确的“Jay left”。两个模糊状态的叠加可以是明确的,这是一种纯粹的量子效应。为此,引入了和谐算符之间的以下二分法:
等式(7)中给出了经典和谐算符的自然示例。它显然是一个经典的和谐算符,因为它只依赖于数字算符,它不会改变绑定到任何角色的填充符。因此,(i)计算角色是否拥有特定填充符和(ii)应用和谐算符的顺序无关紧要,因此该示例是经典的。
作为非经典和谐算符的示例,考虑以下情况。假设给定一个正方形格子,其中图中的每个顶点都扮演一个角色,如图2中所图示。特别地,图2是一块表面代码的示意框图200,其中圆圈标示Fock空间表示的占用状态(相当于量子计算语言中的量子位)。红十字(在210处示出)给出了四个占用状态之间的“顶点”相互作用的示例,蓝色方块(在212处示出)是位于正方形周边的四个占用状态之间的元格(plaquette)相互作用的示例。文中提到的集合V和P由表面代码中所有这种顶点和元格子图的并集组成。
令P是图中的元格集(意思是由图中所有单位单元组成的集合,每个单位单元都由4个顶点组成,因为该图是正方形的),并且令V是该图的顶点集(意思是关于方图中每个顶点的所有4个顶点的集合)。这种情况下的语言是由单个填充符生成的,和谐算符可以表达为
此和谐算符对应于Toric码,Toric码可以用作量子计算的纠错码。最大和谐状态对应于代码的最小能量子空间,这已被证明可以防止局部错误。这表明,除了纯粹的学术好奇之外,非经典和谐算符对量子计算至关重要,而且从这个角度来看,量子纠错与语言学有着深厚的联系。
对给定的Fock空间表示的和谐的表达采用相同的形式,而不管是否它具有经典还是量子和谐算符。
找到符合语法的句子——其是最大调和的句子——然后归结为优化和谐算符的期望值。然而,这种优化本质上会产生成本。可以使用oracle查询模型来评估量子和经典和谐优化的成本。在这个模型中,可以假设除了通过查询表示和谐函数的oracle可以收集到的信息之外,对哈密顿量一无所知。
六.和谐最大化:数值模拟
从梯度符号计算的角度来看,解析语法内的句子的目标是找到对最大化和谐的角色和填充符的指派。在这里,研究了为经典Fock空间优化和谐的问题,也就是说和谐算符只是数字算符的总和。从这些示例中可以看出,在Fock空间表示内优化和谐是实用的,因此为学习过程提供量子加速非常重要。
A.An.Bn语法
回想一下,用于An.Bn形式的语法表达式的解析树规则是在四符号字母表{A,B,S,.}上定义的。这是一个简单的示例,其中解析树可以被可视化为一个“鱼骨”结构(HB),该结构可以递归地描述如下:
0)零深度HB由一个节点组成;1)深度为n的HB的根正好有三个子:子编号1和3是叶,子编号2是深度为n-1的HB。
当选择n时,对应的Fock空间和和谐算符是完全定义的,并且和谐是对角算符,它可以被重新解释为在所有可能的符号指派给HB结构的节点的空间上的某个标量函数h。
因此,负和谐-h可以被视为对应波茨模型的哈密顿量,其是HB图上伊辛(Ising)模型的推广。例如,参见Giovanni Gallavotti,“Statistical Mechanics:A ShortTreatise”,Springer(1999);Renfrey
B.Potts,“Some generalized order-disorder transformations”,数学论文集,48(1):106-109(1952)。手头模型与传统伊辛模型之间的区别在于伊辛模型由2值自旋组成,而在波茨(Potts)模型的当前实例中,每个节点可以假设{A,B,S,.}中的四个值之一。这些值的最大和谐指派被理解为哈密顿量-h的基态。
在此设置中,可以通过使用在求解伊辛模型方面具有出色跟踪记录的模拟退火策略来找到这种基态。用于求解更普遍的波茨模型的算法概要如下:
对于任何预先选择的n,存在将深度n的HB结构变成零和谐解析树的唯一符号指派。实验表明,这种唯一的符合语法的HB结构可以通过算法1获得,该算法从平均为O(n)步的随机符号指派开始。数值测试使用了经过修改以适应波茨模型的高度优化的模拟退火代码。HB结构用n∈[2..1024]进行测试,测量实现最大和谐所需的退火过程的最小重复和扫描次数。用独立于n的10次重复和20次扫描,始终可以实现此目标。在大约10%的情况中,扫描的最小数量偶尔会下降到19次,而只有在一个案例中记录为18次。由于深度n的结构有3n+1个节点,因此可以说最大化要求对和谐函数进行大约600n次重新评估,方差最多为10%。图3中示出了与An.Bn表达式(作为n的函数)调和的经验平均复杂性。特别地,图3是曲线图300,其示出了通过必须查询和谐函数以找到用于An.Bn语法的最大和谐树——(双对数标度)的次数来测量的退火复杂性。
和谐函数
和谐算符
表I.是描述了用于平衡括号语法的和谐算符的表。指派+1的和谐奖励以使得在树的根部有S。除非另有说明,否则用于给定配置的和谐为零。还给出了在由2D模式构成的Fock空间上平衡括号语法的经典和谐算符,其中可以将任何顶点j L(j)定义为节点的左子节点,将任何顶点R(j)定义为节点的右子节点。
B.平衡括号语法
用于枚举和纠错由左右括号组成的语法表达式的平衡括号语法是一种语法,其基于6个符号A、B、C、S、(、)的字母表并且有下面的一组规范化的生成规则:
S→B,S→C,B→(A,B→(),A→S),C→SS。
从语义上讲,S符号只能出现在语法解析子树或完整的语法解析树的根部。例如,图4是示出最佳和谐解析树的示例的示意框图400。更详细地,图4示出了用于表达式()()的唯一解析树,它是两个不相交的语法子表达式的串联。
用于此语法的和谐函数如下。
假设候选解析树的结构是已知的,那么对应的Fock空间的结构也是已知的,和谐算符也是如此。如上所述,如果和谐算符是对角线的,则可以将其转换为给定解析树的所有可能节点→符号(node→symbol)指派的空间上的实值函数h。然后,可以使用合适的最大化方法将符号的最佳和谐指派作为函数h的argmax找到。下面演示了如何通过某种模拟退火方法来实现这一点。不幸的是,并非每个候选解析树都允许实现和谐的绝对最大值的符号指派。事实上,如果考虑一组已知最大深度D和已知最大叶数L的二叉树,那么允许符合语法指派的二叉树子集与整个集(关于D,L)相比呈指数级小。可以将允许这种最大和谐符号指派的二叉树称为可行解析树。所有其他树都被称为不可行。因此,用于在给定候选解析树上最大化和谐的相对简单的代码应该只是枚举了所有可行解析树的更高级别算法中的子程序,或者,为了纠错目的,将不可行树变形为可行树。如下所示,整个算法的更高级别也可以在合理的更新启发式算法上沿着模拟退火的路线设计。
1.可行解析树的递归枚举。
从一个专门的和谐优化方法开始,该方法利用括号放置语法是上下文无关的这一事实。这种方法很可能很好地推广到任何上下文无关语法。请注意,在这种情况下,最佳解析树的任何子树都是最佳的。让我们对表I中提出的特定和谐哈密顿量进行更强有力的观察。
引理1.对于表I中的和谐算符:整个调和解析树的和谐为0;这种树的任何子树的和谐为-1。
证明.在进行递归证明之前,回想一下在整个树根处的符号S有+1的和谐奖励。不理会此加值,可以说整个树及其任何子树在调和解析树中都必须具有-1的和谐。让我们首先递归地证明,具有任何符号指派的解析子树的和谐不能大于-1。事实上,对于深度为0的子树来说这是显而易见的。假设它已经被证明对于深度最大为d的子树来说,考虑一个深度为d+1的解析子树。根据归纳假设,它的根的任何子树具有的和谐最多为-1。根处的符号指派的和谐是负的。除非子子树(child subtree)的边符合正确的生成规则(因此会产生+2的和谐奖励),否则整体和谐将小于-1。因此,让我们排除边缘确实对应于生成规则的情况。
情况A、B、C:A、B、C中任一个的根指派带有-3的和谐惩罚。如果只有一个子子树有和谐为-1,则总子树和谐不能超过-1+2-3=-2。如果有两个子子树,则和谐不能超过-1+(-1)+2+2-3=-1。情况S:如果根下有两棵子子树,每棵子子树的和谐为-1,则注意到其中一棵子树的一条边最多可以获得+2的和谐奖励(因为S没有两个子的生成规则)。因此整体和谐不能超过-1+(-1)+2+0-2=-2。如果根下只有一棵子树,则整体和谐仍然不能超过-1+2-2=-1。case(,):根指派为括号之一的情况很明显。现在让我们通过案例区分来证明,在和谐-1的解析子树中,其根的任何子子树也必须具有和谐-1。Case(,):如果根指派是任一括号,则任何子子树对整体和谐的贡献最多为-1。因此,整个树必须没有子子树才能具有-1的和谐。观察的主张是微不足道的。情况A、B、C:A、B、C中任意一个的根指派带有-3的和谐惩罚。如果只有一棵子子树的和谐≤1,则总子树和谐不能为-1。因此,有两棵子子树的和谐h1≤-1,h2≤-1,整体和谐最多为h=h1+h2+4-3=h1+h2+1。一个必须有h1=h2=-1,对于h=-1。情况S:如果根下有两棵子子树,每棵子子树的和谐≤-1,则注意到这些子树之一的最多一条边可以获得+2的和谐奖励(因为S没有两棵子树的生成规则)。因此整体和谐不能为-1。因此,存在一个和谐hc≤-1的子子树。并且整体和谐至多是hc。因此必须有hc=-1。
□
此算法在写入时被读取为非常昂贵的双递归例程。然而,在实践中,可以通过将所有先前计算的枚举高速缓存在全局高速缓存中来使其完全易于管理。这样,任何递归请求的enumSubtrees(l,d)都会立即从缓存中取回答案,如果它之前曾被计算过的话。
2.退火成可行解析树。
在前一小节中开发的算法2被建立在所讨论语法的具体属性上,并且可能无法清楚地推广到其他语法。考虑一般情况,其中给定是候选解析树的二叉树,然后相对容易地找到符号对树节点的最大和谐指派。特别地,从算法上推断候选树是否可行是相对容易的。根据本节开头的讨论,可行树非常罕见,并且随机生成的树可行的概率呈指数级低。人们可以从一种策略中受益,即给定随机树,就可以在可接受的步骤数后将树变形为可行树。这种策略会具有重要的纠错方面,因为它能够以相对较低的成本将错误的解析树编辑为正确的解析树。树变形策略需要被分解为相对简单的步骤序列才能通用,并且直观上很清楚变形策略一般不可能贪婪,例如通常不可能通过单调增加连续候选树的最大和谐的步骤序列来达到可行树。因此,再次考虑这一级别的模拟退火原理。下面,提出了一种用于树变形算法的可能设计。
基本步骤。允许对二叉树进行以下基本操作:
1)叶删除:树的叶连同导向它的边一起被删除
2)叶创建:将叶添加到具有少于2个子的某个节点。
显然,这组操作是通用的。实际上,任何树都可以通过类型2)的操作序列从根演化,并且任何树都可以通过类型1)的操作序列而被简化为根。因此,任何树T1都可以通过类型1)和2)的一系列操作变形为任何其他树T2。然而,已经发现在实践中引入冗余基本操作是有益的:
3)叶分叉:通过将两个新叶附着到二叉树,将一些叶变成内部节点。
在约束下变形。正如在上一小节中一样,可以通过规定其所需的叶数L和最大深度D来驱动对可行树的请求。可以选择变形更新,以使得更新后的树深度永远不会超过D并且其叶数与L非常接近。因此,无论什么时候叶数低于L,人们总是喜欢在内部节点进行叶分叉或叶创建;并且如果这导致了深度大于D的树,则永远不会向现有叶节点添加叶或分叉叶。(在此策略中存在死锁的理论上的可能性,即在不将树深度增加超过限制的情况下无法添加叶,然而,当D>log2(L)时这不会发生,这是主要场景。)退火式树变形算法的顶级方案如下:
这里,“随机附加更新”意味着指对随机选择的叶进行分叉或将叶作为第二子添加到内部节点。根据基本操作的给定定义,“随机还原更新”意味着删除叶。为了促进收敛并消除死锁,可以排除向最近删除了叶的站点添加(多个)叶,并且可以排除删除最近添加的叶。“T是可行的”谓词需要在对子树T的节点的所有符号指派上最大化和谐。通过在所有可能的符号指派配置集上运行合适的模拟退火子例程,这可以在实践中轻松完成。如果由此实现的最大和谐等于-1,则子树T是可行的。
3.对退火成可行解析树的模拟度量。
在请求深度最多为4且有4个叶的随机二叉树之后,初始随机树在算法3的少于60次基本移动中变形为可行的4端解析树。为了比较,通常需要超过1000个随机生成的4叶样本树,以得到可行解析树候选。在请求最大深度为6且有5个叶的随机二叉树之后,在中值情况下需要大约450个基本移动来生成具有-1和谐的可行解析树候选。(显然,不存在奇数叶的调和树)。在请求深度最多为7且有6个叶的随机二叉树之后,在中值情况下需要大约2100次基本移动才能得到可行解析树。(表II中给出了对这些数字的快速参考。)
表二模拟退火到可行解析树的成本
然而,该算法具有一些潜在的缺点。首先,它对初始候选树的形状很敏感。在不利的初始化情况下,终止所需的时间可能是一般情况的两倍。一个6叶运行的单个实例已经在它从未收敛的地方注册。(这就是为什么列出的是终止的中间步骤而不是“平均”的原因)。终止度量的另一个特征是它在请求叶数中可能仍然是指数级的。
七.量子语言处理的计算能力
已经表明,经典Fock空间表示可以用于解决语言处理中的问题,但一个重要的问题仍然存在:“从使用量子和谐算符可以收集哪些量子优势?”这里,提供了两种优势的证据。第一这样的优势显示,除非BQP=BPP,否则使用合理的量子绑定算符族的量子语言处理无法在任意小误差内在经典计算机上被有效模拟。这可以通过将解析量子语言的问题重新转换为执行量子计算的问题来证明。第二个这样的优势是使用量子模拟退火对优化经典和谐函数的加速。
量子学习任务的计算工具的问题随着量子算法的众多引人注目的去量化或量子启发的经典算法而日益突出,这些算法乍一看似乎提供指数级的加速。这指出了数据的量子模型可能比经典方法更具表现力的希望核心。在这里,这是通过表明至少有一些语言类别使得评估语言等同于量子计算来解决的,因此表明示例方法不太可能被去量化。此外,这些结果简单地显示存在一类通用且无法被去量化的玻尔兹曼机。
为了证明用于语言的量子Fock空间表示比经典表示更强大,需要首先定义使用这种表示来解决问题的计算模型。这在下面完成。
定义4.调和量子计算机可以被定义为一种遵循以下假设的量子计算模型。
3.Fock空间表示中的每个绑定算符可以被表示为O(poly(n))稀疏行可计算矩阵。
有了这个定义,就容易看出这种调和量子计算机与之前已经考虑的问题类型略有不同。该计算机中没有内置和谐优化的概念。另外,该计算机需要参数化的和谐算符族,而不仅仅是一个。引入了使用和谐算符族的要求,以处理此模型中不存在和谐最大化的事实。具体来说,和谐最大化问题可以这样解决,即通过选择一个经典上容易求解的和谐算符,然后慢慢将其转化为想要解决的实际和谐算符。这类似于绝热量子计算。参见Edward Farhi、Jeffrey Goldstone、Sam Gutmann和Michael Sipser的“Quantum computation byadiabatic evolution(绝热演化的量子计算)”,arXiv预印本quant-ph/0001106(2000)。
定理2.存在满足定义4的调和量子计算机,κ=4,它是在多项式上等价于量子计算的电路模型。
证明.为了证明这个说法,首先需要显示存在可以模拟任何电路的调和量子计算机,然后显示此模型可以被基于电路的量子计算机有效地模拟。该说明的前进方向紧随David Gosset、Barbara MTerhal和Anna Vershynina的“Universal adiabatic quantumcomputation via the space-time circuit-to-hamiltonian construction(经由时空电路到哈密顿构造的通用绝热量子计算)”,物理评论快报,114(14):140501(2015年))(以下称为“Gosset”),其显示了量子计算的电路模型和在晶格上使用XXZ模型的绝热量子计算之间的等效性。
图5示出了示意框图500和510,其图示了在Gosset中使用的构造的电路哈密顿量。图500在黑框中示出了一组作用于8量子位的系统的两个量子位门。图510表示哈密顿量的结构,其中在边上绘制的每个圆圈表示一个粒子可以位于其中的地点,叠加有在该构造中使用的四体顶点和元格(plaquette)算符的示例。
在本节中使用的构造如下。
考虑两个量子位门{Up}的组,它们作用于具有线性最近邻连接的2k个量子位。虽然两个量子位门是任意的,但它们的目标有一个假设的模式。门以因果菱形布置。在第一个时间步长中,门操作只发生在量子位k-1和k之间。类似地,在最后一个时间步长中,在量子位k-1和k之间也只有双量子位门。在第二个时间步长中,在量子位k-1和k-2以及量子位k和k+1之间有两个量子位门。在倒数第二个时间步长中,双量子位门也针对相同的量子位。重复此过程,直到两种模式在第k个时间步长处相交。这些双量子位门是任意的,并且由于它们是通用的,因此任何量子电路都可以被嵌入到这种模式中以获得足够大的k,这可能是通过将许多门视为身份来实现的。
可以构建对应于这些门的和谐算符。用于此和谐算符的Fock空间由与门在其中起作用的时空坐标相对应的角色组成。例如,令w是特定的两级门所作用的量子位,并假设门在时间t和t+1之间是活动的。角色对应于这个时空区域的边界:(w,t),(w+1,t);(w,t+1);(w+1,t+1)。放置在每个角色中的填充符是0、1,它们对应于每个门所作用的量子位可以采用的值。可以将用于对应语法的绑定算符表示为f∈0,1,并且可以类似地定义
这里,为了方便,假设n(w,t):=(n(w,t),0+n(w,t),1)并且h.c.被用作厄米共轭的缩写
其中对于图中度数为4的所有顶点如上定义,也就是说顶点不位于因果菱形的边界处。如果顶点位于边界处,则在菱形外耦合的项被设置为零。还隐含地假设,上面项中索引w′s的是给定门Up所作用的每个元格内的量子位的空间坐标。最后,
如果在计算开始时对应于初始量子位状态的填充符未被设置为0(对应于s=0),则其用于创建和谐惩罚。上述和谐算符通过检验来满足定义4中规定的要求,κ=4。
在Gosset中示出了最大和谐的状态,如果则具有最大和谐对应的配置可以被测量以找到具有在下面由正常数界定的概率的电路的输出。因此,是κ=4的和谐算符,其最大和谐配置在成功测量后产生任何量子计算的结果。
为了看出调和量子计算机的成本是O(poly(n)),请注意,在模型内已经归因于至少以1/3成本O(poly(n/∈))在误差和概率内测量系统的系统的和谐的成本。为了保证测量成功地投射到最大和谐状态,测量必须具有∈∈O(γ)。由于γ∈Ω(n-3),选择∈∈Θ(n-3)就足够了,因此模型内的投影成本是O(poly(n))。因此,如果测量成功地投射到最大和谐状态上,则可以在多项式时间内实现计算。
接下来,希望表明可以以高概率准备在协议结束时进行的测量。在Gosset中提出的方法是使用绝热状态准备,其被保证在多项式时间内工作,因为最小间隙是逆多项式。在当前情况下,无法在模型内执行绝热扫描,因此可以使用Zeno效应来模拟它。
首先,针对的最大和谐的状态通过设计为形式的状态而被选择。通过假设,可以在上面用于调和量子计算机的模型中无成本地准备此状态。现在,对于任何s∈[0,1],可以选择最大和谐的状态|ψmax(s)>(通过选择合适的全局相位作为s的函数),以服从的一组正交的瞬时特征向量{|ψ(s)|}
同样,不难看出
因此,如果对于所有s的谱间隙至少为γ(s),那么
对于任何Δ>0,因此从(14)、(16)和微积分基本定理可以得出:
现在,假设试图通过对于r步均匀扫过s并取Δ=1/r来准备状态|ψmax(1)>。这从联合边界给出:
等式(10)给出,在O(poly(n))中并且已知γ(s)也在Ω(poly(n))中。因此,在足以准备状态的特征基础中具有r∈Θ(poly(n))测量值。然而,每个这样的测量现在必须具有至多1/r的失败概率,这需要对数重复次数,因为假设在调和量子计算机模型中的测量成功概率至少为2/3。因此,准备状态的总成本是多项式的,反过来所有量子电路都可以在计算模型中进行模拟。
接下来,希望相反地展示,具体地,基于电路的量子计算机可以使用门操作的多项式数在有界误差内模拟调和量子计算机。首先,如果和谐算符中存在的项数是多项式并且每个绑定算符本身都可以表示为行可计算的O(poly(n))-稀疏矩阵,那么对于所有的s,也可以被表示为行可计算的O(poly(n))-稀疏矩阵也是如此。
如果是行可计算的O(poly)(n)-稀疏矩阵,那么对于任何s,可以使用O(poly(n/∈))门在误差∈内模拟因此,通过使用相位估计,可以使用此模拟的O(1/∈)应用在误差∈和大于2/3的成功概率内模拟特征基础中的测量。因此,可以按需在成本O(poly(n/∈))内实现测量。
接下来,希望能够应用绑定算符来准备初始状态。这可能具有挑战性,因为绑定算符不必是单一的。这可以通过注意以下等式来解决
因此,如果以成本O(poly(n/∈))在误差∈内应用创建算符,则可以准备状态。由于可以表示为O(poly(n))稀疏行可计算矩阵,因此这是可能的。此外,由于此过程必须重复的次数为O(poly(n)),因此也可以通过降低每个单独状态准备中的容错能力,使用O(poly(n))门操作在恒定误差内准备初始状态。由此可知,涉及满足这些假设的调和量子计算机的协议中的每个步骤都可以在量子计算机上有效地模拟。这证明了与证明相反的方向。□
此定理的自然结果是,在多项式上等价于量子计算的格子上还存在量子玻尔兹曼机的模型。以前的工作表明,原则上这种Boltzmann机器很难训练和评估BQP,但没有表明它们是BQP完备的。本公开提供了这样的证据。
A.经典和谐优化的量子优势
如果和谐算符是经典的,那么通常可以合理地相信实现了和谐优化的机器不具有比非确定性图灵机更多的能力。虽然这当然是正确的,但可以使用量子计算机或潜在的量子退火器类别来实现对上面讨论的退火方法的多项式改进。在此公开中,注意力集中在量子计算机的情况上,因为在这种设置中潜在优势的情况更加明显。此处讨论了RD Somma、SBoixo、Howard Barnum和EKnill的先前工作,“Quantum simulations of classicalannealing processes”,物理评论快报,101(13):130504(2008),其表明多项式优势可以对经典退火过程获得,并认为这些加速对于优化问题确实是多项式的,诸如上面检查的那些。
模拟退火的成本强烈取决于相关联的马尔可夫过程的谱间隙。如果考虑一系列逆温度βk,则令δ为对应于温度βk的过渡矩阵的最小谱间隙。此外,令γ是最大和谐状态和下一个最高和谐状态之间的最小间隙,令∈是可容忍的故障概率,并且让该过程发生在具有D配置的空间中。如果β的最终值服从βf∈O(γ-1log(D/∈2)),则模拟退火尺度的复杂性为
量子算法可以用于对此进行改进。最自然的方法是在二部图上用量子游走代替选择新配置的随机过程,其中每个子图对应于系统的不同配置。量子游走的目的是加速混合时间。然而,在此过程中,减小β的退火过程需要在每一步将量子游走投影到游走算符的本征态。这个过程可以使用相位估计来实现,并增加了协议的成本。当适应这些问题时,算法的最终复杂性是
其具有随马尔可夫链的间隙的二次更好缩放并且以对剩余参数更差的缩放为代价。鉴于对于本文公开的应用,这些参数预计比马尔可夫链的间隙呈指数级小,量子提供的改进可能是显著的。
八.学习和谐算符
和谐优化的问题通常是一个具有挑战性的问题。它涉及找出在Fock空间内所有可能的占有集上实现最大和谐的配置。即使对于经典的和谐算符,这个问题也不太可能通过经典或量子解决。可以清楚地看到这一挑战,因为诸如3-SAT之类的二元可满足性问题可以映射到和谐优化问题。因此,如果可以在任意类型的计算机上有效地最大化和谐,则意味着BPP=NP或BQP=NP,在广泛接受的复杂性理论猜想下,这两者都是错误的。这些复杂性理论结果意味着,不能指望贪婪的局部优化器产生全局最大和谐的状态。
局部优化器的缺点可以通过使用诸如模拟退火、量子退火之类的全局优化器或迭代局部搜索来回避。模拟退火是一种受物理学启发的算法,旨在模拟冶金中的退火过程。在我们的上下文中,该算法背后的想法是,给定一个特定的Fock状态|φ>,使用一组预定义动作之一随机改变占用。这一举措产生了新的状态|φ′>,如果和谐得到改善,则该状态被接受,但如果和谐没有通过此举措改善,则该状态仅以与某些常数β>0的eβ(H(|φ′>)-H(|φ>)成正比的概率被拒绝。这使退火能够摆脱局部最优,同时保留许多局部优化的特征。这种方法在第VI节中进行。
A.和谐算符的量子无监督学习
虽然经典和谐函数可能具有针对手头问题的自然构造,但通常难以找到理想地适用于给定语言处理任务的唯一的量子和谐算符。这自然增加了从语言数据推断出量子和谐算符的可能性,然后可以使用该算符来确定给定的句子是否符合语法。在下一小节中,介绍通过监督训练来学习量子和谐算符以解决此问题的示例技术。也就是说,为用户提供了了一个语言及,其产生量子状态向量的副本的预言机,量子状态向量附有指定向量是否符合语法的标签。可以首先预训练量子玻尔兹曼机,以使用学习算法为数据集生成代理,该算法将指派权重以最大化符合语法示例的和谐并且最小化不符合语法示例的和谐。参见,例如Nathan Wiebe、Ashish Kapoor和Krysta MSvore,“Quantum deep learning”,量子信息与计算,16(7-8):541-587(2016);Mohammad HAmin、Evgeny Andriyash、Jason Rolfe、BohdanKulchytskyy和Roger Melko,“Quantum boltzmann machine”,物理评论X,8(2):021050(2018年);Maria Kieferova和Nathan Wiebe,“Tomography and generative trainingwith quantum Boltzmann machines”,物理评论A,96(6):062327(2017)。
这个预训练步骤可以通过应用Maria Kieferova和Nathan Wiebe的工作简单地完成,“Tomography and generative training with quantum Boltzmann machines”,物理评论A,96(6):062327(2017)。这个想法是训练玻尔兹曼机来生成数据集,该数据集在自然统计距离(或散度)方面接近训练数据的分布。要使用的最自然的品质因数是使用戈尔登-汤普森(Golden-Thompson)或相对熵训练的量子相对熵。下面说明了相对熵训练的结果,但同样的结果也适用于戈尔登-汤普森(Golden-Thompson)训练,后者更适合使用潜在变量的情况。
定理3.令|vk>:k=1,...,K为中的的向量,正整数K和n,并且令为一个映射,以使得任何为量子和谐算符。如果假设有预言机F,预言机F在给定时会得到在概率大于2/3的误差∈内估计S(ρ|σ(ω))相对于欧几里得范数中的ω的梯度所需的对F的查询和训练示例的数量是在中。
证明.该证明是Maria Kieferova和Nathan Wiebe定理1的直接结果,“Tomographyand generative training with quantum Boltzmann machines”,物理评论A,96(6):062327(2017)。□
这表明,可以通过在来自目标语言的句子样本上以无监督方式训练量子玻尔兹曼机来学习和谐算符。给定一个和谐算符就很容易生成一个可能的状态解析。您只需准备输入状态向量|vtest>并使用算符对其应用量子相位估计。然后,目标是在和谐阈值κ下找到具有特征值σ的特征向量|σ>,以使得|<σ|vtest>|在满足σ≥κ的条件下最大化。该过程的成功概率取决于κ的值以及输入状态与最大和谐状态的子空间的重叠。
B.和谐算符的量子监督学习
量子和谐算符也可以在监督设置中学习。这种形式的量子玻尔兹曼训练在文献中没有被考虑过,其可以应用到一般的量子玻尔兹曼训练过程。为此,这种训练形式中隐藏单元的可能性也被包括在内。由于梯度不再具有封闭形式,因此在相对熵训练中通常更难训练隐藏单元的权重。
在开始之前,引入一些符号。首先,可以假设和谐算符作所作用的Hilbert空间的形式为其对应于输入|vk>的子系统、用于计算和谐的隐藏单元和标签量子位。在和谐算符的判别训练中,需要将第一音域(register)约束为|vk>。可以通过向以输入|vk>为条件的和谐算符添加惩罚来实现这一点。可以称这种和谐算符为Hk并标示这些约束的强度λ。
用于一组横跨越隐藏状态空间的基向量|σk,j>。最终可以选择这些向量进行对角化H′k。还可以定义任何算符f(k)
例如,如果在|vk>中编码的句子符合语法(最大调和),则否则其为0。用于这种判别训练的自然训练目标是分类准确度。(可以考虑交叉熵,但是这里需要的矩阵对数使得很难找到用于训练目标函数的梯度的解析形式。)可以将这个函数定义为
下面给出此目标函数的梯度。
证明.从乘积规则来看
使用完全相同的参数
虽然上述表达式适用于任何有效的约束惩罚λ,但希望理解玻尔兹曼机在惩罚强度达到无穷大的极限中的性能。幸运的是,可以表明这个极限中每个Hk的特征值和特征向量的形式。这可以使用退化微扰理论来实现。
这意味着如果在Hk中忽略则这是约束算符的本征态。形式上,让我们考虑算符的真实特征值并断言用于Hk的特征值和特征向量的λ-1次幂的泰勒级数。具体来说,对于具有特征值Ek,j的固定特征状态|ψk,j>,在假设特征值和特征向量被选择为λ的可微函数的情况下,将极限取为λ-1→0,|ψk,j>=|vk>|σk,j>+O(1/λ)并且因此
以上结果表明梯度的基本表达式存在,其可以按照和谐算符中的项的约束期望值来表达。
C.学习和谐算符的量子复杂性
本公开现在转向利用定理4的监督学习过程的计算复杂性。可以注意到,尽管与(7)中明确给出的不同地分解为算符的总和的情况下,像(7)这样的调和语法算符也遵守此定理的条件。特别地,该等式中给出的算符n不是单一的。这是因为数字算符计算Fock表示中特定模式的占用情况,因此作为结果遵守n.|0>=0,这显然是非单一的,因为0不是单位向量,但|0>是。然而,可以通过在Pauli-basis中表达n(.)来解决这个问题。特别地,其中Z(.)是作用于相同模式的Pauli-Z运算。由于进行这种替换后且很明显可以重写和谐算符以符合定理4的假设。
推论1.在定理4的假设下,进一步假设对于和谐算符中的每一个,都是单一和厄米,并且在授权访问单一oracle和准备的副本的状态准备oracle Gk的情况下,对这些oracle的查询数量是在O(D2/∈2)中,需要这些数量的查询在概率至少为2/3的欧几里德距离中的误差∈内计算向量,该向量分量为如果定义过程Gk使得Gk|k>|0>=|k>|ψk>,其中|ψk>是的净化,那么查询复杂性可以降低到O(D2/∈)。
证明.实现这一点的算法是建设性的。首先,很容易看出,通过对F的两个查询就有可能构造对状态进行标记的门U——也就是说当且仅当时U|ψ>=-|ψ>,否则U充当身份。通过使用此单一性来应用阿达马(Hadamard)测试并使用oracle Gk生成的状态作为输入,很容易看出您可以从具有以下期望值的随机变量中进行采样:此随机变量的方差最多为1,因为任何投影的范数最多为1。同样,因为是单一的,所以可以以同样的方式使用Hadamard测试从具有以下均值的随机变量中采样:
且其方差最多为1。最后,通过将应用到由Gk得到的状态,可以从方差最多为1的均值的随机变量中采样。根据方差的可加属性,在概率至少2/3的误差δ内估计梯度每个分量所需的样本数至多是电路的O(1/δ2)次重复。为了保证欧几里得范数中的误差最多为∈,取δ=∈/D就足够了。对于Gk产生Gibbs状态的副本的情况,结果如下。
如果提供纯化的吉布斯(Gibbs)状态预言,则通过在K个元素上准备均匀叠加,可以准备形式的状态。如果假设其中A是对应于H′k的域的希尔伯特空间,而B是辅助希尔伯特空间,并且如果将K定义为用于Gk的控制寄存器的希尔伯特空间,则会看到
因此,通过重复涉及Hadamard测试的上述步骤,可以创建单一电路,以使得单个量子位的测量产生具有均值的随机变量
且方差最多为1。最后,通过使用幅度估计,可以使用上述协议的O(D/∈)应用在误差∈/D内提取这些均值。参见Gilles Brassard、Peter Hoyer、Michele Mosca和AlainTapp,“Quantum amplitude amplification and estimation”,当代数学,305:53-74(2002年)。这产生了梯度的一个分量,并且由于有D个分量,因此总查询复杂性如所声称地是O(D2/∈)。□
以下引理是众所周知的,可以在Stephen Boyd和Lieven Vandenberghe,“Convexoptimization”中找到证明,剑桥大学出版社,2004年。
这意味着,对于每一个∈>0,都存在t∈O((L/μ)log(||x(0)-x*||/∈)),以使得||x(t)-x*||≤∈。
使用引理2,然后可以限制梯度下降的迭代次数,这将是找到用于训练目标函数的局部最优值所需的。
定理5.令以使得满足引理2的要求。如果ω*表示在f是强凸的情况下在紧凑区域内和谐算符的最佳权重,并且可以假设存在以使得那么在推论1的假设下,对准备训练数据和准备数据以找到ω′以使得||ω′-ω*||≤∈的方法的查询数量在下式中
因此,从三角不等式还可以得到
为了确保总误差最多为∈,可以选择两种贡献最多为∈/2。然后,初等代数表明它足以选择
如果使用推论1的结果,则所需的总迭代次数是O(D2/δ2)。然而,此过程的成功概率至少为2/3。这意味着,如果每个导数失败的概率可以降低到1/3k,那么协议成功的概率至少是2/3。根据切尔诺夫界,这可以通过使用每个梯度计算的O(log(k))次重复来实现。因此,样本总数为
因此,从(42)和(43)得出,整个协议所需的样本总数缩放为
此结果表明,训练过程中所需的样本数量与目标不确定性成多项式成反比,并且即使在梯度计算中的偏差导致解呈指数发散的最坏情况假设下,这也成立。此外,由于此结果并不明确依赖于函数f的形式(除了保证其凸性和平滑性之外),因此该结果通常也适用于量子玻尔兹曼机的监督训练。
九.其他实施例
在本节中,公开了用于执行所公开技术的示例方法。所描述的特定实施例不应被解释为限制性的,因为所公开的方法动作可以单独地、以不同的顺序或至少部分地彼此同时地执行。此外,任何公开的方法或方法动作可以与本文所公开的任何其他方法或方法动作一起执行。
图6是示出了用于找到被用来对如本文所公开的机器学习算法所训练的量子数据进行建模的玻尔兹曼机的参数梯度的示例方法600的流程图。该示例中的表达式在用于执行酉矩阵的线性组合的定理4中被描述。所图示的过程大多是经典的,但是包括一些量子组分——即,找到两个期望值。
在图7和图8的示例方法700和800中图示了用于找到那些期望值的示例过程。在本文的推论1中特别公开了使用“Hadamard测试”来学习这些期望值的方法。
图13是示出了用于操作量子计算机的示例1300方法的流程图。
在1310处,量子玻尔兹曼机的描述被加载到量子计算机中。
在1312处,根据协议来训练量子玻尔兹曼机,其中分类误差被用作协议的度量。
在进一步的实现中,该方法包括使用惩罚函数来将玻尔兹曼机的可见单元限制(clamp)为输入到协议中的可见单元。
在某些实施例中,利用描述玻尔兹曼机的哈密顿量中的约束项来执行训练。在特定的实现中,哈密顿量将投影交换到标签子空间上。在一些实施例中,量子玻尔兹曼机的描述是在Fock空间表示中。
在特定实施例中,量子计算机是拓扑量子计算设备(例如,使用马约拉纳零模式操作的拓扑量子计算设备)。
十.示例计算环境
图9图示了在其中可以实现所描述的实施例的各方面的合适的经典计算环境900的一般化示例。计算环境900不旨在对所公开技术的使用范围或功能性的任何限制提出任何限制,因为本文所描述的技术和工具可以被实现在具有计算硬件的各种通用或专用环境中。
参考图9,计算环境900包括至少一个处理设备910和存储器920。在图9中,这个最基本的配置930被包括在虚线内。处理设备910(例如,CPU或微处理器)执行计算机可执行指令。在多处理系统中,多个处理设备执行计算机可执行指令以增加处理能力。存储器920可以是易失性存储器(例如,寄存器、高速缓存、RAM、DRAM、SRAM)、非易失性存储器(例如,ROM、EEPROM、闪存)或两者的某种组合。存储器920存储软件980,该就实现用于执行用于操作量子计算机的任何公开技术以执行如本文所描述的任何量子玻尔兹曼技术的工具。存储器920还可以存储软件980,用于合成、生成或编译量子电路以用于执行如本文所描述的所述量子语言处理技术。
计算环境可以具有附加特征。例如,计算环境900包括存储装置940、一个或多个输入设备950、一个或多个输出设备960和一个或多个通信连接970。诸如总线、控制器或网络之类的互连机制(未示出),对计算环境900的组件进行互连。通常,操作系统软件(未示出)为在计算环境900中执行的其他软件提供操作环境,并协调计算环境900的组件的活动。
存储装置940可以是可移动的或不可移动的,并且包括一个或多个磁盘(例如,硬盘驱动器)、固态驱动器(例如,闪存驱动器)、磁带或盒带、CD-ROM、DVD或者任何其他在计算环境900内可以被用来存储信息并且可以被访问的有形非易失性存储介质。存储装置940还可以存储用于实现任何公开的量子语言处理技术的软件980的指令。存储装置940还可以存储用于软件980的指令,用于生成和/或合成任何所描述的技术、系统或量子电路。
(多个)输入设备950可以是诸如键盘、触摸屏、鼠标、笔、轨迹球之类的触摸输入设备、语音输入设备、扫描设备或向计算环境900提供输入的另一设备。(多个)输出设备960可以是显示设备(例如,计算机显示器、膝上型显示器、智能电话显示器、平板显示器、上网本显示器或触摸屏)、打印机、扬声器或提供来自计算环境900的输出的另一个设备。
(多个)通信连接970使得能够通过通信介质与另一个计算实体进行通信。通信介质在调制数据信号中传达诸如计算机可执行指令或其他数据之类的信息。调制数据信号是这样一种信号,它的特性中的一个或多个被设置或改变,以使得对信号中的信息进行编码。作为示例而非限制,通信介质包括利用电、光、RF、红外线、声学或其他载体所实现的有线或无线技术。
如所指出,用于控制量子计算设备执行相位算术的各种方法、技术、电路设计技术或编译/合成技术可以在存储在一个或多个计算机可读介质上的计算机可读指令的一般上下文中进行描述。计算机可读介质是可以在计算环境内或由计算环境访问的任何可用介质(例如,存储器或存储设备)。计算机可读介质包括有形计算机可读存储器或存储设备,诸如存储器920和/或存储装置940,并且不包括传播载波或信号本身(有形计算机可读存储器或存储设备不包括传播载波或信号本身)。
本文所公开的方法的各种实施例也可以在由处理器在计算环境中执行的计算机可执行指令(诸如包括在程序模块中的那些)的一般上下文中进行描述。通常,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、库、对象、类、组件、数据结构等。在各种实施例中,程序模块的功能性可以按照期望的那样在程序模块之间进行组合或进行拆分。用于程序模块的计算机可执行指令可以在本地或分布式计算环境中被执行。
图10中描绘了用于实现根据所公开技术的系统的可能网络拓扑1000(例如,客户端-服务器网络)的示例。联网计算设备1020可以是例如运行浏览器或连接到网络1012的其他软件的计算机。计算设备1020可以具有如图9中所示并且在上面已经讨论过了的计算机架构。计算设备1020不限于传统的个人计算机,而是可以包括被配置为连接到网络1012并与之通信的其他计算硬件(例如,智能电话、膝上型计算机、平板计算机或其他移动计算设备、服务器、网络设备、专用设备等)。此外,计算设备1020可以包括FPGA或其他可编程逻辑设备。在所图示的实施例中,计算设备1020被配置为经由网络1012来与计算设备1030(例如,远程服务器,诸如云计算环境中的服务器)通信。在所图示的实施例中,计算设备1020被配置为向计算设备1030发射输入数据,并且计算设备1030被配置为实现用于控制量子计算设备的技术以执行根据任何公开实施例的任何量子玻尔兹曼技术和/或用于生成用于执行本文公开的任何技术的量子电路的电路生成编译/合成技术。计算设备1030可以向计算设备1020输出结果。从计算设备1030接收的任何数据都可以被存储或显示在计算设备1020上(例如,在计算设备1020处的图形用户界面或网页上显示为数据)。在所图示的实施例中,所图示的网络1012可以被实现为使用有线联网(例如以太网IEEE标准802.3或其他适当标准)或无线联网(例如IEEE标准802.11a、802.11b、802.11g或802.11n或其他适当的标准之一)的局域网(“LAN”)。可替代地,网络1012的至少一部分可以是互联网或类似的公共网络并且使用适当的协议(例如,HTTP协议)进行操作。
图11中描绘了用于实现根据所公开技术的系统的可能网络拓扑1100(例如,分布式计算环境)的另一个示例。联网计算设备1120可以是例如运行浏览器或连接到网络1112的其他软件的计算机。计算设备1120可以具有如图9中所示并且在上面已经讨论过了的计算机架构。在所图示的实施例中,计算设备1120被配置为经由网络1112来与多个计算设备1130、1131、1132(例如,远程服务器或其他分布式计算设备,诸如云计算环境中的一个或多个服务器)通信。在所图示的实施例中,计算环境1100中的计算设备1130、1131、1132中的每一个被用来执行用于控制量子计算设备的技术以执行任何公开的实施例和/或用于生成用于执行本文公开的任何技术的量子电路的电路生成/编译/合成技术的至少一部分。换言之,计算设备1130、1131、1132形成分布式计算环境,其中在多个计算设备上共享用于在如本文所公开的量子计算设备中执行任何技术和/或量子电路生成/编译/合成过程的技术的各方面。计算设备1120被配置为将输入数据发射到计算设备1130、1131、1132,这些计算设备被配置为分布式地实现诸如任何公开方法的执行或任何公开电路的创建的过程,并且提供结果给计算设备1120。从计算设备1130、1131、1132接收的任何数据可以被存储或显示在计算设备1120上(例如,在计算设备1120处的图形用户界面或网页上显示为数据)。所图示的网络1112可以是以上关于图10讨论的任何网络。
参考图12,用于实现所公开技术的示例性系统包括计算环境1200。在计算环境1200中,编译的量子计算机电路描述(包括用于执行如本文所公开的任何公开技术的量子电路)可以被用来编程(或配置)一个或多个量子处理单元,以使得(多个)量子处理单元实现由量子计算机电路描述所描述的电路。
环境1200包括一个或多个量子处理单元1202和一个或多个读出设备1208。(多个)量子处理单元执行由量子计算机电路描述预编译和描述的量子电路。(多个)量子处理单元可以是以下中的一个或多个,但不限于此:(a)超导量子计算机;(b)离子阱量子计算机;(c)用于量子计算的容错架构;和/或(d)拓扑量子架构(例如,使用马约拉纳零模式的拓扑量子计算设备)。
预编译的量子电路,包括任何公开的电路,可以在量子处理器控制器1220的控制下经由控制线1206而被发送到(或以其他方式被应用到)(多个)量子处理单元。量子处理器控制器(QP控制器)1220可以结合经典处理器1210(例如,具有如上文关于图9所述的架构)来操作以实现期望的量子计算过程。在所图示的示例中,QP控制器1220还经由一个或多个QP子控制器1204来实现所期望的量子计算过程,这些子控制器1204特别适用于控制(多个)量子处理器1202中的对应一个。例如,在一个示例中,量子控制器1220通过向一个或多个存储器(例如,低温存储器)发送指令来促进编译的量子电路的实现,该存储器然后将指令传递到(多个)低温控制单元(例如,(多个)QP子控制器1204),低温控制单元例如将代表门的脉冲序列发射到(多个)量子处理单元1202以供实现。在其他示例中,(多个)QP控制器1220和(多个)QP子控制器1204操作来向(多个)量子处理器提供适当的磁场、已编码的操作或其他这种控制信号,以实现编译的量子计算机电路描述的操作。(多个)量子控制器可以进一步与读出设备1208交互以帮助控制和实现期望的量子计算过程(例如,一旦可用,通过从量子处理单元读取或测量出数据结果等)。
参考图12,编译是将量子算法的高级描述翻译成包括一系列量子操作或门的量子计算机电路描述的过程,其可以包括如本文所公开的电路(例如,被配置为执行本文公开的一个或多个过程的电路)。可以由编译器1222使用环境1200的经典处理器1210(例如,如图9中所示)来执行编译,该处理器从存储器或存储设备1212加载高级描述并将所得的量子计算机电路描述存储在存储器或存储设备1212中。
在其他实施例中,编译和/或验证可以由远程计算机1260(例如,具有如上文关于图9所描述的计算环境的计算机)远程执行,远程计算机将所得的量子计算机电路描述存储在一个或多个存储器或存储设备1262中,并将量子计算机电路描述发射到计算环境1200以在(多个)量子处理单元1202中实现。此外,远程计算机1200可以将高级描述存储在存储器或存储设备1262中并将高级描述发射到计算环境1200以供编译和与(多个)量子处理器一起使用。在这些场景中的任何一个中,由(多个)量子处理器执行的计算的结果可以在计算过程之后和/或在计算过程期间被传送到远程计算机。更进一步地,远程计算机可以与(多个)QP控制器1220通信,以使得远程计算机1260可以远程控制量子计算过程(包括任何编译、验证和QP控制过程)。一般来说,远程计算机1260经由通信连接1250来与(多个)QP控制器1220、编译器/合成器1222和/或验证工具1223通信。
在特定实施例中,环境1200可以是云计算环境,其通过合适的网络(其可以包括互联网)将环境1200的量子处理资源提供给一个或多个远程计算机(诸如远程计算机1260)。
十一.结束语
在这项工作中,考虑了如何将计算语言学中的某些问题最好地拟合到量子计算机上的问题。在这样做时,呈现了一种用于表示语言处理的新形式体系的实施例,被称为Fock空间表示,其优点是可以很容易以少量量子位进行编码(与张量积表示不同)。然后开发了用于这种表示中的调和语法的形式体系,包括将其推广到经典语法之外的方式。所公开的这个量子情况与量子纠错码相关,而且不能在经典计算机上有效解决——除非P=BQP,这意味着结果可以潜在地提供指数加速以用于评估量子和谐算符,除非经典计算机至多在多项式上比量子计算机弱。在这样做时,还提供了用于训练量子玻尔兹曼机的新方法,这些方法对当前的语言处理应用具有独立的价值。最后,通过示出Fock空间表示如何与经典优化方法相结合,如何可以被用来在普通计算机上非常快速地解析语法相对复杂的句子,来说明了Fock空间表示的效用。
已经参考所图示的实施例描述和说明了所公开技术的原理,应当认识到,在不脱离这些原理的情况下,可以在布置和细节上修改所图示的实施例。例如,以软件示出的所图示的实施例的元件可以以硬件来实现,反之亦然。此外,来自任何示例的技术可以与在任何一个或多个其他示例中描述的技术相组合。应当了解,诸如参考所图示的示例描述的那些过程和功能可以被实现在单个硬件或软件模块中,或者可以提供分开的模块。提供上述特定布置是为了方便说明,并且可以使用其他布置。
Claims (12)
1.一种操作量子计算机的方法,包括:
将量子玻尔兹曼机的描述加载到所述量子计算机中;
根据协议来训练所述量子玻尔兹曼机,其中分类误差被用作针对所述协议的度量;以及
使用惩罚函数将所述玻尔兹曼机的可视单元限制为输入到所述协议中的可视单元。
2.根据权利要求1所述的方法,其中所述训练利用描述所述玻尔兹曼机的哈密顿量中的约束项而被执行。
3.根据权利要求2所述的方法,其中所述哈密顿量将投影算子交换到标签子空间上。
4.根据权利要求1所述的方法,其中所述量子玻尔兹曼机的所述描述是在福克空间表示中。
5.根据权利要求1所述的方法,其中所述量子计算机是拓扑量子计算设备。
6.根据权利要求5所述的方法,其中所述拓扑量子计算设备使用马约拉纳零模式操作。
7.一种系统,包括:
量子计算系统;以及
经典计算机,所述经典计算机被配置为根据以下方法来控制所述量子计算系统,所述方法包括:
将量子玻尔兹曼机的描述加载到所述量子计算机中;
根据协议来训练所述量子玻尔兹曼机,其中分类误差被用作针对所述协议的度量;以及
使用惩罚函数将玻尔兹曼机的可视单元限制为输入到所述协议中的可视单元。
8.根据权利要求7所述的系统,其中所述训练利用描述所述玻尔兹曼机的哈密顿量中的约束项而被执行。
9.根据权利要求8所述的系统,其中所述哈密顿量将投影算子交换到标签子空间上。
10.根据权利要求7所述的系统,其中所述量子玻尔兹曼机的所述描述是在福克空间表示中。
11.根据权利要求7所述的系统,其中所述量子计算机是拓扑量子计算设备。
12.根据权利要求11所述的系统,其中所述量子计算系统是使用马约拉纳零模式操作的拓扑量子计算设备。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962804576P | 2019-02-12 | 2019-02-12 | |
US62/804,576 | 2019-02-12 | ||
US16/446,511 | 2019-06-19 | ||
US16/446,511 US11783222B2 (en) | 2019-02-12 | 2019-06-19 | Quantum algorithms for supervised training of quantum boltzmann machines |
PCT/US2020/015516 WO2020167466A1 (en) | 2019-02-12 | 2020-01-29 | Quantum algorithms for supervised training of quantum boltzmann machines |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113412492A true CN113412492A (zh) | 2021-09-17 |
Family
ID=69740624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080013408.6A Pending CN113412492A (zh) | 2019-02-12 | 2020-01-29 | 用于量子玻尔兹曼机的监督训练的量子算法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11783222B2 (zh) |
EP (1) | EP3924886A1 (zh) |
CN (1) | CN113412492A (zh) |
WO (1) | WO2020167466A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116775849A (zh) * | 2023-08-23 | 2023-09-19 | 成都运荔枝科技有限公司 | 一种线上问题处理系统及方法 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11558069B1 (en) * | 2018-09-13 | 2023-01-17 | PsiQuantum Corp. | Conversion of Pauli errors to erasure errors in a photonic quantum computing system |
US12067456B2 (en) * | 2019-11-19 | 2024-08-20 | Arizona Board Of Regents On Behalf Of The University Of Arizona | Entanglement-enhanced machine learning with quantum data acquisition |
US11537927B2 (en) * | 2020-02-14 | 2022-12-27 | International Business Machines Corporation | Quantum readout error mitigation by stochastic matrix inversion |
US11200360B1 (en) | 2020-06-10 | 2021-12-14 | International Business Machines Corporation | Synthesis of a quantum circuit |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6678450B1 (en) * | 1998-04-24 | 2004-01-13 | The Johns Hopkins University | Optical method for quantum computing |
US20180165601A1 (en) * | 2016-12-08 | 2018-06-14 | Microsoft Technology Licensing, Llc | Tomography and generative data modeling via quantum boltzmann training |
US20180308007A1 (en) * | 2015-10-16 | 2018-10-25 | D-Wave Systems Inc. | Systems and methods for creating and using quantum boltzmann machines |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107004162A (zh) * | 2014-12-05 | 2017-08-01 | 微软技术许可有限责任公司 | 量子深度学习 |
WO2017214293A1 (en) * | 2016-06-08 | 2017-12-14 | D-Wave Systems Inc. | Systems and methods for quantum computation |
DE102017002616A1 (de) * | 2017-03-20 | 2018-09-20 | Forschungszentrum Jülich GmbH | Verfahren zur in-situ Herstellung von "Majorana-Materialien - Supraleiter" Hybridnetzwerken, sowie eine durch das Verfahren hergestellte Hybridstruktur |
KR102071582B1 (ko) * | 2017-05-16 | 2020-01-30 | 삼성전자주식회사 | 딥 뉴럴 네트워크(Deep Neural Network)를 이용하여 문장이 속하는 클래스(class)를 분류하는 방법 및 장치 |
WO2019157228A1 (en) * | 2018-02-09 | 2019-08-15 | D-Wave Systems Inc. | Systems and methods for training generative machine learning models |
-
2019
- 2019-06-19 US US16/446,511 patent/US11783222B2/en active Active
-
2020
- 2020-01-29 EP EP20708825.3A patent/EP3924886A1/en active Pending
- 2020-01-29 WO PCT/US2020/015516 patent/WO2020167466A1/en unknown
- 2020-01-29 CN CN202080013408.6A patent/CN113412492A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6678450B1 (en) * | 1998-04-24 | 2004-01-13 | The Johns Hopkins University | Optical method for quantum computing |
US20180308007A1 (en) * | 2015-10-16 | 2018-10-25 | D-Wave Systems Inc. | Systems and methods for creating and using quantum boltzmann machines |
US20180165601A1 (en) * | 2016-12-08 | 2018-06-14 | Microsoft Technology Licensing, Llc | Tomography and generative data modeling via quantum boltzmann training |
Non-Patent Citations (1)
Title |
---|
M.L.DALLA CHIARA等: "Quantum Computational Semantics on Fock Space", 《INTERNATIONAL JOURNAL OF THEORETICAL PHYSICS》, vol. 44, no. 12, 28 December 2005 (2005-12-28), pages 2223, XP037852352, DOI: 10.1007/s10773-005-8017-z * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116775849A (zh) * | 2023-08-23 | 2023-09-19 | 成都运荔枝科技有限公司 | 一种线上问题处理系统及方法 |
CN116775849B (zh) * | 2023-08-23 | 2023-10-24 | 成都运荔枝科技有限公司 | 一种线上问题处理系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2020167466A1 (en) | 2020-08-20 |
EP3924886A1 (en) | 2021-12-22 |
US20210065037A1 (en) | 2021-03-04 |
US11783222B2 (en) | 2023-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gao et al. | A quantum machine learning algorithm based on generative models | |
Ganea et al. | Hyperbolic neural networks | |
Ghosh et al. | The journey of graph kernels through two decades | |
Huang et al. | Gamepad: A learning environment for theorem proving | |
Cohen et al. | Tensorlog: A probabilistic database implemented using deep-learning infrastructure | |
CN113412492A (zh) | 用于量子玻尔兹曼机的监督训练的量子算法 | |
US20220164626A1 (en) | Automated merge conflict resolution with transformers | |
Wiebe et al. | Quantum language processing | |
Howard et al. | Learning to simulate high energy particle collisions from unlabeled data | |
Zhang et al. | PS-Tree: A piecewise symbolic regression tree | |
Huynh et al. | Quantum-inspired machine learning: a survey | |
Sivakumar et al. | GenerativeMTD: A deep synthetic data generation framework for small datasets | |
Luongo | Quantum algorithms for data analysis | |
Ruskanda et al. | Simple sentiment analysis ansatz for sentiment classification in quantum natural language processing | |
Serratosa | A general model to define the substitution, insertion and deletion graph edit costs based on an embedded space | |
Kissas et al. | The language of hyperelastic materials | |
Sekiyama et al. | Automated proof synthesis for the minimal propositional logic with deep neural networks | |
CN116629361A (zh) | 基于本体学习和注意力机制的知识推理方法 | |
Emerson et al. | Variational inference for logical inference | |
KR20230132186A (ko) | 딥러닝 기반 분자 설계 방법, 이를 수행하는 장치 및 컴퓨터 프로그램 | |
Boutaib et al. | Path classification by stochastic linear recurrent neural networks | |
Le | Algorithmic and theoretical aspects of sparse deep neural networks | |
Griffith | Essential reservoir computing | |
Guo et al. | TransI: Translating infinite dimensional embeddings based on trend smooth distance | |
Fu et al. | Fact Discovery from Knowledge Base via Facet Decomposition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |