CN114372584B - 基于机器学习框架的迁移学习方法及相关装置 - Google Patents
基于机器学习框架的迁移学习方法及相关装置 Download PDFInfo
- Publication number
- CN114372584B CN114372584B CN202210282328.1A CN202210282328A CN114372584B CN 114372584 B CN114372584 B CN 114372584B CN 202210282328 A CN202210282328 A CN 202210282328A CN 114372584 B CN114372584 B CN 114372584B
- Authority
- CN
- China
- Prior art keywords
- quantum
- machine learning
- classical
- feature extractor
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 154
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000013526 transfer learning Methods 0.000 title claims abstract description 15
- 230000006870 function Effects 0.000 claims description 36
- 238000005259 measurement Methods 0.000 claims description 27
- 239000002096 quantum dot Substances 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 15
- 238000013508 migration Methods 0.000 claims description 15
- 230000005012 migration Effects 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000005283 ground state Effects 0.000 description 9
- 238000012549 training Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000001133 acceleration Effects 0.000 description 4
- 238000004806 packaging method and process Methods 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 241000282373 Panthera pardus Species 0.000 description 1
- 101150040210 allR gene Proteins 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000001617 migratory effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N10/00—Quantum computing, i.e. information processing based on quantum-mechanical phenomena
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computational Mathematics (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Optical Modulation, Optical Deflection, Nonlinear Optics, Optical Demodulation, Optical Logic Elements (AREA)
Abstract
本发明公开了一种基于机器学习框架的迁移学习方法及相关装置,本发明通过调用经典模块基于求解源任务的第一机器学习模型构建经典特征提取器,以及调用量子模块构建量子特征提取器;构建包括所述经典特征提取器和所述量子特征提取器的第二机器学习模型;将目标数据输入至所述第二机器学习模型以实现目标任务的求解,所述目标任务与所述源任务相关联,有利于提高迁移学习模型的运行速度。
Description
技术领域
本发明属于量子计算技术领域,特别是涉及一种基于机器学习框架的迁移学习方法及相关装置。
背景技术
机器学习的准确性基于对大量的样本数据进行学习,然而现实中常常存在目标任务样本量不足的情况,受到生物智能的启发,机器学习引入了迁移学习。迁移学习是指一种学习对另一种学习的影响,或习得的经验对完成其他活动的影响。例如我们学习第二语言并不是从零开始,而是利用之前的语言知识;又例如,用来辨识汽车的知识也可以用来提升识别卡车的能力。
经典的迁移学习是选择一个与目标任务关联的源任务的机器学习模型,然后对该机器学习模型进行微调,以使得其适应目标任务。经典的迁移学习机器模型运行速度慢,难以满足日益对结果实时性的要求。
发明内容
本发明的目的是提供一种基于机器学习框架的迁移学习方法及相关装置,旨在提高迁移学习模型的运行速度。
本发明的一个实施例提供了一种基于机器学习框架的迁移学习方法,所述机器学习框架包括经典模块和量子模块,所述方法包括:
调用所述经典模块基于求解源任务的第一机器学习模型构建经典特征提取器,以及调用所述量子模块构建量子特征提取器;
构建包括所述经典特征提取器和所述量子特征提取器的第二机器学习模型;
将目标数据输入至所述第二机器学习模型以实现目标任务的求解,所述目标任务与所述源任务相关联。
可选的,所述调用所述经典模块基于求解源任务的第一机器学习模型构建经典特征提取器,包括:
获取训练好的求解源任务的第一机器学习模型,以及删除所述第一机器学习模型中与所述目标任务无关的经典神经网络层,得到经典特征提取器。
可选的,所述量子模块包括量子态编码逻辑门单元、量子态演化逻辑门单元和量子测量子模块;所述调用所述量子模块构建量子特征提取器,包括:
调用所述量子态编码逻辑门单元构建数据编码量子线路,所述数据编码量子线路用于将所述经典特征提取器的输出编码至量子比特的初始态;
调用所述量子态演化逻辑门单元构建可变分量子线路,所述可变分量子线路用于将所述初始态演化至目标态;
调用所述量子测量子模块构建测量量子线路,所述测量量子线路用于测量所述量子比特,得到所述目标数据的特征。
可选的,所述调用所述量子态演化逻辑门单元构建可变分量子线路,包括:
调用所述量子态演化逻辑门单元构建嵌入层、旋转层和纠缠层,以及将所述嵌入层、所述旋转层和所述纠缠层级联,得到可变分量子线路,所述嵌入层用于将所述初始态演化为叠加态,所述旋转层用于将所述叠加态演化为随机态,所述纠缠层用于使多个所述随机态产生纠缠,得到目标态。
可选的,所述嵌入层包括H门,所述旋转层包括单量子旋转逻辑门,所述纠缠层包括CNOT门,所述单量子旋转逻辑门包括以下至少一个:RX门、RY门、RZ门。
可选的,所述量子模块还包括数据结构模块,所述构建包括所述经典特征提取器和所述量子特征提取器的第二机器学习模型,包括:
调用所述经典模块构建经典分类器,所述经典分类器用于基于所述量子特征提取器的输出对所述目标数据进行分类;
调用所述数据结构模块将所述经典特征提取器、所述量子特征提取器和所述经典分类器依次进行级联,得到第二机器学习模型。
可选的,所述经典模块还包括损失函数单元和优化器单元,所述将目标数据输入至所述第二机器学习模型以实现目标任务的求解之前,所述方法还包括:
调用所述损失函数单元计算所述第二机器学习模型的损失函数;
调用所述优化器单元基于所述损失函数更新所述量子特征提取器的参数,以对所述第二机器学习模型进行优化。
本发明的又一实施例提供了一种基于机器学习框架的迁移学习装置,所述机器学习框架包括经典模块和量子模块,所述装置包括:
模型构建单元,用于调用所述经典模块基于求解源任务的第一机器学习模型构建经典特征提取器,以及调用所述量子模块构建量子特征提取器;
所述模型构建单元,还用于构建包括所述经典特征提取器和所述量子特征提取器的第二机器学习模型;
模型运行单元,用于将目标数据输入至所述第二机器学习模型以实现目标任务的求解,所述目标任务与所述源任务相关联。
可选的,在所述调用所述经典模块基于求解源任务的第一机器学习模型构建经典特征提取器方面,所述模型构建单元,具体用于:
获取训练好的求解源任务的第一机器学习模型,以及删除所述第一机器学习模型中与所述目标任务无关的经典神经网络层,得到经典特征提取器。
可选的,所述量子模块包括量子态编码逻辑门单元、量子态演化逻辑门单元和量子测量子模块;在所述调用所述量子模块构建量子特征提取器方面,所述模型构建单元,具体用于:
调用所述量子态编码逻辑门单元构建数据编码量子线路,所述数据编码量子线路用于将所述经典特征提取器的输出编码至量子比特的初始态;
调用所述量子态演化逻辑门单元构建可变分量子线路,所述可变分量子线路用于将所述初始态演化至目标态;
调用所述量子测量子模块构建测量量子线路,所述测量量子线路用于测量所述量子比特,得到所述目标数据的特征。
可选的,在所述调用所述量子态演化逻辑门单元构建可变分量子线路方面,所述模型构建单元,具体用于:
调用所述量子态演化逻辑门单元构建嵌入层、旋转层和纠缠层,以及将所述嵌入层、所述旋转层和所述纠缠层级联,得到可变分量子线路,所述嵌入层用于将所述初始态演化为叠加态,所述旋转层用于将所述叠加态演化为随机态,所述纠缠层用于使多个所述随机态产生纠缠,得到目标态。
可选的,所述嵌入层包括H门,所述旋转层包括单量子旋转逻辑门,所述纠缠层包括CNOT门,所述单量子旋转逻辑门包括以下至少一个:RX门、RY门、RZ门。
可选的,所述量子模块还包括数据结构模块,在所述构建包括所述经典特征提取器和所述量子特征提取器的第二机器学习模型方面,所述模型构建单元,具体用于:
调用所述经典模块构建经典分类器,所述经典分类器用于基于所述量子特征提取器的输出对所述目标数据进行分类;
调用所述数据结构模块将所述经典特征提取器、所述量子特征提取器和所述经典分类器依次进行级联,得到第二机器学习模型。
可选的,所述经典模块还包括损失函数单元和优化器单元,在所述将目标数据输入至所述第二机器学习模型以实现目标任务的求解之前,所述装置还包括模型训练单元,所述模型训练单元用于:
调用所述损失函数单元计算所述第二机器学习模型的损失函数;
调用所述优化器单元基于所述损失函数更新所述量子特征提取器的参数,以对所述第二机器学习模型进行优化。
本发明的又一实施例提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项中所述的方法。
本发明的又一实施例提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项中所述的方法。
与现有技术相比,本发明通过调用经典模块基于求解源任务的第一机器学习模型构建经典特征提取器,以及调用量子模块构建量子特征提取器;构建包括该经典特征提取器和该量子特征提取器的第二机器学习模型;实现了将用于求解源任务的第一机器学习模型迁移用于求解目标任务的第二机器学习模型,同时,由于第二机器学习模型包括量子特征提取器,利用量子叠加的特性,可以实现第二机器学习模型运行时的加速,从而提高迁移学习模型的运行速度。
附图说明
图1为本发明实施例提供的一种基于机器学习框架的迁移学习方法的计算机终端的硬件结构框图;
图2为本发明实施例提供的一种基于机器学习框架的迁移学习方法的流程示意图;
图3为本发明实施例提供的一种第二机器学习模型的结构示意图;
图4为本发明实施例提供的一种可变分量子线路的结构示意图;
图5为本发明实施例提供的另一种可变分量子线路的结构示意图;
图6为本发明实施例提供的一种基于机器学习框架的迁移学习装置的结构示意图。
具体实施方式
下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本发明实施例首先提供了一种基于机器学习框架的迁移学习方法,该方法可以应用于电子设备,如计算机终端,具体如普通电脑、量子计算机等。
下面以运行在计算机终端上为例对其进行详细说明。图1为本发明实施例提供的一种基于机器学习框架的迁移学习方法的计算机终端的硬件结构框图。如图1所示,计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储基于机器学习框架的迁移学习方法的存储器104,可选地,上述计算机终端还可以包括用于通信功能的传输装置106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的基于机器学习框架的迁移学习方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
需要说明的是,真正的量子计算机是混合结构的,它包含两大部分:一部分是经典计算机,负责执行经典计算与控制;另一部分是量子设备,负责运行量子程序进而实现量子计算。而量子程序是由量子语言如QRunes语言编写的一串能够在量子计算机上运行的指令序列,实现了对量子逻辑门操作的支持,并最终实现量子计算。具体的说,量子程序就是一系列按照一定时序操作量子逻辑门的指令序列。
在实际应用中,因受限于量子设备硬件的发展,通常需要进行量子计算模拟以验证量子算法、量子应用等等。量子计算模拟即借助普通计算机的资源搭建的虚拟架构(即量子虚拟机)实现特定问题对应的量子程序的模拟运行的过程。通常,需要构建特定问题对应的量子程序。本发明实施例所指量子程序,即是经典语言编写的表征量子比特及其演化的程序,其中与量子计算相关的量子比特、量子逻辑门等等均有相应的经典代码表示。
量子线路作为量子程序的一种体现方式,也称量子逻辑电路,是最常用的通用量子计算模型,表示在抽象概念下对于量子比特进行操作的线路,其组成包括量子比特、线路(时间线)、以及各种量子逻辑门,最后常需要通过量子测量操作将结果读取出来。
不同于传统电路是用金属线所连接以传递电压信号或电流信号,在量子线路中,线路可看成是由时间所连接,亦即量子比特的状态随着时间自然演化,在这过程中按照哈密顿运算符的指示,一直到遇上逻辑门而被操作。
一个量子程序整体上对应有一条总的量子线路,本发明所述量子程序即指该条总的量子线路,其中,该总的量子线路中的量子比特总数与量子程序的量子比特总数相同。可以理解为:一个量子程序可以由量子线路、针对量子线路中量子比特的测量操作、保存测量结果的寄存器及控制流节点(跳转指令)组成,一条量子线路可以包含几十上百个甚至成千上万个量子逻辑门操作。量子程序的执行过程,就是对所有的量子逻辑门按照一定时序执行的过程。需要说明的是,时序即单个量子逻辑门被执行的时间顺序。
需要说明的是,经典计算中,最基本的单元是比特,而最基本的控制模式是逻辑门,可以通过逻辑门的组合来达到控制电路的目的。类似地,处理量子比特的方式就是量子逻辑门。使用量子逻辑门,能够使量子态发生演化,量子逻辑门是构成量子线路的基础,量子逻辑门包括单比特量子逻辑门,如Hadamard门(H门,阿达马门)、泡利-X门(X门)、泡利-Y门(Y门)、泡利-Z门(Z门)、RX门、RY门、RZ门等等;多比特量子逻辑门,如CNOT门、CR门、iSWAP门、Toffoli门等等。量子逻辑门一般使用酉矩阵表示,而酉矩阵不仅是矩阵形式,也是一种操作和变换。一般量子逻辑门在量子态上的作用是通过酉矩阵左乘以量子态右矢对应的矩阵进行计算。
参见图2,图2为本发明实施例提供的一种基于机器学习框架的迁移学习方法的流程示意图,所述机器学习框架包括经典模块和量子模块,所述方法包括:
步骤201:调用所述经典模块基于求解源任务的第一机器学习模型构建经典特征提取器,以及调用所述量子模块构建量子特征提取器;
步骤202:构建包括所述经典特征提取器和所述量子特征提取器的第二机器学习模型;
步骤203:将目标数据输入至所述第二机器学习模型以实现目标任务的求解,所述目标任务与所述源任务相关联。
其中,在迁移学习中,已有的知识称为源域,源任务可以基于已有的知识求解;要学习的新知识称为目标域,目标任务需要用学习的新知识求解。目标任务与源任务相关联,是指两者具有一定的相似性。
其中,机器学习框架集成了众多用于创建和训练机器学习模型的函数集,通过其定义的接口可以方便的调用函数集中的函数实现对机器学习模型的相关操作。
机器学习框架包括的上述量子模块可以被配置为创建机器学习模型中的量子计算层,量子计算层为包含量子程序的程序模块,可以用于实现对应量子程序的量子计算,通过对量子程序按照一定的标准进行封装得到量子计算层,便于在创建和训练机器学习模型时进行使用。量子程序为实现量子计算的程序,可以通过调用量子模块创建按特定顺序作用于量子比特的量子逻辑门得到量子程序,并对量子程序进行封装得到量子计算层。量子计算层包括上述的量子特征提取器。
机器学习框架包括的上述经典模块可以被配置为创建机器学习模型的经典计算层,经典计算层为机器学习模型中的经典计算部分,其可以是通过经典模块对创建好的经典计算程序按照一定标准进行封装得到,使得经典计算层便于在训练机器学习模型时进行使用。经典计算层包括上述的经典特征提取器。如图3所示,图3为本发明实施例提供的一种第二机器学习模型的结构示意图。
在创建好量子计算层和经典计算层后,可以通过经典模块对其进行封装,创建符合一定标准的抽象类层,抽象类层通过编程语言中的类(class)的方法实现,通过对量子计算层和经典计算层封装以创建符合一定标准的机器学习模型,例如创建的抽象类层定义了正向运算机器学习模型的方式,当然也可以只对量子计算层或经典计算层进行封装,抽象类层通过封装便于在训练机器学习模型时对机器学习模型进行正向运算以得到用于计算损失函数的计算结果,同时也可以得到反向计算时进行梯度计算的顺序关系。经典模块还可以用于创建机器学习模型的训练层对机器学习模型进行训练。
具体地,将目标数据输入至所述第二机器学习模型以实现目标任务的求解,可以是直接将第二机器学习模型的输出作为求解目标任务得到的结果,也可以是基于第二机器学习模型的输出进一步后处理,将后处理得到的结果作为求解目标任务得到的结果,在此不作限定。
与现有技术相比,本发明通过调用经典模块基于求解源任务的第一机器学习模型构建经典特征提取器,以及调用量子模块构建量子特征提取器;构建包括该经典特征提取器和该量子特征提取器的第二机器学习模型;实现了将用于求解源任务的第一机器学习模型迁移用于求解目标任务的第二机器学习模型,同时,由于第二机器学习模型包括量子特征提取器,利用量子叠加的特性,可以实现第二机器学习模型运行时的加速,从而提高迁移学习模型的运行速度。
可选的,在所述调用所述经典模块基于求解源任务的第一机器学习模型构建经典特征提取器方面,包括:
获取训练好的求解源任务的第一机器学习模型,以及删除所述第一机器学习模型中与所述目标任务无关的经典神经网络层,得到经典特征提取器。
可选的,在所述调用所述经典模块基于求解源任务的第一机器学习模型构建经典特征提取器方面,另一具体实现方式还可以为:
获取训练好的求解源任务的第一机器学习模型,将所述第一机器学习模型作为经典特征提取器。
需要说明的是,获取训练好的求解源任务的第一机器学习模型之后,是直接将所述第一机器学习模型作为经典特征提取器,还是删除所述第一机器学习模型中与所述目标任务无关的经典神经网络层,得到经典特征提取器,需要基于所述第一机器学习模型中是否有与所述目标任务无关的经典神经网络层进行判断。
举例说明,例如第一机器学习模型是用来执行源任务——识别猫,而第二机器学习模型是用来执行目标任务——识别狸花猫,那么可以直接将所述第一机器学习模型作为经典特征提取器;又例如第一机器学习模型是用来执行源任务——识别猫,而第二机器学习模型是用来执行目标任务——识别豹,则需要删除所述第一机器学习模型中与所述目标任务无关的经典神经网络层,得到经典特征提取器。
在本发明实施例中,通过选择训练好的求解源任务的第一机器学习模型,后期模型训练阶段,不需要再对经典特征提取器进行训练;同时,删除所述第一机器学习模型中与所述目标任务无关的经典神经网络层,得到经典特征提取器,实现了经典特征提取器的构建。
可选的,所述量子模块包括量子态编码逻辑门单元、量子态演化逻辑门单元和量子测量子模块;所述调用所述量子模块构建量子特征提取器,包括:
调用所述量子态编码逻辑门单元构建数据编码量子线路,所述数据编码量子线路用于将所述经典特征提取器的输出编码至量子比特的初始态;
调用所述量子态演化逻辑门单元构建可变分量子线路,所述可变分量子线路用于将所述初始态演化至目标态;
调用所述量子测量子模块构建测量量子线路,所述测量量子线路用于测量所述量子比特,得到所述目标数据的特征。
其中,所述量子模块包括量子逻辑门子模块和量子测量子模块,所述量子逻辑门子模块包括量子态编码逻辑门单元和量子态演化逻辑门单元。
其中,所述数据编码量子线路可以为以下其中一种:基态编码量子线路、幅度编码量子线路、角度编码量子线路、瞬时量子多项式IQP(Instantaneous Quantum Polynomial)编码线路。
具体来讲,基态相对于任意量子态,相当于基向量相对于任意向量。例如,对于量子态,其中和为基态,对于量子态,其中为基态。基态编码量子线路用于将输入数据编码至量子比特的量子态中的基态。例如对于输入数据5,其二进制码为101,进而可以将其编码至量子比特的量子态中的基态。
具体来讲,角度编码量子线路中包括含参量子逻辑门,例如可以为RX旋转门、RY旋转门和RZ旋转门中的任意一者。对输入数据进行反三角函数变换,将变换得到的角度作为旋转门的旋转角度参数,从而实现对输入数据的编码。
具体来讲,IQP编码指的是通过创建IQP编码线路的逻辑门作用于指定量子比特得到IQP编码线路,并将输入数据作为该IQP编码线路的参数,运行该IQP编码线路可以将输入数据x编码至量子态,其中,x为张量数据,H为上述H门,n为指定量子比特的数量,表示n个指定量子比特的初始量子态均为,r表示的重复次数,如下:
其中,测量量子线路即测量操作,根据测量得到的目标量子态确定不同基态出现的概率,或者不同基态出现的次数,又或者目标观测量的期望值。上述概率、次数、期望可以用于表示局部特征。
可选的,所述调用所述量子态演化逻辑门单元构建可变分量子线路,包括:
调用所述量子态演化逻辑门单元构建嵌入层、旋转层和纠缠层,以及将所述嵌入层、所述旋转层和所述纠缠层级联,得到可变分量子线路,所述嵌入层用于将所述初始态演化为叠加态,所述旋转层用于将所述叠加态演化为随机态,所述纠缠层用于使多个所述随机态产生纠缠,得到目标态。如图4所示,图4为本发明实施例提供的一种可变分量子线路的结构示意图。
其中,嵌入层、旋转层和纠缠层各层的数量可以是一层、两层或多层,嵌入层、旋转层和纠缠层每层可以包括一个量子逻辑门、两个量子逻辑门或者多个量子逻辑门,每层包括的量子逻辑门可以相同也可以不同,在此,均不做限定。
其中,旋转层包括的量子逻辑门例如可以是单量子旋转逻辑门,如RX门、RY门、RZ门,也可以是绕任意轴旋转的旋转逻辑门。
其中,纠缠层包括的量子逻辑门可以是双量子逻辑门,如受控门CNOT门、受控旋转门等,也可以是多量子逻辑门,如Toffoli门等。
在本发明的一具体实施例中,所述嵌入层包括H门,所述旋转层包括单量子旋转逻辑门,所述纠缠层包括CNOT门,所述单量子旋转逻辑门包括以下至少一个:RX门、RY门、RZ门。
如图5所示,图5为本发明实施例提供的另一种可变分量子线路的结构示意图。所述可变分量子线路包括4个量子比特;嵌入层包括4个H门,4个H门分别作用于4个量子比特上;旋转层包括4个RY门,4个RY门分别作用于4个量子比特上;纠缠层包括3个CNOT门,3个CNOT门依次作用于和、和、和上。所述可变分量子线路包括1个嵌入层、4个旋转层和3个纠缠层,按照旋转层—纠缠层—旋转层的顺序交替连接。
可选的,所述量子模块还包括数据结构模块,所述构建包括所述经典特征提取器和所述量子特征提取器的第二机器学习模型,包括:
调用所述经典模块构建经典分类器,所述经典分类器用于基于所述量子特征提取器的输出对所述目标数据进行分类;
调用所述数据结构模块将所述经典特征提取器、所述量子特征提取器和所述经典分类器依次进行级联,得到第二机器学习模型。
具体来讲,机器学习框架包括的上述数据结构模块定义了张量数据的数据结构,通过调用数据结构模块,可以将输入的数据转化为张量数据,以用于输入机器学习模型进行正向计算。当然,数据结构模块还可以被配置为对张量数据执行运算,例如数据结构模块还可以定义张量数据之间的数学运算和逻辑运算等,进而可以调用数据结构模块基于张量数据之间的运算关系创建机器学习模型的经典计算层,例如经典神经网络的全连接层通过函数y=w*x+b定义了输入全连接层的数据x和输出全连接层的数据y之间的关系,其中w和b为参数,通过将数据x、参数w、参数b转化为张量数据,并调用数据结构模块对这些张量数据执行与该函数对应的运算,可以构建全连接层。
其中,经典分类器例如可以为全连接层,全连接层用于基于所述量子特征提取器的输出,即目标数据的特征x,进行分类。其中,调用所述数据结构模块将所述经典特征提取器、所述量子特征提取器和所述经典分类器依次进行级联,即通过调用数据结构模块中的赋值函数将经典特征提取器的输出赋值给量子特征提取器的输入,然后将量子特征提取器的输出赋值给经典分类器的输入,实现三者的级联。
可选的,所述经典模块还包括损失函数单元和优化器单元,所述将目标数据输入至所述第二机器学习模型以实现目标任务的求解之前,所述方法还包括:
调用所述损失函数单元计算所述第二机器学习模型的损失函数;
调用所述优化器单元基于所述损失函数更新所述量子特征提取器的参数,以对所述第二机器学习模型进行优化。
其中,所述损失函数例如可以是SoftmaxCrossEntropy函数,所述优化器例如可以是基于Adam优化函数的优化器。
在本发明实施例中,通过基于所述损失函数更新所述量子特征提取器的参数,以对所述第二机器学习模型进行优化,不需要对整个第二机器学习模型全部进行优化训练,减少了对训练数据的需求,实现了训练过程的加速。
参见图6,图6为本发明实施例提供的一种基于机器学习框架的迁移学习装置的结构示意图,所述机器学习框架包括经典模块和量子模块,所述装置包括:
模型构建单元601,用于调用所述经典模块基于求解源任务的第一机器学习模型构建经典特征提取器,以及调用所述量子模块构建量子特征提取器;
所述模型构建单元601,还用于构建包括所述经典特征提取器和所述量子特征提取器的第二机器学习模型;
模型运行单元602,用于将目标数据输入至所述第二机器学习模型以实现目标任务的求解,所述目标任务与所述源任务相关联。
可选的,在所述调用所述经典模块基于求解源任务的第一机器学习模型构建经典特征提取器方面,包括:
获取训练好的求解源任务的第一机器学习模型,以及删除所述第一机器学习模型中与所述目标任务无关的经典神经网络层,得到经典特征提取器。
可选的,所述量子模块包括量子态编码逻辑门单元、量子态演化逻辑门单元和量子测量子模块;在所述调用所述量子模块构建量子特征提取器方面,所述模型构建单元601,具体用于:
调用所述量子态编码逻辑门单元构建数据编码量子线路,所述数据编码量子线路用于将所述经典特征提取器的输出编码至量子比特的初始态;
调用所述量子态演化逻辑门单元构建可变分量子线路,所述可变分量子线路用于将所述初始态演化至目标态;
调用所述量子测量子模块构建测量量子线路,所述测量量子线路用于测量所述量子比特,得到所述目标数据的特征。
可选的,在所述调用所述量子态演化逻辑门单元构建可变分量子线路方面,所述模型构建单元601,具体用于:
调用所述量子态演化逻辑门单元构建嵌入层、旋转层和纠缠层,以及将所述嵌入层、所述旋转层和所述纠缠层级联,得到可变分量子线路,所述嵌入层用于将所述初始态演化为叠加态,所述旋转层用于将所述叠加态演化为随机态,所述纠缠层用于使多个所述随机态产生纠缠,得到目标态。
可选的,所述嵌入层包括H门,所述旋转层包括单量子旋转逻辑门,所述纠缠层包括CNOT门,所述单量子旋转逻辑门包括以下至少一个:RX门、RY门、RZ门。
可选的,所述量子模块还包括数据结构模块,在所述构建包括所述经典特征提取器和所述量子特征提取器的第二机器学习模型方面,所述模型构建单元601,具体用于:
调用所述经典模块构建经典分类器,所述经典分类器用于基于所述量子特征提取器的输出对所述目标数据进行分类;
调用所述数据结构模块将所述经典特征提取器、所述量子特征提取器和所述经典分类器依次进行级联,得到第二机器学习模型。
可选的,所述经典模块还包括损失函数单元和优化器单元,在所述将目标数据输入至所述第二机器学习模型以实现目标任务的求解之前,所述装置还包括模型训练单元603,所述模型训练单元603用于:
调用所述损失函数单元计算所述第二机器学习模型的损失函数;
调用所述优化器单元基于所述损失函数更新所述量子特征提取器的参数,以对所述第二机器学习模型进行优化。
与现有技术相比,本发明通过调用经典模块基于求解源任务的第一机器学习模型构建经典特征提取器,以及调用量子模块构建量子特征提取器;构建包括该经典特征提取器和该量子特征提取器的第二机器学习模型;实现了将用于求解源任务的第一机器学习模型迁移用于求解目标任务的第二机器学习模型,同时,由于第二机器学习模型包括量子特征提取器,利用量子叠加的特性,可以实现第二机器学习模型运行时的加速,从而提高迁移学习模型的运行速度。
本发明实施例还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
具体的,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
调用所述经典模块基于求解源任务的第一机器学习模型构建经典特征提取器,以及调用所述量子模块构建量子特征提取器;
构建包括所述经典特征提取器和所述量子特征提取器的第二机器学习模型;
将目标数据输入至所述第二机器学习模型以实现目标任务的求解,所述目标任务与所述源任务相关联。
具体的,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的再一实施例还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项中方法实施例中的步骤。
具体的,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
具体的,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
调用所述经典模块基于求解源任务的第一机器学习模型构建经典特征提取器,以及调用所述量子模块构建量子特征提取器;
构建包括所述经典特征提取器和所述量子特征提取器的第二机器学习模型;
将目标数据输入至所述第二机器学习模型以实现目标任务的求解,所述目标任务与所述源任务相关联。
以上依据图式所示的实施例详细说明了本发明的构造、特征及作用效果,以上所述仅为本发明的较佳实施例,但本发明不以图面所示限定实施范围,凡是依照本发明的构想所作的改变,或修改为等同变化的等效实施例,仍未超出说明书与图示所涵盖的精神时,均应在本发明的保护范围内。
Claims (9)
1.一种基于机器学习框架的迁移学习方法,其特征在于,所述机器学习框架包括经典模块和量子模块,所述量子模块包括量子态演化逻辑门单元,所述方法包括:
调用所述经典模块基于求解源任务的第一机器学习模型构建经典特征提取器,以及调用所述量子模块构建量子特征提取器;所述量子特征提取器包括可变分量子线路,所述可变分量子线路是调用所述量子态演化逻辑门单元构建嵌入层、旋转层和纠缠层,以及将所述嵌入层、所述旋转层和所述纠缠层级联得到的,所述嵌入层用于将初始态演化为叠加态,所述旋转层用于将所述叠加态演化为随机态,所述纠缠层用于使多个所述随机态产生纠缠,得到目标态;所述嵌入层包括H门,所述旋转层包括单量子旋转逻辑门,所述纠缠层包括CNOT门,所述单量子旋转逻辑门包括以下至少一个:RX门、RY门、RZ门;
构建包括所述经典特征提取器和所述量子特征提取器的第二机器学习模型;
将目标数据输入至所述第二机器学习模型以实现目标任务的求解,所述目标任务与所述源任务相关联。
2.如权利要求1所述的方法,其特征在于,所述调用所述经典模块基于求解源任务的第一机器学习模型构建经典特征提取器,包括:
获取训练好的求解源任务的第一机器学习模型,以及删除所述第一机器学习模型中与所述目标任务无关的经典神经网络层,得到经典特征提取器。
3.如权利要求1所述的方法,其特征在于,所述量子模块还包括量子态编码逻辑门单元和量子测量子模块;所述调用所述量子模块构建量子特征提取器,包括:
调用所述量子态编码逻辑门单元构建数据编码量子线路,所述数据编码量子线路用于将所述经典特征提取器的输出编码至量子比特的初始态;
调用所述量子态演化逻辑门单元构建所述可变分量子线路,所述可变分量子线路用于将所述初始态演化至目标态;
调用所述量子测量子模块构建测量量子线路,所述测量量子线路用于测量所述量子比特,得到所述目标数据的特征。
4.如权利要求3所述的方法,其特征在于,所述嵌入层用于将所述初始态演化为叠加态,所述旋转层用于将所述叠加态演化为随机态,所述纠缠层用于使多个所述随机态产生纠缠,得到目标态。
5.如权利要求1所述的方法,其特征在于,所述量子模块还包括数据结构模块,所述构建包括所述经典特征提取器和所述量子特征提取器的第二机器学习模型,包括:
调用所述经典模块构建经典分类器,所述经典分类器用于基于所述量子特征提取器的输出对所述目标数据进行分类;
调用所述数据结构模块将所述经典特征提取器、所述量子特征提取器和所述经典分类器依次进行级联,得到第二机器学习模型。
6.如权利要求1所述的方法,其特征在于,所述经典模块还包括损失函数单元和优化器单元,所述将目标数据输入至所述第二机器学习模型以实现目标任务的求解之前,所述方法还包括:
调用所述损失函数单元计算所述第二机器学习模型的损失函数;
调用所述优化器单元基于所述损失函数更新所述量子特征提取器的参数,以对所述第二机器学习模型进行优化。
7.一种基于机器学习框架的迁移学习装置,其特征在于,所述机器学习框架包括经典模块和量子模块,所述量子模块包括量子态演化逻辑门单元,所述装置包括:
模型构建单元,用于调用所述经典模块基于求解源任务的第一机器学习模型构建经典特征提取器,以及调用所述量子模块构建量子特征提取器;所述量子特征提取器包括可变分量子线路,所述可变分量子线路是调用所述量子态演化逻辑门单元构建嵌入层、旋转层和纠缠层,以及将所述嵌入层、所述旋转层和所述纠缠层级联得到的,所述嵌入层用于将初始态演化为叠加态,所述旋转层用于将所述叠加态演化为随机态,所述纠缠层用于使多个所述随机态产生纠缠,得到目标态;所述嵌入层包括H门,所述旋转层包括单量子旋转逻辑门,所述纠缠层包括CNOT门,所述单量子旋转逻辑门包括以下至少一个:RX门、RY门、RZ门;
所述模型构建单元,还用于构建包括所述经典特征提取器和所述量子特征提取器的第二机器学习模型;
模型运行单元,用于将目标数据输入至所述第二机器学习模型以实现目标任务的求解,所述目标任务与所述源任务相关联。
8.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至6任一项中所述的方法。
9.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至6任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210282328.1A CN114372584B (zh) | 2022-03-22 | 2022-03-22 | 基于机器学习框架的迁移学习方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210282328.1A CN114372584B (zh) | 2022-03-22 | 2022-03-22 | 基于机器学习框架的迁移学习方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114372584A CN114372584A (zh) | 2022-04-19 |
CN114372584B true CN114372584B (zh) | 2022-06-21 |
Family
ID=81145651
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210282328.1A Active CN114372584B (zh) | 2022-03-22 | 2022-03-22 | 基于机器学习框架的迁移学习方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114372584B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116187454B (zh) * | 2022-07-18 | 2024-09-20 | 上海图灵智算量子科技有限公司 | 基于量子线路的量子注意力机制方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112308194A (zh) * | 2020-09-24 | 2021-02-02 | 广西大学 | 一种量子迁移平行多层蒙特卡罗双馈风机参数优化方法 |
CN113496481A (zh) * | 2021-05-20 | 2021-10-12 | 北京交通大学 | 一种少样本胸部X-Ray图像的辅助检测方法 |
CN114201668A (zh) * | 2021-11-18 | 2022-03-18 | 北京三快在线科技有限公司 | 推荐系统的数据处理方法、装置、电子设备和存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210334700A1 (en) * | 2020-04-22 | 2021-10-28 | Qpiai India Private Limited | System and method of creating artificial intelligence model, machine learning model or quantum model generation framework |
AU2021105083A4 (en) * | 2021-08-07 | 2021-10-07 | Ahmadpour, Seyed-Sajad DR | Quantum Computing Machine Learning Module and System |
-
2022
- 2022-03-22 CN CN202210282328.1A patent/CN114372584B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112308194A (zh) * | 2020-09-24 | 2021-02-02 | 广西大学 | 一种量子迁移平行多层蒙特卡罗双馈风机参数优化方法 |
CN113496481A (zh) * | 2021-05-20 | 2021-10-12 | 北京交通大学 | 一种少样本胸部X-Ray图像的辅助检测方法 |
CN114201668A (zh) * | 2021-11-18 | 2022-03-18 | 北京三快在线科技有限公司 | 推荐系统的数据处理方法、装置、电子设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
《Transfer learning in hybrid classical-quantum neural networks》;Andrea Mari;《https://arxiv.org/pdf/1912.08278.pdf》;20191217;1-12 * |
Also Published As
Publication number | Publication date |
---|---|
CN114372584A (zh) | 2022-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12079691B2 (en) | Quantum convolution operator | |
CN112232513A (zh) | 一种量子态的制备方法及装置 | |
CN114358319B (zh) | 基于机器学习框架的分类方法及相关装置 | |
CN112633507B (zh) | 一种将复向量编码到量子线路的方法及装置 | |
CN114358295B (zh) | 基于机器学习框架的二分类方法及相关装置 | |
CN114792378A (zh) | 一种量子图像识别方法及装置 | |
CN114358318B (zh) | 基于机器学习框架的分类方法及相关装置 | |
CN114358216B (zh) | 基于机器学习框架的量子聚类方法及相关装置 | |
CN115293254B (zh) | 基于量子多层感知器的分类方法及相关设备 | |
CN114358317B (zh) | 基于机器学习框架的数据分类方法及相关设备 | |
CN113222153B (zh) | 一种量子态的模拟方法、装置、存储介质和电子装置 | |
CN114819163A (zh) | 量子生成对抗网络的训练方法、装置、介质及电子装置 | |
CN114372584B (zh) | 基于机器学习框架的迁移学习方法及相关装置 | |
CN114764619A (zh) | 一种基于量子线路的卷积操作方法及装置 | |
CN115879562B (zh) | 一种量子程序初始映射的确定方法、装置及量子计算机 | |
CN113222151A (zh) | 一种量子态的变换方法及装置 | |
CN116109854B (zh) | 军事武器装备类别确定方法、装置、介质及电子装置 | |
CN115775029B (zh) | 量子线路转化方法、装置、介质及电子装置 | |
CN114881239A (zh) | 量子生成器的构造方法、装置、介质及电子装置 | |
CN114881238A (zh) | 量子鉴别器的构造方法、装置、介质及电子装置 | |
CN115983392A (zh) | 量子程序映射关系的确定方法、装置、介质及电子装置 | |
CN114912619A (zh) | 一种量子计算任务调度方法、装置及量子计算机操作系统 | |
CN114372582B (zh) | 基于机器学习框架的量子自动编码方法及相关装置 | |
CN116167407B (zh) | 一种基于量子循环神经网络的数据预测方法及相关设备 | |
CN116432710B (zh) | 机器学习模型构建方法、机器学习框架及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |