CN114358216A - 基于机器学习框架的量子聚类方法及相关装置 - Google Patents

基于机器学习框架的量子聚类方法及相关装置 Download PDF

Info

Publication number
CN114358216A
CN114358216A CN202210282574.7A CN202210282574A CN114358216A CN 114358216 A CN114358216 A CN 114358216A CN 202210282574 A CN202210282574 A CN 202210282574A CN 114358216 A CN114358216 A CN 114358216A
Authority
CN
China
Prior art keywords
quantum
sample data
data
gates
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210282574.7A
Other languages
English (en)
Other versions
CN114358216B (zh
Inventor
窦猛汉
方圆
王伟
李蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Origin Quantum Computing Technology Co Ltd
Original Assignee
Origin Quantum Computing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Origin Quantum Computing Technology Co Ltd filed Critical Origin Quantum Computing Technology Co Ltd
Priority to CN202210282574.7A priority Critical patent/CN114358216B/zh
Publication of CN114358216A publication Critical patent/CN114358216A/zh
Application granted granted Critical
Publication of CN114358216B publication Critical patent/CN114358216B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于机器学习框架的量子聚类方法及相关装置,本发明通过调用量子模块基于获取的样本数据集和k个初始聚类中心创建量子机器学习聚类模型,以及运行该量子机器学习聚类模型,得到输出数据;然后调用数据结构模块基于该输出数据确定样本数据集中每个样本数据与k个所述初始聚类中心的相似度,进而实现了将经典聚类算法中数据间距离的比较转换成量子比特的量子态间相似度的比较,利用量子叠加的性质,减少了经典k‑means算法对计算资源的占用率;最后,基于该相似度确定每个所述样本数据所属的目标聚类,实现了聚类算法速度的提升。

Description

基于机器学习框架的量子聚类方法及相关装置
技术领域
本发明属于量子计算技术领域,特别是涉及一种基于机器学习框架的量子聚类方法及相关装置。
背景技术
k-means算法是无监督机器学习中最常用的聚类算法,对于给定的样本数据集,按照样本数据之间的距离大小,将样本数据集划分为k个簇,让簇内的样本数据尽量紧密的聚集在一起,而让簇间的距离尽量的大。数据之间的距离越小,相似度越大;数据之间的距离越大,相似度越小,其作用是将具有相似特征的样本聚为一类。
然而,随着样本数据集和聚类中心数量的增大,经典k-means算法会非常占用计算资源,计算速度越来越慢。量子计算的发展为解决该问题带来了曙光,如能将量子计算与k-means算法相结合,利用量子计算机远超经典计算机的效率,将进一步提高数据的处理能力。因此,如何实现量子聚类机器学习是一个需要解决的技术问题。
发明内容
本发明的目的是提供一种基于机器学习框架的量子聚类方法及相关装置,旨在减少经典k-means算法对计算资源的占用率,提升聚类算法的速度。
本发明的一个实施例提供了一种基于机器学习框架的量子聚类方法,所述机器学习框架包括数据结构模块和量子模块,所述方法包括:
获取样本数据集和k个初始聚类中心;
调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型,以及运行所述量子机器学习聚类模型,得到输出数据;
调用所述数据结构模块基于所述输出数据确定所述样本数据集中每个样本数据与k个所述初始聚类中心的相似度,以及基于所述相似度确定每个所述样本数据所属的目标聚类。
可选的,所述量子机器学习聚类模型包括级联的数据编码量子线路、相似度计算量子线路和测量量子线路,所述量子模块包括量子态编码逻辑门单元、量子态演化逻辑门单元和量子测量子模块;所述调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型,包括:
调用所述量子态编码逻辑门单元创建所述数据编码量子线路,所述数据编码量子线路用于将所述样本数据集中的每个样本数据和k个所述初始聚类中心分别编码至量子比特的第一量子态和第二量子态;
调用所述量子态演化逻辑门单元创建所述相似度计算量子线路,所述相似度计算量子线路用于将所述第一量子态和所述第二量子态演化至纠缠量子态;
调用所述量子测量子模块创建所述测量量子线路,所述测量量子线路用于测量所述量子比特得到所述输出数据。
可选的,所述量子比特包括数据比特,所述调用所述量子态编码逻辑门单元创建所述数据编码量子线路,包括:
调用所述量子态编码逻辑门单元获取两个RX门和两个RY门;
基于所述样本数据和所述初始聚类中心确定两个所述RX门和两个所述RY门的旋转参数;
将确定所述旋转参数后的两个所述RX门以及两个所述RY门作用于所述数据比特,得到所述数据编码量子线路。
可选的,所述基于所述样本数据和所述初始聚类中心确定两个所述RX门和两个所述RY门的旋转参数,包括:
基于所述样本数据的横坐标确定其中一个所述RX门的旋转参数,基于所述样本数据的纵坐标确定其中一个所述RY门的旋转参数,基于所述初始聚类中心的横坐标确定另外一个所述RX门的旋转参数,以及基于所述初始聚类中心的纵坐标确定另外一个所述RY门的旋转参数。
可选的,所述量子比特还包括辅助比特,所述调用所述量子态演化逻辑门单元创建所述相似度计算量子线路,包括:
调用所述量子态演化逻辑门单元获取两个H门和一个受控SWAP门;
将其中一个所述H门作用于所述辅助比特,将所述受控SWAP门作用于所述辅助比特和所述数据比特,将另外一个所述H门作用于所述辅助比特,得到所述相似度计算量子线路,其中,所述辅助比特为所述受控SWAP门的控制比特。
可选的,所述基于所述相似度确定每个所述样本数据所属的目标聚类,包括:
基于所述相似度确定每个所述样本数据对应的最大相似度;
基于所述最大相似度将所述样本数据集划分至k个所述初始聚类中心对应的k个聚类中,得到每个所述样本数据所属的聚类;
基于每个所述聚类中的样本数据计算每个所述聚类的新的聚类中心;
在所述新的聚类中心与所述初始聚类中心的距离小于或等于预设阈值时,确定每个所述样本数据所属的聚类为目标聚类。
可选的,所述方法还包括:
在所述新的聚类中心与所述初始聚类中心的距离大于所述预设阈值时,将k个新的所述聚类中心作为k个所述初始聚类中心,以及执行所述调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型。
本发明的又一实施例提供了一种基于机器学习框架的量子聚类装置,所述机器学习框架包括数据结构模块和量子模块,所述装置包括:
数据获取单元,用于获取样本数据集和k个初始聚类中心;
模型创建和运行单元,用于调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型,以及运行所述量子机器学习聚类模型,得到输出数据;
数据后处理单元,用于调用所述数据结构模块基于所述输出数据确定所述样本数据集中每个样本数据与k个所述初始聚类中心的相似度,以及基于所述相似度确定每个所述样本数据所属的目标聚类。
可选的,所述量子机器学习聚类模型包括级联的数据编码量子线路、相似度计算量子线路和测量量子线路,所述量子模块包括量子态编码逻辑门单元、量子态演化逻辑门单元和量子测量子模块;在所述调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型方面,所述模型创建和运行单元,具体用于:
调用所述量子态编码逻辑门单元创建所述数据编码量子线路,所述数据编码量子线路用于将所述样本数据集中的每个样本数据和k个所述初始聚类中心分别编码至量子比特的第一量子态和第二量子态;
调用所述量子态演化逻辑门单元创建所述相似度计算量子线路,所述相似度计算量子线路用于将所述第一量子态和所述第二量子态演化至纠缠量子态;
调用所述量子测量子模块创建所述测量量子线路,所述测量量子线路用于测量所述量子比特得到所述输出数据。
可选的,所述量子比特包括数据比特,在所述调用所述量子态编码逻辑门单元创建所述数据编码量子线路方面,所述模型创建和运行单元,具体用于:
调用所述量子态编码逻辑门单元获取两个RX门和两个RY门;
基于所述样本数据和所述初始聚类中心确定两个所述RX门和两个所述RY门的旋转参数;
将确定所述旋转参数后的两个所述RX门以及两个所述RY门作用于所述数据比特,得到所述数据编码量子线路。
可选的,在所述基于所述样本数据和所述初始聚类中心确定两个所述RX门和两个所述RY门的旋转参数方面,所述模型创建和运行单元,具体用于:
基于所述样本数据的横坐标确定其中一个所述RX门的旋转参数,基于所述样本数据的纵坐标确定其中一个所述RY门的旋转参数,基于所述初始聚类中心的横坐标确定另外一个所述RX门的旋转参数,以及基于所述初始聚类中心的纵坐标确定另外一个所述RY门的旋转参数。
可选的,所述量子比特还包括辅助比特,在所述调用所述量子态演化逻辑门单元创建所述相似度计算量子线路方面,所述模型创建和运行单元,具体用于:
调用所述量子态演化逻辑门单元获取两个H门和一个受控SWAP门;
将其中一个所述H门作用于所述辅助比特,将所述受控SWAP门作用于所述辅助比特和所述数据比特,将另外一个所述H门作用于所述辅助比特,得到所述相似度计算量子线路,其中,所述辅助比特为所述受控SWAP门的控制比特。
可选的,在所述基于所述相似度确定每个所述样本数据所属的目标聚类方面,所述数据后处理单元,具体用于:
基于所述相似度确定每个所述样本数据对应的最大相似度;
基于所述最大相似度将所述样本数据集划分至k个所述初始聚类中心对应的k个聚类中,得到每个所述样本数据所属的聚类;
基于每个所述聚类中的样本数据计算每个所述聚类的新的聚类中心;
在所述新的聚类中心与所述初始聚类中心的距离小于或等于预设阈值时,确定每个所述样本数据所属的聚类为目标聚类。
可选的,所述数据后处理单元,还用于:
在所述新的聚类中心与所述初始聚类中心的距离大于所述预设阈值时,将k个新的所述聚类中心作为k个所述初始聚类中心,以及执行所述调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型。
本发明的又一实施例提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项中所述的方法。
本发明的又一实施例提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项中所述的方法。
与现有技术相比,本发明通过调用量子模块基于获取的样本数据集和k个初始聚类中心创建量子机器学习聚类模型,以及运行该量子机器学习聚类模型,得到输出数据;然后调用数据结构模块基于该输出数据确定样本数据集中每个样本数据与k个所述初始聚类中心的相似度,进而实现了将经典聚类算法中数据间距离的比较转换成量子比特的量子态间相似度的比较,利用量子叠加的性质,减少了经典k-means算法对计算资源的占用率;最后,基于该相似度确定每个所述样本数据所属的目标聚类,实现了聚类算法速度的提升。
附图说明
图1为本发明实施例提供的一种基于机器学习框架的量子聚类方法的计算机终端的硬件结构框图;
图2为本发明实施例提供的一种基于机器学习框架的量子聚类方法的流程示意图;
图3为本发明实施例提供的一种数据编码量子线路的结构示意图;
图4为本发明实施例提供的一种相似度计算量子线路的结构示意图;
图5为本发明实施例提供的一种基于机器学习框架的量子聚类装置的流程示意图。
具体实施方式
下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本发明实施例首先提供了一种基于机器学习框架的量子聚类方法,该方法可以应用于电子设备,如计算机终端,具体如普通电脑、量子计算机等。
下面以运行在计算机终端上为例对其进行详细说明。图1为本发明实施例提供的一种基于机器学习框架的量子聚类方法的计算机终端的硬件结构框图。如图1所示,计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储基于机器学习框架的量子聚类方法的存储器104,可选地,上述计算机终端还可以包括用于通信功能的传输装置106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的基于机器学习框架的量子聚类方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
需要说明的是,真正的量子计算机是混合结构的,它包含两大部分:一部分是经典计算机,负责执行经典计算与控制;另一部分是量子设备,负责运行量子程序进而实现量子计算。而量子程序是由量子语言如QRunes语言编写的一串能够在量子计算机上运行的指令序列,实现了对量子逻辑门操作的支持,并最终实现量子计算。具体的说,量子程序就是一系列按照一定时序操作量子逻辑门的指令序列。
在实际应用中,因受限于量子设备硬件的发展,通常需要进行量子计算模拟以验证量子算法、量子应用等等。量子计算模拟即借助普通计算机的资源搭建的虚拟架构(即量子虚拟机)实现特定问题对应的量子程序的模拟运行的过程。通常,需要构建特定问题对应的量子程序。本发明实施例所指量子程序,即是经典语言编写的表征量子比特及其演化的程序,其中与量子计算相关的量子比特、量子逻辑门等等均有相应的经典代码表示。
量子线路作为量子程序的一种体现方式,也称量子逻辑电路,是最常用的通用量子计算模型,表示在抽象概念下对于量子比特进行操作的线路,其组成包括量子比特、线路(时间线)、以及各种量子逻辑门,最后常需要通过量子测量操作将结果读取出来。
不同于传统电路是用金属线所连接以传递电压信号或电流信号,在量子线路中,线路可看成是由时间所连接,亦即量子比特的状态随着时间自然演化,在这过程中按照哈密顿运算符的指示,一直到遇上逻辑门而被操作。
一个量子程序整体上对应有一条总的量子线路,本发明所述量子程序即指该条总的量子线路,其中,该总的量子线路中的量子比特总数与量子程序的量子比特总数相同。可以理解为:一个量子程序可以由量子线路、针对量子线路中量子比特的测量操作、保存测量结果的寄存器及控制流节点(跳转指令)组成,一条量子线路可以包含几十上百个甚至成千上万个量子逻辑门操作。量子程序的执行过程,就是对所有的量子逻辑门按照一定时序执行的过程。需要说明的是,时序即单个量子逻辑门被执行的时间顺序。
需要说明的是,经典计算中,最基本的单元是比特,而最基本的控制模式是逻辑门,可以通过逻辑门的组合来达到控制电路的目的。类似地,处理量子比特的方式就是量子逻辑门。使用量子逻辑门,能够使量子态发生演化,量子逻辑门是构成量子线路的基础,量子逻辑门包括单比特量子逻辑门,如Hadamard门(H门,阿达马门)、泡利-X门(X门)、泡利-Y门(Y门)、泡利-Z门(Z门)、RX门、RY门、RZ门等等;多比特量子逻辑门,如CNOT门、CR门、iSWAP门、Toffoli门等等。量子逻辑门一般使用酉矩阵表示,而酉矩阵不仅是矩阵形式,也是一种操作和变换。一般量子逻辑门在量子态上的作用是通过酉矩阵左乘以量子态右矢对应的矩阵进行计算。
参见图2,图2为本发明实施例提供的一种基于机器学习框架的量子聚类方法的流程示意图,所述机器学习框架包括数据结构模块和量子模块,所述方法包括:
步骤201:获取样本数据集和k个初始聚类中心;
步骤202:调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型,以及运行所述量子机器学习聚类模型,得到输出数据;
步骤203:调用所述数据结构模块基于所述输出数据确定所述样本数据集中每个样本数据与k个所述初始聚类中心的相似度,以及基于所述相似度确定每个所述样本数据所属的目标聚类。
其中,机器学习框架集成了众多用于创建和训练机器学习模型的函数集,通过其定义的接口可以方便的调用函数集中的函数实现对机器学习模型的相关操作。
机器学习框架包括的上述量子模块可以被配置为创建机器学习模型中的量子计算层,量子计算层为包含量子程序的程序模块,可以用于实现对应量子程序的量子计算,通过对量子程序按照一定的标准进行封装得到量子计算层,便于在创建和训练机器学习模型时进行使用。量子程序为实现量子计算的程序,可以通过调用量子模块创建按特定顺序作用于量子比特的量子逻辑门得到量子程序,并对量子程序进行封装得到量子计算层。所述量子机器学习聚类模型包括所述量子计算层。
其中,k-means算法中k代表的k个聚类,means代表的是聚类中心,k-means算法的本质是确定k个聚类的中心点。所述k个初始聚类中心为人为设定的。
具体地,所述运行所述量子机器学习聚类模型,得到输出数据,包括:
运行所述量子机器学习聚类模型对应的量子线路,以及对量子线路中的量子比特进行测量,将测量得到的数据作为输出数据。其中,所述输出数据可以是量子比特的量子态,也可以是量子比特量子态对应的振幅或者概率。
其中,数据结构模块,被配置为创建用于输入机器学习模型的张量数据,以及对所述张量数据执行运算;所述数据结构模块包括:张量创建子模块,被配置为将输入数据按照预设的数据结构排列以创建用于输入所述机器学习模型的张量数据,和/或创建以所述预设的数据结构排列且数值确定的用于输入所述机器学习模型的张量数据;运算操作子模块,被配置为对所述张量数据执行运算。所述运算操作子模块包括以下至少一者:数学运算单元,被配置为对所述张量数据执行数学运算;逻辑运算单元,被配置为对所述张量数据执行逻辑运算;数据变换单元,被配置为对所述张量数据执行变换运算,以变换所述张量数据的数据结构。
具体地,所述调用所述数据结构模块基于所述输出数据确定所述样本数据集中每个样本数据与k个所述初始聚类中心的相似度,包括:调用运算操作子模块对该输出数据进行运算,例如相应的编程语言接口,Python接口、C接口、C++接口等,从而确定所述样本数据集中每个样本数据与k个所述初始聚类中心的相似度。
在数据分析和数据挖掘以及搜索引擎中,经常需要知道个体间差异的大小,进而评价个体的相似性和类别。常见的比如数据分析中比如相关分析,数据挖掘中的分类聚类(k-means等)算法,搜索引擎进行物品推荐。
相似度就是比较两个事物的相似性。一般通过计算事物的特征之间的距离,如果距离小,那么相似度大;如果距离大,那么相似度小。因此,这里可以通过样本数据集中每个样本数据与k个初始聚类中心的相似度去确定每个样本数据所属的目标聚类。
与现有技术相比,本发明通过调用量子模块基于获取的样本数据集和k个初始聚类中心创建量子机器学习聚类模型,以及运行该量子机器学习聚类模型,得到输出数据;然后调用数据结构模块基于该输出数据确定样本数据集中每个样本数据与k个所述初始聚类中心的相似度,进而实现了将经典聚类算法中数据间距离的比较转换成量子比特的量子态间相似度的比较,利用量子叠加的性质,减少了经典k-means算法对计算资源的占用率;最后,基于该相似度确定每个所述样本数据所属的目标聚类,实现提升聚类算法速度的提升。
可选的,所述量子机器学习聚类模型包括级联的数据编码量子线路、相似度计算量子线路和测量量子线路,所述量子模块包括量子态编码逻辑门单元、量子态演化逻辑门单元和量子测量子模块;所述调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型,包括:
调用所述量子态编码逻辑门单元创建所述数据编码量子线路,所述数据编码量子线路用于将所述样本数据集中的每个样本数据和k个所述初始聚类中心分别编码至量子比特的第一量子态和第二量子态;
调用所述量子态演化逻辑门单元创建所述相似度计算量子线路,所述相似度计算量子线路用于将所述第一量子态和所述第二量子态演化至纠缠量子态;
调用所述量子测量子模块创建所述测量量子线路,所述测量量子线路用于测量所述量子比特得到所述输出数据。
其中,所述量子模块包括量子逻辑门子模块和量子测量子模块,量子逻辑门子模块包括量子态编码逻辑门单元和量子态演化逻辑门单元。
其中,所述数据编码量子线路可以为以下其中一种:基态编码量子线路、幅度编码量子线路、角度编码量子线路、瞬时量子多项式IQP(Instantaneous Quantum Polynomial)编码线路。
具体来讲,基态相对于任意量子态,相当于基向量相对于任意向量。例如,对于量子态
Figure 843794DEST_PATH_IMAGE001
,其中
Figure 838426DEST_PATH_IMAGE002
Figure 28099DEST_PATH_IMAGE003
为基态,对于量子态
Figure 990239DEST_PATH_IMAGE004
,其中
Figure 556349DEST_PATH_IMAGE005
为基态。基态编码量子线路用于将输入数据编码至量子比特的量子态中的基态。例如对于输入数据5,其二进制码为101,进而可以将其编码至量子比特的量子态中的基态
Figure 858018DEST_PATH_IMAGE006
具体来讲,对于量子态
Figure 530176DEST_PATH_IMAGE007
,其中a和b为振幅;对于量子态
Figure 917295DEST_PATH_IMAGE004
,其中c、d、e、f为振幅。例如,对于输入数据[1,3],对其归一化后1对应于0.25,3对应于0.75,进而可以令量子态
Figure 287097DEST_PATH_IMAGE008
中的振幅的
Figure 240009DEST_PATH_IMAGE009
来对其进行编码。
具体来讲,角度编码量子线路中包括含参量子逻辑门,例如可以为RX旋转门、RY旋转门和RZ旋转门中的任意一者。对输入数据进行反三角函数变换,将变换得到的角度作为旋转门的旋转角度参数,从而实现对输入数据的编码。
具体来讲,IQP编码指的是通过创建IQP编码线路的逻辑门作用于指定量子比特得到IQP编码线路,并将输入数据作为该IQP编码线路的参数,运行该IQP编码线路可以将输入数据x编码至量子态
Figure 37064DEST_PATH_IMAGE010
,其中,x为张量数据,H为上述H门,n为指定量子比特的数量,
Figure 645900DEST_PATH_IMAGE011
表示n个指定量子比特的初始量子态均为
Figure 632442DEST_PATH_IMAGE012
,r表示
Figure 643123DEST_PATH_IMAGE013
的重复次数,
Figure 673396DEST_PATH_IMAGE014
如下:
Figure 377102DEST_PATH_IMAGE015
其中,
Figure 823127DEST_PATH_IMAGE016
表示RZZ门,
Figure 485053DEST_PATH_IMAGE017
表示RZ门,S表示被该
Figure 623910DEST_PATH_IMAGE018
逻辑门作用的量子比特的集合。
其中,测量量子线路可以是测量所述量子比特中的一个或两个、多个或全部。输出数据可以是期望值,也可以是不同基态出现的概率,还可以是不同几台出现的次数。
其中,上述数据编码量子线路将样本数据和初始聚类中心分别编码至第一量子态为
Figure 207338DEST_PATH_IMAGE019
和第二量子态
Figure 519371DEST_PATH_IMAGE020
进一步地,所述调用所述数据结构模块基于所述输出数据确定所述样本数据集中每个样本数据与k个所述初始聚类中心的相似度,包括:
基于相似度确定公式和所述输出数据确定所述样本数据集中每个样本数据与k个所述初始聚类中心的相似度,所述相似度确定公式为:
Figure 504644DEST_PATH_IMAGE021
其中,所述
Figure 814403DEST_PATH_IMAGE022
为相似度,所述
Figure 698176DEST_PATH_IMAGE023
为输出数据。
可选的,所述量子比特包括数据比特,所述调用所述量子态编码逻辑门单元创建所述数据编码量子线路,包括:
调用所述量子态编码逻辑门单元获取两个RX门和两个RY门;
基于所述样本数据和所述初始聚类中心确定两个所述RX门和两个所述RY门的旋转参数;
将确定所述旋转参数后的两个所述RX门以及两个所述RY门作用于所述数据比特,得到所述数据编码量子线路。
可选的,所述基于所述样本数据和所述初始聚类中心确定两个所述RX门和两个所述RY门的旋转参数,包括:
基于所述样本数据的横坐标确定其中一个所述RX门的旋转参数,基于所述样本数据的纵坐标确定其中一个所述RY门的旋转参数,基于所述初始聚类中心的横坐标确定另外一个所述RX门的旋转参数,以及基于所述初始聚类中心的纵坐标确定另外一个所述RY门的旋转参数。
进一步地,旋转参数基于以下公式确定:
Figure 751583DEST_PATH_IMAGE024
其中,
Figure 591363DEST_PATH_IMAGE025
分别为样本数据(或初始聚类中心)的横坐标和纵坐标,
Figure 134340DEST_PATH_IMAGE026
为RX门的旋转参数,
Figure 426781DEST_PATH_IMAGE027
为RY门的旋转参数。
举例说明,如图3所示,图3为本发明实施例提供的一种数据编码量子线路的结构示意图。样本数据对应的RX门和RY门的旋转参数分别为
Figure 283878DEST_PATH_IMAGE028
Figure 289749DEST_PATH_IMAGE029
,初始聚类中心对应的RX门和RY门的旋转参数分别为
Figure 941311DEST_PATH_IMAGE030
Figure 986627DEST_PATH_IMAGE031
。样本数据和初始聚类中心为二维数据,其坐标分别为
Figure 444153DEST_PATH_IMAGE032
,则
Figure 992946DEST_PATH_IMAGE028
Figure 80988DEST_PATH_IMAGE029
Figure 161070DEST_PATH_IMAGE030
Figure 359971DEST_PATH_IMAGE031
分别如下:
Figure 825587DEST_PATH_IMAGE033
Figure 84530DEST_PATH_IMAGE034
Figure 838859DEST_PATH_IMAGE035
Figure 890385DEST_PATH_IMAGE036
可选的,所述量子比特还包括辅助比特,所述调用所述量子态演化逻辑门单元创建所述相似度计算量子线路,包括:
调用所述量子态演化逻辑门单元获取两个H门和一个受控SWAP门;
将其中一个所述H门作用于所述辅助比特,将所述受控SWAP门作用于所述辅助比特和所述数据比特,将另外一个所述H门作用于所述辅助比特,得到所述相似度计算量子线路,其中,所述辅助比特为所述受控SWAP门的控制比特。
其中,所述测量量子线路包括作用于所述辅助量子比特的测量逻辑门。测量逻辑门可以是对所述辅助比特进行测量,得到所述辅助量子比特的量子态为
Figure 413771DEST_PATH_IMAGE037
的概率;也可以是对所述辅助比特进行测量,得到所述辅助量子比特的量子态为
Figure 843615DEST_PATH_IMAGE003
的概率;还可以是对所述辅助比特进行测量,得到所述辅助量子比特的量子态为
Figure 881978DEST_PATH_IMAGE037
Figure 422681DEST_PATH_IMAGE003
的概率。
如图4所示,图4为本发明实施例提供的一种相似度计算量子线路的结构示意图。图中的第一条线表示辅助比特,第二条和第三条线表示数据比特,两个H门和一个受控SWAP门作用于辅助比特和数据比特。
其中,上述相似度计算量子线路将第一量子态为
Figure 879201DEST_PATH_IMAGE038
和第二量子态
Figure 214368DEST_PATH_IMAGE020
演化至纠缠态:
Figure 943289DEST_PATH_IMAGE039
对所述辅助量子比特进行测量,得到所述辅助量子比特的量子态为
Figure 84420DEST_PATH_IMAGE037
的概率为:
Figure 582398DEST_PATH_IMAGE040
可选的,所述基于所述相似度确定每个所述样本数据所属的目标聚类,包括:
基于所述相似度确定每个所述样本数据对应的最大相似度;
基于所述最大相似度将所述样本数据集划分至k个所述初始聚类中心对应的k个聚类中,得到每个所述样本数据所属的聚类;
基于每个所述聚类中的样本数据计算每个所述聚类的新的聚类中心;
在所述新的聚类中心与所述初始聚类中心的距离小于或等于预设阈值时,确定每个所述样本数据所属的聚类为目标聚类。
可选的,所述方法还包括:
在所述新的聚类中心与所述初始聚类中心的距离大于所述预设阈值时,将k个新的所述聚类中心作为k个所述初始聚类中心,以及执行所述调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型。
具体地,基于所述最大相似度将所述样本数据集划分至k个所述聚类中心对应的k个聚类中,得到每个样本数据所属的聚类,即若样本数据集中的任意一个样本数据
Figure 88466DEST_PATH_IMAGE041
Figure 616268DEST_PATH_IMAGE041
与k个聚类中的聚类M的相似度最大,则将样本数据
Figure 498773DEST_PATH_IMAGE042
划分到聚类M中去。
具体地,基于每个所述聚类中的样本数据计算每个所述聚类的新的聚类中心,若聚类中心为该聚类中所有样本数据的重心,则基于重心公式计算每个所述聚类的新的聚类中心;若聚类中心为该聚类中最短距离的中心,则确定聚类中任意两个样本数据的距离从而确定最短距离,进而确定最短距离的中心,然后将最短距离的中心确定为每个所述聚类的新的聚类中心;若聚类中心为平均距离的中心,则确定聚类中任意两个样本数据的距离,进而确定这些距离的平均距离,然后将平均距离的中心确定为每个所述聚类的新的聚类中心。
其中,所述新的聚类中心与所述初始聚类中心的距离可以是两者的明式距离、欧式距离、马式距离和兰式距离,在此不作限定。预设阈值为预先设定的。
参见图5,图5为本发明实施例提供的一种基于机器学习框架的量子聚类装置的流程示意图,所述机器学习框架包括数据结构模块和量子模块,所述装置包括:
数据获取单元501,用于获取样本数据集和k个初始聚类中心;
模型创建和运行单元502,用于调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型,以及运行所述量子机器学习聚类模型,得到输出数据;
数据后处理单元503,用于调用所述数据结构模块基于所述输出数据确定所述样本数据集中每个样本数据与k个所述初始聚类中心的相似度,以及基于所述相似度确定每个所述样本数据所属的目标聚类。
可选的,所述量子机器学习聚类模型包括级联的数据编码量子线路、相似度计算量子线路和测量量子线路,所述量子模块包括量子态编码逻辑门单元、量子态演化逻辑门单元和量子测量子模块;在所述调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型方面,所述模型创建和运行单元502,具体用于:
调用所述量子态编码逻辑门单元创建所述数据编码量子线路,所述数据编码量子线路用于将所述样本数据集中的每个样本数据和k个所述初始聚类中心分别编码至量子比特的第一量子态和第二量子态;
调用所述量子态演化逻辑门单元创建所述相似度计算量子线路,所述相似度计算量子线路用于将所述第一量子态和所述第二量子态演化至纠缠量子态;
调用所述量子测量子模块创建所述测量量子线路,所述测量量子线路用于测量所述量子比特得到所述输出数据。
可选的,所述量子比特包括数据比特,在所述调用所述量子态编码逻辑门单元创建所述数据编码量子线路方面,所述模型创建和运行单元502,具体用于:
调用所述量子态编码逻辑门单元获取两个RX门和两个RY门;
基于所述样本数据和所述初始聚类中心确定两个所述RX门和两个所述RY门的旋转参数;
将确定所述旋转参数后的两个所述RX门以及两个所述RY门作用于所述数据比特,得到所述数据编码量子线路。
可选的,在所述基于所述样本数据和所述初始聚类中心确定两个所述RX门和两个所述RY门的旋转参数方面,所述模型创建和运行单元502,具体用于:
基于所述样本数据的横坐标确定其中一个所述RX门的旋转参数,基于所述样本数据的纵坐标确定其中一个所述RY门的旋转参数,基于所述初始聚类中心的横坐标确定另外一个所述RX门的旋转参数,以及基于所述初始聚类中心的纵坐标确定另外一个所述RY门的旋转参数。
可选的,所述量子比特还包括辅助比特,在所述调用所述量子态演化逻辑门单元创建所述相似度计算量子线路方面,所述模型创建和运行单元502,具体用于:
调用所述量子态演化逻辑门单元获取两个H门和一个受控SWAP门;
将其中一个所述H门作用于所述辅助比特,将所述受控SWAP门作用于所述辅助比特和所述数据比特,将另外一个所述H门作用于所述辅助比特,得到所述相似度计算量子线路,其中,所述辅助比特为所述受控SWAP门的控制比特。
可选的,在所述基于所述相似度确定每个所述样本数据所属的目标聚类方面,所述数据后处理单元503,具体用于:
基于所述相似度确定每个所述样本数据对应的最大相似度;
基于所述最大相似度将所述样本数据集划分至k个所述初始聚类中心对应的k个聚类中,得到每个所述样本数据所属的聚类;
基于每个所述聚类中的样本数据计算每个所述聚类的新的聚类中心;
在所述新的聚类中心与所述初始聚类中心的距离小于或等于预设阈值时,确定每个所述样本数据所属的聚类为目标聚类。
可选的,所述数据后处理单元503,还用于:
在所述新的聚类中心与所述初始聚类中心的距离大于所述预设阈值时,将k个新的所述聚类中心作为k个所述初始聚类中心,以及执行所述调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型。
与现有技术相比,本发明通过调用量子模块基于获取的样本数据集和k个初始聚类中心创建量子机器学习聚类模型,以及运行该量子机器学习聚类模型,得到输出数据;然后调用数据结构模块基于该输出数据确定样本数据集中每个样本数据与k个所述初始聚类中心的相似度,进而实现了将经典聚类算法中数据间距离的比较转换成量子比特的量子态间相似度的比较,利用量子叠加的性质,减少了经典k-means算法对计算资源的占用率;最后,基于该相似度确定每个所述样本数据所属的目标聚类,实现了聚类算法速度的提升。
本发明实施例还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
具体的,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
获取样本数据集和k个初始聚类中心;
调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型,以及运行所述量子机器学习聚类模型,得到输出数据;
调用所述数据结构模块基于所述输出数据确定所述样本数据集中每个样本数据与k个所述初始聚类中心的相似度,以及基于所述相似度确定每个所述样本数据所属的目标聚类。
具体的,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的再一实施例还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项中方法实施例中的步骤。
具体的,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
具体的,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
获取样本数据集和k个初始聚类中心;
调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型,以及运行所述量子机器学习聚类模型,得到输出数据;
调用所述数据结构模块基于所述输出数据确定所述样本数据集中每个样本数据与k个所述初始聚类中心的相似度,以及基于所述相似度确定每个所述样本数据所属的目标聚类。
以上依据图式所示的实施例详细说明了本发明的构造、特征及作用效果,以上所述仅为本发明的较佳实施例,但本发明不以图面所示限定实施范围,凡是依照本发明的构想所作的改变,或修改为等同变化的等效实施例,仍未超出说明书与图示所涵盖的精神时,均应在本发明的保护范围内。

Claims (10)

1.一种基于机器学习框架的量子聚类方法,其特征在于,所述机器学习框架包括数据结构模块和量子模块,所述方法包括:
获取样本数据集和k个初始聚类中心;
调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型,以及运行所述量子机器学习聚类模型,得到输出数据;
调用所述数据结构模块基于所述输出数据确定所述样本数据集中每个样本数据与k个所述初始聚类中心的相似度,以及基于所述相似度确定每个所述样本数据所属的目标聚类。
2.如权利要求1所述的方法,其特征在于,所述量子机器学习聚类模型包括级联的数据编码量子线路、相似度计算量子线路和测量量子线路,所述量子模块包括量子态编码逻辑门单元、量子态演化逻辑门单元和量子测量子模块;所述调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型,包括:
调用所述量子态编码逻辑门单元创建所述数据编码量子线路,所述数据编码量子线路用于将所述样本数据集中的每个样本数据和k个所述初始聚类中心分别编码至量子比特的第一量子态和第二量子态;
调用所述量子态演化逻辑门单元创建所述相似度计算量子线路,所述相似度计算量子线路用于将所述第一量子态和所述第二量子态演化至纠缠量子态;
调用所述量子测量子模块创建所述测量量子线路,所述测量量子线路用于测量所述量子比特得到所述输出数据。
3.如权利要求2所述的方法,其特征在于,所述量子比特包括数据比特,所述调用所述量子态编码逻辑门单元创建所述数据编码量子线路,包括:
调用所述量子态编码逻辑门单元获取两个RX门和两个RY门;
基于所述样本数据和所述初始聚类中心确定两个所述RX门和两个所述RY门的旋转参数;
将确定所述旋转参数后的两个所述RX门以及两个所述RY门作用于所述数据比特,得到所述数据编码量子线路。
4.如权利要求3所述的方法,其特征在于,所述基于所述样本数据和所述初始聚类中心确定两个所述RX门和两个所述RY门的旋转参数,包括:
基于所述样本数据的横坐标确定其中一个所述RX门的旋转参数,基于所述样本数据的纵坐标确定其中一个所述RY门的旋转参数,基于所述初始聚类中心的横坐标确定另外一个所述RX门的旋转参数,以及基于所述初始聚类中心的纵坐标确定另外一个所述RY门的旋转参数。
5.如权利要求4所述的方法,其特征在于,所述量子比特还包括辅助比特,所述调用所述量子态演化逻辑门单元创建所述相似度计算量子线路,包括:
调用所述量子态演化逻辑门单元获取两个H门和一个受控SWAP门;
将其中一个所述H门作用于所述辅助比特,将所述受控SWAP门作用于所述辅助比特和所述数据比特,将另外一个所述H门作用于所述辅助比特,得到所述相似度计算量子线路,其中,所述辅助比特为所述受控SWAP门的控制比特。
6.如权利要求1所述的方法,其特征在于,所述基于所述相似度确定每个所述样本数据所属的目标聚类,包括:
基于所述相似度确定每个所述样本数据对应的最大相似度;
基于所述最大相似度将所述样本数据集划分至k个所述初始聚类中心对应的k个聚类中,得到每个所述样本数据所属的聚类;
基于每个所述聚类中的样本数据计算每个所述聚类的新的聚类中心;
在所述新的聚类中心与所述初始聚类中心的距离小于或等于预设阈值时,确定每个所述样本数据所属的聚类为目标聚类。
7.如权利要求6所述的方法,其特征在于,所述方法还包括:
在所述新的聚类中心与所述初始聚类中心的距离大于所述预设阈值时,将k个新的所述聚类中心作为k个所述初始聚类中心,以及执行所述调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型。
8.一种基于机器学习框架的量子聚类装置,其特征在于,所述机器学习框架包括数据结构模块和量子模块,所述装置包括:
数据获取单元,用于获取样本数据集和k个初始聚类中心;
模型创建和运行单元,用于调用所述量子模块基于所述样本数据集和k个所述初始聚类中心创建量子机器学习聚类模型,以及运行所述量子机器学习聚类模型,得到输出数据;
数据后处理单元,用于调用所述数据结构模块基于所述输出数据确定所述样本数据集中每个样本数据与k个所述初始聚类中心的相似度,以及基于所述相似度确定每个所述样本数据所属的目标聚类。
9.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至7任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至7任一项中所述的方法。
CN202210282574.7A 2022-03-22 2022-03-22 基于机器学习框架的量子聚类方法及相关装置 Active CN114358216B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210282574.7A CN114358216B (zh) 2022-03-22 2022-03-22 基于机器学习框架的量子聚类方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210282574.7A CN114358216B (zh) 2022-03-22 2022-03-22 基于机器学习框架的量子聚类方法及相关装置

Publications (2)

Publication Number Publication Date
CN114358216A true CN114358216A (zh) 2022-04-15
CN114358216B CN114358216B (zh) 2022-06-21

Family

ID=81095062

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210282574.7A Active CN114358216B (zh) 2022-03-22 2022-03-22 基于机器学习框架的量子聚类方法及相关装置

Country Status (1)

Country Link
CN (1) CN114358216B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115796294A (zh) * 2023-02-07 2023-03-14 江苏微知量子科技有限公司 一种面向量子计算的大规模数据调用系统
WO2023232039A1 (zh) * 2022-05-30 2023-12-07 本源量子计算科技(合肥)股份有限公司 量子比特读取信号的优化方法及装置、量子计算机

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110852380A (zh) * 2019-11-11 2020-02-28 安徽师范大学 基于量子蚁狮与k均值的聚类方法及入侵检测方法
US20210192381A1 (en) * 2019-12-18 2021-06-24 Xanadu Quantum Technologies Inc. Apparatus and methods for quantum computing with pre-training
CN113190719A (zh) * 2021-05-08 2021-07-30 北京百度网讯科技有限公司 节点分组方法、装置及电子设备
CN113674097A (zh) * 2021-08-24 2021-11-19 四川元匠科技有限公司 基于量子聚类算法的金融投资分析方法、存储介质和终端
CN113853614A (zh) * 2019-06-28 2021-12-28 国际商业机器公司 在量子特征空间中使用量子相似性矩阵的无监督聚类

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113853614A (zh) * 2019-06-28 2021-12-28 国际商业机器公司 在量子特征空间中使用量子相似性矩阵的无监督聚类
CN110852380A (zh) * 2019-11-11 2020-02-28 安徽师范大学 基于量子蚁狮与k均值的聚类方法及入侵检测方法
US20210192381A1 (en) * 2019-12-18 2021-06-24 Xanadu Quantum Technologies Inc. Apparatus and methods for quantum computing with pre-training
CN113190719A (zh) * 2021-05-08 2021-07-30 北京百度网讯科技有限公司 节点分组方法、装置及电子设备
CN113674097A (zh) * 2021-08-24 2021-11-19 四川元匠科技有限公司 基于量子聚类算法的金融投资分析方法、存储介质和终端

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023232039A1 (zh) * 2022-05-30 2023-12-07 本源量子计算科技(合肥)股份有限公司 量子比特读取信号的优化方法及装置、量子计算机
CN115796294A (zh) * 2023-02-07 2023-03-14 江苏微知量子科技有限公司 一种面向量子计算的大规模数据调用系统
CN115796294B (zh) * 2023-02-07 2023-04-07 江苏微知量子科技有限公司 一种面向量子计算的大规模数据调用系统

Also Published As

Publication number Publication date
CN114358216B (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
CN114358216B (zh) 基于机器学习框架的量子聚类方法及相关装置
CN112232513A (zh) 一种量子态的制备方法及装置
US20240095563A1 (en) Quantum convolution operator
CN114358319B (zh) 基于机器学习框架的分类方法及相关装置
CN112073221A (zh) 一种实现网络节点排序的方法及装置
CN113222155B (zh) 一种量子线路的构建方法、装置、电子装置和存储介质
CN112633507A (zh) 一种将复向量编码到量子线路的方法及装置
CN112016691A (zh) 一种量子线路的构建方法及装置
CN114792378A (zh) 一种量子图像识别方法及装置
CN114358318B (zh) 基于机器学习框架的分类方法及相关装置
CN114358295B (zh) 基于机器学习框架的二分类方法及相关装置
CN114358317B (zh) 基于机器学习框架的数据分类方法及相关设备
CN116403019A (zh) 遥感图像量子识别方法、装置、存储介质及电子装置
CN116011681A (zh) 一种气象数据预测方法、装置、存储介质及电子装置
CN114372539A (zh) 基于机器学习框架的分类方法及相关设备
CN114819163A (zh) 量子生成对抗网络的训练方法、装置、介质及电子装置
CN115545947A (zh) 基于变分量子线路的最优投资组合确定方法及相关装置
CN114974405A (zh) 基于量子gnn的结合能预测方法
CN114764619A (zh) 一种基于量子线路的卷积操作方法及装置
CN114819170A (zh) 基于量子线路的期权估算方法、装置、介质及电子装置
CN115409185A (zh) 一种线性函数对应的量子线路的构建方法及装置
CN114372582B (zh) 基于机器学习框架的量子自动编码方法及相关装置
CN114372584B (zh) 基于机器学习框架的迁移学习方法及相关装置
CN114862079A (zh) 基于量子线路的风险值估算方法、装置、介质及电子装置
CN114764620B (zh) 一种量子卷积操作器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant