CN117974816A - 选取数据编码方式的方法、装置、计算机设备及存储介质 - Google Patents
选取数据编码方式的方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN117974816A CN117974816A CN202410372715.3A CN202410372715A CN117974816A CN 117974816 A CN117974816 A CN 117974816A CN 202410372715 A CN202410372715 A CN 202410372715A CN 117974816 A CN117974816 A CN 117974816A
- Authority
- CN
- China
- Prior art keywords
- data
- difference
- label
- tag
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 105
- 238000009826 distribution Methods 0.000 claims abstract description 120
- 238000011156 evaluation Methods 0.000 claims abstract description 79
- 239000011159 matrix material Substances 0.000 claims description 107
- 238000012545 processing Methods 0.000 claims description 31
- 238000010801 machine learning Methods 0.000 claims description 28
- 230000015654 memory Effects 0.000 claims description 26
- 230000006870 function Effects 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 230000000694 effects Effects 0.000 description 27
- 238000012549 training Methods 0.000 description 6
- 241000282472 Canis lupus familiaris Species 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明涉及人工智能技术领域,公开了选取数据编码方式的方法、装置、计算机设备及存储介质,该方法包括:获取待编码的数据集,数据集包括多个标注有标签的图像数据;根据多种数据编码方式,对数据集分别进行编码处理,生成每种数据编码方式对应的量子态集;对于每种数据编码方式对应的量子态集,根据不同标签所对应的量子态之间的差异程度确定相应数据编码方式的差异参数,进而确定数据编码方式的评价参数;选取最大评价参数所对应的数据编码方式作为所述数据集编码所需的目标数据编码方式。本发明利用不同标签所对应的量子态之间的差异程度能够比较准确地表征不同标签量子态的分布情况,从而能够选取出分布合理的量子态。
Description
技术领域
本发明涉及人工智能技术领域,具体涉及选取数据编码方式的方法、装置、计算机设备及存储介质。
背景技术
随着量子计算的研究深入,其与机器学习的结合逐步成为一个崭新的研究方向。量子机器学习在是人工智能研究中的极具潜力的前沿课题,同时它也很可能是未来人工智能发展的新热点。在使用量子机器学习处理图像数据时,首先要将图像数据编码到量子电路,或者说编码为量子态的形式,才能为量子机器学习的算法或模型作用。
目前量子机器学习编码图像数据的工作具有多种方式。比如将图像数据中的特征作为参数编码进量子旋转门中,作用到对应的量子比特上。还有各种振幅编码方式,是将特征编码到最终量子比特各个量子态对应的振幅中。
面对种类繁多的数据编码方式,一般基于人为经验选取合适的数据编码方式,但对于不同的图像数据,可能需要采用不同的数据编码方式,这种人为选取的方式可能导致编码后的量子态分布不合理,对后续的训练过程带来更多的冗余工作,甚至影响最终的结果。
发明内容
有鉴于此,本发明提供了一种选取数据编码方式的方法、装置、计算机设备及存储介质,以解决编码后的量子态分布不合理的问题。
第一方面,本发明提供了一种选取数据编码方式的方法,包括:
获取待编码的数据集,所述数据集包括多个标注有标签的图像数据;
根据多种数据编码方式,对所述数据集中的图像数据分别进行编码处理,生成每种所述数据编码方式对应的量子态集;所述量子态集包括多个对所述图像数据进行编码处理所生成的量子态;
对于每种所述数据编码方式对应的量子态集,根据不同标签所对应的量子态之间的差异程度确定相应数据编码方式的差异参数;
根据所述数据编码方式的差异参数,确定所述数据编码方式的评价参数;
选取最大评价参数所对应的数据编码方式作为所述数据集编码所需的目标数据编码方式。
在一些可选的实施方式中,所述根据不同标签所对应的量子态之间的差异程度确定相应数据编码方式的差异参数,包括:
根据对应同一种标签的至少部分量子态,计算所述标签所对应的密度矩阵;
计算不同标签所对应的密度矩阵之间的差异程度;
根据不同标签所对应的密度矩阵之间的差异程度,确定相应数据编码方式的差异参数。
在一些可选的实施方式中,所述标签所对应的密度矩阵满足:
其中,A表示标签的索引,表示标签A所对应的密度矩阵,/>表示图像数据对应的量子态,/>表示量子态/>的外积,/>表示标注有标签A的图像数据的数量。
在一些可选的实施方式中,所述计算不同标签所对应的密度矩阵之间的差异程度,包括:
将多种标签两两作为一组,形成标签组;
对于任一所述标签组,确定所述标签组内第一标签所对应的密度矩阵与第二标签所对应的密度矩阵之间的距离;将所述标签组所对应的距离作为所述第一标签与所述第二标签之间的差异程度。
在一些可选的实施方式中,所述确定所述标签组内第一标签所对应的密度矩阵与第二标签所对应的密度矩阵之间的距离,包括:
确定所述标签组内第一标签所对应的密度矩阵与第二标签所对应的密度矩阵之间的迹距离;所述迹距离满足:
其中,表示第一标签i所对应的密度矩阵,/>表示第二标签j所对应的密度矩阵,表示迹函数,/>表示第一标签i所对应的密度矩阵/>与第二标签j所对应的密度矩阵/>之间的距离。
在一些可选的实施方式中,所述根据不同标签所对应的密度矩阵之间的差异程度,确定相应数据编码方式的差异参数,包括:
对多个所述标签组所对应的距离进行均值处理,计算得到相应数据编码方式的差异参数。
在一些可选的实施方式中,所述对多个所述标签组所对应的距离进行均值处理,计算得到相应数据编码方式的差异参数,包括:
确定所述标签组的数量L;其中,,C表示所述标签的种类数;
将L个所述标签组所对应的距离均值,作为相应数据编码方式的差异参数:
其中,表示第一标签i所对应的密度矩阵/>与第二标签j所对应的密度矩阵/>之间的距离,/>表示差异参数。
在一些可选的实施方式中,该方法还包括:
对于每种所述数据编码方式对应的量子态集,确定用于表示所述量子态分布集中程度的分布参数;所述量子态分布越集中,所述分布参数越大;
所述根据所述数据编码方式的差异参数,确定所述数据编码方式的评价参数,包括:
根据所述数据编码方式的差异参数和分布参数,确定所述数据编码方式的评价参数;其中,所述差异参数和所述分布参数与所述评价参数之间均为正相关关系。
在一些可选的实施方式中,所述确定用于表示所述量子态分布集中程度的分布参数,包括:
根据对应同一种标签的至少部分量子态,计算所述标签所对应的集中程度;
根据多个所述标签所对应的集中程度,综合确定相应数据编码方式的分布参数。
在一些可选的实施方式中,所述根据对应同一种标签的至少部分量子态,计算所述标签所对应的集中程度,包括:
根据对应同一种标签的至少部分量子态,计算所述标签所对应的密度矩阵;
对所述标签所对应的密度矩阵进行求迹处理,将计算得到的迹作为所述标签所对应的集中程度:
其中,A表示标签的索引,表示标签A所对应的密度矩阵,/>表示迹函数,表示标签A所对应的集中程度。
在一些可选的实施方式中,所述根据多个所述标签所对应的集中程度,综合确定相应数据编码方式的分布参数,包括:
将多个所述标签所对应的集中程度的均值,作为相应数据编码方式的分布参数:
其中,表示第i种标签所对应的集中程度,C表示所述标签的种类数,/>表示分布参数。
在一些可选的实施方式中,所述根据所述数据编码方式的差异参数和分布参数,确定所述数据编码方式的评价参数,包括:
对所述数据编码方式的差异参数和分布参数进行加权求和,确定所述数据编码方式的评价参数;所述评价参数满足:
其中,表示分布参数,/>表示差异参数表示,/>表示分布参数的权重,表示差异参数的权重。
在一些可选的实施方式中,所述分布参数的权重与所述差异参数的权重相同。
在一些可选的实施方式中,所述获取待编码的数据集,包括:
获取包括多个原始图像数据的原始数据集;所述原始图像数据标注有相应的标签;
将所述原始图像数据转换为有W×H个元素的特征向量;W为所述原始图像数据的宽度,H为所述原始图像数据的高度;
将所述特征向量作为后续编码处理所需的图像数据。
在一些可选的实施方式中,所述多种数据编码方式包括:基本量子编码方法、密集角编码方法、振幅编码方法中的至少一种。
在一些可选的实施方式中,该方法还包括:
根据所述目标数据编码方式,对所述数据集中的图像数据分别进行编码处理,生成每个所述图像数据对应的目标量子态;
根据所述目标量子态执行量子机器学习任务。
第二方面,本发明提供了一种选取数据编码方式的装置,包括:
数据获取模块,用于获取待编码的数据集,所述数据集包括多个标注有标签的图像数据;
编码模块,用于根据多种数据编码方式,对所述数据集中的图像数据分别进行编码处理,生成每种所述数据编码方式对应的量子态集;所述量子态集包括多个对所述图像数据进行编码处理所生成的量子态;
差异参数确定模块,用于对于每种所述数据编码方式对应的量子态集,根据不同标签所对应的量子态之间的差异程度确定相应数据编码方式的差异参数;
评价参数确定模块,用于根据所述数据编码方式的差异参数,确定所述数据编码方式的评价参数;
选取模块,用于选取最大评价参数所对应的数据编码方式作为所述数据集编码所需的目标数据编码方式。
第三方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的选取数据编码方式的方法。
第四方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的选取数据编码方式的方法。
第五方面,本发明提供了一种计算机程序产品,包括计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的选取数据编码方式的方法。
本发明利用图像数据标注有标签的特点,对于某数据编码方式对应的量子态集,可以根据量子态所对应的标签对量子态进行分组,从而能够确定不同标签所对应的量子态之间的差异程度;基于该差异程度确定该数据编码方式的评价参数,进而基于多个数据编码方式的评价参数选取出不同标签之间具有较大差异量子态的目标数据编码方式。该方法实现简单,且利用不同标签所对应的量子态之间的差异程度能够比较准确地表征不同标签量子态的分布情况,从而能够选取出分布合理的量子态,保证基于选取出的目标数据编码方式所得到的量子态具有较好的编码效果,大大提升了后续量子机器学习的效率和效果。
将转换后的特征向量作为后续需要编码处理的图像数据,便于后续对其进行编码处理,生成相应的量子态。确定标签所对应的密度矩阵,基于密度矩阵可以比较简单地表示差异参数和分布参数,便于快速评价数据编码方式的编码效果;以重复的方式两两选取标签,形成标签组,能够基于更全面的差异程度计算数据编码方式的差异参数。结合差异参数和分布参数,能够更准确地表征数据编码方式的编码效果,从而可以更准确地选取出目标数据编码方式。
附图说明
为了更清楚地说明本发明具体实施方式或相关技术中的技术方案,下面将对具体实施方式或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的选取数据编码方式的方法的流程示意图;
图2是根据本发明实施例的另一选取数据编码方式的方法的流程示意图;
图3是根据本发明实施例的再一选取数据编码方式的方法的流程示意图;
图4是根据本发明实施例的选取数据编码方式的装置的结构框图;
图5是本发明实施例的计算机设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明实施例,提供了一种选取数据编码方式的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在使用量子机器学习处理图像数据时,首先要将图像数据编码到量子电路,或者说编码为量子态的形式,才能为量子机器学习的算法或模型作用。数据的分布可以对算法或模型的最终结果产生影响,所以将图像数据编码是量子机器学习首要的也是十分重要的步骤。
目前量子机器学习编码图像数据的工作具有多种方式。但在量子机器学习中使用这些编码方式存在以下的问题:编码方式种类繁多,但对于不同的数据,采用哪种编码方式可以更高效的进行后续的学习过程并无法确定。目前还是通过人为选择编码方式,这可能会由于编码后的量子态数据的分布不合理,对后续的训练过程带来更多的冗余工作,甚至影响最终的结果。
本发明实施例提供一种选取数据编码方式的方法,获取待编码的数据集,数据集包括多个标注有标签的图像数据;根据多种数据编码方式,对数据集中的图像数据分别进行编码处理,生成每种数据编码方式对应的量子态集;量子态集包括多个对图像数据进行编码处理所生成的量子态;对于每种数据编码方式对应的量子态集,根据不同标签所对应的量子态之间的差异程度确定相应数据编码方式的差异参数;根据数据编码方式的差异参数,确定数据编码方式的评价参数;根据多种数据编码方式的评价参数,选取至少一种数据编码方式作为数据集编码所需的目标数据编码方式。该方法可以快速分析量子机器学习编码图像数据后得到的量子态数据分布特点,可以用参数来评价编码方式的效果,进而能够选择最合适的数据编码方式,从而可以提升量子机器学习的效率。
在本实施例中提供了一种选取数据编码方式的方法,可应用于服务器等可实现量子计算的设备,如AI服务器。图1是根据本发明实施例的选取数据编码方式的方法的流程图,如图1所示,该流程包括以下步骤。
步骤S101,获取待编码的数据集,该数据集包括多个标注有标签的图像数据。
本实施例中,对某数据集进行量子机器学习时,需要对该数据集中的数据进行编码处理,以能够执行后续的量子计算。其中,该数据集包括多个图像数据,且每个图像数据均标注有相应的标签,以表示图像数据所对应的分类。
例如,若该数据集用于训练能够区分猫与狗的分类数据集,则其中的图像数据为猫或狗的图像,且标注有相应的标签;例如,猫图像的标签为Label=“cat”,狗图像的标签为Label=“dog”,即该数据集共具有两种标签。或者,若该数据集用于识别0~9的阿拉伯数字,则其中的图像数据分别标注有相应的标签,例如Label=“1”、Label=“2”等,且该数据集共具有10种标签。
步骤S102,根据多种数据编码方式,对数据集中的图像数据分别进行编码处理,生成每种数据编码方式对应的量子态集;量子态集包括多个对图像数据进行编码处理所生成的量子态。
本实施例中,可以预先设置多种数据编码方式,该数据编码方式可以是已有的编码方式,也可以是自行设计的编码方式,本实施例对此不作限定。
对于上述的数据集,基于任一种数据编码方式,均可对该数据集中的每个图像数据进行编码处理,从而确定该图像数据的量子态;并且,对于其中一种数据编码方式,基于该数据编码方式可以对数据集中的N个图像数据分别进行编码处理,得到每个图像数据对应的量子态,共N个量子态,可以将该N个量子态形成一个集合,作为该数据编码方式所对应的量子态集。
可以理解,通过对数据集中的图像数据进行编码处理,可以确定每种数据编码方式所对应的量子态集,且每个量子态集均包括N个量子态。
步骤S103,对于每种数据编码方式对应的量子态集,根据不同标签所对应的量子态之间的差异程度确定相应数据编码方式的差异参数。
本实施例中,如上所述,每种数据编码方式均对应一个量子态集,对于每个量子态集,可以按照类似的处理方式进行处理,以能够评价相应数据编码方式的编码效果。后续主要以其中一个量子态集为例进行说明。
具体地,对于某个数据编码方式对应的量子态集,其包括N个标注有标签的图像数据所编码生成的量子态,故在该量子态集中,每个量子态也对应有相应的标签。因此,基于标签是否相同,可以对量子态集中的N个量子态进行分组,每一组内的量子态均对应同一种标签。例如,若该数据集共有C种标签,则可以将这些量子态分为C组。例如,若该数据集为上述的用于识别0~9的阿拉伯数字的数据集,则C=10。
本实施例中,可以确定不同量子态组之间的差异程度,基于该差异程度来确定相应数据编码方式的差异参数。其中,由于不同量子态组对应的不同的标签,为了能够更好地区分不同种的量子态,则需要不同量子态组之间具有足够大的差异程度,即需要相应数据编码方式的差异参数也足够大。换句话说,某数据编码方式的差异参数越大,表示使用该数据编码方式对数据集进行编码的编码效果越好,越能区分不同标签的量子态。
对于其他的数据编码方式,均可按照相同的方式确定其所对应的差异参数,此处不作详述。
步骤S104,根据数据编码方式的差异参数,确定数据编码方式的评价参数。
本实施例中,如上所述,数据编码方式的差异参数,可以表示该数据编码方式的编码效果,故基于数据编码方式的差异参数,可以确定用于评价数据编码方式是否可用的参数,即评价参数。其中,该差异参数与评价参数之间为正相关关系,即差异参数越大,评价参数也越大。例如,可以直接将数据编码方式的差异参数,作为该数据编码方式的评价参数。
步骤S105,选取最大评价参数所对应的数据编码方式作为数据集编码所需的目标数据编码方式。
本实施例中,在确定多种数据编码方式的评价参数后,基于这些评价参数,即可确定每一种数据编码方式对该数据集的编码效果,进而选取出适用于该数据集的一种或多种数据编码方式,即目标数据编码方式,使得后续能够基于该目标数据编码方式对该数据集进行编码处理。
一般情况下,选取编码效果最好的数据编码方式,作为该数据集编码所需的目标数据编码方式。例如,若数据编码方式的评价参数为上述的差异参数,由于差异参数越大,表示使用该数据编码方式对数据集进行编码的编码效果越好,故此时可以将评价参数最大的数据编码方式作为数据集编码所需的目标数据编码方式。
可选地,在上述步骤S105“选取最大评价参数所对应的数据编码方式作为数据集编码所需的目标数据编码方式”之后,该方法还可以包括:根据目标数据编码方式,对数据集中的图像数据分别进行编码处理,生成每个图像数据对应的目标量子态;根据目标量子态执行量子机器学习任务。
本实施例中,在对数据集执行量子机器学习任务之前,可以先基于上述步骤S101至步骤S105,选取出适用于该数据集的目标数据编码方式,之后每当需要对该数据集进行量子机器学习时,即可基于该标数据编码方式将数据集中的N个图像数据编码为N个量子态,即目标量子态,进而可以使用该N个目标量子态执行量子机器学习任务。利用该目标数据编码方式,可以使得目标量子态分布比较合理,能够更高效地执行该学习过程,保证量子机器学习的效率和效果。
本实施例提供的选取数据编码方式的方法,利用图像数据标注有标签的特点,对于某数据编码方式对应的量子态集,可以根据量子态所对应的标签对量子态进行分组,从而能够确定不同标签所对应的量子态之间的差异程度;基于该差异程度确定该数据编码方式的评价参数,进而基于多个数据编码方式的评价参数选取出不同标签之间具有较大差异量子态的目标数据编码方式。该方法实现简单,且利用不同标签所对应的量子态之间的差异程度能够比较准确地表征不同标签量子态的分布情况,从而能够选取出分布合理的量子态,保证基于选取出的目标数据编码方式所得到的量子态具有较好的编码效果,大大提升了后续量子机器学习的效率和效果。
在本实施例中提供了一种选取数据编码方式的方法,可应用于服务器等可实现量子计算的设备,如AI服务器。图2是根据本发明实施例的选取数据编码方式的方法的流程图,如图2所示,该流程包括以下步骤。
步骤S201,获取待编码的数据集,该数据集包括多个标注有标签的图像数据。
详细请参见图1所示实施例的步骤S101,在此不再赘述。
在一些可选的实施方式中,上述步骤S201“获取待编码的数据集”,可以包括以下步骤A1至步骤A3。
步骤A1,获取包括多个原始图像数据的原始数据集;原始图像数据标注有相应的标签。
步骤A2,将原始图像数据转换为有W×H个元素的特征向量;W为原始图像数据的宽度,H为原始图像数据的高度。
步骤A3,将特征向量作为后续编码处理所需的图像数据。
本实施例中,原始图像数据一般都是以矩阵形式保存的,原始图像数据的宽度为W,高度为H;该宽度W具体为宽度方向上的像素点数量,或者说原始图像数据的列数,该高度H具体为高度方向上的像素点数量,或者说原始图像数据的行数,即原始图像数据为H行W列的矩阵。为便于后续基于数据编码方式,在编码前,可以将原始图像数据转换为一维的特征向量,该特征向量/>包括W×H个元素,每个元素对应原始图像数据中的一个像素点。
将转换后的特征向量作为后续需要编码处理的图像数据,并形成相应的数据集。
在下述步骤S202进行编码处理时,基于数据编码方法可以将图像数据(即特征向量)编码为相应的量子态/>,其中,/>为狄拉克符号。例如,若共设有n种数据编码方法E1、E2、…、En,基于这些数据编码方法分别对同一张图像数据进行编码,可以得到相应的量子态/>。
可选地,多种数据编码方式包括:基本量子编码方法、密集角编码方法、振幅编码方法中的至少一种。
具体地,例如,对于具有m个特征值的图像数据(即m=W×H),基于基本量子编码方法,可以编码为相应的量子态,/>,基于密集角编码方法,可以编码为/>,基于振幅编码方法可以编码为/>。
步骤S202,根据多种数据编码方式,对数据集中的图像数据分别进行编码处理,生成每种数据编码方式对应的量子态集;量子态集包括多个对图像数据进行编码处理所生成的量子态。
详细请参见图1所示实施例的步骤S102,在此不再赘述。
步骤S203,对于每种数据编码方式对应的量子态集,根据不同标签所对应的量子态之间的差异程度确定相应数据编码方式的差异参数。
详细请参见图1所示实施例的步骤S103,在此不再赘述。
在一些可选的实施方式中,所述步骤S203“根据不同标签所对应的量子态之间的差异程度确定相应数据编码方式的差异参数”可以包括以下步骤B1至步骤B3。
步骤B1,根据对应同一种标签的至少部分量子态,计算标签所对应的密度矩阵。
本实施例中,对于某种数据编码方式对应的量子态集,其包括N个量子态,其每个量子态对应相应的标签。对于对应同一种标签的量子态中,可以从中选取部分或全部的量子态,基于所选取的量子态计算该标签所对应的密度矩阵。
一般情况下,对于某种标签,选取所有的对应该标签的量子态,基于所选取的所有量子态计算该标签所对应的密度矩阵。
例如,若数据集具有C种标签,则可以基于标签是否相同将N个量子态分为C个量子态组,每个量子态组包含mi个相同标签的量子态,i=1,2,…,C,且所有mi之和为N。对于第i种标签所对应的量子态,其数量为mi,可以基于该mi个量子态计算该第i个标签所对应的密度矩阵。
可选地,可以基于量子态的外积计算密度矩阵。具体地,标签所对应的密度矩阵满足下式(1):
其中,A表示标签的索引,表示标签A所对应的密度矩阵,/>表示图像数据对应的量子态,/>表示量子态/>的外积,/>表示标注有标签A的图像数据的数量,也是量子态集中对应该标签A的量子态的数量。
可以理解,上式(1)中,只对标签为A(Label=A)的量子态求其外积,并进行求和。类似地,对于标签为B(Label=B)的量子态,与上式(1)相似,可以该标签B的密度矩阵/>为/>;可以理解,其中的/>表示标注有标签B的图像数据的数量,也是量子态集中对应该标签B的量子态的数量。
步骤B2,计算不同标签所对应的密度矩阵之间的差异程度。
本实施例中,对于每一种标签,均可确定相应的密度矩阵。例如,若数据集具有C种标签,则可确定C个密度矩阵,i=1,2,…,C。对于不同标签所对应的密度矩阵,可以确定二者之间的差异程度。
一般情况下,可以两两确定标签所对应的密度矩阵之间的差异程度。具体地,上述步骤B2“计算不同标签所对应的密度矩阵之间的差异程度”可以包括以下步骤B21至步骤B22。
步骤B21,将多种标签两两作为一组,形成标签组。
本实施例中,对于数据集的C种标签,可以两两进行组合,形成标签组。此外,由于数据集至少包括2种标签,即C≥2,故最少也可以形成一个标签组,即标签组的数量为一个或多个。
其中,在基于C种标签形成标签组时,可以从C种标签中以不重复的方式选取两个标签,形成标签组,此时,标签组的数量为,/>表示向下取整函数。或者,也可以从C种标签中以重复的方式选取两个标签,形成标签组,此时,根据组合公式可得,标签组的数量为。
例如,若数据集具有4种标签:标签a、标签b、标签c、标签d,则以不重复的方式进行选取,可以形成两个标签组,例如标签组[标签a, 标签b]和标签组[标签c, 标签d];而以重复的方式进行选取,可以形成6个标签组,具体为:[标签a, 标签b]、[标签a, 标签c]、[标签a, 标签d]、[标签b, 标签c]、[标签b, 标签d]、[标签c, 标签d]。
其中,为后续能够基于更全面的差异程度计算数据编码方式的差异参数,一般以重复的方式两两选取标签,形成标签组。
步骤B22,对于任一标签组,确定标签组内第一标签所对应的密度矩阵与第二标签所对应的密度矩阵之间的距离;将标签组所对应的距离作为第一标签与第二标签之间的差异程度。
本实施例中,对于任一标签组,其包括两个标签,为方便描述,将其中一个标签称为第一标签,将另一个标签称为第二标签。并且,两个密度矩阵之间的距离,可以表示这两个密度矩阵之间的相似程度,即可以表示二者之间的差异;两个密度矩阵之间的距离越大,则这两个密度矩阵之间的差异也越大,因此,本实施例中,以第一标签所对应的密度矩阵与第二标签所对应的密度矩阵之间的距离,表示二者之间的差异程度。
例如,若第一标签为第i个标签,其密度矩阵为,第二标签为第j个标签,其密度矩阵为/>,i≠j。第一标签i所对应的密度矩阵/>与第二标签j所对应的密度矩阵/>之间的距离/>则可作为第一标签i与第二标签j之间的差异程度。
可选地,以两个密度矩阵之间的迹距离(trace distance),表示两个密度矩阵之间的距离,即可以以迹距离表示差异程度。具体地,上述步骤B22“确定标签组内第一标签所对应的密度矩阵与第二标签所对应的密度矩阵之间的距离”,可以包括以下步骤B221。
步骤B221,确定标签组内第一标签所对应的密度矩阵与第二标签所对应的密度矩阵之间的迹距离。
并且,该迹距离满足下式(2):
其中,表示第一标签i所对应的密度矩阵,/>表示第二标签j所对应的密度矩阵,表示迹函数,/>表示第一标签i所对应的密度矩阵/>与第二标签j所对应的密度矩阵/>之间的距离。其中,i、j均为标签的索引,i、j均是在1至C之间的整数,且i≠j,C表示标签的种类数。
其中,迹距离可以表示两个密度矩阵之间的相似度,迹距离越小,则代表两个密度矩阵越相似;相应地,迹距离越大,则表示两个密度矩阵差异程度也越大。
步骤B3,根据不同标签所对应的密度矩阵之间的差异程度,确定相应数据编码方式的差异参数。
本实施例中,在确定不同标签所对应的密度矩阵之间的差异程度之后,例如确定每个标签组的差异程度后,即可基于此计算所需的差异参数。
其中,若数据集只包含两种标签,即C=2,则可以直接将这两种标签所对应的密度矩阵之间的差异程度,作为相应数据编码方式的差异参数;或者,若数据集的标签种类数C≥3,则可以形成多个标签组,此时可以结合多个标签组所对应的差异程度,综合确定数据编码方式的差异参数。
可选地,上述步骤B3“根据不同标签所对应的密度矩阵之间的差异程度,确定相应数据编码方式的差异参数”可以包括以下步骤B31。
步骤B31,对多个标签组所对应的距离进行均值处理,计算得到相应数据编码方式的差异参数。
本实施例中,若数据集的标签种类数较多(例如,C≥3),可以形成多个标签组,则对于每一标签组内的两个标签,均可基于上述步骤B221所示的方式,确定每个标签组所对应的距离;之后,可以对这些标签组所对应的距离进行均值处理,从而计算得到相应数据编码方式的差异参数。
其中,该均值处理可以为算数平均处理,即将多个标签组所对应的距离的算术平均值,作为相应数据编码方式的差异参数;或者,该均值处理也可以为几何平均处理、调和平均处理等,具体可基于实际情况而定。
可选地,可以采用简单的算数平均处理,以快速计算出数据编码方式的差异参数。具体地,上述步骤B31“对多个标签组所对应的距离进行均值处理,计算得到相应数据编码方式的差异参数”可以包括以下步骤B311至步骤B312。
步骤B311,确定标签组的数量N;其中,,C表示标签的种类数。
本实施例中,在确定标签组时,以重复选取的方式,从C种标签中选出两个标签,形成标签组,共可以形成N个标签组。根据组合公式可得,标签组的数量N为。
步骤B312,将N个标签组所对应的距离均值,作为相应数据编码方式的差异参数。并且,该差异参数满足下式(3):
其中,表示第一标签i所对应的密度矩阵/>与第二标签j所对应的密度矩阵/>之间的距离,/>表示差异参数。
本实施例中,在确定每个标签组对应的距离后,即可对这N个距离/>进行求和,将求和结果除以标签组的数量N,即可确定N个标签组所对应的距离均值/>,即相应数据编码方式的差异参数。
其中,由于密度矩阵与密度矩阵/>之间的距离/>,其等同于密度矩阵/>与密度矩阵/>之间的距离/>,故在上式(3)中,不需要重复计算不必要的密度矩阵,其中的索引i<j,即在上式(3)中,只需要/>个距离/>进行求和。
可以理解,若标签组所对应的距离具体为其内两个标签所对应的密度矩阵的迹距离,则N个标签组所对应的距离均值是迹距离的均值。
步骤S204,对于每种数据编码方式对应的量子态集,确定用于表示量子态分布集中程度的分布参数;量子态分布越集中,分布参数越大。
本实施例中,对于每种数据编码方式对应的量子态集,除了基于上述步骤S203确定数据编码方式的差异参数之外,还确定数据编码方式的分布情况,本实施例以分布参数表示其分布情况。
具体地,对于量子态集中的N个量子态,可以确定这些量子态的分布集中程度,量子态的分布越集中,则表示使用该数据编码方式所编码得到的量子态,越能够准确地表示图像数据的特征。因此,基于表示量子态分布集中程度的分布参数,也可评价数据编码方式的编码效果;并且,数据编码方式对应的分布参数越大,该数据编码方式越可能被选为目标数据编码方式。
在一些可选的实施方式中,上述步骤S204“确定用于表示量子态分布集中程度的分布参数”可以包括以下步骤C1至步骤C2。
步骤C1,根据对应同一种标签的至少部分量子态,计算标签所对应的集中程度。
对于某种数据编码方式对应的量子态集,其包括N个量子态,其每个量子态对应相应的标签。对于对应同一种标签的量子态中,可以从中选取部分或全部的量子态,基于所选取的量子态计算该标签的所对应的集中程度。
可选地,上述步骤C1“根据对应同一种标签的至少部分量子态,计算标签所对应的集中程度”包括以下步骤C11至步骤C12。
步骤C11,根据对应同一种标签的至少部分量子态,计算标签所对应的密度矩阵。
本实施例中,与上述步骤B1相似,对于每一种标签的量子态,可以计算得到该标签所对应的密度矩阵,例如可以基于上式(1)计算每种标签所对应的密度矩阵,此处不再赘述。
步骤C12,对标签所对应的密度矩阵进行求迹处理,将计算得到的迹作为标签所对应的集中程度。其中,集中程度满足下式(4):
其中,A表示标签的索引,表示标签A所对应的密度矩阵,/>表示迹函数,表示标签A所对应的集中程度。
本实施例中,对于标签A,在确定该标签A对应的密度矩阵后,取该密度矩阵/>的平方,即密度矩阵/>乘以自身,利用迹函数确定的迹/>,该迹/>即可表示标签A所对应的量子态的分布集中程度。
可以理解,对比标签B,也可基于与上式(4)相似的方式确定标签B所对应的集中程度,且:。
本实施例中,利用密度矩阵的迹,可以简单方便地确定标签所对应的量子态分布的集中程度。其中,标签所对应的迹越大(越接近1),则表示数据分布越集中。
步骤C2,根据多个标签所对应的集中程度,综合确定相应数据编码方式的分布参数。
本实施例中,数据集中至少有两种标签,对于每一种标签,均可确定相应的集中程度。结合多种标签分别对应的集中程度,可以更全面准确地确定相应数据编码方式的分布参数。
可选地,上述步骤C2“根据多个标签所对应的集中程度,综合确定相应数据编码方式的分布参数”可以包括以下步骤C21。
步骤C21,将多个标签所对应的集中程度的均值,作为相应数据编码方式的分布参数。该分布参数满足下式(5):
其中,表示第i种标签所对应的集中程度,C表示标签的种类数,/>表示分布参数。
本实施例中,在确定多种标签所分别对应的集中程度后,确定这些集中程度的均值,将该均值作为相应数据编码方式的分布参数。其中,该均值为算术平均值。
具体地,由于数据集具有C种标签,基于每一种标签所对应的量子态,可以确定每种标签的集中程度,i=1,2,…,C;对这C个集中程度/>求均值,即可确定相应的分布参数/>,具体如上式(5)所示。
步骤S205,根据数据编码方式的差异参数和分布参数,确定数据编码方式的评价参数;其中,差异参数和分布参数与评价参数之间均为正相关关系。
本实施例中,对于每一种数据编码方式,均可以确定相应的差异参数和分布参数,为能够更好地评价数据编码方式的编码效果,综合该差异参数和分布参数,计算得到相应数据编码方式的评价参数。
其中,由于差异参数表示区分不同标签量子态的难易程度,差异参数越大,可以更好地区分不同种的量子态,故此时表示使用该数据编码方式对数据集进行编码的编码效果越好;类似地,分布参数表示量子态分布集中程度,分布参数越大,表示量子态分布越集中,越能够较好的表征量子态的特点,其所对应的数据编码方式的编码效果越好。因此,将最终确定的评价参数设置为与差异参数和分布参数均呈正相关关系,即数据编码方式的差异参数和分布参数越大,数据编码方式的评价参数也越大,越可能被选取为目标数据编码方式。
在一些可选的实施方式中,上述步骤S205“根据数据编码方式的差异参数和分布参数,确定数据编码方式的评价参数”可以包括以下步骤D1。
步骤D1,对数据编码方式的差异参数和分布参数进行加权求和,确定数据编码方式的评价参数;评价参数满足:
其中,表示分布参数,/>表示差异参数表示,/>表示分布参数的权重,表示差异参数的权重。
本实施例中,为分布参数和差异参数分别设置相应的权重,即,基于预设的两个权重对分布参数和差异参数进行加权求和,求和结果即可作为最终确定的评价参数。其中,不同的数据编码方式共用同一组权重/>,以能够统一确定不同数据编码方式的评价参数p。
可选地,分布参数的权重与差异参数的权重/>可以是相同。例如,可以将差异参数与分布参数之和,作为评价参数,即/>。
步骤S206,选取最大评价参数所对应的数据编码方式作为数据集编码所需的目标数据编码方式。
本实施例中,若设有n种数据编码方法E1、E2、…、En,可以基于上述方式确定每一种数据编码方法的评价参数,且n个评价参数依次为:p1,p2,…,pn。从n个评价参数中选取出最大评价参数,将该最大评价参数所对应的数据编码方式作为目标数据编码方式,之后即可使用该目标数据编码方式对该数据集进行量子机器学习。
本实施例提供的选取数据编码方式的方法,通过计算不同分类标签之间的关系,确定每种数据编码方式的效果,从而可以为数据编码方式的选择提供评价指标。相比于在后续量子机器学习过程才能看出数据集的学习效果,可以在训练开始之前就选取最为适合的数据编码方式;由于量子机器学习的训练过程是十分耗费资源的过程,通过本实施例提供的方法可以快速评价量子机器学习的编码方式效果,大大提升模型和算法的开发效率。
将转换后的特征向量作为后续需要编码处理的图像数据,便于后续对其进行编码处理,生成相应的量子态。确定标签所对应的密度矩阵,基于密度矩阵可以比较简单地表示差异参数和分布参数,便于快速评价数据编码方式的编码效果;以重复的方式两两选取标签,形成标签组,能够基于更全面的差异程度计算数据编码方式的差异参数。结合差异参数和分布参数,能够更准确地表征数据编码方式的编码效果,从而可以更准确地选取出目标数据编码方式。
在一些可选的实施方式中,在结合数据编码方式的差异参数和分布参数确定其评价参数的情况下,可以基于密度矩阵的迹确定分布参数,可以基于密度矩阵的迹距离确定差异参数,使得分布参数和差异参数均是从矩阵迹的维度所确定的参数,能够提高二者之间的统一性,从而可以计算得到更准确地评价参数,即该评价参数可以更准确地评价数据编码方式的编码效果。
具体地,在这种情况下,可以先计算每一标签对应的密度矩阵,之后再分别计算差异参数和分布参数。如图3所示,该选取数据编码方式的方法包括以下步骤S301至步骤S309。
步骤S301,获取待编码的数据集。该数据集包括多个标注有标签的图像数据。
步骤S302,选择需要衡量编码效果的n种数据编码方式。
步骤S303,对于每一种数据编码方式,计算每一种标签对应的密度矩阵。
步骤S304,将标签两两作为一组,计算每一标签组内两个标签所对应的密度矩阵之间的迹距离。
步骤S305,对两两组合之间的迹距离求和并取平均,得到相应数据编码方式的差异参数。
步骤S306,计算每一种标签对应的密度矩阵的迹。例如,基于上式(4)得到每种标签的迹。
步骤S307,计算各标签的迹的平均值,将该平均值作为相应数据编码方式的分布参数。
步骤S308,将数据表码方式的差异参数与分布参数之和,作为该数据编码方式的评价参数。即。
步骤S309,将最大评价参数对应的数据编码方式作为选取的目标数据编码方式。
例如,若最大评价参数对应的数据编码方式为Ec,则之后可以通过数据编码方式Ec,将图像数据编码为量子态,然后通过机器学习算法进行训练,并完成分类任务。
在本实施例中还提供了一种选取数据编码方式的装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以是实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种选取数据编码方式的装置,如图4所示,包括:
数据获取模块401,用于获取待编码的数据集,所述数据集包括多个标注有标签的图像数据;
编码模块402,用于根据多种数据编码方式,对所述数据集中的图像数据分别进行编码处理,生成每种所述数据编码方式对应的量子态集;所述量子态集包括多个对所述图像数据进行编码处理所生成的量子态;
差异参数确定模块403,用于对于每种所述数据编码方式对应的量子态集,根据不同标签所对应的量子态之间的差异程度确定相应数据编码方式的差异参数;
评价参数确定模块404,用于根据所述数据编码方式的差异参数,确定所述数据编码方式的评价参数;
选取模块405,用于选取最大评价参数所对应的数据编码方式作为数据集编码所需的目标数据编码方式。
在一些可选的实施方式中,所述差异参数确定模块403根据不同标签所对应的量子态之间的差异程度确定相应数据编码方式的差异参数,包括:
根据对应同一种标签的至少部分量子态,计算所述标签所对应的密度矩阵;
计算不同标签所对应的密度矩阵之间的差异程度;
根据不同标签所对应的密度矩阵之间的差异程度,确定相应数据编码方式的差异参数。
在一些可选的实施方式中,所述标签所对应的密度矩阵满足:
其中,A表示标签的索引,表示标签A所对应的密度矩阵,/>表示图像数据对应的量子态,/>表示量子态/>的外积,/>表示标注有标签A的图像数据的数量。
在一些可选的实施方式中,所述差异参数确定模块403计算不同标签所对应的密度矩阵之间的差异程度,包括:
将多种标签两两作为一组,形成标签组;
对于任一所述标签组,确定所述标签组内第一标签所对应的密度矩阵与第二标签所对应的密度矩阵之间的距离;将所述标签组所对应的距离作为所述第一标签与所述第二标签之间的差异程度。
在一些可选的实施方式中,所述差异参数确定模块403确定所述标签组内第一标签所对应的密度矩阵与第二标签所对应的密度矩阵之间的距离,包括:
确定所述标签组内第一标签所对应的密度矩阵与第二标签所对应的密度矩阵之间的迹距离;所述迹距离满足:
其中,表示第一标签i所对应的密度矩阵,/>表示第二标签j所对应的密度矩阵,表示迹函数,/>表示第一标签i所对应的密度矩阵/>与第二标签j所对应的密度矩阵/>之间的距离。
在一些可选的实施方式中,所述差异参数确定模块403根据不同标签所对应的密度矩阵之间的差异程度,确定相应数据编码方式的差异参数,包括:
对多个所述标签组所对应的距离进行均值处理,计算得到相应数据编码方式的差异参数。
在一些可选的实施方式中,所述差异参数确定模块403对多个所述标签组所对应的距离进行均值处理,计算得到相应数据编码方式的差异参数,包括:
确定所述标签组的数量L;其中,,C表示所述标签的种类数;
将L个所述标签组所对应的距离均值,作为相应数据编码方式的差异参数:
其中,表示第一标签i所对应的密度矩阵/>与第二标签j所对应的密度矩阵/>之间的距离,/>表示差异参数。
在一些可选的实施方式中,该装置还包括分布参数确定模块,用于:对于每种所述数据编码方式对应的量子态集,确定用于表示所述量子态分布集中程度的分布参数;所述量子态分布越集中,所述分布参数越大;
所述评价参数确定模块404根据所述数据编码方式的差异参数,确定所述数据编码方式的评价参数,包括:
根据所述数据编码方式的差异参数和分布参数,确定所述数据编码方式的评价参数;其中,所述差异参数和所述分布参数与所述评价参数之间均为正相关关系。
在一些可选的实施方式中,所述分布参数确定模块确定用于表示所述量子态分布集中程度的分布参数,包括:
根据对应同一种标签的至少部分量子态,计算所述标签所对应的集中程度;
根据多个所述标签所对应的集中程度,综合确定相应数据编码方式的分布参数。
在一些可选的实施方式中,所述分布参数确定模块根据对应同一种标签的至少部分量子态,计算所述标签所对应的集中程度,包括:
根据对应同一种标签的至少部分量子态,计算所述标签所对应的密度矩阵;
对所述标签所对应的密度矩阵进行求迹处理,将计算得到的迹作为所述标签所对应的集中程度:
其中,A表示标签的索引,表示标签A所对应的密度矩阵,/>表示迹函数,表示标签A所对应的集中程度。
在一些可选的实施方式中,所述分布参数确定模块根据多个所述标签所对应的集中程度,综合确定相应数据编码方式的分布参数,包括:
将多个所述标签所对应的集中程度的均值,作为相应数据编码方式的分布参数:
其中,表示第i种标签所对应的集中程度,C表示所述标签的种类数,/>表示分布参数。
在一些可选的实施方式中,所述评价参数确定模块404根据所述数据编码方式的差异参数和分布参数,确定所述数据编码方式的评价参数,包括:
对所述数据编码方式的差异参数和分布参数进行加权求和,确定所述数据编码方式的评价参数;所述评价参数满足:/>
其中,表示分布参数,/>表示差异参数表示,/>表示分布参数的权重,表示差异参数的权重。
在一些可选的实施方式中,所述分布参数的权重与所述差异参数的权重相同。
在一些可选的实施方式中,所述数据获取模块401获取待编码的数据集,包括:
获取包括多个原始图像数据的原始数据集;所述原始图像数据标注有相应的标签;
将所述原始图像数据转换为有W×H个元素的特征向量;W为所述原始图像数据的宽度,H为所述原始图像数据的高度;
将所述特征向量作为后续编码处理所需的图像数据。
在一些可选的实施方式中,所述多种数据编码方式包括:基本量子编码方法、密集角编码方法、振幅编码方法中的至少一种。
在一些可选的实施方式中,该装置还包括:
执行模块,用于根据所述目标数据编码方式,对所述数据集中的图像数据分别进行编码处理,生成每个所述图像数据对应的目标量子态;根据所述目标量子态执行量子机器学习任务。
上述各个模块和单元的更进一步的功能描述与上述对应实施例相同,在此不再赘述。例如,本实施例提供的选取数据编码方式的装置,利用图像数据标注有标签的特点,对于某数据编码方式对应的量子态集,可以根据量子态所对应的标签对量子态进行分组,从而能够确定不同标签所对应的量子态之间的差异程度;基于该差异程度确定该数据编码方式的评价参数,进而基于多个数据编码方式的评价参数选取出不同标签之间具有较大差异量子态的目标数据编码方式。该装置实现简单,且利用不同标签所对应的量子态之间的差异程度能够比较准确地表征不同标签量子态的分布情况,从而能够选取出分布合理的量子态,保证基于选取出的目标数据编码方式所得到的量子态具有较好的编码效果,大大提升了后续量子机器学习的效率和效果。
本实施例中的选取数据编码方式的装置是以功能单元的形式来呈现,这里的单元是指ASIC(Application Specific Integrated Circuit,专用集成电路)电路,包括执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
本发明实施例还提供一种计算机设备,具有上述图4所示的选取数据编码方式的装置。
请参阅图5,图5是本发明可选实施例提供的一种计算机设备的结构示意图,如图5所示,该计算机设备包括:一个或多个处理器10、存储器20,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相通信连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在计算机设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在一些可选的实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器一起使用。同样,可以连接多个计算机设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器10为例。
处理器10可以是中央处理器,网络处理器或其组合。其中,处理器10还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路,可编程逻辑器件或其组合。上述可编程逻辑器件可以是复杂可编程逻辑器件,现场可编程逻辑门阵列,通用阵列逻辑或其任意组合。
其中,所述存储器20存储有可由至少一个处理器10执行的指令,以使所述至少一个处理器10执行实现上述实施例示出的方法。
存储器20可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器20可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些可选的实施方式中,存储器20可选包括相对于处理器10远程设置的存储器,这些远程存储器可以通过网络连接至该计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
存储器20可以包括易失性存储器,例如,随机存取存储器;存储器也可以包括非易失性存储器,例如,快闪存储器,硬盘或固态硬盘;存储器20还可以包括上述种类的存储器的组合。
该计算机设备还包括输入装置30和输出装置40。处理器10、存储器20、输入装置30和输出装置40可以通过总线或者其他方式连接,图5中以通过总线连接为例。
输入装置30可接收输入的数字或字符信息,以及产生与该计算机设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等。输出装置40可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。上述显示设备包括但不限于液晶显示器,发光二极管,显示器和等离子体显示器。在一些可选的实施方式中,显示设备可以是触摸屏。
本发明实施例还提供了一种计算机可读存储介质,上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可记录在存储介质,或者被实现通过网络下载的原始存储在远程存储介质或非暂时机器可读存储介质中并将被存储在本地存储介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件的存储介质上的这样的软件处理。其中,存储介质可为磁碟、光盘、只读存储记忆体、随机存储记忆体、快闪存储器、硬盘或固态硬盘等;进一步地,存储介质还可以包括上述种类的存储器的组合。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件,当软件或计算机代码被计算机、处理器或硬件访问且执行时,实现上述实施例示出的方法。
本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。本领域技术人员应能理解,计算机程序指令在计算机可读介质中的存在形式包括但不限于源文件、可执行文件、安装包文件等,相应地,计算机程序指令被计算机执行的方式包括但不限于:该计算机直接执行该指令,或者该计算机编译该指令后再执行对应的编译后程序,或者该计算机读取并执行该指令,或者该计算机读取并安装该指令后再执行对应的安装后程序。在此,计算机可读介质可以是可供计算机访问的任意可用的计算机可读存储介质或通信介质。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (20)
1.一种选取数据编码方式的方法,其特征在于,所述方法包括:
获取待编码的数据集,所述数据集包括多个标注有标签的图像数据;
根据多种数据编码方式,对所述数据集中的图像数据分别进行编码处理,生成每种所述数据编码方式对应的量子态集;所述量子态集包括多个对所述图像数据进行编码处理所生成的量子态;
对于每种所述数据编码方式对应的量子态集,根据不同标签所对应的量子态之间的差异程度确定相应数据编码方式的差异参数;
根据所述数据编码方式的差异参数,确定所述数据编码方式的评价参数;
选取最大评价参数所对应的数据编码方式作为所述数据集编码所需的目标数据编码方式。
2.根据权利要求1所述的方法,其特征在于,所述根据不同标签所对应的量子态之间的差异程度确定相应数据编码方式的差异参数,包括:
根据对应同一种标签的至少部分量子态,计算所述标签所对应的密度矩阵;
计算不同标签所对应的密度矩阵之间的差异程度;
根据不同标签所对应的密度矩阵之间的差异程度,确定相应数据编码方式的差异参数。
3.根据权利要求2所述的方法,其特征在于,所述标签所对应的密度矩阵满足:
其中,A表示标签的索引,表示标签A所对应的密度矩阵,/>表示图像数据对应的量子态,/>表示量子态/>的外积,/>表示标注有标签A的图像数据的数量。
4.根据权利要求2所述的方法,其特征在于,所述计算不同标签所对应的密度矩阵之间的差异程度,包括:
将多种标签两两作为一组,形成标签组;
对于任一所述标签组,确定所述标签组内第一标签所对应的密度矩阵与第二标签所对应的密度矩阵之间的距离;将所述标签组所对应的距离作为所述第一标签与所述第二标签之间的差异程度。
5.根据权利要求4所述的方法,其特征在于,所述确定所述标签组内第一标签所对应的密度矩阵与第二标签所对应的密度矩阵之间的距离,包括:
确定所述标签组内第一标签所对应的密度矩阵与第二标签所对应的密度矩阵之间的迹距离;所述迹距离满足:
其中,表示第一标签i所对应的密度矩阵,/>表示第二标签j所对应的密度矩阵,/>表示迹函数,/>表示第一标签i所对应的密度矩阵/>与第二标签j所对应的密度矩阵之间的距离。
6.根据权利要求4所述的方法,其特征在于,所述根据不同标签所对应的密度矩阵之间的差异程度,确定相应数据编码方式的差异参数,包括:
对多个所述标签组所对应的距离进行均值处理,计算得到相应数据编码方式的差异参数。
7.根据权利要求6所述的方法,其特征在于,所述对多个所述标签组所对应的距离进行均值处理,计算得到相应数据编码方式的差异参数,包括:
确定所述标签组的数量L;其中,,C表示所述标签的种类数;
将L个所述标签组所对应的距离均值,作为相应数据编码方式的差异参数:
其中,表示第一标签i所对应的密度矩阵/>与第二标签j所对应的密度矩阵/>之间的距离,/>表示差异参数。
8.根据权利要求1至7中任一项所述的方法,其特征在于,还包括:
对于每种所述数据编码方式对应的量子态集,确定用于表示所述量子态分布集中程度的分布参数;所述量子态分布越集中,所述分布参数越大;
所述根据所述数据编码方式的差异参数,确定所述数据编码方式的评价参数,包括:
根据所述数据编码方式的差异参数和分布参数,确定所述数据编码方式的评价参数;其中,所述差异参数和所述分布参数与所述评价参数之间均为正相关关系。
9.根据权利要求8所述的方法,其特征在于,所述确定用于表示所述量子态分布集中程度的分布参数,包括:
根据对应同一种标签的至少部分量子态,计算所述标签所对应的集中程度;
根据多个所述标签所对应的集中程度,综合确定相应数据编码方式的分布参数。
10.根据权利要求9所述的方法,其特征在于,所述根据对应同一种标签的至少部分量子态,计算所述标签所对应的集中程度,包括:
根据对应同一种标签的至少部分量子态,计算所述标签所对应的密度矩阵;
对所述标签所对应的密度矩阵进行求迹处理,将计算得到的迹作为所述标签所对应的集中程度:
其中,A表示标签的索引,表示标签A所对应的密度矩阵,/>表示迹函数,/>表示标签A所对应的集中程度。
11.根据权利要求9所述的方法,其特征在于,所述根据多个所述标签所对应的集中程度,综合确定相应数据编码方式的分布参数,包括:
将多个所述标签所对应的集中程度的均值,作为相应数据编码方式的分布参数:
其中,表示第i种标签所对应的集中程度,C表示所述标签的种类数,/>表示分布参数。
12.根据权利要求8所述的方法,其特征在于,所述根据所述数据编码方式的差异参数和分布参数,确定所述数据编码方式的评价参数,包括:
对所述数据编码方式的差异参数和分布参数进行加权求和,确定所述数据编码方式的评价参数;所述评价参数满足:
其中,表示分布参数,/>表示差异参数表示,/>表示分布参数的权重,/>表示差异参数的权重。
13.根据权利要求12所述的方法,其特征在于,所述分布参数的权重与所述差异参数的权重相同。
14.根据权利要求1所述的方法,其特征在于,所述获取待编码的数据集,包括:
获取包括多个原始图像数据的原始数据集;所述原始图像数据标注有相应的标签;
将所述原始图像数据转换为有W×H个元素的特征向量;W为所述原始图像数据的宽度,H为所述原始图像数据的高度;
将所述特征向量作为后续编码处理所需的图像数据。
15.根据权利要求14所述的方法,其特征在于,所述多种数据编码方式包括:基本量子编码方法、密集角编码方法、振幅编码方法中的至少一种。
16.根据权利要求1所述的方法,其特征在于,还包括:
根据所述目标数据编码方式,对所述数据集中的图像数据分别进行编码处理,生成每个所述图像数据对应的目标量子态;
根据所述目标量子态执行量子机器学习任务。
17.一种选取数据编码方式的装置,其特征在于,所述装置包括:
数据获取模块,用于获取待编码的数据集,所述数据集包括多个标注有标签的图像数据;
编码模块,用于根据多种数据编码方式,对所述数据集中的图像数据分别进行编码处理,生成每种所述数据编码方式对应的量子态集;所述量子态集包括多个对所述图像数据进行编码处理所生成的量子态;
差异参数确定模块,用于对于每种所述数据编码方式对应的量子态集,根据不同标签所对应的量子态之间的差异程度确定相应数据编码方式的差异参数;
评价参数确定模块,用于根据所述数据编码方式的差异参数,确定所述数据编码方式的评价参数;
选取模块,用于选取最大评价参数所对应的数据编码方式作为所述数据集编码所需的目标数据编码方式。
18.一种计算机设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1至16中任一项所述的选取数据编码方式的方法。
19.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至16中任一项所述的选取数据编码方式的方法。
20.一种计算机程序产品,其特征在于,包括计算机指令,所述计算机指令用于使计算机执行权利要求1至16中任一项所述的选取数据编码方式的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410372715.3A CN117974816A (zh) | 2024-03-29 | 2024-03-29 | 选取数据编码方式的方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410372715.3A CN117974816A (zh) | 2024-03-29 | 2024-03-29 | 选取数据编码方式的方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117974816A true CN117974816A (zh) | 2024-05-03 |
Family
ID=90863363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410372715.3A Pending CN117974816A (zh) | 2024-03-29 | 2024-03-29 | 选取数据编码方式的方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117974816A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112001498A (zh) * | 2020-08-14 | 2020-11-27 | 苏州浪潮智能科技有限公司 | 基于量子计算机的数据识别方法、装置及可读存储介质 |
CN112633510A (zh) * | 2020-12-08 | 2021-04-09 | 北京百度网讯科技有限公司 | 量子数据间距离的确定方法及量子设备 |
CN114580643A (zh) * | 2022-03-18 | 2022-06-03 | 北京百度网讯科技有限公司 | 确定方法、模型处理方法、装置、设备及存储介质 |
KR20220131128A (ko) * | 2021-03-19 | 2022-09-27 | 삼성에스디에스 주식회사 | 양자 오토인코더 장치 및 상기 장치에서의 인코딩 방법 |
US20230186138A1 (en) * | 2021-12-15 | 2023-06-15 | Beijing Baidu Netcom Science Technology Co., Ltd. | Training of quantum neural network |
US20230267357A1 (en) * | 2022-02-24 | 2023-08-24 | Beijing Baidu Netcom Science Technology Co., Ltd. | Simulation method of quantum system, computing device and storage medium |
CN116993839A (zh) * | 2023-09-26 | 2023-11-03 | 苏州元脑智能科技有限公司 | 编码方式筛选方法、装置、电子设备及存储介质 |
-
2024
- 2024-03-29 CN CN202410372715.3A patent/CN117974816A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112001498A (zh) * | 2020-08-14 | 2020-11-27 | 苏州浪潮智能科技有限公司 | 基于量子计算机的数据识别方法、装置及可读存储介质 |
CN112633510A (zh) * | 2020-12-08 | 2021-04-09 | 北京百度网讯科技有限公司 | 量子数据间距离的确定方法及量子设备 |
KR20220131128A (ko) * | 2021-03-19 | 2022-09-27 | 삼성에스디에스 주식회사 | 양자 오토인코더 장치 및 상기 장치에서의 인코딩 방법 |
US20230186138A1 (en) * | 2021-12-15 | 2023-06-15 | Beijing Baidu Netcom Science Technology Co., Ltd. | Training of quantum neural network |
US20230267357A1 (en) * | 2022-02-24 | 2023-08-24 | Beijing Baidu Netcom Science Technology Co., Ltd. | Simulation method of quantum system, computing device and storage medium |
CN114580643A (zh) * | 2022-03-18 | 2022-06-03 | 北京百度网讯科技有限公司 | 确定方法、模型处理方法、装置、设备及存储介质 |
CN116993839A (zh) * | 2023-09-26 | 2023-11-03 | 苏州元脑智能科技有限公司 | 编码方式筛选方法、装置、电子设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
TOMONORI SHIRAKAWA 等: "Automatic quantum circuit encoding of a given arbitrary quantum state", ARXIV, 29 December 2021 (2021-12-29) * |
王芙蓉 等: "基于奇异值分解的矩阵低秩近似量子算法", 物理学报, 31 December 2021 (2021-12-31) * |
黄一鸣 等: "量子机器学习算法综述", 计算机学报, 19 May 2017 (2017-05-19) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10552119B2 (en) | Dynamic management of numerical representation in a distributed matrix processor architecture | |
CN112308204A (zh) | 使用适应度估计的自动化神经网络生成 | |
CN111950692B (zh) | 用于改进的通用化的基于汉明距离的稳健输出编码 | |
EP4283533A1 (en) | Quantum convolution operator | |
CN114821217B (zh) | 一种基于量子经典混合神经网络的图像识别方法及装置 | |
CN116109121B (zh) | 基于大数据分析的用户需求挖掘方法及系统 | |
CN115618269B (zh) | 基于工业传感器生产的大数据分析方法及系统 | |
CN115827257B (zh) | 用于处理器体系的cpu容量预测方法及其系统 | |
Jha et al. | The neural process family: Survey, applications and perspectives | |
CN112749653A (zh) | 行人检测方法、装置、电子设备及存储介质 | |
Roth et al. | Automated characterization of parallel application communication patterns | |
CN114358319A (zh) | 基于机器学习框架的分类方法及相关装置 | |
CN109615080B (zh) | 无监督模型评估方法、装置、服务器及可读存储介质 | |
CN108520532B (zh) | 识别视频中物体运动方向的方法及装置 | |
CN112529024A (zh) | 一种样本数据的生成方法、装置及计算机可读存储介质 | |
Rai | Advanced deep learning with R: Become an expert at designing, building, and improving advanced neural network models using R | |
CN113822144A (zh) | 一种目标检测方法、装置、计算机设备和存储介质 | |
CN117373580A (zh) | 基于时序网络实现钛合金产品的性能分析方法及系统 | |
US20230342626A1 (en) | Model processing method and related apparatus | |
CN113128015B (zh) | 预估单振幅模拟量子计算所需资源的方法和系统 | |
CN117974816A (zh) | 选取数据编码方式的方法、装置、计算机设备及存储介质 | |
CN115034812B (zh) | 基于大数据的钢铁行业销售量预测方法及装置 | |
CN113705686B (zh) | 图像分类方法、装置、电子设备及可读存储介质 | |
CN116403019A (zh) | 遥感图像量子识别方法、装置、存储介质及电子装置 | |
CN116011681A (zh) | 一种气象数据预测方法、装置、存储介质及电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |