CN113361664B - 一种基于量子卷积神经网络的图像识别系统及方法 - Google Patents

一种基于量子卷积神经网络的图像识别系统及方法 Download PDF

Info

Publication number
CN113361664B
CN113361664B CN202110910909.0A CN202110910909A CN113361664B CN 113361664 B CN113361664 B CN 113361664B CN 202110910909 A CN202110910909 A CN 202110910909A CN 113361664 B CN113361664 B CN 113361664B
Authority
CN
China
Prior art keywords
quantum
neural network
measurement
unit
image recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110910909.0A
Other languages
English (en)
Other versions
CN113361664A (zh
Inventor
吕金虎
高庆
吕颜轩
刘克新
郑瑾
裴迎庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Academy of Mathematics and Systems Science of CAS
Original Assignee
Beihang University
Academy of Mathematics and Systems Science of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University, Academy of Mathematics and Systems Science of CAS filed Critical Beihang University
Priority to CN202110910909.0A priority Critical patent/CN113361664B/zh
Publication of CN113361664A publication Critical patent/CN113361664A/zh
Application granted granted Critical
Publication of CN113361664B publication Critical patent/CN113361664B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N10/00Quantum computing, i.e. information processing based on quantum-mechanical phenomena
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Computational Mathematics (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Neurology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于量子卷积神经网络的图像识别系统及方法,通过量子态输入单元制备或读入编码输入图像信息的量子比特,通过量子卷积神经网络运算单元对量子比特进行操作,通过量子态测量单元对量子比特进行测量操作,给出输出结果,通过网络优化单元进行训练,以使得量子卷积神经网络的输出结果尽量接近期望输出。本发明利用量子态编码图像信息,通过基于量子电路构建的量子卷积神经网络来高效地提取图像特征以及进行特征映射,并进行图像识别,能够实现对图像数据或者编码图像信息的量子数据进行高效特征提取,用于快速处理大规模、高维度图像数据的图像识别任务。

Description

一种基于量子卷积神经网络的图像识别系统及方法
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于量子卷积神经网络的图像识别系统及方法。
背景技术
经典机器学习和深度学习技术已经成为当前大数据处理与分析的基础技术,在图像识别、自然语言处理、视频分析等领域发挥着重要的作用。随着大数据技术的日益发展,互联网及工业互联网的信息采集和产生设备的部署量日益增长,大数据的数据规模和数据维度都呈现指数级增长的趋势。由于经典计算具有有限的计算能力和存储资源,因而经典机器学习算法的应用也遇到了巨大的挑战。探索量子计算在大数据处理和机器学习中的应用有望拓展新的解决方案。
量子机器学习是量子计算和机器学习的交叉领域,目前正受到越来越广泛的关注。量子机器学习主要指通过量子计算硬件(包括量子退火计算机、光量子计算机和量子电路等)实现机器学习算法,从而能够更高效、智能地处理经典数据或者量子数据。基于叠加、纠缠和量子并行性等量子属性,量子机器学习有潜力实现超越经典机器学习技术的学习效率和判别效率,以应对信息化浪潮下日益增长的大数据智能处理需求。然而,量子计算所具有独特的性质使得经典机器学习算法无法直接在量子计算硬件上实施,需要设计新的构建方法和训练方法以建立量子机器学习算法。
卷积神经网络(Convolutional Neural Network, CNN)是经典机器学习技术中一种重要模型,尤其在图像处理和语音识别任务中具有优越性能。卷积神经网络具有两种特殊的网络层:卷积层和池化层,这两种网络层堆叠形成特殊的层级结构,使得卷积神经网络能够高效地从输入数据中提取结构化特征。此外,卷积神经网络所具有局部连接和权值共享的特点降低了网络模型的复杂度,能够显著提升模型的运算效率。
因此,在图像数据的规模和维度呈现指数级增长的严峻挑战下,借鉴经典卷积神经网络的结构特点,提供一种基于量子计算硬件的,能够充分挖掘量子计算潜力的,能够高效、智能地提取图像中结构化特征的图像识别算法是亟待解决的技术问题。
发明内容
有鉴于此,本发明提供了一种基于量子卷积神经网络的图像识别系统及方法,用以快速处理大规模、高维度图像数据的识别任务。
本发明提供的一种基于量子卷积神经网络的图像识别系统,包括:量子态输入单元、量子卷积神经网络运算单元、量子态测量单元以及网络优化单元;其中,
所述量子态输入单元,用于制备或读入对图像信息进行编码的量子比特;
所述量子卷积神经网络运算单元,包括多个量子神经网络层;其中,每个量子神经网络层为量子卷积层、量子池化层和量子全连接层中的任意一种;所述量子卷积神经网络运算单元用于对所述量子比特施加多种量子门或者多种量子测量操作;
所述量子态测量单元,用于对经过所述量子卷积神经网络运算单元操作后剩余的一个或多个量子比特施加量子测量操作,获取测量结果,并将测量结果映射到输入数据的期望输出值上,给出图像识别任务的输出结果;
所述网络优化单元,用于将所述量子态测量单元给出的输出结果与输入数据所对应的期望输出值进行比较,更新所述量子卷积神经网络运算单元中量子门的可调参数,并更新所述量子态测量单元中的可调参数。
在一种可能的实现方式中,在本发明提供的上述基于量子卷积神经网络的图像识别系统中,所述量子态输入单元,用于根据数字图像数据制备编码有相应图像信息的量子比特,或者,用于读入作为输入数据的、编码有图像信息的量子比特。
在一种可能的实现方式中,在本发明提供的上述基于量子卷积神经网络的图像识别系统中,所述量子卷积层由多个量子门组成,所述量子门包括单量子比特门和多量子比特门;所述单量子比特门施加于单个量子比特上,所述多量子比特门施加于相邻的多个量子比特上;所述量子比特为一维量子比特阵列或二维量子比特阵列,所述量子比特的相邻关系为在一维量子比特阵列中相邻、在二维量子比特阵列中相邻以及由量子计算硬件定义的相邻关系中的任意一种;
所述量子池化层,包括量子测量操作和受控单量子比特门;其中,所述受控单量子比特门用于依据所述量子测量操作的测量结果,对量子比特施加不同的幺正变换操作;
所述量子全连接层,用于对经过所述量子卷积层和所述量子池化层后剩余的量子比特施加多个单量子比特门或多量子比特门。
在一种可能的实现方式中,在本发明提供的上述基于量子卷积神经网络的图像识别系统中,所述量子态测量单元,用于对量子比特施加单次量子测量操作,给出单次测量结果1或-1;或者,
所述量子态测量单元,用于对量子比特施加多次量子测量操作,取多次测量结果的平均值为输出结果,或者,对多次测量结果进行函数运算或经典神经网络运算,将运算结果作为输出结果。
在一种可能的实现方式中,在本发明提供的上述基于量子卷积神经网络的图像识别系统中,所述网络优化单元,用于通过定义损失函数,来对输出结果和输入数据的期望输出值进行相似度度量,并通过计算损失函数相对于量子卷积神经网络模型中可调参数的梯度,来更新所述量子卷积神经网络运算单元中量子门的可调参数,并更新所述量子态测量单元中的可调参数。
本发明还提供了一种计算设备,包括本发明提供的上述基于量子卷积神经网络的图像识别系统。
本发明还提供了一种基于量子卷积神经网络的图像识别方法,包括如下步骤:
S1:获取待识别图像数据集;
S2:将所述待识别图像数据集输入预先训练好的量子卷积神经网络模型,依次执行量子态输入单元、量子卷积神经网络运算单元和量子态测量单元后,获取输出结果,作为对输入的待识别图像数据集的识别结果;
其中,所述量子卷积神经网络模型的训练过程包括如下步骤:
SS1:准备图像识别任务的训练数据集,包括输入数据和对应的期望输出值,所述输入数据为实数值图像矩阵、二值图像矩阵和存储于量子比特的包含图像信息的量子态中的任意一种;
SS2:建立量子卷积神经网络模型,将可调参数调整至初始值;
SS3:随机选取部分训练数据集作为单次训练数据,或将全部训练数据集作为单次训练数据;
SS4:依据单次训练数据,通过量子态输入单元制备或读入对图像信息进行编码的量子比特;
SS5:通过量子卷积神经网络运算单元对所述量子比特施加多种量子门或者多种量子测量操作;
SS6:通过量子态测量单元对经过所述量子卷积神经网络运算单元操作后剩余的一个或多个量子比特施加量子测量操作,获取测量结果,并将测量结果映射到期望输出值上,给出图像识别任务的输出结果;
SS7:通过网络优化单元比较输出结果和期望输出值的差异,更新所述量子卷积神经网络运算单元中量子门的可调参数,并更新所述量子态测量单元中的可调参数;
SS8:返回步骤SS3,重复执行步骤SS3~SS7,直至损失函数值达到设定要求,和/或,训练迭代次数达到设定次数;保存训练完成后的量子神经网络模型,包括保存模型中的量子门序列及其参数。
在一种可能的实现方式中,在本发明提供的上述基于量子卷积神经网络的图像识别方法中,在执行步骤SS2之后,在执行步骤SS3之前,还包括:
对所述训练数据集进行预处理,包括将所述训练数据集划分为训练集和测试集,并对所述训练集和所述测试集中的图像样本进行归一化运算、降采样运算、填充缺失值和离散化运算;
步骤SS8,具体包括:
SS81:返回步骤SS3,重复执行步骤SS3~SS7若干次后,对预处理后的测试集进行图像识别,并记录图像识别准确率,依据图像识别准确率调整量子卷积神经网络模型中的超参数;
SS82:重复步骤SS81,直至损失函数值达到设定要求,和/或,训练迭代次数达到设定次数;保存训练完成后的量子神经网络模型,包括保存模型中的量子门序列及其参数。
本发明提供的上述基于量子卷积神经网络的图像识别系统及方法,通过量子态输入单元制备或读入编码输入图像信息的量子比特,通过量子卷积神经网络运算单元对量子比特进行操作,通过量子态测量单元对量子比特进行测量操作,给出输出结果,通过网络优化单元进行训练,以使得量子卷积神经网络的输出结果尽量接近期望输出。本发明利用量子态编码图像信息,通过基于量子电路构建的量子卷积神经网络来高效地提取图像特征以及进行特征映射,并进行图像识别,能够实现对图像数据或者编码图像信息的量子数据进行高效特征提取,用于快速处理大规模、高维度图像数据的图像识别任务。与经典卷积神经网络相比,量子卷积神经网络利用量子计算速度快、存储容量大和具备量子并行性的特点,能够实现更快的图像运算速度、模型训练速度和识别速度,并且具有更强的表达能力(能够拟合更复杂的输入图像数据到输出识别结果的映射关系)。与其他已知的量子神经网络相比,所述量子卷积神经网络运算单元具有与经典卷积神经网络相类似的层级结构以及参数共享和局部连接的特点,使得量子卷积神经网络能够更高效地提取输入图像数据的结构化特征。本发明中的量子卷积神经网络既能处理经典图像数据,也能处理编码了图像信息量子数据,极大地扩展了机器学习算法的适用数据范围。
附图说明
图1为本发明提供的一种基于量子卷积神经网络的图像识别系统的结构框图;
图2为本发明提供的一种基于量子卷积神经网络的图像识别系统中量子卷积神经网络运算单元的结构示意图;
图3为一类通用的两量子比特门的量子电路图;
图4为一类量子池化操作模块的量子电路图;
图5为本发明提供的一种基于量子卷积神经网络的图像识别方法的流程图;
图6为本发明提供的一种基于量子卷积神经网络的图像识别方法中量子卷积神经网络模型的训练过程的流程图;
图7为本发明实施例1提供的一类图像识别任务训练过程中损失函数值变化示意图;
图8为本发明实施例1提供的一类图像识别任务训练过程中测试集准确率变化示意图。
具体实施方式
下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整的描述,显然,所描述的实施方式仅仅是作为例示,并非用于限制本发明。
本发明提供的一种基于量子卷积神经网络的图像识别系统,如图1所示,包括:量子态输入单元、量子卷积神经网络运算单元、量子态测量单元以及网络优化单元。下面分别对这四个单元进行详细描述。
(1) 量子态输入单元,用于制备或读入对图像信息进行编码的量子比特。
量子态输入单元制备或读入对图像信息进行编码的量子比特,包括但不限于以下两种形式:1)用于根据数字图像数据制备编码有相应图像信息的量子比特,2)用于读入作为输入数据的、编码有图像信息的量子比特。
量子计算硬件只能对量子比特进行操作,从而处理通过量子比特的量子态所存储的信息。量子态输入单元将图像识别任务的输入图像信息存储到量子比特中。一方面,对于给出经典图像数据的机器学习任务,量子态输入单元执行量子态制备方法,将处于初始状态的量子比特变换为对输入图像信息进行编码的量子态,并且,对于一些经典图像数据,需要首先对图像数据进行预处理以满足量子态编码的要求。另一方面,对于给出量子图像数据的机器学习任务,即输入图像数据信息已编码在给定量子比特中,量子态输入单元读入给定的量子比特。
经典计算机中的经典比特,取值可以为0或1,能够存储通过0和1编码的信息。类似的,在量子计算中,量子比特是量子信息的载体,量子比特有两个基态
Figure 445762DEST_PATH_IMAGE001
Figure 694341DEST_PATH_IMAGE002
。然而,与经典计算不同的是,单个量子比特可以为上述两个基态的任意叠加态:
Figure 292813DEST_PATH_IMAGE003
其中,
Figure 576026DEST_PATH_IMAGE004
为复数,且满足
Figure 664068DEST_PATH_IMAGE005
,因此单量子比特的量子态可以表示为一个二维复向量:
Figure 134364DEST_PATH_IMAGE006
由于量子力学的叠加和纠缠特性,n个量子比特的量子态
Figure 598843DEST_PATH_IMAGE007
包含2 n 个基态:
Figure 470984DEST_PATH_IMAGE008
,可以表示为:
Figure 933190DEST_PATH_IMAGE009
其中,
Figure 953098DEST_PATH_IMAGE010
i的二进制形式
Figure 893372DEST_PATH_IMAGE011
所对应的基态
Figure 885599DEST_PATH_IMAGE012
,例如
Figure 581023DEST_PATH_IMAGE013
,因此,n量子比特的量子态
Figure 25910DEST_PATH_IMAGE014
可以表示为一个2 n 维的复向量:
Figure 769876DEST_PATH_IMAGE015
数据信息的编码:采用幅值编码时,量子态的每个复值系数用于存储一个复数。例如,对于一个N=2 n 维实向量
Figure 678926DEST_PATH_IMAGE016
,可以用n个量子比特的量子态系数来编码,即量子态取值为
Figure 217354DEST_PATH_IMAGE017
。从而,对于一个N*N维的图像矩阵,其中所包含的数据为N 2个实数,可以通过
Figure 211855DEST_PATH_IMAGE018
个量子比特进行编码。
数据预处理包括补充零数据维度、作归一化等方法。补充零数据维度旨在将不满足维度要求的输入数据进行维度扩充,以使得输入数据的维度等于量子态可编码的数据维度。作归一化旨在使得输入数据的各个分量的平方和等于1,从而满足量子态系数的归一化条件。离散化运算是指将连续数值转化为离散数值,以降低对存储容量的要求。降采样是指在保留图像主要特征的情况下,降低图像的数据维度,以减少对量子比特数量的要求。
量子态制备:依据目标量子态设计量子门序列,将量子比特由初始状态变换为目标量子态。
在本发明中,输入数据为经典数据,首先采用补充零数据维度和作归一化的方法对经典输入数据进行预处理,之后采用幅值编码方法将输入数据编码到量子比特的量子态中,最后通过量子态制备方法制备具有所需量子态的量子比特。对于
Figure 759511DEST_PATH_IMAGE020
维输入数据,所需的量子比特数为
Figure 457821DEST_PATH_IMAGE021
(2) 量子卷积神经网络运算单元,包括多个量子神经网络层;其中,每个量子神经网络层为量子卷积层、量子池化层和量子全连接层中的任意一种;量子卷积神经网络运算单元用于对量子比特施加多种量子门或者多种量子测量操作,从而对量子比特上的量子态进行变换,即对量子态中编码的输入图像数据进行特征提取和映射。
图2为本发明提供的上述基于量子卷积神经网络的图像识别系统中量子卷积神经网络运算单元的结构示意图举例,每个虚线框内的部分表示一个量子网络层。图2中每条横线A表示一个量子比特;方框B表示单个量子门,量子门对所连接的量子比特进行操作;带指针符号的方框C表示量子测量操作;双线D表示量子测量操作输出的测量结果;与测量结果相连的方框E表示经典受控量子门,其依据所关联的测量结果,对量子比特施加不同的操作;方框G表示量子全连接层。按照自左至右的顺序,依次对量子比特施加量子门和量子测量操作。方框B所示的两量子比特量子门可以在量子计算硬件上可以通过图3所示的量子电路实现。方框C、双线D和方框E组成一个量子池化操作模块,在量子计算硬件上可以通过图4所示的量子电路实现。
量子卷积层可以由多个量子门组成,量子门可以包括单量子比特门和多量子比特门,单量子比特门施加于单个量子比特上,多量子比特门施加于相邻的多个量子比特上;量子比特可以为一维量子比特阵列,或者,量子比特也可以为二维量子比特阵列,在此不做限定;量子比特的相邻关系可以为在一维量子比特阵列中相邻,或者,量子比特的相邻关系也可以为在二维量子比特阵列中相邻,或者,量子比特的相邻关系还可以为由量子计算硬件定义的相邻关系,在此不做限定。
量子门对所连接的量子比特进行操作,改变量子比特的量子态。量子门可以操作单个量子比特或者多个量子比特。一些量子门具有固定的参数,仅能对量子比特进行固定的操作;一些量子门包含可调整的参数,改变该类量子门的参数能够改变其对量子比特所施加的操作;一些量子门为经典受控量子门,其依据所接收的经典控制量的不同,对量子比特施加不同的操作。
量子测量操作间接提取量子态的信息。根据量子力学原理,量子态中的信息无法直接获取,需要通过量子测量操作来获取。依据量子态的不同,量子测量以不同概率给出测量结果1或-1。例如,对量子态
Figure 495047DEST_PATH_IMAGE022
施加Z测量操作时,将以概率
Figure 648948DEST_PATH_IMAGE023
得到测量结果1,以概率
Figure 295DEST_PATH_IMAGE024
得到测量结果-1。施加量子测量操作后,量子比特的量子态坍缩,不再参与后续运算过程。
经典卷积神经网络的两个重要特点分别是局部连接和参数共享。在量子卷积层中,单个量子门仅对相邻的量子比特进行操作,具有局部连接的特点。此外,在一个量子卷积层内部,所有的量子门具有相同的可调整参数,具有参数共享的特点。局部连接和权值共享的特点使得量子卷积神经网络模型能够有效地提取结构化特征,同时所需的运算量少,收敛速度快。
量子池化层,具体可以包括量子测量操作和受控单量子比特门;其中,受控单量子比特门可以依据量子测量操作的测量结果,对量子比特施加不同的幺正变换操作;被施加量子测量操作的量子比特不再参与后续运算。量子池化层对部分量子比特施加测量操作,依据测量结果的不同,经典受控量子门对相邻量子比特施加不同的操作。同一量子池化层内部的量子门具有相同的可调整参数,具有参数共享的特点。经过量子池化层的操作,被测量的量子比特发生坍缩,不再参与后续运算,同时其量子态所包含的信息通过经典受控量子门与相邻量子比特进行交互,有效地降低特征映射的维度,同时使得特征映射具有一定的平移不变性。
量子全连接层,具体可以对经过量子卷积层和量子池化层后剩余的量子比特施加多个单量子比特门或多量子比特门。量子全连接层位于量子卷积神经网络运算单元的末阶段,对于经过量子卷积层和量子池化层操作的量子比特,其施加多个单量子比特门或多量子比特门。需要注意,在量子全连接层内部的各个量子门相互独立,并不要求它们的可调整参数相同。同时,多量子比特门可施加于不相邻的量子比特。因而,量子全连接层往往具有更多的可调整参数,同时具有密集连接的特点。
在量子卷积神经网络运算单元中,一般首先放置量子卷积层,之后交错放置量子卷积层和量子池化层,并且在最后放置量子全连接层。
为使得量子卷积神经网络运算单元具有更强大的特征提取能力,所采用的具有可调整参数的量子门应具有尽可能大范围的可施加操作空间。
需要说明的是,虽然图2中的量子比特为一维量子比特阵列,但将本发明的方法切换到二维量子比特阵列也是可行的。同时量子比特的相邻关系包括在一维阵列中相邻、在二维阵列中相邻以及由量子计算硬件定义的相邻关系中的任意一种。
图3所示的一类通用两量子比特门能够实现对两量子比特的量子态的任意操作,由通用单量子比特门、单量子比特旋转门和量子受控非门组成。图3中
RZRY表示单量子比特旋转门,矩阵表示为:
Figure 618358DEST_PATH_IMAGE025
图3中abcd表示四个通用的单量子比特量子门U,矩阵表示为:
Figure 764169DEST_PATH_IMAGE026
其中,i表示虚数单位,
Figure 467683DEST_PATH_IMAGE027
表示量子门的参数。
图4所示的一类池化操作模块,具有任意的控制量子态并且能够实现任意的单量子比特操作。图4中ab表示通用的单量子比特门,
Figure 357141DEST_PATH_IMAGE028
表示量子门b的共轭量子门。
(3) 量子态测量单元,用于对经过量子卷积神经网络运算单元操作后剩余的一个或多个量子比特施加量子测量操作,获取测量结果,并将测量结果映射到输入数据的期望输出值上,给出图像识别任务的输出结果;
量子态测量单元,具体可以对经过量子卷积神经网络运算单元的操作后剩余的量子比特施加单次量子测量操作,给出单次测量结果1或-1;或者,量子态测量单元,具体可以对经过量子卷积神经网络运算单元的操作后剩余的量子比特施加多次量子测量操作,取多次测量结果的平均值为输出结果,多次测量结果的平均值是取值在-1到1之间的实数;或者,量子态测量单元,具体可以对经过量子卷积神经网络运算单元的操作后剩余的量子比特施加多次量子测量操作,对多次测量结果进行函数运算或经典神经网络运算,将运算结果作为输出结果,引入经典神经网络运算时,将量子比特的测量结果作为神经网络的输入,通过经典神经网络对测量结果进行映射,将神经网络的输出作为输出结果。
(4) 网络优化单元,用于将量子态测量单元给出的输出结果与输入数据所对应的期望输出值进行比较,更新量子卷积神经网络运算单元中量子门的可调参数,并更新量子态测量单元中的可调参数。
网络优化单元,具体可以通过定义损失函数,来对输出结果和输入数据的期望输出值进行相似度度量,并通过计算损失函数相对于量子卷积神经网络模型中可调参数的梯度,来更新量子卷积神经网络运算单元中量子门的可调参数,并更新量子态测量单元中的可调参数。损失函数值越小则说明差异越小。例如,损失函数可以为交叉熵函数、平方损失函数等。
调整参数的方法:可以采用基于梯度的方法,计算损失函数相对于可调整参数的梯度,适当将部分或全部可调整参数沿与梯度相反的方向调整,即可降低损失函数的值,从而使得输出结果更接近期望输出;还可以采用其他启发式的调整参数的方法,如进化算法,仿生算法等。
梯度计算方法:损失函数相对于每个可调整参数的梯度可以通过链式法则和参数偏移法则来获取。具体地,设量子卷积神经网络模型中的可调整参数为,θ需要计算关于θ的第j个分θ j 量的梯度值,量子态测量单元所选定的K个输出量子比特的测量结果期望值为
Figure 32973DEST_PATH_IMAGE029
,损失函数为
Figure 615264DEST_PATH_IMAGE030
,计算方法如下:
1)通过链式法则计算损失函数值f关于可调整参数θ j 的梯度的解析表达式:
Figure 806074DEST_PATH_IMAGE031
该表达式包含多个测量结果的期望值关于参数θ j 的梯度
Figure 233644DEST_PATH_IMAGE032
2)将参数θ j 增加
Figure 560721DEST_PATH_IMAGE033
,重新执行量子态输入单元、量子卷积神经网络运算单元、量子态测量单元,获取新测量期望值
Figure 48334DEST_PATH_IMAGE034
3)将参数θ j 减小
Figure 929702DEST_PATH_IMAGE033
,重新执行量子态输入单元、量子卷积神经网络运算单元、量子态测量单元,获取新测量期望值
Figure 223280DEST_PATH_IMAGE035
4)计算各个测量期望值
Figure 608125DEST_PATH_IMAGE036
关于参数θ j 的梯度值:
Figure 266640DEST_PATH_IMAGE037
5)将上述梯度值代入1)中表达式,计算损失函数关于参数θ j 的梯度值
Figure 432042DEST_PATH_IMAGE038
本发明提供的上述基于量子卷积神经网络的图像识别系统中,量子卷积神经网络运算单元由量子计算硬件(包括量子退火计算机、超导量子计算机、光学量子计算机等)组成,量子态输入单元、量子态测量单元以及网络优化单元可以通过经典计算机(包括存储器和经典处理器)来实现。
基于同一发明构思,本发明还提供了一种基于量子卷积神经网络的图像识别方法,如图5所示,包括如下步骤:
S1:获取待识别图像数据集;
S2:将待识别图像数据集输入预先训练好的量子卷积神经网络模型,依次执行量子态输入单元、量子卷积神经网络运算单元和量子态测量单元后,获取输出结果,作为对输入的待识别图像数据集的识别结果;
其中,量子卷积神经网络模型的训练过程,如图6所示,包括如下步骤:
SS1:准备图像识别任务的训练数据集,包括输入数据和对应的期望输出值,输入数据为实数值图像矩阵、二值图像矩阵和存储于量子比特的包含图像信息的量子态中的任意一种;
SS2:建立量子卷积神经网络模型,将可调参数调整至初始值;
SS3:随机选取部分训练数据集作为单次训练数据,或将全部训练数据集作为单次训练数据;
SS4:依据单次训练数据,通过量子态输入单元制备或读入对图像信息进行编码的量子比特;
SS5:通过量子卷积神经网络运算单元对量子比特施加多种量子门或者多种量子测量操作;
SS6:通过量子态测量单元对经过量子卷积神经网络运算单元操作后剩余的一个或多个量子比特施加量子测量操作,获取测量结果,并将测量结果映射到期望输出值上,给出图像识别任务的输出结果;
SS7:通过网络优化单元比较输出结果和期望输出值的差异,更新量子卷积神经网络运算单元中量子门的可调参数,并更新量子态测量单元中的可调参数;
SS8:返回步骤SS3,重复执行步骤SS3~SS7,直至损失函数值达到设定要求,和/或,训练迭代次数达到设定次数;保存训练完成后的量子神经网络模型,包括保存模型中的量子门序列及其参数。
需要说明的是,训练方法可以包含训练效果验证:定义测试准确率函数为量子卷积神经网络模型对测试集样本进行正确识别的比率,在训练过程中,每间隔一定训练迭代次数,在测试数据集上执行上述识别方法,并统计测试准确率。
在具体实施时,在执行本发明提供的上述基于量子卷积神经网络的图像识别方法中的步骤SS2之后,在执行本发明提供的上述基于量子卷积神经网络的图像识别方法中的步骤SS3之前,还可以执行如下操作:
对训练数据集进行预处理,包括将训练数据集划分为训练集和测试集,并对训练集和测试集中的图像样本进行归一化运算、降采样运算、填充缺失值和离散化运算;
这样,在执行本发明提供的上述基于量子卷积神经网络的图像识别方法中的步骤SS8时,具体可以通过以下方式来实现:
SS81:返回步骤SS3,重复执行步骤SS3~SS7若干次后,对预处理后的测试集进行图像识别,并记录图像识别准确率,依据图像识别准确率调整量子卷积神经网络模型中的超参数;
SS82:重复步骤SS81,直至损失函数值达到设定要求,和/或,训练迭代次数达到设定次数;保存训练完成后的量子神经网络模型,包括保存模型中的量子门序列及其参数。
下面通过一个具体的实施例对本发明提供的上述基于量子卷积神经网络的图像识别系统及其方法的具体实施进行详细说明。
实施例1:
CIFAR-10图像识别任务是一项经典的机器学习任务,该任务要求对于给定的彩色图像,识别出图像中包含哪些类别的物品。本发明实施例1在CIFAR-10图像识别任务上对量子卷积神经网络的效果进行原理性验证。CIFAR-10数据集包含10个物体类别的RGB彩色图像及对应标签,每张图像为32*32的彩色图像。
在数值仿真实验中,从原始数据集中随机选取等量的猫和狗的图像构建一个识别两类物体的机器学习任务。由于现有算力条件下仅能对少量量子比特进行数值仿真,考虑量子比特的数量限制,本发明实施例1将彩色图像转化为灰度图像,并且降采样到8*8维,从而仅需仿真6个量子比特即可实现对量子卷积神经网络的效果验证。实验数据集包含10000个训练样本,1700个测试样本,输入数据的维度为64维,标签值(期望输出值)为1或-1。
所建立的量子卷积神经网络模型包含6个量子比特,量子卷积神经网络运算单元的结构如图2所示。对于一副输入图像,量子卷积神经网络的输出结果大于0时,代表识别结果为猫,输出结果小于等于0时,代表识别结果为狗。网络优化单元中,采用平方损失函数以及随机梯度下降算法对模型参数进行训练。训练过程的损失函数值变化示意图如图7所示,训练过程的测试准确率数值变化示意图如图8所示。由图7和图8可以看出,训练过程中损失函数有明显的下降趋势并且最终降到约0.45,测试准确率在前50次迭代训练中快速上升,并最终达到96.65%的识别准确率。
基于同一发明构思,本发明还提供了一种计算设备,包括本发明提供的上述基于量子卷积神经网络的图像识别系统。本发明提供的上述计算设备的具体实施与本发明提供的上述基于量子卷积神经网络的图像识别系统的实施类似,在此不做赘述。
本发明提供的上述基于量子卷积神经网络的图像识别系统及其方法,通过量子态输入单元制备或读入编码输入图像信息的量子比特,通过量子卷积神经网络运算单元对量子比特进行操作,通过量子态测量单元对量子比特进行测量操作,给出输出结果,通过网络优化单元进行训练,以使得量子卷积神经网络的输出结果尽量接近期望输出。本发明利用量子态编码图像信息,通过基于量子电路构建的量子卷积神经网络来高效地提取图像特征以及进行特征映射,并进行图像识别,能够实现对图像数据或者编码图像信息的量子数据进行高效特征提取,用于快速处理大规模、高维度图像数据的图像识别任务。与经典卷积神经网络相比,量子卷积神经网络利用量子计算速度快、存储容量大和具备量子并行性的特点,能够实现更快的图像运算速度、模型训练速度和识别速度,并且具有更强的表达能力(能够拟合更复杂的输入图像数据到输出识别结果的映射关系)。与其他已知的量子神经网络相比,所述量子卷积神经网络运算单元具有与经典卷积神经网络相类似的层级结构以及参数共享和局部连接的特点,使得量子卷积神经网络能够更高效地提取输入图像数据的结构化特征。本发明中的量子卷积神经网络既能处理经典图像数据,也能处理编码了图像信息量子数据,极大地扩展了机器学习算法的适用数据范围。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1.一种基于量子卷积神经网络的图像识别系统,其特征在于,包括:量子态输入单元、量子卷积神经网络运算单元、量子态测量单元以及网络优化单元;其中,
所述量子态输入单元,用于制备或读入对图像信息进行编码的量子比特;
所述量子卷积神经网络运算单元,包括多个量子神经网络层;其中,每个量子神经网络层为量子卷积层、量子池化层和量子全连接层中的任意一种;所述量子卷积神经网络运算单元用于对所述量子比特施加多种量子门或者多种量子测量操作;
所述量子态测量单元,用于对经过所述量子卷积神经网络运算单元操作后剩余的一个或多个量子比特施加量子测量操作,获取测量结果,并将测量结果映射到输入数据的期望输出值上,给出图像识别任务的输出结果;
所述网络优化单元,用于将所述量子态测量单元给出的输出结果与输入数据所对应的期望输出值进行比较,更新所述量子卷积神经网络运算单元中量子门的可调参数,并更新所述量子态测量单元中的可调参数;
在量子卷积神经网络运算单元中,首先放置量子卷积层,之后交错放置量子卷积层和量子池化层,最后放置量子全连接层;
所述量子卷积层由多个量子门组成,所述量子门包括单量子比特门和多量子比特门;所述单量子比特门施加于单个量子比特上,所述多量子比特门施加于相邻的多个量子比特上;所述量子比特为一维量子比特阵列或二维量子比特阵列,所述量子比特的相邻关系为在一维量子比特阵列中相邻、在二维量子比特阵列中相邻以及由量子计算硬件定义的相邻关系中的任意一种;
所述量子池化层,包括量子测量操作和受控单量子比特门;其中,所述受控单量子比特门用于依据所述量子测量操作的测量结果,对量子比特施加不同的幺正变换操作;
所述量子全连接层,用于对经过所述量子卷积层和所述量子池化层后剩余的量子比特施加多个单量子比特门或多量子比特门。
2.如权利要求1所述的基于量子卷积神经网络的图像识别系统,其特征在于,所述量子态输入单元,用于根据数字图像数据制备编码有相应图像信息的量子比特,或者,用于读入作为输入数据的、编码有图像信息的量子比特。
3.如权利要求1所述的基于量子卷积神经网络的图像识别系统,其特征在于,所述量子态测量单元,用于对量子比特施加单次量子测量操作,给出单次测量结果1或-1;或者,
所述量子态测量单元,用于对量子比特施加多次量子测量操作,取多次测量结果的平均值为输出结果,或者,对多次测量结果进行函数运算或经典神经网络运算,将运算结果作为输出结果。
4.如权利要求1所述的基于量子卷积神经网络的图像识别系统,其特征在于,所述网络优化单元,用于通过定义损失函数,来对输出结果和输入数据的期望输出值进行相似度度量,并通过计算损失函数相对于量子卷积神经网络模型中可调参数的梯度,来更新所述量子卷积神经网络运算单元中量子门的可调参数,并更新所述量子态测量单元中的可调参数。
5.一种计算设备,其特征在于,包括如权利要求1~4任一项所述的基于量子卷积神经网络的图像识别系统。
6.一种基于权利要求1中所述图像识别系统的图像识别方法,其特征在于,包括如下步骤:
S1:获取待识别图像数据集;
S2:将所述待识别图像数据集输入预先训练好的量子卷积神经网络模型,依次执行量子态输入单元、量子卷积神经网络运算单元和量子态测量单元后,获取输出结果,作为对输入的待识别图像数据集的识别结果;
其中,所述量子卷积神经网络模型的训练过程包括如下步骤:
SS1:准备图像识别任务的训练数据集,包括输入数据和对应的期望输出值,所述输入数据为实数值图像矩阵、二值图像矩阵和存储于量子比特的包含图像信息的量子态中的任意一种;
SS2:建立量子卷积神经网络模型,将可调参数调整至初始值;
SS3:随机选取部分训练数据集作为单次训练数据,或将全部训练数据集作为单次训练数据;
SS4:依据单次训练数据,通过量子态输入单元制备或读入对图像信息进行编码的量子比特;
SS5:通过量子卷积神经网络运算单元对所述量子比特施加多种量子门或者多种量子测量操作;
SS6:通过量子态测量单元对经过所述量子卷积神经网络运算单元操作后剩余的一个或多个量子比特施加量子测量操作,获取测量结果,并将测量结果映射到期望输出值上,给出图像识别任务的输出结果;
SS7:通过网络优化单元比较输出结果和期望输出值的差异,更新所述量子卷积神经网络运算单元中量子门的可调参数,并更新所述量子态测量单元中的可调参数;
SS8:返回步骤SS3,重复执行步骤SS3~SS7,直至损失函数值达到设定要求,和/或,训练迭代次数达到设定次数;保存训练完成后的量子神经网络模型,包括保存模型中的量子门序列及其参数。
7.如权利要求6所述的基于量子卷积神经网络的图像识别方法,其特征在于,在执行步骤SS2之后,在执行步骤SS3之前,还包括:
对所述训练数据集进行预处理,包括将所述训练数据集划分为训练集和测试集,并对所述训练集和所述测试集中的图像样本进行归一化运算、降采样运算、填充缺失值和离散化运算;
步骤SS8,具体包括:
SS81:返回步骤SS3,重复执行步骤SS3~SS7若干次后,对预处理后的测试集进行图像识别,并记录图像识别准确率,依据图像识别准确率调整量子卷积神经网络模型中的超参数;
SS82:重复步骤SS81,直至损失函数值达到设定要求,和/或,训练迭代次数达到设定次数;保存训练完成后的量子神经网络模型,包括保存模型中的量子门序列及其参数。
CN202110910909.0A 2021-08-10 2021-08-10 一种基于量子卷积神经网络的图像识别系统及方法 Active CN113361664B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110910909.0A CN113361664B (zh) 2021-08-10 2021-08-10 一种基于量子卷积神经网络的图像识别系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110910909.0A CN113361664B (zh) 2021-08-10 2021-08-10 一种基于量子卷积神经网络的图像识别系统及方法

Publications (2)

Publication Number Publication Date
CN113361664A CN113361664A (zh) 2021-09-07
CN113361664B true CN113361664B (zh) 2021-11-05

Family

ID=77540837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110910909.0A Active CN113361664B (zh) 2021-08-10 2021-08-10 一种基于量子卷积神经网络的图像识别系统及方法

Country Status (1)

Country Link
CN (1) CN113361664B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114764620B (zh) * 2021-12-31 2024-04-09 本源量子计算科技(合肥)股份有限公司 一种量子卷积操作器
CN114444664B (zh) * 2022-02-01 2022-10-14 上海图灵智算量子科技有限公司 基于量子计算的注意力模型及神经网络模型
CN116740343A (zh) * 2022-03-01 2023-09-12 本源量子计算科技(合肥)股份有限公司 一种基于量子经典混合神经网络的图像分割方法及装置
CN114358258B (zh) * 2022-03-17 2022-07-12 苏州浪潮智能科技有限公司 一种量子神经网络训练方法和装置
CN114863167B (zh) * 2022-04-22 2024-02-02 苏州浪潮智能科技有限公司 一种图像识别分类的方法、系统、设备以及介质
CN115641852A (zh) * 2022-10-18 2023-01-24 中国电信股份有限公司 声纹识别方法、装置、电子设备和计算机可读存储介质
CN115828999B (zh) * 2022-10-21 2023-09-19 中国人民解放军战略支援部队信息工程大学 基于量子态振幅变换的量子卷积神经网络构建方法及系统
CN115908943A (zh) * 2022-12-16 2023-04-04 合肥本源量子计算科技有限责任公司 图像分类方法、装置、电子设备及计算机可读存储介质
CN117437494B (zh) * 2023-12-20 2024-04-16 量子科技长三角产业创新中心 一种图像分类方法、系统、电子设备及存储介质
CN117669753B (zh) * 2024-01-31 2024-04-16 北京航空航天大学杭州创新研究院 量子模型训练方法、多模态数据处理方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110969086A (zh) * 2019-10-31 2020-04-07 福州大学 一种基于多尺度cnn特征及量子菌群优化kelm的手写图像识别方法
JP2020060967A (ja) * 2018-10-10 2020-04-16 LeapMind株式会社 ニューラルネットワーク処理装置、およびニューラルネットワーク処理方法
CN111340193A (zh) * 2020-02-29 2020-06-26 湖北师范大学 一种量子平均池化计算方法
CN111582210A (zh) * 2019-07-09 2020-08-25 沈阳工业大学 基于量子神经网络的人体行为识别方法
CN112464003A (zh) * 2020-11-06 2021-03-09 苏州浪潮智能科技有限公司 一种图像分类方法及相关装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3112817A1 (en) * 2018-10-05 2020-04-09 President And Fellows Of Harvard College Quantum convolutional neural networks
CN109948742B (zh) * 2019-03-25 2022-12-02 西安电子科技大学 基于量子神经网络的手写体图片分类方法
US11562279B2 (en) * 2019-06-18 2023-01-24 Xanadu Quantum Technologies Inc. Apparatus and methods for quantum computing and machine learning
CN112613366A (zh) * 2020-12-14 2021-04-06 中国电子科技集团公司第五十四研究所 基于量子遗传算法的驾驶员状态检测神经网络构建方法
CN112613571A (zh) * 2020-12-29 2021-04-06 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 一种用于图像识别的量子神经网络方法、系统及介质
CN113158599B (zh) * 2021-04-14 2023-07-18 广州放芯科技有限公司 基于量子信息学的芯片和芯片化eda装置
CN113159239B (zh) * 2021-06-28 2021-09-28 北京航空航天大学 一种量子图卷积神经网络处理图数据的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020060967A (ja) * 2018-10-10 2020-04-16 LeapMind株式会社 ニューラルネットワーク処理装置、およびニューラルネットワーク処理方法
CN111582210A (zh) * 2019-07-09 2020-08-25 沈阳工业大学 基于量子神经网络的人体行为识别方法
CN110969086A (zh) * 2019-10-31 2020-04-07 福州大学 一种基于多尺度cnn特征及量子菌群优化kelm的手写图像识别方法
CN111340193A (zh) * 2020-02-29 2020-06-26 湖北师范大学 一种量子平均池化计算方法
CN112464003A (zh) * 2020-11-06 2021-03-09 苏州浪潮智能科技有限公司 一种图像分类方法及相关装置

Also Published As

Publication number Publication date
CN113361664A (zh) 2021-09-07

Similar Documents

Publication Publication Date Title
CN113361664B (zh) 一种基于量子卷积神经网络的图像识别系统及方法
Schulz et al. Deep learning: Layer-wise learning of feature hierarchies
Mohamed et al. Content-based image retrieval using convolutional neural networks
Rodrigues et al. Deep hashing for multi-label image retrieval: a survey
Ali et al. Pioneer dataset and automatic recognition of Urdu handwritten characters using a deep autoencoder and convolutional neural network
CN112733866A (zh) 一种提高可控图像文本描述正确性的网络构建方法
CN110941734A (zh) 基于稀疏图结构的深度无监督图像检索方法
CN111125411A (zh) 一种深度强相关哈希学习的大规模图像检索方法
CN115661550B (zh) 基于生成对抗网络的图数据类别不平衡分类方法及装置
CN110188827A (zh) 一种基于卷积神经网络和递归自动编码器模型的场景识别方法
Kalra et al. Learning permutation invariant representations using memory networks
CN112270345A (zh) 基于自监督字典学习的聚类算法
CN117437494A (zh) 一种图像分类方法、系统、电子设备及存储介质
CN115147601A (zh) 基于自注意力全局特征增强的城市街道点云语义分割方法
Dinov et al. Black box machine-learning methods: Neural networks and support vector machines
Wu et al. Directly connected convolutional neural networks
Diao et al. Multi-label remote sensing image classification with deformable convolutions and graph neural networks
CN116524282B (zh) 一种基于特征向量的离散相似度匹配分类方法
Kashyap et al. Quantum Convolutional Neural Network Architecture for Multi-Class Classification
Bi et al. K-means clustering optimizing deep stacked sparse autoencoder
Kanungo Analysis of Image Classification Deep Learning Algorithm
Khastavaneh et al. Representation learning techniques: An overview
Xue et al. Fast and unsupervised neural architecture evolution for visual representation learning
Su et al. A dual quantum image feature extraction method: PSQIFE
Probst The set autoencoder: Unsupervised representation learning for sets

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant