CN114419380A - 一种图像识别方法、装置及电子设备和存储介质 - Google Patents

一种图像识别方法、装置及电子设备和存储介质 Download PDF

Info

Publication number
CN114419380A
CN114419380A CN202210334041.9A CN202210334041A CN114419380A CN 114419380 A CN114419380 A CN 114419380A CN 202210334041 A CN202210334041 A CN 202210334041A CN 114419380 A CN114419380 A CN 114419380A
Authority
CN
China
Prior art keywords
quantum
image
output
data
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210334041.9A
Other languages
English (en)
Inventor
姜金哲
张新
李辰
李红珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202210334041.9A priority Critical patent/CN114419380A/zh
Publication of CN114419380A publication Critical patent/CN114419380A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N10/00Quantum computing, i.e. information processing based on quantum-mechanical phenomena
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Computational Mathematics (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种图像识别方法、装置及一种电子设备和计算机可读存储介质,该方法包括:获取图像数据,将所述图像数据映射到量子态空间,以生成图像量子数据;将所述图像量子数据输入卷积神经网络中进行图像识别;其中,所述卷积神经网络包括多个卷积层和输出层,每个所述卷积层包括多个通道,所述输出层包括多个通道。本申请提供的图像识别方法,将传统的卷积神经网络计算模式与量子计算相结合,利用卷积神经网络的高效表达能力,更有效的进行图像识别任务,提高了图像识别的准确度。

Description

一种图像识别方法、装置及电子设备和存储介质
技术领域
本申请涉及图像识别技术领域,更具体地说,涉及一种图像识别方法、装置及一种电子设备和一种计算机可读存储介质。
背景技术
图像识别领域中,卷积神经网络的应用十分广泛,更在逐步成为最为主流的机器学习算法。而量子计算则是近些年最为火热的研究方向,因为其具有的高并行、超大存储空间等特点,充满了高性能计算所需的发展潜力。随着目前数据量的日益增大,机器学习的模型也与日剧增,对传统卷积神经网络模型的计算已逐渐遇到算力瓶颈,所以卷积神经网络与量子计算的理论相结合,发展量子卷积神经网络计算,是对未来高性能机器学习算法的探索,是目前机器学习研究中的极具潜力的前沿课题,同时它也很可能是未来人工智能发展的新热点。
但是,在相关技术中卷积神经网络应用于图像识别时准确度较低,因此,如何提高图像识别的准确度是本领域技术人员需要解决的技术问题。
发明内容
本申请的目的在于提供一种图像识别方法、装置及一种电子设备和一种计算机可读存储介质,提高了图像识别的准确度。
为实现上述目的,本申请提供了一种图像识别方法,包括:
获取图像数据,将所述图像数据映射到量子态空间,以生成图像量子数据;
将所述图像量子数据输入卷积神经网络中进行图像识别;其中,所述卷积神经网络包括多个卷积层和输出层,每个所述卷积层包括多个通道,所述输出层包括多个通道。
其中,将所述图像数据映射到量子态空间,以生成图像量子数据,包括:
利用量子旋转门对所述图像数据中的每个像素点对应的辅助比特进行操作,得到每个所述像素点对应的量子比特数据,以生成所述图像数据对应的图像量子数据。
其中,将所述图像量子数据输入卷积神经网络中进行图像识别,包括:
将所述图像量子数据输入第一个卷积层中,得到第一个卷积层的输出特征图;
将第c-1个卷积层的输出特征图输入第c个卷积层中,得到第c个卷积层的输出特征图;
将最后一个卷积层的输出特征图输入所述输出层中,根据所述输出层的输出结果确定所述图像数据的类别。
其中,第c-1个卷积层输出mc-1个输出特征图,c为大于1的正整数;
相应的,所述将第c-1个卷积层的输出特征图输入第c个卷积层中,得到第c个卷积层的输出特征图,包括:
在第c个卷积层中的每个通道中,利用每个通道对应的量子卷积核对第c-1个卷积层的输出特征图进行卷积操作,得到每个通道对应的mc-1个中间特征图;
在第c个卷积层中的每个通道中,对每个通道对应的mc-1个中间特征图中对应位置的量子比特数据进行聚合,得到每个通道的输出特征图;
将第c个卷积层中所有通道的输出特征图确定为第c个卷积层的输出特征图。
其中,所述将最后一个卷积层的输出特征图输入所述输出层中,根据所述输出层的输出结果确定所述图像数据的类别,包括:
在所述输出层中的每个通道中,利用所述输出层中的每个通道对应的量子卷积核对最后一个卷积层的输出特征图进行卷积操作,得到每个通道对应的输出量子比特数据;
在所述输出层中的每个通道中,将每个通道对应的输出量子比特数据中|1>状态的概率确定为每个通道的输出概率;
将输出概率最大的通道对应的类别确定为所述图像数据的类别。
其中,所述在第c个卷积层中的每个通道中,对每个通道对应的mc-1个中间特征图中对应位置的量子比特数据进行聚合,得到每个通道的输出特征图,包括:
在第c个卷积层中的每个通道中,通过多量子比特控制非门对每个通道对应的mc-1个中间特征图中对应位置的量子比特数据进行聚合,得到每个通道的输出特征图。
其中,还包括:
获取训练图像数据,并确定所述训练图像数据对应的类别标签;
将所述训练图像数据映射到量子态空间,以生成训练图像量子数据;
利用所述训练图像量子数据和对应的类别标签对所述卷积神经网络进行训练。
为实现上述目的,本申请提供了一种图像识别装置,包括:
映射模块,用于获取图像数据,将所述图像数据映射到量子态空间,以生成图像量子数据;
识别模块,用于将所述图像量子数据输入卷积神经网络中进行图像识别;其中,所述卷积神经网络包括多个卷积层和输出层,每个所述卷积层包括多个通道,所述输出层包括多个通道。
为实现上述目的,本申请提供了一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述图像识别方法的步骤。
为实现上述目的,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述图像识别方法的步骤。
通过以上方案可知,本申请提供的一种图像识别方法,包括:获取图像数据,将所述图像数据映射到量子态空间,以生成图像量子数据;将所述图像量子数据输入卷积神经网络中进行图像识别;其中,所述卷积神经网络包括多个卷积层和输出层,每个所述卷积层包括多个通道,所述输出层包括多个通道。
本申请提供的图像识别方法,将传统的卷积神经网络计算模式与量子计算相结合,利用卷积神经网络的高效表达能力,更有效的进行图像识别任务,提高了图像识别的准确度。本申请还公开了一种图像识别装置及一种电子设备和一种计算机可读存储介质,同样能实现上述技术效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1为根据一示例性实施例示出的一种图像识别方法的流程图;
图2为根据一示例性实施例示出的一种卷积层通道卷积过程的示意图;
图3为根据一示例性实施例示出的一种卷积层通道聚合过程的示意图;
图4为根据一示例性实施例示出的一种输出层输出比特计算过程的示意图;
图5为根据一示例性实施例示出的一种图像识别装置的结构图;
图6为根据一示例性实施例示出的一种电子设备的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。另外,在本申请实施例中,“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
量子卷积神经网络主要是将卷积神经网络结构由量子比特和量子门实现。在量子卷积神经网络中,将输入的传统图片信息中每个像素点转化量子比特,量子比特对应传统计算机当中比特的概念,有两个存在的状态|0>,|1>,对应比特的开关状态,但与经典比特的区别在于,量子比特的状态可以是两种状态的线性叠加状态,其形式为:
|φ> =α|0>+ β|1>
其中α,β称为量子态的概率幅,分别表示处于两种态的概率分布,满足|α|2+|β|2=1。这也是量子比特的特点与优势之一,每个量子比特可以同时表征两种状态。量子卷积神经网络的除输入的图像信息外,卷积核的每个信息也同样的表示为量子态。
量子门则是实现量子卷积神经网络信息调整和聚合的重要手段,是对量子态进行的控制操作。常用的单量子控制门量子旋转门R(θ)都可以使目标量子比特旋转特定的角度,即改变其概率幅分布,起到和传统卷积神经网络卷积核参数的作用。多位量子控制门,如n位受控非门是在前n个量子比特全为|1>态时候,才对目标比特进行作用,多在量子比特信息聚合时使用。量子卷积神经网络可利用卷积核对输入的图片的量子比特信息作用进行图像识别。
目前量子卷积神经网络方面的研究较为稀少,调研发现目前的工作大部分工作采用的是单通道的计算模式,多通道模式的相关工作也只是各通道内部单独传递,没有通道间的信息聚合。传统卷积神经网络的模型结构经常出现多通道的结构,例如常用的卷积神经网络的一个卷积层具有32通道的3×3卷积核,多通道之间的信息聚合是提升模型表达能力、预测精度的常用的有效的手段,是值得量子卷积神经网络借鉴的技术方法。另外,目前量子卷积神经网络在分类的过程中仍然经常使用Softmax方法。Softmax在卷积神经网络中是普遍采用的分类方法。该函数定义如下:
Figure DEST_PATH_IMAGE001
其中,Vi是分类器前级输出单元的输出,i表示类别索引,总的类别个数为C,Si表示的是当前元素的指数与所有元素指数和的比值,把输出的神经元映射到(0,1)之间,并且保证归一化后的和为1,即表示多分类的概率之和为100%。量子卷积神经网络在分类阶段将输出的量子信息转化为传统数据信息并利用softmax方法,最终得出量子卷积神经网络输出的分类结果。
所以这些量子卷积神经网络存在以下的问题:首先量子卷积神经网络结构的通道数基本为1,或者多通道的结构之间无信息的进一步聚合,大大限制了模型的扩展和能力提升。然后是分类函数的非线性问题,我们知道非线性计算过程会存在一些不可预知的问题,目前卷积神经网络的泛化性能差很有可能就是非线性计算过程的结果。
基于以上问题,本申请采用具有信息聚合能力的多通道量子卷积计算,并且为线性的计算过程,解决了目前量子卷积神经网络存在的问题。
本申请实施例公开了一种图像识别方法,提高了图像识别的准确度。
参见图1,根据一示例性实施例示出的一种图像识别方法的流程图,如图1所示,包括:
S101:获取图像数据,将所述图像数据映射到量子态空间,以生成图像量子数据;
在本实施例中,对于需要进行图像识别的图像数据,将其映射到量子态空间,以生成对应的图像量子数据。作为一种可行的实施方式,将所述图像数据映射到量子态空间,以生成图像量子数据,包括:利用量子旋转门对所述图像数据中的每个像素点对应的辅助比特进行操作,得到每个所述像素点对应的量子比特数据,以生成所述图像数据对应的图像量子数据。
在具体实施中,采用量子电路的计算方式将传统的图像数据样本映射到量子态空间,即为量子卷积神经网络可作用的量子比特形式,设图像样本数据为X={x11,x12,…,xnn},其中n代表图像的维度大小。对于每一个像素点xij,利用量子旋转门R对相应的辅助比特进行操作,辅助比特初始化为|0>态,得到映射后的对应量子比特|xij>=R(xij)|0>,则映射后的量子样本为|X>=∏| xij >,随后将量子样本输入到卷积层进行计算。
S102:将所述图像量子数据输入卷积神经网络中进行图像识别;其中,所述卷积神经网络包括多个卷积层和输出层,每个所述卷积层包括多个通道,所述输出层包括多个通道。
在具体实施中,卷积神经网络的训练过程包括:获取训练图像数据,并确定所述训练图像数据对应的类别标签;将所述训练图像数据映射到量子态空间,以生成训练图像量子数据;利用所述训练图像量子数据和对应的类别标签对所述卷积神经网络进行训练。
卷积神经网络包括多个串行连接的卷积层和输出层,每个卷积层和输出层均包括多个通道,图像量子数据在卷积神经网络中的处理过程包括:将所述图像量子数据输入第一个卷积层中,得到第一个卷积层的输出特征图;将第c-1个卷积层的输出特征图输入第c个卷积层中,得到第c个卷积层的输出特征图;将最后一个卷积层的输出特征图输入所述输出层中,根据所述输出层的输出结果确定所述图像数据的类别。在具体实施中,初始的图像量子数据的尺寸为n0×n0,将其输入第一个卷积层,第一个卷积层包含m1个通道,输出数据的尺寸为n1×n1×m1,也即输出m1个输出特征图,输入第二个卷积层,以此类推,将第c-1个卷积层的输出特征图输入第c个卷积层中,得到第c个卷积层的输出特征图,c=2,3,…,最后一个卷积层的输出特征图输入输出层中,根据输出层的输出结果确定所述图像数据的类别。
第c-1个卷积层输出mc-1个输出特征图,第c个卷积层的处理过程包括:在第c个卷积层中的每个通道中,利用每个通道对应的量子卷积核对第c-1个卷积层的输出特征图进行卷积操作,得到每个通道对应的mc-1个中间特征图;在第c个卷积层中的每个通道中,对每个通道对应的mc-1个中间特征图中对应位置的量子比特数据进行聚合,得到每个通道的输出特征图;将第c个卷积层中所有通道的输出特征图确定为第c个卷积层的输出特征图。在具体实施中,第c个卷积层的输入数据维度为nc-1×n c-1×mc-1,根据计算场景需求设置第c个卷积层所需通道数mc,每个通道的量子卷积核可设置为kc×kc,其中每个卷积核由量子旋转门构成,每个旋转门的角度为可训练参数。该卷积层j通道的量子卷积核通过卷积计算的方式作用于输入数据可得mc-1个特征图,计算过程如图2所示,像素点卷积计算公式为:
Figure 767956DEST_PATH_IMAGE002
,其中,R(θij)为(i,j)位置对应的量子旋转门,
Figure 113487DEST_PATH_IMAGE003
为多量子比特控制非门,即n个控制比特作用到一个受控比特上,当所有的控制比特为|1>时,对受控比特进行非操作,其他时候不对受控比特进行操作。在第c个卷积层中的每个通道中,通过多量子比特控制非门对每个通道对应的mc-1个中间特征图中对应位置的量子比特数据进行聚合,得到每个通道的输出特征图,计算过程如图3所示,像素点聚合计算公式为:
Figure 467108DEST_PATH_IMAGE004
Figure 530879DEST_PATH_IMAGE005
为第c-1个特征图中(i,j)位置的值,最终得到mc个特征图为该卷积层输出,并做为下一层卷积层或者输出层的输入。
输出层的处理过程包括:在所述输出层中的每个通道中,利用所述输出层中的每个通道对应的量子卷积核对最后一个卷积层的输出特征图进行卷积操作,得到每个通道对应的输出量子比特数据;在所述输出层中的每个通道中,将每个通道对应的输出量子比特数据中|1>状态的概率确定为每个通道的输出概率;将输出概率最大的通道对应的类别确定为所述图像数据的类别。在具体实施中,输出层的输入数据维度为nC×nC×mC,卷积神经网络中一共包含C个卷积层,第C个卷积层为最后一个卷积层,若类别标签的数量为p,则输出层包括p个通道,每个通道的量子卷积核可设置为nC×nC,最终输出为p个量子比特,计算示意图如图4所示。取每个量子比特为|1>的概率值作为该通道表示的输出标签的概率,选取其中概率最高的标签为最终模型给出的预测标签,便可进行图像识别任务。例如两通道的输出量子比特可表征两张种状态,选取其中为|1>的概率更高的为最终的输出标签,完成二分类识别任务。
本申请实施例提供的图像识别方法,将传统的卷积神经网络计算模式与量子计算相结合,利用卷积神经网络的高效表达能力,更有效的进行图像识别任务,提高了图像识别的准确度。进一步的,本申请实施例提供的图像识别方法,符合量子计算特性,计算过程为线性过程,使用该方法后量子卷积神经网络为全局的线性计算过程,具有很强的泛化能力和表达能力。
下面对本申请实施例提供的一种图像识别装置进行介绍,下文描述的一种图像识别装置与上文描述的一种图像识别方法可以相互参照。
参见图5,根据一示例性实施例示出的一种图像识别装置的结构图,如图5所示,包括:
映射模块501,用于获取图像数据,将所述图像数据映射到量子态空间,以生成图像量子数据;
识别模块502,用于将所述图像量子数据输入卷积神经网络中进行图像识别;其中,所述卷积神经网络包括多个卷积层和输出层,每个所述卷积层包括多个通道,所述输出层包括多个通道。
本申请实施例提供的图像识别装置,将传统的卷积神经网络计算模式与量子计算相结合,利用卷积神经网络的高效表达能力,更有效的进行图像识别任务,提高了图像识别的准确度。进一步的,本申请实施例提供的图像识别装置,符合量子计算特性,计算过程为线性过程,使用该方法后量子卷积神经网络为全局的线性计算过程,具有很强的泛化能力和表达能力。
在上述实施例的基础上,作为一种优选实施方式,所述映射模块501具体用于:利用量子旋转门对所述图像数据中的每个像素点对应的辅助比特进行操作,得到每个所述像素点对应的量子比特数据,以生成所述图像数据对应的图像量子数据。
在上述实施例的基础上,作为一种优选实施方式,所述识别模块502包括:
第一输入单元,用于将所述图像量子数据输入第一个卷积层中,得到第一个卷积层的输出特征图;
第二输入单元,用于将第c-1个卷积层的输出特征图输入第c个卷积层中,得到第c个卷积层的输出特征图;
确定单元,用于将最后一个卷积层的输出特征图输入所述输出层中,根据所述输出层的输出结果确定所述图像数据的类别。
在上述实施例的基础上,作为一种优选实施方式,第c-1个卷积层输出mc-1个输出特征图,c为大于1的正整数;
相应的,所述第二输入单元包括:
卷积子单元,用于在第c个卷积层中的每个通道中,利用每个通道对应的量子卷积核对第c-1个卷积层的输出特征图进行卷积操作,得到每个通道对应的mc-1个中间特征图;
聚合子单元,用于在第c个卷积层中的每个通道中,对每个通道对应的mc-1个中间特征图中对应位置的量子比特数据进行聚合,得到每个通道的输出特征图;
确定子单元,用于将第c个卷积层中所有通道的输出特征图确定为第c个卷积层的输出特征图。
在上述实施例的基础上,作为一种优选实施方式,所述确定单元具体用于:在所述输出层中的每个通道中,利用所述输出层中的每个通道对应的量子卷积核对最后一个卷积层的输出特征图进行卷积操作,得到每个通道对应的输出量子比特数据;在所述输出层中的每个通道中,将每个通道对应的输出量子比特数据中|1>状态的概率确定为每个通道的输出概率;将输出概率最大的通道对应的类别确定为所述图像数据的类别。
在上述实施例的基础上,作为一种优选实施方式,所述聚合子单元具体用于:在第c个卷积层中的每个通道中,通过多量子比特控制非门对每个通道对应的mc-1个中间特征图中对应位置的量子比特数据进行聚合,得到每个通道的输出特征图。
在上述实施例的基础上,作为一种优选实施方式,还包括:
确定模块,用于获取训练图像数据,并确定所述训练图像数据对应的类别标签;
生成模块,用于将所述训练图像数据映射到量子态空间,以生成训练图像量子数据;
训练模块,用于利用所述训练图像量子数据和对应的类别标签对所述卷积神经网络进行训练。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于上述程序模块的硬件实现,且为了实现本申请实施例的方法,本申请实施例还提供了一种电子设备,图6为根据一示例性实施例示出的一种电子设备的结构图,如图6所示,电子设备包括:
通信接口1,能够与其它设备比如网络设备等进行信息交互;
处理器2,与通信接口1连接,以实现与其它设备进行信息交互,用于运行计算机程序时,执行上述一个或多个技术方案提供的图像识别方法。而所述计算机程序存储在存储器3上。
当然,实际应用时,电子设备中的各个组件通过总线系统4耦合在一起。可理解,总线系统4用于实现这些组件之间的连接通信。总线系统4除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图6中将各种总线都标为总线系统4。
本申请实施例中的存储器3用于存储各种类型的数据以支持电子设备的操作。这些数据的示例包括:用于在电子设备上操作的任何计算机程序。
可以理解,存储器3可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random AccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本申请实施例描述的存储器3旨在包括但不限于这些和任意其它适合类型的存储器。
上述本申请实施例揭示的方法可以应用于处理器2中,或者由处理器2实现。处理器2可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器2中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器2可以是通用处理器、DSP,或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器2可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器3,处理器2读取存储器3中的程序,结合其硬件完成前述方法的步骤。
处理器2执行所述程序时实现本申请实施例的各个方法中的相应流程,为了简洁,在此不再赘述。
在示例性实施例中,本申请实施例还提供了一种存储介质,即计算机存储介质,具体为计算机可读存储介质,例如包括存储计算机程序的存储器3,上述计算机程序可由处理器2执行,以完成前述方法所述步骤。计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种图像识别方法,其特征在于,包括:
获取图像数据,将所述图像数据映射到量子态空间,以生成图像量子数据;
将所述图像量子数据输入卷积神经网络中进行图像识别;其中,所述卷积神经网络包括多个卷积层和输出层,每个所述卷积层包括多个通道,所述输出层包括多个通道。
2.根据权利要求1所述图像识别方法,其特征在于,将所述图像数据映射到量子态空间,以生成图像量子数据,包括:
利用量子旋转门对所述图像数据中的每个像素点对应的辅助比特进行操作,得到每个所述像素点对应的量子比特数据,以生成所述图像数据对应的图像量子数据。
3.根据权利要求1所述图像识别方法,其特征在于,将所述图像量子数据输入卷积神经网络中进行图像识别,包括:
将所述图像量子数据输入第一个卷积层中,得到第一个卷积层的输出特征图;
将第c-1个卷积层的输出特征图输入第c个卷积层中,得到第c个卷积层的输出特征图;
将最后一个卷积层的输出特征图输入所述输出层中,根据所述输出层的输出结果确定所述图像数据的类别。
4.根据权利要求3所述图像识别方法,其特征在于,第c-1个卷积层输出mc-1个输出特征图,c为大于1的正整数;
相应的,所述将第c-1个卷积层的输出特征图输入第c个卷积层中,得到第c个卷积层的输出特征图,包括:
在第c个卷积层中的每个通道中,利用每个通道对应的量子卷积核对第c-1个卷积层的输出特征图进行卷积操作,得到每个通道对应的mc-1个中间特征图;
在第c个卷积层中的每个通道中,对每个通道对应的mc-1个中间特征图中对应位置的量子比特数据进行聚合,得到每个通道的输出特征图;
将第c个卷积层中所有通道的输出特征图确定为第c个卷积层的输出特征图。
5.根据权利要求3所述图像识别方法,其特征在于,所述将最后一个卷积层的输出特征图输入所述输出层中,根据所述输出层的输出结果确定所述图像数据的类别,包括:
在所述输出层中的每个通道中,利用所述输出层中的每个通道对应的量子卷积核对最后一个卷积层的输出特征图进行卷积操作,得到每个通道对应的输出量子比特数据;
在所述输出层中的每个通道中,将每个通道对应的输出量子比特数据中|1>状态的概率确定为每个通道的输出概率;
将输出概率最大的通道对应的类别确定为所述图像数据的类别。
6.根据权利要求4所述图像识别方法,其特征在于,所述在第c个卷积层中的每个通道中,对每个通道对应的mc-1个中间特征图中对应位置的量子比特数据进行聚合,得到每个通道的输出特征图,包括:
在第c个卷积层中的每个通道中,通过多量子比特控制非门对每个通道对应的mc-1个中间特征图中对应位置的量子比特数据进行聚合,得到每个通道的输出特征图。
7.根据权利要求1所述图像识别方法,其特征在于,还包括:
获取训练图像数据,并确定所述训练图像数据对应的类别标签;
将所述训练图像数据映射到量子态空间,以生成训练图像量子数据;
利用所述训练图像量子数据和对应的类别标签对所述卷积神经网络进行训练。
8.一种图像识别装置,其特征在于,包括:
映射模块,用于获取图像数据,将所述图像数据映射到量子态空间,以生成图像量子数据;
识别模块,用于将所述图像量子数据输入卷积神经网络中进行图像识别;其中,所述卷积神经网络包括多个卷积层和输出层,每个所述卷积层包括多个通道,所述输出层包括多个通道。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述图像识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述图像识别方法的步骤。
CN202210334041.9A 2022-03-31 2022-03-31 一种图像识别方法、装置及电子设备和存储介质 Pending CN114419380A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210334041.9A CN114419380A (zh) 2022-03-31 2022-03-31 一种图像识别方法、装置及电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210334041.9A CN114419380A (zh) 2022-03-31 2022-03-31 一种图像识别方法、装置及电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN114419380A true CN114419380A (zh) 2022-04-29

Family

ID=81263271

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210334041.9A Pending CN114419380A (zh) 2022-03-31 2022-03-31 一种图像识别方法、装置及电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN114419380A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024078394A1 (zh) * 2022-10-13 2024-04-18 中移(苏州)软件技术有限公司 图像质量评价方法、装置、电子设备、存储介质及程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112464003A (zh) * 2020-11-06 2021-03-09 苏州浪潮智能科技有限公司 一种图像分类方法及相关装置
CN113255747A (zh) * 2021-05-14 2021-08-13 山东英信计算机技术有限公司 量子多通道卷积神经分类方法、系统、终端及存储介质
WO2021238279A1 (zh) * 2020-05-25 2021-12-02 腾讯科技(深圳)有限公司 数据分类方法、分类器训练方法及系统
CN114091648A (zh) * 2020-07-29 2022-02-25 中移(苏州)软件技术有限公司 基于卷积神经网络的图像分类方法、装置及卷积神经网络

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021238279A1 (zh) * 2020-05-25 2021-12-02 腾讯科技(深圳)有限公司 数据分类方法、分类器训练方法及系统
CN114091648A (zh) * 2020-07-29 2022-02-25 中移(苏州)软件技术有限公司 基于卷积神经网络的图像分类方法、装置及卷积神经网络
CN112464003A (zh) * 2020-11-06 2021-03-09 苏州浪潮智能科技有限公司 一种图像分类方法及相关装置
CN113255747A (zh) * 2021-05-14 2021-08-13 山东英信计算机技术有限公司 量子多通道卷积神经分类方法、系统、终端及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
郑长松: "《装甲车故障诊断技术》", 30 May 2019 *
高志强: "《深度学习从入门到实战》", 30 June 2018, pages: 67 - 69 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024078394A1 (zh) * 2022-10-13 2024-04-18 中移(苏州)软件技术有限公司 图像质量评价方法、装置、电子设备、存储介质及程序产品

Similar Documents

Publication Publication Date Title
US11710041B2 (en) Feature map and weight selection method and accelerating device
CN112001498B (zh) 基于量子计算机的数据识别方法、装置及可读存储介质
CN111210446B (zh) 一种视频目标分割方法、装置和设备
CN111914085A (zh) 文本细粒度情感分类方法、系统、装置及存储介质
CN112329680A (zh) 基于类激活图的半监督遥感影像目标检测和分割方法
CN111275175A (zh) 神经网络训练方法、装置、图像分类方法、设备和介质
US20210383224A1 (en) Machine learning method and machine learning system involving data augmentation
CN114549913A (zh) 一种语义分割方法、装置、计算机设备和存储介质
CN112446888A (zh) 图像分割模型的处理方法和处理装置
CN113255747B (zh) 量子多通道卷积神经分类方法、系统、终端及存储介质
CN114419380A (zh) 一种图像识别方法、装置及电子设备和存储介质
Seyedhosseini et al. Fast adaboost training using weighted novelty selection
CN114791796A (zh) 一种基于分离栅闪存晶体管的多输入计算单元及其计算方法
CN114926636A (zh) 一种点云语义分割方法、装置、设备及存储介质
CN108875649A (zh) 一种地物分类方法、系统、设备和存储介质
CN115795065A (zh) 基于带权哈希码的多媒体数据跨模态检索方法及系统
CN114491289A (zh) 一种双向门控卷积网络的社交内容抑郁检测方法
Peng et al. Swin transformer-based supervised hashing
WO2024001653A9 (zh) 特征提取方法、装置、存储介质及电子设备
US11567690B2 (en) Semiconductor memory device and electronic system the same
WO2024011859A1 (zh) 一种基于神经网络的人脸检测方法和装置
CN116957024A (zh) 利用神经网络模型进行推理的方法和装置
Zhang et al. Effective traffic signs recognition via kernel PCA network
US20230153572A1 (en) Domain generalizable continual learning using covariances
CN106776600A (zh) 文本聚类的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220429

RJ01 Rejection of invention patent application after publication