CN110909796B - 一种图像分类方法及相关装置 - Google Patents

一种图像分类方法及相关装置 Download PDF

Info

Publication number
CN110909796B
CN110909796B CN201911159360.5A CN201911159360A CN110909796B CN 110909796 B CN110909796 B CN 110909796B CN 201911159360 A CN201911159360 A CN 201911159360A CN 110909796 B CN110909796 B CN 110909796B
Authority
CN
China
Prior art keywords
image
convolution
target
value
target image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911159360.5A
Other languages
English (en)
Other versions
CN110909796A (zh
Inventor
姜金哲
张新
朱效民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201911159360.5A priority Critical patent/CN110909796B/zh
Publication of CN110909796A publication Critical patent/CN110909796A/zh
Application granted granted Critical
Publication of CN110909796B publication Critical patent/CN110909796B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种图像分类方法,包括利用交叉熵函数进行模型训练得到的图像分类模型执行以下步骤:接收目标图像,并对目标图像进行量子化转换;通过预设通道个数的卷积核作用于量子化转换后的目标图像得到预设个数个特征图像;对特征图像进行卷积操作并通过2×2大小的池化窗口对卷积操作后的卷积输出进行乘积池化;乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数基于各所述得分值计算目标图像属于各目标种类的概率值,以及确定概率值最大的目标种类为目标图像所属类别。该方法可有效提高图像分类的准确性与可靠性。本申请还公开了一种图像分类装置、设备以及计算机可读存储介质,均具有上述技术效果。

Description

一种图像分类方法及相关装置
技术领域
本申请涉及人工智能技术领域,特别涉及一种图像分类方法;还涉及一种图像分类装置、设备以及计算机可读存储介质。
背景技术
卷积神经网络具有局部感知、参数共享及多核卷积等特性,在图像识别领域广泛使用,包括人脸识别、行人检测、语音识别、医学图像处理等,即使目标物体的方向、形状、光照条件等发生变化,仍拥有良好的分类精度。量子计算采用一种与传统的计算方式截然不同的新型计算方法,量子并行处理极大地提高了量子计算的效率,使其达到常规计算技术不能达到的解题速度,还可以解决常规计算不能解决的某些计算复杂度很高的问题。量子计算与神经网络融合进行图像分类正逐步成为一个崭新的研究方向。目前,现有的量子门线路神经网络是一种基于量子理论所设计的量子神经网络模型。利用该量子神经网络模型进行图像分类取得了良好的分类效果,在各方面性能上均优于普通BP神经网络。但在,目前的量子门线路神经网络存在如下不足之处:一是在池化过程中,采用的是相邻两个位置进行乘积达到池化目的,这种二维数据上不对称的采样使得量子门线路神经网络在运算过程中大部分处于不对称的状态,同时需面临采样方向的选择问题;二是输出层的损失函数选择,采用的是预测值与目标值的差的平方,导致收敛速度较慢;上述两点技术缺陷均回影响图像分类的准确度与可靠性。
因此,如何提供解决上述技术缺陷已成为本领域技术人员亟待解决的技术问题。
发明内容
本申请的目的是提供一种图像分类方法,能够有效保障图像分类的准确度与可靠性;本申请的另一目的是提供一种图像分类装置、设备以及计算机可读存储介质,均具有上述技术效果。
为解决上述技术问题,本申请提供了一种图像分类方法,包括:
训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;
利用训练完成的所述图像分类模型执行以下步骤:
接收目标图像,并对所述目标图像进行量子化转换;
通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;
对所述特征图像进行卷积操作并通过
Figure DEST_PATH_IMAGE001
大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;
乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别。
可选的,所述对所述目标图像进行量子化转换,包括:
将所述目标图像的像素点的实值的最大值与最小值做差得到基准值;
分别计算各所述像素点的实值与所述最小值的差值并基于所述差值与所述基准值得到各所述像素点对应的概率角度;
基于所述概率角度将所述像素点的实值转化为量子态。
可选的,所述通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像,包括:
利用Hadamard门将各所述像素点的量子态的概率角度旋转
Figure DEST_PATH_IMAGE002
利用量子旋转门将概率角度旋转
Figure 908245DEST_PATH_IMAGE002
后的所述像素点的量子态的概率角度旋转预设角度;
将所述预设通道个数的卷积核作用于像素点的量子态的概率角度旋转了所述目标角度后的所述目标图像;
对各层卷积输出添加偏置项后得到所述预设个数个特征图像。
可选的,所述对所述特征图像进行卷积操作,包括:
利用量子旋转门对所述特征图像进行卷积操作并对隐藏层各通道添加偏置项。
可选的,所述乘积池化后在输出层得到目标图像对各目标种类的得分值包括:
在输出层利用量子旋转门根据乘积池化后的输出值得到所述目标图像对各目标种类的得分值。
为解决上述技术问题,本申请还提供了一种图像分类装置,包括:
训练模块,用于训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;
转换模块,用于接收目标图像,并对所述目标图像进行量子化转换;
提取模块,用于通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;
卷积与池化模块,用于对所述特征图像进行卷积操作,并通过
Figure DEST_PATH_IMAGE003
大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;
确定模块,用于乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别。
可选的,所述转换模块包括:
第一计算单元,用于将所述目标图像的像素点的实值的最大值与最小值做差得到基准值;
第二计算单元,用于分别计算各所述像素点的实值与所述最小值的差值并基于所述差值与所述基准值得到各所述像素点对应的概率角度;
转换单元,用于基于所述概率角度将所述像素点的实值转化为量子态。
可选的,所述提取模块包括:
第一旋转单元,用于利用Hadamard门将各所述像素点的量子态的概率角度旋转
Figure 291953DEST_PATH_IMAGE002
第二旋转单元,用于利用量子旋转门将概率角度旋转
Figure 422720DEST_PATH_IMAGE002
后的所述像素点的量子态的概率角度旋转预设角度;
提取单元,用于将所述预设通道个数的卷积核作用于像素点的量子态的概率角度旋转了所述目标角度后的所述目标图像,并对各层卷积输出添加偏置项后得到所述预设个数个特征图像。
为解决上述技术问题,本申请还提供了一种图像分类设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上所述的图像分类方法的步骤。
为解决上述技术问题,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的图像分类方法的步骤。
本申请所提供的图像分类方法,包括训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;利用训练完成的所述图像分类模型执行以下步骤:接收目标图像,并对所述目标图像进行量子化转换;通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;对所述特征图像进行卷积操作并通过
Figure DEST_PATH_IMAGE004
大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别。
可见,在对目标图像进行量子化转换以及得到特征图像的基础上,本申请通过
Figure DEST_PATH_IMAGE005
大小的池化窗口进行乘积池化操作,从而无需选择池化方向,有效简化了操作。并且通过
Figure DEST_PATH_IMAGE006
大小的池化窗口遍历特征图像可使网络结构的两个维度在池化后共同缩小二分之一,维持相同的尺寸,有效保持了图层的对称性与稳定性,提高了图像分类的准确性。此外,相较于训练过程中使用平方损失函数的传统方式,本申请在模型训练过程中利用交叉熵函数计算输出层参数的梯度,从而可以更好的惩罚不好的预测,在误差较大时梯度下降更快,避免在梯度下降过程中出现梯度消散现象,提高图像分类模型的稳定性,保障图像分类的可靠性。
本申请所提供的图像分类装置、设备以及计算机可读存储介质,均具有上述技术效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例所提供的一种图像分类方法的流程示意图;
图2为本申请实施例所提供的一种卷积层量子卷积电路图;
图3为本申请实施例所提供的一种输出层全连接量子电路图;
图4为本申请实施例所提供的一种图像分类装置的示意图;
图5为本申请实施例所提供的一种图像分类设备的示意图。
具体实施方式
本申请的核心是提供一种图像分类方法,能够有效保障图像分类的准确度与可靠性;本申请的另一核心是提供一种图像分类装置、设备以及计算机可读存储介质,均具有上述技术效果。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参考图1,图1为本申请实施例所提供的一种图像分类方法的流程示意图;参考图1所示,该图像分类方法包括:
S101:训练图像分类模型;其中,在训练图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据梯度调整参数得到符合要求的图像分类模型;
具体的,本步骤旨在进行图像分类模型的训练,以后续利用训练完成的图像分类模型进行图像分类。具体而言,本申请采用梯度下降的方法训练图像分类模型,从图像分类模型的最后一层向第一层逐层反向传播需要训练的参数的梯度,并在梯度方向上调整参数的值,以得到复合要求的图像分类模型。其中,本申请利用交叉熵函数计算输出层的各个参数的梯度,从而较之使用平方损失函数的传统方式,本申请可以更好的惩罚不好的预测,在误差较大时梯度下降更快,避免在梯度下降过程中出现梯度消散现象,提高图像分类模型的稳定性,保障图像分类的可靠性。
可以明白的是,上述训练图像分类模型的步骤可以只执行一次,即图像分类模型训练完成后,后续利用此图像分类模型进行图像分类即可,而无需重复进行图像分类模型的训练。
S102:接收目标图像,并对所述目标图像进行量子化转换;
具体的,本申请所提供的图像分类方法利用量子计算与卷积神经网络相融合的图像分类模型进行图像分类,该图像分类模型训练完成后,便可利用此图像分类模型进行图像分类。其中,本步骤旨在在图像分类模型的表示层对接收到的目标图像进行量子化转换,即将目标图像的各像素点的实值转换为概率分布的量子态,从而利用量子计算的特性,提高运算效率。
在一种具体的实施方式中,上述对目标图像进行量子化转换包括将目标图像的像素点的实值的最大值与最小值做差得到基准值;分别计算各像素点的实值与最小值的差值并基于差值与基准值得到各像素点对应的概率角度;基于概率角度将像素点的实值转化为量子态。
具体的,本实施例采取全局量化的方式对目标图像进行量子化转换,以更好的表征目标图像的整体特性,利于后续准确的进行图像分类。具体而言,首先计算目标图像的各像素点的实值的最大值与最小值的差值,并将此最大值与最小值的差值作为基准值。进一步,分别计算各像素点的实值与该最小值的差值,并基于基准值以及各像素点的实值与该最小值的差值分别得到各像素点对应的概率角度,进而基于概率角度将对应像素点的实值转化为量子态,如如下公式所示:
Figure DEST_PATH_IMAGE007
;其中,
Figure DEST_PATH_IMAGE008
Figure DEST_PATH_IMAGE009
表示概率角度,x表示像素点的实值,
Figure DEST_PATH_IMAGE010
,即b表示像素点的实值的最大值,
Figure DEST_PATH_IMAGE011
,即a表示像素点的实值的最小值。
S103:通过预设通道个数的卷积核作用于量子化转换后的目标图像得到预设个数个特征图像;
具体的,将目标图像的各像素点的实值转换为量子态后,本步骤旨在在图像分类模型的表示层进一步将单通道或少数通道的输入值转换为多通道的特征,具体即通过预设通道个数的卷积核作用于量子化转换后的目标图像,从而得到预设个数个特征图像,以为后续进行卷积操作做准备,提升图像分类的准确性。其中,特征图像的个数等于卷积核的通道个数,而对于卷积核的通道个数本申请不做具体限定,可以根据实际需要进行差异性设置。例如,通过m通道的
Figure DEST_PATH_IMAGE012
大小的卷积核作用于量子化转换后的目标图像,从而得到m个的
Figure DEST_PATH_IMAGE013
大小的特征图像。
另外,在一种具体的实施方式中,上述通过预设通道个数的卷积核作用于量子化转换后的目标图像得到预设个数个特征图像包括:利用Hadamard门(哈达玛门)将各像素点的量子态的概率角度旋转
Figure 512643DEST_PATH_IMAGE002
;利用量子旋转门将概率角度旋转
Figure 237016DEST_PATH_IMAGE002
后的像素点的量子态的概率角度旋转预设角度;将预设通道个数的卷积核作用于像素点的量子态的概率角度旋转了目标角度后的目标图像;对各层卷积输出添加偏置项后得到预设个数个特征图像。
具体的,较之传统的卷积操作,本实施例利用量子门组对量子态进行偏移操作,首先利用Hadamard门对原始的量子态进行H操作,以将各像素点的量子态的概率角度旋转
Figure 17890DEST_PATH_IMAGE002
。然后,在此基础上进一步利用量子旋转门
Figure DEST_PATH_IMAGE014
再将各像素点的量子态的概率角度旋转预设角度
Figure DEST_PATH_IMAGE015
,如如下公式所示:
Figure DEST_PATH_IMAGE016
;其中,
Figure DEST_PATH_IMAGE017
Figure DEST_PATH_IMAGE018
表示对
Figure DEST_PATH_IMAGE019
量子态进行初始化旋转操作的预设角度;
Figure DEST_PATH_IMAGE020
表示原始数据中第i行、第j列对应的像素点;
Figure DEST_PATH_IMAGE021
表示初始化完成后量子态
Figure DEST_PATH_IMAGE022
的角度;
完成上述初始化准备后,进一步将预设通道个数的卷积核作用于初始化后的输入值,将各卷积核扫过输入值,对应位置的初始化后的输入值与权重
系数
Figure DEST_PATH_IMAGE023
相乘并求和,进而得到特征图像相应位置的输出,计算公式如下所示:
Figure DEST_PATH_IMAGE024
其中,
Figure DEST_PATH_IMAGE025
Figure DEST_PATH_IMAGE026
表示卷积核中第i行、第j列对应的核权重,
Figure DEST_PATH_IMAGE027
表示完成卷积操作后输出的数据。进一步,由量子旋转门
Figure DEST_PATH_IMAGE028
对各层卷积输出加上一个偏置项,得到表示层每层的输出为:
Figure DEST_PATH_IMAGE029
;r表示对卷积操作后输出的
Figure 750967DEST_PATH_IMAGE027
添加的偏置项参数;对于
Figure DEST_PATH_IMAGE030
大小的卷积核,
Figure DEST_PATH_IMAGE031
大小的特征图像,则
Figure DEST_PATH_IMAGE032
。其中,本实施例选取量子位处于
Figure DEST_PATH_IMAGE033
的状态为表示层每层的实际输出值。
S104:对特征图像进行卷积操作并通过
Figure DEST_PATH_IMAGE034
大小的池化窗口对卷积操作后的卷积输出进行乘积池化;
具体的,表示层的输出为隐藏层的输入,且隐藏层由卷积层与池化层的组合叠加构成,即一个卷积层伴随着后面的一个池化层,多个该结构的叠加构成隐藏层,隐藏层的层数由表示层输入的维度和最终输出的大小决定。本步骤即旨在在卷积层与池化层分别对特征图像进行卷积与池化操作。具体而言,在卷积层,采用
Figure DEST_PATH_IMAGE035
大小的卷积核进行卷积操作,实现跨通道的交互与信息整合。对于L层卷积层输入
Figure DEST_PATH_IMAGE036
来说,通道数为
Figure DEST_PATH_IMAGE037
,以及
Figure DEST_PATH_IMAGE038
层隐藏层的输出,且需要通过
Figure DEST_PATH_IMAGE039
大小的卷积核进行卷积操作。
其中,在一种具体的实施方式中,上述对所述特征图像进行卷积操作包括利用量子旋转门对所述特征图像进行卷积操作并对隐藏层各通道添加偏置项。具体而言,本实施例中卷积操作同样由量子旋转门
Figure DEST_PATH_IMAGE040
完成,可以得到
Figure DEST_PATH_IMAGE041
通道的
Figure DEST_PATH_IMAGE042
维度的卷积输出,
Figure DEST_PATH_IMAGE043
表示第L层隐藏层的通道数,计算公式如下所述:
Figure DEST_PATH_IMAGE044
;其中,
Figure DEST_PATH_IMAGE045
。进一步,由量子旋转门
Figure DEST_PATH_IMAGE046
对每一通道再加入偏置项,从而得到卷积层的输出:
Figure DEST_PATH_IMAGE047
。卷积层量子卷积电路图如图2所示。
在卷积层完成上述卷积操作后,进一步在池化层进行乘积池化操作。且具体的本申请通过
Figure DEST_PATH_IMAGE048
大小的池化窗口进行乘积池化,即通过
Figure 385692DEST_PATH_IMAGE048
大小的池化窗口以步长为2扫过输入值,从而达到保持池化后维度减半,并且两个维度上的大小仍然一致的目的,计算公式如下所示:
Figure DEST_PATH_IMAGE049
S105:乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数(归一化指数函数)基于各得分值计算目标图像属于各目标种类的概率值,以及确定概率值最大的目标种类为目标图像所属类别。
具体的,通过隐藏层中的多层池化的操作后,输出层的输入为
Figure DEST_PATH_IMAGE050
维度的值,故在图像分类模型的输出层首先将
Figure DEST_PATH_IMAGE051
维度的值转化为k个输出值,即根据乘积池化后的输出值得到目标图像对k个目标种类的得分值。
其中,在一种具体的实施方式中,上述乘积池化后在输出层得到目标图像对各目标种类的得分值包括在输出层利用量子旋转门根据乘积池化后的输出值得到目标图像对各目标种类的得分值。具体而言,本实施例同样利用量子旋转门
Figure DEST_PATH_IMAGE052
完成上述根据乘积池化后的输出值得到目标图像对各目标分类得分值的操作,计算公式如下所示:
Figure DEST_PATH_IMAGE053
。输出层的全连接量子电路图如图3所示。
进一步,区别于将各目标种类直接输出的传统方式,本申请在得到目标图像对各目标种类的得分值后,首先利用softmax函数基于各得分值计算目标图像属于各目标种类的概率值,以此作为输出层最终的输出,以后续基于各概率值确定目标图像所属类别,具体即确定概率值最大的目标种类为目标图像所属类别。
综上所述,在对目标图像进行量子化转换以及得到特征图像的基础上,本申请通过
Figure 3886DEST_PATH_IMAGE048
大小的池化窗口进行乘积池化操作,从而无需选择池化方向,有效简化了操作。并且通过
Figure 322872DEST_PATH_IMAGE048
大小的池化窗口遍历特征图像可使网络结构的两个维度在池化后共同缩小二分之一,维持相同的尺寸,有效保持了图层的对称性与稳定性,提高了图像分类的准确性。此外,相较于训练过程中使用平方损失函数的传统方式,本申请在模型训练过程中利用交叉熵函数计算输出层参数的梯度,从而可以更好的惩罚不好的预测,在误差较大时梯度下降更快,避免在梯度下降过程中出现梯度消散现象,提高图像分类模型的稳定性,保障图像分类的可靠性。
本申请还提供了一种图像分类装置,下文描述的该装置可以与上文描述的方法相互对应参照。请参考图4,图4为本申请实施例所提供的一种图像分类装置的示意图;参考图4所示,该图像分类装置包括:
训练模块10,用于训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;
转换模块20,用于接收目标图像,并对所述目标图像进行量子化转换;
提取模块30,用于通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;
卷积与池化模块40,用于对所述特征图像进行卷积操作,并通过
Figure 802133DEST_PATH_IMAGE048
大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;
确定模块50,用于乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别。
在上述实施例的基础上,作为一种具体的实施方式,转换模块20包括:
第一计算单元,用于将所述目标图像的像素点的实值的最大值与最小值做差得到基准值;
第二计算单元,用于分别计算各所述像素点的实值与所述最小值的差值并基于所述差值与所述基准值得到各所述像素点对应的概率角度;
转换单元,用于基于所述概率角度将所述像素点的实值转化为量子态。
在上述实施例的基础上,作为一种具体的实施方式,提取模块30包括:
第一旋转单元,用于利用Hadamard门将各所述像素点的量子态的概率角度旋转
Figure 813951DEST_PATH_IMAGE002
第二旋转单元,用于利用量子旋转门将概率角度旋转
Figure 371971DEST_PATH_IMAGE002
后的所述像素点的量子态的概率角度旋转预设角度;
提取单元,用于将所述预设通道个数的卷积核作用于像素点的量子态的概率角度旋转了所述目标角度后的所述目标图像,并对各层卷积输出添加偏置项后得到所述预设个数个特征图像。
在上述实施例的基础上,作为一种具体的实施方式,卷积与池化模块40具体用于利用量子旋转门对所述特征图像进行卷积操作并对隐藏层各通道添加偏置项。
在上述实施例的基础上,作为一种具体的实施方式,确定模块50具体用于在输出层利用量子旋转门根据乘积池化后的输出值得到所述目标图像对各目标种类的得分值。
本申请还提供了一种图像分类设备,该图像分类设备包括:存储器1与处理器2;其中,存储器1用于存储计算机程序;处理器2用于执行该计算机程序时实现如下的步骤:
训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;接收目标图像,并对所述目标图像进行量子化转换;通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;对所述特征图像进行卷积操作并通过
Figure 166752DEST_PATH_IMAGE048
大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;乘积池化后在输出层得到所述目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别。
对于本申请所提供的文件系统的介绍请参照上述方法的实施例,本申请在此不做赘述。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现如下的步骤:
训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;接收目标图像,并对所述目标图像进行量子化转换;通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;对所述特征图像进行卷积操作并通过
Figure 533142DEST_PATH_IMAGE048
大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;乘积池化后在输出层得到所述目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory ,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
对于本发明所提供的计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不做赘述。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备以及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦写可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的图像分类方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围。

Claims (6)

1.一种图像分类方法,其特征在于,包括:
训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;
利用训练完成的所述图像分类模型执行以下步骤:
接收目标图像,并对所述目标图像进行量子化转换;
通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;
对所述特征图像进行卷积操作,并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;
乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别;
所述对所述目标图像进行量子化转换,包括:
将所述目标图像的像素点的实值的最大值与最小值做差得到基准值;
分别计算各所述像素点的实值与所述最小值的差值并基于所述差值与所述基准值得到各所述像素点对应的概率角度;
基于所述概率角度将所述像素点的实值转化为量子态;
所述通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像,包括:
利用Hadamard门将各所述像素点的量子态的概率角度旋转π/4;
利用量子旋转门将概率角度旋转π/4后的所述像素点的量子态的概率角度旋转预设角度;
将所述预设通道个数的卷积核作用于像素点的量子态的概率角度旋转了所述目标角度后的所述目标图像;
对各层卷积输出添加偏置项后得到所述预设个数个特征图像;
所述通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像具体包括:利用量子门组对量子态进行偏移操作,利用Hadamard门对原始的量子态进行H操作,以将各像素点的量子态的概率角度旋转π/4;利用量子旋转门R(θ)将各像素点的量子态的概率角度旋转预设角度θ,公式为:R(θij)H|xij>=cos(φij)|0>+sin(φij)|1>=|φij>;其中,
Figure FDA0003549288070000021
θij表示对|xij>量子态进行初始化旋转操作的预设角度;xij表示原始数据中第i行、第j列对应的像素点;φij表示初始化完成后量子态|φij>的角度;
Figure FDA0003549288070000024
表示卷积层的输入量子态概率角度;
完成初始化准备后,将预设通道个数的卷积核作用于初始化后的输入值,将各卷积核扫过输入值,对应位置的初始化后的输入值与权重系数ω相乘并求和,进而得到特征图像相应位置的输出,公式为:
Figure FDA0003549288070000022
其中,
Figure FDA0003549288070000023
ωij表示卷积核中第i行、第j列对应的核权重,ψi′j′表示完成卷积操作后输出的数据;
由量子旋转门R(r)对各层卷积输出加上一个偏置项,得到表示层每层的输出为:|yi′j′>=sin(ψi′j′+r);r表示对卷积操作后输出的ψi′j′添加的偏置项参数;对于n×n大小的卷积核,n′×n′大小的特征图像,i,j∈n,i′,j′∈n′;其中,选取量子位处于|1>的状态为表示层每层的实际输出值。
2.根据权利要求1所述的图像分类方法,其特征在于,对所述特征图像进行卷积操作,包括:
利用量子旋转门对所述特征图像进行卷积操作并对隐藏层各通道添加偏置项。
3.根据权利要求2所述的图像分类方法,其特征在于,所述乘积池化后在输出层得到目标图像对各目标种类的得分值包括:
在输出层利用量子旋转门根据乘积池化后的输出值得到所述目标图像对各目标种类的得分值。
4.一种图像分类装置,其特征在于,包括:
训练模块,用于训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;
转换模块,用于接收目标图像,并对所述目标图像进行量子化转换;
提取模块,用于通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;
卷积与池化模块,用于对所述特征图像进行卷积操作,并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;
确定模块,用于乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别;
所述转换模块包括:
第一计算单元,用于将所述目标图像的像素点的实值的最大值与最小值做差得到基准值;
第二计算单元,用于分别计算各所述像素点的实值与所述最小值的差值并基于所述差值与所述基准值得到各所述像素点对应的概率角度;
转换单元,用于基于所述概率角度将所述像素点的实值转化为量子态;
所述提取模块包括:
第一旋转单元,用于利用Hadamard门将各所述像素点的量子态的概率角度旋转π/4;
第二旋转单元,用于利用量子旋转门将概率角度旋转π/4后的所述像素点的量子态的概率角度旋转预设角度;
提取单元,用于将所述预设通道个数的卷积核作用于像素点的量子态的概率角度旋转了所述目标角度后的所述目标图像,并对各层卷积输出添加偏置项后得到所述预设个数个特征图像;
所述通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像具体包括:利用量子门组对量子态进行偏移操作,利用Hadamard门对原始的量子态进行H操作,以将各像素点的量子态的概率角度旋转π/4;利用量子旋转门R(θ)将各像素点的量子态的概率角度旋转预设角度θ,公式为:R(θij)H|xij>=cos(φij)|0>+sin(φij)|1>=|φij>;其中,
Figure FDA0003549288070000041
θij表示对|xij>量子态进行初始化旋转操作的预设角度;xij表示原始数据中第i行、第j列对应的像素点;φij表示初始化完成后量子态|φij>的角度;
Figure FDA0003549288070000044
表示卷积层的输入量子态概率角度;
完成初始化准备后,将预设通道个数的卷积核作用于初始化后的输入值,将各卷积核扫过输入值,对应位置的初始化后的输入值与权重系数ω相乘并求和,进而得到特征图像相应位置的输出,公式为:
Figure FDA0003549288070000042
其中,
Figure FDA0003549288070000043
ωij表示卷积核中第i行、第j列对应的核权重,ψi′j′表示完成卷积操作后输出的数据;
由量子旋转门R(r)对各层卷积输出加上一个偏置项,得到表示层每层的输出为:|yi′j′>=sin(ψi′j′+r);r表示对卷积操作后输出的ψi′j′添加的偏置项参数;对于n×n大小的卷积核,n′×n′大小的特征图像,i,j∈n,i′,j′∈n′;其中,选取量子位处于|1>的状态为表示层每层的实际输出值。
5.一种图像分类设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至3任一项所述的图像分类方法的步骤。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述的图像分类方法的步骤。
CN201911159360.5A 2019-11-22 2019-11-22 一种图像分类方法及相关装置 Active CN110909796B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911159360.5A CN110909796B (zh) 2019-11-22 2019-11-22 一种图像分类方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911159360.5A CN110909796B (zh) 2019-11-22 2019-11-22 一种图像分类方法及相关装置

Publications (2)

Publication Number Publication Date
CN110909796A CN110909796A (zh) 2020-03-24
CN110909796B true CN110909796B (zh) 2022-05-17

Family

ID=69819187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911159360.5A Active CN110909796B (zh) 2019-11-22 2019-11-22 一种图像分类方法及相关装置

Country Status (1)

Country Link
CN (1) CN110909796B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112651418B (zh) * 2020-05-25 2022-03-08 腾讯科技(深圳)有限公司 数据分类方法、分类器训练方法及系统
CN112464003B (zh) * 2020-11-06 2023-04-28 苏州浪潮智能科技有限公司 一种图像分类方法及相关装置
CN114819171B (zh) * 2021-02-26 2023-08-08 本源量子计算科技(合肥)股份有限公司 一种量子卷积操作的实现方法及装置
CN113255747B (zh) * 2021-05-14 2023-07-28 山东英信计算机技术有限公司 量子多通道卷积神经分类方法、系统、终端及存储介质
CN113435581B (zh) * 2021-06-30 2023-11-07 北京量子信息科学研究院 数据处理方法、量子计算机、装置及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778682A (zh) * 2017-01-11 2017-05-31 厦门中控生物识别信息技术有限公司 一种卷积神经网络模型的训练方法及其设备
CN110288030A (zh) * 2019-06-27 2019-09-27 重庆大学 基于轻量化网络模型的图像识别方法、装置及设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10769491B2 (en) * 2017-09-01 2020-09-08 Sri International Machine learning system for generating classification data and part localization data for objects depicted in images

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778682A (zh) * 2017-01-11 2017-05-31 厦门中控生物识别信息技术有限公司 一种卷积神经网络模型的训练方法及其设备
CN110288030A (zh) * 2019-06-27 2019-09-27 重庆大学 基于轻量化网络模型的图像识别方法、装置及设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Model and algorithm of quantum-inspired neural network with sequence input based on controlled rotation gates;Panchi Li 等;《Springer》;20130530;第107-126页 *
基于受控Hadamard;李盼池 等;《计算机研究与发展》;20151231;第211-220页 *
基于量子门线路的量子神经网络模型及算法;李盼池 等;《控制与决策》;20120131;第143-146,151页 *

Also Published As

Publication number Publication date
CN110909796A (zh) 2020-03-24

Similar Documents

Publication Publication Date Title
CN110909796B (zh) 一种图像分类方法及相关装置
CN109949255B (zh) 图像重建方法及设备
CN108510532B (zh) 基于深度卷积gan的光学和sar图像配准方法
Zhou et al. Separability and compactness network for image recognition and superresolution
US11182644B2 (en) Method and apparatus for pose planar constraining on the basis of planar feature extraction
CN110059728B (zh) 基于注意力模型的rgb-d图像视觉显著性检测方法
CN109872305B (zh) 一种基于质量图生成网络的无参考立体图像质量评价方法
CN111127538A (zh) 一种基于卷积循环编码-解码结构的多视影像三维重建方法
TWI643137B (zh) 物件辨識方法及物件辨識系統
US11823432B2 (en) Saliency prediction method and system for 360-degree image
CN112818969A (zh) 一种基于知识蒸馏的人脸姿态估计方法及系统
Berg et al. Points to patches: Enabling the use of self-attention for 3d shape recognition
CN113240683B (zh) 基于注意力机制的轻量化语义分割模型构建方法
CN112464003A (zh) 一种图像分类方法及相关装置
CN113744136A (zh) 基于通道约束多特征融合的图像超分辨率重建方法和系统
CN112862871A (zh) 图像融合方法及装置
CN113313180B (zh) 一种基于深度对抗学习的遥感图像语义分割方法
WO2021037174A1 (zh) 一种神经网络模型训练方法及装置
Youn Dynamic graph neural network for super-pixel image classification
Xiong et al. An efficient multi-scale contextual feature fusion network for counting crowds with varying densities and scales
Ahmadian et al. Single image super-resolution with self-organization neural networks and image laplace gradient operator
CN116958324A (zh) 图像生成模型的训练方法、装置、设备及存储介质
CN111079930A (zh) 数据集质量参数的确定方法、装置及电子设备
CN116343052A (zh) 一种基于注意力和多尺度的双时相遥感图像变化检测网络
US20220164934A1 (en) Image processing method and apparatus, device, video processing method and storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant