CN110909796A - 一种图像分类方法及相关装置 - Google Patents

一种图像分类方法及相关装置 Download PDF

Info

Publication number
CN110909796A
CN110909796A CN201911159360.5A CN201911159360A CN110909796A CN 110909796 A CN110909796 A CN 110909796A CN 201911159360 A CN201911159360 A CN 201911159360A CN 110909796 A CN110909796 A CN 110909796A
Authority
CN
China
Prior art keywords
image
target
target image
image classification
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911159360.5A
Other languages
English (en)
Other versions
CN110909796B (zh
Inventor
姜金哲
张新
朱效民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201911159360.5A priority Critical patent/CN110909796B/zh
Publication of CN110909796A publication Critical patent/CN110909796A/zh
Application granted granted Critical
Publication of CN110909796B publication Critical patent/CN110909796B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Abstract

本申请公开了一种图像分类方法,包括利用交叉熵函数进行模型训练得到的图像分类模型执行以下步骤:接收目标图像,并对目标图像进行量子化转换;通过预设通道个数的卷积核作用于量子化转换后的目标图像得到预设个数个特征图像;对特征图像进行卷积操作并通过2×2大小的池化窗口对卷积操作后的卷积输出进行乘积池化;乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数基于各所述得分值计算目标图像属于各目标种类的概率值,以及确定概率值最大的目标种类为目标图像所属类别。该方法可有效提高图像分类的准确性与可靠性。本申请还公开了一种图像分类装置、设备以及计算机可读存储介质,均具有上述技术效果。

Description

一种图像分类方法及相关装置
技术领域
本申请涉及人工智能技术领域,特别涉及一种图像分类方法;还涉及一种图像分类装置、设备以及计算机可读存储介质。
背景技术
卷积神经网络具有局部感知、参数共享及多核卷积等特性,在图像识别领域广泛使用,包括人脸识别、行人检测、语音识别、医学图像处理等,即使目标物体的方向、形状、光照条件等发生变化,仍拥有良好的分类精度。量子计算采用一种与传统的计算方式截然不同的新型计算方法,量子并行处理极大地提高了量子计算的效率,使其达到常规计算技术不能达到的解题速度,还可以解决常规计算不能解决的某些计算复杂度很高的问题。量子计算与神经网络融合进行图像分类正逐步成为一个崭新的研究方向。目前,现有的量子门线路神经网络是一种基于量子理论所设计的量子神经网络模型。利用该量子神经网络模型进行图像分类取得了良好的分类效果,在各方面性能上均优于普通BP神经网络。但在,目前的量子门线路神经网络存在如下不足之处:一是在池化过程中,采用的是相邻两个位置进行乘积达到池化目的,这种二维数据上不对称的采样使得量子门线路神经网络在运算过程中大部分处于不对称的状态,同时需面临采样方向的选择问题;二是输出层的损失函数选择,采用的是预测值与目标值的差的平方,导致收敛速度较慢;上述两点技术缺陷均回影响图像分类的准确度与可靠性。
因此,如何提供解决上述技术缺陷已成为本领域技术人员亟待解决的技术问题。
发明内容
本申请的目的是提供一种图像分类方法,能够有效保障图像分类的准确度与可靠性;本申请的另一目的是提供一种图像分类装置、设备以及计算机可读存储介质,均具有上述技术效果。
为解决上述技术问题,本申请提供了一种图像分类方法,包括:
训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;
利用训练完成的所述图像分类模型执行以下步骤:
接收目标图像,并对所述目标图像进行量子化转换;
通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;
对所述特征图像进行卷积操作并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;
乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别。
可选的,所述对所述目标图像进行量子化转换,包括:
将所述目标图像的像素点的实值的最大值与最小值做差得到基准值;
分别计算各所述像素点的实值与所述最小值的差值并基于所述差值与所述基准值得到各所述像素点对应的概率角度;
基于所述概率角度将所述像素点的实值转化为量子态。
可选的,所述通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像,包括:
利用Hadamard门将各所述像素点的量子态的概率角度旋转π/4;
利用量子旋转门将概率角度旋转π/4后的所述像素点的量子态的概率角度旋转预设角度;
将所述预设通道个数的卷积核作用于像素点的量子态的概率角度旋转了所述目标角度后的所述目标图像;
对各层卷积输出添加偏置项后得到所述预设个数个特征图像。
可选的,所述对所述特征图像进行卷积操作,包括:
利用量子旋转门对所述特征图像进行卷积操作并对隐藏层各通道添加偏置项。
可选的,所述乘积池化后在输出层得到目标图像对各目标种类的得分值包括:
在输出层利用量子旋转门根据乘积池化后的输出值得到所述目标图像对各目标种类的得分值。
为解决上述技术问题,本申请还提供了一种图像分类装置,包括:
训练模块,用于训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;
转换模块,用于接收目标图像,并对所述目标图像进行量子化转换;
提取模块,用于通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;
卷积与池化模块,用于对所述特征图像进行卷积操作,并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;
确定模块,用于乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别。
可选的,所述转换模块包括:
第一计算单元,用于将所述目标图像的像素点的实值的最大值与最小值做差得到基准值;
第二计算单元,用于分别计算各所述像素点的实值与所述最小值的差值并基于所述差值与所述基准值得到各所述像素点对应的概率角度;
转换单元,用于基于所述概率角度将所述像素点的实值转化为量子态。
可选的,所述提取模块包括:
第一旋转单元,用于利用Hadamard门将各所述像素点的量子态的概率角度旋转π/4;
第二旋转单元,用于利用量子旋转门将概率角度旋转π/4后的所述像素点的量子态的概率角度旋转预设角度;
提取单元,用于将所述预设通道个数的卷积核作用于像素点的量子态的概率角度旋转了所述目标角度后的所述目标图像,并对各层卷积输出添加偏置项后得到所述预设个数个特征图像。
为解决上述技术问题,本申请还提供了一种图像分类设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上所述的图像分类方法的步骤。
为解决上述技术问题,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的图像分类方法的步骤。
本申请所提供的图像分类方法,包括训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;利用训练完成的所述图像分类模型执行以下步骤:接收目标图像,并对所述目标图像进行量子化转换;通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;对所述特征图像进行卷积操作并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别。
可见,在对目标图像进行量子化转换以及得到特征图像的基础上,本申请通过2×2大小的池化窗口进行乘积池化操作,从而无需选择池化方向,有效简化了操作。并且通过2×2大小的池化窗口遍历特征图像可使网络结构的两个维度在池化后共同缩小二分之一,维持相同的尺寸,有效保持了图层的对称性与稳定性,提高了图像分类的准确性。此外,相较于训练过程中使用平方损失函数的传统方式,本申请在模型训练过程中利用交叉熵函数计算输出层参数的梯度,从而可以更好的惩罚不好的预测,在误差较大时梯度下降更快,避免在梯度下降过程中出现梯度消散现象,提高图像分类模型的稳定性,保障图像分类的可靠性。
本申请所提供的图像分类装置、设备以及计算机可读存储介质,均具有上述技术效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例所提供的一种图像分类方法的流程示意图;
图2为本申请实施例所提供的一种卷积层量子卷积电路图;
图3为本申请实施例所提供的一种输出层全连接量子电路图;
图4为本申请实施例所提供的一种图像分类装置的示意图;
图5为本申请实施例所提供的一种图像分类设备的示意图。
具体实施方式
本申请的核心是提供一种图像分类方法,能够有效保障图像分类的准确度与可靠性;本申请的另一核心是提供一种图像分类装置、设备以及计算机可读存储介质,均具有上述技术效果。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参考图1,图1为本申请实施例所提供的一种图像分类方法的流程示意图;参考图1所示,该图像分类方法包括:
S101:训练图像分类模型;其中,在训练图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据梯度调整参数得到符合要求的图像分类模型;
具体的,本步骤旨在进行图像分类模型的训练,以后续利用训练完成的图像分类模型进行图像分类。具体而言,本申请采用梯度下降的方法训练图像分类模型,从图像分类模型的最后一层向第一层逐层反向传播需要训练的参数的梯度,并在梯度方向上调整参数的值,以得到复合要求的图像分类模型。其中,本申请利用交叉熵函数计算输出层的各个参数的梯度,从而较之使用平方损失函数的传统方式,本申请可以更好的惩罚不好的预测,在误差较大时梯度下降更快,避免在梯度下降过程中出现梯度消散现象,提高图像分类模型的稳定性,保障图像分类的可靠性。
可以明白的是,上述训练图像分类模型的步骤可以只执行一次,即图像分类模型训练完成后,后续利用此图像分类模型进行图像分类即可,而无需重复进行图像分类模型的训练。
S102:接收目标图像,并对所述目标图像进行量子化转换;
具体的,本申请所提供的图像分类方法利用量子计算与卷积神经网络相融合的图像分类模型进行图像分类,该图像分类模型训练完成后,便可利用此图像分类模型进行图像分类。其中,本步骤旨在在图像分类模型的表示层对接收到的目标图像进行量子化转换,即将目标图像的各像素点的实值转换为概率分布的量子态,从而利用量子计算的特性,提高运算效率。
在一种具体的实施方式中,上述对目标图像进行量子化转换包括将目标图像的像素点的实值的最大值与最小值做差得到基准值;分别计算各像素点的实值与最小值的差值并基于差值与基准值得到各像素点对应的概率角度;基于概率角度将像素点的实值转化为量子态。
具体的,本实施例采取全局量化的方式对目标图像进行量子化转换,以更好的表征目标图像的整体特性,利于后续准确的进行图像分类。具体而言,首先计算目标图像的各像素点的实值的最大值与最小值的差值,并将此最大值与最小值的差值作为基准值。进一步,分别计算各像素点的实值与该最小值的差值,并基于基准值以及各像素点的实值与该最小值的差值分别得到各像素点对应的概率角度,进而基于概率角度将对应像素点的实值转化为量子态,如如下公式所示:
Figure BDA0002285646470000061
其中,
Figure BDA0002285646470000062
Figure BDA0002285646470000063
表示概率角度,x表示像素点的实值,b=max(x),即b表示像素点的实值的最大值,a=min(x),即a表示像素点的实值的最小值。
S103:通过预设通道个数的卷积核作用于量子化转换后的目标图像得到预设个数个特征图像;
具体的,将目标图像的各像素点的实值转换为量子态后,本步骤旨在在图像分类模型的表示层进一步将单通道或少数通道的输入值转换为多通道的特征,具体即通过预设通道个数的卷积核作用于量子化转换后的目标图像,从而得到预设个数个特征图像,以为后续进行卷积操作做准备,提升图像分类的准确性。其中,特征图像的个数等于卷积核的通道个数,而对于卷积核的通道个数本申请不做具体限定,可以根据实际需要进行差异性设置。例如,通过m通道的n×n大小的卷积核作用于量子化转换后的目标图像,从而得到m个的n'×n'大小的特征图像。
另外,在一种具体的实施方式中,上述通过预设通道个数的卷积核作用于量子化转换后的目标图像得到预设个数个特征图像包括:利用Hadamard门(哈达玛门)将各像素点的量子态的概率角度旋转π/4;利用量子旋转门将概率角度旋转π/4后的像素点的量子态的概率角度旋转预设角度;将预设通道个数的卷积核作用于像素点的量子态的概率角度旋转了目标角度后的目标图像;对各层卷积输出添加偏置项后得到预设个数个特征图像。
具体的,较之传统的卷积操作,本实施例利用量子门组对量子态进行偏移操作,首先利用Hadamard门对原始的量子态进行H操作,以将各像素点的量子态的概率角度旋转π/4。然后,在此基础上进一步利用量子旋转门R(θ)再将各像素点的量子态的概率角度旋转预设角度θ,如如下公式所示:
R(θij)H|xij>=cos(φij)|0>+sin(φij)|1>=|φij>;其中,
Figure BDA0002285646470000071
完成上述初始化准备后,进一步将预设通道个数的卷积核作用于初始化后的输入值,将各卷积核扫过输入值,对应位置的初始化后的输入值与权重系数ω相乘并求和,进而得到特征图像相应位置的输出,计算公式如下所示:
Figure BDA0002285646470000072
其中,
Figure BDA0002285646470000073
进一步,由量子旋转门R(r)对各层卷积输出加上一个偏置项,得到表示层每层的输出为:|yi'j'>=sin(ψi'j'+r);对于n×n大小的卷积核,n'×n'大小的特征图像,则i,j∈n,i',j'∈n'。其中,本实施例选取量子位处于|1>的状态为表示层每层的实际输出值。
S104:对特征图像进行卷积操作并通过2×2大小的池化窗口对卷积操作后的卷积输出进行乘积池化;
具体的,表示层的输出为隐藏层的输入,且隐藏层由卷积层与池化层的组合叠加构成,即一个卷积层伴随着后面的一个池化层,多个该结构的叠加构成隐藏层,隐藏层的层数由表示层输入的维度和最终输出的大小决定。本步骤即旨在在卷积层与池化层分别对特征图像进行卷积与池化操作。具体而言,在卷积层,采用1×1大小的卷积核进行卷积操作,实现跨通道的交互与信息整合。对于L层卷积层输入|x>来说,通道数为kL-1,以及L-1层隐藏层的输出,且需要通过1×1×kL-1×kL大小的卷积核进行卷积操作。
其中,在一种具体的实施方式中,上述对所述特征图像进行卷积操作包括利用量子旋转门对所述特征图像进行卷积操作并对隐藏层各通道添加偏置项。具体而言,本实施例中卷积操作同样由量子旋转门R(θ)完成,可以得到kL通道的nL维度的卷积输出,kL表示第L层隐藏层的通道数,计算公式如下所述:
Figure BDA0002285646470000081
其中,i,j∈nL。进一步,由量子旋转门R(r)对每一通道再加入偏置项,从而得到卷积层的输出:
Figure BDA0002285646470000082
卷积层量子卷积电路图如图2所示。
在卷积层完成上述卷积操作后,进一步在池化层进行乘积池化操作。且具体的本申请通过2×2大小的池化窗口进行乘积池化,即通过2×2大小的池化窗口以步长为2扫过输入值,从而达到保持池化后维度减半,并且两个维度上的大小仍然一致的目的,计算公式如下所示:
Figure BDA0002285646470000083
S105:乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数(归一化指数函数)基于各得分值计算目标图像属于各目标种类的概率值,以及确定概率值最大的目标种类为目标图像所属类别。
具体的,通过隐藏层中的多层池化的操作后,输出层的输入为1×1×kL维度的值,故在图像分类模型的输出层首先将1×1×kL维度的值转化为k个输出值,即根据乘积池化后的输出值得到目标图像对k个目标种类的得分值。
其中,在一种具体的实施方式中,上述乘积池化后在输出层得到目标图像对各目标种类的得分值包括在输出层利用量子旋转门根据乘积池化后的输出值得到目标图像对各目标种类的得分值。具体而言,本实施例同样利用量子旋转门R(r)完成上述根据乘积池化后的输出值得到目标图像对各目标分类得分值的操作,计算公式如下所示:
Figure BDA0002285646470000091
输出层的全连接量子电路图如图3所示。
进一步,区别于将各目标种类直接输出的传统方式,本申请在得到目标图像对各目标种类的得分值后,首先利用softmax函数基于各得分值计算目标图像属于各目标种类的概率值,以此作为输出层最终的输出,以后续基于各概率值确定目标图像所属类别,具体即确定概率值最大的目标种类为目标图像所属类别。
综上所述,在对目标图像进行量子化转换以及得到特征图像的基础上,本申请通过2×2大小的池化窗口进行乘积池化操作,从而无需选择池化方向,有效简化了操作。并且通过2×2大小的池化窗口遍历特征图像可使网络结构的两个维度在池化后共同缩小二分之一,维持相同的尺寸,有效保持了图层的对称性与稳定性,提高了图像分类的准确性。此外,相较于训练过程中使用平方损失函数的传统方式,本申请在模型训练过程中利用交叉熵函数计算输出层参数的梯度,从而可以更好的惩罚不好的预测,在误差较大时梯度下降更快,避免在梯度下降过程中出现梯度消散现象,提高图像分类模型的稳定性,保障图像分类的可靠性。
本申请还提供了一种图像分类装置,下文描述的该装置可以与上文描述的方法相互对应参照。请参考图4,图4为本申请实施例所提供的一种图像分类装置的示意图;参考图4所示,该图像分类装置包括:
训练模块10,用于训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;
转换模块20,用于接收目标图像,并对所述目标图像进行量子化转换;
提取模块30,用于通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;
卷积与池化模块40,用于对所述特征图像进行卷积操作,并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;
确定模块50,用于乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别。
在上述实施例的基础上,作为一种具体的实施方式,转换模块20包括:
第一计算单元,用于将所述目标图像的像素点的实值的最大值与最小值做差得到基准值;
第二计算单元,用于分别计算各所述像素点的实值与所述最小值的差值并基于所述差值与所述基准值得到各所述像素点对应的概率角度;
转换单元,用于基于所述概率角度将所述像素点的实值转化为量子态。
在上述实施例的基础上,作为一种具体的实施方式,提取模块30包括:
第一旋转单元,用于利用Hadamard门将各所述像素点的量子态的概率角度旋转π/4;
第二旋转单元,用于利用量子旋转门将概率角度旋转π/4后的所述像素点的量子态的概率角度旋转预设角度;
提取单元,用于将所述预设通道个数的卷积核作用于像素点的量子态的概率角度旋转了所述目标角度后的所述目标图像,并对各层卷积输出添加偏置项后得到所述预设个数个特征图像。
在上述实施例的基础上,作为一种具体的实施方式,卷积与池化模块40具体用于利用量子旋转门对所述特征图像进行卷积操作并对隐藏层各通道添加偏置项。
在上述实施例的基础上,作为一种具体的实施方式,确定模块50具体用于在输出层利用量子旋转门根据乘积池化后的输出值得到所述目标图像对各目标种类的得分值。
本申请还提供了一种图像分类设备,该图像分类设备包括:存储器1与处理器2;其中,存储器1用于存储计算机程序;处理器2用于执行该计算机程序时实现如下的步骤:
训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;接收目标图像,并对所述目标图像进行量子化转换;通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;对所述特征图像进行卷积操作并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;乘积池化后在输出层得到所述目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别。
对于本申请所提供的文件系统的介绍请参照上述方法的实施例,本申请在此不做赘述。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现如下的步骤:
训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;接收目标图像,并对所述目标图像进行量子化转换;通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;对所述特征图像进行卷积操作并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;乘积池化后在输出层得到所述目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
对于本发明所提供的计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不做赘述。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备以及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦写可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的图像分类方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围。

Claims (10)

1.一种图像分类方法,其特征在于,包括:
训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;
利用训练完成的所述图像分类模型执行以下步骤:
接收目标图像,并对所述目标图像进行量子化转换;
通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;
对所述特征图像进行卷积操作,并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;
乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别。
2.根据权利要求1所述的图像分类方法,其特征在于,所述对所述目标图像进行量子化转换,包括:
将所述目标图像的像素点的实值的最大值与最小值做差得到基准值;
分别计算各所述像素点的实值与所述最小值的差值并基于所述差值与所述基准值得到各所述像素点对应的概率角度;
基于所述概率角度将所述像素点的实值转化为量子态。
3.根据权利要求2所述的图像分类方法,其特征在于,所述通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像,包括:
利用Hadamard门将各所述像素点的量子态的概率角度旋转π/4;
利用量子旋转门将概率角度旋转π/4后的所述像素点的量子态的概率角度旋转预设角度;
将所述预设通道个数的卷积核作用于像素点的量子态的概率角度旋转了所述目标角度后的所述目标图像;
对各层卷积输出添加偏置项后得到所述预设个数个特征图像。
4.根据权利要求3所述的图像分类方法,其特征在于,对所述特征图像进行卷积操作,包括:
利用量子旋转门对所述特征图像进行卷积操作并对隐藏层各通道添加偏置项。
5.根据权利要求4所述的图像分类方法,其特征在于,所述乘积池化后在输出层得到目标图像对各目标种类的得分值包括:
在输出层利用量子旋转门根据乘积池化后的输出值得到所述目标图像对各目标种类的得分值。
6.一种图像分类装置,其特征在于,包括:
训练模块,用于训练图像分类模型;其中,在训练所述图像分类模型的过程中,利用交叉熵函数计算输出层参数的梯度,并根据所述梯度调整所述参数得到符合要求的所述图像分类模型;
转换模块,用于接收目标图像,并对所述目标图像进行量子化转换;
提取模块,用于通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像;
卷积与池化模块,用于对所述特征图像进行卷积操作,并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化;
确定模块,用于乘积池化后在输出层得到目标图像对各目标种类的得分值,并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值,以及确定概率值最大的所述目标种类为所述目标图像所属类别。
7.根据权利要求1所述的图像分类装置,其特征在于,所述转换模块包括:
第一计算单元,用于将所述目标图像的像素点的实值的最大值与最小值做差得到基准值;
第二计算单元,用于分别计算各所述像素点的实值与所述最小值的差值并基于所述差值与所述基准值得到各所述像素点对应的概率角度;
转换单元,用于基于所述概率角度将所述像素点的实值转化为量子态。
8.根据权利要求7所述的图像分类装置,其特征在于,所述提取模块包括:
第一旋转单元,用于利用Hadamard门将各所述像素点的量子态的概率角度旋转π/4;
第二旋转单元,用于利用量子旋转门将概率角度旋转π/4后的所述像素点的量子态的概率角度旋转预设角度;
提取单元,用于将所述预设通道个数的卷积核作用于像素点的量子态的概率角度旋转了所述目标角度后的所述目标图像,并对各层卷积输出添加偏置项后得到所述预设个数个特征图像。
9.一种图像分类设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述的图像分类方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的图像分类方法的步骤。
CN201911159360.5A 2019-11-22 2019-11-22 一种图像分类方法及相关装置 Active CN110909796B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911159360.5A CN110909796B (zh) 2019-11-22 2019-11-22 一种图像分类方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911159360.5A CN110909796B (zh) 2019-11-22 2019-11-22 一种图像分类方法及相关装置

Publications (2)

Publication Number Publication Date
CN110909796A true CN110909796A (zh) 2020-03-24
CN110909796B CN110909796B (zh) 2022-05-17

Family

ID=69819187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911159360.5A Active CN110909796B (zh) 2019-11-22 2019-11-22 一种图像分类方法及相关装置

Country Status (1)

Country Link
CN (1) CN110909796B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112464003A (zh) * 2020-11-06 2021-03-09 苏州浪潮智能科技有限公司 一种图像分类方法及相关装置
CN112651418A (zh) * 2020-05-25 2021-04-13 腾讯科技(深圳)有限公司 数据分类方法、分类器训练方法及系统
CN113255747A (zh) * 2021-05-14 2021-08-13 山东英信计算机技术有限公司 量子多通道卷积神经分类方法、系统、终端及存储介质
CN113435581A (zh) * 2021-06-30 2021-09-24 北京量子信息科学研究院 数据处理方法、量子计算机、装置及存储介质
CN114819171A (zh) * 2021-02-26 2022-07-29 合肥本源量子计算科技有限责任公司 一种量子卷积操作的实现方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778682A (zh) * 2017-01-11 2017-05-31 厦门中控生物识别信息技术有限公司 一种卷积神经网络模型的训练方法及其设备
US20190073560A1 (en) * 2017-09-01 2019-03-07 Sri International Machine learning system for generating classification data and part localization data for objects depicted in images
CN110288030A (zh) * 2019-06-27 2019-09-27 重庆大学 基于轻量化网络模型的图像识别方法、装置及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778682A (zh) * 2017-01-11 2017-05-31 厦门中控生物识别信息技术有限公司 一种卷积神经网络模型的训练方法及其设备
US20190073560A1 (en) * 2017-09-01 2019-03-07 Sri International Machine learning system for generating classification data and part localization data for objects depicted in images
CN110288030A (zh) * 2019-06-27 2019-09-27 重庆大学 基于轻量化网络模型的图像识别方法、装置及设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PANCHI LI 等: "Model and algorithm of quantum-inspired neural network with sequence input based on controlled rotation gates", 《SPRINGER》 *
李盼池 等: "基于受控Hadamard", 《计算机研究与发展》 *
李盼池 等: "基于量子门线路的量子神经网络模型及算法", 《控制与决策》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112651418A (zh) * 2020-05-25 2021-04-13 腾讯科技(深圳)有限公司 数据分类方法、分类器训练方法及系统
CN112464003A (zh) * 2020-11-06 2021-03-09 苏州浪潮智能科技有限公司 一种图像分类方法及相关装置
CN112464003B (zh) * 2020-11-06 2023-04-28 苏州浪潮智能科技有限公司 一种图像分类方法及相关装置
CN114819171A (zh) * 2021-02-26 2022-07-29 合肥本源量子计算科技有限责任公司 一种量子卷积操作的实现方法及装置
CN114819171B (zh) * 2021-02-26 2023-08-08 本源量子计算科技(合肥)股份有限公司 一种量子卷积操作的实现方法及装置
CN113255747A (zh) * 2021-05-14 2021-08-13 山东英信计算机技术有限公司 量子多通道卷积神经分类方法、系统、终端及存储介质
CN113435581A (zh) * 2021-06-30 2021-09-24 北京量子信息科学研究院 数据处理方法、量子计算机、装置及存储介质
CN113435581B (zh) * 2021-06-30 2023-11-07 北京量子信息科学研究院 数据处理方法、量子计算机、装置及存储介质

Also Published As

Publication number Publication date
CN110909796B (zh) 2022-05-17

Similar Documents

Publication Publication Date Title
CN110909796B (zh) 一种图像分类方法及相关装置
CN109949255B (zh) 图像重建方法及设备
Liu et al. A spectral grouping and attention-driven residual dense network for hyperspectral image super-resolution
CN108510532B (zh) 基于深度卷积gan的光学和sar图像配准方法
WO2021073493A1 (zh) 图像处理方法及装置、神经网络的训练方法、合并神经网络模型的图像处理方法、合并神经网络模型的构建方法、神经网络处理器及存储介质
CN111767979A (zh) 神经网络的训练方法、图像处理方法、图像处理装置
US11182644B2 (en) Method and apparatus for pose planar constraining on the basis of planar feature extraction
CN110059728B (zh) 基于注意力模型的rgb-d图像视觉显著性检测方法
CN111144329A (zh) 一种基于多标签的轻量快速人群计数方法
CN111738268A (zh) 一种基于随机块的高分遥感图像的语义分割方法及系统
US20230245419A1 (en) Saliency prediction method and system for 360-degree image
CN111127538A (zh) 一种基于卷积循环编码-解码结构的多视影像三维重建方法
CN114821342B (zh) 一种遥感影像道路提取方法及系统
CN113744136A (zh) 基于通道约束多特征融合的图像超分辨率重建方法和系统
CN112862871A (zh) 图像融合方法及装置
CN113313180B (zh) 一种基于深度对抗学习的遥感图像语义分割方法
CN112418256A (zh) 分类、模型训练、信息搜索方法、系统及设备
Ahmadian et al. Single image super-resolution with self-organization neural networks and image laplace gradient operator
CN110414593B (zh) 图像处理方法及装置、处理器、电子设备及存储介质
CN111062275A (zh) 一种多层次监督的人群计数方法、装置、介质及电子设备
CN111079930A (zh) 数据集质量参数的确定方法、装置及电子设备
Chen et al. Hyperspectral remote sensing IQA via learning multiple kernels from mid-level features
US20220164934A1 (en) Image processing method and apparatus, device, video processing method and storage medium
Liu et al. Dsma: Reference-based image super-resolution method based on dual-view supervised learning and multi-attention mechanism
Vasilyev et al. Classification via compressed latent space

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant