CN111401452B - 一种基于偏微分算子的等变卷积网络模型的图像分类方法 - Google Patents

一种基于偏微分算子的等变卷积网络模型的图像分类方法 Download PDF

Info

Publication number
CN111401452B
CN111401452B CN202010189225.1A CN202010189225A CN111401452B CN 111401452 B CN111401452 B CN 111401452B CN 202010189225 A CN202010189225 A CN 202010189225A CN 111401452 B CN111401452 B CN 111401452B
Authority
CN
China
Prior art keywords
equal
convolution
variation
network model
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010189225.1A
Other languages
English (en)
Other versions
CN111401452A (zh
Inventor
林宙辰
沈铮阳
何翎申
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202010189225.1A priority Critical patent/CN111401452B/zh
Priority to PCT/CN2020/084650 priority patent/WO2021184466A1/zh
Publication of CN111401452A publication Critical patent/CN111401452A/zh
Application granted granted Critical
Publication of CN111401452B publication Critical patent/CN111401452B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing

Abstract

本发明公布了一种基于偏微分算子的等变卷积网络模型的图像分类方法,针对卷积网络模型的输入层和中间层,基于偏微分算子分别设计输入层的等变卷积和中间层的等变卷积,构建等变卷积网络模型PDO‑eConv,并进行模型训练;模型PDO‑eConv输入为图像数据,输出为图像的预测分类,从而实现高效地进行图像分类识别视觉分析。本发明能够提供更好的参数共享机制,达到更低的图像分类错误率。

Description

一种基于偏微分算子的等变卷积网络模型的图像分类方法
技术领域
本发明属于模式识别、机器学习、人工智能技术领域,涉及图像分类方法,具体涉及 一种基于偏微分算子的等变卷积网络模型的图像分类方法。
背景技术
在过去的几年中,卷积神经网络(CNN)模型已成为用于图像识别任务的主要机器学习 方法。与全连接网络相比,采用CNN处理图像的一个显着优势是它们是平移等变的:先将 图像平移然后通过若干个卷积层得到的特征图与先将原始图像通过卷积层然后再平移得到 的结果相同。换句话说,每一层都保持了平移对称性,即等变性。同样,等变性带来了权 重共享,通过它可以更有效地使用参数。
为了在用神经网络提取特征时,能够保持更多的对称性,已有工作包括Cohen和Welling(Group equivariant convolutional networks)提出的群等变卷积网络(G-CNN),该工作展示了如何推广卷积网络,以利用更多对称性,包括旋转和反射。G-CNN在群p4m 或p4上具有等变性。一般地,用pnm表示由平移,反射和旋转2π/n这些元素生成的群,其 中p代表旋转,n代表旋转变换的个数,m代表反射变换;用pn表示仅由平移和旋转2π/n 生成的群。当n给定时,即得到一个具体的群,如群p4m和群p4。进一步地,Hoogeboom 等人提出了HexaConv,并展示了如何在六角形格子,而不是正方形格子,上实现群等变卷积 操作。相应地,等变性扩展到群p6m(即旋转变换的个数为6的由平移、反射和旋转π/3生 成的群)上。但是,由于很难找到除了正方形和六边形网格的其他离散晶格形式,很难用 相似的方式设计出对除了π/4和π/3的更小旋转角度等变的CNN。
由于在2D平面上的晶格上似乎没有更多的旋转对称性,因此一些工作致力于设计对于 更大的群近似等变的网络结构。Zhou等人提出了定向响应网络0RN(0rientedresponse networks),它在卷积过程中旋转滤波器并生成具有位置和方向编码的特征图。然而,它 从本质上就是近似等变的网络。Weiler等人提出了基于可操纵滤波器(卷积)的SFCNN (Learning steerable filters for rotation equivariant CNNs)。如果将输入数据看作 是连续的,它达到的等变性是确切的。然而在实现中,SFCNN需要用很大的卷积核来逼近 可操纵滤波器,这会带来较大的计算负担,并且等变性也变为近似的。即使如此,一些边 缘信息也会被舍弃,使得等变性不够精确。
事实上,也有一些工作利用偏微分算子来设计等变的特征提取器,用在图像识别任务 上。Liu等人将一系列等变的偏微分算子线性加权,设计出了一种可学习的偏微分方程 (Toward designing intelligent PDEs for computer vision:An optimal controlapproach),它本身就是平移和旋转等变的。Fang等人将该技术应用到人脸识别任务上(Feature learning via partial differential equation with applications to facerecognition)。但是,总体说来,可学习偏微分方程的模型表达能力远远比不上CNN网络,因此,图像识别效果也不够理想。
发明内容
为了克服上述现有技术的不足,本发明提供一种基于偏微分算子的等变卷积网络模型 的图像分类方法,利用偏微分算子设计得到等变的卷积网络模型,取名为PD0-eConv(partial diffrential operator based equivariant convolution),用于高效的进行图像分类与识别等视觉分析。
本发明针对卷积网络模型的输入层和中间层,利用偏微分算子分别设计了两种等变卷 积层。将该两种等变卷积层分别作为任意一个已有的CNN模型中的输入层和中间层,即得 到一个等变的CNN模型,它的输入为图像数据,输出为图像的预测分类。
本发明提供的技术方案是:
一种基于偏微分算子的等变卷积网络模型PD0-eConv的图像分类方法,利用偏微分算 子设计出等变的CNN模型,用于高效的进行图像分类与识别等视觉分析,包括以下步骤:
1)将图像数据分为训练样本和测试样本;
2)对训练样本图像进行预处理,进行标准图像增强;
可采用标准图像增强技术,如在图像每边增加4个零值像素,再进行随机裁剪;对图 像进行随机水平旋转;对图像进行随机中心旋转;
3)构建基于偏微分算子的等变卷积网络模型并进行训练:
可以选用一个任意已有的卷积网络模型CNN架构,针对卷积网络模型的输入层和中间 层,利用偏微分算子分别设计两种等变卷积,即构建等变卷积的输入层和等变卷积的中间 层。构建等变卷积和对等变卷积参数初始化包括如下步骤:
31)确定等变卷积网络模型的等变群:
在构建等变算子前,需要先确定卷积网络模型在什么群上能保持等变性。在图像识别 任务中,通常要求图片对于旋转、反射、平移变换具有等变性。若考虑旋转、反射、平移变换,设等变群S为pnm;若仅考虑旋转和平移变换两种变换,设等变群S为pn(由平移 和旋转2π/n生成的群)。
32)构建输入层的等变卷积:
定义微分算子族Ψ(A)
Figure BDA0002414970670000031
为:
Figure BDA0002414970670000032
其中,H(×,×)是一个二元多项式,f/fx(A)和f/fy(A)表示两个依赖于A的微分算子, 它们的具体形式如下:
Figure BDA0002414970670000033
Figure BDA0002414970670000034
上式中,β={β1,β2,…,β9}是多项式中各项系数的集合,也是后续生成的等变卷积中的 参数。A是属于等变群S的正交矩阵,式2中的x和y分别对应式1中的f/fx(A)和 f/fy(A)。将式2和式3代入式1,可以得到微分算子Ψ(A)
Figure BDA0002414970670000035
实际上是关于f/fx和 f/fy的二元多项式。将该多项式中涉及到的所有微分算子离散化,得到
Figure BDA0002414970670000036
A∈S(具 体方式在实施例步骤3(2)中进一步详述),即得到用来处理输入数据的等变卷积。
33)构建中间层的等变卷积:
定义微分算子族
Figure BDA0002414970670000037
为:
Figure BDA0002414970670000041
其中多项式HB为:
Figure BDA0002414970670000042
这里的下标B用来区分不同的多项式,不同主要体现在每一项的系数上,系数为 β(B)={β1(B),β2(B),…,β9(B)},B∈S。将式(4)中的微分算子离散化,得到新的算子
Figure BDA0002414970670000043
A,B∈S,也就是用来处理中间层特征图的等变卷积。
34)等变卷积的初始化方式:
在32)和33)中,
Figure BDA0002414970670000044
A∈S和
Figure BDA0002414970670000045
A,B∈S均表示一组卷积,当A取值为I时,可 得到
Figure BDA0002414970670000046
Figure BDA0002414970670000047
B∈S。先用何凯明参数初始化方法He’sinitializer(Delving deep intorectifiers:surpassing human-level performance on ImageNet Classification)初始化上述构造的输入层等变卷积中的偏微分算子(卷积)
Figure BDA0002414970670000048
和中间层等变卷积中的偏微分算子(卷积)
Figure BDA0002414970670000049
B∈S,得到等变卷积的初始化值;然后用该初始化值反解出对应的等 变卷积参数β或β(B),并以反解得到的等变卷积参数β或β(B)的值作为对应的等变卷积真实 的初始化值。
本发明中,全连接层参数初始化方式为Xavier初始化方式。权重衰减因子为0.0005, 动量为0.9。该等变的CNN模型可以在深度学习框架Tensorflow下实现。
将上述构建并初始化的输入层的等变卷积和中间层的等变卷积作为CNN模型中的输入 卷积层和中间卷积层,即得到等变CNN模型。再利用训练样本图像对该等变CNN模型进行 训练。
本发明具体实施时,均采用反向传播算法,用带Nesterov动量的随机梯度下降算法进 行等变CNN模型训练。训练过程迭代300轮,批大小为128,即每128张图片为一个批次。学习速率初始值为0.1,在151至225轮学习速率为0.01,在226至300轮学习速率为0.001。
4)利用步骤3)构建并训练好的基于偏微分算子的等变CNN模型,对测试图像样本进 行识别,得到预测的图像分类标签,由此实现图片分类识别,其中测试样本无需经过图像 预处理。
本发明的有益效果是:
本发明提供了一种基于偏微分算子的等变CNN模型PDO-eConv的图像分类方法。我们 利用偏微分算子设计出分别用于输入层和中间层的等变卷积。在具体实施中,我们可以将 任意一个已有CNN模型中的卷积层采用本发明设计的等变卷积,得到一个等变的CNN模型, 最后用该模型进行图像识别。
本发明提出的网络结构不仅具有等变性,也带来了更好的参数共享机制,能够显著提 高参数利用率。在图像识别任务数据集旋转MNIST和CIFAR上,本发明与传统的卷积模型 以及一些现有的等变卷积如G-CNN、HexaConv相比,都取得了明显更好的效果,它能够有效处理具有方向特征的图片数据,并且往往可以用更少的参数,在数据集上达到更低的分类错误率。
附图说明
图1是卷积神经网络模型处理图像的等变性的示意图;
其中,将变换g作用在映射的输入上,即作用方式为πg,然后再通过映射Ψ得到的结 果,应该与通过映射Ψ再经过变换g(即作用方式为π′g)相同。
图2是本发明具体实施实现基于偏微分算子的等变卷积网络模型进行图像分类的流程 框图。
具体实施方式
下面结合附图,通过实施例进一步描述本发明,但不以任何方式限制本发明的范围。
本发明提供一种基于偏微分算子的等变卷积网络模型PDO-eConv的图像分类方法,利 用偏微分算子设计出等变的卷积网络模型,用于高效的进行图像分类与识别等视觉分析。
包括以下步骤:
步骤1:将图像数据分为训练样本和测试样本,本实施例所有数据集为CIFAR-10和CIFAR-100数据集,它们均由60,000张大小为32×32的RGB彩色图像组成,其中训练数 据50,000张,测试数据10,000张,类别分别为10类和100类。
步骤2:对训练样本图像进行标准图像增强。标准图像增强操作包括:在图片每边增 加4个零值像素,然后进行随机裁剪,即对原图平移若干个像素;对图片进行随机水平翻转。
步骤3:将数据增强过的训练样本通过本发明得到的等变CNN模型进行训练。本发明 所述的等变性可以这么理解:将变换g作用在映射的输入上(作用方式为πg)然后通过映射Ψ得到的结果,应该与通过映射Ψ再经过变换g(作用方式为πg)相同。等变性的示 意图为附图1。容易看出,如果神经网络的每一层都是等变的,那么这种等变性会在整个 网络中得到维护。事实上,我们可以选用任意一个已有的CNN架构,然后将其中的输入卷 积层和中间卷积层采用本发明构建的基于偏微分算子设计的等变卷积,得到一个等变的 CNN模型。在本实施例中,我们选用ResNet作为网络基本架构。其中,构建等变卷积和对 等变卷积参数初始化的步骤如下:
1)确定等变卷积网络模型的等变群:在构建等变算子前,需要先确定卷积网络模型在 什么群上能保持等变性。在图像识别任务中,我们通常要求图片对于旋转、反射、平移变 换具有等变性。如果考虑这三种变换,我们设等变群E为pnm;如果仅考虑旋转和平移变换 这两种变换,我们设等变群E为pn。这两种群在背景技术中已经介绍过。进一步地,我们记
Figure BDA0002414970670000063
其中
Figure BDA0002414970670000064
表示半直积,S是一个由正交变换组成的离散群。
2)构建输入层的等变卷积:
定义微分算子为:
Figure BDA0002414970670000061
其中
Figure BDA0002414970670000062
Figure BDA0002414970670000071
我们将式(1)中的微分算子离散化,得到新的算子
Figure BDA0002414970670000072
该算子实际上是一个卷积族, 它的形式为:
Figure BDA0002414970670000073
其中Γ是所有用到微分算子的索引,
Figure BDA0002414970670000074
通过将式(2)和(3)代入式(1)得到,
Figure BDA0002414970670000075
是和微 分算子fi相对应的卷积,它的形式列举在表1和表2中。
表1 3*3卷积的九种形式
Figure BDA0002414970670000076
表2 5*5卷积的六种形式
Figure BDA0002414970670000077
Figure BDA0002414970670000081
表1和表2中,具体来说,
Figure BDA0002414970670000082
为与1(f0)对应的卷积,
Figure BDA0002414970670000083
为与fx对应的卷积,
Figure BDA0002414970670000084
为与fy对应的卷积,……,
Figure BDA0002414970670000085
为与fxxyy对应的卷积。
最后,对于输入图像数据I,等变卷积层的实现方式为:
Figure BDA0002414970670000086
需要注意的是,上述等变卷积是针对输入数据仅有一个通道的情况描述的。事实上, 输入数据通常具有多个通道,如本实施例中的图像数据具有RGB三个通道。为了处理多通道数据,我们仅需要将式(1)中的多项式也相应的更改为多通道的多项式,自然地, 式(4)中的卷积核
Figure BDA0002414970670000087
可以处理多通道的输入图像数据I。
3)构建中间层的等变卷积:
由于输入层等等变卷积提取的特征图额外具有正交变换S这一维度,中间层的等变 卷积实施方式有所不同。具体地,我们定义微分算子
Figure BDA0002414970670000088
其中多项式HB表示为:
Figure BDA0002414970670000089
这里的下标B用来区分不同的多项式,这种差异主要体现在每一项的系数上,所有的系数为β(B)={β1(B),β2(B),…,β9(B)},B∈S。用和步骤2)中相同的方式将式(6)中 的微分算子离散化,得到用来处理中间层特征图的等变卷积核,卷积实现方式为:
Figure BDA0002414970670000091
其中F∈Rn×n×/S/是该中间层输入特征图,它是一个三维格点函数,其中|S|表示离散群S 中的元素个数,F的上标代表它的正交变换维度索引。特别需要注意的是,如果在输入层中,我们用多个等变卷积来提取特征,那么我们在中间层得到的特征图也应当是 多通道的(这种多通道区别于正交变换维度)。为了处理这一情况,我们同样地可以将 式(6)中的多项式更改为多通道的多项式即可。
4)等变卷积的参数初始化方式:
对于输入层的等变卷积,我们考虑卷积核
Figure BDA0002414970670000093
然后用MSAR何凯明参数初始化方法初始化
Figure BDA0002414970670000094
然后用这个初始化的值求解线 性方程(9)得到其中参数β的初始化。对于中间层的等变卷积,我们用同样的方式初始 化参数β(B)。
等变卷积层和全连接层是两种不相关的结构。本发明中,全连接层直接采用现有方 法Xavier进行初始化。对本发明提出的等变卷积层,则采用以上具体的初始化方法。 等变卷积的形式是卷积,本发明采用经典的MSAR初始化方法(也称作何凯明参数初始 化方法)初始化其中的
Figure BDA0002414970670000095
Figure BDA0002414970670000096
B∈S。另一方面,如式(9)所示,这两个卷积是 由β和β(B)参数化的,因此我们用初始化的结果来求解式(9)表示的线性方程,可得 到β和β(B)的初始化。也就是,等变卷积的参数就是β和β(B),用何凯明初始化两个卷 积只是一个中间步骤,最终目的是初始化β和β(B)。
步骤4:将测试样本(无需进行图像预处理)分别通过训练好的网络进行识别,得到预 测的分类标签。
本发明中的模型均使用反向传播算法,利用带Nesterov动量的随机梯度下降算法进行 训练,动量为0.9。每一个模型训练过程迭代300轮,批处理大小为128,即每128张图片为一个批次。学习速率初始值为0.1,在151至225轮学习速率为0.01,在226至300轮 学习速率为0.001。等变卷积参数初始化方式为本发明步骤3(3)中特别提出的一种初始 化方式,全连接层参数初始化方式为Xavier初始化方式。权重衰减因子为0.0005。
在实施例中,我们将ResNet中的卷积层相应替换成本发明中的等变卷积。具体来说, ResNet包括一个输入层,三大组卷积层,其中第i组卷积层包括2n个卷积层,每个卷积层使用ki个滤波器(或称等变卷积),最后接一个分类器,因此共有6n+2层。为了公平的 比较原始ResNet和改造后等变卷积模型的效果,我们需要相应的调整每层使用等变卷积的数量使得参数量大致相等。例如,对于ResNet-26,他的结构设置为n=4,ki=16,32,64。 如果我们要求本发明对于群p6(或p6m)是等变的,则需要将等变卷积滤波器数量相应的调 整为ki=6,13,26(ki=4,9,18)。
表1给出了本发明模型PD0-eConv和其他模型在CIFAR数据集上的图像分类错误率比 较:
表1
Figure BDA0002414970670000101
Figure BDA0002414970670000111
从表中可以看出,和HexaConv相似,我们分别用在群p6和群p6m上等变的PD0-eConv 作为原始网络模型中的卷积层,在相近参数量下,采用本发明方法的图像分类结果显著优 于HexaConv的分类结果(图像分类错误率6.33%vs.8.64%)。此外,HexaConv需要额外的 内存存储六边形网格图片,而本发明不需要。我们也将本发明与G-CNN对比,总的来说在 相似参数量下,本发明也能达到更好的结果。和很深的ResNet还有Wide ResNet相比,本 发明也在更少的参数量下达到了至少差不多的结果。特别地,和Wide ResNet相比,本发明仅用12.6%的参数就达到了相近的结果,这说明本发明能更有效的利用参数。
需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人 员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换和修改都是可能 的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书 界定的范围为准。

Claims (10)

1.一种基于偏微分算子的等变卷积网络模型的图像分类识别方法,其特征在于,针对卷积网络模型的输入层和中间层,基于偏微分算子分别设计输入层的等变卷积和中间层的等变卷积,构建等变卷积网络模型PDO-eConv,并进行模型训练;模型PDO-eConv输入为图像数据,输出为图像的预测分类,从而实现高效地进行图像分类识别视觉分析;包括以下步骤:
1)将图像数据分为训练样本和测试样本;
2)对训练样本进行预处理,进行标准图像增强处理;
3)构建基于偏微分算子的等变卷积网络模型并进行训练:
针对任一卷积网络模型的输入层和中间层,利用偏微分算子分别构建用于输入层和中间层的等变卷积;构建等变卷积和对等变卷积参数初始化包括如下操作:
31)确定等变卷积网络模型的等变群S;等变群包括由旋转、反射、平移三种变换生成的变换群pnm和由旋转、平移两种变换生成的变换群pn;n为旋转变换的个数;
32)构建输入层的等变卷积,用于处理输入图像数据:
定义微分算子族Ψ(A),A∈S,表示为式1:
Figure FDA0002414970660000011
其中,A是属于等变群S的正交矩阵;H(·,·)是二元多项式,该二元多项式中各项系数的集合为β,是后续生成的输入层等变卷积中的参数;
Figure FDA0002414970660000012
Figure FDA0002414970660000013
表示两个依赖于A的微分算子;
将式1的Ψ(A)多项式中的所有微分算子离散化,得到新的算子,即得到输入层的等变卷积;
33)构建中间层的等变卷积,用于处理中间层特征图:
定义微分算子族
Figure FDA0002414970660000014
表示为式4:
Figure FDA0002414970660000015
其中,HB为多项式;多项式HB的各项系数的集合为β(B),是后续生成的中间层等变卷积中的参数;
将式(4)中的微分算子离散化,得到新的算子,即得到中间层的等变卷积;
34)对等变卷积进行初始化:
先采用参数初始化方法初始化上述构建 的输入层等变卷积和中间层等变卷积,得到等变卷积的初始化值;
然后用该初始化值反解出对应的等变卷积参数β或β(B),作为对应的等变卷积真实的初始化值;
将上述构建并初始化的输入层的等变卷积和中间层的等变卷积作为卷积网络模型中的输入卷积层和中间卷积层,即得到等变卷积网络模型;
35)利用训练样本图像对该等变卷积网络模型进行训练,得到训练好的基于偏微分算子的等变卷积网络模型;
4)利用步骤3)构建并训练好的基于偏微分算子的等变卷积网络模型,对测试图像样本进行识别,得到预测的图像分类标签,由此实现图片分类识别,其中测试样本无需经过图像预处理。
2.如权利要求1所述基于偏微分算子的等变卷积网络模型的图像分类识别方法,其特征是,步骤2)对训练样本进行标准图像增强处理,具体采用标准图像增强技术,包括在图像的每边增加零值像素,再进行随机裁剪;对图像进行随机水平旋转;对图像进行随机中心旋转处理。
3.如权利要求1所述基于偏微分算子的等变卷积网络模型的图像分类识别方法,其特征是,步骤31)确定等变卷积网络模型的等变群:
当考虑旋转、反射、平移变换三种变换时,确定等变群S为pnm;
当仅考虑旋转和平移变换两种变换时,确定等变群S为pn。
4.如权利要求1所述基于偏微分算子的等变卷积网络模型的图像分类识别方法,其特征是,步骤32)中,二元多项式H(·,·)表示为式2:
H(x,y)=β12x+β3y+β4x25xy+β6y27x2y+β8xy29x2 式2
两个依赖于A的微分算子
Figure FDA0002414970660000021
Figure FDA0002414970660000022
表示为式3:
Figure FDA0002414970660000031
式2中,多项式中各项系数的集合β={β1,β2,…,β9};
步骤33)中,多项式HB表示为式5:
Figure FDA0002414970660000032
其中,多项式HB的各项系数的集合为p(B)={β1(B),β2(B),…,β9(B)},B∈S。
5.如权利要求4所述基于偏微分算子的等变卷积网络模型的图像分类识别方法,其特征是,步骤32)得到新的算子的形式表示为:
Figure FDA0002414970660000033
其中,Γ是所有用到微分算子的索引,
Figure FDA0002414970660000034
通过将式2和3代入式1得到;
Figure FDA0002414970660000035
是和微分算子
Figure FDA0002414970660000036
相对应的卷积;
对于输入图像数据I,等变卷积层的实现方式表示为式7:
Figure FDA0002414970660000037
步骤33)中间层等变卷积的实现方式表示为式8:
Figure DEST_PATH_BDA0002414970670000091
其中,F∈Rn×n×|S|是输入特征图,是一个三维格点函数,其中|S|表示离散群S中的元素个数,F的上标代表正交变换维度索引。
6.如权利要求1所述基于偏微分算子的等变卷积网络模型的图像分类识别方法,其特征是,步骤34)中,具体采用何凯明参数初始化方法初始化输入层等变卷积中的偏微分算子和中间层等变卷积中的偏微分算子,得到初始化值;然后用该初始化值反解出对应的参数,并以此作为对应的等变卷积真实的初始化值。
7.如权利要求6所述基于偏微分算子的等变卷积网络模型的图像分类识别方法,其特征是,全连接层参数初始化方式为Xavier初始化方式。
8.如权利要求7所述基于偏微分算子的等变卷积网络模型的图像分类识别方法,其特征是,权重衰减因子为0.0005,动量为0.9;具体采用深度学习框架Tensorflow实现。
9.如权利要求1所述基于偏微分算子的等变卷积网络模型的图像分类识别方法,其特征是,步骤35)具体采用反向传播算法,利用带Nesterov动量的随机梯度下降算法对该等变卷积网络模型进行训练。
10.如权利要求9所述基于偏微分算子的等变卷积网络模型的图像分类识别方法,其特征是,训练过程迭代300轮,批大小为128,即每128张图片为一个批次;学习速率初始值为0.1,在151至225轮学习速率为0.01,在226至300轮学习速率为0.001。
CN202010189225.1A 2020-03-17 2020-03-17 一种基于偏微分算子的等变卷积网络模型的图像分类方法 Active CN111401452B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010189225.1A CN111401452B (zh) 2020-03-17 2020-03-17 一种基于偏微分算子的等变卷积网络模型的图像分类方法
PCT/CN2020/084650 WO2021184466A1 (zh) 2020-03-17 2020-04-14 一种基于偏微分算子的等变卷积网络模型的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010189225.1A CN111401452B (zh) 2020-03-17 2020-03-17 一种基于偏微分算子的等变卷积网络模型的图像分类方法

Publications (2)

Publication Number Publication Date
CN111401452A CN111401452A (zh) 2020-07-10
CN111401452B true CN111401452B (zh) 2022-04-26

Family

ID=71430974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010189225.1A Active CN111401452B (zh) 2020-03-17 2020-03-17 一种基于偏微分算子的等变卷积网络模型的图像分类方法

Country Status (2)

Country Link
CN (1) CN111401452B (zh)
WO (1) WO2021184466A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257753B (zh) * 2020-09-23 2023-04-07 北京大学 基于偏微分算子的广义等变卷积网络模型的图像分类方法
CN112990315B (zh) * 2021-03-17 2023-10-20 北京大学 基于偏微分算子的等变3d卷积网络的3d形状图像分类方法
CN113033677A (zh) * 2021-03-30 2021-06-25 北京有竹居网络技术有限公司 视频分类方法、装置、电子设备和存储介质
CN113313161B (zh) * 2021-05-24 2023-09-26 北京大学 基于旋转不变的规范等变网络模型的物体形状分类方法
CN113723472B (zh) * 2021-08-09 2023-11-24 北京大学 一种基于动态滤波等变卷积网络模型的图像分类方法
CN113705386A (zh) * 2021-08-12 2021-11-26 北京有竹居网络技术有限公司 视频分类方法、装置、可读介质和电子设备
CN113723490B (zh) * 2021-08-24 2023-10-31 哈尔滨工业大学(深圳) 一种基于张量卷积网络的图像分类方法、系统及存储介质
CN113591804B (zh) * 2021-09-27 2022-02-22 阿里巴巴达摩院(杭州)科技有限公司 图像特征提取方法、计算机可读存储介质以及计算机终端
CN114037901B (zh) * 2021-10-25 2023-06-20 河海大学 光伏发电预测导向的实时卫星近红外图像推算方法
CN114463556B (zh) * 2022-01-24 2022-12-16 北京智源人工智能研究院 等变网络训练方法和装置、图像识别方法和装置
CN114528977B (zh) * 2022-01-24 2023-01-31 北京智源人工智能研究院 一种等变网络训练方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110717481A (zh) * 2019-12-12 2020-01-21 浙江鹏信信息科技股份有限公司 一种利用级联卷积神经网络实现人脸检测的方法
CN110827304A (zh) * 2018-08-10 2020-02-21 清华大学 一种基于深度卷积网络与水平集方法的中医舌像定位方法和系统
CN110852273A (zh) * 2019-11-12 2020-02-28 重庆大学 一种基于强化学习注意力机制的行为识别方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2869239A3 (en) * 2013-11-04 2015-08-19 Facebook, Inc. Systems and methods for facial representation
KR20150098119A (ko) * 2014-02-19 2015-08-27 삼성전자주식회사 의료 영상 내 거짓양성 병변후보 제거 시스템 및 방법
CN104517122A (zh) * 2014-12-12 2015-04-15 浙江大学 一种基于优化卷积架构的图像目标识别方法
NL2016285B1 (en) * 2016-02-19 2017-09-20 Scyfer B V Device and method for generating a group equivariant convolutional neural network.
CN108764289B (zh) * 2018-04-26 2021-04-30 福建天晴数码有限公司 一种基于卷积神经网络的ui异常图片分类方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827304A (zh) * 2018-08-10 2020-02-21 清华大学 一种基于深度卷积网络与水平集方法的中医舌像定位方法和系统
CN110852273A (zh) * 2019-11-12 2020-02-28 重庆大学 一种基于强化学习注意力机制的行为识别方法
CN110717481A (zh) * 2019-12-12 2020-01-21 浙江鹏信信息科技股份有限公司 一种利用级联卷积神经网络实现人脸检测的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Deep Neural Networks Motivated by Partial Differential Equations;Lars Ruthotto等;《arXiv》;20181210;第1-9页 *
PDE-based Group Equivariant Convolutional Neural Networks;Bart M.N. Smets等;《arXiv》;20200124;第1-28页 *
PDE-N ET 2.0: L EARNING PDE S FROM D ATA WITH A N UMERIC -S YMBOLIC H YBRID D EEP N ETWORK;Zichao Long等;《arXiv》;20190901;第1-18页 *
基于图像部分和神经网络的图像放大研究;高松鹤;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20200315;第4-5章 *

Also Published As

Publication number Publication date
WO2021184466A1 (zh) 2021-09-23
CN111401452A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN111401452B (zh) 一种基于偏微分算子的等变卷积网络模型的图像分类方法
CN109711426B (zh) 一种基于gan和迁移学习的病理图片分类装置及方法
Fowlkes et al. Spectral grouping using the nystrom method
CN110148104B (zh) 基于显著性分析与低秩表示的红外与可见光图像融合方法
CN104268593B (zh) 一种小样本情况下多稀疏表示的人脸识别方法
CN112862792B (zh) 一种用于小样本图像数据集的小麦白粉病孢子分割方法
CN108596138A (zh) 一种基于迁移层次网络的人脸识别方法
Cheng et al. Deep-learning-assisted volume visualization
CN110866896B (zh) 基于k-means与水平集超像素分割的图像显著性目标检测方法
CN112257753B (zh) 基于偏微分算子的广义等变卷积网络模型的图像分类方法
WO2020098257A1 (zh) 一种图像分类方法、装置及计算机可读存储介质
CN110990775B (zh) 基于多流形对偶图正则化非负矩阵分解的多视图聚类方法
CN112101364B (zh) 基于参数重要性增量学习的语义分割方法
Barron et al. Volumetric semantic segmentation using pyramid context features
CN112634149A (zh) 一种基于图卷积网络的点云去噪方法
CN109740539A (zh) 基于超限学习机和融合卷积网络的3d物体识别方法
Lefèvre et al. Hyperspectral image classification from multiscale description with constrained connectivity and metric learning
CN109726725A (zh) 一种基于大间隔类间互异性多核学习的油画作者识别方法
CN113723472A (zh) 一种基于动态滤波等变卷积网络模型的图像分类方法
CN112330639A (zh) 一种用于彩色-热红外图像的显著性检测方法
CN112416293A (zh) 一种神经网络增强方法、系统及其应用
CN116977694A (zh) 一种基于不变特征提取的高光谱对抗样本防御方法
CN114612450A (zh) 基于数据增广机器视觉的图像检测分割方法、系统、电子设备
Tasoulis et al. Unsupervised clustering using fractal dimension
CN114092494A (zh) 一种基于超像素和全卷积神经网络的脑部mr图像分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant