图像特征的处理方法、装置、电子设备及存储介质
技术领域
本公开涉及图像处理技术领域,具体而言,本发明涉及一种图像特征的处理方法、装置、电子设备及存储介质。
背景技术
注意力机制源于对人类视觉的研究,在认知科学中,由于信息处理的瓶颈,人类会选择性地关注所有信息的一部分,同时忽略其他可见的信息。神经注意力机制可以使得神经网络具备专注于其输入子集的能力,即选择特定的输入。在计算能力有限的情况下,注意力机制是解决信息超载问题的主要手段的一种资源分配方案。
通常情况下,注意力网络得到的结果可以表示为两部分之和,默认情况下,两部分各自的比例系数均取固定值,如第一部分的比例系数取值为1,第二部分的比例系数取值也为1等。这种两部分各自的比例系数取固定值的方式在很大程度上带有不准确性,从而导致得到的结果精确度降低。
发明内容
本公开的目的旨在至少能解决上述的技术缺陷之一,特别是由于注意力网络输出结果中各部分的比例系数是固定取值,导致结果精确度降低的技术缺陷。
第一方面,提供了一种图像特征的处理方法,该方法包括:
将从图像中提取到的待处理特征输入至预设卷积神经网络,基于预设卷积神经网络进行卷积处理得到卷积处理结果;
利用预设阈值函数对卷积处理结果进行阈值处理操作,得到通道阈值系数;
基于通道阈值系数计算空间阈值系数;
依据通道阈值系数以及空间阈值系数,对待处理特征进行处理,得到处理后的图像特征。
在一个可能的实现方式中,该方法还包括:
将待处理特征输入至预设通道注意力网络,得到通道注意力特征;
将待处理特征输入至预设空间注意力网络,得到空间注意力特征;
依据通道阈值系数以及空间阈值系数,对待处理特征进行处理,得到处理后的图像特征,包括:
基于通道阈值系数、通道注意力特征、空间阈值系数和空间注意力特征,得到处理后的图像特征。
在一个可能的实现方式中,基于通道阈值系数、通道注意力特征、空间阈值系数和空间注意力特征,得到处理后的图像特征,包括:
利用通道阈值系数和通道注意力特征进行乘法运算,得到通道输出部分;
利用空间阈值系数和空间注意力特征进行乘法运算,得到空间输出部分;
利用通道输出部分和空间输出部分进行加法运算,得到处理后的图像特征。
在一个可能的实现方式中,基于通道阈值系数计算空间阈值系数,包括:
利用预定的数值对通道阈值系数进行减法运算,得到空间阈值系数。
在一个可能的实现方式中,预设阈值函数为Sigmoid函数。
在一个可能的实现方式中,将从图像中提取到的待处理特征输入至预设卷积神经网络步骤之前,该方法还包括:
将图像输入预设的特征提取神经网络进行特征提取操作,得到待处理特征。
第二方面,提供了一种图像特征的处理装置,该装置包括:
第一处理模块,用于将从图像中提取到的待处理特征输入至预设卷积神经网络,基于预设卷积神经网络进行卷积处理得到卷积处理结果;
第二处理模块,用于利用预设阈值函数对卷积处理结果进行阈值处理操作,得到通道阈值系数;
计算模块,用于基于通道阈值系数计算空间阈值系数;
第三处理模块,用于依据通道阈值系数以及空间阈值系数,对待处理特征进行处理,得到处理后的图像特征。
在一个可能的实现方式中,该装置还包括:
第一输入模块,用于将待处理特征输入至预设通道注意力网络,得到通道注意力特征;
第二输入模块,用于将待处理特征输入至预设空间注意力网络,得到空间注意力特征;
第三处理模块,还用于基于通道阈值系数、通道注意力特征、空间阈值系数和空间注意力特征,得到处理后的图像特征。
第三方面,提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行上述任一项所述图像特征的处理方法。
例如,本公开的第三方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行如本公开的第一方面所示的图像特征的处理方法对应的操作。
第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述的图像特征的处理方法。
例如,本公开实施例的第四方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现本公开第一方面所示的图像特征的处理方法。
本公开实施例提供的技术方案带来的有益效果是:
通过将待处理特征进行卷积处理和阈值处理操作,得到通道阈值系数,并基于通道阈值系数计算空间阈值系数,依据通道阈值系数以及空间阈值系数,对待处理特征进行处理,得到处理后的图像特征。由于通道阈值系数和空间阈值系数均是通过计算得到的,而非取固定值,能有效提高处理后的图像特征的精度。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对本公开实施例描述中所需要使用的附图作简单地介绍。
图1为本公开实施例提供的一种图像特征的处理方法的流程示意图;
图2为本公开实施例提供的一种图像特征的处理装置的结构示意图;
图3为本公开实施例提供的一种图像特征的处理电子设备的结构示意图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本公开,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本公开的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
首先对本公开涉及的几个名词进行介绍和解释:计算机视觉中的注意力机制的基本思想就是让计算机系统学会注意力——能够忽略无关信息而关注重点信息。通常情况下,注意力域包括空间域、通道域和混合域。空间域的设计思路是将原始图片中的空间信息变换到另一个空间中并保留重要信息。Spatial Transformer Networks模型为一种典型的空间注意力网络模型,不仅能找到图片信息中需要被关注的区域,同时具备旋转、缩放变换的功能,使得图片局部的重要信息能够通过变换而被框盒提取出来;通道域的注意力网络是对一个通道内的信息直接全局平均池化,在神经网络中,每张图片初始由三通道表示,经过不同的卷积核之后,每一个通道又会生成新的信号,每个通道上的信号都有一个权重,表征该通道与关键信息的相关度,权重越大,相关度越高。其中,SENet模型是一个典型的通道注意力网络模型;混合域的注意力模型机制是结合空间注意力模型的设计思路和通道注意力模型的设计思路来得到的。
通常情况下,注意力网络得到的结果可以表示为两部分之和,默认情况下,两部分各自的比例系数均取固定值,如第一部分的比例系数取值为1,第二部分的比例系数取值也为1等。这种两部分各自的比例系数取固定值的方式在很大程度上带有不准确性,从而导致得到的结果精确度降低。
本公开提供的图像特征的处理方法、装置、电子设备和存储介质,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本公开的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本公开的实施例进行描述。
实施例一
本公开实施例提供了一种图像特征的处理的方法,如图1所示,该方法包括:
S101,将从图像中提取到的待处理特征输入至预设卷积神经网络,基于预设卷积神经网络进行卷积处理得到卷积处理结果;
从图像中提取到的待处理特征输入至预设卷积神经网络。基于预设预设卷积神经网络进行卷积处理得到卷积处理结果,其主要目的是为了进一步抽象特征和降维,把通道的维度降维1。如待处理特征为B*C*H*W,B表示Batch Size,Batch为每次送入网络中训练的一部分数据,Batch Size表示每个Batch中训练样本的数量,C表示通道的维度,H表示待处理特征的高,W表示待处理特征的宽。将待处理特征为B*C*H*W的特征输入预设卷积神经网络进行卷积处理,得到的卷积处理结果为B*1*H*W,即将通道的维度将为1。
S102,利用预设阈值函数对卷积处理结果进行阈值处理操作,得到通道阈值系数;
将卷积处理结果进行阈值处理操作,得到通道阈值系数。卷积处理结果的通道维度为1,能便于利用预设阈值函数进行阈值处理操作。
S103,基于通道阈值系数计算空间阈值系数;
S104,依据通道阈值系数以及空间阈值系数,对待处理特征进行处理,得到处理后的图像特征。
利用通道阈值系数计算空间阈值系数,通常情况下,通道阈值系数和空间阈值系数的和为1。
在本公开实施例中,通过将待处理特征进行卷积处理和阈值处理操作,得到通道阈值系数,并基于通道阈值系数计算空间阈值系数,依据通道阈值系数以及空间阈值系数,对待处理特征进行处理,得到处理后的图像特征。由于通道阈值系数和空间阈值系数均是通过计算得到的,而非取固定值,能有效提高处理后的图像特征的精度。
实施例二
本公开实施例提供了另一种可能的实现方式,在实施例一的基础上,还包括实施例二所示的方法,其中,该方法还包括S105(图中未标出)和S106(图中未标出):
S105,将待处理特征输入至预设通道注意力网络,得到通道注意力特征;
S106,将待处理特征输入至预设空间注意力网络,得到空间注意力特征;
S104,依据通道阈值系数以及空间阈值系数,对待处理特征进行处理,得到处理后的图像特征,包括S1041(图中未标出):
S1041,基于通道阈值系数、通道注意力特征、空间阈值系数和空间注意力特征,得到处理后的图像特征。
预设通道注意力网络包括但不限于Spatial Transformer Networks,一般的,预设通道注意力网络是对特征的通道维度做注意力处理,通过池化方法总结(Pooling)操作来获取每一个通道的权重。预设空间注意力网络包括但不限于SENet,一般的,预设空间注意力网络是对特征的空间维度做注意力处理,通过过卷积操作和Sigmoid操作可以得到空间位置上的注意力。
待处理特征一方面输入预设通道注意力网络,经预设通道注意力网络进行通道特征处理后得到通道注意力特征;待处理特征另一方面输入预设空间注意力网络,经预设空间注意力网络进行空间特征处理后得到空间注意力特征;待处理特征第三方面输入预设卷积神经网络,经预设卷积神经网络进行卷积处理后,利用预设阈值函数进行阈值处理操作,得到通道阈值系数。综合通道阈值系数、通道注意力特征、空间阈值系数和空间注意力特征,得到处理后的图像特征。
在又一种可能的实现方式中,S1041,基于通道阈值系数、通道注意力特征、空间阈值系数和空间注意力特征,得到处理后的图像特征,包括S10411(图中未标出)、S10412(图中未标出)和S10413(图中未标出):
S10411,利用通道阈值系数和通道注意力特征进行乘法运算,得到通道输出部分;
S10412,利用空间阈值系数和空间注意力特征进行乘法运算,得到空间输出部分;
S10413,利用通道输出部分和空间输出部分进行加法运算,得到处理后的图像特征。
将计算得到的通道阈值系数和通过预设通道注意力网络后得到的通道注意力特征进行相乘,得到通道输出部分。将计算得到的空间阈值系数和通过预设空间注意力网络后得到的空间注意力特征进行相乘,得到空间输出部分。将通道输出部分和空间输出部分进行相加,得到处理后的图像特征。
其中,处理后的图像特征的表示公式为:
F(x,y)=αSe(x,y)+βSa(x,y),F(x,y)表示从图像中提取到的待处理特征,α表示通道阈值系数,Se(x,y)表示通道注意力特征,β表示空间阈值系数,Sa(x,y)表示空间注意力特征。
在又一种可能的实现方式中,S103,基于通道阈值系数计算空间阈值系数,包括S1031(图中未标出):
S1031,利用预定的数值对通道阈值系数进行减法运算,得到空间阈值系数。
预定的数值包括但不限于1。一般情况下,通道阈值系数和空间阈值系数的和为1,即β=1-α,β表示空间阈值系数,α表示通道阈值系数。
在又一种可能的实现方式中,预设阈值函数为Sigmoid函数。
Sigmoid函数是一个在生物学中常见的函数,也称为S型生长曲线。在信息科学中,由于其单增以及反函数单增等性质,Sigmoid函数常被用作神经网络的阈值函数,将变量映射到0~1之间。
在又一种可能的实现方式中,S101,将从图像中提取到的待处理特征输入至预设卷积神经网络,基于预设卷积神经网络进行卷积处理得到卷积处理结果,之前还包括S107(图中未标出):
S107,将图像输入预设的特征提取神经网络进行特征提取操作,得到待处理特征。
预设的特征提取神经网络是一个能学习到图像中哪个位置特征多的网络。将图像输入预设的特征提取神经网络进行特征提取操作,能得到待处理特征。
在本公开实施例中,通过将待处理特征进行卷积处理和阈值处理操作,得到通道阈值系数,并基于通道阈值系数计算空间阈值系数,依据通道阈值系数以及空间阈值系数,对待处理特征进行处理,得到处理后的图像特征。由于通道阈值系数和空间阈值系数均是通过计算得到的,而非取固定值,能有效提高处理后的图像特征的精度。
实施例三
本公开实施例提供了一种图像特征的处理装置,如图2所示,该图像特征的处理装置20可以包括:第一处理模块模块201、第二处理模块模块202、计算模块203以及第三处理模块模块204,其中,
第一处理模块201,用于将从图像中提取到的待处理特征输入至预设卷积神经网络,基于预设卷积神经网络进行卷积处理得到卷积处理结果;
第二处理模块202,用于利用预设阈值函数对卷积处理结果进行阈值处理操作,得到通道阈值系数;
计算模块203,用于基于通道阈值系数计算空间阈值系数;
第三处理模块204,用于依据通道阈值系数以及空间阈值系数,对待处理特征进行处理,得到处理后的图像特征。
进一步地,该装置20还包括:第一输入模块(图中未标出)和第二输入模块(图中未标出),其中,
第一输入模块,用于将待处理特征输入至预设通道注意力网络,得到通道注意力特征;
第二输入模块,用于将待处理特征输入至预设空间注意力网络,得到空间注意力特征;
第三处理模块204,还用于基于通道阈值系数、通道注意力特征、空间阈值系数和空间注意力特征,得到处理后的图像特征。
进一步地,第三处理模块204包括第一运算模块(图中未标出)、第二运算模块(图中未标出)和第三运算模块(图中未标出),其中,
第一运算模块,用于利用通道阈值系数和通道注意力特征进行乘法运算,得到通道输出部分;
第二运算模块,用于利用空间阈值系数和空间注意力特征进行乘法运算,得到空间输出部分;
第三运算模块,用于利用通道输出部分和空间输出部分进行加法运算,得到处理后的图像特征。
进一步地,计算模块203,还用于利用预定的数值对通道阈值系数进行减法运算,得到空间阈值系数。
进一步地,预设阈值函数为Sigmoid函数。
进一步地,第一处理模块201之前还包括第三输入模块(图中未标出),其中,
第三输入模块,用于将图像输入预设的特征提取神经网络进行特征提取操作,得到待处理特征。
本实施例的图像特征的处理装置可执行本公开实施例一或实施例二提供的一种图像特征的处理方法,其实现原理相类似,此处不再赘述。
在本公开实施例中,通过将待处理特征进行卷积处理和阈值处理操作,得到通道阈值系数,并基于通道阈值系数计算空间阈值系数,依据通道阈值系数以及空间阈值系数,对待处理特征进行处理,得到处理后的图像特征。由于通道阈值系数和空间阈值系数均是通过计算得到的,而非取固定值,能有效提高处理后的图像特征的精度。
实施例四
本公开实施例还提供了一种电子设备,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行根据上述任一实施例所述的图像特征的处理方法。
本公开实施例还提供了计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一实施例提供的的图像特征的处理方法。
本公开的实施例中的方案,下面请参考图3,其示出了适于用来实现本公开实施例的电子设备300的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图3示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图3所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储装置308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置308被安装,或者从ROM 302被安装。在该计算机程序被处理装置301执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取至少两个网际协议地址;向节点评价设备发送包括所述至少两个网际协议地址的节点评价请求,其中,所述节点评价设备从所述至少两个网际协议地址中,选取网际协议地址并返回;接收所述节点评价设备返回的网际协议地址;其中,所获取的网际协议地址指示内容分发网络中的边缘节点。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收包括至少两个网际协议地址的节点评价请求;从所述至少两个网际协议地址中,选取网际协议地址;返回选取出的网际协议地址;其中,接收到的网际协议地址指示内容分发网络中的边缘节点。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。