CN105894046A - 卷积神经网络训练及图像处理的方法和系统、计算机设备 - Google Patents

卷积神经网络训练及图像处理的方法和系统、计算机设备 Download PDF

Info

Publication number
CN105894046A
CN105894046A CN201610430066.3A CN201610430066A CN105894046A CN 105894046 A CN105894046 A CN 105894046A CN 201610430066 A CN201610430066 A CN 201610430066A CN 105894046 A CN105894046 A CN 105894046A
Authority
CN
China
Prior art keywords
image block
convolutional neural
image
neural networks
block group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610430066.3A
Other languages
English (en)
Other versions
CN105894046B (zh
Inventor
汤晓鸥
黄琛
吕健勤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sensetime Technology Development Co Ltd
Original Assignee
Beijing Sensetime Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sensetime Technology Development Co Ltd filed Critical Beijing Sensetime Technology Development Co Ltd
Priority to CN201610430066.3A priority Critical patent/CN105894046B/zh
Publication of CN105894046A publication Critical patent/CN105894046A/zh
Application granted granted Critical
Publication of CN105894046B publication Critical patent/CN105894046B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes

Abstract

本申请公开了一种卷积神经网络训练及图像处理的方法和系统、计算机设备,卷积神经网络的训练方法包括:对多个图像中的各图像分别进行图像块划分以得到图像块集合;根据图像块集合中的各图像块生成至少一个第一图像块组;根据至少一个第一图像块组训练卷积神经网络;基于第一卷积神经网络对图像块集合中的各图像块进行分类以得到至少一个第二图像块组,其中,第一卷积神经网络为经至少一个第一图像块组训练后的卷积神经网络;基于第一卷积神经网络提取图像块集合中的各图像块的特征信息;以及根据所提取的特征信息和至少一个第二图像块组训练第一卷积神经网络。采用本申请实施例的方案,可以对无任何标定的图像中的各图像块进行分组,实现无监督标签标定。

Description

卷积神经网络训练及图像处理的方法和系统、计算机设备
技术领域
本申请一般涉及图像特征提取领域,具体地涉及卷积神经网络训练及图像处理的方法和系统、计算机设备。
背景技术
目前,在图像识别领域中通常涉及图像特征的提取,传统的图像提取方法首先使用图像训练集来训练CNN(Conventional Neural Network,卷积神经网络),然后使用CNN来进行图像特征提取。
传统的图像特征提取方法需要使用预先标定的一些属性(例如,图像标签等)来训练CNN。
例如,现有技术中,可通过人工手动标定的方式来进行图像的属性标定。但是这需要消耗大量的人力,标定效率较低。
或者,现有技术中,还可利用网络数据来进行图像属性的标定。然而,由于网络数据中包含了大量的噪声,导致图像属性的标定准确率较低。
此外,如上所述的方法还有一个共同的缺点,即,不能保证人工标定或者网络挖掘的属性标签能在特征空间被预测出来,也不能保证它们具有鉴别性。
发明内容
本申请提供了一种对卷积神经网络进行训练的方案以及一种图像处理的方案。
本申请实施方式的一方面提供一种卷积神经网络的训练方法,包括:对多个图像中的各图像分别进行图像块划分以得到图像块集合;根据图像块集合中的各图像块生成至少一个第一图像块组;根据至少一个第一图像块组训练卷积神经网络;基于第一卷积神经网络对图像块集合中的各图像块进行分类以得到至少一个第二图像块组,其中,第一卷积神经网络为经至少一个第一图像块组训练后的卷积神经网络;基于第一卷积神经网络提取图像块集合中的各图像块的特征信息;以及根据所提取的特征信息和至少一个第二图像块组训练第一卷积神经网络。
在一些实施例中,根据图像块集合中的各图像块生成至少一个第一图像块组,包括:根据图像块集合中的各图像块之间的第一相似度聚类各图像块以得到多个第三图像块组;将各第三图像块组之间的第二相似度和预设相似度阈值进行比较;根据比较结果将多个第三图像块组分为至少一个第一图像块组。
在一些实施例中,根据比较结果将多个第三图像块组分为至少一个第一图像块组,包括:将第三图像块组中,第二相似度小于预设相似度阈值的第三图像块组合并以生成至少一个第一图像块组。
在一些实施例中,根据图像块集合中的各图像块生成至少一个第一图像块组,包括:对各第一图像块组中的图像块进行图像变换;以及将经图像变换后的图像块添加至对应的第一图像块组中。
在一些实施例中,图像变换包括以下至少一者:平移、缩放以及旋转。
在一些实施例中,根据图像块集合中的各图像块生成至少一个第一图像块组,包括:剔除包含的图像块的数量小于预定数量的第一图像块组。
在一些实施例中,根据至少一个第一图像块组训练卷积神经网络包括:根据至少一个第一图像块组对卷积神经网络循环执行第一网络参数的调节步骤,直至调节结果满足第一预定收敛条件。
在一些实施例中,第一网络参数的调节步骤包括:基于当前卷积神经网络分别提取各图像块的特征信息;根据提取出的特征信息对各图像块重新分组;以及根据当前第一网络参数的调节步骤中的重新分组结果与前一次第一网络参数的调节步骤中的重新分组结果之间的差异调整当前卷积神经网络的网络参数。
在一些实施例中,第一收敛条件包括:当前第一参数调节步骤中的重新分组结果与前一次第一参数调节步骤中的重新分组结果的差异落入第一容差范围。
在一些实施例中,根据所提取的特征信息和至少一个第二图像块组训练第一卷积神经网络,包括:将所提取的特征信息映射为二维编码;以及根据二维编码和第二图像块组训练第一卷积神经网络的参数以生成第二卷积神经网络。
在一些实施例中,二维编码为基于哈希函数将所提取的特征信息映射生成的哈希编码。
在一些实施例中,根据所提取的特征信息和至少一个第二图像块组训练第一卷积神经网络,包括:根据所提取的特征信息和至少一个第二图像块组循环执行第二网络参数的调节步骤,直至调节结果满足第二预定收敛条件。
在一些实施例中,第二网络参数的调节步骤包括:根据哈希编码及第二图像块组调节当前第一卷积神经网络的参数和哈希函数的参数;基于调节后的当前第一卷积神经网络的参数和哈希函数的参数重新提取各第二图像块组中的各图像块的特征信息;以及生成与重新提取后的各第图像块的特征信息相对应的哈希编码。
在一些实施例中,第二收敛条件包括:当前第二参数调节步骤中生成的各图像块的特征信息与前一次第二参数调节步骤中生成的各图像块的特征信息的差异落入第二容差范围;以及当前第二参数调节步骤中生成的各哈希编码与前一次第二参数调节步骤中生成的各哈希编码的差异落入第三容差范围。
本申请实施方式的另一方面提供一种图像处理方法,包括:采用如上的卷积神经网络的训练方法训练卷积神经网络以得到训练后的第三卷积神经网络;对输入第三卷积神经网络的至少一个第一图像进行图像处理。
在一些实施例中,图像处理包括:通过第三卷积神经网络提取第一图像的特征信息;以及基于提取出的第一图像的特征信息对各第一图像进行分组。
在一些实施例中,图像处理包括:通过第三卷积神经网络提取第一图像的特征信息;基于提取出的特征信息生成哈希编码;以及以哈希编码为依据在待检索图像集合中检索与哈希编码匹配的图像。
在一些实施例中,图像处理包括:通过第三卷积神经网络确定第一图像中的边缘图像块;其中,边缘图像块为第一图像中,包含图像轮廓的图像块。
在一些实施例中,图像处理包括:采用第三图像块组对第三卷积神经网络训练;其中,第三图像块组中包括多个具有至少一个相同的特征信息的图像块。
本申请实施方式的再一方面提供一种卷积神经网络的训练系统,包括:划分模块,用于对多个图像中的各图像分别进行图像块划分以得到图像块集合;第一生成模块,用于根据图像块集合中的各图像块生成至少一个第一图像块组;第一训练模块,用于根据至少一个第一图像块组训练卷积神经网络;分类模块,用于基于第一卷积神经网络对图像块集合中的各图像块进行分类以得到至少一个第二图像块组,其中,第一卷积神经网络为经至少一个第一图像块组训练后的卷积神经网络;特征提取模块,用于基于第一卷积神经网络提取图像块集合中的各图像块的特征信息;以及第二训练模块,用于根据所提取的特征信息和至少一个第二图像块组训练第一卷积神经网络。
在一些实施例中,第一生成模块包括:聚类单元,用于根据图像块集合中的各图像块之间的第一相似度聚类各图像块以得到多个第三图像块组;比较单元,用于将各第三图像块组之间的第二相似度和预设相似度阈值进行比较;第一分组单元,用于根据比较结果将多个第三图像块组分为至少一个第一图像块组。
在一些实施例中,第一分组单元进一步用于:将第三图像块组中,第二相似度小于预设相似度阈值的第三图像块组合并以生成至少一个第一图像块组。
在一些实施例中,第一生成模块还包括:图像变换单元,用于对各第一图像块组中的图像块进行图像变换;以及添加单元,用于将经图像变换后的图像块添加至对应的第一图像块组中。
在一些实施例中,图像变换包括以下至少一者:平移、缩放以及旋转。
在一些实施例中,第一生成模块还包括:剔除单元,用于剔除包含的图像块的数量小于预定数量的第一图像块组。
在一些实施例中,第一训练模块进一步用于:根据至少一个第一图像块组对卷积神经网络循环执行第一网络参数的调节步骤,直至调节结果满足第一预定收敛条件。
在一些实施例中,第一训练模块包括提取单元、第二分组单元以及参数调节单元,提取单元、第二分组单元以及参数调节单元用于执行第一网络参数的调节步骤;其中,提取单元用于基于当前卷积神经网络分别提取各图像块的特征信息;第二分组单元用于根据提取出的特征信息对各图像块重新分组;参数调节单元用于根据当前第一网络参数的调节步骤中的重新分组结果与前一次第一网络参数的调节步骤中的重新分组结果之间的差异调整当前卷积神经网络的网络参数。
在一些实施例中,第一收敛条件包括:当前第一参数调节步骤中的重新分组结果与前一次第一参数调节步骤中的重新分组结果的差异落入第一容差范围。
在一些实施例中,第二训练模块包括:映射单元,用于将所提取的特征信息映射为二维编码;以及生成单元,用于根据二维编码和第二图像块组训练第一卷积神经网络的参数以生成第二卷积神经网络。
在一些实施例中,二维编码为基于哈希函数将所提取的特征信息映射生成的哈希编码。
在一些实施例中,生成单元进一步用于:根据所提取的特征信息和至少一个第二图像块组循环执行第二网络参数的调节步骤,直至调节结果满足第二预定收敛条件。
在一些实施例中,在执行第二网络参数的调节步骤时,生成单元进一步用于:根据哈希编码及第二图像块组调节当前第一卷积神经网络的参数和哈希函数的参数;基于调节后的当前第一卷积神经网络的参数和哈希函数的参数重新提取各第二图像块组中的各图像块的特征信息;以及生成与重新提取后的各图像块的特征信息相对应的哈希编码。
在一些实施例中,第二收敛条件包括:当前第二参数调节步骤中生成的各图像块的特征信息与前一次第二参数调节步骤中生成的各图像块的特征信息的差异落入第二容差范围;以及当前第二参数调节步骤中生成的各哈希编码与前一次第二参数调节步骤中生成的各哈希编码的差异落入第三容差范围。
本申请实施方式的又一方面提供一种图像处理系统,包括:如上的卷积神经网络的训练系统;以及图像处理模块,用于对输入第三卷积神经网络的至少一个第一图像进行图像处理;其中,第三卷积神经网络为经卷积神经网络的训练系统训练得到的卷积神经网络。
在一些实施例中,图像处理模块包括:第一特征信息提取单元,用于通过第三卷积神经网络提取第一图像的特征信息;以及第三分组单元,用于基于提取出的第一图像的特征信息对各第一图像进行分组。
在一些实施例中,图像处理模块包括:第二特征信息提取单元,用于通过第三卷积神经网络提取第一图像的特征信息;哈希编码生成单元,用于基于提取出的特征信息生成哈希编码;以及图像检索单元,用于以哈希编码为依据在待检索图像集合中检索与哈希编码匹配的图像。
在一些实施例中,图像处理模块包括:边缘确定单元,用于通过第三卷积神经网络确定第一图像中的边缘图像块;其中,边缘图像块为第一图像中,包含图像轮廓的图像块。
在一些实施例中,图像处理模块包括:训练单元,用于采用第三图像块组对第三卷积神经网络训练;其中,第三图像块组中包括多个具有至少一个相同的特征信息的图像块。
本申请实施方式的还一方面提供一种计算机设备,包括:存储器,存储可执行指令;一个或多个处理器,与存储器通信以执行可执行指令从而完成以下操作:对多个图像中的各图像分别进行图像块划分以得到图像块集合;根据图像块集合中的各图像块生成至少一个第一图像块组;根据至少一个第一图像块组训练卷积神经网络;基于第一卷积神经网络对图像块集合中的各图像块进行分类以得到至少一个第二图像块组,其中,第一卷积神经网络为经至少一个第一图像块组训练后的卷积神经网络;基于第一卷积神经网络提取图像块集合中的各图像块的特征信息;以及根据所提取的特征信息和至少一个第二图像块组训练第一卷积神经网络。
本申请实施方式的又一方面还提供了一种计算机存储介质,用于存储计算机可读取的指令。所述指令包括:对多个图像中的各图像分别进行图像块划分以得到图像块集合的指令;根据图像块集合中的各图像块生成至少一个第一图像块组的指令;根据至少一个第一图像块组训练卷积神经网络的指令;基于第一卷积神经网络对图像块集合中的各图像块进行分类以得到至少一个第二图像块组的指令,其中,第一卷积神经网络为经至少一个第一图像块组训练后的卷积神经网络;基于第一卷积神经网络提取图像块集合中的各图像块的特征信息的指令;以及根据所提取的特征信息和至少一个第二图像块组训练第一卷积神经网络的指令。
采用本申请实施例的方案,可以对无任何标定的图像中的各图像块进行分组,实现无监督标签标定。此外,通过分组形成的各个图像块组和可表征各图像块特征信息的二维编码来进一步训练卷积神经网络,可得到更具鉴别性和视觉意义的特征(例如,特征信息),从而可实现在无监督的情况下从图像中获得具有代表性和鉴别性的特征。
附图说明
通过阅读参照以下附图所作的对非限制性实施方式的详细描述,本申请的其它特征、目的和优点将会变得更明显,其中:
图1示意性地示出了根据本申请实施方式的卷积神经网络的训练方法的流程图;
图2示意性地示出了本申请的卷积神经网络的训练方法中,根据图像块集合中的各图像块生成至少一个第一图像块组的步骤的流程图;
图3示意性地示出了本申请的卷积神经网络的训练方法中,根据至少一个第一图像块组训练卷积神经网络的步骤的流程图;
图4示意性地示出了根据本申请的卷积神经网络的训练方法中,根据所提取的特征信息和至少一个第二图像块组训练第一卷积神经网络的步骤的流程图;
图5示意性地示出了本申请的图像处理方法的流程图;
图6示意性地示出了本申请的卷积神经网络的训练系统的结构图;
图7示意性地示出了本申请的图像处理系统的结构图;
图8示意性地示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施方式对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分。在不冲突的情况下,本申请中的实施方式及实施方式中的特征可以相互组合。本领域技术人员还将理解的是,虽然本文中可使用用语“第一”、“第二”等来描述各种元件、部件、层和/或组,但是这些元件、部件、层和/或组不应被这些用语限制。这些用语仅用于将一个元件、部件、层和/或组与其它元件、部件、层或组区分开。因此,在不背离本发明的精神和范围的情况下,下文讨论的第一元件、第一部件、第一层或者第一组可称作第二元件、第二部件、第二层或者第二组。下面将参考附图并结合实施方式来详细说明本申请。
图1示意性地示出了根据本申请实施方式的提取图像特征的方法的流程图100。
如图1所示,根据本申请实施方式的提取图像特征的方法100包括:
步骤110,对多个图像中的各图像分别进行图像块划分以得到图像块集合。
在一些可选的实现方式中,例如,可通过在每个图像中随机选取多个图像块来将多个图像划分以得到图像块集合。
例如,可以将n个图像分别进行划分,使得每个图像均划分为mi个图像块,在这里,i为自然数,且满足1≤i≤n。
例如,在一些应用场景中,可通过使用固定大小(例如,40×40像素)的选取框以固定移动步长(例如,40个像素)在每个图像上选取图像块来将多个图像分为多个图像块。还可以在未背离本申请公开教导的范围内,选用其它图像分块的方法。
步骤120,根据图像块集合中的各图像块生成至少一个第一图像块组。
在一些可选的实现方式中,例如可以根据各图像块的相似度将多个图像块聚类生成至少个第一图像块组。
在这里,各图像块之间的相似度可反映各图像块的特征之间的相近程度。这些特征例如可以是但不限于HOG(Histogram of OrientedGradient,方向梯度直方图)特征、通过CNN提取的特征或通过分类器得到的特征等。
具体而言,在一些应用场景中,例如可以先将包含多个图像的图像集平均分为两个集合,一个集合作为发现集D,另一个作为验证集N。
接着,分别将发现集D和验证集N分为多个子集,各子集可以具有相同大小且互不重叠。例如,可将发现集D分为两个子集D1和D2,并将验证集N分为子集N1和N2。
在D1中,可利用D1中所包含图像块的HOG特征对D1中的图像块进行聚类。具体的聚类算法例如可通过k均值(k-means)方法、谱聚类(Spectral Clustering)方法等来实施。
在这些应用场景中,还可以可利用上述聚类结果来训练分类器,例如,SVM(Support Vector Machine,支持向量机)分类器,以使得聚类生成的第一图像块组的各图像块的相似程度更高。例如,在对分类器进行训练的过程中,可将上述第一图像块组中的各图像块作为正样本并将子集N1中的图像块作为负样本。然后可利用训练得到的分类器对子集D2中的图像块进行分组,再利用所得到的分组结果优化分类器。在优化分类器的过程中,可将利用分类器得到的第一图像块组中的图像块作为正样本并将子集N2中的图像块作为负样本。之后可将利用上述方法得到的分类器用于对D1中的图像块分组,然后结合N1来进一步优化分类器。如此循环,直到分类器得到的图像块组不再变化。可利用上述循环得到的分类器对图像集中的各图像块进行聚类以得到各第一图像块组。
参见图2所示,在一些可选的实现方式中,本步骤120还可以采用如图2所示的流程200来实现。
具体而言,步骤210,根据各图像块之间的第一相似度聚类多个图像块以得到第三图像块组;
步骤220,将各第三图像块组之间的第二相似度和预设相似度阈值进行比较;以及
步骤230,根据比较结果将多个第三图像块组分为至少一个第一图像块组。
在一些可选的实现方式中,步骤230中,例如可以将第三图像块组中,第二相似度小于预设相似度阈值的第三图像块组合并以生成至少一个第一图像块组。
经聚类生成的各图像块组(第三图像块组)之间的相似度例如可以根据这些图像块组中所包含的图像块之间的相似度来衡量,例如,可通过一个图像块组中的全部图像块的特征得到该图像块组的总体特征,如果两个图像块组的总体特征的相似程度大于上述预设相似度阈值,则可将它们合并为一个第一图像块组。
将多个满足条件的第三图像块组合并为一个第一图像块组可使得一个第一图像块组中包含的图像块的数量相应地较多,使得第一图像块组包含的信息更为丰富,这样利用第一图像块组训练出的CNN所得到的特征将更具鲁棒性。
此外,在另一些可选的实现方式中,如图2所示,图1中的步骤120还可以进一步包括:
步骤240:剔除包含的图像块的数量小于预定数量的第一图像块组。
例如,在一些应用场景中,可将包含少于3个图像块的第一图像块组剔除或将包含少于其它预定数目的图像块的图像块组去除。图像块组中包含较少的图像块说明该图像块组并没有较强的代表性,通过剔除这些第一图像块组,可以使得聚类结果更具代表性。
此外,在另一些可选的实现方式中,如图2所示,图1中的步骤120还可以进一步包括:
步骤250:对各第一图像块组中的图像块进行图像变换;以及
步骤260,将经图像变换后的图像块添加至对应的第一图像块组中。
在这里,图像变换例如可以包括但不限于平移、缩放以及旋转中的至少一者。
利用包含经过图像变换的图像块的第一图像块组训练得到的CNN可以对这些经过图像变换的图像块的图像变换具有不变性。也就是说,经后续的步骤对CNN训练之后,CNN可以对同一个图像块经过图像变换后得到的多个图像块提取出相同的特征。
通过本步骤120,可以对在步骤110中通过划分图像生成的图像块进行聚类得到第一图像块组,这些第一图像块组可以作为训练CNN的标签,从而代替人工标定的标签,实现无监督情况下的标签标定以及CNN的训练和特征提取。
步骤130,根据至少一个第一图像块组训练卷积神经网络。
在一些可选的实现方式中,本步骤130例如可以通过如图3所示的流程来实现。
具体而言,步骤310,循环执行第一参数调节步骤。
步骤320,判断当前卷积神经网络是否满足第一收敛条件。
步骤330,若是,则结束第一参数调节步骤并将当前卷积神经网络的参数作为第一卷积神经网络的参数。
在这里,上述的第一参数调节步骤例如可以通过如下的方式来实现。具体而言:
在步骤311中,基于当前卷积神经网络提取各图像块的特征信息;
在步骤312中,根据提取出的特征性对多个图像块重新分组;
在步骤313中,根据当前第一网络参数的调节步骤中的重新分组结果与前一次第一网络参数的调节步骤中的重新分组结果之间的差异调整当前卷积神经网络的网络参数。
在这里,第一收敛条件例如可以包括:当前第一参数调节步骤中的重新分组结果与前一次第一参数调节步骤中的重新分组结果的差异落入第一容差范围。也即是说,若当前第一参数调节步骤中的重新分组结果与前一次第一参数调节步骤中的重新分组结果的差异落入一预先设置的第一容差范围,可以认为该二次的重新分组结果之间差异较小甚至完全相同。此时,可以认为对当前卷积神经网络的网络参数已经完成。
步骤140,基于第一卷积神经网络对多个图像块分类生成至少一个第二图像块组。在这里,第一卷积神经网络即为经至少一个第一图像块组训练后的卷积神经网络。
步骤150,利用第一卷积神经网络提取各图像块的特征信息。
步骤160,根据所提取的特征信息和至少一个第二图像块组训练第一卷积神经网络。
在一些可选的实现方式中,步骤160可以通过如图4所示的流程400来实现。
具体而言,在步骤410中,将所提取的特征信息映射为二维编码。
在一些可选的实现方式中,二维编码例如可以是基于哈希函数将所提取的特征信息映射生成的哈希编码,例如,二维哈希编码。
具体而言,二维哈希编码在本领域中是指一串二维码,可例如但不限于LSH(Locality-Sensitive Hashing,局部敏感哈希编码),ITQ(Iterative Quantization,迭代量化哈希编码),SH(Spectral Hashing,谱哈希编码)。
具体地,可通过将所提取的特征输入哈希函数来将所提取的特征映射为哈希编码,例如映射为与所提取的特征一一对应的哈希编码。
在一个可选的实现方式中,哈希函数h(x;W)可例如表示为:
h(x;W)=sign(WT f(X)) (1)
其中,W表示哈希权重,f(X)表示从图像块中提取特征。
由于将各图像块的特征利用哈希函数映射为哈希编码,使得原本多维抽象的特征得到了降维并且更加具有视觉意义,所以利用哈希编码训练得到的CNN可以提取更加具有鉴别性和视觉意义的图像特征。
步骤420,根据二维编码和第二图像块组训练第一卷积神经网络的参数以生成第二卷积神经网络。
在一些可选的实现方式中,图4中的步骤420例如可以进一步包括:
步骤421,循环执行第二参数调节步骤。
步骤422,判断当前第一卷积神经网络是否满足第二收敛条件。
步骤423,若是,则结束第二参数调节步骤并将当前第一卷积神经网络的参数作为第二卷积神经网络的参数。
在这里,上述的第二参数调节步骤例如可以通过如下的方式来实现。具体而言:
在步骤4211中,根据哈希编码及第二图像块组调节当前第一卷积神经网络的网络参数和哈希函数的参数。
具体而言,例如,相同第二图像块组中各图像块的哈希编码之间的相似度大于分属不同第二图像块组中的任意二图像块的哈希编码之间的相似度。在一些应用场景中,任意二哈希编码之间的相似度可使用哈希编码之间的Hamming(汉明)距离来描述。也即是说,若二哈希编码之间的Hamming距离越短,则可说明该二哈希编码所对应的图像块之间的相似度越高。
例如,图像块A和图像块B属于相同的第二图像块组,而图像块C属于与图像块A和图像块B分别属于不同的第二图像块组,则图像块A和图像块B的哈希编码之间的相似度应高于图像块A和图像块C以及图像块B和图像块C之间的相似度,如果在图像块A、图像块B和图像块C中得到的哈希编码不满足这个条件,则需要调整哈希函数的参数和当前第一卷积神经网络的参数。
在步骤4212中,基于调节后的当前第一卷积神经网络的网络参数和哈希函数的参数重新提取各第二图像块组中的各图像块的特征信息;以及
在步骤4213中,生成与重新提取后的各图像块的特征信息相对应的哈希编码。
在一些可选的实现方式中,第二收敛条件例如可以包括:当前第二参数调节步骤中生成的各图像块的特征信息与前一次第二参数调节步骤中生成的各图像块的特征信息的差异落入第二容差范围;以及当前第二参数调节步骤中生成的各哈希编码与前一次第二参数调节步骤中生成的各哈希编码的差异落入第三容差范围。也即是说,若当前第二参数调节步骤中生成的各图像块的特征信息与前一次第二参数调节步骤中生成的各图像块的特征信息的差异落入第二容差范围,可以认为该二次第二参数调节步骤中提取出的各图像块的特征信息差异较小(甚至二者完全相同);类似地,若当前第二参数调节步骤中生成的各哈希编码与前一次第二参数调节步骤中生成的各哈希编码的差异落入第三容差范围,可以认为该二次第二参数调节步骤中生成的哈希编码差异较小(甚至二者完全相同),此时,可以结束第二参数调节的步骤。
上述利用哈希编码及多个第二图像块组训练第一卷积神经网络的过程例如可通过使用一个排序目标函数计算哈希编码的排序目标函数值并反相传播目标梯度来调整CNN和哈希函数来实现。
具体而言,排序目标函数可例如设置为:
min Σ i ϵ i + α · tr [ W T f ( X ) f ( X ) T W ] + β | | WW T - I | | 2 2 + γ | | W | | 2 2 s . t . : max ( 0 , ρ + H ( b i , b i + ) - H ( b i , b i - ) ) ≤ ϵ i ∀ i , b i = h ( x i ; W ) , and ϵ i ≥ 0 - - - ( 2 )
其中,εi为松弛变量;
为相同图像块组中的哈希编码对;
为不同图像块组的哈希编码对;
H(·,·)表示Hamming距离;
ρ表示之间的Hamming距离的预置边界;
α,β,γ为正则化参数。
通过多次调整哈希函数和当前第一卷积神经网络的参数,使得到的特征信息以及与这些特征对应的哈希编码能够使得上述目标函数值最小,这样即可得到期望的哈希函数及最终的第二卷积神经网络。
这样一来,通过如上所述的步骤110~步骤160得到期望的第二卷积神经网络后,在后续的图像处理步骤中,便可使用该第二卷积神经网络提取多个图像块的特征信息。具体地,可将多个图像块作为第二卷积神经网络的输入,然后通过第二卷积神经网络进行常规的卷积、池化(pooling)等处理后输出多个图像块的特征信息。
参见图5所示,为本申请的图像处理方法的一个实施例的示意性流程图500。
具体而言,在步骤510中,采用如上所述的卷积神经网络的训练方法训练卷积神经网络以得到训练后的第三卷积神经网络。
在步骤520中,对输入第三卷积神经网络的至少一个第一图像进行图像处理。
在一些可选的实现方式中,步骤520例如可以包括:
步骤521,通过第三卷积神经网络提取第一图像的特征信息;以及
步骤522,基于提取出的第一图像的特征信息对各第一图像进行分组。
或者,在另一些可选的实现方式中,步骤520还可以包括:
步骤523,通过第三卷积神经网络提取第一图像的特征信息;
步骤524,基于提取出的特征信息生成哈希编码;以及
步骤525,以哈希编码为依据在待检索图像集合中检索与哈希编码匹配的图像。
或者,在另一些可选的实现方式中,步骤520还可以包括:
步骤526,通过所述第三卷积神经网络确定所述第一图像中的边缘图像块。在这里,边缘图像块为第一图像中,包含图像轮廓的图像块。这样一来,可以更精确地提取出各第一图像中的图像轮廓。
或者,在另一些可选的实现方式中,步骤520还可以包括:
步骤527,采用第三图像块组对第三卷积神经网络训练。在这里,第三图像块组中包括多个具有至少一个相同的特征信息的图像块。通过步骤526的训练,可以提高第三卷积神经网络对第三图像块组中各图像块的共同的特征信息具有更精确的分类以及特征提取能力。
如图6所示,为本申请的卷积神经网络的训练系统的一个实施例的示意性结构图600。
如图6所示,卷积神经网络的训练系统包括划分模块610、第一生成模块620、第一训练模块630、分类模块640、特征提取模块650以及第二训练模块660。
其中,划分模块610可用于对多个图像中的各图像分别进行图像块划分以得到图像块集合。
第一生成模块620可用于根据图像块集合中的各图像块生成至少一个第一图像块组。
第一训练模块630可用于根据至少一个第一图像块组训练卷积神经网络。
分类模块640可用于基于第一卷积神经网络对图像块集合中的各图像块进行分类以得到至少一个第二图像块组,其中,第一卷积神经网络为经至少一个第一图像块组训练后的卷积神经网络。
特征提取模块650可用于基于第一卷积神经网络提取图像块集合中的各图像块的特征信息。
第二训练模块660可用于根据所提取的特征信息和至少一个第二图像块组训练第一卷积神经网络。
在一些可选的实现方式中,第一生成模块620可进一步包括聚类单元621、比较单元622以及第一分组单元623。
其中,聚类单元621可用于根据图像块集合中的各图像块之间的第一相似度聚类各图像块以得到多个第三图像块组。
比较单元622可用于将各第三图像块组之间的第二相似度和预设相似度阈值进行比较。
第一分组单元623用于根据比较结果将多个第三图像块组分为至少一个第一图像块组。
在一些可选的实现方式中,第一分组单元623可进一步用于将第三图像块组中,第二相似度小于预设相似度阈值的第三图像块组合并以生成至少一个第一图像块组。
在一些可选的实现方式中,第一生成模块620还可以进一步包括图像变换单元624和添加单元625。
其中,图像变换单元624可用于对各第一图像块组中的图像块进行图像变换。
添加单元625可用于将经图像变换后的图像块添加至对应的第一图像块组中。
在这里,图像变换例如可以包括平移、缩放以及旋转中的至少一者。
在一些可选的实现方式中,第一生成模块620还可以进一步包括剔除单元626。剔除单元626可用于剔除包含的图像块的数量小于预定数量的第一图像块组。
在一些可选的实现方式中,第一训练模块630可进一步用于:根据至少一个第一图像块组对卷积神经网络循环执行第一网络参数的调节步骤,直至调节结果满足第一预定收敛条件。
在这些可选的实现方式中,第一训练模块630包括提取单元631、第二分组单元632以及参数调节单元633。且提取单元631、第二分组单元632以及参数调节单元633用于执行第一网络参数的调节步骤。
具体而言,提取单元631可用于基于当前卷积神经网络分别提取各图像块的特征信息;。
第二分组单元632可用于根据提取出的特征信息对各图像块重新分组。
参数调节单元633可用于根据当前第一网络参数的调节步骤中的重新分组结果与前一次第一网络参数的调节步骤中的重新分组结果之间的差异调整当前卷积神经网络的网络参数。
在一些可选的实现方式中,第一收敛条件例如可以包括:当前第一参数调节步骤中的重新分组结果与前一次第一参数调节步骤中的重新分组结果的差异落入第一容差范围。
在一些可选的实现方式中,第二训练模块660可包括映射单元661和生成单元662。
其中,映射单元661可用于将所提取的特征信息映射为二维编码。
生成单元662可用于根据二维编码和第二图像块组训练第一卷积神经网络的参数以生成第二卷积神经网络。
在这里,二维编码例如可以是基于哈希函数将所提取的特征信息映射生成的哈希编码。
在这一些可选的实现方式中,生成单元662还可进一步用于:根据所提取的特征信息和至少一个第二图像块组循环执行第二网络参数的调节步骤,直至调节结果满足第二预定收敛条件。
在执行第二网络参数的调节步骤时,生成单元662进一步用于:根据哈希编码及第二图像块组调节当前第一卷积神经网络的参数和哈希函数的参数;基于调节后的当前第一卷积神经网络的参数和哈希函数的参数重新提取各第二图像块组中的各图像块的特征信息;以及生成与重新提取后的各图像块的特征信息相对应的哈希编码。
在一些可选的实现方式中,第二收敛条件例如可以包括:当前第二参数调节步骤中生成的各图像块的特征信息与前一次第二参数调节步骤中生成的各图像块的特征信息的差异落入第二容差范围;以及当前第二参数调节步骤中生成的各哈希编码与前一次第二参数调节步骤中生成的各哈希编码的差异落入第三容差范围。
参见图7所示,为本申请的图像处理系统的一个实施例的示意性结构图700。
本实施例的图像处理系统包括如上所述的卷积神经网络的训练系统710以及图像处理模块720。
其中,图像处理模块720可用于对输入第三卷积神经网络的至少一个第一图像进行图像处理。在这里,第三卷积神经网络为经卷积神经网络的训练系统710训练得到的卷积神经网络。
在一些可选的实现方式中,图像处理模块720可包括第一特征信息提取单元721和第三分组单元722。其中,第一特征信息提取单元721可用于通过第三卷积神经网络提取第一图像的特征信息。第三分组单元722可用于基于提取出的第一图像的特征信息对各第一图像进行分组。
在另一些可选的实现方式中,图像处理模块720还可以包括第二特征信息提取单元723、哈希编码生成单元724和图像检索单元725。
其中,第二特征信息提取单元723可用于通过第三卷积神经网络提取第一图像的特征信息。
哈希编码生成单元724可用于基于提取出的特征信息生成哈希编码。
图像检索单元725可用于以哈希编码为依据在待检索图像集合中检索与哈希编码匹配的图像。
在另一些可选的实现方式中,图像处理模块720还可以包括边缘确定单元726,用于通过第三卷积神经网络确定第一图像中的边缘图像块。其中,边缘图像块为第一图像中,包含图像轮廓的图像块。
在另一些可选的实现方式中,图像处理模块720还可以包括训练单元727,用于采用第三图像块组对第三卷积神经网络训练。其中,第三图像块组中包括多个具有至少一个相同的特征信息的图像块。
下面参考图8,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统800的结构示意图。
如图8所示,计算机系统800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的可执行指令或者从存储部分808加载到随机访问存储器(RAM)803中的可执行指令而执行各种适当的动作和处理。中央处理单元可与只读存储器802和/或随机访问存储器830中通信以执行可执行指令从而完成以下操作:对多个图像中的各图像分别进行图像块划分以得到图像块集合;根据图像块集合中的各图像块生成至少一个第一图像块组;根据至少一个第一图像块组训练卷积神经网络;基于第一卷积神经网络对图像块集合中的各图像块进行分类以得到至少一个第二图像块组,其中,第一卷积神经网络为经至少一个第一图像块组训练后的卷积神经网络;基于第一卷积神经网络提取图像块集合中的各图像块的特征信息;以及根据所提取的特征信息和至少一个第二图像块组训练第一卷积神经网络。
此外,在RAM 803中,还可存储有系统400操作所需的各种程序和数据。CPU401、ROM802以及RAM803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行流程图所示的方法的程序代码。具体而言,包括:对多个图像中的各图像分别进行图像块划分以得到图像块集合的指令;根据图像块集合中的各图像块生成至少一个第一图像块组的指令;根据至少一个第一图像块组训练卷积神经网络的指令;基于第一卷积神经网络对图像块集合中的各图像块进行分类以得到至少一个第二图像块组的指令,其中,第一卷积神经网络为经至少一个第一图像块组训练后的卷积神经网络;基于第一卷积神经网络提取图像块集合中的各图像块的特征信息的指令;以及根据所提取的特征信息和至少一个第二图像块组训练第一卷积神经网络的指令。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本申请的方法中限定的上述功能。
以上描述仅为本申请的示例性实施方式以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不背离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种卷积神经网络的训练方法,其特征在于,包括:
对多个图像中的各图像分别进行图像块划分以得到图像块集合;根据所述图像块集合中的各图像块生成至少一个第一图像块组;
根据所述至少一个第一图像块组训练卷积神经网络;
基于第一卷积神经网络对所述图像块集合中的各图像块进行分类以得到至少一个第二图像块组,其中,所述第一卷积神经网络为经所述至少一个第一图像块组训练后的卷积神经网络;
基于所述第一卷积神经网络提取所述图像块集合中的各图像块的特征信息;以及
根据所提取的特征信息和所述至少一个第二图像块组训练所述第一卷积神经网络。
2.根据权利要求1所述的方法,其特征在于,所述根据所述图像块集合中的各图像块生成至少一个第一图像块组,包括:
根据所述图像块集合中的各图像块之间的第一相似度聚类所述各图像块以得到多个第三图像块组;
将各所述第三图像块组之间的第二相似度和预设相似度阈值进行比较;
根据比较结果将所述多个第三图像块组分为所述至少一个第一图像块组。
3.根据权利要求2所述的方法,其特征在于,所述根据比较结果将所述多个第三图像块组分为所述至少一个第一图像块组,包括:
将所述第三图像块组中,所述第二相似度小于预设相似度阈值的第三图像块组合并以生成至少一个所述第一图像块组。
4.根据权利要求1-3任一所述的方法,其特征在于,所述根据所述图像块集合中的各图像块生成至少一个第一图像块组,包括:
对各所述第一图像块组中的图像块进行图像变换;以及
将经图像变换后的图像块添加至对应的第一图像块组中。
5.一种图像处理方法,其特征在于,包括:
采用如权利要求1-4任一所述的卷积神经网络的训练方法训练卷积神经网络以得到训练后的第三卷积神经网络;
对输入所述第三卷积神经网络的至少一个第一图像进行图像处理。
6.一种卷积神经网络的训练系统,其特征在于,包括:
划分模块,用于对多个图像中的各图像分别进行图像块划分以得到图像块集合;
第一生成模块,用于根据所述图像块集合中的各图像块生成至少一个第一图像块组;
第一训练模块,用于根据所述至少一个第一图像块组训练卷积神经网络;
分类模块,用于基于第一卷积神经网络对所述图像块集合中的各图像块进行分类以得到至少一个第二图像块组,其中,所述第一卷积神经网络为经所述至少一个第一图像块组训练后的卷积神经网络;
特征提取模块,用于基于所述第一卷积神经网络提取所述图像块集合中的各图像块的特征信息;以及
第二训练模块,用于根据所提取的特征信息和所述至少一个第二图像块组训练所述第一卷积神经网络。
7.根据权利要求6所述的系统,其特征在于,所述第一生成模块包括:
聚类单元,用于根据所述图像块集合中的各图像块之间的第一相似度聚类所述各图像块以得到多个第三图像块组;
比较单元,用于将各所述第三图像块组之间的第二相似度和预设相似度阈值进行比较;
第一分组单元,用于根据比较结果将所述多个第三图像块组分为所述至少一个第一图像块组。
8.根据权利要求7所述的系统,其特征在于,所述第一分组单元进一步用于:
将所述第三图像块组中,所述第二相似度小于预设相似度阈值的第三图像块组合并以生成至少一个所述第一图像块组。
9.一种图像处理系统,其特征在于,包括:
如权利要求6-8任一所述的卷积神经网络的训练系统;以及
图像处理模块,用于对输入第三卷积神经网络的至少一个第一图像进行图像处理;
其中,所述第三卷积神经网络为经所述卷积神经网络的训练系统训练得到的卷积神经网络。
10.一种计算机设备,其特征在于,包括:
存储器,存储可执行指令;
一个或多个处理器,与存储器通信以执行可执行指令从而完成以下操作:
对多个图像中的各图像分别进行图像块划分以得到图像块集合;根据所述图像块集合中的各图像块生成至少一个第一图像块组;
根据所述至少一个第一图像块组训练卷积神经网络;
基于第一卷积神经网络对所述图像块集合中的各图像块进行分类以得到至少一个第二图像块组,其中,所述第一卷积神经网络为经所述至少一个第一图像块组训练后的卷积神经网络;
基于所述第一卷积神经网络提取所述图像块集合中的各图像块的特征信息;以及
根据所提取的特征信息和所述至少一个第二图像块组训练所述第一卷积神经网络。
CN201610430066.3A 2016-06-16 2016-06-16 卷积神经网络训练及图像处理的方法和系统、计算机设备 Active CN105894046B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610430066.3A CN105894046B (zh) 2016-06-16 2016-06-16 卷积神经网络训练及图像处理的方法和系统、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610430066.3A CN105894046B (zh) 2016-06-16 2016-06-16 卷积神经网络训练及图像处理的方法和系统、计算机设备

Publications (2)

Publication Number Publication Date
CN105894046A true CN105894046A (zh) 2016-08-24
CN105894046B CN105894046B (zh) 2019-07-02

Family

ID=56730763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610430066.3A Active CN105894046B (zh) 2016-06-16 2016-06-16 卷积神经网络训练及图像处理的方法和系统、计算机设备

Country Status (1)

Country Link
CN (1) CN105894046B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408030A (zh) * 2016-09-28 2017-02-15 武汉大学 基于中层语义属性和卷积神经网络的sar图像分类方法
CN106407991A (zh) * 2016-09-14 2017-02-15 北京市商汤科技开发有限公司 图像属性识别方法和系统以及相关网络训练方法和系统
CN106980880A (zh) * 2017-03-06 2017-07-25 北京小米移动软件有限公司 图像匹配的方法及装置
CN107122375A (zh) * 2016-12-12 2017-09-01 南京理工大学 基于图像特征的图像主体的识别方法
CN107197260A (zh) * 2017-06-12 2017-09-22 清华大学深圳研究生院 基于卷积神经网络的视频编码后置滤波方法
CN108229673A (zh) * 2016-12-27 2018-06-29 北京市商汤科技开发有限公司 卷积神经网络的处理方法、装置和电子设备
CN108509963A (zh) * 2017-02-28 2018-09-07 株式会社日立制作所 基于深度学习的目标差异性检测方法和目标差异性检测设备
CN108804988A (zh) * 2017-05-04 2018-11-13 上海荆虹电子科技有限公司 一种遥感影像场景分类方法及装置
CN109242788A (zh) * 2018-08-21 2019-01-18 福州大学 一种基于编码-解码卷积神经网络低照度图像优化方法
CN109934281A (zh) * 2019-03-08 2019-06-25 电子科技大学 一种二分类网络的非监督训练方法
CN110147872A (zh) * 2018-05-18 2019-08-20 北京中科寒武纪科技有限公司 编码存储装置及方法、处理器及训练方法
CN110189279A (zh) * 2019-06-10 2019-08-30 北京字节跳动网络技术有限公司 模型训练方法、装置、电子设备及存储介质
WO2019184888A1 (zh) * 2018-03-28 2019-10-03 华为技术有限公司 一种基于卷积神经网络的图像处理的方法和装置
CN110443363A (zh) * 2018-05-04 2019-11-12 北京市商汤科技开发有限公司 图像特征学习方法及装置
CN110598630A (zh) * 2019-09-12 2019-12-20 江苏航天大为科技股份有限公司 基于卷积神经网络的城市轨道交通乘客拥挤程度检测方法
CN110717469A (zh) * 2019-10-16 2020-01-21 山东浪潮人工智能研究院有限公司 一种基于相关性语义特征学习的手指静脉识别方法及系统
WO2021056765A1 (zh) * 2019-09-24 2021-04-01 北京市商汤科技开发有限公司 图像处理方法及相关装置
CN112861976A (zh) * 2021-02-11 2021-05-28 温州大学 一种基于孪生图卷积哈希网络的敏感图像识别方法
US11429809B2 (en) 2019-09-24 2022-08-30 Beijing Sensetime Technology Development Co., Ltd Image processing method, image processing device, and storage medium
EP4242985A1 (en) * 2022-03-10 2023-09-13 FUJIFILM Business Innovation Corp. Information processing apparatus, program, and information processing method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130108154A1 (en) * 2010-07-07 2013-05-02 Nec Corporation Image processing learning device, image processing learning method, and image processing learning program
CN103984959A (zh) * 2014-05-26 2014-08-13 中国科学院自动化研究所 一种基于数据与任务驱动的图像分类方法
CN105046272A (zh) * 2015-06-29 2015-11-11 电子科技大学 一种基于简洁非监督式卷积网络的图像分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130108154A1 (en) * 2010-07-07 2013-05-02 Nec Corporation Image processing learning device, image processing learning method, and image processing learning program
CN103984959A (zh) * 2014-05-26 2014-08-13 中国科学院自动化研究所 一种基于数据与任务驱动的图像分类方法
CN105046272A (zh) * 2015-06-29 2015-11-11 电子科技大学 一种基于简洁非监督式卷积网络的图像分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FAYAOLIU 等: "CRF learning with CNN features for image segmentation", 《PATTERN RECOGNITION》 *
张文达 等: "基于多尺度分块卷积神经网络的图像目标识别算法", 《计算机应用》 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407991A (zh) * 2016-09-14 2017-02-15 北京市商汤科技开发有限公司 图像属性识别方法和系统以及相关网络训练方法和系统
CN106407991B (zh) * 2016-09-14 2020-02-11 北京市商汤科技开发有限公司 图像属性识别方法和系统以及相关网络训练方法和系统
CN106408030B (zh) * 2016-09-28 2019-06-25 武汉大学 基于中层语义属性和卷积神经网络的sar图像分类方法
CN106408030A (zh) * 2016-09-28 2017-02-15 武汉大学 基于中层语义属性和卷积神经网络的sar图像分类方法
CN107122375B (zh) * 2016-12-12 2020-11-06 南京理工大学 基于图像特征的图像主体的识别方法
CN107122375A (zh) * 2016-12-12 2017-09-01 南京理工大学 基于图像特征的图像主体的识别方法
CN108229673A (zh) * 2016-12-27 2018-06-29 北京市商汤科技开发有限公司 卷积神经网络的处理方法、装置和电子设备
CN108509963A (zh) * 2017-02-28 2018-09-07 株式会社日立制作所 基于深度学习的目标差异性检测方法和目标差异性检测设备
CN106980880A (zh) * 2017-03-06 2017-07-25 北京小米移动软件有限公司 图像匹配的方法及装置
CN108804988A (zh) * 2017-05-04 2018-11-13 上海荆虹电子科技有限公司 一种遥感影像场景分类方法及装置
CN108804988B (zh) * 2017-05-04 2020-11-20 深圳荆虹科技有限公司 一种遥感影像场景分类方法及装置
CN107197260A (zh) * 2017-06-12 2017-09-22 清华大学深圳研究生院 基于卷积神经网络的视频编码后置滤波方法
CN107197260B (zh) * 2017-06-12 2019-09-13 清华大学深圳研究生院 基于卷积神经网络的视频编码后置滤波方法
WO2019184888A1 (zh) * 2018-03-28 2019-10-03 华为技术有限公司 一种基于卷积神经网络的图像处理的方法和装置
CN110443363A (zh) * 2018-05-04 2019-11-12 北京市商汤科技开发有限公司 图像特征学习方法及装置
CN110147872A (zh) * 2018-05-18 2019-08-20 北京中科寒武纪科技有限公司 编码存储装置及方法、处理器及训练方法
CN109242788A (zh) * 2018-08-21 2019-01-18 福州大学 一种基于编码-解码卷积神经网络低照度图像优化方法
CN109934281A (zh) * 2019-03-08 2019-06-25 电子科技大学 一种二分类网络的非监督训练方法
CN110189279A (zh) * 2019-06-10 2019-08-30 北京字节跳动网络技术有限公司 模型训练方法、装置、电子设备及存储介质
CN110598630A (zh) * 2019-09-12 2019-12-20 江苏航天大为科技股份有限公司 基于卷积神经网络的城市轨道交通乘客拥挤程度检测方法
WO2021056765A1 (zh) * 2019-09-24 2021-04-01 北京市商汤科技开发有限公司 图像处理方法及相关装置
US11429809B2 (en) 2019-09-24 2022-08-30 Beijing Sensetime Technology Development Co., Ltd Image processing method, image processing device, and storage medium
CN110717469A (zh) * 2019-10-16 2020-01-21 山东浪潮人工智能研究院有限公司 一种基于相关性语义特征学习的手指静脉识别方法及系统
CN110717469B (zh) * 2019-10-16 2022-04-12 山东浪潮科学研究院有限公司 一种基于相关性语义特征学习的手指静脉识别方法及系统
CN112861976A (zh) * 2021-02-11 2021-05-28 温州大学 一种基于孪生图卷积哈希网络的敏感图像识别方法
CN112861976B (zh) * 2021-02-11 2024-01-12 温州大学 一种基于孪生图卷积哈希网络的敏感图像识别方法
EP4242985A1 (en) * 2022-03-10 2023-09-13 FUJIFILM Business Innovation Corp. Information processing apparatus, program, and information processing method

Also Published As

Publication number Publication date
CN105894046B (zh) 2019-07-02

Similar Documents

Publication Publication Date Title
CN105894046A (zh) 卷积神经网络训练及图像处理的方法和系统、计算机设备
Garg et al. A novel content-based image retrieval approach for classification using GLCM features and texture fused LBP variants
CN110414377B (zh) 一种基于尺度注意力网络的遥感图像场景分类方法
CN103164713B (zh) 图像分类方法和装置
DE102018128581A1 (de) Erkennung und klassifikfation von schadsoftware unter verwendung eines künstlichen neuronalen netzes
Thai et al. Image classification using support vector machine and artificial neural network
CN105184303B (zh) 一种基于多模态深度学习的图像标注方法
EP3029606A2 (en) Method and apparatus for image classification with joint feature adaptation and classifier learning
CN106156777B (zh) 文本图片检测方法及装置
CN108021908B (zh) 人脸年龄段识别方法及装置、计算机装置及可读存储介质
CN112801146A (zh) 一种目标检测方法及系统
CN105389588B (zh) 基于多语义码本图像特征表示方法
Khrissi et al. Image Segmentation based on k-means and genetic algorithms
CN113569895A (zh) 图像处理模型训练方法、处理方法、装置、设备及介质
CN103366175B (zh) 基于潜在狄利克雷分配的自然图像分类方法
CN104036296A (zh) 一种图像的表示和处理方法及装置
Awang et al. Vehicle counting system based on vehicle type classification using deep learning method
Wang et al. A novel sparse boosting method for crater detection in the high resolution planetary image
CN114492634B (zh) 一种细粒度装备图片分类识别方法及系统
CN112163114A (zh) 一种基于特征融合的图像检索方法
CN115546525A (zh) 多视图聚类方法、装置、电子设备及存储介质
CN106570514A (zh) 一种基于词袋模型和支持向量机的汽车轮毂分类方法
CN113486202A (zh) 小样本图像分类的方法
Wang et al. A multi-label hyperspectral image classification method with deep learning features
CN107169450A (zh) 一种高分辨率遥感图像的场景分类方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant