CN110189279A - 模型训练方法、装置、电子设备及存储介质 - Google Patents
模型训练方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN110189279A CN110189279A CN201910498003.5A CN201910498003A CN110189279A CN 110189279 A CN110189279 A CN 110189279A CN 201910498003 A CN201910498003 A CN 201910498003A CN 110189279 A CN110189279 A CN 110189279A
- Authority
- CN
- China
- Prior art keywords
- image
- hash codes
- model
- distribution probability
- changing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000003860 storage Methods 0.000 title claims abstract description 22
- 230000009466 transformation Effects 0.000 claims description 64
- 238000013519 translation Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 9
- 241000208340 Araliaceae Species 0.000 claims description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 2
- 235000008434 ginseng Nutrition 0.000 claims description 2
- 235000013350 formula milk Nutrition 0.000 description 17
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 238000003062 neural network model Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000005291 magnetic effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本公开实施例提供了一种模型训练方法、装置、电子设备及存储介质,包括:获取训练样本数据,训练样本数据包括至少一个图像对,图像对包括原始图像以及原始图像的变换图像;基于训练样本数据对初始的模型进行训练,直至原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度满足预设条件;其中,模型是以图像为输入,以图像的哈希码分布概率为输出的模型,哈希码分布概率为输入至模型的图像所对应的哈希码为预设哈希码中的每一种哈希码的概率。在本公开实施例中,由于训练后的模型是满足约束条件的,因此通过该模型得到的哈希码分布概率也是相似的,进而解决了鲁棒性较差的问题。
Description
技术领域
本公开涉及图像处理技术领域,具体而言,本公开涉及一种模型训练方法、装置、电子设备及存储介质。
背景技术
现有技术中,对于原始图像,用户可能对图像会进行一些改变,比如,将图像进行旋转、在图像上加几个文字、将图像放大或缩小等简单的变换操作,变换后的图像与原始图像本质上是相同或相似的图像,理论上变换前后的图像的哈希码应该是尽可能相同。
但是,现有技术中得到图像的哈希码的方式,由于哈希算法的鲁棒性不强,会经常导致变换前后的图像的哈希码的鲁棒性较差。
发明内容
本公开的目的旨在至少能解决上述的技术缺陷之一,提升用户的使用体验。本公开采用的技术方案如下:
第一方面,本公开提供了一种模型训练方法,该方法包括:
获取训练样本数据,训练样本数据包括至少一个图像对,图像对包括原始图像以及原始图像的变换图像;
基于训练样本数据中的各图像对对初始的模型进行训练,直至各图像对中的原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度满足预设条件;
其中,模型是以图像为输入,以图像的哈希码分布概率为输出的模型,哈希码分布概率为输入至模型的图像所对应的哈希码为预设哈希码中的每一种哈希码的概率。
本公开第一方面可选的实施例中,变换图像是通过下列方式得到的:
在预设的图像变换参数取值范围内随机选取图像变换参数的取值;
基于图像变换参数的取值对原始图像进行变换,得到原始图像的变换图像。
本公开第一方面可选的实施例中,图像变换参数包括图像颜色缩放参数、图像颜色平移参数、图像缩放参数和图像旋转参数中的至少一种。
本公开第一方面可选的实施例中,通过原始图像的哈希码分布概率与变换图像的哈希码分布概率之间的相对熵,衡量原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度是否满足预设条件。
第二方面,本公开还提供了一种判断相似图像的方法,该方法包括:
获取至少两个待检测图像;
通过模型得到每个待检测图像的哈希码分布概率,其中,模型是通过第一方面实施例中任一项的方法训练得到的;
基于每个待检测图像的哈希码分布概率,确定待检测图像中的相似图像。
第三方面,本公开提供了一种模型训练装置,该装置包括:
样本数据获取模块,用于获取训练样本数据,训练样本数据包括至少一个图像对,图像对包括原始图像以及原始图像的变换图像;
模型训练模块,用于基于训练样本数据中的各图像对对初始的模型进行训练,直至各图像对中的原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度满足预设条件;
其中,模型是以图像为输入,以图像的哈希码分布概率为输出的模型,哈希码分布概率为输入至模型的图像所对应的哈希码为预设哈希码中的每一种哈希码的概率。
本公开第三方面可选的实施例中,样本数据获取模块通过以下方式得到变换图像:
在预设的图像变换参数取值范围内随机选取图像变换参数的取值,基于图像变换参数的取值对原始图像进行变换,得到原始图像的变换图像。
本公开第三方面可选的实施例中,图像变换参数包括图像颜色缩放参数、图像颜色平移参数、图像缩放参数和图像旋转参数中的至少一种。
本公开第三方面可选的实施例中,通过原始图像的哈希码分布概率与变换图像的哈希码分布概率之间的相对熵,衡量原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度是否满足预设条件。
第四方面,本公开提供了一种判断相似图像的装置,该装置包括:
图像获取模块,获取至少两个待检测图像;
图像处理模块,用于通过模型得到每个待检测图像的哈希码分布概率,基于每个待检测图像的哈希码分布概率,确定待检测图像中的相似图像,其中,模型是通过第一方面实施例中任一项的方法训练得到的
第五方面,本公开提供了一种电子设备,该电子设备包括处理器和存储器;
存储器,用于存储计算机操作指令;
处理器,用于通过调用计算机操作指令,执行如本公开的第一方面和第二方面中的任一实施例所示的方法。
第六方面,本公开提供了一种计算机可读存储介质,该计算机可读存储介质存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如本公开的第一方面和第二方面中的任一实施例所示的方法。
本公开实施例提供的技术方案带来的有益效果是:
在本公开实施例中,可以基于训练样本数据中的图像对对初始的模型进行训练,并且在各图像对中的原始图像的哈希码分布概率和换图像的哈希码分布概率的相似度满足预设条件时,可以完成对初始的模型的训练,由于训练后的模型是满足约束条件的,因此变换前后的图像通过该训练后的模型得到的哈希码分布概率自然也是相似的,进而解决了变换前后的图像的哈希码的鲁棒性较差的问题。
附图说明
为了更清楚地说明在本公开的实施例中的技术方案,下面将对本公开实施例描述中所需要使用的附图作简单地介绍。
图1为本公开的实施例中一种模型训练方法的流程示意图;
图2为本公开的实施例中一种判断相似图像的方法的示意图;
图3为本公开的实施例中一种模型训练方法装置的结构示意图;
图4为本公开的实施例中一种判断相似图像的装置的结构示意图;
图5为本公开的实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本公开的实施例,该实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本公开的技术感,而不能解释为对本公开的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”和“该”也可包括复数形式。应该进一步理解的是,本公开的说明书中使用的措辞“包括”是指存在该特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
下面以具体地实施例对本公开的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本公开的实施例进行描述。
本公开的实施例提供了一种模型训练方法,如图1所示,该方法可以包括:
步骤S110,获取训练样本数据,训练样本数据包括至少一个图像对,图像对包括原始图像以及原始图像的变换图像。
其中,得到原始图像的变换图像的具体实现方式,本公开实施例不做限定,如可以将原始图像进行旋转、平移、缩放得到变换图像。
在实际应用中,样本数据中所包括的图像对可以是对一张原始图像进行不同的变换得到的图像对,如可以对原始图像分别进行放大、平移、缩放变换,进而得到变换图像A、变换图像B和变换图像C,此时训练样本数据中所包括图像对为原始图像和变换图像A、原始图像和变换图像B,以及原始图像和变换图像C。
当然,在实际应用中,样本数据中所包括的图像对也可以是对不同的原始图像进行变换,进而得到原始图像的变换图像。如可以对原始图像A、原始图像B和原始图像C分别进行放大变换,进而得到原始图像A的变换图像a、原始图像B的变换图像b、原始图像C的变换图像c,此时练样本数据中所包括图像对为原始图像A和变换图像a、原始图像B和变换图像b,原始图像C和变换图像c。
步骤S120,基于训练样本数据中的各图像对对初始的模型进行训练,直至各图像对中的原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度满足预设条件;
其中,该模型可以是神经网络模型,且该神经网络模型是以图像为输入,以图像的哈希码分布概率为输出的模型,哈希码分布概率为输入至模型的图像所对应的哈希码为预设哈希码中的每一种哈希码的概率。
在实际应用中,可以将图像输入至模型,通过该模型的得到图像的哈希码分布概率,而哈希码分布概率指的是输入至模型的图像所对应的哈希码为预设哈希码中的每一种哈希码的概率,且每一种哈希码的概率之和为1。
在一示例中,预设哈希码包括code1、code2、code3和code4,此时哈希码分布概率指的是输入至模型的图像所对应的哈希码为code1、code2、code3和code4中的每一种哈希码的概率,如可以将图像X输入至模型,此时从模型中输出图像X所对应的哈希码为code1的概率为0.3、为code2的概率为0.2、为code3的概率为0.4、为code4的概率为0.1。
在实际应用中,在基于训练样本数后,可以将原始图像以及分别变换图像输入初始的模型,分别得到原始图像的哈希码分布概率和变换图像的哈希码分布概率;进一步的,判断原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度是否满足预设条件,若不满足预设条件,则说明基于当前的模型得到的原始图像的哈希码分布概率和变换图像的哈希码分布概率的鲁棒性不满足实际需求,此时可以调节当前模型的参数,再次分别将原始图像和变换图像输入到调节参数后的模型,并再次判断得到的原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度是否满足预设条件,若仍不满足预设条件,则再次调节模型的参数,并重复上述执行步骤,直至得到的原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度满足预设条件,则说明基于当前的神经络模型得到的原始图像的哈希分布概率和变换图像的哈希分布概率的鲁棒性满足实际需求。
其中,预设条件的具体内容可以根据实际需要设置,本公开实施例不做限定,如可以将预设条件设置为小于预设阈值。
在本申请实施例中,可以基于训练样本数据中的图像对对初始的模型进行训练,并且在各图像对中的原始图像的哈希码分布概率和换图像的哈希码分布概率的相似度满足预设条件时,可以完成对初始的模型的训练,由于训练后的模型是满足约束条件的,因此变换前后的图像通过该训练后的模型得到的哈希码分布概率自然也是相似的,进而解决了变换前后的图像的哈希码的鲁棒性较差的问题。
在本公开的可选实施例中,可以通过下列方式得到变换图像:
在预设的图像变换参数取值范围内随机选取图像变换参数的取值;
基于图像变换参数的取值对原始图像进行变换,得到原始图像的变换图像。
其中,对于每一个图像变换参数的取值可以存在一个取值范围,而取值范围具体的数值可以根据大量实验数据得出,本公开实施例在此就不再赘述。在实际应用中,在预设的图像变换参数取值范围内随机选取图像变换参数的取值后,可以基于随机选取的图像变换参数的取值对原始图像进行变换,得到原始图像的变换图像。
在本公开的可选实施例中,图像变换参数包括图像颜色缩放参数、图像颜色平移参数、图像缩放参数和图像旋转参数中的至少一种。
其中,图像颜色缩放参数指的是在将图像进行缩放变换时,图像中像素点的颜色产生变换的参数;图像颜色平移参数指的是在将图像进行平移变换时,图像中像素点的颜色产生变换的参数;图像缩放参数指的是在将图像进行缩放变换时,图像中像素点的位置产生变换的参数;图像旋转参数指的是在将图像进行旋转变换时,图像中像素点的角度产生变换的参数。
在实际应用中,在基于图像变换参数的取值对原始图像进行变换,得到原始图像的变换图像时,可以通过图像变换公式得到原始图像的变换图像。相应的,在随机选取图像变换参数的取值时可以选取图像变换公式中所涉及的图像变换参数的取值。比如所采用的图像变换公式中存在表示坐标的图像变换参数,此时可以在预设的坐标参数的取值范围内随机选取坐标的取值,然后基于随机选取坐标的取值和图像变换公式对原始图像进行变换,进而得到变换图像。
其中,若图像变换公式中涉及到多个图像变换参数,需要随机选取哪几个图像变换参数的取值,本公开实施例不做限定。比如,图像变换公式中存在表示坐标的图像变换参数和图像颜色缩放参数的图像变换参数,此时可以在预设的图像变换参数的取值范围内随机选取坐标的取值和图像颜色缩放参数的取值,也可以只选取其中一个图像变换参数的取值,将另一个参数取值设置为默认值。
在一示例中,图像变换公式中所涉及的图像变换参数为图像缩放参数,预设的图像缩放参数的取值范围为(0.8,1.2),原始图像为I,在基于原始图像I得到变换图像时,可以在(0.8,1.2)内随机选取的取值为1,此时可以基于图像缩放参数的取值(1)以及图像变换公式对原始图像进行变换,得到变换图像I’。
在本公开的可选实施例中,图像变换公式可以为:
I'=A(αI+β)
其中,I’为变换图像,I为原始图像,A为Affine(仿射变换)矩阵,α为图像颜色缩放参数,β为图像颜色平移参数,θ为图像旋转参数,a为图像水平方向上的平移参数、b为图像竖直方向上的平移参数、为图像空间缩放参数。
在实际应用中,可以将α的取值范围设置为(0.8,1.2),β的取值范围设置为[-30,30],θ的取值范围设置为[-30°,30°],a的取值范围为设置(-0.2,0.2),b的取值范围设置为(-0.2,0.2)。
也就是说,在得到变换图像时,可以在α、β、θ、a和b的取值范围内随机选取一个取值,然后基于确定的取值以及图像变换公式对原始图像进行变换,即可得到变换图像。当然,在实际应用中也可以只选取部分图像变换参数的取值,将其它的图像变换参数的取值设置为默认值,比如,可以只在α、β的取值范围内随机选取一个取值,而θ、a和b的取值设置为默认值,然后基于α、β的取值,θ、a和b的默认值以及图像变换公式对原始图像进行变换,进而得到原始图像的变换图像。
在本公开的可选实施例中,通过原始图像的哈希码分布概率与变换图像的哈希码分布概率之间的相对熵,衡量原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度是否满足预设条件。
在实际应用中,在判断两个概率是否相似时,通常可以基于两个概率的相对熵来衡量。也就是说,在衡量原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度是否满足预设条件时,可以判断原始图像的哈希码分布概率与变换图像的哈希码分布概率之间的相对熵是否满足预设条件,若满足预设条件,则说明原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度是满足预设条件,若相对熵是不满足预设条件,则说明原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度是不满足预设条件。
在本公开实施例中,可以基于哈希码分布概率与变换图像的哈希码分布概率之间的分布距离,衡量原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度是否满足预设条件。在实际应用中,可以通过衡量分布距离的公式来确定哈希码分布概率与变换图像的哈希码分布概率之间的分布距离。
在本公开的可选实施例中,衡量分布距离的公式可以为:
其中,Pc’为变换图像所对应的哈希码为预设哈希码中的每一种哈希码的概率,Pc为原始图像所对应的哈希码为预设哈希码中的每一种哈希码的概率,n为预设哈希码中存在多少种哈希码。
在实际应用中,在基于模型得到原始图像所对应的哈希码为预设哈希码中的每一种哈希码的概率Pc和变换的图像所对应的哈希码为预设哈希码中的每一种哈希码的概率Pc'后,可以将得到Pc和Pc'分别输入衡量分布距离公式,基于输出的结果判断是否满足预设条。
其中,当输出结果的数值越小,说明两个概率越接近,当输出结果的数值为0时,则说明两个概率是完全相同的.在本公开实施例中,在对初始的模型进行训练时,可以将预设条件设置为小于预设阈值,而阈值的具体数值可以根据实际需要设定,本公开实施例不做限定。
在一示例中,假如预设哈希码包括code1、code2、code3和code4,预设条件设置为小于阈值0.2(原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度大于80%),基于模型得到的原始图像的哈希码分布概率为Pc(如原始图像所对应的哈希码为code1的概率为0.3、code2的概率为0.2、code3的概率为0.4、code4的概率为0.1),变换图像的哈希码分布概率为Pc’(如变换图像所对应的哈希码为code1的概率为0.3、code2的概率为0.1、code3的概率为0.1、code4的概率为0.5),此时可以分别将原始图像和变换图像中所对应的哈希码为code1、code2、code3和code4的概率输入衡量分布距离的公式,若得到的结果为0.1(小于0.2),则认为满足预设条件,此时可以完成对初始的模型的训练,若得到的结果为0.3(小于0.2),则不满足预设条件,此时可以调节当前的模型的参数,并再次分别将原始图像和变换图像输入到调节参数后的模型,将再次得到的Pc’和Pc分别输入衡量分布距离的公式,直至得到的结果满足预设条件。
基于上述实施例中所描述的方法,本公开实施例还提供一种判断相似图像的方法,如图2所示,该方法包括:
步骤210,获取至少两个待检测图像。
步骤220,通过模型得到每个待检测图像的哈希码分布概率,其中,模型是通过上述实施例中所描述的方法训练得到的。
在实际应用中,在需要判断是否存在相似图像时,可以将获取到的每个待检测图像分别输入训练后的模型,得到每个待检测图像哈希码分布概率。比如,需要判断待检测图像A、待检测图像B和待检测图像C中是否存在相似图像,可以将检测图像A、待检测图像B和待检测图像C分别输入训练后的模型,得到待检测图像A的哈希码分布概率PA待检测图像B的哈希码分布概率PB,以及待检测图像C的哈希码分布概率PC。
其中,该模型可以是神经网络模型,且得到训练后的模型的具体实现方法,可以参考本公开实施例中图1所示的方法,在此就不再赘述。
步骤230,基于每个待检测图像的哈希码分布概率,确定待检测图像中的相似图像。
在实际应用中,在通过训练后的模型得到每一个待检测图像的哈希码分布概率后,可以基于得到的每一个待检测图像的哈希码分布概率确定待检测图像中哪些图像为相似图片。
其中,基于每个待检测图像的哈希码分布概率,确定待检测图像中的相似图像的具体实现方式,可以根据实际需要设置,本公开实施例不做限定。
在一示例中,可以通过每两个待检测图像的哈希码分布概率之间的相对熵,衡量每两个待检测图像的哈希码分布概率的相似度是否满足预设条件,若满足预设条件,则可以说明这两个待检测图像是相似图片,若不满足预设条件,则说明这两个待检测图像不是相似图片。而如何通过每两个待检测图像的哈希码分布概率之间的相对熵,衡量每两个待检测图像的哈希码分布概率的相似度是否满足预设条件与上述实施例中实现方式的原理相似,在此就不再赘述。
基于与图1中所示方法相同的原理,本公开的实施例中还提供了一种模型训练装置30,如图3所示,该装置30可以包括样本数据获取模块310和模型训练模块320,其中:
样本数据获取模块310,用于获取训练样本数据,训练样本数据包括至少一个图像对,图像对包括原始图像以及原始图像的变换图像;
模型训练模块320,用于基于训练样本数据中的各图像对对初始的模型进行训练,直至各图像对中的原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度满足预设条件;
其中,模型是以图像为输入,以图像的哈希码分布概率为输出的模型,哈希码分布概率为输入至模型的图像所对应的哈希码为预设哈希码中的每一种哈希码的概率。
本公开可选的实施例中,样本数据获取模块通过以下方式得到变换图像:
在预设的图像变换参数取值范围内随机选取图像变换参数的取值,基于图像变换参数的取值对原始图像进行变换,得到原始图像的变换图像。
本公开可选的实施例中,图像变换参数包括图像颜色缩放参数、图像颜色平移参数、图像缩放参数和图像旋转参数中的至少一种。
本公开可选的实施例中,通过原始图像的哈希码分布概率与变换图像的哈希码分布概率之间的相对熵,衡量原始图像的哈希码分布概率和变换图像的哈希码分布概率的相似度是否满足预设条件。
基于与图2中所示方法相同的原理,本公开的实施例中还提供了一种判断相似图像的装置40,如图4所示,该装置40可以包括样本数据获取模块410和模型训练模块420,其中:
图像获取模块410,获取至少两个待检测图像;
图像处理模块420,用于通过模型得到每个待检测图像的哈希码分布概率,基于每个待检测图像的哈希码分布概率,确定待检测图像中的相似图像,其中,模型是通过上述中模型训练方法训练得到的。
本公开实施例的模型训练装置可执行本公开的实施例所提供的一种模型训练方法,其实现原理相类似,本公开各实施例中的模型训练装置中的各模块所执行的动作是与本公开各实施例中的模型训练方法中的步骤相对应的,对于模型训练装置的各模块的详细功能描述具体可以参见前文中所示的对应的模型训练方法中的描述,此处不再赘述。
本公开实施例的判断相似图像的装置可执行本公开的实施例所提供的一种判断相似图像的方法,其实现原理相类似,本公开各实施例中的判断相似图像的装置中的各模块所执行的动作是与本公开各实施例中的判断相似图像的方法中的步骤相对应的,对于判断相似图像的装置的各模块的详细功能描述具体可以参见前文中所示的对应的判断相似图像的方法中的描述,此处不再赘述。
基于与本公开的实施例中所示的方法相同的原理,本公开的实施例中还提供了一种电子设备,该电子设备可以包括但不限于:处理器和存储器;存储器,用于存储计算机操作指令;处理器,用于通过调用计算机操作指令执行实施例所示的方法。
基于与本公开的实施例中所示的方法相同的原理,本公开的实施例中还提供了一种计算机可读存储介质,该计算机可读存储介质存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述实施例所示的方法,在此不再赘述。
本公开的实施例中的方案,下面参考图5,其示出了一种适用于实现本公开实施例的电子设备500的结构示意图,该电子设备500可以为终端设备或服务器。其中,终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500可以包括处理装置(例如中央处理器、图像处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例所示的方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种模型训练方法,其特征在于,所述方法包括:
获取训练样本数据,所述训练样本数据包括至少一个图像对,所述图像对包括原始图像以及所述原始图像的变换图像;
基于所述训练样本数据中的各图像对对初始的模型进行训练,直至各图像对中的所述原始图像的哈希码分布概率和所述变换图像的哈希码分布概率的相似度满足预设条件;
其中,所述模型是以图像为输入,以图像的哈希码分布概率为输出的模型,所述哈希码分布概率为输入至所述模型的图像所对应的哈希码为预设哈希码中的每一种哈希码的概率。
2.根据权利要求1所述的方法,其特征在于,所述变换图像是通过下列方式得到的:
在预设的图像变换参数取值范围内随机选取图像变换参数的取值;
基于所述图像变换参数的取值对所述原始图像进行变换,得到所述原始图像的变换图像。
3.根据权利要求2所述的方法,其特征在于,所述图像变换参数包括图像颜色缩放参数、图像颜色平移参数、图像缩放参数和图像旋转参数中的至少一种。
4.根据权利要求1所述的方法,其特征在于,通过所述原始图像的哈希码分布概率与所述变换图像的哈希码分布概率之间的相对熵,衡量所述原始图像的哈希码分布概率和所述变换图像的哈希码分布概率的相似度是否满足预设条件。
5.一种判断相似图像的方法,其特征在于,所述方法包括:
获取至少两个待检测图像;
通过所述模型得到每个待检测图像的哈希码分布概率,其中,所述模型是通过权利要求1至4中任一项所述的方法训练得到的;
基于所述每个待检测图像的哈希码分布概率,确定所述待检测图像中的相似图像。
6.一种模型训练装置,其特征在于,包括:
样本数据获取模块,用于获取训练样本数据,所述训练样本数据包括至少一个图像对,所述图像对包括原始图像以及所述原始图像的变换图像;
模型训练模块,用于基于所述训练样本数据中的各图像对对初始的模型进行训练,直至各图像对中的所述原始图像的哈希码分布概率和所述变换图像的哈希码分布概率的相似度满足预设条件;
其中,所述模型是以图像为输入,以图像的哈希码分布概率为输出的模型,所述哈希码分布概率为输入至所述模型的图像所对应的哈希码为预设哈希码中的每一种哈希码的概率。
7.根据权利要求6所述的装置,其特征在于,所述样本数据获取模块通过以下方式得到所述变换图像:
在预设的图像变换参数取值范围内随机选取图像变换参数的取值,基于所述图像变换参数的取值对所述原始图像进行变换,得到所述原始图像的变换图像。
8.一种判断相似图像的装置,其特征在于,包括:
图像获取模块,获取至少两个待检测图像;
图像处理模块,用于通过所述模型得到每个待检测图像的哈希码分布概率,基于所述每个待检测图像的哈希码分布概率,确定所述待检测图像中的相似图像,其中,所述模型是通过权利要求1至4中任一项所述的方法训练得到的。
9.一种电子设备,其特征在于,包括:
处理器和存储器;
所述存储器,用于存储计算机操作指令;
所述处理器,用于通过调用所述计算机操作指令,执行权利要求1至5中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述可读存储介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现权利要求1至5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910498003.5A CN110189279B (zh) | 2019-06-10 | 2019-06-10 | 模型训练方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910498003.5A CN110189279B (zh) | 2019-06-10 | 2019-06-10 | 模型训练方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110189279A true CN110189279A (zh) | 2019-08-30 |
CN110189279B CN110189279B (zh) | 2022-09-30 |
Family
ID=67720980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910498003.5A Active CN110189279B (zh) | 2019-06-10 | 2019-06-10 | 模型训练方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110189279B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114254791A (zh) * | 2020-09-23 | 2022-03-29 | 新智数字科技有限公司 | 一种烟气含氧量的预测方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2454214A (en) * | 2007-10-31 | 2009-05-06 | Sony Corp | Detecting Edge Pixels In An Image |
CN105894046A (zh) * | 2016-06-16 | 2016-08-24 | 北京市商汤科技开发有限公司 | 卷积神经网络训练及图像处理的方法和系统、计算机设备 |
CN106203461A (zh) * | 2015-05-07 | 2016-12-07 | 中国移动通信集团公司 | 一种图像处理方法及装置 |
CN106570141A (zh) * | 2016-11-04 | 2017-04-19 | 中国科学院自动化研究所 | 近似重复图像检测方法 |
CN107067020A (zh) * | 2016-12-30 | 2017-08-18 | 腾讯科技(上海)有限公司 | 图片识别方法及装置 |
CN108665441A (zh) * | 2018-03-30 | 2018-10-16 | 北京三快在线科技有限公司 | 一种近似重复图像检测方法及装置,电子设备 |
CN109376256A (zh) * | 2018-09-29 | 2019-02-22 | 京东方科技集团股份有限公司 | 图像搜索方法及装置 |
CN109711422A (zh) * | 2017-10-26 | 2019-05-03 | 北京邮电大学 | 图像数据处理、模型的建立方法、装置、计算机设备和存储介质 |
-
2019
- 2019-06-10 CN CN201910498003.5A patent/CN110189279B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2454214A (en) * | 2007-10-31 | 2009-05-06 | Sony Corp | Detecting Edge Pixels In An Image |
CN106203461A (zh) * | 2015-05-07 | 2016-12-07 | 中国移动通信集团公司 | 一种图像处理方法及装置 |
CN105894046A (zh) * | 2016-06-16 | 2016-08-24 | 北京市商汤科技开发有限公司 | 卷积神经网络训练及图像处理的方法和系统、计算机设备 |
CN106570141A (zh) * | 2016-11-04 | 2017-04-19 | 中国科学院自动化研究所 | 近似重复图像检测方法 |
CN107067020A (zh) * | 2016-12-30 | 2017-08-18 | 腾讯科技(上海)有限公司 | 图片识别方法及装置 |
CN109711422A (zh) * | 2017-10-26 | 2019-05-03 | 北京邮电大学 | 图像数据处理、模型的建立方法、装置、计算机设备和存储介质 |
CN108665441A (zh) * | 2018-03-30 | 2018-10-16 | 北京三快在线科技有限公司 | 一种近似重复图像检测方法及装置,电子设备 |
CN109376256A (zh) * | 2018-09-29 | 2019-02-22 | 京东方科技集团股份有限公司 | 图像搜索方法及装置 |
Non-Patent Citations (1)
Title |
---|
周书仁,谢盈,蔡碧野: "融合多尺度特征的深度哈希图像检索方法", 《计算机科学与探索》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114254791A (zh) * | 2020-09-23 | 2022-03-29 | 新智数字科技有限公司 | 一种烟气含氧量的预测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110189279B (zh) | 2022-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108898185A (zh) | 用于生成图像识别模型的方法和装置 | |
CN110413812A (zh) | 神经网络模型的训练方法、装置、电子设备及存储介质 | |
CN109598304B (zh) | 分类模型校准方法、装置、设备及可读介质 | |
CN109215121A (zh) | 用于生成信息的方法和装置 | |
CN109754464A (zh) | 用于生成信息的方法和装置 | |
CN110213573A (zh) | 一种视频质量评估方法、装置和电子设备 | |
CN109118456A (zh) | 图像处理方法和装置 | |
CN110263565A (zh) | 用于调用服务的方法和装置 | |
CN109815365A (zh) | 用于处理视频的方法和装置 | |
CN110502665A (zh) | 视频处理方法和装置 | |
CN116182878B (zh) | 道路曲面信息生成方法、装置、设备和计算机可读介质 | |
CN110059623A (zh) | 用于生成信息的方法和装置 | |
CN111597465A (zh) | 展示方法、装置和电子设备 | |
CN111984803B (zh) | 多媒体资源处理方法、装置、计算机设备及存储介质 | |
CN110347875A (zh) | 一种视频场景分类方法、装置、移动终端及存储介质 | |
WO2021217340A1 (zh) | 基于ai的通用智能家居方案自动化设计方法及装置 | |
CN110188782A (zh) | 图像相似性确定方法、装置、电子设备及可读存储介质 | |
CN109688086A (zh) | 用于终端设备的权限控制方法和装置 | |
CN110198473A (zh) | 视频处理方法、装置、电子设备及计算机可读存储介质 | |
CN110189279A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN109559274A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN113722738A (zh) | 数据保护方法、装置、介质及电子设备 | |
CN107682691B (zh) | 一种相机对焦校准的方法、终端及计算机可读存储介质 | |
CN108921838A (zh) | 用于检测图像的方法和装置 | |
CN109242892B (zh) | 用于确定图像间的几何变换关系的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |