CN105205487B - 一种图片处理方法及装置 - Google Patents

一种图片处理方法及装置 Download PDF

Info

Publication number
CN105205487B
CN105205487B CN201410230512.7A CN201410230512A CN105205487B CN 105205487 B CN105205487 B CN 105205487B CN 201410230512 A CN201410230512 A CN 201410230512A CN 105205487 B CN105205487 B CN 105205487B
Authority
CN
China
Prior art keywords
picture
vector
feature
fitting
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410230512.7A
Other languages
English (en)
Other versions
CN105205487A (zh
Inventor
张博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201410230512.7A priority Critical patent/CN105205487B/zh
Publication of CN105205487A publication Critical patent/CN105205487A/zh
Application granted granted Critical
Publication of CN105205487B publication Critical patent/CN105205487B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明实施例公开一种图片处理及装置,其中方法可包括:提取图片的多个特征向量,并将图片的多个特征向量映射为拟合向量;查找拟合向量中每个特征向量对应的预设CRC编码,根据拟合向量中每个特征向量对应的预设CRC编码生成散列值;获取预设拟合系数,并根据散列值和预设拟合系数对拟合向量进行加权计算,得到图片的加权向量;将图片的加权向量映射为图片的签名。采用本发明实施例,可提高图片处理精度,可降低特征向量的维度,从而简化了计算复杂度,提高了图片处理效率。

Description

一种图片处理方法及装置
技术领域
本发明涉及计算机领域,尤其涉及一种图片处理方法及装置。
背景技术
在对图片的处理过程中,可通过全局特征(global feature)算法和/或局部特征(local feature)算法进行对图片的特征进行提取,将提取的图片的特征应用于图片索引或图片相似度判断等场景中。例如,在互联网平台的广告系统中,若投放的广告类型为图片,可通过全局特征算法GIST(Generalized Search Tree,通用搜索树)对图片进行去重判断和相似度计算,可提取每张图片的GIST特征,对提取到的GIST特征计算向量的欧式距离,根据欧式距离计算每张图片的相似度,还可将提取到的每张图片的GIST特征作为广告特征的表达,但是需离线保存并计算所有图片,加载每张图片的GIST全局特征,维度高,计算复杂度大,且无法描述图片的细节特征,根据欧式距离计算每张图片的相似度的阈值为[0,+∞),阈值难以精确确定,降低了图片处理的效率。现有技术中对图片的特征进行提取,得到的特征向量维度高,计算复杂度大,图片处理精度低,图片处理效率低。
发明内容
本发明实施例提供一种图片处理方法及装置,可解决现有技术中对图片的特征进行提取得到的特征向量维度高,计算复杂度大,图片处理精度低,图片处理效率低的技术问题。
本发明第一方面提供了一种图片处理方法,可包括:
提取图片的多个特征向量,并将所述图片的多个特征向量映射为拟合向量;
查找所述拟合向量中每个特征向量对应的预设CRC编码,根据所述拟合向量中每个特征向量对应的预设CRC编码生成散列值;
获取预设拟合系数,并根据所述散列值和所述预设拟合系数对所述拟合向量进行加权计算,得到所述图片的加权向量;
将所述图片的加权向量映射为所述图片的签名。
本发明第二方面提供了一种图片处理装置,可包括:
图片特征处理模块,用于提取图片的多个特征向量,并将所述图片的多个特征向量映射为拟合向量;
散列值处理模块,用于查找所述拟合向量中每个特征向量对应的预设CRC编码,根据所述拟合向量中每个特征向量对应的预设CRC编码生成散列值;
加权计算模块,用于获取预设拟合系数,并根据所述散列值和所述预设拟合系数对所述拟合向量进行加权计算,得到所述图片的加权向量;
签名模块,用于将所述图片的加权向量映射为所述图片的签名。
本发明第三方面提供了一种终端,可包括:如上述第二方面所述的装置。
实施本发明实施例,具有如下有益效果:
可提取图片的多个特征向量,并将图片的多个特征向量映射为拟合向量,由拟合向量中每个特征向量对应的预设CRC编码生成散列值,从而可根据散列值和预设拟合系数对拟合向量进行加权计算得到图片的加权向量,将图片的加权向量映射为图片的签名。采用本发明实施例,可提高图片处理精度,可降低特征向量的维度,从而简化了计算复杂度,提高了图片处理效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种图片处理方法的流程示意图;
图2是本发明实施例提供的图片处理方法的具体示意图;
图3是本发明实施例提供的一种图片处理装置的结构示意图;
图4是本发明实施例提供的图片特征处理模块的结构示意图;
图5是本发明实施例提供的散列值处理模块的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中,一种图片处理装置可以为:个人电脑、服务器等终端,也可以通过终端中的客户端模块实现,例如:图片处理客户端、广告图片处理客户端等。
本发明实施例中,可对训练样本进行分类训练以构建特征分析模型,再将需要处理的图片输入到特征分析模型中,输出图片的特征向量,从而提取到图片的特征向量。进一步,将图片的多个特征向量映射为拟合向量,由拟合向量中每个特征向量对应的预设CRC(Cyclic Redundancy Check,循环冗余校验)编码生成散列值,从而可根据散列值和预设拟合系数对拟合向量进行加权计算得到图片的加权向量,将图片的加权向量映射为图片的签名。具体实现中,本发明实施例可以应用于互联网平台的广告系统的广告图片处理方案中,在得到每张广告图片的签名时,可通过对比多张广告图片的签名确定该多张图片的相似度,还可以通过广告图片的签名进行索引或者用于广告特征的表达等等。
下面将结合附图1,对本发明实施例提供的图片处理方法进行详细介绍。
请参见图1,为本发明实施例提供了一种图片处理方法的流程示意图,该方法可以包括以下步骤:S101~S104。
S101,提取图片的多个特征向量,并将图片的多个特征向量映射为拟合向量。
作为一种可选的实施方式,本发明实施例中提取图片的多个特征向量,其中,多个特征向量包括但不局限于:图片细节特征向量、色彩特征向量和纹理特征向量,还可以包括其他图片的特征向量,具体不受本发明实施例的限制。
作为一种可选的实施方式,图片细节特征向量具体可以描述图片局部特征,则提取图片的特征向量具体可以包括:
提取图片的SIFT(scale-invariant feature transform,尺度不变特征转换)特征点,对图片的SIFT特征点进行数据聚类,确定每个SIFT特征点所属的预设类别,统计图片中所述预设类别的频率,由统计得到的图片中所述预设类别的频率生成图片的图片细节特征序列,将图片细节特征序列映射为图片的图片细节特征向量。
具体实现中,图片细节特征向量可通过预先建立的特征分析模型进行提取。具体的,特征分析模型的建立过程可以为:通过尺度不变特征转换算法对训练样本进行图片的SIFT特征点的提取,通过聚类算法对提取到特征点进行分类,不同数目的聚类簇对应不同的训练模型,由测试样本对训练模型的准确率进行测试,将准确率最高的训练模型确定为特征分析模型。
聚类算法例如K-Means算法,K-Means算法可合并词义相近的视觉词汇,构造一个包含K个词汇的视觉词表,K为大于0的正整数。其中,在BOW模型中,假定对于一个文档,忽略它的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合,文档中每个单词的出现都是独立的,不依赖于其它单词是否出现,则文档中任意一个位置出现的任何单词,都不受该文档语意影响而独立选择的。
在K-Means算法中,可将图片设为由至少一个“视觉词汇”组成的集合,且视觉词汇之间没有顺序,对于同一类目标的不同实例之间存在共同的部位特征,将不同实例之间共同的部位特征提取出来,作为识别这一类目标的视觉词汇包,再将相似的特征聚为一个簇(也称为词典包或vocabulary)中,在同一个词典包中的视觉词汇,都可以用该词典包编号来表示,最终将一幅图片中的所有特征点表示为一序列用词典包编号描述的特征向量。本发明实施例中,每个SIFT特征点所属的预设类别包括:词典包编号。
本发明实施例中,通过SIFT算法对预设数量的训练样本进行图片的SIFT特征点的提取,即提取图片的视觉词汇,其中,预设数量例如50000,训练样本例如广告系统中的广告图片。在SIFT算法中,每个特征点可以通过特征点周围区域4*4区域范围的像素的8个方向进行描述,对每个特征点可得到4*4*8=128维的特征点向量,可用于表示该特征点的梯度幅值与梯度方向。提取图片的SIFT特征点后,再汇总所有提取到的特征点,构成128维的特征点向量,并计算该128维特征点向量的余弦相似度,将计算结果作为K-Means算法的输入,通过K-Means算法,构造一个包含K个词汇的视觉词表:SIFT-vocabulary,得到训练模型,其中,K为聚类簇的数目,K值大小具体不受本发明实施例的限制。例如,对训练模型,可分别选取K=50,K=300,k=600,k=1200共四组对测试样本进行测试,测试结果中K=50时准确率最高,则将准确率最高的训练模型即K=50时对应的训练模型确定为特征分析模型。
进一步的,可通过确定的特征分析模型对图片进行分析处理,具体的,提取图片的SIFT特征点,对图片的SIFT特征点进行数据聚类,确定每个SIFT特征点所属的预设类别,则可通过特征分析模型1得到该图片的每个SIFT特征点所属的预设类别,再统计图片中预设类别的频率,由统计得到的图片中预设类别的频率生成图片的图片细节特征序列,将图片细节特征序列映射为图片的图片细节征向量。例如,图片中的SIFT特征点所属的预设类别包括:类别1-类别K,统计得到图片中预设类别的频率为<10,0,0,9,70,……,1>,表示类别1出现10次,类别2出现0次,类别3出现0次,……,类别K出现1次,可构造直方图,生成图片的图片细节特征序列,将直方图归一化处理,即将图片细节特征序列映射为图片的图片细节征向量,则可将该图片表示为K维的图片细节征向量。
作为一种可选的实施方式,色彩特征向量可用色彩直方图(Histogram)进行描述,可描述不同色彩在图片中所占的比例,可采用RGB(red,green,blue)色彩空间,每个色彩维度包含256个色彩值,则R、G、B的组合包括:2563=16777216种情况,本发明实施例中,对图片进行颜色量化(color quantization),具体的,将色彩空间划分成若干个小的颜色区间,每个小的颜色区间称为直方图的一个桶(bin),计算图片中的颜色落在每个小的颜色区间内的像素数量,得到颜色直方图。进一步可选的,本发明实施例中,颜色量化的方法为:将颜色空间的各个分量(维度)均匀地进行划分,得到颜色区间,确定该图片的每个颜色区间所属的类别编号,再统计图片中类别编号的频率,由统计得到的图片中类别编号的频率生成图片的图片颜色特征序列,将图片颜色特征序列映射为图片的色彩特征向量。进一步可选的,颜色量化的方法可以通过向量量化、聚类方法或者神经网络方法实现,也可以为其他实现方式,具体不受本发明实施例的限制。例如,可将色彩空间划分为四个bin,分别为:[0,64),[64,128),[128,192),[192,256),分别对应编号:0,1,2,3;标注图片中每个像素点RGB的bin编号序列,如:<0,1,1>,<1,3,0>……;统计图片中bin编号序列出现的次数,构造色彩RGB直方图,生成图片的图片颜色特征序列;将色彩RGB直方图归一化处理,输出直方图归一化后的值序列,即将图片颜色特征序列映射为图片的色彩特征向量,得到色彩特征向量。
作为一种可选的实施方式,纹理特征向量可用LBP(Local Binary Pattern,局部二值模式)纹理算法进行描述,具体的,通过检测窗口在图片中选取图像区域,将检测窗口划分为N×N的小区域(cell);对于每个cell中的一个像素,与相邻的8个像素的灰度值进行比较,若相邻的8个像素中的某个像素的像素值大于cell中的像素值,则该像素点的位置被标记为1,否则为0,则可得到该窗口中心像素点的LBP值,例如,3*3邻域内的8个点则可产生8位二进制数,即得到该窗口中心像素点的LBP值。抽象为公式:
其中,P=8,gc为中心点,gp为邻域点。计算每个cell的直方图,即每个数字(例如十进制数LBP值)出现的频率;对该直方图进行归一化处理,输出直方图归一化后的值序列,即将图片纹理特征序列映射为图片的纹理特征向量,得到纹理特征向量。
作为一种可选的实施方式,可将提取到的图片的多个特征向量映射为拟合向量,其中,拟合向量的维数为多个特征向量的维数之和。多个特征向量包括:图片细节特征向量、色彩特征向量和纹理特征向量,则可将图片表示为三个维度的特征,例如图片细节特征向量为128维,色彩特征向量为4维,纹理特征向量为8维,则拟合向量为140维。
S102,查找拟合向量中每个特征向量对应的预设CRC编码,根据拟合向量中每个特征向量对应的预设CRC编码生成散列值。
作为一种可选的实施方式,查找拟合向量中每个特征向量对应的预设CRC编码,其中,预设CRC编码为由下述式子计算得到:预设CRC编码=CRC[Rands]*(link+1),其中,Rands=i%256,link=i/256,i为每个特征向量对应的预设编号,i为大于0的正整数。
进一步的,根据拟合向量中每个特征向量对应的预设CRC编码生成散列值具体包括:将拟合向量中每个特征向量对应的预设CRC编码转换为二进制序列;由BKDR算法对二进制序列作散列换,得到散列值。
本发明实施例中,在选择hash(哈希)算法进行散列换时,采用包括BKDRhash算法(Brian Kernighan与Dennis Ritchie的《The C Programming Language》一书被展示而得名的一种hash算法)、APHash算法(由Arash Partow发明的一种hash算法)、DJBHash算法(由Daniel J.Bernstein教授发明的一种hash算法)、JSHash算法(由Justin Sobel发明的一种hash算法)、RSHash算法(因Robert Sedgwicks在其《Algorithms in C》一书中展示而得名的一种hash算法)、SDBMHash算法(因在开源项目SDBM(一种简单的数据库引擎)中被应用而得名的一种Hash算法)、PJWHash算法(基于AT&T贝尔实验室的Peter J.Weinberger的论文而发明的一种hash算法)和ELFHash算法(在Unix的Extended Library Function被附带而得名的一种hash算法,是PJW Hash的变形算法)共8种算法进行测试实验,测试实验结果如下表所示,其中,数据1、数据2、数据3以及数据4为四组随机字符串数据,数据1、数据2、数据3以及数据4对应列中的数值表示冲突个数,数据1得分、数据2得分、数据3得分以及数据4得分对应列中的a数值越高表示hash函数的冲突率越低,效果越好。由下表可知8种算法中BKDRhash算法的平均分最高,则hash函数的冲突率最低,效果最好,因此,本发明实施例采用BKDR算法进行散列换,从而得到散列值。
S103,获取预设拟合系数,并根据散列值和预设拟合系数对拟合向量进行加权计算,得到图片的加权向量。
作为一种可选的实施方式,预设拟合系数为:对预设数量的训练样本图片通过最小二乘法计算得到的系数,获取预设拟合系数,并根据散列值和预设拟合系数对拟合向量进行加权计算,得到图片的加权向量。例如,可选取10000张通过人工筛选后的相似图片作为训练样本,通过最小二乘法,得到拟合系数α、β和γ,通过下述加权计算式子可以进行加权计算,计算结果为图片的加权向量,则加权计算式子可以为:
其中,Wsift-i为图片细节特征向量,WHIS-i为色彩特征向量,Wtexture-i为纹理特征向量。设加权向量为Q,散列值为C位,i值范围为[1,C],若散列值的第i位为1,则Q的第i个元素加上该特征的权重,若散列值的第i位不为1,则Q的第i个元素减去该特征的权重。计算方法例如,α=2、β=1、γ=3,散列值为(1,-1,1),Wsift-i为(-2,0,1),WHIS-i为(2,-1,1),Wtexture-i为(0,1,-2),则Q为2(-2,0,1)+1(2,-1,1)+3(0,1,-2),即(2*(-2)+1*2+3*0,(-2)*0-1*(-1)-3*(-1),2*1+1*1+3*(-2)),则Q为(-2,4,-3)。
S104,将图片的加权向量映射为图片的签名。
作为一种可选的实施方式,对于图片的加权向量,如果第i个元素大于0,则对应图片的签名的第i位映射为1,否则,映射为0。例如,图片的加权向量Q为(-2,4,-3)时,第一位小于0,第二位大于0,第三位小于0,则图片的签名为(0,1,0)。
进一步可选的,本发明实施例提供的图片处理方法在步骤S102之前,还可以包括步骤:
获取每个特征向量对应的预设编号i,i为大于0的正整数,由下述式子计算得到特征向量对应的预设CRC编码:预设CRC编码=CRC[Rands]*(link+1),其中,Rands=i%256,link=i/256。
具体实现中,CRC的基本原理是:在K位信息码后再拼接R位的校验码,整个编码长度为N位。CRC校验码为256个独立的32位整数,每次为编号为I的特征向量分配一个独立的CRC编码,预设CRC编码的分配由上述式子计算得到,其中,i每个特征向量对应的预设编号,对于相同的特征向量具备相同的编号。
进一步可选的,本发明实施例提供的图片处理方法在步骤S104之后,还可以包括步骤:
通过比较多个图片的签名的汉明距离确定多个图片的相似度。
具体实现中,可在线计算每张图片的签名,并比较多个图片的签名的汉明距离以确定多个图片的相似度,其中,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。例如,如果两张图片的签名的汉明距离为0~2,则确定为相似图片。
现有技术中,通过传统的hash算法计算得到一个C位的散列值,并计算得到签名,传统hash算法将原始内容尽量均匀随机地映射为一个签名。两张图片通过传统hash算法产生两个签名,如果两个签名相等,说明两张图片相同;如果不相等,除了说明两张图片不相等外,不再提供任何信息,则即使原始内容(两张图片)只相差一个像素,通过传统hash算法所产生的签名也很大差别。
本发明实施例中,如图2所示,为本发明实施例提供的图片处理方法的具体示意图,201为离线建立特征分析模型的过程,2011为训练样本和测试样本,2012为算法处理,包括SIFT算法和聚类算法,2013为确定的特征分析模型。202为提取多个特征向量的过程,2021为提取色彩特征向量,2022为提取图片细节特征向量,2023为提取纹理特征向量,其中,2022与201连接。203为欲处理的图片。204为图片的签名的处理过程,2041为将图片的多个特征向量映射为拟合向量,2042为生成散列值从而进行计算得到加权向量的过程,2043为将图片的加权向量映射为图片的签名,2044为图片的签名的应用,即图片的签名可应用于:图片相似度、图片检索或图片聚类等。
本发明实施例中,通过查找拟合向量中每个特征向量对应的预设CRC编码,根据拟合向量中每个特征向量对应的预设CRC编码生成散列值,根据散列值和预设拟合系数对拟合向量进行加权计算,得到图片的加权向量,再映射为图片的签名。通过本发明实施例,可将高维的特征向量转换为低维进行处理,并输出低维度的图片的签名。本发明实施例中,提取图片的多个特征向量,输出的图片的签名,维度低,数据量小,可减少系统的延迟。
本发明实施例提供一种图片处理方法,可提取图片的多个特征向量,并将图片的多个特征向量映射为拟合向量,由拟合向量中每个特征向量对应的预设CRC编码生成散列值,从而可根据散列值和预设拟合系数对拟合向量进行加权计算得到图片的加权向量,将图片的加权向量映射为图片的签名。采用本发明实施例,可提高图片处理精度,可降低特征向量的维度,从而简化了计算复杂度,提高了图片处理效率。
下面将结合附图3~附图5,对本发明实施例提供的图片处理装置进行详细介绍。需要说明的是,附图3~附图5任一所示的装置,用于执行本发明图1所示实施例的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明图1所示的实施例。
请参见图3,为本发明实施例提供了一种图片处理装置的结构示意图。如图3所示,本发明实施例的图片处理装置可包括:图片特征处理模块301、散列值处理模块302、加权计算模块303以及签名模块304。
图片特征处理模块301,用于提取图片的多个特征向量,并将图片的多个特征向量映射为拟合向量。
作为一种可选的实施方式,本发明实施例中提取图片的多个特征向量,其中,多个特征向量包括但不局限于:图片细节特征向量、色彩特征向量和纹理特征向量,还可以包括其他图片的特征向量,具体不受本发明实施例的限制。
作为一种可选的实施方式,如图4所示,本发明实施例提供的图片特征处理模块301具体还可以包括:特征提取单元401、分类单元402、序列生成单元403以及映射单元404。
特征提取单元401,用于提取图片的SIFT特征点。
分类单元402,用于对图片的SIFT特征点进行数据聚类,确定每个SIFT特征点所属的预设类别。
序列生成单元403,用于统计图片中预设类别的频率,由统计得到的图片中预设类别的频率生成图片的图片细节特征序列。
映射单元404,用于将图片细节特征序列映射为图片的图片细节特征向量。
具体实现中,图片细节特征向量可通过预先建立的特征分析模型进行提取。特征分析模型的建立过程参见图1所示的实施例,在此不再详述。具体的,特征提取单元401提取图片的SIFT特征点,分类单元402对图片的SIFT特征点进行数据聚类,确定每个SIFT特征点所属的预设类别,则可通过特征分析模型得到该图片的每个SIFT特征点所属的预设类别,序列生成单元403可统计图片中预设类别的频率,由统计得到的图片中预设类别的频率生成图片的图片细节特征序列,映射单元404可将图片细节特征序列映射为图片的图片细节征向量。例如,图片中的SIFT特征点所属的预设类别包括:类别1-类别K,统计得到图片中预设类别的频率为<10,0,0,9,70,……,1>,表示类别1出现10次,类别2出现0次,类别3出现0次,……,类别K出现1次,可构造直方图,生成图片的图片细节特征序列,将直方图归一化处理,即将图片细节特征序列映射为图片的图片细节征向量,则可将该图片表示为K维的图片细节征向量。
作为一种可选的实施方式,特征提取单元401,还用于提取图片的颜色区间。
分类单元402,用于确定图片的每个颜色区间所属的类别编号。
序列生成单元403,用于统计图片中类别编号的频率,由统计得到的图片中类别编号的频率生成图片的图片颜色特征序列。
映射单元404,用于将图片颜色特征序列映射为图片的色彩特征向量。
具体实现中,色彩特征向量可用色彩直方图进行描述,可对图片进行颜色量化:将颜色空间的各个分量(维度)均匀地进行划分,得到颜色区间,确定该图片的每个颜色区间所属的类别编号,再统计图片中类别编号的频率,由统计得到的图片中类别编号的频率生成图片的图片颜色特征序列,将图片颜色特征序列映射为图片的色彩特征向量。进一步可选的,颜色量化的方法可以通过向量量化、聚类方法或者神经网络方法实现,也可以为其他实现方式,具体不受本发明实施例的限制。例如,可将色彩空间划分为四个bin,分别为:[0,64),[64,128),[128,192),[192,256),分别对应编号:0,1,2,3;标注图片中每个像素点RGB的bin编号序列,如:<0,1,1>,<1,3,0>……;统计图片中bin编号序列出现的次数,构造色彩RGB直方图,生成图片的图片颜色特征序列;将色彩RGB直方图归一化处理,输出直方图归一化后的值序列,即将图片颜色特征序列映射为图片的色彩特征向量,得到色彩特征向量。
作为一种可选的实施方式,特征提取单元401,还用于提取图片的像素区间。
分类单元402,用于确定图片的每个像素区间所属的LBP值。
序列生成单元403,用于统计图片中每个LPB值的频率,由统计得到的每个LPB值的频率生成图片的图片纹理特征序列。
映射单元404,用于将图片纹理特征序列映射为图片的纹理特征向量。
具体实现中,纹理特征向量可用LBP纹理算法进行描述,具体的,通过检测窗口在图片中选取图像区域,将检测窗口划分为N×N的小区域(cell);对于每个cell中的一个像素,与相邻的8个像素的灰度值进行比较,若相邻的8个像素中的某个像素的像素值大于cell中的像素值,则该像素点的位置被标记为1,否则为0,则可得到该窗口中心像素点的LBP值,例如,3*3邻域内的8个点则可产生8位二进制数,即得到该窗口中心像素点的LBP值。抽象为公式:
其中,P=8,gc为中心点,gp为邻域点。计算每个cell的直方图,即每个数字(例如十进制数LBP值)出现的频率;对该直方图进行归一化处理,输出直方图归一化后的值序列,即将图片纹理特征序列映射为图片的纹理特征向量,得到纹理特征向量。
作为一种可选的实施方式,图片特征处理模块301可将提取到的图片的多个特征向量映射为拟合向量,其中,拟合向量的维数为多个特征向量的维数之和。多个特征向量包括:图片细节特征向量、色彩特征向量和纹理特征向量,则可将图片表示为三个维度的特征,例如图片细节特征向量为128维,色彩特征向量为4维,纹理特征向量为8维,则拟合向量为140维。
散列值处理模块302,用于查找拟合向量中每个特征向量对应的预设CRC编码,根据拟合向量中每个特征向量对应的预设CRC编码生成散列值。
作为一种可选的实施方式,预设CRC编码参见编码计算模块305。散列值处理模块302可查找拟合向量中每个特征向量对应的预设CRC编码,从而根据拟合向量中每个特征向量对应的预设CRC编码生成散列值。
进一步可选的,如图5所示,本发明实施例提供的散列值处理模块302具体还可以包括:转换单元501和散列值计算单元502。
转换单元501,用于将拟合向量中每个特征向量对应的预设CRC编码转换为二进制序列。
散列值计算单元502,用于由BKDR算法对二进制序列作散列换,得到散列值。
具体实现中,转换单元501将拟合向量中每个特征向量对应的预设CRC编码转换为二进制序列,散列值计算单元502通过BKDR算法对二进制序列作散列换,从而得到散列值。本发明实施例中,在选择算法进行散列换时,采用包括BKDRhash算法、APHash算法、DJBHash算法、JSHash算法、RSHash算法、SDBMHash算法、PJWHash算法和ELFHash算法共8种算法进行测试实验,又测试实验结果选择BKDR算法进行散列换,测试实验结果比对参见图1所示实施例描述,在此不再详述。
加权计算模块303,用于获取预设拟合系数,并根据散列值和预设拟合系数对拟合向量进行加权计算,得到图片的加权向量。
作为一种可选的实施方式,预设拟合系数为:对预设数量的训练样本图片通过最小二乘法计算得到的系数,加权计算模块303可获取预设拟合系数,并根据散列值和预设拟合系数对拟合向量进行加权计算,得到图片的加权向量。例如,可选取10000张通过人工筛选后的相似图片作为训练样本,通过最小二乘法,得到拟合系数α、β和γ,通过下述加权计算式子可以进行加权计算,计算结果为图片的加权向量,则加权计算式子可以为:
其中,Wsift-i为图片细节特征向量,WHIS-i为色彩特征向量,Wtexture-i为纹理特征向量。设加权向量为Q,散列值为C位,i值范围为[1,C],若散列值的第i位为1,则Q的第i个元素加上该特征的权重,若散列值的第i位不为1,则Q的第i个元素减去该特征的权重。
签名模块304,用于将图片的加权向量映射为图片的签名。
作为一种可选的实施方式,对于图片的加权向量,如果第i个元素大于0,则对应图片的签名的第i位映射为1,否则,映射为0。例如,图片的加权向量Q为(-2,4,-3)时,第一位小于0,第二位大于0,第三位小于0,则图片的签名为(0,1,0)。
进一步可选的,本发明实施例提供的图片处理装置还可以包括:编码计算模块305。
编码计算模块305,用于获取每个特征向量对应的预设编号i,i为大于0的正整数,由下述式子计算得到特征向量对应的预设CRC编码:预设CRC编码=CRC[Rands]*(link+1),其中,Rands=i%256,link=i/256。
具体实现中,CRC的基本原理是:在K位信息码后再拼接R位的校验码,整个编码长度为N位。CRC校验码为256个独立的32位整数,每次为编号为I的特征向量分配一个独立的CRC编码,预设CRC编码的分配由上述式子计算得到,其中,i每个特征向量对应的预设编号,对于相同的特征向量具备相同的编号。
进一步可选的,本发明实施例提供的图片处理装置还可以包括:确定模块306。
确定模块306,用于通过比较多个图片的签名的汉明距离确定多个图片的相似度。
具体实现中,可在线计算每张图片的签名,并比较多个图片的签名的汉明距离以确定多个图片的相似度,其中,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。例如,如果两张图片的签名的汉明距离为0~2,则确定为相似图片。
现有技术中,通过传统的hash算法计算得到一个C位的散列值,并计算得到签名,传统hash算法将原始内容尽量均匀随机地映射为一个签名。两张图片通过传统hash算法产生两个签名,如果两个签名相等,说明两张图片相同;如果不相等,除了说明两张图片不相等外,不再提供任何信息,则即使原始内容(两张图片)只相差一个像素,通过传统hash算法所产生的签名也很大差别。
本发明实施例中,通过查找拟合向量中每个特征向量对应的预设CRC编码,根据拟合向量中每个特征向量对应的预设CRC编码生成散列值,根据散列值和预设拟合系数对拟合向量进行加权计算,得到图片的加权向量,再映射为图片的签名。通过本发明实施例,可将高维的特征向量转换为低维进行处理,并输出低维度的图片的签名。本发明实施例中,提取图片的多个特征向量,输出的图片的签名,维度低,数据量小,可减少系统的延迟。
本发明实施例提供一种图片处理装置,图片特征处理模块可提取图片的多个特征向量,并将图片的多个特征向量映射为拟合向量,散列值处理模块可由拟合向量中每个特征向量对应的预设CRC编码生成散列值,加权计算模块可根据散列值和预设拟合系数对拟合向量进行加权计算得到图片的加权向量,签名模块可将图片的加权向量映射为图片的签名。采用本发明实施例,可提高图片处理精度,可降低特征向量的维度,从而简化了计算复杂度,提高了图片处理效率。
本发明实施例还公开了一种终端,包括图3~图5任一所示的装置.本发明实施例提供的终端可以为个人电脑、服务器等终端设备。该装置的结构和功能可参见图3~图5任一所示实施例的相关描述,在此不赘述。需要说明的是,本实施例的终端可应用于上述方法中。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (15)

1.一种图片处理方法,其特征在于,所述方法包括:
提取图片的多个特征向量,并将所述图片的多个特征向量映射为拟合向量;所述多个特征向量包括:图片细节特征向量、色彩特征向量和纹理特征向量;所述图片细节特征向量是由在所述图片中所统计到的SIFT特征点所属预设类别的频率而确定的;所述色彩特征向量是由在所述图片中所统计到的颜色区间所属类别编号的频率而确定的;所述纹理特征向量是由检测窗口中中心像素点的LBP值出现的频率而确定的;
查找所述拟合向量中每个特征向量对应的预设循环冗余校验CRC编码,根据所述拟合向量中每个特征向量对应的预设CRC编码生成散列值;
获取预设拟合系数,并根据所述散列值和所述预设拟合系数对所述拟合向量进行加权计算,得到所述图片的加权向量;
将所述图片的加权向量映射为所述图片的签名。
2.如权利要求1所述的方法,其特征在于,所述根据所述拟合向量中每个特征向量对应的预设CRC编码生成散列值,包括:
将所述拟合向量中每个特征向量对应的预设CRC编码转换为二进制序列;
由BKDR算法对所述二进制序列作散列变换,得到所述散列值。
3.如权利要求1所述的方法,其特征在于,所述提取图片的特征向量包括:
提取所述图片的SIFT特征点,对所述图片的SIFT特征点进行数据聚类,确定每个SIFT特征点所属的预设类别,统计所述图片中所述预设类别的频率,由所述统计得到的所述图片中所述预设类别的频率生成所述图片的图片细节特征序列,将所述图片细节特征序列映射为所述图片的图片细节特征向量。
4.如权利要求1所述的方法,其特征在于,所述查找所述拟合向量中的每个特征向量对应的预设CRC编码之前,包括:
获取每个特征向量对应的预设编号i,i为大于0的正整数,由下述式子计算得到所述特征向量对应的预设CRC编码:预设CRC编码=CRC[Rands]*(link+1),其中,Rands=i%256,link=i/256,所述预设CRC编码的原理是在K位信息码后再拼接R位的校验码之后所得到的整个编码长度为N位的CRC编码;其中,CRC校验码为256个独立的32位整数,其中,K、R、N均为大于0的正整数。
5.如权利要求1所述的方法,其特征在于,所述拟合向量的维数为所述多个特征向量的维数之和;所述加权向量的维数与所述特征向量的数目一致。
6.如权利要求1所述的方法,其特征在于,所述预设拟合系数为:对预设数量的训练样本图片通过最小二乘法计算得到的系数。
7.如权利要求1~6任一所述的方法,其特征在于,所述将所述图片的加权向量映射为所述图片的签名之后,包括:
通过比较多个所述图片的签名的汉明距离确定所述多个图片的相似度。
8.一种图片处理装置,其特征在于,所述装置包括:
图片特征处理模块,用于提取图片的多个特征向量,并将所述图片的多个特征向量映射为拟合向量;所述多个特征向量包括:图片细节特征向量、色彩特征向量和纹理特征向量;所述图片细节特征向量是由在所述图片中所统计到的SIFT特征点所属预设类别的频率而确定的;所述色彩特征向量是由在所述图片中所统计到的颜色区间所属类别编号的频率而确定的;所述纹理特征向量是由检测窗口中中心像素点的LBP值出现的频率而确定的;
散列值处理模块,用于查找所述拟合向量中每个特征向量对应的预设CRC编码,根据所述拟合向量中每个特征向量对应的预设CRC编码生成散列值;
加权计算模块,用于获取预设拟合系数,并根据所述散列值和所述预设拟合系数对所述拟合向量进行加权计算,得到所述图片的加权向量;
签名模块,用于将所述图片的加权向量映射为所述图片的签名。
9.如权利要求8所述的装置,其特征在于,所述散列值处理模块包括:
转换单元,用于将所述拟合向量中每个特征向量对应的预设CRC编码转换为二进制序列;
散列值计算单元,用于由BKDR算法对所述二进制序列作散列变换,得到所述散列值。
10.如权利要求8所述的装置,其特征在于,所述图片特征处理模块包括:
特征提取单元,用于提取所述图片的SIFT特征点;
分类单元,用于对所述图片的SIFT特征点进行数据聚类,确定每个SIFT特征点所属的预设类别;
序列生成单元,用于统计所述图片中所述预设类别的频率,由所述统计得到的所述图片中所述预设类别的频率生成所述图片的图片细节特征序列;
映射单元,用于将所述图片细节特征序列映射为所述图片的图片细节特征向量。
11.如权利要求8所述的装置,其特征在于,所述装置还包括:
编码计算模块,用于获取每个特征向量对应的预设编号i,i为大于0的正整数,由下述式子计算得到所述特征向量对应的预设CRC编码:预设CRC编码=CRC[Rands]*(link+1),其中,Rands=i%256,link=i/256,所述预设CRC编码的原理是在K位信息码后再拼接R位的校验码之后所得到的整个编码长度为N位的CRC编码;其中,CRC校验码为256个独立的32位整数,其中,K、R、N均为大于0的正整数。
12.如权利要求8所述的装置,其特征在于,所述拟合向量的维数为所述多个特征向量的维数之和;所述加权向量的维数与所述特征向量的数目一致。
13.如权利要求8所述的装置,其特征在于,所述预设拟合系数为:对预设数量的训练样本图片通过最小二乘法计算得到的系数。
14.如权利要求8~13任一所述的装置,其特征在于,所述装置还包括:
确定模块,用于通过比较多个所述图片的签名的汉明距离确定所述多个图片的相似度。
15.一种终端,其特征在于,包括如权利要求8~14任一所述的装置。
CN201410230512.7A 2014-05-28 2014-05-28 一种图片处理方法及装置 Active CN105205487B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410230512.7A CN105205487B (zh) 2014-05-28 2014-05-28 一种图片处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410230512.7A CN105205487B (zh) 2014-05-28 2014-05-28 一种图片处理方法及装置

Publications (2)

Publication Number Publication Date
CN105205487A CN105205487A (zh) 2015-12-30
CN105205487B true CN105205487B (zh) 2019-08-23

Family

ID=54953159

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410230512.7A Active CN105205487B (zh) 2014-05-28 2014-05-28 一种图片处理方法及装置

Country Status (1)

Country Link
CN (1) CN105205487B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107123079A (zh) * 2016-02-24 2017-09-01 掌赢信息科技(上海)有限公司 一种表情迁移方法和电子设备
CN106780962B (zh) * 2016-11-10 2019-04-12 深圳怡化电脑股份有限公司 一种纸币鉴伪的方法及装置
CN108830279B (zh) * 2018-04-03 2021-12-31 南昌奇眸科技有限公司 一种图像特征提取与匹配方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101281598A (zh) * 2008-05-23 2008-10-08 清华大学 基于多部件多特征融合的人脸识别方法
CN102067511A (zh) * 2008-06-16 2011-05-18 高通股份有限公司 用于生成散列助记符的方法和装置
CN102215223A (zh) * 2011-05-20 2011-10-12 北京工业大学 一种基于人脸特征的模糊保险箱远程身份认证方法
CN102510330A (zh) * 2011-11-02 2012-06-20 杭州电子科技大学 一种基于指纹特征数据与匹配算法的新型模糊金库方法
CN102880854A (zh) * 2012-08-16 2013-01-16 北京理工大学 基于分布式和哈希映射的室外海量物体识别方法和系统
CN102955784A (zh) * 2011-08-19 2013-03-06 北京百度网讯科技有限公司 一种基于数字签名对多个图像进行相似判断的设备和方法
CN103778415A (zh) * 2014-01-21 2014-05-07 蔺全录 矿井人员虹膜考勤与跟踪定位方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005521173A (ja) * 2002-03-27 2005-07-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ディジタル・オブジェクトにディジタル署名によって透かしを入れる方法及び装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101281598A (zh) * 2008-05-23 2008-10-08 清华大学 基于多部件多特征融合的人脸识别方法
CN102067511A (zh) * 2008-06-16 2011-05-18 高通股份有限公司 用于生成散列助记符的方法和装置
CN102215223A (zh) * 2011-05-20 2011-10-12 北京工业大学 一种基于人脸特征的模糊保险箱远程身份认证方法
CN102955784A (zh) * 2011-08-19 2013-03-06 北京百度网讯科技有限公司 一种基于数字签名对多个图像进行相似判断的设备和方法
CN102510330A (zh) * 2011-11-02 2012-06-20 杭州电子科技大学 一种基于指纹特征数据与匹配算法的新型模糊金库方法
CN102880854A (zh) * 2012-08-16 2013-01-16 北京理工大学 基于分布式和哈希映射的室外海量物体识别方法和系统
CN103778415A (zh) * 2014-01-21 2014-05-07 蔺全录 矿井人员虹膜考勤与跟踪定位方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
An Iris Cryptosystem for Information Security;Xiangqian Wu 等;《International Conference on Intelligent Information Hiding and Multimedia Signal Processing》;20080817;1533-1536
Query-Adaptive Image Search With Hash Codes;Yu-Gang Jiang 等;《IEEE TRANSACTIONS ON MULTIMEDIA》;20130228;第15卷(第2期);442-453
基于模糊保险箱的人耳生物特征模板保护方法;袁立 等;《中南大学学报(自然科学版)》;20110930;第42卷(第增1期);778-783
基于特征降维的场景分类方法研究;付赛男;《中国优秀硕士学位论文全文数据库信息科技辑》;20130715;第2013年卷(第7期);第3.2.2节,第4.3.2节,图4-3

Also Published As

Publication number Publication date
CN105205487A (zh) 2015-12-30

Similar Documents

Publication Publication Date Title
Kabbai et al. Image classification by combining local and global features
US10013636B2 (en) Image object category recognition method and device
Avila et al. Bossa: Extended bow formalism for image classification
Yi et al. Feature representations for scene text character recognition: A comparative study
CN110717554B (zh) 图像识别方法、电子设备及存储介质
CN111198959A (zh) 一种基于卷积神经网络的两阶段图像检索方法
CN103020265B (zh) 图像检索的方法和系统
Uricchio et al. Fisher encoded convolutional bag-of-windows for efficient image retrieval and social image tagging
CN102385592B (zh) 图像概念的检测方法和装置
CN115937655B (zh) 多阶特征交互的目标检测模型及其构建方法、装置及应用
CN104281572B (zh) 一种基于互信息的目标匹配方法及其系统
CN111444765B (zh) 图像重识别方法及相关模型的训练方法及相关装置、设备
CN105989001B (zh) 图像搜索方法及装置、图像搜索系统
CN104112018A (zh) 一种大规模图像检索方法
Kalyoncu et al. GTCLC: leaf classification method using multiple descriptors
Wang et al. Spatial weighting for bag-of-features based image retrieval
Douik et al. Content based image retrieval using local and global features descriptor
WO2015146113A1 (ja) 識別辞書学習システム、識別辞書学習方法および記録媒体
CN105654054A (zh) 基于半监督近邻传播学习和多视觉词典模型的智能视频分析方法
Zhu et al. A modified deep neural network enables identification of foliage under complex background
CN105205487B (zh) 一种图片处理方法及装置
CN104143088B (zh) 一种基于图像检索和特征权重学习的人脸识别方法
CN103440292B (zh) 基于比特向量的多媒体信息检索方法和系统
JP6042778B2 (ja) 画像に基づくバイナリ局所特徴ベクトルを用いた検索装置、システム、プログラム及び方法
Sadique et al. Content-based image retrieval using color layout descriptor, gray-level co-occurrence matrix and k-nearest neighbors

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant