CN108334642A - 一种相似头像检索系统 - Google Patents
一种相似头像检索系统 Download PDFInfo
- Publication number
- CN108334642A CN108334642A CN201810245327.3A CN201810245327A CN108334642A CN 108334642 A CN108334642 A CN 108334642A CN 201810245327 A CN201810245327 A CN 201810245327A CN 108334642 A CN108334642 A CN 108334642A
- Authority
- CN
- China
- Prior art keywords
- image
- head portrait
- module
- similar
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- General Engineering & Computer Science (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种相似头像检索系统,包括图像上传模块,用于上传头像图片;图像获取模块,用于获取头像图片中某一范围内的图像;图像编码模块,用于将获取的图像编码成文本;图像检索模块,用于从文本中检索出相似的图像文本;头像人脸检测模块,用于从图像中提取人脸;结果显示模块,用于显示某一范围与上传的头像图片相似的用户ID。本发明能够快速的检测出相似的头像。
Description
技术领域
本发明涉及图像检索技术领域,特别是涉及一种相似头像检索系统。
背景技术
目前,图像检索技术在科研领域做得较好的国外知名高校有伊利诺斯大学,其提出的多媒体分析与检索系统(MultimediaAnalysis and Retrieval System,简称为MARS)对图像检索的发展提供方向。国内有清华大学基于彩色图像的导航检索系统,浙江大学计算机系的基于颜色的Photo Navigator和基于形状的Photo Engine的检索系统等,这些研究对图像检索技术的发展都具有指导性的意义。在商业领域,国外有Google,Tineye,Picitup等研究图像检索技术的商业公司,国内也有百度、阿里巴巴等著名企业在对其商用进行不懈的探索与努力。
随着图像检索技术的应用与发展,它的算法也层出不穷。学者将基于内容的图像检索算法分为基于颜色特征的图像检索算法、基于纹理特征的图像检索算法及基于形状特征的图像检索算法等几种。
(1)基于颜色特征的图像检索算法
彩色图像是基于颜色特征图像检索算法的研究对象,分析图像的颜色特征及颜色直方图。Zhao等人讨论了在不同的颜色空间以及采用不同的距离度量公式的情况下,对颜色直方图的性能进行评估,进而提出了一种先在不同的颜色空间中提取每幅图像颜色直方图,再用距离度量公式进行相似性测量的算法,该文的研究结果可以为选择颜色空间和距离度量公式提供参考性的意见Liu等人提出了一种新的表示图像颜色特征的方法,即颜色差分直方图(Color Difference Histograms,简称为CDH),它更注重颜色、边缘方向和感知颜色差异等特征,仿真结果表明,该算法具有较好的检索性能。
(2)基于纹理特征的图像检索算法
灰度图像是基于纹理特征图像检索算法的研究对象,纹理特征的描述方法多种多样。在实际的研究中,学者们通常采用结合多种描述方法的算法,使提取的纹理特征更有效。Aiadi等人对韦伯局部描述符(Weber Local Descriptor),简称为W LD、局部二值模式(Local BinaryPattern,简称为LB)和灰度共生矩阵(Gray-Level Co-occurrence Matrix,简称为GLCM)这三种常用的纹理特征进行研究,从查全率、查准率以及检索时间上作比较,实验结果表明,WLD算法的性能略好于其他算法。Zand等人研究了Gabo:小波和曲波特征这两种纹理特征模型,提出了采用Gabor小波和曲波变换的方法,拟合编码子带的信息多项式系数来创建纹理特征向量,实验结果表明,该算法的有效性更好。
发明内容
本发明所要解决的技术问题是提供一种相似头像检索系统,能够快速的检测出相似的头像。
本发明解决其技术问题所采用的技术方案是:提供一种相似头像检索系统,包括图像上传模块,用于上传头像图片;图像获取模块,用于获取头像图片中某一范围内的图像;图像编码模块,用于将获取的图像编码成文本;图像检索模块,用于从文本中检索出相似的图像文本;头像人脸检测模块,用于从图像中提取人脸;结果显示模块,用于显示某一范围与上传的头像图片相似的用户ID。
所述图像获取模块采用python中解析网页的库函数urllib对头像图片的url解码并保存。
所述头像人脸提取模块通过opencv中Haar特征的人脸检测,首先加载训练好的Harr文件,输入对应的头像图片,将其灰度化后,调用Harr文件输出人脸图像的位置。
所述图像检索模块使用汉明距离来检索生成文本中与输入图像相似的图像。
所述图像编码模块使用感知哈希算法将图像转化为文本内容。
有益效果
由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明增加了对图像检索及人脸提取功能。本发明操作简单,方便部署;本系统可以应用到头像推荐领域,可以大大的减少图片检索的时间。
附图说明
图1是本发明的系统方框图;
图2是本发明的内部结构图;
图3和图4是本发明的识别结果图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明的实施方式涉及一种相似头像检索系统,如图1所示,包括图像上传模块,用于上传头像图片;图像获取模块,用于获取头像图片中某一范围内的图像;图像编码模块,用于将获取的图像编码成文本;图像检索模块,用于从文本中检索出相似的图像文本;头像人脸检测模块,用于从图像中提取人脸;结果显示模块,用于显示某一范围与上传的头像图片相似的用户ID。本发明能够快速的显示与所输入的头像相似的ID号。
下面以QQ为例进一步说明本发明。
本实施例主要用到的python中解析网页的库函数urllib,通过下面网址可以获取任意qq的头像:'http://q1.qlogo.cn/g?b=qq&nk='+str(qq号码)+'&s=100'。并利用urllib解析网址并保存qq头像。
本实施例直接用urllib.request模块的urlopen获取页面,获取到的数据格式为bytes类型,需要decode解码,转换成图片类型。
如图2所示,以感知哈希算法将图片编码为文本值。
感知哈希算法是一类算法的总称,包括aHash、pHash、dHash。顾名思义,感知哈希不是以严格的方式计算Hash值,而是以更加相对的方式计算哈希值,因为“相似”与否,就是一种相对的判定。下面是介绍dhash计算。
(1)缩放图片。目的是把图片缩放到足够小。缩放的原因是原图的分辨率一般都非常高。一张200*200的图片,就有整整4万个像素点,每一个像素点都保存着一个RGB值,4万个RGB,是相当庞大的信息量,非常多的细节需要处理。因此,本实施例需要把图片缩放到非常小,隐藏它的细节部分,只见森林,不见树木。建议缩放为9*8。
(2)灰度化。dHash全名为差异值hash,通过计算相邻像素之间的颜色强度差异得出。我们缩放后的图片,细节已经被隐藏,信息量已经变少。但是还不够,因为它是彩色的,由RGB值组成。白色表示为(255,255,255),黑色表示为(0,0,0),值越大颜色越亮,越小则越暗。每种颜色都由3个数值组成,也就是红、绿、蓝的值。如果直接使用RGB值对比颜色强度差异,相当复杂,因此本实施方式转化为灰度值——只由一个0到255的整数表示灰度。这样的话就将三维的比较简化为了一维比较。
(3)差异计算。差异值是通过计算每行相邻像素的强度对比得出的。我们的图片为9*8的分辨率,那么就有8行,每行9个像素。差异值是每行分别计算的,也就是第二行的第一个像素不会与第一行的任何像素比较。每一行有9个像素,那么就会产生8个差异值,这也是为何我们选择9作为宽度,因为8bit刚好可以组成一个byte,方便转换为16进制值。如果前一个像素的颜色强度大于第二个像素,那么差异值就设置为True(也就是1),如果不大于第二个像素,就设置为False(也就是0)。
(4)转换为hash值。本实施例将差异值数组中每一个值看做一个bit,每8个bit组成为一个16进制值,将16进制值连接起来转换为字符串,就得出了最后的dHash值。
本实施例中图像检索模块通过dHash值计算两张图片的汉明距离(HammingDistance),通过汉明距离的大小,判断两张图片的相似程度。
本实施例主要用到汉明距离:两个等长字符串s1与s2之间的汉明距离定义为将其中一个变为另外一个所需要作的最小替换次数。例如字符串“1111”与“1001”之间的汉明距离为2,汉明距离越大则说明图片越不一致,反之,汉明距离越小则说明图片越相似,当距离为0时,说明完全相同。(通常认为距离>10就是两张完全不同的图片)。
本实施例中头像人脸检测模块主要用到的是opencv中基于haar特征的人脸检测,该方法用于得到qq图像中人脸的位置。
这里使用的是cv2.CascadeClassifier,这是初始化opencv的CascadeClassification,它的作用就是产生一个检测器,检测的依据全都储存在参数所代表的那个xml文件中,这个xml文件可以在opencv-github中获得,官方提供的还有眼睛,树等其他对象的识别数据,这些数据就是一张一张图像训练出来的。
分类器训练完以后,就可以应用于输入图像中的感兴趣区域(与训练样本相同的尺寸)的检测。检测到目标区域分类器输出为1,否则输出为0。为了检测整副图像,可以在图像中移动搜索窗口,检测每一个位置来确定可能的目标。为了搜索不同大小的目标物体,分类器被设计为可以进行尺寸改变,这样比改变待检图像的尺寸大小更为有效。所以,为了在图像中检测未知大小的目标物体,扫描程序通常需要用不同比例大小的搜索窗口对图片进行几次扫描。
图3和图4是采用本发明实施方式后的识别结果图。
不难发现,本发明增加了对qq图像检索及qq人脸提取功能。本发明操作简单,方便部署;本系统可以应用到头像推荐领域,可以大大的减少图片检索的时间。
Claims (5)
1.一种相似头像检索系统,其特征在于,包括图像上传模块,用于上传头像图片;图像获取模块,用于获取头像图片中某一范围内的图像;图像编码模块,用于将获取的图像编码成文本;图像检索模块,用于从文本中检索出相似的图像文本;头像人脸检测模块,用于从图像中提取人脸;结果显示模块,用于显示某一范围与上传的头像图片相似的用户ID。
2.根据权利要求1所述的相似头像检索系统,其特征在于,所述图像获取模块采用python中解析网页的库函数urllib对头像图片的url解码并保存。
3.根据权利要求1所述的相似头像检索系统,其特征在于,所述头像人脸提取模块通过opencv中Haar特征的人脸检测,首先加载训练好的Harr文件,输入对应的头像图片,将其灰度化后,调用Harr文件输出人脸图像的位置。
4.根据权利要求1所述的相似头像检索系统,其特征在于,所述图像检索模块使用汉明距离来检索生成文本中与输入图像相似的图像。
5.根据权利要求1所述的相似头像检索系统,其特征在于,所述图像编码模块使用感知哈希算法将图像转化为文本内容。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810245327.3A CN108334642A (zh) | 2018-03-23 | 2018-03-23 | 一种相似头像检索系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810245327.3A CN108334642A (zh) | 2018-03-23 | 2018-03-23 | 一种相似头像检索系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108334642A true CN108334642A (zh) | 2018-07-27 |
Family
ID=62932282
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810245327.3A Pending CN108334642A (zh) | 2018-03-23 | 2018-03-23 | 一种相似头像检索系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108334642A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109670070A (zh) * | 2018-11-29 | 2019-04-23 | 昆明理工大学 | 一种基于双重Hash的图像相似判定方法 |
CN109857896A (zh) * | 2019-01-31 | 2019-06-07 | 上海计算机软件技术开发中心 | 一种文档水印检测与识别系统 |
CN109902608A (zh) * | 2019-02-21 | 2019-06-18 | 中山市公安局交通警察支队 | 基于摄录识别的警务工作系统 |
CN110474889A (zh) * | 2019-07-26 | 2019-11-19 | 湖北乾智科技有限公司 | 一种基于网站图标的钓鱼网站识别方法及装置 |
CN110647855A (zh) * | 2019-09-29 | 2020-01-03 | 常州大学 | 一种基于人脸识别的地铁车站客流统计方法 |
CN111354016A (zh) * | 2020-02-28 | 2020-06-30 | 珠海大横琴科技发展有限公司 | 基于深度学习和差异值哈希的无人机舰船跟踪方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104298791A (zh) * | 2014-11-19 | 2015-01-21 | 中国石油大学(华东) | 一种基于集成哈希编码的快速图像检索方法 |
CN106130873A (zh) * | 2016-06-14 | 2016-11-16 | 北京小米移动软件有限公司 | 信息处理方法及装置 |
-
2018
- 2018-03-23 CN CN201810245327.3A patent/CN108334642A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104298791A (zh) * | 2014-11-19 | 2015-01-21 | 中国石油大学(华东) | 一种基于集成哈希编码的快速图像检索方法 |
CN106130873A (zh) * | 2016-06-14 | 2016-11-16 | 北京小米移动软件有限公司 | 信息处理方法及装置 |
Non-Patent Citations (1)
Title |
---|
干丽萍: "基于感知哈希的作业相似度检测", 《台州学院学报》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109670070A (zh) * | 2018-11-29 | 2019-04-23 | 昆明理工大学 | 一种基于双重Hash的图像相似判定方法 |
CN109670070B (zh) * | 2018-11-29 | 2022-07-29 | 昆明理工大学 | 一种基于双重Hash的图像相似判定方法 |
CN109857896A (zh) * | 2019-01-31 | 2019-06-07 | 上海计算机软件技术开发中心 | 一种文档水印检测与识别系统 |
CN109902608A (zh) * | 2019-02-21 | 2019-06-18 | 中山市公安局交通警察支队 | 基于摄录识别的警务工作系统 |
CN110474889A (zh) * | 2019-07-26 | 2019-11-19 | 湖北乾智科技有限公司 | 一种基于网站图标的钓鱼网站识别方法及装置 |
CN110647855A (zh) * | 2019-09-29 | 2020-01-03 | 常州大学 | 一种基于人脸识别的地铁车站客流统计方法 |
CN111354016A (zh) * | 2020-02-28 | 2020-06-30 | 珠海大横琴科技发展有限公司 | 基于深度学习和差异值哈希的无人机舰船跟踪方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108334642A (zh) | 一种相似头像检索系统 | |
Xiao et al. | Image splicing forgery detection combining coarse to refined convolutional neural network and adaptive clustering | |
Meng et al. | A Fusion Steganographic Algorithm Based on Faster R-CNN. | |
Du et al. | Perceptual hashing for image authentication: A survey | |
Cao et al. | Self-attention-based deep feature fusion for remote sensing scene classification | |
CN107256246B (zh) | 基于卷积神经网络的印花织物图像检索方法 | |
Khokher et al. | Content-based image retrieval: Feature extraction techniques and applications | |
KR20110028034A (ko) | 라벨 검색 방법 및 장치 | |
CN101930461A (zh) | 通信网络的数字图像可视化管理和检索 | |
CN117597703A (zh) | 用于图像分析的多尺度变换器 | |
CN111079511A (zh) | 基于深度学习的文档自动归类及光学字符识别方法及系统 | |
Nirmala et al. | A modern approach for image forgery detection using BRICH clustering based on normalised mean and standard deviation | |
CN112182275A (zh) | 一种基于多维度特征融合的商标近似检索系统和方法 | |
Chen et al. | Efficient video hashing based on low‐rank frames | |
CN109857896A (zh) | 一种文档水印检测与识别系统 | |
Zhu et al. | How to evaluate semantic communications for images with vitscore metric? | |
KR20110019117A (ko) | 시멘틱 기반의 이미지 검색 방법 | |
Li et al. | Perceptual hashing for color images | |
KR101142163B1 (ko) | 시멘틱 기반의 이미지 검색 방법 | |
CN109299295A (zh) | 蓝印花布图像数据库搜索方法 | |
Agarwal et al. | Blind forensics of images using higher order local binary pattern | |
CN107870923B (zh) | 图像检索方法和装置 | |
Mumar | Image retrieval using SURF features | |
Abraham | Digital image forgery detection approaches: A review and analysis | |
Tang et al. | Robust video hashing based on multidimensional scaling and ordinal measures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180727 |
|
RJ01 | Rejection of invention patent application after publication |