CN111291625B - 一种基于人脸检索的好友推荐方法及系统 - Google Patents

一种基于人脸检索的好友推荐方法及系统 Download PDF

Info

Publication number
CN111291625B
CN111291625B CN202010046983.8A CN202010046983A CN111291625B CN 111291625 B CN111291625 B CN 111291625B CN 202010046983 A CN202010046983 A CN 202010046983A CN 111291625 B CN111291625 B CN 111291625B
Authority
CN
China
Prior art keywords
face
subset
data set
feature vector
face feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010046983.8A
Other languages
English (en)
Other versions
CN111291625A (zh
Inventor
王凯
杜玉晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202010046983.8A priority Critical patent/CN111291625B/zh
Publication of CN111291625A publication Critical patent/CN111291625A/zh
Application granted granted Critical
Publication of CN111291625B publication Critical patent/CN111291625B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出一种基于人脸检索的好友推荐方法,包括:S1.将n个不同性别的人脸图片组成人脸库;S2.提取人脸图片特征,组成人脸图片特征向量;S3.对人脸图片特征向量进行聚类;S4.对聚类后的人脸图片特征向量的搜索空间进行层次划分,建立数据索引;S5.根据用户历史检索的人脸记录,判断用户检索人脸的性别,对应不同的人脸库;S6.对每一个检索的人脸记录特征向量,判断其属于已经聚类的组别号l;S7.评判相似性;S8.判断相似性是否满足要求,若是,记录在用户推荐数据库中;否则,舍弃。本发明还提出一种基于人脸检索的好友推荐系统,克服了现有好友推荐系统及方法的召回率不高以及冷启动的缺陷。

Description

一种基于人脸检索的好友推荐方法及系统
技术领域
本发明涉及社交网络的好友推荐技术领域,更具体地,涉及一种基于人脸检索的好友推荐方法及系统。
背景技术
随着网络技术的快速发展,互联网成为由人构成的巨大社会结构,网络社交成为人们日常生活中重要的社交元素。在网络交友中,人们面对的是一块块电子屏幕,可以借助匿名ID充分享受在私人空间里的自由,脱离了许多在现实生活中交友受到的限制,同时使用这些社交应用,人们在了解自己所感兴趣的最新资讯的同时可以发布个人状态、观看好友状态、与好友互通信息、发送图片及视频等功能。为了更好地拓宽用户社交圈并且通过新朋友获取更多的信息资源,好友推荐成为社交网络最为青睐的对象。
根据用户间产生关联的方式,网络社交可分为主动社交和被动社交,主动社交一般是指用户在线下属于彼此认识的朋友、亲人等,用户主动的搜索用来标识用户身份的唯一ID,查找添加成为网络中的好友;被动社交是指用户间并不认识,成为好友是因为社交应用系统的推荐,如附近的人、感兴趣的人等功能,用户无法主观改变该推荐结果而只能被动的查看并添加。
当前,很多好友推荐系统及方法都依赖用户之间的活跃程度,如果用户的好友人数不够多,那么无论是为其推荐其他好友还是将其推荐给其他人都变得很困难。例如,基于社交图片的好友推荐系统在社交网络中,用户发布的社交状态能够即时快速体现用户最近的兴趣偏好信息,而社交图片是网络中传递信息的重要媒介,但用户发布动态时的图片并不一定会代表用户的喜好,所以基于此生成的用户兴趣向量不准确,从而导致推荐结果的召回率不高,此外,用户发布动态并不一定会发布图片,这也会导致数据稀疏,影响推荐效果,而且对于新用户,由于没有足够的用户历史数据,因此存在推荐冷启动的问题。
综上所述,提出一种提高召回率、减轻冷启动的基于人脸检索的好友推荐方法及系统十分有必要。
发明内容
为克服现有好友推荐系统及方法的召回率不高,且存在冷启动的缺陷,本发明提出一种提高召回率、减轻冷启动的基于人脸检索的好友推荐方法及系统,旨在至少在一定程度上解决上述技术问题。
为了达到上述技术效果,本发明的技术方案如下:
一种基于人脸检索的好友推荐方法,所述方法包括:
S1.将n个不同性别的人脸图片分别存储至对应的服务器,组成人脸库;
S2.利用人脸特征提取模块对每张人脸图片的人脸区域进行特征提取,将提取到的特征组成人脸图片特征向量;
S3.对n个不同性别的人脸图片特征向量进行聚类;
S4.对聚类后的人脸图片特征向量的搜索空间进行层次划分,建立数据索引;
S5.根据用户历史检索的人脸记录,判断用户检索人脸的性别,对应不同的人脸库;
S6.对每一个检索的人脸记录特征向量,判断其属于已经聚类的组别号l;
S7.评判每一个检索的人脸记录特征向量与第l组聚类中每一个人脸特征向量的相似性;
S8.判断相似性是否满足要求,若是,将人脸库中与用户历史检索的人脸记录相似的图像,记录在用户推荐数据库中;否则,舍弃。
优选地,在步骤S1中,不同性别的人脸图片对应不同的人脸库。
优选地,步骤S3所述的对n个不同性别的人脸图片特征向量进行聚类的步骤为:
S301.设定人脸聚类分组数目k;
S302.利用随机选择器从人脸图片的n个人脸特征向量中,随机选择k个人脸特征向量作为k个初始聚类中心;
S303.分别计算每个人脸特征向量与k个初始聚类中心的距离,根据计算所得的距离将n个人脸特征向量再次聚类划分为k组;
S304.分别计算k组聚类的每一组人脸特征向量的均值,将均值作为每一组的新聚类中心;
S305.计算k组聚类的标准测度函数,若标准测度函数满足阈值ε,则聚类结束,输出n个人脸特征向量的聚类结果;否则,返回步骤S302。
在此,聚类之后得到的人脸特征向量类别,相似的人脸特征向量将划分到同一类别,聚类可以加速后续层次划分过程中索引K-DTree的构建。
优选地,步骤S303所述的每个人脸特征向量与k个初始聚类中心的距离计算公式为:
hj,k=Pxj-zkP
其中,hj,k表示第j个人脸特征向量与k个初始聚类中心的距离;xj表示第j个人脸特征向量,j=1,...,n;zk表示第k个初始聚类中心;将每个人脸特征向量与k个初始聚类中心的距离hj,k进行比较,根据hj,k的大小,将n个人脸特征向量再次聚类划分为k组。
在此,每个人脸特征向量与k个初始聚类中心的距离hj,k进行比较,相对而言,离第k个初始聚类中心更近的人脸特征向量,将重新聚类到第k组聚类类别,离其它初始聚类中心更近的人脸特征向量,将重新聚类到其它组聚类类别。
优选地,步骤S304所述的每一组人脸特征向量的均值计算公式为:
Figure BDA0002369775290000031
其中,Ci表示第i组人脸特征向量聚类中心簇;x表示人脸特征向量;μi表示人脸特征向量聚类中心簇Ci的均值;
步骤S305所述k组聚类的标准测度函数表达式为:
Figure BDA0002369775290000032
其中,E表示标准测度函数,k表示聚类中心的个数,i表示人脸特征向量聚类的组别,Ci表示第i组人脸特征向量聚类中心簇,x表示人脸特征向量;μi表示人脸特征向量聚类中心簇Ci的均值。
优选地,步骤S4所述聚类后的人脸图片特征向量的搜索空间进行层次划分,并建立数据索引的方法为K-D Tree法,步骤为:
S401.在F维人脸特征向量聚类的数据集合中选择具有最大方差的维度f,以第f维度数据集合的中值m为中心,将数据集合进行划分,得到子集合V1与子集合V2;
S402.创建存储f与m的树结点node;
S403对子集合V1与子集合V2分别选取各自具有最大方差的维度f1与f2,以第f1维度数据集合的中值m1为中心,对子集合V1进行划分;以第f2维度数据集合的中值m2为中心,对子集合V2进行划分;
S404.判断数据集合是否还能划分,若是,返回步骤S401;否则,将子集合作为叶子结点,并保存子集合的数据。
在此,步骤S401所述的方差计算即采用最基本的数据方差计算公式,然后选取最大方差的维度f进行后续层次划分,因为实际数据都会呈现簇状的聚类状态,因此先建立K-D Tree数据索引,再进行快速匹配。
优选地,步骤S404所述的数据集合还能划分的依据是:数据集合中包括的数据个数大于1。
优选地,步骤S7所述的相似性判断步骤为:
S701.以用户发起的每一个检索的人脸记录特征向量数据Q为基准,从树结点向叶子结点的方向访问K-D Tree数据索引;
S702.用户发起的每一个检索的人脸记录特征向量数据Q对应K-D Tree结点中维度f数据集合上的值Qf,将Qf与中值m进行比较;
S703.判断Qf是否小于m,若是,则从K-D Tree的左子树访问;否则,从K-D Tree的右子树访问;
S704.计算Qf与叶子结点上保存的数据之间的距离H,记录下最小距离对应的数据点,作为最近邻点Pcur,最小距离记为Dcur;
S705.判断未被访问过的K-D Tree分支里是否存在与Qf之间的距离H小于Dcur的点,若是,更新最近邻点Pcur和最小距离Dcur;否则,该分支内不存在与Q之间的距离小于Dcur,原最近邻点Pcur满足相似性要求。
在此,Qf与叶子结点上保存的数据之间的距离满足点与点之间距离的基本求解公式:
Figure BDA0002369775290000041
其中,H表示Qf与叶子节点g之间的距离,(xf,yf)为Qf对应的数据点,(xg,yg)为叶子结点g上保存的数据,检索到原最近邻点Pcur满足相似性要求的最近邻点Pcur则作为推荐结果返回。
本发明还提出一种基于人脸检索的好友推荐系统,包括:
图片采集模块,用于采集不同性别的人脸图片;
特征提取模块,用于提取人脸图片的人脸区域特征;
数据聚类模块,用于对不同性别的人脸图片特征向量进行聚类;
层次划分模块,用于对已经聚类的人脸图片特征向量的搜索空间进行层次划分;
判断模块,用于判断每一检索的人脸记录特征向量对应的聚类类别;
相似性判别模块,用于判别人脸库中人脸特征向量与用户历史检索的人脸记录的相似性。
与现有技术相比,本发明的有益技术效果:
(1)本发明提出的技术方案是在陌生人社交场景下的好友推荐,通过聚类避免了监督学习的繁琐,提高了好友推荐的速度,并将聚类的数据搜索空间进行层次划分,聚类操作可以加速后续层次划分及数据索引的建立,从而,以用户历史检索为基础进行好友推荐,因此,在用户首次进行检索时也可以进行精准推荐,较好地减轻了冷启动的问题。
(2)本发明还提出了一种基于人脸检索的好友推荐系统,构建了一套全新完整的基于人脸检索的陌生人交友系统。
附图说明
图1为本发明提出的基于人脸检索的好友推荐方法的流程图。
图2为本发明提出的基于人脸检索的好友推荐系统。
图3为K-D tree人脸特征数据索引图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示的本发明提出的基于人脸检索的好友推荐方法的流程图,方法包括:
S1.将n个不同性别的人脸图片分别存储至对应的服务器,组成人脸库,不同性别的人脸图片对应不同的人脸库。
S2.利用人脸特征提取模块对每张人脸图片的人脸区域进行特征提取,将提取到的特征组成人脸图片特征向量;
S3.对n个不同性别的人脸图片特征向量进行聚类;聚类步骤如下:
S301.设定人脸聚类分组数目k;
S302.利用随机选择器从人脸图片的n个人脸特征向量中,随机选择k个人脸特征向量作为k个初始聚类中心;
S303.分别计算每个人脸特征向量与k个初始聚类中心的距离,根据计算所得的距离将n个人脸特征向量再次聚类划分为k组;每个人脸特征向量与k个初始聚类中心的距离计算公式为:
hj,k=Pxj-zkP
其中,hj,k表示第j个人脸特征向量与k个初始聚类中心的距离;xj表示第j个人脸特征向量,j=1,...,n;zk表示第k个初始聚类中心;将每个人脸特征向量与k个初始聚类中心的距离hj,k进行比较,根据hj,k的大小,将n个人脸特征向量再次聚类划分为k组。每个人脸特征向量与k个初始聚类中心的距离hj,k进行比较,相对而言,离第k个初始聚类中心更近的人脸特征向量,将重新聚类到第k组聚类类别,离其它初始聚类中心更近的人脸特征向量,将重新聚类到其它组聚类类别。
S304.分别计算k组聚类的每一组人脸特征向量的均值,将均值作为每一组的新聚类中心;每一组人脸特征向量的均值计算公式为:
Figure BDA0002369775290000061
其中,Ci表示第i组人脸特征向量聚类中心簇;x表示人脸特征向量;μi表示人脸特征向量聚类中心簇Ci的均值;
S305.计算k组聚类的标准测度函数,若标准测度函数满足阈值ε,则聚类结束,输出n个人脸特征向量的聚类结果;否则,返回步骤S302。k组聚类的标准测度函数表达式为:
Figure BDA0002369775290000071
其中,E表示标准测度函数,k表示聚类中心的个数,i表示人脸特征向量聚类的组别,Ci表示第i组人脸特征向量聚类中心簇,x表示人脸特征向量;μi表示人脸特征向量聚类中心簇Ci的均值。
S4.对聚类后的人脸图片特征向量的搜索空间进行层次划分,建立数据索引;聚类后的人脸图片特征向量层次划分的方法为K-D Tree法,步骤为:
S401.在F维人脸特征向量聚类的数据集合中选择具有最大方差的维度f,以第f维度数据集合的中值m为中心,将数据集合进行划分,得到子集合V1与子集合V2;
S402.创建存储f与m的树结点node;
S403.对子集合V1与子集合V2分别选取各自具有最大方差的维度f1与f2,以第f1维度数据集合的中值m1为中心,对子集合V1进行划分;以第f2维度数据集合的中值m2为中心,对子集合V2进行划分;
S404.判断数据集合是否还能划分,若是,返回步骤S401;否则,将子集合作为叶子结点,并保存子集合的数据。能划分的标准是:子集合V中包括数据的个数大于1。
在此,步骤S401所述的方差计算即采用最基本的数据方差计算公式,然后选取最大方差的维度f进行后续层次划分,因为实际数据都会呈现簇状的聚类状态,因此先建立K-D Tree数据索引,再进行快速匹配。
S5.根据用户历史检索的人脸记录,判断用户检索人脸的性别,对应不同的人脸库;
S6.对每一个检索的人脸记录特征向量,判断其属于已经聚类的组别号l;
S7.评判每一个检索的人脸记录特征向量与第l组聚类中每一个人脸特征向量的相似性;
S8.判断相似性是否满足要求,若是,将人脸库中与用户历史检索的人脸记录为相似的图像,记录在用户推荐数据库中;否则,舍弃。相似性判断步骤为:
S701.以用户发起的每一个检索的人脸记录特征向量数据Q为基准,从树结点向叶子结点的方向访问K-D Tree数据索引;
S702.用户发起的每一个检索的人脸记录特征向量数据Q对应K-D Tree结点中维度f数据集合上的值Qf,将Qf与中值m进行比较;
S703.判断Qf是否小于m,若是,则从K-D Tree的左子树访问;否则,从K-D Tree的右子树访问;
S704.计算Qf与叶子结点上保存的数据之间的距离H,记录下最小距离对应的数据点,作为最近邻点Pcur,最小距离记为Dcur;
S705.判断未被访问过的K-D Tree分支里是否存在与Qf之间的距离H小于Dcur的点,若是,更新最近邻点Pcur和最小距离Dcur;否则,该分支内不存在与Q之间的距离小于Dcur,原最近邻点Pcur满足相似性要求。
在此,Qf与叶子结点上保存的数据之间的距离满足点与点之间距离的基本求解公式:
Figure BDA0002369775290000081
其中,H表示Qf与叶子节点g之间的距离,(xf,yf)为Qf对应的数据点,(xg,yg)为叶子结点g上保存的数据,检索到原最近邻点Pcur满足相似性要求的最近邻点Pcur则作为推荐结果返回。
如图2所示,本发明还提出一种基于人脸检索的好友推荐系统,包括:
图片采集模块,用于采集不同性别的人脸图片;
特征提取模块,用于提取人脸图片的人脸区域特征;
数据聚类模块,用于对不同性别的人脸图片特征向量进行聚类;
层次划分模块,用于对已经聚类的人脸图片特征向量的搜索空间进行层次划分;
判断模块,用于判断每一检索的人脸记录特征向量对应的聚类类别;
相似性判别模块,用于判别人脸库中人脸特征向量与用户历史检索的人脸记录的相似性。
在具体实施时,设组成人脸库的人脸图片共6张,利用人脸特征提取模块对每张人脸图片的人脸区域进行特征提取,组成人脸特征向量如表1所示:
表1
人脸图片代号 特征1 特征2
1 2 3
2 5 4
3 9 6
4 4 7
5 8 1
6 7 2
对上述人脸特征向量进行聚类:
1)利用随机选择器从上述6个人脸特征向量中随机选择3个特征向量作为初始聚类中心;
2)分别计算每个人脸特征向量与3个初始聚类中心的距离,根据计算所得的距离将6个人脸特征向量再次聚类划分为3组;
3)分别计算3组聚类的每一组人脸特征向量的均值,将均值作为每一组的新聚类中心;
4)计算标准测度函数E,当满足阈值ε时,则聚类结束,输出n个人脸特征向量的聚类结果;否则,返回步骤2)。
最终聚类之后将其分为3类,然后进行K-Dtree数据索引构建,如图3所示的索引图,具体流程如下:
如表1所示,将1号人脸图片的人脸特征1和人脸特征2分别表示为x维度和y维度上的数据,即(2,3),同理2-6号人脸图片的人脸特征分别表示为(5,4),(9,6),(4,7),(8,1),(7,2),然后比较x维度以及y维度上的方差。经计算,x维度的方差大于y维度,将数据按照x维的大小升序排列并取中间值7,使用x=7对中间值进行切分,并将点(7,2)作为根节点,切分点(7,2)前面的点作为K-Dtree的左子树,后面的点作为K-Dtree的右子树。
当用户发起人脸检索时,将获取到的人脸图片进行特征提取,设用户检索的人脸为(2.3,3.2),(2.3,3.2)在x维上小于点(7,2),进入左子树,按逐层进行空间划分的维度进行二叉查,最终到达点(2,3),将优先考虑为最近邻点Pcur。
计算点(2.3,3.2)与点(2,3)的距离为0.3606,以点(2.3,3.2)为圆心,0.3606为半径画圆,该圆明显不与y=4的超平面相交,故不用考虑(5,4)的右子树,更不用考虑(7,2)的右子树,这样点(2,3)就是最终确定的最近邻点。
5)将检索到的结果作为推荐结果返回。
同理,按照相同的方法对左右子进行划分,由计算可得,y维度的方差大于x维度的方差,将数据按照y维升序排列取中间值4,使用y=4对左子树继续切分,并将点(5,4)作为左子树的根节点。使用y=6对右子树切分,并将点(9,6)作为右子树的根节点,将剩余的数据按照x为继续划分。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (6)

1.一种基于人脸检索的好友推荐方法,其特征在于,所述方法包括:
S1.将n个不同性别的人脸图片分别存储至对应的服务器,组成人脸库;
S2.利用人脸特征提取模块对每张人脸图片的人脸区域进行特征提取,将提取到的特征组成人脸图片特征向量;
S3.对n个不同性别的人脸图片特征向量进行聚类;
S4.对聚类后的人脸图片特征向量的搜索空间进行层次划分,建立数据索引;
步骤S4所述聚类后的人脸图片特征向量的搜索空间进行层次划分,并建立数据索引的方法为K-D Tree法,步骤为:
S401.在F维人脸特征向量聚类的数据集合中选择具有最大方差的维度f,以第f维度数据集合的中值m为中心,将数据集合进行划分,得到子集合V1与子集合V2;
S402.创建存储f与m的树结点node;
S403对子集合V1与子集合V2分别选取各自具有最大方差的维度f1与f2,以第f1维度数据集合的中值m1为中心,对子集合V1进行划分;以第f2维度数据集合的中值m2为中心,对子集合V2进行划分;
S404.判断数据集合是否还能划分,若是,返回步骤S401;否则,将子集合作为叶子结点,并保存子集合的数据;步骤S404所述的数据集合还能划分的依据是:数据集合中包括的数据个数大于1;
S5.根据用户历史检索的人脸记录,判断用户检索人脸的性别,对应不同的人脸库;
S6.对每一个检索的人脸记录特征向量,判断其属于已经聚类的组别号l;
S7.评判每一个检索的人脸记录特征向量与第l组聚类中每一个人脸特征向量的相似性;
步骤S7所述的相似性判断步骤为:
S701.以每一检索的人脸特征向量数据Q为基准,从树结点向叶子结点的方向访问K-DTree数据索引;
S702.每一检索的人脸特征向量数据Q对应K-D Tree结点中维度f数据集合上的值Qf,将Qf与中值m进行比较;
S703.判断Qf是否小于m,若是,则从K-D Tree的左子树访问;否则,从K-D Tree的右子树访问;
S704.计算Qf与叶子结点上保存的数据之间的距离H,记录下最小距离对应的数据点,作为最近邻点Pcur,最小距离记为Dcur;
S705.判断未被访问过的K-D Tree分支里是否存在与Qf之间的距离H小于Dcur的点,若是,更新最近邻点Pcur和最小距离Dcur;;否则,该分支内不存在与Q之间的距离小于Dcur,原最近邻点Pcur满足相似性要求;
S8.判断相似性是否满足要求,若是,将人脸库中与用户历史检索的人脸记录相似的图像,记录在用户推荐数据库中;否则,舍弃。
2.根据权利要求1所述的基于人脸检索的好友推荐方法,其特征在于,在步骤S1中,不同性别的人脸图片对应不同的人脸库。
3.根据权利要求1所述的基于人脸检索的好友推荐方法,其特征在于,步骤S3所述的对n个不同性别的人脸图片特征向量进行聚类的步骤为:
S301.设定人脸聚类分组数目k;
S302.利用随机选择器从人脸图片的n个人脸特征向量中,随机选择k个人脸特征向量作为k个初始聚类中心;
S303.分别计算每个人脸特征向量与k个初始聚类中心的距离,根据计算所得的距离将n个人脸特征向量再次聚类划分为k组;
S304.分别计算k组聚类的每一组人脸特征向量的均值,将均值作为每一组的新聚类中心;
S305.计算k组聚类的标准测度函数,若标准测度函数满足阈值ε,则聚类结束,输出n个人脸特征向量的聚类结果;否则,返回步骤S302。
4.根据权利要求3所述的基于人脸检索的好友推荐方法,其特征在于,步骤S303所述的每个人脸特征向量与k个初始聚类中心的距离计算公式为:
hj,k=||xj-zk||
其中,hj,k表示第j个人脸特征向量与k个初始聚类中心的距离;xj表示第j个人脸特征向量,j=1,...,n;zk表示第k个初始聚类中心;将每个人脸特征向量与k个初始聚类中心的距离hj,k进行比较,根据hj,k的大小,将n个人脸特征向量再次聚类划分为k组。
5.根据权利要求3所述的基于人脸检索的好友推荐方法,其特征在于,步骤S304所述的每一组人脸特征向量的均值计算公式为:
Figure FDA0004054268950000031
其中,Ci表示第i组人脸特征向量聚类中心簇;x表示人脸特征向量;μi表示人脸特征向量聚类中心簇Ci的均值;
步骤S305所述k组聚类的标准测度函数表达式为:
Figure FDA0004054268950000032
其中,E表示标准测度函数,k表示聚类中心的个数,i表示人脸特征向量聚类的组别,Ci表示第i组人脸特征向量聚类中心簇,x表示人脸特征向量;μi表示人脸特征向量聚类中心簇Ci的均值。
6.一种基于人脸检索的好友推荐系统,其特征在于,包括:
图片采集模块,用于采集不同性别的人脸图片;
特征提取模块,用于提取人脸图片的人脸区域特征;
数据聚类模块,用于对不同性别的人脸图片特征向量进行聚类;
层次划分模块,用于对已经聚类的人脸图片特征向量的搜索空间进行层次划分;
判断模块,用于判断每一检索的人脸记录特征向量对应的聚类类别;
相似性判别模块,用于判别人脸库中人脸特征向量与用户历史检索的人脸记录的相似性;
所述聚类后的人脸图片特征向量的搜索空间进行层次划分,并建立数据索引的方法为K-D Tree法,步骤为:
S401.在F维人脸特征向量聚类的数据集合中选择具有最大方差的维度f,以第f维度数据集合的中值m为中心,将数据集合进行划分,得到子集合V1与子集合V2;
S402.创建存储f与m的树结点node;
S403对子集合V1与子集合V2分别选取各自具有最大方差的维度f1与f2,以第f1维度数据集合的中值m1为中心,对子集合V1进行划分;以第f2维度数据集合的中值m2为中心,对子集合V2进行划分;
S404.判断数据集合是否还能划分,若是,返回步骤S401;否则,将子集合作为叶子结点,并保存子集合的数据;步骤S404所述的数据集合还能划分的依据是:数据集合中包括的数据个数大于1;
所述聚类后的人脸图片特征向量的搜索空间进行层次划分,并建立数据索引的方法为K-D Tree法,步骤为:
S401.在F维人脸特征向量聚类的数据集合中选择具有最大方差的维度f,以第f维度数据集合的中值m为中心,将数据集合进行划分,得到子集合V1与子集合V2;
S402.创建存储f与m的树结点node;
S403对子集合V1与子集合V2分别选取各自具有最大方差的维度f1与f2,以第f1维度数据集合的中值m1为中心,对子集合V1进行划分;以第f2维度数据集合的中值m2为中心,对子集合V2进行划分;
S404.判断数据集合是否还能划分,若是,返回步骤S401;否则,将子集合作为叶子结点,并保存子集合的数据;步骤S404所述的数据集合还能划分的依据是:数据集合中包括的数据个数大于1。
CN202010046983.8A 2020-01-16 2020-01-16 一种基于人脸检索的好友推荐方法及系统 Active CN111291625B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010046983.8A CN111291625B (zh) 2020-01-16 2020-01-16 一种基于人脸检索的好友推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010046983.8A CN111291625B (zh) 2020-01-16 2020-01-16 一种基于人脸检索的好友推荐方法及系统

Publications (2)

Publication Number Publication Date
CN111291625A CN111291625A (zh) 2020-06-16
CN111291625B true CN111291625B (zh) 2023-04-18

Family

ID=71024300

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010046983.8A Active CN111291625B (zh) 2020-01-16 2020-01-16 一种基于人脸检索的好友推荐方法及系统

Country Status (1)

Country Link
CN (1) CN111291625B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112633051A (zh) * 2020-09-11 2021-04-09 博云视觉(北京)科技有限公司 一种基于图像搜索的在线人脸聚类方法
CN113723205A (zh) * 2021-08-04 2021-11-30 中国人民解放军陆军勤务学院 一种基于人脸底库特征分组的人脸识别方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2514655A1 (en) * 2001-11-27 2003-05-27 Samsung Electronics Co., Ltd. Apparatus and method for depth image-based representation of 3-dimensional object

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11205103B2 (en) * 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2514655A1 (en) * 2001-11-27 2003-05-27 Samsung Electronics Co., Ltd. Apparatus and method for depth image-based representation of 3-dimensional object

Also Published As

Publication number Publication date
CN111291625A (zh) 2020-06-16

Similar Documents

Publication Publication Date Title
CN108763314B (zh) 一种兴趣推荐方法、装置、服务器及存储介质
CN106383877B (zh) 一种社交媒体在线短文本聚类和话题检测方法
US7684651B2 (en) Image-based face search
CN113158023B (zh) 基于混合推荐算法的公共数字生活精准分类服务方法
Wang et al. Automatic image annotation and retrieval using weighted feature selection
CN109947987B (zh) 一种交叉协同过滤推荐方法
CN111291625B (zh) 一种基于人脸检索的好友推荐方法及系统
CN114358109A (zh) 特征提取模型训练、样本检索方法、装置和计算机设备
CN114329051B (zh) 数据信息识别方法、装置、设备、存储介质及程序产品
CN115329210A (zh) 一种基于交互图分层池化的虚假新闻检测方法
CN114416929A (zh) 实体召回模型的样本生成方法、装置、设备及存储介质
Pedronette et al. Unsupervised effectiveness estimation for image retrieval using reciprocal rank information
CN113705310A (zh) 特征学习的方法、目标物体的识别方法和对应装置
CN111767419B (zh) 图片搜索方法、装置、设备及计算机可读存储介质
CN110162535B (zh) 用于执行个性化的搜索方法、装置、设备以及存储介质
CN114943285B (zh) 互联网新闻内容数据智能审核系统
CN116955707A (zh) 内容标签的确定方法、装置、设备、介质及程序产品
CN111160077A (zh) 一种大规模人脸动态聚类方法
CN111428767B (zh) 数据处理方法及装置、处理器、电子设备及存储介质
CN116484067A (zh) 目标对象匹配方法、装置及计算机设备
Anandarao et al. Detection of Hot Topic in Tweets Using Modified Density Peak Clustering.
CN113901333B (zh) 一种融合了图结构与文本特征的好友推荐方法
CN114708449B (zh) 相似视频的确定方法、实例表征模型的训练方法及设备
CN115795023B (zh) 文档推荐方法、装置、设备以及存储介质
CN114547279B (zh) 一种基于混合过滤的司法推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant