CN104281842A - 人脸图片人名识别方法和装置 - Google Patents

人脸图片人名识别方法和装置 Download PDF

Info

Publication number
CN104281842A
CN104281842A CN201410539153.3A CN201410539153A CN104281842A CN 104281842 A CN104281842 A CN 104281842A CN 201410539153 A CN201410539153 A CN 201410539153A CN 104281842 A CN104281842 A CN 104281842A
Authority
CN
China
Prior art keywords
name
text
face picture
score value
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410539153.3A
Other languages
English (en)
Inventor
薛红霞
陶哲
胡金辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201410539153.3A priority Critical patent/CN104281842A/zh
Publication of CN104281842A publication Critical patent/CN104281842A/zh
Priority to PCT/CN2015/091869 priority patent/WO2016058520A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种人脸图片人名识别方法和装置,主要涉及计算机技术领域,主要目的在于准确识别出人脸图片中的人脸的人名。方法包括:从目标人脸图片对应的文本中提取人名;对目标人脸图片进行人脸识别,识别出目标人脸图片的相似人脸图片,并获取相似人脸图片中人脸的人名;根据文本中的人名,以及相似人脸图片中人脸的人名,确定目标人脸图片中人脸的人名。根据本发明,将通过人脸识别技术识别出的相似人脸的人名和从对应文本中得到的人名综合考虑,无疑能够更加准确地确定目标人脸图片中的人脸的人名。

Description

人脸图片人名识别方法和装置
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种人脸图片人名识别方法和装置。
背景技术
目前,人脸识别技术正在逐渐发展,但是由于人脸图片往往存在光线、角度等方面的问题,容易造成难以准确识别出人脸对应人物的人名。
例如,某条新闻信息中报道了明星A的演唱会情况,并插入了具有明星A的脸部的照片,但基于现有的人脸识别技术进行识别后,得到结果为:照片中的人脸可能是明星A,也可能是明星B,且是明星B的可能性更大一些。此时,基于前述的人脸识别技术的识别结果来确定照片中人脸的人名,则非常容易出现错误。由此可见,仅基于人脸识别技术来确定人脸图片中的人脸的人名,准确率是较低的。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的人脸图片人名识别方法和装置。
依据本发明的一个方面,提供了一种人脸图片人名识别方法,其包括:从目标人脸图片对应的文本中提取人名;对所述目标人脸图片进行人脸识别,识别出所述目标人脸图片的相似人脸图片,并获取所述相似人脸图片中人脸的人名;根据所述文本中的人名,以及所述相似人脸图片中人脸的人名,确定所述目标人脸图片中人脸的人名。
可选地,前述的方法,根据所述文本中的人名,以及所述相似人脸图片中人脸的人名,确定所述目标人脸图片中人脸的人名,具体包括:根据所述文本的属性和/或所述文本与所述文本中人名之间的关系,为所述文本中的人名计算第一分值;根据所述相似人脸图片与所述目标人脸图片的相似度,为所述相似人脸图片中人脸的人名计算第二分值;根据相同人名具有的第一分值和第二分值计算结果分值,并根据结果分值的大小确定所述目标人脸图片中人脸的人名。
可选地,前述的方法,根据所述文本的属性和/或所述文本与所述文本中人名之间的关系,为所述文本中的人名计算第一分值,具体包括:根据所述文本的属性为所述文本中的人名计算第一子分值,根据所述文本与所述文本中人名的关系计算第二子分值,根据所述第一子分值和所述第二子分值计算所述第一分值。
可选地,前述的方法,所述文本的属性包括:所述文本的类型、所述文本的所在位置和/或所述文本的发布者;所述文本与所述文本中的人名的关系包括:所述文本中的人名在所述文本中的位置和/或出现次数。
可选地,前述的方法,对所述目标人脸图片进行人脸识别,识别出所述目标人脸图片的相似人脸图片,具体包括:获取已收集的人脸图片的特征,以及获取所述目标人脸图片的特征;将所述已收集的人脸图片的特征与所述目标人脸图片的特征进行比较,并根据比较结果确定所述相似人脸图片。
可选地,前述的方法,根据相同人名具有的第一分值和第二分值计算结果分值,具体包括:计算所述相同人名具有的第一分值与预设的第一权值的乘积,以及所述相同人名具有的第二分值与预设的第二权值的乘积,并根据得到的乘积计算所述结果分值。
可选地,前述的方法,所述文本包括所述目标人脸图片对应的文档中的标题、正文和/或所述目标人脸图片的环绕文本。
依据本发明的一个方面,还提供了一种人脸图片人名识别装置,其包括:人名提取模块,用于从目标人脸图片对应的文本中提取人名;人脸识别模块,用于对所述目标人脸图片进行人脸识别,识别出所述目标人脸图片的相似人脸图片,并获取所述相似人脸图片中人脸的人名;人名确定模块,用于根据所述文本中的人名,以及所述相似人脸图片中人脸的人名,确定所述目标人脸图片中人脸的人名。
可选地,前述的装置,所述人名确定模块包括:第一分值计算模块,用于根据所述文本的属性和/或所述文本与所述文本中人名之间的关系,为所述文本中的人名计算第一分值;第二分值计算模块,用于根据所述相似人脸图片与所述目标人脸图片的相似度,为所述相似人脸图片中人脸的人名计算第二分值;结果分值计算模块,用于根据相同人名具有的第一分值和第二分值计算结果分值,并根据结果分值的大小确定所述目标人脸图片中人脸的人名。
可选地,前述的装置,所述第一分值计算模块根据所述文本的属性为所述文本中的人名计算第一子分值,根据所述文本与所述文本中人名的关系计算第二子分值,根据所述第一子分值和所述第二子分值计算所述第一分值。
可选地,前述的装置,所述文本的属性包括:所述文本的类型、所述文本的所在位置和/或所述文本的发布者;所述文本与所述文本中的人名的关系包括:所述文本中的人名在所述文本中的位置和/或出现次数。
可选地,前述的装置,所述人脸识别模块包括:特征提取模块,用于获取已收集的人脸图片的特征,以及获取所述目标人脸图片的特征;特征比较模块,用于将所述已收集的人脸图片的特征与所述目标人脸图片的特征进行比较,并根据比较结果确定所述相似人脸图片。
可选地,前述的装置,所述结果分值计算模块计算所述相同人名具有的第一分值与预设的第一权值的乘积,以及所述相同人名具有的第二分值与预设的第二权值的乘积,并根据得到的乘积计算所述结果分值。
可选地,前述的装置,所述文本包括所述目标人脸图片对应的文档中的标题、正文和/或所述目标人脸图片的环绕文本。
根据以上技术方案,可知本发明的人脸图片人名识别方法和装置至少具有以下优点:
在本发明的技术方案中,不但利用人脸识别技术来对目标人脸图片进行了识别,并且考虑到目标人脸图片对应的文本中所包含的人名,这是因为目标人脸图片对应的文本往往与目标人脸图片之间具有较紧密的关系,所以文本中涉及的人名包含了目标人脸图片中人脸的人名,而将通过人脸识别技术识别出的相似人脸的人名和从对应文本中得到的人名综合考虑,无疑能够更加准确地确定目标人脸图片中的人脸的人名。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明的一个实施例的人脸图片人名识别方法的流程图;
图2示出了根据本发明的一个实施例的人脸图片人名识别方法的原理示意图;
图3示出了根据本发明的一个实施例的人脸图片人名识别方法的局部流程图;
图4示出了根据本发明的一个实施例的人脸图片人名识别方法的局部流程图;
图5示出了根据本发明的一个实施例的人脸图片人名识别装置的框图;
图6示出了根据本发明的一个实施例的人脸图片人名识别装置的模块框图;
图7示出了根据本发明的一个实施例的人脸图片人名识别装置的模块框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示,本发明的一个实施例提供了一种人脸图片人名识别方法,其包括:
步骤110,从目标人脸图片对应的文本中提取人名。在本实施例中,对于文本的类型不做限制,例如,当目标人脸图片位于一则新闻消息中时,则文本可以是该新闻消息的新闻内容;当目标人脸图片位于一篇科技文档中时,则文本可以是该目标人脸图片的上下文内容。在本实施例中,目标人脸图片通常与其对应文本之间存在紧密的联系,所以可以确定文本中很可能存在着目标人脸图片中的人脸的人名,例如,一则新闻消息中提供了一张明星的个人照片,而新闻内容报道了明星的演唱会情况,则新闻内容中提供了明星照片中明星的人名;一篇科技文档提供了一张科学家的照片,且照片下方的文本是对于该科学家的生平介绍,则照片下方文本中提供了科学家的人名。文本中所提取的人名数量为一个或多个。
步骤120,对目标人脸图片进行人脸识别,识别出目标人脸图片的相似人脸图片,并获取相似人脸图片中人脸的人名。在本实施例中,基于人脸识别技术识别出了目标人脸图片的相似人脸图片,且对所采用的人脸识别技术不进行限制,现有的任何人脸识别技术均可用于本实施例的技术方案。在本实施例中,可以在数据库中预存储大量已收集的人脸图片以及每张人脸图片中人脸的人名,则通过人脸识别技术可以从数据库中找到相似人脸图片,并能够确定相似人脸图片的人名。通过人脸识别技术得到的人名数量为一个或多个。
步骤130,根据文本中的人名,以及相似人脸图片中人脸的人名,确定目标人脸图片中人脸的人名。在本实施例中,由于综合考虑了人脸识别技术识别出的人名以及文本中包含的人名,所以能够更加准确地确定目标人脸图片中人脸的人名。在本实施例中,对于如何确定目标人脸图片中人脸的人名的方式不做限制,例如,对于一张新闻消息中的人脸图片,从该新闻消息的新闻内容中提取了“张三、李四”两个人名,通过人脸识别方式得到了目标人脸图片的两张相似人脸图片,并确定该两张相似人脸图片的名字分别为“李四、王五”,则同时被两种方式获取的“李四”的准确性比较较高,所以将“李四”确定为目标人脸图片中人脸的人名;而假如,从该新闻消息的新闻内容中提取了“张三”一个人名,通过人脸识别方式得到了目标人脸图片的一张相似人脸图片,并确定该相似人脸图片的名字为“李四”,则以人脸识别技术得到的结果为准,将“李四”确定为目标人脸图片中人脸图片。
在本实施例的技术方案中,因为目标人脸图片对应的文本往往与目标人脸图片之间具有较紧密的关系,所以文本中涉及的人名包含了目标人脸图片中人脸的人名,而将通过人脸识别技术识别出的相似人脸的人名和从对应文本中得到的人名综合考虑,如示意图图2所示,无疑能够更加准确地确定目标人脸图片中的人脸的人名。
如图3所示,本发明的另一个实施例提供了一种人脸图片人名识别方法,步骤130具体包括:
步骤131,根据文本的属性和/或文本与文本中人名之间的关系,为文本中的人名计算第一分值。在本实施例中,文本的不同属性、文本与文本中人名之间的不同关系,能够反映人名为目标人脸图片中人脸的人名的可能性高低。例如,当文本的属性为文本的类型时,例如,一则新闻消息中提供了一张明星的个人照片,而新闻内容报道了明星的演唱会情况,则新闻内容中的人名有很大可能是明星的人名,则文本中每个人名的第一分值可设置为90分;一篇文学作品中提供了一张作者的照片,而其正文中包含的人名可能只是作品主角而非作者的人名,则文本中每个人名的第一分值可设置为10分。同理,当文本与文本中人名的关系为人名在文本中出现的次数时,例如,一则配有人脸图片的新闻消息中,人名1出现了9次,而人名2出现了一次,则容易理解人名1更可能是人脸图片中人脸的人名,所以人名1的第一分值可以设置为80分,而人名2的第一分值可设置为20分。本实施例中,对文本的属性、文本与文本中人名之间的关系不做限制。
步骤132,根据相似人脸图片与目标人脸图片的相似度,为相似人脸图片中人脸的人名计算第二分值。在本实施例中,容易理解,相似度更高的相似人脸图片中的人脸更可能与目标人脸图片中的人脸为同一张人脸,所以相似度较高的目标人脸图片应该具有更高的分值。假设返回的K张相似图片中,人名Namei出现了M次,对应的相似度分别为Similarityj,计算其第二分值:
Name i face = Σ j = 1 M Similarity j
为便于计算,可将其进行标准化:
Name i face , = Name i face Σ j = 1 K Similarity j
需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,依然落在本发明的范围之内,例如增添参数或倍数值等。
步骤133,根据相同人名具有的第一分值和第二分值计算结果分值,并根据结果分值的大小确定目标人脸图片中人脸的人名。在本实施例中,第一分值和第二分值都反映了所获得的人名为目标人脸图片中人脸的人名的可能性高低,所以综合第一分值和第二分值得到的结果分值,更能够反映每个人名是否为目标人脸图片中人脸的人名的可能性,则按结果分值的大小选择相应的人名作为目标人脸图片中人脸的人名,准确程度非常高。在本实施例中,对结果分值的计算方式不进行限制,例如,其可以是第一分值与第二分值的相加或相乘。例如,人名1的第一分值为80分、第二分值为60分,人名2的第一分值为90分、第二分值为20分,人名3只有第一分值为50分,结果分值的计算方式为第一分值和第二分值相加,则人名1的结果分值为140分、人名2的结果分值为110分,人名3的结果分值为50分,则选择人名1作为目标人脸图片的人名。
在本实施例的技术方案中,基于文本的属性、文本与文本中人名之间的关系得到的第一分值、基于相似人脸图片与目标人脸图片的相似度得到的第二分值,都反映了每个人名为目标人脸图片中人脸的人名的可能性高低,所以按照综合第一分值和第二分值得到的结果分值来选取人名作为目标人脸图片中人脸的人名,这种方式的准确性很高,尤其适用于通过文本提取、通过人脸识别技术得到了多个候选人名的情况。
本发明的另一个实施例提供了一种人脸图片人名识别方法,步骤131,具体包括:
根据文本的属性为文本中的人名计算第一子分值,根据文本与文本中人名的关系计算第二子分值,根据第一子分值和第二子分值计算第一分值。在本实施例中,同时考虑了文本的属性、文本与文本中人名的关系,所以计算得到的第一分值明显能够反映每个人名为目标人脸图片中人脸的人名的可能性高低。
例如,假设文本与文本中的人名的关系为人名在文本中的位置,容易理解人名出现的位置会反映出该人名是否为目标人脸图片中人脸的人名的可能性高低,比如新闻消息中的最先出现的人名往往就是其中的人脸图片中人脸的人名,而较后位置出现的人名为目标人脸图片中人脸的人名的可能性较低,所以第一子分值也能够反映出该人名是否为目标人脸图片中人脸的人名的可能性高低。
例如,假设文本的属性为文本的类型,则一张人脸图片可能有多个文本,其类型可以能是人脸图片的标题、内容、环绕文本等;文本的类型不同,其能反映目标人脸图片中人脸的人名的能力也不同,比如一张人脸图片对应的标题是“明星A、明星B被封国际明星”,从标题仅能获得这张人脸图片可能包含的人名;再结合目标人脸图片对应的正文内容“中国新生代当红人气明星A”就可以找到这张图片对应的人脸的人名。所以,第二子分值也能够反映出该人名是否为目标人脸图片中人脸的人名的可能性高低。
由于同一人名可能出现在P个文本中,所以采用以下方式计算人名第一分值Namei:
Name i Text = Σ p = 1 K Weight p × Weight position
假设共出现人名N个,可以将人名第一分值标准化:
Name i Text , = Name i Text Σ q = 1 N Name q Text
其中,weightp为第一子分值,weightposition为第二子分值。
需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,依然落在本发明的范围之内,例如增添参数或倍数值等。
本发明的另一个实施例提供了一种人脸图片人名识别方法,文本的属性包括但不限于:文本的类型、文本的所在位置和/或文本的发布者。在本实施例中,对于文本的类型,例如,标题中的人名为目标人脸图片中人脸的人名的可能性较高,而正文中的人名为目标人脸图片中人脸的人名的可能性较较低;对于文本的所在位置,文本位于知名网站则人名为目标人脸图片中人脸的人名的可能性较高,而文本位于非知名网站则人名为目标人脸图片中人脸的人名的可能性较较低;对于文本的发布者,较权威者发布文本中的人名为目标人脸图片中人脸的人名的可能性较高,而非权威者发布的文本的人名为目标人脸图片中人脸的人名的可能性较较低。
文本与文本中的人名的关系包括但不限于:文本中的人名在文本中的位置和/或出现次数。在本实施例中,对于文本中的人名在文本中的位置,例如,文本中较前位置的人名为目标人脸图片中人脸的人名的可能性较高,而文本中较后位置的人名为目标人脸图片中人脸的人名的可能性较较低。
如图4所示,本发明的另一个实施例提供了一种人脸图片人名识别方法,步骤120具体包括:
步骤121,获取已收集的人脸图片的特征,以及获取目标人脸图片的特征。在本实施例中,基于人脸特征提取,并通过图像处理算法,检测出人脸图片中人脸的位置,并提取人脸的相关特征,多个特征形成多维向量以用于进行比较,例如,400维的向量。
步骤122,将已收集的人脸图片的特征与目标人脸图片的特征进行比较,并根据比较结果确定相似人脸图片。在本实施例中,通过特征比较的方式,提供了一种有效地识别相似人脸图片的方式。
本发明的另一个实施例提供了一种人脸图片人名识别方法,步骤130具体包括:
计算相同人名具有的第一分值与预设的第一权值的乘积,以及相同人名具有的第二分值与预设的第二权值的乘积,并根据得到的乘积计算结果分值。
在本实施例中,第一权值和第二权值反映了正文和人脸识别两种方式的重要程度,如第一权值设置得较大,则说明用户较看重文本提取的结果,如第二权值设置得较大,则说明用户较看重人脸识别的结果;因此,如果文本来源的可信度较高,则可以将第一权值设置得较大,如果人脸识别的算法较优,则可以将第二权值设置得较大,本实施例的技术方案有利于用户调整第一分值和第二分值的影响程度,从而获得最合理的结果分值。
基于前述实施例的公式,对于人名Namei计算其结果分值:
Name i = Name i Text , × Weight Text + Name i face , × Weight face
然后找出结果分值最高的人名:
Name=MAX(Namei)
如果所选人名的得分大于指定阈值Threshold,则将此人名作为目标人脸图片中人脸的人名进行输出。
需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,依然落在本发明的范围之内,例如增添参数或倍数值等。
本发明的另一个实施例提供了一种人脸图片人名识别方法,文本包括但不限于目标人脸图片对应的文档中的标题、正文和/或目标人脸图片的环绕文本。
如图5所示,本发明的另一个实施例提供了一种人脸图片人名识别装置,其包括:
人名提取模块510,用于从目标人脸图片对应的文本中提取人名。在本实施例中,对于文本的类型不做限制,例如,当目标人脸图片位于一则新闻消息中时,则文本可以是该新闻消息的新闻内容;当目标人脸图片位于一篇科技文档中时,则文本可以是该目标人脸图片的上下文内容。在本实施例中,目标人脸图片通常与其对应文本之间存在紧密的联系,所以可以确定文本中很可能存在着目标人脸图片中的人脸的人名,例如,一则新闻消息中提供了一张明星的个人照片,而新闻内容报道了明星的演唱会情况,则新闻内容中提供了明星照片中明星的人名;一篇科技文档提供了一张科学家的照片,且照片下方的文本是对于该科学家的生平介绍,则照片下方文本中提供了科学家的人名。文本中所提取的人名数量为一个或多个。
人脸识别模块520,用于对目标人脸图片进行人脸识别,识别出目标人脸图片的相似人脸图片,并获取相似人脸图片中人脸的人名。在本实施例中,基于人脸识别技术识别出了目标人脸图片的相似人脸图片,且对所采用的人脸识别技术不进行限制,现有的任何人脸识别技术均可用于本实施例的技术方案。在本实施例中,可以在数据库中预存储大量已收集的人脸图片以及每张人脸图片中人脸的人名,则通过人脸识别技术可以从数据库中找到相似人脸图片,并能够确定相似人脸图片的人名。通过人脸识别技术得到的人名数量为一个或多个。
人名确定模块530,用于根据文本中的人名,以及相似人脸图片中人脸的人名,确定目标人脸图片中人脸的人名。在本实施例中,由于综合考虑了人脸识别技术识别出的人名以及文本中包含的人名,所以能够更加准确地确定目标人脸图片中人脸的人名。在本实施例中,对于如何确定目标人脸图片中人脸的人名的方式不做限制,例如,对于一张新闻消息中的人脸图片,从该新闻消息的新闻内容中提取了“张三、李四”两个人名,通过人脸识别方式得到了目标人脸图片的两张相似人脸图片,并确定该两张相似人脸图片的名字分别为“李四、王五”,则同时被两种方式获取的“李四”的准确性比较较高,所以将“李四”确定为目标人脸图片中人脸的人名;而假如,从该新闻消息的新闻内容中提取了“张三”一个人名,通过人脸识别方式得到了目标人脸图片的一张相似人脸图片,并确定该相似人脸图片的名字为“李四”,则以人脸识别技术得到的结果为准,将“李四”确定为目标人脸图片中人脸图片。
在本实施例的技术方案中,因为目标人脸图片对应的文本往往与目标人脸图片之间具有较紧密的关系,所以文本中涉及的人名包含了目标人脸图片中人脸的人名,而将通过人脸识别技术识别出的相似人脸的人名和从对应文本中得到的人名综合考虑,如示意图图2所示,无疑能够更加准确地确定目标人脸图片中的人脸的人名。
如图6所示,本发明的另一个实施例提供了一种人脸图片人名识别装置,人名确定模块530包括:
第一分值计算模块531,用于根据文本的属性和/或文本与文本中人名之间的关系,为文本中的人名计算第一分值。在本实施例中,文本的不同属性、文本与文本中人名之间的不同关系,能够反映人名为目标人脸图片中人脸的人名的可能性高低。例如,当文本的属性为文本的类型时,例如,一则新闻消息中提供了一张明星的个人照片,而新闻内容报道了明星的演唱会情况,则新闻内容中的人名有很大可能是明星的人名,则文本中每个人名的第一分值可设置为90分;一篇文学作品中提供了一张作者的照片,而其正文中包含的人名可能只是作品主角而非作者的人名,则文本中每个人名的第一分值可设置为10分。同理,当文本与文本中人名的关系为人名在文本中出现的次数时,例如,一则配有人脸图片的新闻消息中,人名1出现了9次,而人名2出现了一次,则容易理解人名1更可能是人脸图片中人脸的人名,所以人名1的第一分值可以设置为80分,而人名2的第一分值可设置为20分。本实施例中,对文本的属性、文本与文本中人名之间的关系不做限制。
第二分值计算模块532,用于根据相似人脸图片与目标人脸图片的相似度,为相似人脸图片中人脸的人名计算第二分值。在本实施例中,容易理解,相似度更高的相似人脸图片中的人脸更可能与目标人脸图片中的人脸为同一张人脸,所以相似度较高的目标人脸图片应该具有更高的分值。假设返回的K张相似图片中,人名Namei出现了M次,对应的相似度分别为Similarityj,计算其第二分值:
Name i face = Σ j = 1 M Similarity j
为便于计算,可将其进行标准化:
Name i face , = Name i face Σ j = 1 K Similarity j
需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,依然落在本发明的范围之内,例如增添参数或倍数值等。
结果分值计算模块533,用于根据相同人名具有的第一分值和第二分值计算结果分值,并根据结果分值的大小确定目标人脸图片中人脸的人名。在本实施例中,第一分值和第二分值都反映了所获得的人名为目标人脸图片中人脸的人名的可能性高低,所以综合第一分值和第二分值得到的结果分值,更能够反映每个人名是否为目标人脸图片中人脸的人名的可能性,则按结果分值的大小选择相应的人名作为目标人脸图片中人脸的人名,准确程度非常高。在本实施例中,对结果分值的计算方式不进行限制,例如,其可以是第一分值与第二分值的相加或相乘。例如,人名1的第一分值为80分、第二分值为60分,人名2的第一分值为90分、第二分值为20分,人名3只有第一分值为50分,结果分值的计算方式为第一分值和第二分值相加,则人名1的结果分值为140分、人名2的结果分值为110分,人名3的结果分值为50分,则选择人名1作为目标人脸图片的人名。
在本实施例的技术方案中,基于文本的属性、文本与文本中人名之间的关系得到的第一分值、基于相似人脸图片与目标人脸图片的相似度得到的第二分值,都反映了每个人名为目标人脸图片中人脸的人名的可能性高低,所以按照综合第一分值和第二分值得到的结果分值来选取人名作为目标人脸图片中人脸的人名,这种方式的准确性很高,尤其适用于通过文本提取、通过人脸识别技术得到了多个候选人名的情况。
本发明的另一个实施例提供了一种人脸图片人名识别装置,第一分值计算模块531根据文本的属性为文本中的人名计算第一子分值,根据文本与文本中人名的关系计算第二子分值,根据第一子分值和第二子分值计算第一分值。在本实施例中,同时考虑了文本的属性、文本与文本中人名的关系,所以计算得到的第一分值明显能够反映每个人名为目标人脸图片中人脸的人名的可能性高低。
例如,假设文本与文本中的人名的关系为人名在文本中的位置,容易理解人名出现的位置会反映出该人名是否为目标人脸图片中人脸的人名的可能性高低,比如新闻消息中的最先出现的人名往往就是其中的人脸图片中人脸的人名,而较后位置出现的人名为目标人脸图片中人脸的人名的可能性较低,所以第一子分值也能够反映出该人名是否为目标人脸图片中人脸的人名的可能性高低。
例如,假设文本的属性为文本的类型,则一张人脸图片可能有多个文本,其类型可以能是人脸图片的标题、内容、环绕文本等;文本的类型不同,其能反映目标人脸图片中人脸的人名的能力也不同,比如一张人脸图片对应的标题是“明星A、明星B被封国际明星”,从标题仅能获得这张人脸图片可能包含的人名;再结合目标人脸图片对应的正文内容“中国新生代当红人气明星A”就可以找到这张图片对应的人脸的人名。所以,第二子分值也能够反映出该人名是否为目标人脸图片中人脸的人名的可能性高低。
由于同一人名可能出现在P个文本中,所以采用以下方式计算人名第一分值Namei
Name i Text = Σ p = 1 K Weight p × Weight position
假设共出现人名N个,可以将人名第一分值标准化:
Name i Text , = Name i Text Σ q = 1 N Name q Text
其中,weightp为第一子分值,weightposition为第二子分值。
需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,依然落在本发明的范围之内,例如增添参数或倍数值等。
本发明的另一个实施例提供了一种人脸图片人名识别装置,文本的属性包括但不限于:文本的类型、文本的所在位置和/或文本的发布者。在本实施例中,对于文本的类型,例如,标题中的人名为目标人脸图片中人脸的人名的可能性较高,而正文中的人名为目标人脸图片中人脸的人名的可能性较较低;对于文本的所在位置,文本位于知名网站则人名为目标人脸图片中人脸的人名的可能性较高,而文本位于非知名网站则人名为目标人脸图片中人脸的人名的可能性较较低;对于文本的发布者,较权威者发布文本中的人名为目标人脸图片中人脸的人名的可能性较高,而非权威者发布的文本的人名为目标人脸图片中人脸的人名的可能性较较低。
文本与文本中的人名的关系包括但不限于:文本中的人名在文本中的位置和/或出现次数。在本实施例中,对于文本中的人名在文本中的位置,例如,文本中较前位置的人名为目标人脸图片中人脸的人名的可能性较高,而文本中较后位置的人名为目标人脸图片中人脸的人名的可能性较较低。
如图7所示,本发明的另一个实施例提供了一种人脸图片人名识别装置,人脸识别模块520包括:
特征提取模块521,用于获取已收集的人脸图片的特征,以及获取目标人脸图片的特征。在本实施例中,基于人脸特征提取,并通过图像处理算法,检测出人脸图片中人脸的位置,并提取人脸的相关特征,多个特征形成多维向量以用于进行比较,例如,400维的向量。
特征比较模块522,用于将已收集的人脸图片的特征与目标人脸图片的特征进行比较,并根据比较结果确定相似人脸图片。在本实施例中,通过特征比较的方式,提供了一种有效地识别相似人脸图片的方式。
本发明的另一个实施例提供了一种人脸图片人名识别装置,结果分值计算模块533计算相同人名具有的第一分值与预设的第一权值的乘积,以及相同人名具有的第二分值与预设的第二权值的乘积,并根据得到的乘积计算结果分值。在本实施例中,第一权值和第二权值反映了正文和人脸识别两种方式的重要程度,如第一权值设置得较大,则说明用户较看重文本提取的结果,如第二权值设置得较大,则说明用户较看重人脸识别的结果;因此,如果文本来源的可信度较高,则可以将第一权值设置得较大,如果人脸识别的算法较优,则可以将第二权值设置得较大,本实施例的技术方案有利于用户调整第一分值和第二分值的影响程度,从而获得最合理的结果分值。
基于前述实施例的公式,对于人名Namei计算其结果分值:
Name i = Name i Text , × Weight Text + Name i face , × Weight face
然后找出结果分值最高的人名:
Name=MAX(Namei)
如果所选人名的得分大于指定阈值Threshold,则将此人名作为目标人脸图片中人脸的人名进行输出。
需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,依然落在本发明的范围之内,例如增添参数或倍数值等。
本发明的另一个实施例提供了一种人脸图片人名识别装置,文本包括但不限于目标人脸图片对应的文档中的标题、正文和/或目标人脸图片的环绕文本。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的人脸图片人名识别装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种人脸图片人名识别方法,其包括:
从目标人脸图片对应的文本中提取人名;
对所述目标人脸图片进行人脸识别,识别出所述目标人脸图片的相似人脸图片,并获取所述相似人脸图片中人脸的人名;
根据所述文本中的人名,以及所述相似人脸图片中人脸的人名,确定所述目标人脸图片中人脸的人名。
2.根据权利要求1所述的方法,其中,根据所述文本中的人名,以及所述相似人脸图片中人脸的人名,确定所述目标人脸图片中人脸的人名,具体包括:
根据所述文本的属性和/或所述文本与所述文本中人名之间的关系,为所述文本中的人名计算第一分值;
根据所述相似人脸图片与所述目标人脸图片的相似度,为所述相似人脸图片中人脸的人名计算第二分值;
根据相同人名具有的第一分值和第二分值计算结果分值,并根据结果分值的大小确定所述目标人脸图片中人脸的人名。
3.根据权利要求1-2任一项所述的方法,其中,根据所述文本的属性和/或所述文本与所述文本中人名之间的关系,为所述文本中的人名计算第一分值,具体包括:
根据所述文本的属性为所述文本中的人名计算第一子分值,根据所述文本与所述文本中人名的关系计算第二子分值,根据所述第一子分值和所述第二子分值计算所述第一分值。
4.根据权利要求1-3任一项所述的方法,其中,
所述文本的属性包括:所述文本的类型、所述文本的所在位置和/或所述文本的发布者;
所述文本与所述文本中的人名的关系包括:所述文本中的人名在所述文本中的位置和/或出现次数。
5.根据权利要求1-4任一项所述的方法,其中,对所述目标人脸图片进行人脸识别,识别出所述目标人脸图片的相似人脸图片,具体包括:
获取已收集的人脸图片的特征,以及获取所述目标人脸图片的特征;
将所述已收集的人脸图片的特征与所述目标人脸图片的特征进行比较,并根据比较结果确定所述相似人脸图片。
6.根据权利要求1-5任一项所述的方法,其中,根据相同人名具有的第一分值和第二分值计算结果分值,具体包括:
计算所述相同人名具有的第一分值与预设的第一权值的乘积,以及所述相同人名具有的第二分值与预设的第二权值的乘积,并根据得到的乘积计算所述结果分值。
7.根据权利要求1-6中任一项所述的方法,其中,
所述文本包括所述目标人脸图片对应的文档中的标题、正文和/或所述目标人脸图片的环绕文本。
8.一种人脸图片人名识别装置,其包括:
人名提取模块,用于从目标人脸图片对应的文本中提取人名;
人脸识别模块,用于对所述目标人脸图片进行人脸识别,识别出所述目标人脸图片的相似人脸图片,并获取所述相似人脸图片中人脸的人名;
人名确定模块,用于根据所述文本中的人名,以及所述相似人脸图片中人脸的人名,确定所述目标人脸图片中人脸的人名。
9.根据权利要求8所述的装置,其中,所述人名确定模块包括:
第一分值计算模块,用于根据所述文本的属性和/或所述文本与所述文本中人名之间的关系,为所述文本中的人名计算第一分值;
第二分值计算模块,用于根据所述相似人脸图片与所述目标人脸图片的相似度,为所述相似人脸图片中人脸的人名计算第二分值;
结果分值计算模块,用于根据相同人名具有的第一分值和第二分值计算结果分值,并根据结果分值的大小确定所述目标人脸图片中人脸的人名。
10.根据权利要求8-9任一项所述的装置,其中,
所述第一分值计算模块根据所述文本的属性为所述文本中的人名计算第一子分值,根据所述文本与所述文本中人名的关系计算第二子分值,根据所述第一子分值和所述第二子分值计算所述第一分值。
CN201410539153.3A 2014-10-13 2014-10-13 人脸图片人名识别方法和装置 Pending CN104281842A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410539153.3A CN104281842A (zh) 2014-10-13 2014-10-13 人脸图片人名识别方法和装置
PCT/CN2015/091869 WO2016058520A1 (zh) 2014-10-13 2015-10-13 人脸图片人名识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410539153.3A CN104281842A (zh) 2014-10-13 2014-10-13 人脸图片人名识别方法和装置

Publications (1)

Publication Number Publication Date
CN104281842A true CN104281842A (zh) 2015-01-14

Family

ID=52256702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410539153.3A Pending CN104281842A (zh) 2014-10-13 2014-10-13 人脸图片人名识别方法和装置

Country Status (2)

Country Link
CN (1) CN104281842A (zh)
WO (1) WO2016058520A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016058520A1 (zh) * 2014-10-13 2016-04-21 北京奇虎科技有限公司 人脸图片人名识别方法和装置
CN107943892A (zh) * 2017-11-16 2018-04-20 海信集团有限公司 一种视频中主要角色名称的确定方法及装置
CN108882033A (zh) * 2018-07-19 2018-11-23 北京影谱科技股份有限公司 一种基于视频语音的人物识别方法、装置、设备和介质
CN109034040A (zh) * 2018-07-19 2018-12-18 北京影谱科技股份有限公司 一种基于演员表的人物识别方法、装置、设备和介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG10202000100YA (en) 2020-01-06 2020-07-29 Alipay Labs Singapore Pte Ltd Biometric based user identity verification

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402593A (zh) * 2010-11-05 2012-04-04 微软公司 对于搜索查询输入的多模态方式
US20130216107A1 (en) * 2012-02-20 2013-08-22 Chih-Hsung Huang Method of surveillance by face recognition
CN103793697A (zh) * 2014-02-17 2014-05-14 北京旷视科技有限公司 一种人脸图像的身份标注方法及人脸身份识别方法
CN104091164A (zh) * 2014-07-28 2014-10-08 北京奇虎科技有限公司 人脸图片人名识别方法和系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739428B (zh) * 2008-11-10 2012-04-18 中国科学院计算技术研究所 一种对多媒体创建索引的方法
US8559682B2 (en) * 2010-11-09 2013-10-15 Microsoft Corporation Building a person profile database
JP2013235329A (ja) * 2012-05-07 2013-11-21 Taiwan Colour & Imaging Technology Corp 顔識別監視管理方法
CN104281842A (zh) * 2014-10-13 2015-01-14 北京奇虎科技有限公司 人脸图片人名识别方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402593A (zh) * 2010-11-05 2012-04-04 微软公司 对于搜索查询输入的多模态方式
US20130216107A1 (en) * 2012-02-20 2013-08-22 Chih-Hsung Huang Method of surveillance by face recognition
CN103793697A (zh) * 2014-02-17 2014-05-14 北京旷视科技有限公司 一种人脸图像的身份标注方法及人脸身份识别方法
CN104091164A (zh) * 2014-07-28 2014-10-08 北京奇虎科技有限公司 人脸图片人名识别方法和系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016058520A1 (zh) * 2014-10-13 2016-04-21 北京奇虎科技有限公司 人脸图片人名识别方法和装置
CN107943892A (zh) * 2017-11-16 2018-04-20 海信集团有限公司 一种视频中主要角色名称的确定方法及装置
CN107943892B (zh) * 2017-11-16 2021-12-21 海信集团有限公司 一种视频中主要角色名称的确定方法及装置
CN108882033A (zh) * 2018-07-19 2018-11-23 北京影谱科技股份有限公司 一种基于视频语音的人物识别方法、装置、设备和介质
CN109034040A (zh) * 2018-07-19 2018-12-18 北京影谱科技股份有限公司 一种基于演员表的人物识别方法、装置、设备和介质
CN109034040B (zh) * 2018-07-19 2021-11-23 北京影谱科技股份有限公司 一种基于演员表的人物识别方法、装置、设备和介质

Also Published As

Publication number Publication date
WO2016058520A1 (zh) 2016-04-21

Similar Documents

Publication Publication Date Title
CN112507068B (zh) 文档查询方法、装置、电子设备和存储介质
US10558754B2 (en) Method and system for automating training of named entity recognition in natural language processing
US9424524B2 (en) Extracting facts from unstructured text
CN105653984B (zh) 文件指纹校验方法及装置
US10943071B2 (en) Statistical preparation of data using semantic clustering
CN111581355B (zh) 威胁情报的主题检测方法、装置和计算机存储介质
CN104281842A (zh) 人脸图片人名识别方法和装置
US20200265074A1 (en) Searching multilingual documents based on document structure extraction
CN110309251B (zh) 文本数据的处理方法、装置和计算机可读存储介质
CA2656425A1 (en) Recognizing text in images
CN106528508A (zh) 一种重复文本的判定方法和装置
CN104731509A (zh) 基于触摸操作的搜索方法、装置和终端
US20160124939A1 (en) Disambiguation in mention detection
CN104091164A (zh) 人脸图片人名识别方法和系统
WO2020194004A1 (en) Methods and apparatus to detect a text region of interest in a digital image using machine-based analysis
US10528609B2 (en) Aggregating procedures for automatic document analysis
CN104537341A (zh) 人脸图片信息获取方法和装置
CN104463177A (zh) 相似人脸图片获取方法和装置
CN107330079B (zh) 基于人工智能呈现辟谣信息的方法和装置
CN104750791A (zh) 一种图像检索方法及装置
CN113591881B (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
CN109492401B (zh) 一种内容载体风险检测方法、装置、设备及介质
US20190372998A1 (en) Exchange-type attack simulation device, exchange-type attack simulation method, and computer readable medium
CN110569370A (zh) 一种知识图谱的构建方法、装置、电子设备及存储介质
CN114241501A (zh) 影像文档处理方法、装置及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150114

RJ01 Rejection of invention patent application after publication