CN107704520A - 基于人脸识别的多文件检索方法和装置 - Google Patents

基于人脸识别的多文件检索方法和装置 Download PDF

Info

Publication number
CN107704520A
CN107704520A CN201710792718.2A CN201710792718A CN107704520A CN 107704520 A CN107704520 A CN 107704520A CN 201710792718 A CN201710792718 A CN 201710792718A CN 107704520 A CN107704520 A CN 107704520A
Authority
CN
China
Prior art keywords
face
identified
file
user
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710792718.2A
Other languages
English (en)
Other versions
CN107704520B (zh
Inventor
彭松
秦锋剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Green Bay Network Technology Co., Ltd.
Original Assignee
Grass Count Language (beijing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Grass Count Language (beijing) Technology Co Ltd filed Critical Grass Count Language (beijing) Technology Co Ltd
Priority to CN201710792718.2A priority Critical patent/CN107704520B/zh
Publication of CN107704520A publication Critical patent/CN107704520A/zh
Application granted granted Critical
Publication of CN107704520B publication Critical patent/CN107704520B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种基于人脸识别的多文件检索方法和装置,方法包括:获取多个待识别文件,若待识别文件为文档格式文件,根据该文档记载的用户标识,检索得到对应的待识别人脸,若待识别文件为图片格式文件,读取其中记载的目标人脸,在待识别人脸中,查询与目标人脸相似的相似人脸,根据相似人脸对应的用户标识,对目标人脸进行标记。通过从文档格式文件中获取用户标识,根据用户标识检索得到缩小了检索范围的待识别人脸,再对图片格式文件中的人脸在待识别人脸中进行匹配检索,则提高了检索的效率和识别的准确度,解决现有技术中当检索对象为多个文件时,需要用户手动多次操作,且检索范围较大,致使检索的效率和识别的准确度较低的问题。

Description

基于人脸识别的多文件检索方法和装置
技术领域
本发明涉及信息检索技术领域,尤其涉及一种基于人脸识别的多文件检索方法和装置。
背景技术
目前,信息检索的最常见的方式,是通过已经预先获得的检索的关键字,在搜索引擎的文本框中输入关键字,从而获得检索结果。
随着电子产品的普及,电脑,摄像类产品等已经成为人们日常生活中常用的设备,电子文档和图像文件的数量增加,人们经常需要在多个文件中检索出需要的信息。
目前,当人们需要检索一个文件内容时,需要手动打开文件,找出相关的关键词,通过文档的检索工具,对单个文件进行检索,而当检索的对象是多个文件,且文件格式也不相同时,用户需要进行多次操作,当数据量较大时,检索的效率和准确度都不高。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一目的在于提出一种基于人脸识别的多文件检索方法,以实现通过从文档格式文件中获取用户标识,根据用户标识检索得到缩小了检索范围的待识别人脸,再对图片格式文件中的人脸在待识别人脸中进行匹配检索,从而提高了检索的效率和识别的准确度,解决了现有技术中当需要同时对多个文件进行检索时,需要用户手动多次操作,且检索范围较大,致使检索的效率和识别的准确度较低的问题。
本发明得第二个目的在于提出一种基于人脸识别的多文件检索装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种计算机可读存储介质。
为达上述目的,本发明第一方面实施例提出了一种基于人脸识别的多文件检索方法,包括:
获取多个待识别文件;
识别每一个所述待识别文件的格式;
若所述待识别文件为文档格式文件,根据所述文档格式文件记载的用户标识,从预设人脸库中,检索得到所述用户标识对应的待识别人脸,作为所述文档格式文件的人脸识别结果;
若所述待识别文件为图片格式文件,读取所述图片格式文件记载的目标人脸;
在所述待识别人脸中,查询与所述目标人脸相似的相似人脸,得到所述相似人脸对应的用户标识;
根据所述相似人脸对应的用户标识,对所述图片格式文件记载的目标人脸进行标记,得到所述图片格式文件的人脸识别结果。
本实施例的基于人脸识别的多文件检索方法中,获取多个待识别文件,若待识别文件为文档格式文件,根据该文件记载的用户标识,检索得到对应的待识别人脸,作为文档格式文件的人脸识别结果,若待识别文件为图片格式文件,读取其中记载的目标人脸,在待识别人脸中,查询与目标人脸相似的相似人脸,根据相似人脸对应的用户标识,对目标人脸进行标记,得到图片格式文件的人脸识别结果。通过从文档格式文件中获取用户标识,根据用户标识检索得到缩小了检索范围的待识别人脸,再对图片格式文件中的人脸在待识别人脸中进行匹配检索,则提高了检索的效率和识别的准确度,解决现有技术中当检索对象为多个文件时,需要用户手动多次操作,且检索范围较大,致使检索的效率和识别的准确度较低的问题。
为达上述目的,本发明第二方面实施例提出了一种基于人脸识别的多文件检索装置,包括:
获取模块,用于获取多个待识别文件;
识别模块,用于识别每一个所述待识别文件的格式;
第一处理模块,用于若所述待识别文件为文档格式文件,根据所述文档格式文件记载的用户标识,从预设人脸库中,检索得到所述用户标识对应的待识别人脸,作为所述文档格式文件的人脸识别结果;
第二处理模块,用于若所述待识别文件为图片格式文件,读取所述图片格式文件记载的目标人脸;
查询模块,用于在所述待识别人脸中,查询与所述目标人脸相似的相似人脸,得到所述相似人脸对应的用户标识;根据所述相似人脸对应的用户标识,对所述图片格式文件记载的目标人脸进行标记,得到所述图片格式文件的人脸识别结果。
本发明实施例的基于人脸识别的多文件检索装置中,获取模块用于获取多个待识别文件,识别模块用于识别每一个待识别文件的格式,第一处理模块用于若待识别文件为文档格式文件,根据文档格式文件记载的用户标识,从预设人脸库中,检索得到用户标识对应的待识别人脸,作为文档格式文件的人脸识别结果,第二处理模块用于若待识别文件为图片格式文件,读取图片格式文件记载的目标人脸,查询模块用于在待识别人脸中,查询与目标人脸相似的相似人脸,得到相似人脸对应的用户标识,根据相似人脸对应的用户标识,对图片格式文件记载的目标人脸进行标记,得到图片格式文件的人脸识别结果。通过从文档格式文件中获取用户标识,根据用户标识检索得到缩小了检索范围的待识别人脸,再对图片格式文件中的人脸在待识别人脸中进行匹配检索,则提高了检索的效率和识别的准确度,解决现有技术中当检索对象为多个文件时,需要用户手动多次操作,且检索范围较大,致使检索的效率和识别的准确度较低的问题。
为达上述目的,本发明第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如第一方面实施例所述的基于人脸识别的多文件检索方法。
为了实现上述目的,本发明第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面实施例所述的基于人脸识别的多文件检索方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例所提供的一种基于人脸识别的多文件检索方法的流程示意图;
图2为本发明实施例所提供的获取待识别人脸的方法的流程示意图;
图3为本实施例所提供的另一种基于人脸识别的多文件检索方法的流程示意图;
图4为本发明实施例提供的一种基于人脸识别的多文件检索装置的结构示意图;以及
图5为本发明实施例所提供的另一种基于人脸识别的多文件检索装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的基于人脸识别的多文件检索方法和装置。
图1为本发明实施例所提供的一种基于人脸识别的多文件检索方法的流程示意图。
如图1所示,该方法包括以下步骤:
步骤S101,获取多个待识别文件。
具体地,获取用户上传的多个待识别的文件,其中上传的待识别文件可以单独的文件,也可以是目录文件,还可以是压缩包等,本实施例中不做限定,都适用于本实施例的多文件检索方法。
步骤S102,识别每一个待识别文件的格式。
具体地,用户上传的待识别文件包括文档格式文件和图片格式文件,根据待识别文件的扩展名识别出文档格式文件和图片格式文件,其中,待识别文件中至少包含一个文档格式文件和一个图片格式文件。
其中,文档格式文件可以为word文档文件,或者为PDF文档文件,或者为纯文本格式文档文件等,本实施例中对文档格式的文件类型不做限定,同样,对图片格式的文件的文件类型也不做具体限定。
步骤S103,若待识别文件为文档格式文件,根据文档格式文件记载的用户标识,从预设人脸库中,检索得到用户标识对应的待识别人脸,作为文档格式文件的人脸识别结果。
具体地,若待识别文件为文档格式文件,则识别出文档格式文件的字符,从识别出的字符中,提取用户标识,其中,用户标识包括身份证号和/或手机号。根据获得的用户标识从预设的人脸库中检索得到用户标识对应的待识别人脸。
其中,预设人脸库中包含人脸和人脸对应的相关用户标识,如人脸对应的身份证,和/或手机号码,和/或姓名等等。
举例,待识别文件中包含2个文档格式文件,2个文档格式文件中,包含不同的用户标识,为了便于区分,2个文档格式文件称为文档格式文件1和文档格式文件2,对应的用户标识分别为身份证号码和手机号码。其中,文档格式文件1中包含10000个身份证号码的用户标识,文档格式文件2中包含1000个手机号码的用户标识。作为一种可能的实现方式,首先,通过身份证号码的用户标识对预设人脸库进行检索,得到身份证号码的用户标识对应的待识别人脸A,作为文档格式文件1的人脸识别结果。然后根据手机号码的用户标识对待识别人脸A中的人脸进一步检索,得到待识别人脸B,作为文档格式文件2的人脸识别结果,而最后一次检索得到的待识别人脸B则作为文档格式文件的人脸识别结果,作为人脸的检索范围。
需要说明的是,待识别人脸A一个人脸的集合,其中的人脸的数量和身份证号码的用户标识的数量相同,即有10000个待识别人脸。待识别人脸B也是一个人脸的集合,待识别人脸B中人脸的数量小于等于手机号码的用户标识个数。即用户标识越多,最后检索得到的查询范围就越小,检索效率和准确度就越高。
步骤S104,若待识别文件为图片格式文件,读取图片格式文件记载的目标人脸。
具体地,若待识别文件为图像格式文件,根据现有技术中的人脸识别算法,从图片格式文件中识别出目标人脸,本实施例中对人脸识别的算法不做限定。
步骤S105,在待识别人脸中,查询与目标人脸相似的相似人脸,得到相似人脸对应的用户标识。
具体地,根据用户标识从预设人脸库中检索得到待识别人脸,进而从待识别人脸中查询与目标人脸相似的相似人脸,作为一种可能的实现方式,可将目标人脸和待识别人脸分别提取特征点并进行特征点对比分析,查询出与目标人脸相似的相似人脸,相似人脸是属于待识别人脸的,从而可以得到对应的用户标识。
例如,本步骤中的待识别人脸,即为步骤S103中得到的待识别人脸B,在待识别人脸B中,查询与目标人脸相似的相似人脸,从而得到相似人脸对应的用户标识,即身份证号码和手机号。
步骤S106,根据相似人脸对应的用户标识,对图片格式文件记载的目标人脸进行标记,得到图片格式文件的人脸识别结果。
具体地,根据得到的相似人脸的用户标识,将该用户标识标记到目标人脸,得到目标人脸对应的用户标识,将该包含用户标识的目标人脸作为图片格式文件的人脸识别结果。
例如,根据用户标识手机号码和电话号码,对目标人脸进行标记,得到图片格式文件的人脸识别结果,即得到该人脸图像对应的用户是谁,身份号码是多少,手机号码是多少。
需要说明的是,本实施例中,是以文档格式文件为2个,即对应用户标识为2种,而图像格式文件为1个,即对应目标人脸为1个的情况进行举例说明的,对文档格式文件为1个,图像格式文件也为一个的情况,或者文档格式文件和图像格式文件均为多个的情况,其实现原理相同,本实施例中不再一一赘述。
本实施例的基于人脸识别的多文件检索方法中,获取多个待识别文件,若待识别文件为文档格式文件,根据该文件记载的用户标识,检索得到对应的待识别人脸,作为文档格式文件的人脸识别结果,若待识别文件为图片格式文件,读取其中记载的目标人脸,在待识别人脸中,查询与目标人脸相似的相似人脸,根据相似人脸对应的用户标识,对目标人脸进行标记,得到图片格式文件的人脸识别结果。通过从文档格式文件中获取用户标识,根据用户标识检索得到缩小了检索范围的待识别人脸,再对图片格式文件中的人脸在待识别人脸中进行匹配检索,则提高了检索的效率和识别的准确度,解决现有技术中当检索对象为多个文件时,需要用户手动多次操作,且检索范围较大,致使检索的效率和识别的准确度较低的问题。
在上一实施例基础上,本发明实施例还提出了一种根据得到的用户标识获得待识别人脸的方法,确定了查询范围,图2为本发明实施例所提供的获取待识别人脸的方法的流程示意图,基于上述实施例,如图2所示,步骤S103可以包括:
步骤S1031,识别文档格式文件的字符。
具体地,当识别文件为文档格式文件时,识别出文档格式文件中的字符。文档中包括汉字、数字和字母,其中,汉字占用2个字符,数字和字母占用一个字符。
步骤S1032,从识别出的字符中,提取用户标识。
具体地,用户标识包括身份证号和/或手机号。从识别出的字符串,提取用户标识,作为一种可能的实现方式,对于占用一个字符的数字或字母,根据识别出的字符,得到该字符对应的二进制数,将二进制数对应美国信息交换标准代码(American Standard Codefor Information Interchange,ASCII)表查询,得到该字符对应的数字或者字母,进而查询出所有的字符对应的数字或者字母,若提取得到的数字序列为连续的18位数字,则该数字序列识别为身份证号码,若提取得到的数字序列为连续11个数字且为1开头,则该数字序列识别为用户的手机号。
需要说明的是,本实施例中的身份证号码和手机号码的识别原则,是按照中国的编码规则进行的,对于识别其他国家的身份证号码和手机号码,实现原理类似,此处不做赘述。
例如,若用户标识为身份证号码,从文档格式文件中提取出了1000个身份证号码,这1000个身份证号码则为文档格式文件确定的用户标识。
步骤S1033,根据用户标识从预设人脸库中,检索得到用户标识对应的待识别人脸。
具体地,预设人脸库中包括海量的人脸信息,人脸信息对应有该用户的个人信息,至少包含:身份证号码,手机号等等。例如,根据上述步骤提取出的1000个身份证号码的用户标识,作为查询范围,对预设人脸库进行检索,则可以检索得到1000个身份证号码对应的人脸,该1000个人脸即为确认的人脸查询范围,称为待识别人脸。
本发明实施例的获取待识别人脸的方法中,通过文本文档中提取得到的用户标识,根据该用户标识在预设人脸库中进行检索,得到待识别人脸,缩小了人脸查询的范围,为下一步的查询提高了查询的速度和效率。
在上述实施例的基础上,本实施例提供了另一种基于人脸识别的多文件检索方法,进一步解释了对查询结果的处理和输出方式,图3为本实施例所提供的另一种基于人脸识别的多文件检索方法的流程示意图,如图3所示,步骤S106之后,还可以包括如下步骤:
步骤S301,判断是否按照预设的输出类型输出结果,若是,执行步骤S302,若否,执行步骤S303。
具体地,对每个待识别文件进行识别后,还会对识别的结果进行输出,如果是按照预设的输出类型进行输出,则直接输出识别结果,否则,则对识别结果按照预设的运算方式运算后,输出运算结果。
步骤S302,按照预设输出类型输出结果。
具体地,预设的输出类型有2种,一种为输出全部结果;一种为输出单个结果。如果预设的输出类型为输出全部结果,则对各个待识别文件的人脸识别结果进行输出,即可以查看所有待识别文件的人脸识别结果;如果预设的输出类型为输出部分结果,则对选定的待识别文件的人脸识别结果进行输出,即可以查看单个待识别文件的人脸识别结果。
步骤S303,按照预设运算方式进行集合运算,并输出运算结果。
具体地,若没有预设输出类型,则对得到的待识别文件的人脸识别结果按照预设的运算方式进行集合运算,得到集合运算的结果,其中,运算方式包括交集运算,和/或并集运算。
本实施例的基于人脸识别的多文件检索方法中,获取多个待识别文件,若待识别文件为文档格式文件,根据该文件记载的用户标识,检索得到对应的待识别人脸,作为文档格式文件的人脸识别结果,若待识别文件为图片格式文件,读取其中记载的目标人脸,在待识别人脸中,查询与目标人脸相似的相似人脸,根据相似人脸对应的用户标识,对目标人脸进行标记,得到图片格式文件的人脸识别结果,并可对识别结果进行按照不同的输出类型进行输出,或者按照预设的运算方式进行集合运算并输出。相较于上一实施例,不仅能够解决现有技术中当检索对象为多个文件时,需要用户手动多次操作,且检索范围较大,致使检索的效率和识别的准确度较低的问题,而且进一步通过对待识别文件的人脸识别结果按照预设类型进行输出,使得输出结果可以按照用户需求进行输出,而采用预设的集合运算方式对输出结果进行集合运算后输出,则可以使输出结果更加多样性,交集运算还可以提高人脸识别的准确度。
为了实现上述实施例,本发明还提出一种基于人脸识别的多文件检索装置。
图4为本发明实施例提供的一种基于人脸识别的多文件检索装置的结构示意图。
如图4所示,该装置包括:获取模块41、识别模块42、第一处理模块43、第二处理模块44和查询模块45。
获取模块41,用于获取多个待识别文件。
识别模块42,用于识别每一个待识别文件的格式。
第一处理模块43,用于若待识别文件为文档格式文件,根据文档格式文件记载的用户标识,从预设人脸库中,检索得到用户标识对应的待识别人脸,作为文档格式文件的人脸识别结果。
第二处理模块44,用于若待识别文件为图片格式文件,读取图片格式文件记载的目标人脸。
查询模块45,用于在待识别人脸中,查询与目标人脸相似的相似人脸,得到相似人脸对应的用户标识,根据相似人脸对应的用户标识,对图片格式文件记载的目标人脸进行标记,得到图片格式文件的人脸识别结果。
需要说明的是,前述对方法实施例的解释说明也适用于该实施例的装置,此处不再赘述。
本发明实施例的基于人脸识别的多文件检索装置中,获取模块用于获取多个待识别文件,识别模块用于识别每一个待识别文件的格式,第一处理模块用于若待识别文件为文档格式文件,根据文档格式文件记载的用户标识,从预设人脸库中,检索得到用户标识对应的待识别人脸,作为文档格式文件的人脸识别结果,第二处理模块用于若待识别文件为图片格式文件,读取图片格式文件记载的目标人脸,查询模块用于在待识别人脸中,查询与目标人脸相似的相似人脸,得到相似人脸对应的用户标识,根据相似人脸对应的用户标识,对图片格式文件记载的目标人脸进行标记,得到图片格式文件的人脸识别结果。通过从文档格式文件中获取用户标识,根据用户标识检索得到缩小了检索范围的待识别人脸,再对图片格式文件中的人脸在待识别人脸中进行匹配检索,则提高了检索的效率和识别的准确度,解决现有技术中当检索对象为多个文件时,需要用户手动多次操作,且检索范围较大,致使检索的效率和识别的准确度较低的问题。
基于上述实施例,本发明实施例还提供了一种基于人脸识别的多文件检索装置的可能的实现方式,图5为本发明实施例所提供的另一种基于人脸识别的多文件检索装置的结构示意图,在上一实施例的基础上,该装置还包括:输出模块46。
输出模块46,用于若预设的输出类型为输出全部结果,对各个待识别文件的人脸识别结果进行输出;若预设的输出类型为输出单个结果,对选定的待识别文件的人脸识别结果进行输出。
作为一种可能的实现方式,输出模块46,具体还用于:
还用于依据预设运算方式,对各个待识别文件进行集合运算,得到集合运算结果,并输出集合运算结果。其中,运算方式包括交集运算和/或并集运算。
作为一种可能的实现方式,第一处理模块43,包括:识别单元431、提取单元432和检索单元433。
识别单元431,用于识别文档格式文件的字符。
提取单元432,用于从识别出的字符中,提取用户标识,其中,用户标识包括身份证号和/或手机号。
检索单元433,用于根据用户标识从预设人脸库中,检索得到用户标识对应的待识别人脸。
需要说明的是,前述对方法实施例的解释说明也适用于该实施例的装置,此处不再赘述。
本发明实施例的基于人脸识别的多文件检索装置中,获取模块用于获取多个待识别文件,识别模块用于识别每一个待识别文件的格式,第一处理模块用于若待识别文件为文档格式文件,根据文档格式文件记载的用户标识,从预设人脸库中,检索得到用户标识对应的待识别人脸,作为文档格式文件的人脸识别结果,第二处理模块用于若待识别文件为图片格式文件,读取图片格式文件记载的目标人脸,查询模块用于在待识别人脸中,查询与目标人脸相似的相似人脸,得到相似人脸对应的用户标识,根据相似人脸对应的用户标识,对图片格式文件记载的目标人脸进行标记,得到图片格式文件的人脸识别结果。通过从文档格式文件中获取用户标识,根据用户标识检索得到缩小了检索范围的待识别人脸,再对图片格式文件中的人脸在待识别人脸中进行匹配检索,则提高了检索的效率和识别的准确度,解决现有技术中当检索对象为多个文件时,需要用户手动多次操作,且检索范围较大,致使检索的效率和识别的准确度较低的问题。
为了实现上述实施例,本发明还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现前述方法实施例所述的基于人脸识别的多文件检索方法。
为了实现上述实施例,本发明还提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现前述方法实施例所述的基于人脸识别的多文件检索方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种基于人脸识别的多文件检索方法,其特征在于,包括以下步骤:
获取多个待识别文件;
识别每一个所述待识别文件的格式;
若所述待识别文件为文档格式文件,根据所述文档格式文件记载的用户标识,从预设人脸库中,检索得到所述用户标识对应的待识别人脸,作为所述文档格式文件的人脸识别结果;
若所述待识别文件为图片格式文件,读取所述图片格式文件记载的目标人脸;
在所述待识别人脸中,查询与所述目标人脸相似的相似人脸,得到所述相似人脸对应的用户标识;
根据所述相似人脸对应的用户标识,对所述图片格式文件记载的目标人脸进行标记,得到所述图片格式文件的人脸识别结果。
2.根据权利要求1所述的基于人脸识别的多文件检索方法,其特征在于,所述方法,还包括:
若预设的输出类型为输出全部结果,对各个待识别文件的人脸识别结果进行输出;
若预设的输出类型为输出单个结果,对选定的待识别文件的人脸识别结果进行输出。
3.根据权利要求2所述的基于人脸识别的多文件检索方法,其特征在于,所述方法,还包括:
依据预设运算方式,对各个待识别文件进行集合运算,得到集合运算结果;所述运算方式包括交集运算和/或并集运算;
输出所述集合运算结果。
4.根据权利要求1-3任一项所述的基于人脸识别的多文件检索方法,其特征在于,所述根据所述文档格式文件记载的用户标识,从预设人脸库中,检索得到所述用户标识对应的待识别人脸,包括:
识别所述文档格式文件的字符;
从识别出的字符中,提取所述用户标识;所述用户标识包括身份证号和/或手机号;
根据所述用户标识从预设人脸库中,检索得到所述用户标识对应的待识别人脸。
5.一种基于人脸识别的多文件检索装置,其特征在于,包括:
获取模块,用于获取多个待识别文件;
识别模块,用于识别每一个所述待识别文件的格式;
第一处理模块,用于若所述待识别文件为文档格式文件,根据所述文档格式文件记载的用户标识,从预设人脸库中,检索得到所述用户标识对应的待识别人脸,作为所述文档格式文件的人脸识别结果;
第二处理模块,用于若所述待识别文件为图片格式文件,读取所述图片格式文件记载的目标人脸;
查询模块,用于在所述待识别人脸中,查询与所述目标人脸相似的相似人脸,得到所述相似人脸对应的用户标识;根据所述相似人脸对应的用户标识,对所述图片格式文件记载的目标人脸进行标记,得到所述图片格式文件的人脸识别结果。
6.根据权利要求5所述的基于人脸识别的多文件检索装置,其特征在于,所述装置,还包括:
输出模块,用于若预设的输出类型为输出全部结果,对各个待识别文件的人脸识别结果进行输出;若预设的输出类型为输出单个结果,对选定的待识别文件的人脸识别结果进行输出。
7.根据权利要求6所述的基于人脸识别的多文件检索装置,其特征在于,
所述输出模块,还用于依据预设运算方式,对各个待识别文件进行集合运算,得到集合运算结果;所述运算方式包括交集运算和/或并集运算;输出所述集合运算结果。
8.根据权利要求5-7任一项所述的基于人脸识别的多文件检索装置,其特征在于,所述第一处理模块,包括:
识别单元,用于识别所述文档格式文件的字符;
提取单元,用于从识别出的字符中,提取所述用户标识;所述用户标识包括身份证号和/或手机号;
检索单元,用于根据所述用户标识从预设人脸库中,检索得到所述用户标识对应的待识别人脸。
9.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-4中任一所述的基于人脸识别的多文件检索方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一所述的基于人脸识别的多文件检索方法。
CN201710792718.2A 2017-09-05 2017-09-05 基于人脸识别的多文件检索方法和装置 Active CN107704520B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710792718.2A CN107704520B (zh) 2017-09-05 2017-09-05 基于人脸识别的多文件检索方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710792718.2A CN107704520B (zh) 2017-09-05 2017-09-05 基于人脸识别的多文件检索方法和装置

Publications (2)

Publication Number Publication Date
CN107704520A true CN107704520A (zh) 2018-02-16
CN107704520B CN107704520B (zh) 2020-09-11

Family

ID=61172086

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710792718.2A Active CN107704520B (zh) 2017-09-05 2017-09-05 基于人脸识别的多文件检索方法和装置

Country Status (1)

Country Link
CN (1) CN107704520B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109471718A (zh) * 2018-10-12 2019-03-15 平安科技(深圳)有限公司 基于人脸识别的计算资源配置方法、装置、设备及介质
CN109635148A (zh) * 2018-12-14 2019-04-16 深圳英飞拓科技股份有限公司 人脸图片存储方法及装置
CN110059560A (zh) * 2019-03-18 2019-07-26 阿里巴巴集团控股有限公司 人脸识别的方法、装置及设备
CN111382286A (zh) * 2018-12-27 2020-07-07 深圳云天励飞技术有限公司 数据处理方法及相关产品

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009079769A1 (en) * 2007-12-21 2009-07-02 University Of Northern British Columbia Methods and systems for electoral-college-based image recognition
CN101820489A (zh) * 2009-02-27 2010-09-01 佳能株式会社 图像处理设备及图像处理方法
CN102521619A (zh) * 2011-11-22 2012-06-27 汉王科技股份有限公司 基于人脸识别的信息呈现方法及装置和人脸识别打印系统
CN104123565A (zh) * 2014-07-30 2014-10-29 中山艺展装饰工程有限公司 基于多模态识别的身份证认证与持有人同一性认证方法
CN104504321A (zh) * 2015-01-05 2015-04-08 湖北微模式科技发展有限公司 一种基于摄像头实现远程用户身份验证的方法与系统
CN104519267A (zh) * 2013-09-30 2015-04-15 北京三星通信技术研究有限公司 一种控制拍摄的方法及终端设备
CN106295313A (zh) * 2016-08-03 2017-01-04 北京地平线机器人技术研发有限公司 对象身份管理方法、装置和电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009079769A1 (en) * 2007-12-21 2009-07-02 University Of Northern British Columbia Methods and systems for electoral-college-based image recognition
CN101820489A (zh) * 2009-02-27 2010-09-01 佳能株式会社 图像处理设备及图像处理方法
CN102521619A (zh) * 2011-11-22 2012-06-27 汉王科技股份有限公司 基于人脸识别的信息呈现方法及装置和人脸识别打印系统
CN104519267A (zh) * 2013-09-30 2015-04-15 北京三星通信技术研究有限公司 一种控制拍摄的方法及终端设备
CN104123565A (zh) * 2014-07-30 2014-10-29 中山艺展装饰工程有限公司 基于多模态识别的身份证认证与持有人同一性认证方法
CN104504321A (zh) * 2015-01-05 2015-04-08 湖北微模式科技发展有限公司 一种基于摄像头实现远程用户身份验证的方法与系统
CN106295313A (zh) * 2016-08-03 2017-01-04 北京地平线机器人技术研发有限公司 对象身份管理方法、装置和电子设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109471718A (zh) * 2018-10-12 2019-03-15 平安科技(深圳)有限公司 基于人脸识别的计算资源配置方法、装置、设备及介质
CN109471718B (zh) * 2018-10-12 2023-09-22 平安科技(深圳)有限公司 基于人脸识别的计算资源配置方法、装置、设备及介质
CN109635148A (zh) * 2018-12-14 2019-04-16 深圳英飞拓科技股份有限公司 人脸图片存储方法及装置
CN109635148B (zh) * 2018-12-14 2021-06-15 深圳英飞拓科技股份有限公司 人脸图片存储方法及装置
CN111382286A (zh) * 2018-12-27 2020-07-07 深圳云天励飞技术有限公司 数据处理方法及相关产品
CN110059560A (zh) * 2019-03-18 2019-07-26 阿里巴巴集团控股有限公司 人脸识别的方法、装置及设备
CN110059560B (zh) * 2019-03-18 2023-02-24 创新先进技术有限公司 人脸识别的方法、装置及设备

Also Published As

Publication number Publication date
CN107704520B (zh) 2020-09-11

Similar Documents

Publication Publication Date Title
CN109189991B (zh) 重复视频识别方法、装置、终端及计算机可读存储介质
CN110135411A (zh) 名片识别方法和装置
CN107704520A (zh) 基于人脸识别的多文件检索方法和装置
US10666792B1 (en) Apparatus and method for detecting new calls from a known robocaller and identifying relationships among telephone calls
CN105224518B (zh) 文本相似度的计算方法及系统、相似文本的查找方法及系统
CN108829893A (zh) 确定视频标签的方法、装置、存储介质和终端设备
CN109918556B (zh) 一种综合微博用户社交关系和文本特征抑郁情绪识别方法
CN107679032A (zh) 语音转换纠错方法和装置
CN109582861A (zh) 一种数据隐私信息检测系统
EP0827088A3 (en) Finding and modifying strings of a regular language in a text
US20110106805A1 (en) Method and system for searching multilingual documents
CN108647322B (zh) 基于词网识别大量Web文本信息相似度的方法
CN103761221B (zh) 用于识别敏感文本信息的系统和方法
CN110458078A (zh) 一种人脸图像数据聚类方法、系统及设备
CN111460162B (zh) 一种文本分类方法、装置、终端设备及计算机可读存储介质
CN105550359B (zh) 一种基于垂直搜索的网页排序方法、装置及服务器
CN107992602A (zh) 搜索结果展示方法和装置
CN109753517A (zh) 一种信息查询的方法、装置、计算机存储介质及终端
CN108038506A (zh) 一种图书自动分类方法
CN107832444A (zh) 基于搜索日志的事件发现方法及装置
CN107203265A (zh) 信息交互方法和装置
CN108536676A (zh) 数据处理方法、装置、电子设备及存储介质
CN104462282B (zh) 信息搜索方法和装置
CN109902162B (zh) 基于数字指纹的文本相似性的识别方法、存储介质及装置
CN111475607A (zh) 一种基于Mashup服务功能特征表示与密度峰值检测的Web数据聚类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20190903

Address after: 100192 Dongsheng Science Park, Zhongguancun, 66 Xixiaokou Road, Haidian District, Beijing

Applicant after: Green Bay Network Technology Co., Ltd.

Address before: 100089 Beijing Haidian District Xixiaokou Road 66 Zhongguancun Dongsheng Science Park B-6 Building B 5 floors

Applicant before: Grass count language (Beijing) Technology Co., Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant