CN111782835A - 一种面向人脸识别设备检测的人脸测试数据库管理系统及方法 - Google Patents

一种面向人脸识别设备检测的人脸测试数据库管理系统及方法 Download PDF

Info

Publication number
CN111782835A
CN111782835A CN202010620982.XA CN202010620982A CN111782835A CN 111782835 A CN111782835 A CN 111782835A CN 202010620982 A CN202010620982 A CN 202010620982A CN 111782835 A CN111782835 A CN 111782835A
Authority
CN
China
Prior art keywords
test
database
data set
data
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010620982.XA
Other languages
English (en)
Other versions
CN111782835B (zh
Inventor
谢芳艺
刘彩霞
翁煜
刘丹丹
杨政予
冯宗伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Third Research Institute of the Ministry of Public Security
Original Assignee
Third Research Institute of the Ministry of Public Security
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Third Research Institute of the Ministry of Public Security filed Critical Third Research Institute of the Ministry of Public Security
Priority to CN202010620982.XA priority Critical patent/CN111782835B/zh
Publication of CN111782835A publication Critical patent/CN111782835A/zh
Priority to PCT/CN2021/074023 priority patent/WO2022001096A1/zh
Priority to US18/014,040 priority patent/US20230281238A1/en
Application granted granted Critical
Publication of CN111782835B publication Critical patent/CN111782835B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/96Management of image or video recognition tasks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/993Evaluation of the quality of the acquired pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/70Labelling scene content, e.g. deriving syntactic or semantic representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/50Maintenance of biometric data or enrolment thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Collating Specific Patterns (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种面向人脸识别设备检测的人脸测试数据库管理系统及使用方法,本方案基于数据库归档管理模块、评估批注功能模块以及检测服务功能模块构成;数据库归档管理模块基于用户权限分配,按照数据集标注信息和标识编码规则进行层级分类管理;评估批注功能模块通过人脸检测算法和图像处理进行数据预处理与图像批注,按数据集标识编码规则设定唯一的人脸图像编码或人脸视频编码,从而构建大规模的规范化人脸测试数据库;检测服务模块数据集配置规则有效地为人脸识别产品的性能检测提供符合相关标准要求的测试数据库,并在测试结束后提供测试结果反馈统计服务。相关使用方法能够有效保障测试用人脸图像数据的安全及测试信息的可追溯。本方案可为各类人脸识别产品的检验检测提供测试数据库管理支撑。

Description

一种面向人脸识别设备检测的人脸测试数据库管理系统及 方法
技术领域
本发明涉及人脸测试数据库的管理技术,具体涉及用于人脸识别性能指标检测的人脸图像测试数据库和支撑人脸识别算法研发的测试训练数据库构建与管理技术。
背景技术
人脸识别技术作为生物特征识别领域中最常用的一种模态,近年来在金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗及众多企事业单位等领域得到了广泛应用。
“错误接受率(FAR)和错误拒绝率(FRR)”性能指标是目前学术界与商业界公认的人脸识别关键性能评价指标,其中测评中所用的人脸图像数据库对检测结果具有重大影响。不同检测机构检测人脸识别产品所用的测试数据库缺乏统一规范和管理,使得因测试数据库差异导致了测评结果的差异性。
因此,为科学公正地评价人脸识别产品性能,需要考虑将能够定性定量的影响性能的各类因素加入到数据库,如人脸照片的类型、数据来源、应用场景、采集设备、光照环境、姿态、年龄跨度、性别、表情、肤色等。
综上,设计一种面向人脸识别设备检测的人脸测试数据库管理系统,明确其使用方法,构建综合各类因素影响的人脸图像测试数据库,既可以满足日益增长的人脸识别产品的检测需求,也有利于推动人脸识别产品技术进步。
发明内容
本发明的目的旨在设计供一种面向人脸识别设备检测的人脸测试数据库管理系统,并据此提供一种人脸测试数据库管理方法,用于产品的人脸识别性能指标检测及支撑人脸识别算法研发的测试训练。
为了达到上述目的,本发明提供的面向人脸识别设备检测的人脸测试数据库管理系统,包括数据库归档管理模块、评估批注功能模块以及检测服务功能模块;
所述数据库归档管理模块运行于存储服务器中,结合使用管理需求对人脸测试数据库的数据周期性更新,且基于用户权限分配按照数据集标注信息和标识编码规则进行层级分类管理;
所述评估批注功能模块运行于客户端中,与数据库归档管理模块进行数据交互,对大批量导入的人脸图像和人脸视频进行自动评估,通过人脸检测算法和图像处理进行数据预处理与图像批注,按照数据集标识编码规则设定唯一的人脸图像编码或人脸视频编码,从而构建大规模的规范化人脸测试数据库;
所述的检测服务模块运行于客户端中,调用数据库归档管理模块,按数据集配置使用规则为人脸识别产品的性能检测提供符合标准要求的测试数据库及测试结果反馈统计服务。
进一步地,所述数据库归档管理模块中包括存储总库、使用分库、审核库、预处理库以及反馈库;
所述存储总库由以单一人员为单位的人员数据集组成,所构建的目标人脸测试数据库中每个人员数据集中的人脸图像和人脸视频具有唯一的标识编码且不可逆;
所述使用分库为根据待测设备的性能检测等级需求,按数据集配置规则从存储总库中获取的设定规模数量的测试数据库,由满足样本分布要求的目标集与探测集组成,用于待测设备的“错误接受率(FAR)和错误拒绝率(FRR)”性能指标测试;
所述审核库包括数据管理员建库与测试用户建库,对建库中“已批注数据集”按评估批注模块处理的评估结果进行核查,并与标准中对测试数据库的技术要求进行符合性确认,经过数据库归档模块归档,由最高权限用户审核确认后转换为存储总库;
所述预处理库为最初批量导入存储服务器中的人脸图像或人脸视频,配合评估批注模块进行数据预处理,给出评估结果并形成“已批注数据集”,从而转换为审核库;
所述反馈库为测试用户所建的人员数据集,主要来源于检测服务模块使用下载的使用分库进行性能检测时出现数据异常的数据集,用于存储总库的数据更新。
进一步地,所述数据库归档管理模块中还包括测试结果库,所述测试结果库存储“错误接受率(FAR)和错误拒绝率(FRR)”性能指标检测的结果,以用于数据更新的关联和测试数据库服务应用需求性的统计分析。
进一步地,所述数据库归档管理模块中还包括数据日志,所述数据日志包括人脸测试数据库归档管理模块中所有库与测试结果的相关操作、审计等日志。
进一步地,所述的评估批注功能模块包括数据预处理模块、数据集归档模块和数据集查询模块;
所述数据预处理模块通过相应的图像处理方法对现场采集或批量导入的人脸图像进行人脸裁切与图像质量评判提示,预处理后的数据将自动转入数据集归档模块中;
所述数据集归档模块按图像标识与编码规则对预处理后的人脸图像进行标注与代码生成;并根据不同的因素,采用相应的数据集标识规则和/或人脸图像编码规则来对数据集标识与人脸图像代码进行唯一性管理;
所述数据集查询模块按权限需求根据单项或多项筛选条件对不同测试数据库的人员数据集进行查询,提供实际应用场景下的检测所需测试数据库配比条件与按条件生成统计报表。
进一步地,所述的检测服务功能模块包括数据库调用模块、设备接口调试模块、统计与报表模块、测试结果模块;
所述数据库调用模块,用于按需求与操作下载或上传人员数据集;
所述设备接口调试模块与待测设备通过测试接口函数调用交互,用于人脸图像的推送或获取;
所述统计与报表模块用于提供数据集统计、项目统计、算法统计和模拟测试统计;
所述测试结果模块用于管理“错误接受率(FAR)和错误拒绝率(FRR)”性能检测的测试结果。
进一步地,所述的检测服务功能模块还包括用户登录模块,所述用户登录模块配合数据库归档管理模块按用户权限对人脸测试数据库中各个分库进行与权限相对应的访问操作。
为了达到上述目的,本发明提供的面向人脸识别设备检测的测试数据库管理方法,包括:
大批量导入人脸图像,并按数据集标识编码规则对人脸图像自动评判给予唯一性的人脸信息代码,由此来构建所需类别的测试数据库;
根据数据集配置使用规则下载所需规模的测试数据库,以形成目标集与探测集。
进一步地,所述测试数据库管理方法中还包括:在使用过程中按数据安全机制下载的测试数据库,并参考映射关系实现数据加密与脱敏使用。
进一步地,所述的测试数据库是根据单次项目测试的需求按数据集配置使用规则形成的测试分库,由测试管理员授权下载以密文方式存储于测试服务器或测试计算机中,通过专用解密工具可查看经映射关系处理后的简单对数据排序编号的数据集的信息及编码映射表。
测试用户仅通过管理系统的数据集查询模块授权后按条件对已下载的测试数据库中数据集查看脱敏后的信息,默认仅浏览图片或播放视频。而其中敏感信息包括数据集中的人脸图像或人脸视频的标识与编码、批注信息、样本分布情况等;
测试数据库在“错误接受率(FAR)和错误拒绝率(FRR)”性能指标检测过程中出现数据异常的数据集将以测试结果方式显示,仅通过自动化测试系统访问查询授权本次测试的测试结果中提取特征值失败照片和测试数据库的人脸图像或人脸视频,其编号为映射经本地重新排序的简单编号;
测试数据库中的数据集下载前的信息或存储于存储服务器的信息仅通过授权后的数据集查询模块可查询;
所述的映射关系为存于存储服务器的测试数据库中数据集的完整信息,尤其是批注信息与编码,跟进行性能测试使用的数据集可查看到的标注信息与编码存在对应关系,确保测试人员及待测设备在核实数据准确性情况下可对数据集进行分析,从而有助于提升待测设备的“错误接受率(FAR)和错误拒绝率(FRR)”性能指标检测结果的公正性。
进一步地,所述测试数据库管理方法中还包括:在使用过程中将测试结果与数据使用情况反馈,并将出现异常数据集上传,对测试数据库形成自循环更新模式。
进一步地,所述的数据集标识规则按不同测试数据库及其人员数据集进行层级分类管理而不同命名,标识具有唯一性。
进一步地,所述图像编码规则按所在库对应人脸数据集标识叠加方式后结合图像的影响因素形成字典表进行自动代码生成,代码具有唯一性。
本方法通过信息编码规则与数据集配置使用规则有效地为人脸识别产品的性能检测提供测试数据库,数据安全且可追溯。本发明管理系统及使用方法可服务于人脸识别产品的检测与产品质量提升。
附图说明
以下结合附图和具体实施方式来进一步说明本发明。
图1为本发明实例中测试数据库管理系统的结构示例图;
图2为本发明实例中测试数据库管理系统对应测试数据库分类示例图;
图3为本发明实例中人脸图像的生命周期状态转换示例图;
图4为本发明实例中测试数据库管理系统的使用方法流程示例图;
图5为本发明实例中测试数据库管理系统管理审批流程示例图;
图6为本发明实例中数据集配置规则示例图;
图7为本发明实例中数据安全机制示例图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明。
针对目前人脸识别产品性能测试方案所面临的问题,本实例给出了一种面向人脸识别设备检测的测试数据库管理方案。
本面向人脸识别产品应用检测的测试数据库管理方案结合实际应用场景下人脸识别产品的性能影响因素将测试数据库规模化同时多样化,并按安全层级管理机制进行管理,具有严谨审批流程。
作为举例,本测试数据库管理方案中所涉及的数据来源目标集覆盖居民身份证、护照、驾驶证等证件内置芯片中的电子照片或采集到的证件可视人脸图像、其它证件电子照片及现场采集的现场活体人脸图像;覆盖公安检查站人证核验、出入境管理、高铁自助通关、机场自助通关、轨道交通自助通关、小区出入口管理、场馆安保管理、银行柜台业务办理、社保实名认证、身份核验远程确认、酒店旅客人证核验等实际应用场景,涵盖采集设备、光照环境、姿态、年龄跨度、性别、表情、肤色等影响因素。
作为举例,本测试数据库管理方案在具体实现时,还进一步参考GA/T 541-2011和GA/T 200.2公安数据元与公安信息代码管理机制,由此创新的给出人脸图像或人脸视频的全生命周期状态转换架构,数据安全机制,数据集配置规则,数据集标识规则和人脸图像编码规则,从而可对人脸识别产品在“错误接受率(FAR)和错误拒绝率(FRR)”性能指标测试过程中提供符合性的测试数据库,数据安全且可追溯。在本实例后续的方案中,测试所需的测试数据库来自存储服务器的存储总库按配比下载的测试分库。
参见图1,其所示为本实例基于上述测试数据库管理方案所形成的一种面向人脸识别设备检测的测试数据库管理系统的构成示例方案。
本测试数据库管理系统主要由数据库归档管理模块100、评估批注功能模块200以及检测服务功能模块300配合构成。
数据库归档管理模块100运行在存储服务器(SERVER端)中,结合使用管理需求对人脸测试数据库的数据周期性更新,且基于用户权限分配按照数据集标注信息及编码规则进行层级分类管理。
该数据库归档管理模块100通过归档存储、安全下载、配置使用、反馈更新形成数据循环周期,结合使用管理需求按数据库规则进行替换、新增或删除已归档的数据集中人脸图像或人脸视频。
进一步地,该数据库归档管理模块按用户权限对人脸测试数据库中不同的分库进行管理,如超级管理员拥有全部权限,并审核授权对审核库、反馈库中的数据集与存储总库中的对应数据集进行数据更新,并对使用分库从存储总库中配置授权使用;不同的分库配有对应的不同用户操作权限,实现数据集的全生命周期状态转换。
评估批注功能模块200运行于客户端(如测试WEB界面(PC端)中)中,与数据库归档管理模块100进行数据交互,对大批量导入人脸图像和人脸视频自动评估,通过人脸检测算法进行数据预处理与图像批注,按数据集标识编码规则设定唯一的人脸图像编码或人脸视频编码,从而构建大规模的规范化人脸测试数据库。
检测服务模块300运行于客户端中(如测试WEB界面(PC端)中),调动数据库归档管理模块实现检测服务,期按数据集配置使用规则有效地为人脸识别产品尤其是人证核验产品的性能检测提供标准符合性的测试数据库及测试结果反馈统计服务,数据安全且可追溯。
具体,本检测服务模块300可按数据集配置使用规则针对产品性能检测需求设定数量规模的使用分库作为标准符合性的测试数据库,以满足规定的样本分布和数量比例的目标集和探测集;性能检测获得的测试结果以反馈库的形式配合数据库管理模块管理通过反馈审核对存储总库进行数据更新。
作为举例,位于SERVER端的数据库归档管理模块100可通过性能测试检测系统的测试服务器(SERVER端)400与操作WEB界面的(PC端)进行下载/上传交换,并通过位于PC端的管理系统与待测设备500进行推送/获取调用,从而实现提供大规模测试数据库用于“错误接受率(FAR)和错误拒绝率(FRR)”性能指标检测。
这里的性能测试检测系统,测试服务器(SERVER端)以及管理系统的构成可根据实际需求而定,此处不加以限定。
如图1和图2所示,本实例中运行于存储服务器(SERVER端)的数据库归档管理模块100在实现时按使用管理需求根据用户权限分配按标识与编码规则进行层级分类管理,其对象包括存储总库110、使用分库120、审核库130、预处理库140、反馈库150、测试结果库160和数据日志170。
其中存储总库110由以人员为单位人员数据集组成;即以人员为单元,一个人的所有人脸图像和人脸视频的集合就是单人数据集;数据集汇总形成相应的数据库。
这里的存储总库就是所构建的目标人脸测试数据库,即规模可达百万级别以上的规范化的人脸测试数据库的汇总库,每个人员数据集中的人脸图像和人脸视频具有唯一的标识编码且不可逆。存于存储服务器定期备份,以防丢失。其他的分库是按用户权限结合使用需求建立的,实现存储总库使用和维护。
作为举例,本存储总库中每个人员数据集包括目标集中不同标准或规范或条例规定的身份证机读照片、身份证电子照片、护照电子照片等人脸图像、探测集中不同影响因素下每人1~10幅实际应用场景来源的人脸图像、自定义人脸图像、以及人员视频等。
使用分库120一般由是测试用户根据待测设备的性能检测等级需求按数据集配置规则从存储总库中获取设定规模数量的测试数据库,其由满足样本分布要求的目标集与探测集组成,用于待测设备的“错误接受率(FAR)和错误拒绝率(FRR)”性能指标测试。
审核库130包括数据管理员建库与测试用户建库,对建库中“已批注数据集”按评估批注模块处理的评估结果进行核查,并与标准中对测试数据库的技术要求进行符合性核实,经过数据库归档模块由最高权限用户审核后转换为存储总库。
预处理库140为最初批量导入存储服务器中的人脸图像或人脸视频,配合评估批注模块进行数据预处理,给出评估结果并形成“已批注数据集”,从而转换为审核库。
反馈库150为测试用户所建的人员数据集,主要来源于检测服务模块使用下载的使用分库进行性能检测时出现数据异常的数据集,用于存储总库的数据更新。
测试结果库160存储“错误接受率(FAR)和错误拒绝率(FRR)”性能指标检测的结果,用于测试数据库服务应用需求性的统计分析。
数据日志170包括以上所有库与测试结果的相关操作、审计等日志。
由此形成的数据库归档管理模块100中,其存储总库作为最终存储的人脸测试数据库,除周期性数据更新外将永久性存储备份。使用分库来自于存储总库按数据集配置使用规则用于性能检测;审核库由预处理库经过评估批注模块形成已批注的数据集审核后而转换,经审核后归档入存储总库以扩充数据库规模。反馈库来自于性能检测过程中出现数据异常的数据集,对存储总库的数据经过使用核实后进行更新。
与之配合的,位于PC端的评估批注功能模块200,其与数据库归档管理模块进行数据交互,对大批量导入人脸图像和人脸视频自动评估,通过人脸检测算法和图像处理进行数据预处理与图像批注,按数据集标识编码规则设定唯一的人脸图像编码或人脸视频编码,从而构建大规模的规范化人脸测试数据库。
本评估批注功能模块200包括数据预处理模块210、数据集归档模块220和数据集查询模块230。
本系统中位于PC端的数据预处理模块210通过使用图像算法、人脸检测算法、最佳阈值图像分割法及边缘检测等方式对现场采集或批量导入到存储服务器的人脸图像进行人脸裁切与图像质量评判提示,预处理后的数据和批注信息将自动转入数据集归档模块220中。
作为举例,这里的数据预处理模块对批量导入到存储服务器中的人脸图像或人脸视频进行自动处理;所处理的对象是以人员数据集为单元形成文件夹中的人脸图像或人脸视频,分为目标集的人脸图像样本和探测集的人脸图像或人脸视频。数据预处理模块使用人脸检测算法和图像算法对人员数据集进行处理,处理的依据为各类照片规格对应的标准要求、人证核验设备行业标准中目标集和探测集的技术要求、以及测试数据库样本分布各种因素。当算法检测后出现不符合的人脸图像或人脸视频,可通过应用最佳阈值图像分割法及边缘检测等方法对异常数据进行修正。如身份证机读照片为目标集中的人脸图像样本,符合GA 490-2013行业标准要求;如不符合,则修正再次算法检测,还是不符合则直接反馈数据异常,以后期审核补充更新。经过数据预处理,将人员数据集处理并得出对应批注信息,提供数据集归档模块的数据,用于形成唯一的标识编码。
位于PC端的数据集归档模块220用于按图像标识与编码规则对预处理后的人脸图像进行标注与代码生成。作为举例,其至少包括数据集标识、分辨率、瞳距、姿态、添加图片、图像删除、数据种类、生成图像代码、及表情、光照等影响因素。针对不同的因素,可采用相应的数据集标识规则与图像编码规则来实现数据集标识与人脸图像代码的唯一性管理。
作为举例,人脸图像或人脸视频的批注信息通过数据预处理模块采用人脸检测算法和图像处理算法进行自动处理;与之配合的,数据集归档模块获取数据预处理模块的批注信息并支持核实修改,自动按数据集标识编码规则自动生成唯一的图片或视频编码。人脸图像符合目标集和探测集的要求,可归为人员数据集中的目标集和探测集;人脸视频符合探测集的技术要求,可归为人员数据集中的探测集。数据集归档模块,配合位于存储服务器的数据库归档管理模块,将已批注的数据集进行归档存储。
作为举例,这里的数据集标识规则,按不同测试数据库及其人员数据集进行层级分类管理而不同命名,标识具有唯一性,包括存储总库、使用分库、审核库、预处理库、反馈库、测试结果及其下设的人员数据及命名、还有数据日志等命名方式。
作为举例,这里的数据集标识编码规则按所在库对应人脸数据集标识叠加方式后结合图像的影响因素形成字典表进行自动图片编码或视频编码生成,代码具有唯一性,主要包括目标集中的不同证件类别对应的人脸图像和探测集中的不同影响因素对应的人脸图像。
本实例中的数据集归档模块220,其采用数据集标识编码规则对每张人脸图像或每段人脸视频进行自动编码,核实批注信息;并对批量处理的数据按人脸测试库的构建要求对数据集进行分类,对分类信息予以存储文件夹名和数据编码方式来实现标识。为此,通过本数据集归档模块生成的唯一的编码,使用管理系统可准确地查询人员数据集中的人脸图像或人脸视频,管理并控制其全生命周期状态转换。
本系统中位于PC端的数据集查询模块230,可按用户权限需求根据单项或多项筛选条件对不同测试数据库的人员数据集进行查询,其中筛选条件至少包括图片编码、完整度、性别、年龄分布、民族、肤色、双胞胎、5年内差异、创建用户及其创建时间等人脸图像参数。查询结果结合测试数据库分析统计以人员为单位显示包括针对目标集与探测集要求的人员数据集完整度、针对影响因素要求的平均分数、照片数量、性别、名族、肤色、年龄分布、创建时间等,用于提供实际应用场景下的检测所需测试数据库配比条件与按条件生成统计报表。
这里的数据集查询模块的对象是存储总库中的人员数据集,即存储于存储服务器的人脸测试数据库。查询结果为人员数据集中的人脸图像或人脸视频,及其批注信息和标识编码等数据,用于提供数据集配置使用规则运行及统计与报表模块处理所需的数据。本数据集查询模块,可配合位于存储服务器的数据库归档管理模块进行数据交互,根据权限可直接查询存储总库中已批注的数据集;还可配合位于PC端的数据集归档模块220进行数据交互,根据权限可直接查询存于PC端下载或待上传的已批注的数据集,如测试数据库的数据集、审核库的数据集、反馈库的数据集。
本系统中位于PC端的检测服务功能模块300,期调动数据库归档管理模块,按数据集配置使用规则有效地为人脸识别产品尤其是人证核验产品的性能检测提供标准符合性的测试数据库及测试结果反馈统计服务,数据安全且可追溯。
由图可知,本系统中的检测服务功能模块300主要包括数据库调用模块310、设备接口调试模块320、统计与报表模块330、测试结果模块340以及用户登录管理模块350。
其中,位于PC端的数据库调用模块310将管理系统与存储服务器对接交互,用于按需求与操作下载或上传人员数据集,包括存储总库配置、使用分库下载、审核库上传、预处理库上传、反馈库上传、测试结果上传与下载等。
本系统中位于PC端的设备接口调用模块320与待测设备500通过测试接口函数调用交互,用于人脸图像的推送或获取,主要是获取现场采集的人脸图像、推送测试数据库的人脸图像、获取测试结果等。
该设备接口调用模块320的具体构成,可根据实际需求而定,此处不加以赘述。
本系统中位于PC端的统计与报表模块330用于提供数据集统计、项目统计、算法统计和模拟测试统计。
作为举例,其中数据集统计以性别、民族、肤色等分布条件按需生成;项目统计针对项目以时间周期、测试次数、测试耗时、使用分布、测试用户等条件按需生成;算法统计针对“错误接受率(FAR)和错误拒绝率(FRR)”性能指标的算法测评结果以阈值、特征值提取成功率、FAR值或范围、FRR值或范围、OCR曲线等条件按需生成。
对于该模块的具体构成,可根据实际需求而定,此处不加以限定。
本系统中位于PC端的测试结果模块340,其用于管理“错误接受率(FAR)和错误拒绝率(FRR)”性能检测的测试结果,其中至少包括提取特征值失败照片、测试数据库中测试样本照片与特征比对结果的关系、FAR限值及对应相似度、FRR限值及对应相似度等信息。
进一步地,本测试结果模块提供测试过程中出现异常的数据,用于数据库归档管理模块审核存储总库对应的数据及更新处理。如提取特征值失败照片为异常数据之一,根据其图片编码可通过数据集查询模块查询存储总库对应的数据,并配合数据库归档管理模块、数据预处理模块和数据集归档模块对人员数据集进行修正与周期性更新。如高于FAR或FRR限值对应的相似度,即测试中目标集特征数据与探测集特征数据,其目标集的人脸图像、探测集的人脸图像或人脸视频将视为测试结果中异常数据,从而用于存储总库的周期性更新。
本系统中位于PC端的用户登录管理模块350,其可配合数据库归档管理模块按用户权限对人脸测试数据库中各个分库进行权限访问操作,一般用浏览器web方式访问基于数据库软件管控的存储服务器实现管理系统的人机界面交互。所述用户主要包括超级管理员、数据管理员和测试用户。
作为举例,其中超级管理员具有最高权限,仅此可访问存储数据库与各个库中人脸图像不同状态转换审批。测试管理员对测试用户管理,具有性能检测系统管理与管理系统访问权限。测试用户在PC端进行测试操作,包括使用分库配置下载、性能检测、数据集建库、现场采集人脸图像、数据预处理、测试结果查看等、数据管理员围绕着大规模测试数据库的构建工作,包括人脸图像批量导入、数据预处理、数据集归档、建库等。
由此形成的面向人脸识别设备检测的测试数据库管理系统可结合相应的性能测试系统对人脸识别产品性能进行检测,基于本测试数据库管理系统,用户可方便地大批量导入人脸图像,并按数据集标识与人脸图像编码规则对人脸图像自动评判给予唯一性的人脸信息代码,从而构建所需类别的测试数据库。据此,可根据数据集配置使用规则下载所需规模的测试数据库,即其目标集与探测集。
作为举例,这里的数据集配置使用规则可由人证核验设备公共安全行业标准中测试数据库的技术要求规定,依据人员数据集的批注信息和编码对“错误接受率(FAR)和错误拒绝率(FRR)”性能检测所需的测试数据库对数据进行配比,并将配比后的数据形成人员数据集中的目标集和探测集,用于提供性能检测中接口函数调用的对象。配置的方式为人员数据集中至少1张目标集类的人脸图像和1张探测集类的人脸图像或人脸视频,其中探测集的数量为10幅最佳。为此,这两类数据的比例可在人员数据集的批注信息中体现为完成度和平均分值。
启动数据集配置使用规则,调动数据库调用模块和数据库归档管理模块,将存储总库的人员数据集按数据来源特定的目标集类和图像影响因素特点的探测集类进行数据配置,默认为单人的目标集类的数据(目标集)包括50%身份证机读照片、30%护照电子照片、10%驾驶证电子照片、5%证件可视人脸图像、3%其它证件电子照片;单人探测集类的数据(探测集)包括涵盖采集设备、光照环境、姿态、年龄跨度、性别、表情、肤色等影响因素的1~10幅人脸图像或一段人脸视频。按“错误接受率(FAR)和错误拒绝率(FRR)”性能检测等级要求,确认测试数据库的规模数量,即目标集中不重复的测试人员数量、探测集中的测试人脸图像数量。数据集配置规则将测试数据库规模数量与存储总库的批注信息对应,选出满足上述要求的人员数据集,即使用分库。使用分库与采集现场库以98%:2%比例通过性能测试系统的数据库管理模块汇总形成单测性能检测的测试数据库。
本系统在使用过程中还可按数据安全机制下载的测试数据库,并参考映射关系实现数据加密与脱敏使用。
本系统在使用过程中还可将测试结果与数据使用情况反馈,并将出现异常数据集上传,通过管理系统对测试数据库形成自循环更新模式,实现数据库不断优化升级。
作为举例,如图7所示,本实例方案中的测试数据库是根据单次项目测试的需求按数据集配置使用规则形成的测试分库,由测试管理员授权下载以密文方式存储于测试服务器或测试计算机中,通过专用解密工具可查看经映射关系处理后的简单对数据排序编号的数据集的信息及编码映射表。
测试用户仅通过管理系统的数据集查询模块授权后按条件对已下载的测试数据库中数据集查看脱敏后的信息,默认仅浏览图片或播放视频。而其中敏感信息包括数据集中的人脸图像或人脸视频的标识与编码、批注信息、样本分布情况等。
测试数据库在“错误接受率(FAR)和错误拒绝率(FRR)”性能指标检测过程中出现数据异常的数据集将以测试结果方式显示,仅通过自动化测试系统访问查询授权本次测试的测试结果中提取特征值失败照片和测试数据库的人脸图像或人脸视频,其编号为映射重新本地排序的简单编号。
测试数据库中的数据集下载前的信息或存储于存储服务器的信息仅通过授权后的数据集查询模块可查询。
这里的映射关系为存于存储服务器的测试数据库中数据集的完整信息尤其是批注信息与编码跟进行性能测试使用的数据集可查看到的标注信息与编码存在对应关系,确保测试人员及待测设备在核实数据准确性情况下可对数据集进行分析,从而有助于提升待测设备的“错误接受率(FAR)和错误拒绝率(FRR)”性能指标。
本面向人脸识别设备检测的测试数据库管理系统在具体运行时,可进行大规模测试数据库的采集/批量导入、预处理、图像标识编码、归档存储、配置使用、安全下载与反馈更新等操作,以及项目测试结果统计分析进行高效管理,可用于提供人脸识别产品的“错误接受率(FAR)和错误拒绝率(FRR)”关键性能指标检测所需的测试数据库,项目测试结果统计报表等。
这里需要说明的,对测试数据管理系统而言,最小单元为人脸图像或人脸视频的单帧中的人脸图像;从管理角度而已,人脸图像的全生命周期随着管理层级与使用过程中处于不同的状态,其转换过程见图3所述。
参见图3,其所示为本实例中人脸图像的生命周期状态转换示例方案。
本人脸测试数据库管理系统服务于人脸识别产品的性能检测提供测试数据库,单次检测的测试数据库中的人脸图像或人脸视频来源于批量导入于存储服务器中的和送检产品现场采集的。所获得的数据经过管理系统中各个模块进行预处理、批注、编码、审核、归档、下载等操作才能用于性能检测。性能检测后的数据再次通过管理系统中测试结果模块、数据集查询模块、数据集归档管理等模块进行异常数据反馈、处理、审核等对存储总库数据进行周期更新。
初始的人脸图像或人脸视频中人脸图像(简称“人脸图像”)首先以数据管理权限准备审核库,批量导入存于存储服务器的预处理库,通过评估批注功能模块中的数据预处理模块和数据集归档模块进行处理后归档至存储总库。数据预处理模块将人脸图像采用人脸检测算法、图像裁剪等操作处理,获得对应的批注信息。处理后的人脸图像携带批注信息,通过数据集归档模块进行自动标识,形成唯一的图像标识编码,存入审核库。审核库经过超级管理员审核后归档存储,存入存储总库。启动“错误接受率(FAR)和错误拒绝率(FRR)”性能检测,按数据集配置规则将存储总库的人脸图像进行配置,存入使用分库。通过数据库调用模块安全下载至测试服务器或测试计算机(PC端),即为下载的测试数据库。同步准备现场采集测试数据库,以测试用户权限准备审核库,初始的人脸图像由待测设备现场采集获得,包括目标集和探测集。
重复上述的数据预处理和图像标识编码,以2%的配比结合下载的测试数据库形成本次性能检测所需的测试数据库。经过“错误接受率(FAR)和错误拒绝率(FRR)”性能检测,测试过程中出现异常数据存于测试结果,其对应的人脸图像缓存入反馈库,经过审核、修改或重新替换新人脸图像等操作,按图片编码查询存储总库对应的人脸图像,可进行删除、替换新人脸图像、更新批注信息等反馈更新,最终实现存储总库的人脸图像周期性更新,使得提升性能检测的数据服务质量。
以下基于本实例给出的面向人脸识别设备检测的测试数据库管理系统来说明,其提供测试数据库用于人脸识别产品的“错误接受率(FAR)和错误拒绝率(FRR)”性能指标检测的实施过程。
作为举例,由存储服务器(SERVER端)、测试WEB界面(PC端)、测试服务器(SERVER端)等构成相应的测试环境。
其中,本测试数据库管理系统人脸测试数据库归档管理模块运行在存储服务器(SERVER端),而数据预处理、数据库调用、数据集归档、数据集查询、统计与报表、用户登录管理等操作模块运行在测试WEB界面(PC端)。据此相应的实施流程如图4所示,主要包括如下步骤:
(1)根据用户在测试WEB界面操作初始化本管理系统。
(2)根据所需管理对象不同,若以批量导入方式创建数据库,则使用数据管理员权限进行用户登录管理系统,进入步骤(3);若以现场采集方式创建数据库并开展“错误接受率(FAR)和错误拒绝率(FRR)”性能测试,则使用测试用户权限进行用户登录性能检测系统与管理系统,并进入步骤(8)。
(3)使用数据管理员用户登录后,访问存储服务器按预处理库的人员数据集标识新建文件夹,创建预处理库,并用预处理库标识规则标识文件夹名称。
(4)以数据来源为分类,以人员为单位批量导入人员数据集及其所有的人脸图像。
(5)进入“数据预处理”界面,以对应的预处理库的人员数据集标识对应存储路径对人员数据集中人脸图像进行预处理,并以进度条形式实时显示处理进度,及包含预处理成功率与失败人脸图像详情的处理结果。每批次导入人员数据集的人脸图像数量控制在1万张以内,支持分批导入,断点续传。
(6)进入“数据集归档”界面,对预处理后的人脸图像按数据集标识与图像编码规则自动进行审核库中的数据集标识与图像代码生成,界面自动按组次显示人员数据集归档详情,支持可视化手动修改与保存。
作为举例,其中数据集中图像归档详情可按人脸检测算法、图像质量评判与裁剪处理等尽可能多覆盖涉及姿态、分辨力、瞳距、数据种类、数据来源、应用场景等数据影响因素;默认以按标准裁剪最佳图像存储。
(7)进入“数据集查询”界按用户权限可查询根据人员数据集标识或图像代码对归档后已存储在审核库中的人员数据集或人脸图像进行查询。审核库中的人脸图像经过超级管理员按审核流程通过后进入存储总库。作为举例,这里的超级管理员可查询存储总库。
(8)使用测试用户登录后,新建项目,输入待测设备的厂商信息与设备信息,上传设备的算法配置文件与相关技术资料;同时,可按厂商与设备名称检索历史记录,自动填写项目信息。
(9)开始测试接口调试,选择设备的动态链接库与算法配置文件,自动按测试接口函数进行调试。这里的动态链接库与算法配置文件可根据实际需求来设定,此处不加限定。
(10)验证待测设备的接口是否符合《安全防范人脸识别应用人证核验设备通用技术要求》等相关行业标准与规范中规定的测试接口要求;根据待测设备返回临时测试数据通过,则进入步骤(11);否则结束测试。
(11)在开展性能指标检测前,准备加载本次性能检测所需的测试数据库,首先,通过存储总库按数据配置规则自动配比使用分库,按数据安全规则下载至测试服务器或PC端上;而后准备现场采集的测试数据库。
(12)调用测试接口从待测设备获取现场采集的人脸图像,重复(3)~(7),获取审核库中的人员数据集,形成现场采集的测试数据库。
(13)将下载的和现场采集的测试数据库整理汇总后推送至待测设备运行人脸识别算法开展“错误接受率(FAR)和错误拒绝率(FRR)”性能测试。
(14)测试结果后通过测试接口调试获取测试数据,并上传至存储服务器。
(15)进入“数据集查询”界按用户权限可查询根据使用分库脱敏后映射关系查询测试过程中数据异常、测试数据库和项目及算法统计分析结果,可输出统计结果与报表。
(16)按照数据异常上传后将以反馈库形式在存储服务器中整理汇总上报审核,从而更新存储总库与使用分库。
(17)确认测试结果后可结束测试;如果测试结果不符合要求,可再次重复步骤(8)。
在此基础上,在进一步实现时,相应数据集标识规则按不同测试数据库及其人员数据集进行层级分类管理而不同命名,标识具有唯一性,包括存储总库、使用分库、审核库、预处理库、反馈库、测试结果及其下设的人员数据及命名、还有数据日志等命名方式。测试数据库按照使用管理需求进行层级分类,分为存储总库、使用分库、审核库、预处理库、反馈库和数据日志。
在基于该实施方式的管理系统实现测试数据库层级分类,测试数据库从安全性考虑需分配不同的访问权限。超级用户具有所有访问权限与设置不同用户的权限管理。数据管理员可访问以其名称命名的审核库和预处理库。测试用户可访问使用库查询、下载与新建,以及反馈库上传处理。数据日志以各自用户操作自行生成,仅访问自身用户名命名文件,至少包括更新各个库的数据总量与分类明细等信息。
作为举例,这里的命名规则具体包括以下内容:
(4.1)存储总库仅超级用户访问,一般默认只有一个存储总库与一个备份库,备份库放在存储服务器的read1中。存储总库命名为“人证核验0001+创建日期”,如“RZHY000120200117”即“人证核验0001”存储总库于2020年01年17日创建。
(4.2)使用分库根据待测设备的样品分类类型与测试用户使用习惯设置指定测试级别量的测试数据库,并经过循环测试使用固定化。设置命名参数包括样品类型、测试用户名、测试分级、测试量与数据集分布等。目标集与测试集的照片来源于存储总库按数据配比下载的,人员照片代码不变。目标集命名参数包括证件类型、照片数、数据配比、下载时间;探测集命名参数包括照片数、照片关键参数分布、下载时间。同上,以中文首字母简称+操作用户首字母简称+序号+创建时间格式命名。
(4.3)审核库为按系统使用对象进行分类,需经过审核才能存入总库,分为数据管理员建库与测试用户建库;数据管理员建库是指针对PC端“数据集归档”界面,由数据管理员操作对照片批注处理后存档的人员数据集;测试用户建库是指算法测试过程中需针对此任务号对应设备现场采集的人员数据集,按标准规定的2%比例充入到使用分库中作为本次任务下载到PC端的测试数据库。同上,以中文首字母简称+操作用户首字母简称+序号+创建时间格式命名。
(4.3)预处理库为数据管理员导入库,针对PC端“数据预处理”界面,拷贝到存储服务器需预处理的人员数据集。同上,以中文字母简称+序号+创建时间格式命名,以中文首字母简称+操作用户首字母简称+序号+创建时间格式命名。
(4.4)反馈库为测试用户经过以任务号为单位项目测试后发现异常而上传的照片,以中文首字母简称+操作用户首字母简称+序号+创建时间格式命名。
(4.5)数据日志为用于上述各个库操作与管理过程中形成的日志文件,以以上各个库命名即可。
进一步地,在该具体实施方式中,步骤(6)中的数据集标识规则,按标准中测试库样本分布的类型设置命名参数,包括性别、年龄、肤色、差异性、时期、民族、照片类别与数量、自定义和18位唯一代码。其中照片类别与数量指定是人员数据集归档照片总数、探测集照片数量与目标集照片数量。18位唯一代码默认为身份证号码,如果是护照、港澳台等证件的话前缀以“0”补齐。具体规定以下内容:
(6.1.1)以JY开头,类型之间以下划线“_”分割。类型=前缀+对应值;
(6.1.2)类型可以不传,如果类型不传则取默认值;
(6.1.3)JY_G性别_N民族_R肤色_A年龄分布_T双胞胎_D5年差异_M数据集组名称,如标注数据为:G男_N汉族_R黄色_16岁以下_是双胞胎_是5年内差异_自定义数据集名称;
(6.1.4)根据附录1表找到类型所对应的值,替换,生成的命名:JY_00_01_00_00_01_01_自定义数据集名称。
作为举例,在该具体实施方式中,步骤(6)中的人脸图像编码规则如附录2所示,人员照片的代号是由人员数据集代号和照片代号组成。其中人员数据集代号引用A3.1.2中的编码。按照标准中规定的目标集与探测集的人员照片的要求按类别设置单张照片的命名参数,其中目标集照片的命名参数包括证件类型、采集标准、创建日期。探测集照片命名参数包括数据来源、实际应用场景、采集设备、光照环境、姿态、采集时间、饰物(有无戴透明眼镜);自定义照片和人员视频暂不用。具体规定以下内容:
(6.2.1)以ID开头,为目标集图片;不以ID开头,为探测集图片;
(6.2.2)类型之间以下划线“_”分割。类型=前缀+对应值;
(6.2.3)类型可以不传,如果类型不传则取默认值;
(6.2.4)目标集图片:ID_C证件类型_S采集标准_M备注;如ID_C护照_SGA 490-2013_M自定义备注;对应命名:ID_C03_S00_M自定义备注
(6.2.5)探测集图片:L数据来源_P姿态_E表情_G光照环境_Y应用场景_B采集设备_T采集时间_M备注;如PC采集_正面_眼眉上扬_逆光_出入境管理_扫描仪_2019-12-0817:44:36_自定义备注;对应命名:L00_P00_E03_G01_Y01_B02_T20191208174436_M自定义备注。
进一步地,在该具体实施方式中,步骤(7)中的测试数据库管理系统管理审批流程以最高管理权限对存储总库进行安全管理,以提交后的审核库进行审核后转入存储总库,如图5所示。从管理系统的用户权限而言,审批流程涉及人员包括超级管理员、数据管理员和测试用户。作为举例,按不同主要阶段进行以下具体步骤:
(7.1)提交阶段:从待测设备通过测试接口提供现场采集的人脸图像,由测试用户接收评判符合标准要求,再进入建库阶段;另一边,由数据管理员通过批量导入人脸图像并评判是否符合标准要求,再进入建库阶段;之后两类用户的审核流程类似;
(7.2)建库阶段:用户通过数据预处理中人脸检测算法、图像裁剪与质量评判是否符合标准要求,提交给超级管理员;
(7.3)数据集归档阶段:按照测试数据库分类对不同库的命名、及其人员数据集的标识和人脸图像的编码,形成审核库,提交超级管理员;
(7.4)审核阶段:按照数据集标识和图像编码规则分别按附录1和附录2中的要求综合评价批复审核结果,并转入存储总库;
(7.5)所有的审核流程中不同操作步骤都存于数据日志中。
进一步地,在该具体实施方式中,步骤(11)中的数据配置规则用于提供满足测试样本分布要求的测试数据库,按不同的类型人脸图像以特定的配比比例自动形成。
作为举例,图6给出了一种数据集配置规则示例方案,其具体要求如下内容:
(11.1)目标集的人脸图像样本由来源于居民身份证、护照、驾驶证等证件内置芯片中的电子照片或采集到的证件可视人脸图像、其它证件电子照片及现场采集的现场活体人脸图像共同组成;
(11.2)身份证机读照片:符合GA 490-2013的相关要求,占比50%;
(11.3)护照电子照片:符合GA/T 1180-2014的相关要求,占比30%;
(11.4)驾驶证电子照片:符合GA 482-2008的相关要求,占比10%;
(11.5)证件可视人脸图像:符合GA/T 1324-2017中5.3和标准中附录B的相关要求,占比5%;
(11.6)其它证件电子照片:符合标准中附录A中的相关要求,占比3%;
(11.7)现场活体人脸图像:使用被测设备现场采集活体人脸图像进行导入注册,图像质量符合GB/T 35678-2017中4.2的相关要求,占比2%。
(11.8)探测集中的人脸图像来源于公安检查站人证核验、出入境管理、高铁自助通关、机场自助通关、轨道交通自助通关、小区出入口管理、场馆安保管理、银行柜台业务办理、社保实名认证、身份核验远程确认、酒店旅客人证核验等实际应用场景;
(11.9)探测集中的人脸图像涵盖采集设备、光照环境、姿态、年龄跨度、性别、表情、肤色等影响因素;
(11.10)探测集中的人脸图像每幅图像有且仅有唯一人脸;
(11.11)同一目标人在人脸探测集的人脸图像数量为1~10幅;
(11.12)同一人的多幅图像在光照环境、姿态、饰物、表情、采集时间、采集设备等方面至少有一项不同;
(11.13)探测集中存在与目标集中全部人脸图像身份一致的人脸图像;
(11.14)人脸图像质量符合GB/T 35678-2017中4.2的要求。
(11.15)测试数据库规模应符合以下要求:基本级要求:N≥2000,M≥20000;增强级要求:N≥10000,M≥100000。
注:其中N为目标集中不重复的测试人员数量,M为探测集中的测试人脸图像数量。
(11.16)测试数据库样本分布应符合以下要求:
a)性别分布:男、女各占(50±5)%;
b)年龄分布:16岁以下占(15±3)%、16岁~60岁占(75±5)%、60岁以上占(10±3)%;
c)差异性分布:避免双胞胎等极相似人群;
d)时间跨度分布:避免同一测试人五年内面部特征变化不明显的证件照片同时入库;
e)民族分布:我国汉族人占(60±5)%、与汉族人面部特征差别较为明显的我国少数民族占(20±5)%,白色人种占(5±2)%、黑色人种占(5±2)%、棕色人种占(5±2)%、亚洲其它国家的黄色人种占(5±2)%。其中,我国少数民族分布为维吾尔族占(40±5)%、藏族占(40±5)%、乌兹别克族、塔吉克族、哈萨克族、蒙古族、鄂温克族、回族、俄罗斯族等其他少数民族占(20±2)%。
进一步地,在该具体实施方式中,步骤(15)中的数据安全机制用于对整个系统结合性能测试系统与待测设备对人脸识别相关数据以信息安全要求进行管控。
作为举例,图7给出了一种数据安全机制示例方案。由图可知,在测试过程中,从测试数据库编码脱敏与加密/解密处理下载为单次项目测试的测试数据库,并加密存储;同时,不存于待测设备中现场采集的数据库直接获取转为单次项目测试的测试数据库一部分,开始加载数据测试。测试结束后如有数据异常,以映射关系查看数据集,从而使存储总库的人脸图像代码隐藏保护。异常确认后再按用户权限反馈至存储服务器对存储总库进行优化升级,从而实现人脸图像的全生命周期状态转换自循环更新。
由上可知,本实例方案通过信息编码规则与数据集配置规则有效地为人脸识别产品尤其是人证核验产品的性能检测提供符合性的测试数据库,数据安全且可追溯。
再者,本实例方案在实施时,不仅可服务于人脸识别产品的检测与产品质量提升,还可结合测试结果为不同类型的人脸识别产品应用于公安检查站人证核验、出入境管理、高铁自助通关、机场自助通关、轨道交通自助通关、小区出入口管理等不同实际应用场景下应用提供真实有效的数据支撑。
上述本发明的方法,或特定系统单元、或其部份单元,为纯软件架构,可以透过程序代码布设于实体媒体,如硬盘、光盘片、或是任何电子装置(如智能型手机、计算机可读取的储存媒体),当机器加载程序代码且执行(如智能型手机加载且执行),机器成为用以实行本发明的装置。上述本发明的方法与装置亦可以程序代码型态透过一些传送媒体,如电缆、光纤、或是任何传输型态进行传送,当程序代码被机器(如智能型手机)接收、加载且执行,机器成为用以实行本发明的装置。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (14)

1.面向人脸识别设备检测的人脸测试数据库管理系统,其特征在于,包括数据库归档管理模块、评估批注功能模块以及检测服务功能模块;
所述数据库归档管理模块运行于存储服务器中,结合使用管理需求对人脸测试数据库的数据周期性更新,且基于用户权限分配按照数据集标注信息和标识编码规则进行层级分类管理;
所述评估批注功能模块运行于客户端中,与数据库归档管理模块进行数据交互,对大批量导入的人脸图像和人脸视频进行自动评估,通过人脸检测算法和图像处理进行数据预处理与图像批注,按照数据集标识编码规则设定唯一的人脸图像编码或人脸视频编码,从而构建大规模的规范化人脸测试数据库;
所述的检测服务模块运行于客户端中,调用数据库归档管理模块,按数据集配置使用规则为人脸识别产品的性能检测提供符合标准要求的测试数据库及测试结果反馈统计服务。
2.根据权利要求1所述的人脸测试数据库管理系统,其特征在于,所述数据库归档管理模块中包括存储总库、使用分库、审核库、预处理库以及反馈库;
所述存储总库由以单一人员为单位的人员数据集组成,所构建的目标人脸测试数据库中每个人员数据集中的人脸图像和人脸视频具有唯一的标识编码且不可逆;
所述使用分库为根据待测设备的性能检测等级需求,按数据集配置规则从存储总库中获取的设定规模数量的测试数据库,由满足样本分布要求的目标集与探测集组成,用于待测设备的“错误接受率(FAR)和错误拒绝率(FRR)”性能指标测试;
所述审核库包括数据管理员建库与测试用户建库,对建库中“已批注数据集”按评估批注模块处理的评估结果进行核查,并与标准中对测试数据库的技术要求进行符合性确认,经过数据库归档模块归档,由最高权限用户审核确认后转换为存储总库;
所述预处理库为最初批量导入存储服务器中的人脸图像或人脸视频,配合评估批注模块进行数据预处理,给出评估结果并形成“已批注数据集”,从而转换为审核库;
所述反馈库为测试用户所建的人员数据集,主要来源于检测服务模块使用下载的使用分库进行性能检测时出现数据异常的数据集,用于存储总库的数据更新。
3.根据权利要求2所述的人脸测试数据库管理系统,其特征在于,所述数据库归档管理模块中还包括测试结果库和/或数据日志,所述测试结果库存储“错误接受率(FAR)和错误拒绝率(FRR)”性能指标检测的结果,以用于数据更新的关联和测试数据库服务应用需求性的统计分析;所述数据日志包括人脸测试数据库归档管理模块中所有库与测试结果的相关操作、审计等日志。
4.根据权利要求1所述的人脸测试数据库管理系统,其特征在于,所述的评估批注功能模块包括数据预处理模块、数据集归档模块和数据集查询模块;
所述数据预处理模块通过相应的图像处理方法对现场采集或批量导入的人脸图像进行人脸裁切与图像质量评判提示,预处理后的数据将自动转入数据集归档模块中;
所述数据集归档模块按图像标识与编码规则对预处理后的人脸图像进行标注与代码生成;并根据不同的人脸信息因素,采用相应的数据集标识规则和/或人脸图像编码规则来对数据集标识与人脸图像代码进行唯一性管理;
所述数据集查询模块按权限需求根据单项或多项筛选条件对不同测试数据库的人员数据集进行查询,提供实际应用场景下的检测所需测试数据库配比条件与按条件生成统计报表。
5.根据权利要求1所述的人脸测试数据库管理系统,其特征在于,所述的检测服务功能模块包括数据库调用模块、设备接口调试模块、统计与报表模块、测试结果模块;
所述数据库调用模块,用于按需求操作下载或上传人员数据集;
所述设备接口调试模块与待测设备通过测试接口函数调用交互,用于人脸图像的推送或获取;
所述统计与报表模块用于提供数据集统计、项目统计、算法统计和模拟测试统计;
所述测试结果模块用于管理“错误接受率(FAR)和错误拒绝率(FRR)”性能检测的测试结果。
6.根据权利要求5所述的人脸测试数据库管理系统,其特征在于,所述的检测服务功能模块还包括用户登录模块,所述用户登录模块配合数据库归档管理模块按用户权限对人脸测试数据库中各个分库进行与权限相对应的访问操作。
7.面向人脸识别设备检测的测试数据库管理方法,其特征在于,包括:
大批量导入人脸图像,并按数据集标识编码规则对人脸图像自动评判给予唯一性的人脸信息代码,由此来构建所需类别的测试数据库;
根据数据集配置使用规则下载所需规模的测试数据库,以形成目标集与探测集。
8.根据权利要求7所述的测试数据库管理方法,其特征在于,所述测试数据库管理方法中还包括:在使用过程中按数据安全机制下载测试数据库,并参考映射关系实现数据加密与脱敏使用。
9.根据权利要求7或8所述的测试数据库管理方法,其特征在于,所述的测试数据库为根据单次项目测试的需求按数据集配置使用规则形成的测试分库,经授权下载以密文方式存储,通过专用解密工具可查看经映射关系处理后的简单对数据排序编号的数据集的信息及编码映射表。
10.根据权利要求7或8所述的测试数据库管理方法,其特征在于,所述测试数据库在性能指标检测过程中出现数据异常的数据集以测试结果方式显示,仅通过自动化测试系统访问查询授权本次测试的测试结果中提取特征值失败照片和测试数据库的人脸图像或人脸视频,其编号为映射经本地重新排序的简单编号。
11.根据权利要求8所述的测试数据库管理方法,其特征在于,所述的映射关系为存于存储服务器的测试数据库中数据集的完整信息,尤其是批注信息与编码,跟进行性能测试使用的数据集可查看到的标注信息与编码存在对应关系。
12.根据权利要求7所述的测试数据库管理方法,其特征在于,所述测试数据库管理方法中还包括:在使用过程中将测试结果与数据使用情况反馈,并将出现异常数据集上传,对测试数据库形成自循环更新模式。
13.根据权利要求7所述的测试数据库管理方法,其特征在于,所述的数据集标识规则按不同测试数据库及其人员数据集进行层级分类管理而不同命名,标识具有唯一性。
14.根据权利要求7所述的测试数据库管理方法,其特征在于,所述图像编码规则按所在库对应人脸数据集标识叠加后,结合图像的影响因素形成字典表进行自动代码生成,代码具有唯一性。
CN202010620982.XA 2020-06-30 2020-06-30 一种面向人脸识别设备检测的人脸测试数据库管理系统及方法 Active CN111782835B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010620982.XA CN111782835B (zh) 2020-06-30 2020-06-30 一种面向人脸识别设备检测的人脸测试数据库管理系统及方法
PCT/CN2021/074023 WO2022001096A1 (zh) 2020-06-30 2021-01-28 一种面向人脸识别设备检测的人脸测试数据库管理系统及方法
US18/014,040 US20230281238A1 (en) 2020-06-30 2021-01-28 Facial test database management system for detection of facial recognition device, and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010620982.XA CN111782835B (zh) 2020-06-30 2020-06-30 一种面向人脸识别设备检测的人脸测试数据库管理系统及方法

Publications (2)

Publication Number Publication Date
CN111782835A true CN111782835A (zh) 2020-10-16
CN111782835B CN111782835B (zh) 2024-02-27

Family

ID=72760850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010620982.XA Active CN111782835B (zh) 2020-06-30 2020-06-30 一种面向人脸识别设备检测的人脸测试数据库管理系统及方法

Country Status (3)

Country Link
US (1) US20230281238A1 (zh)
CN (1) CN111782835B (zh)
WO (1) WO2022001096A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112148907A (zh) * 2020-10-23 2020-12-29 北京百度网讯科技有限公司 图像数据库的更新方法、装置、电子设备和介质
CN112580735A (zh) * 2020-12-25 2021-03-30 南方电网深圳数字电网研究院有限公司 图片在线标注方法、装置和计算机可读存储介质
WO2022001096A1 (zh) * 2020-06-30 2022-01-06 公安部第三研究所 一种面向人脸识别设备检测的人脸测试数据库管理系统及方法
CN115391354A (zh) * 2022-10-08 2022-11-25 深圳市众云网有限公司 一种网络优化信息管理系统
CN115601799A (zh) * 2022-09-09 2023-01-13 广州市盛通建设工程质量检测有限公司(Cn) 一种基于人脸识别的评测方法、系统、设备及存储介质

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113361388B (zh) * 2021-06-03 2023-11-24 北京百度网讯科技有限公司 图像数据修正方法、装置、电子设备及自动驾驶车辆
CN114201643B (zh) * 2022-02-18 2022-06-17 深圳市明源云科技有限公司 视频流渠道风控方法、设备及计算机可读存储介质
CN116933233B (zh) * 2023-09-13 2024-01-05 哈尔滨工程大学三亚南海创新发展基地 一种基于数据凭证的检测图像提取方法及装置
CN117235186B (zh) * 2023-11-10 2024-02-27 深圳市度申科技有限公司 一种历史信息同步方法
CN118230100A (zh) * 2024-04-09 2024-06-21 国家工业信息安全发展研究中心 一种生物特征识别活体检测性能测试方法及系统
CN118365965B (zh) * 2024-06-17 2024-09-27 广州凡拓数字创意科技股份有限公司 一种基于图像识别的安检预警系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101706872A (zh) * 2009-11-26 2010-05-12 上海交通大学 通用的开放式人脸识别系统
CN106874306A (zh) * 2015-12-14 2017-06-20 公安部户政管理研究中心 人口信息人像比对系统关键性能指标评测方法
US20180322411A1 (en) * 2017-05-04 2018-11-08 Linkedin Corporation Automatic evaluation and validation of text mining algorithms
CN109492604A (zh) * 2018-11-23 2019-03-19 北京嘉华科盈信息系统有限公司 人脸模型特征统计分析系统
CN110334225A (zh) * 2019-05-14 2019-10-15 上海韬安信息技术有限公司 一种兼容多算法的分布式人脸基础信息中间库服务的设计方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101615196A (zh) * 2009-07-28 2009-12-30 公安部第一研究所 千万级一对多人脸识别产品的测试系统与测试方法
US9122914B2 (en) * 2013-05-09 2015-09-01 Tencent Technology (Shenzhen) Co., Ltd. Systems and methods for matching face shapes
CN111782835B (zh) * 2020-06-30 2024-02-27 公安部第三研究所 一种面向人脸识别设备检测的人脸测试数据库管理系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101706872A (zh) * 2009-11-26 2010-05-12 上海交通大学 通用的开放式人脸识别系统
CN106874306A (zh) * 2015-12-14 2017-06-20 公安部户政管理研究中心 人口信息人像比对系统关键性能指标评测方法
US20180322411A1 (en) * 2017-05-04 2018-11-08 Linkedin Corporation Automatic evaluation and validation of text mining algorithms
CN109492604A (zh) * 2018-11-23 2019-03-19 北京嘉华科盈信息系统有限公司 人脸模型特征统计分析系统
CN110334225A (zh) * 2019-05-14 2019-10-15 上海韬安信息技术有限公司 一种兼容多算法的分布式人脸基础信息中间库服务的设计方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022001096A1 (zh) * 2020-06-30 2022-01-06 公安部第三研究所 一种面向人脸识别设备检测的人脸测试数据库管理系统及方法
CN112148907A (zh) * 2020-10-23 2020-12-29 北京百度网讯科技有限公司 图像数据库的更新方法、装置、电子设备和介质
CN112580735A (zh) * 2020-12-25 2021-03-30 南方电网深圳数字电网研究院有限公司 图片在线标注方法、装置和计算机可读存储介质
CN115601799A (zh) * 2022-09-09 2023-01-13 广州市盛通建设工程质量检测有限公司(Cn) 一种基于人脸识别的评测方法、系统、设备及存储介质
CN115391354A (zh) * 2022-10-08 2022-11-25 深圳市众云网有限公司 一种网络优化信息管理系统

Also Published As

Publication number Publication date
WO2022001096A1 (zh) 2022-01-06
CN111782835B (zh) 2024-02-27
US20230281238A1 (en) 2023-09-07

Similar Documents

Publication Publication Date Title
CN111782835B (zh) 一种面向人脸识别设备检测的人脸测试数据库管理系统及方法
CN108089843B (zh) 一种智能化的银行企业级需求管理系统
US6430306B2 (en) Systems and methods for identifying images
CN114117171B (zh) 一种基于赋能思维的工程档案智能收整方法及系统
US7804982B2 (en) Systems and methods for managing and detecting fraud in image databases used with identification documents
US20160012027A9 (en) Redaction with Classification and Archiving for Format Independence
US20050273453A1 (en) Systems, apparatus and methods for performing criminal background investigations
CN108351898A (zh) 用于结构化多字段文件布局的自动化解释
US20110093434A1 (en) Method and system for searching documents in local area network
CA2873819C (en) Systems and methods for authenticating and aiding in indexing of and searching for electronic files
CN109388648B (zh) 一种在电子笔录中提取人员信息及关系人的方法
CN111832919A (zh) 一种认证信息管理方法、装置、电子设备和可读存储介质
CN115150150B (zh) 一种基于区块链技术的信息记录方法
CN115982429A (zh) 一种基于流程控制的知识管理方法及系统
CN116487066A (zh) 一种临床试验数据监控方法、系统和电子设备
CN115512810A (zh) 一种医学影像数据的数据治理方法及系统
Cash et al. Evaluating eyewitnesses: Translating expressions of pre‐and post‐identification confidence
CN114911511A (zh) 一种软件技术状态管理系统
CN112685389A (zh) 数据管理方法、数据管理装置、电子设备及存储介质
CN117764757B (zh) 一种会计凭证一体化智能管理系统
CN116992496B (zh) 一种用于企业服务管理的数据资源安全监督系统
CN114553684B (zh) 网点运维方法、装置、计算机设备、存储介质
CN118505159A (zh) 基于云平台的企业信息管理方法及系统
CN118631841A (zh) 一种银行客户资料快速校准系统
CN112785252A (zh) 一种互联网新媒体公共服务平台数据管理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant