CN111694979A - 一种基于图像的档案管理方法、系统、设备和介质 - Google Patents
一种基于图像的档案管理方法、系统、设备和介质 Download PDFInfo
- Publication number
- CN111694979A CN111694979A CN202010530732.7A CN202010530732A CN111694979A CN 111694979 A CN111694979 A CN 111694979A CN 202010530732 A CN202010530732 A CN 202010530732A CN 111694979 A CN111694979 A CN 111694979A
- Authority
- CN
- China
- Prior art keywords
- image
- images
- archive
- matching
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007726 management method Methods 0.000 title claims abstract description 47
- 238000000034 method Methods 0.000 claims description 23
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 238000010845 search algorithm Methods 0.000 claims description 14
- 238000003064 k means clustering Methods 0.000 claims description 6
- 230000002457 bidirectional effect Effects 0.000 claims description 5
- 230000001815 facial effect Effects 0.000 claims description 2
- 238000012216 screening Methods 0.000 claims 2
- 238000012545 processing Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Library & Information Science (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明提出一种基于图像的档案管理方法、系统、设备和介质,包括:根据目标对象的注册信息及历史现场图像创建对应目标对象的档案库;其中,所述注册信息包括以下至少之一:注册图像、身份信息、职位信息;获取待识别图像,并根据所述待识别图像从所有所述档案库对应的所述注册图像及所述历史现场图像中获取多张匹配图像;根据所述多张匹配图像获取多个匹配档案作为识别结果;本发明可有效提高图像识别的正确性,增强环境的适应性。
Description
技术领域
本发明涉及大数据及人工智能领域,尤其涉及一种基于图像的档案管理方法、系统、设备和介质。
背景技术
人工智能技术的高速发展,不断改变人类的生产生活方式,其中人脸识别尤为显著,方便人脸生活的同时,极大提升人们的生产效率;人脸考勤机即是在人工智能技术的发展下诞生的广泛使用的设备;与传统刷卡或者指纹式考勤系统相比,具备更友好和更高效的考勤方式和效率;但是当前的人脸考勤设备采用静态库搜索方式,即使用无身份信息人脸的抓拍照与有身份信息的注册照底库进行搜索比较,返回最相近的注册照的身份信息,实现人脸的识别和考勤信息的记录;实际为一种以图搜图的方式,存在抗干扰能力弱的缺点,加之注册照与现场抓拍照往往差异较大,影响了搜索结果的准确性,当注册照底库规模增大时,正确命中率下降明显,甚至出现无法使用的情况。
发明内容
鉴于以上现有技术存在的问题,本发明提出一种基于图像的档案管理方法、系统、设备和介质,主要解决传统方法抗干扰性能差且在处理大规模图像数据时,识别正确率明显下降的问题。
为了实现上述目的及其他目的,本发明采用的技术方案如下。
一种基于图像的档案管理方法,包括:
根据目标对象的注册信息及历史现场图像创建对应目标对象的档案库;其中,所述注册信息包括以下至少之一:注册图像、身份信息、职位信息;
获取待识别图像,并根据所述待识别图像从所有所述档案库对应的所述注册图像及所述历史现场图像中获取多张匹配图像;
根据所述多张匹配图像获取多个匹配档案作为识别结果。
可选地,根据所述注册图像划分聚类类别,通过聚类算法对所述注册信息及历史现场图像进行聚类获取对应目标对象的档案。
可选地,所述聚类算法包括以下之一:K-means聚类、均值漂移聚类、基于密度的聚类方法。
可选地,所述历史现场包括以下至少之一:门禁处、会场、教室。
可选地,设置相似度阈值,通过搜索算法选出与所述待识别图像相似度达到所述相似度阈值的多张匹配图像。
可选地,所述搜索算法包括以下至少之一:量化哈希特征搜索、双向搜索、广度优先搜索。
可选地,在获取多个匹配档案之前,对属于同一档案的多张所述匹配图像进行合并,获取近邻档案,并根据合并后的所述匹配图像与所述待识别图像的相似度获取所述近邻档案的相似度分数。
可选地,根据所述近邻档案对应的所述目标对象的档案库中所有图像与所述待识别图像的相似度,更新所述近邻档案的相似度分数。
可选地,筛除所述近邻档案中重复的图像。
可选地,根据相似度分数对所述近邻档案进行排序,并根据排序结果获取多个所述匹配档案。
可选地,将所述待识别图像录入一个或多个所述匹配档案中,更新所述匹配档案。
可选地,分别设置所述注册图像和所述历史现场图像的权重值,根据所述权重值计算相似度。
可选地,设置存储时间阈值,删除超出所述存储时间阈值的所述历史现场图像。
可选地,所述历史现场图像至少包括人脸图像。
一种基于图像的档案管理系统,包括:
档案创建模块,用于根据目标对象的注册信息及历史现场图像创建对应目标对象的档案库;其中,所述注册信息包括以下至少之一:注册图像、身份信息、职位信息;
图像匹配模块,用于获取待识别图像,并根据所述待识别图像从所有所述档案库对应的所述注册图像及所述历史现场图像中获取多张匹配图像;
档案匹配模块,用于根据所述多张匹配图像获取多个匹配档案作为识别结果。
可选地,包括聚类模块,用于根据所述注册图像划分聚类类别,通过聚类算法对所述注册信息及历史现场图像进行聚类获取对应目标对象的档案。
可选地,所述聚类算法包括以下之一:K-means聚类、均值漂移聚类、基于密度的聚类方法。
可选地,所述历史现场包括以下至少之一:门禁处、会场、教室。
可选地,包括搜索模块,用于设置相似度阈值,通过搜索算法选出与所述待识别图像相似度达到所述相似度阈值的多张匹配图像。
可选地,所述搜索算法包括以下至少之一:量化哈希特征搜索、双向搜索、广度优先搜索。
可选地,包括近邻档案获取模块,用于在获取多个匹配档案之前,对属于同一档案的多张所述匹配图像进行合并,获取近邻档案,并根据合并后的所述匹配图像与所述待识别图像的相似度获取所述近邻档案的相似度分数。
可选地,根据所述近邻档案对应的所述目标对象的档案库中所有图像与所述待识别图像的相似度,更新所述近邻档案的相似度分数。
可选地,包括去重模块,用于筛除所述近邻档案中重复的图像。
可选地,包括排序模块,根据相似度分数对所述近邻档案进行排序,并根据排序结果获取多个所述匹配档案。
可选地,包括档案更新模块,用于将所述待识别图像录入一个或多个所述匹配档案中,更新所述匹配档案。
可选地,包括权重设置模块,用于分别设置所述注册图像和所述历史现场图像的权重值,根据所述权重值计算相似度。
可选地,包括时间阈值设置模块,用于设置存储时间阈值,删除超出所述存储时间阈值的所述历史现场图像。
可选地,所述历史现场图像至少包括人脸图像。
一种设备,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行所述的基于图像的档案管理方法。
一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得设备执行所述的基于图像的档案管理方法。
如上所述,本发明一种基于图像的档案管理方法、系统、设备和介质,具有以下有益效果。
本发明建立目标对象的档案,通过待识别图像搜索到档案,并档案中的图像对待识别图像进行识别,可极大地降低由于注册图像与待识别图像的差异较大而引入的干扰,档案中包括历史现场图像,可适应更多场景待识别图像的识别;充分考虑待识别图像与整个匹配档案的相似度,而不单只考察待识别图像与注册图像的相似度,可有效提升识别的正确率。
附图说明
图1为本发明一实施例中基于图像的档案管理方法的流程图。
图2为本发明一实施例中基于图像的档案管理系统的模块图。
图3为本发明一实施例中终端设备的结构示意图。
图4为本发明另一实施例中终端设备的结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
请参阅图1,本发明提供一种基于图像的档案管理方法,包括步骤S01-S03。
在步骤S01中,根据目标对象的注册信息及历史现场图像创建对应目标对象的档案库;其中,注册信息包括以下至少之一:注册图像、身份信息、职位信息;
在一实施例中,在进行考勤、出勤识别等日常工作时,需要通过抓拍现场图像与注册信息进行比对,进行人员出勤核查。其中注册信息通常包括注册图像(如人脸图像、虹膜图像等),人员姓名、性别、年龄、身份证号等身份信息,以及人员职位(如公司职员、经理、学校老师、班长等)。其中,历史现场可包括一个或多个应用场景的图像,如门禁打卡处、会场、教室等。将注册信息与多个历史现场中抓拍的图像一并存入数据库中。
在一实施例中,由于每个人员对应一张注册图像,注册图像之间相互独立,可根据注册图像划分聚类类别,预先通过聚类算法对底库中的图像进行聚类,在聚类过程中将注册图像信息作为半监督信息,半监督信息中的任意两张注册图像不能被聚类算法归为同一类。通过加入半监督信息将历史现场图像与同一个人对应的注册图像聚类到一起,形成注册图像对应人员的档案库(即目标对象的档案库)。每个人员的档案库至少包括一张注册图像和若干历史现场图像。在另一实施例中,可为每个档案库设置唯一标识,用于区分不同档案库。其中,唯一标识可采用档案编号的形式表示(如Ci)。
在一实施例中,聚类算法可采用常规的聚类算法如K-means聚类、均值漂移聚类、基于密度的聚类方法(Density-Based Spatial Clustering of Applications withNoise,DBSCAN)等。以DBSCAN为例,设注册及抓拍的现场图像均为人脸图像,可预先对注册人脸及现场人脸进行特征提取,获取人脸的关键特征,再通过DBSCAN算法对人脸的关键特征进行聚类。DBSCAN中的几个关键定义可表示如下:
E邻域:给定人脸关键特征半径为E内的区域称为该人脸关键特征的E邻域;
核心对象:如果给定人脸关键特征E邻域内的样本点数大于等于MinPts,则称该人脸关键特征为核心特征;
直接密度可达:对于特征样本集合D,如果样本点q在p的E邻域内,并且p为核心特征,那么样本q从样本p直接密度可达。
密度可达:对于特征样本集合D,给定一串样本点p1,p2....pn,p=p1,q=pn,假如样本pi从pi-1直接密度可达,那么样本q从样本p密度可达。
密度相连:存在特征样本集合D中的一点o,如样本o到样本p和样本q都是密度可达的,那么p和q密度相联。
可以发现,密度可达是直接密度可达的传递闭包,并且这种关系是非对称的。密度相连是对称关系。DBSCAN目的是找到密度相连特征样本的最大集合。
将通过聚类得到的所有人员的档案合并在一起形成底库,进一步地,可对底库中每张图像进行编号,以便于对底库中的图像进行搜索,编号可表示为id。
在步骤S02中,获取待识别图像,并根据所述待识别图像从所有档案库对应的注册图像及历史现场图像中获取多个匹配图像;
在一实施例中,在实际应用中,可通过摄像机等图像采集设备实时采集待识别图像,并通过搜索算法搜索步骤S01中的底库,获取与待识别图像相似度达到预设相似度阈值的多张匹配图像。
在一实施例中,搜索算法可包括量化哈希特征搜索、双向搜索、广度优先搜索等。可根据底库规模大小灵活选择,如当底库规模较小时,可采用广度优先搜索等暴力搜索算法;当地库规模较大时,可采用量化哈希特征搜索算法等快速搜索算法。搜索结果为待识别图像与底库中相似度计算最相近的N个照片和对应的相似度;即为其N个最近邻{neii=(idi,scorei),i∈[0,N)}。
在步骤S03中,根据多张匹配图像获取多个匹配档案作为识别结果:
在一实施例中,对属于同一档案的多张匹配图像进行合并,获取近邻档案,同时筛除近邻档案中重复的图像,并根据合并后的所述匹配图像与所述待识别图像的相似度获取所述近邻档案的相似度分数。
如当匹配图像为3张分别对应k1,k2,k3,根据档案编号判断(k1,k2)属于同一档案,则将(k1,k2)组成近邻档案A1,(k3)组成近邻档案A2。通过(k1,k2)与待识别图像的相似度可计算出A1的相似度分数,同样的,根据k3与待识别图像的相似度可得到A2的相似度分数。
在一实施例中,根据近邻档案对应的所述目标对象的档案库中所有图像与所述待识别图像的相似度,更新所述近邻档案的相似度分数。
具体地,对于待识别图像的搜索结果N个最近邻{neii=(idi,scorei),i∈[0,N)},合并具有相同档案号的近邻,得到合并分数作为待识别照片与合并档案的相似度分数;得到近邻档案集合具体计算如下:
ck∈unique({c(idi),i∈[0,N)})
M=size(unique({c(idi),i∈[0,N)}))
其中c(idi)为图片idi的档案编号,unique(·)为对集合进行去重操作;mean(·)对集合求均值;size(·)计算集合的元素个数。
对于近邻档案集合对近邻档案集合中的近邻档案重打分,计算相似度;目的在于考察待识别图像与整个档案的相似度,而非与档案中部分照片的相似度,从而提升准确度。通过近邻档案的档案编号获取对应目标对象的档案库,计算待识别图像与档案库中所有图像的相似度,用于对对应的近邻档案进行重打分。
计算公式如下:
在一实施例中,根据相似度分数对近邻档案进行排序,并根据排序结果获取多个匹配档案。,排序规则可设置为:按相似度从大到小或从小到大进行排序。根据排序结果选出多个的匹配档案作为待识别图像的识别结果。在另一实施例中,可根据需要获取匹配档案对应各人员身份信息,职位或编号等信息。
在一实施例中,在计算前述待识别图像与底库中图像的相似度时,可分别设置底库中注册图像和历史现场图像的权重,根据权重进行相似度计算。具体地,可设置λr,λx分别为注册照和底库现场照的权重值,更新上述公式即为:
在一实施例中,在完成对待识别图像的识别后,将待识别图像及对应的图像特征录入一个或多个匹配档案中,更新对应的匹配档案,以便于用作下次现场抓拍图像的识别。
在一实施例中,可设置时间阈值,对底库中的历史现场图像进行更新。具体地,可删除存储时间超出时间阈值(如一个月)的历史现场图像,保证档案精简的情况下更接近最近时间的情况,从而保证准确性。
请参阅图2,本实施例提供了一种基于图像的档案管理系统,用于执行前述方法实施例中所述的基于图像的档案管理方法。由于系统实施例的技术原理与前述方法实施例的技术原理相似,因而不再对同样的技术细节做重复性赘述。
在一实施例中,基于图像的档案管理系统包括档案创建模块10、图像匹配模块11和档案匹配模块12,档案创建模块10用于辅助执行前述方法实施例介绍的步骤S01,图像匹配模块11用于执行前述方法实施例介绍的步骤S02,档案匹配模块12用于执行前述方法实施例介绍的步骤S03。
在一实施例中,包括聚类模块,用于根据所述注册图像划分聚类类别,通过聚类算法对所述注册信息及历史现场图像进行聚类获取对应目标对象的档案。
在一实施例中,聚类算法包括以下之一:K-means聚类、均值漂移聚类、基于密度的聚类方法。
在一实施例中,历史现场包括以下至少之一:门禁处、会场、教室。
在一实施例中,包括搜索模块,用于设置相似度阈值,通过搜索算法选出与所述待识别图像相似度达到所述相似度阈值的多张匹配图像。
在一实施例中,所述搜索算法包括以下至少之一:量化哈希特征搜索、双向搜索、广度优先搜索。
在一实施例中,包括近邻档案获取模块,用于在获取多个匹配档案之前,对属于同一档案的多张所述匹配图像进行合并,获取近邻档案,并根据合并后的所述匹配图像与所述待识别图像的相似度获取所述近邻档案的相似度分数。
在一实施例中,根据所述近邻档案对应的所述目标对象的档案库中所有图像与所述待识别图像的相似度,更新所述近邻档案的相似度分数。
在一实施例中,包括去重模块,用于筛除所述近邻档案中重复的图像。
在一实施例中,包括排序模块,根据相似度分数对所述近邻档案进行排序,并根据排序结果获取多个所述匹配档案。
在一实施例中,包括档案更新模块,用于将所述待识别图像录入一个或多个所述匹配档案中,更新所述匹配档案。
在一实施例中,包括权重设置模块,用于分别设置所述注册图像和所述历史现场图像的权重值,根据所述权重值计算相似度。
在一实施例中,包括时间阈值设置模块,用于设置存储时间阈值,删除超出所述存储时间阈值的所述历史现场图像。
在一实施例中,所述历史现场图像至少包括人脸图像。
本申请实施例还提供了一种设备,该设备可以包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述设备执行图1所述的方法。在实际应用中,该设备可以作为终端设备,也可以作为服务器,终端设备的例子可以包括:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准语音层面3,Moving Picture Experts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准语音层面4,Moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等,本申请实施例对于具体的设备不加以限制。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本申请实施例的图1中基于图像的档案管理方法所包含步骤的指令(instructions)。
图3为本申请一实施例提供的终端设备的硬件结构示意图。如图所示,该终端设备可以包括:输入设备1100、第一处理器1101、输出设备1102、第一存储器1103和至少一个通信总线1104。通信总线1104用于实现元件之间的通信连接。第一存储器1103可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,第一存储器1103中可以存储各种程序,用于完成各种处理功能以及实现本实施例的方法步骤。
可选的,上述第一处理器1101例如可以为中央处理器(Central ProcessingUnit,简称CPU)、应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,该处理器1101通过有线或无线连接耦合到上述输入设备1100和输出设备1102。
可选的,上述输入设备1100可以包括多种输入设备,例如可以包括面向用户的用户接口、面向设备的设备接口、软件的可编程接口、摄像头、传感器中至少一种。可选的,该面向设备的设备接口可以是用于设备与设备之间进行数据传输的有线接口、还可以是用于设备与设备之间进行数据传输的硬件插入接口(例如USB接口、串口等);可选的,该面向用户的用户接口例如可以是面向用户的控制按键、用于接收语音输入的语音输入设备以及用户接收用户触摸输入的触摸感知设备(例如具有触摸感应功能的触摸屏、触控板等);可选的,上述软件的可编程接口例如可以是供用户编辑或者修改程序的入口,例如芯片的输入引脚接口或者输入接口等;输出设备1102可以包括显示器、音响等输出设备。
在本实施例中,该终端设备的处理器包括用于执行各设备中语音识别装置各模块的功能,具体功能和技术效果参照上述实施例即可,此处不再赘述。
图4为本申请的另一个实施例提供的终端设备的硬件结构示意图。图4是对图3在实现过程中的一个具体的实施例。如图所示,本实施例的终端设备可以包括第二处理器1201以及第二存储器1202。
第二处理器1201执行第二存储器1202所存放的计算机程序代码,实现上述实施例中图1所述方法。
第二存储器1202被配置为存储各种类型的数据以支持在终端设备的操作。这些数据的示例包括用于在终端设备上操作的任何应用程序或方法的指令,例如消息,图片,视频等。第二存储器1202可能包含随机存取存储器(random access memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
可选地,第一处理器1201设置在处理组件1200中。该终端设备还可以包括:通信组件1203,电源组件1204,多媒体组件1205,语音组件1206,输入/输出接口1207和/或传感器组件1208。终端设备具体所包含的组件等依据实际需求设定,本实施例对此不作限定。
处理组件1200通常控制终端设备的整体操作。处理组件1200可以包括一个或多个第二处理器1201来执行指令,以完成上述图1所示方法的全部或部分步骤。此外,处理组件1200可以包括一个或多个模块,便于处理组件1200和其他组件之间的交互。例如,处理组件1200可以包括多媒体模块,以方便多媒体组件1205和处理组件1200之间的交互。
电源组件1204为终端设备的各种组件提供电力。电源组件1204可以包括电源管理系统,一个或多个电源,及其他与为终端设备生成、管理和分配电力相关联的组件。
多媒体组件1205包括在终端设备和用户之间的提供一个输出接口的显示屏。在一些实施例中,显示屏可以包括液晶显示器(LCD)和触摸面板(TP)。如果显示屏包括触摸面板,显示屏可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
语音组件1206被配置为输出和/或输入语音信号。例如,语音组件1206包括一个麦克风(MIC),当终端设备处于操作模式,如语音识别模式时,麦克风被配置为接收外部语音信号。所接收的语音信号可以被进一步存储在第二存储器1202或经由通信组件1203发送。在一些实施例中,语音组件1206还包括一个扬声器,用于输出语音信号。
输入/输出接口1207为处理组件1200和外围接口模块之间提供接口,上述外围接口模块可以是点击轮,按钮等。这些按钮可包括但不限于:音量按钮、启动按钮和锁定按钮。
传感器组件1208包括一个或多个传感器,用于为终端设备提供各个方面的状态评估。例如,传感器组件1208可以检测到终端设备的打开/关闭状态,组件的相对定位,用户与终端设备接触的存在或不存在。传感器组件1208可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在,包括检测用户与终端设备间的距离。在一些实施例中,该传感器组件1208还可以包括摄像头等。
通信组件1203被配置为便于终端设备和其他设备之间有线或无线方式的通信。终端设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个实施例中,该终端设备中可以包括SIM卡插槽,该SIM卡插槽用于插入SIM卡,使得终端设备可以登录GPRS网络,通过互联网与服务器建立通信。
由上可知,在图4实施例中所涉及的通信组件1203、语音组件1206以及输入/输出接口1207、传感器组件1208均可以作为图3实施例中的输入设备的实现方式。
综上所述,本发明一种基于图像的档案管理方法、系统、设备和介质,对于注册图像和历史现场图像差别较大的情况下,通过性能较好的聚类算法将注册图像和对应的历史现场图像形成档案数据,抓拍待识别图像在由注册图像和历史现场图像形成的底库上进行搜索,大大降低了注册图像与历史现场图像差异较大引入的干扰;同时档案的引入,底库的增加,同一个人员的档案具备了更多场景的底库图像,更有利于扩展对不同场景环境的覆盖;通过匹配图像的合并和匹配档案的精确重排,充分考察待识别图像与整个档案的相似度,而不单单只考察待识别图像与注册图像的相似度,从而提升正确命中率;在底库规模较大及底库中人数较多情况下,待识别图像与注册图像之间具有更多的高分负例(如10个人中可能不存在与待识别人员人脸相像的图像,但百万人中出现与待识别对象相似的人脸图像概率大大提高),使得之前的待识别现场照直接与注册照底库搜索结果不可信,但是本发明与档案的搜索则在搜索结果上进行匹配图像合并和匹配档案精确排序,再考察了待识别图像与档案中所有照片的相似度;可信度得到大大提升,从而使得针对包含大规模注册图像的底库识别正确命中率下降小。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (30)
1.一种基于图像的档案管理方法,其特征在于,包括:
根据目标对象的注册信息及历史现场图像创建对应目标对象的档案库;其中,所述注册信息包括以下至少之一:注册图像、身份信息、职位信息;
获取待识别图像,并根据所述待识别图像从所有所述档案库对应的所述注册图像及所述历史现场图像中获取多张匹配图像;
根据所述多张匹配图像获取多个匹配档案作为识别结果。
2.根据权利要求1所述的基于图像的档案管理方法,其特征在于,根据所述注册图像划分聚类类别,通过聚类算法对所述注册信息及历史现场图像进行聚类获取对应目标对象的档案。
3.根据权利要求2所述的基于图像的档案管理方法,其特征在于,所述聚类算法包括以下之一:K-means聚类、均值漂移聚类、基于密度的聚类方法。
4.根据权利要求1所述的基于图像的档案管理方法,其特征在于,所述历史现场包括以下至少之一:门禁处、会场、教室。
5.根据权利要求1所述的基于图像的档案管理方法,其特征在于,设置相似度阈值,通过搜索算法选出与所述待识别图像相似度达到所述相似度阈值的多张匹配图像。
6.根据权利要求5所述的基于图像的档案管理方法,其特征在于,所述搜索算法包括以下至少之一:量化哈希特征搜索、双向搜索、广度优先搜索。
7.根据权利要求1所述的基于图像的档案管理方法,其特征在于,在获取多个匹配档案之前,对属于同一档案的多张所述匹配图像进行合并,获取近邻档案,并根据合并后的所述匹配图像与所述待识别图像的相似度获取所述近邻档案的相似度分数。
8.根据权利要求7所述的基于图像的档案管理方法,其特征在于,根据所述近邻档案对应的所述目标对象的档案库中所有图像与所述待识别图像的相似度,更新所述近邻档案的相似度分数。
9.根据权利要求7所述的基于图像的档案管理方法,其特征在于,筛除所述近邻档案中重复的图像。
10.根据权利要求8所述的基于图像的档案管理方法,其特征在于,根据相似度分数对所述近邻档案进行排序,并根据排序结果获取多个所述匹配档案。
11.根据权利要求10所述的基于图像的档案管理方法,其特征在于,将所述待识别图像录入一个或多个所述匹配档案中,更新所述匹配档案。
12.根据权利要求5所述的基于图像的档案管理方法,其特征在于,分别设置所述注册图像和所述历史现场图像的权重值,根据所述权重值计算相似度。
13.根据权利要求1所述的基于图像的档案管理方法,其特征在于,设置存储时间阈值,删除超出所述存储时间阈值的所述历史现场图像。
14.根据权利要求1所述的基于图像的档案管理方法,其特征在于,所述历史现场图像至少包括人脸图像。
15.一种基于图像的档案管理系统,其特征在于,包括:
档案创建模块,用于根据目标对象的注册信息及历史现场图像创建对应目标对象的档案库;其中,所述注册信息包括以下至少之一:注册图像、身份信息、职位信息;
图像匹配模块,用于获取待识别图像,并根据所述待识别图像从所有所述档案库对应的所述注册图像及所述历史现场图像中获取多张匹配图像;
档案匹配模块,用于根据所述多张匹配图像获取多个匹配档案作为识别结果。
16.根据权利要求15所述的基于图像的档案管理系统,其特征在于,包括聚类模块,用于根据所述注册图像划分聚类类别,通过聚类算法对所述注册信息及历史现场图像进行聚类获取对应目标对象的档案。
17.根据权利要求16所述的基于图像的档案管理系统,其特征在于,所述聚类算法包括以下之一:K-means聚类、均值漂移聚类、基于密度的聚类方法。
18.根据权利要求15所述的基于图像的档案管理系统,其特征在于,所述历史现场包括以下至少之一:门禁处、会场、教室。
19.根据权利要求15所述的基于图像的档案管理系统,其特征在于,包括搜索模块,用于设置相似度阈值,通过搜索算法选出与所述待识别图像相似度达到所述相似度阈值的多张匹配图像。
20.根据权利要求19所述的基于图像的档案管理系统,其特征在于,所述搜索算法包括以下至少之一:量化哈希特征搜索、双向搜索、广度优先搜索。
21.根据权利要求15所述的基于图像的档案管理系统,其特征在于,包括近邻档案获取模块,用于在获取多个匹配档案之前,对属于同一档案的多张所述匹配图像进行合并,获取近邻档案,并根据合并后的所述匹配图像与所述待识别图像的相似度获取所述近邻档案的相似度分数。
22.根据权利要求21所述的基于图像的档案管理系统,其特征在于,根据所述近邻档案对应的所述目标对象的档案库中所有图像与所述待识别图像的相似度,更新所述近邻档案的相似度分数。
23.根据权利要求21所述的基于图像的档案管理系统,其特征在于,包括去重模块,用于筛除所述近邻档案中重复的图像。
24.根据权利要求22所述的基于图像的档案管理系统,其特征在于,包括排序模块,根据相似度分数对所述近邻档案进行排序,并根据排序结果获取多个所述匹配档案。
25.根据权利要求24所述的基于图像的档案管理系统,其特征在于,包括档案更新模块,用于将所述待识别图像录入一个或多个所述匹配档案中,更新所述匹配档案。
26.根据权利要求19所述的基于图像的档案管理系统,其特征在于,包括权重设置模块,用于分别设置所述注册图像和所述历史现场图像的权重值,根据所述权重值计算相似度。
27.根据权利要求15所述的基于图像的档案管理系统,其特征在于,包括时间阈值设置模块,用于设置存储时间阈值,删除超出所述存储时间阈值的所述历史现场图像。
28.根据权利要求15所述的基于图像的档案管理系统,其特征在于,所述历史现场图像至少包括人脸图像。
29.一种设备,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行如权利要求1-14中一个或多个所述的方法。
30.一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得设备执行如权利要求1-14中一个或多个所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010530732.7A CN111694979A (zh) | 2020-06-11 | 2020-06-11 | 一种基于图像的档案管理方法、系统、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010530732.7A CN111694979A (zh) | 2020-06-11 | 2020-06-11 | 一种基于图像的档案管理方法、系统、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111694979A true CN111694979A (zh) | 2020-09-22 |
Family
ID=72480420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010530732.7A Pending CN111694979A (zh) | 2020-06-11 | 2020-06-11 | 一种基于图像的档案管理方法、系统、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111694979A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023284183A1 (en) * | 2021-07-13 | 2023-01-19 | Zhejiang Dahua Technology Co., Ltd. | Image recognition method, electronic device, and computer-readable storage medium |
CN118503463A (zh) * | 2024-07-19 | 2024-08-16 | 南京宁远人力资源有限公司 | 一种人事档案图像的数字化加工、存储和阅览方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070239764A1 (en) * | 2006-03-31 | 2007-10-11 | Fuji Photo Film Co., Ltd. | Method and apparatus for performing constrained spectral clustering of digital image data |
CN106548130A (zh) * | 2016-10-12 | 2017-03-29 | 国政通科技股份有限公司 | 一种视频图像提取及识别方法与系统 |
CN109726674A (zh) * | 2018-12-28 | 2019-05-07 | 上海依图网络科技有限公司 | 一种人脸识别方法及装置 |
CN110069989A (zh) * | 2019-03-15 | 2019-07-30 | 上海拍拍贷金融信息服务有限公司 | 人脸图像处理方法及装置、计算机可读存储介质 |
CN110688901A (zh) * | 2019-08-26 | 2020-01-14 | 苏宁云计算有限公司 | 一种人脸识别方法及装置 |
-
2020
- 2020-06-11 CN CN202010530732.7A patent/CN111694979A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070239764A1 (en) * | 2006-03-31 | 2007-10-11 | Fuji Photo Film Co., Ltd. | Method and apparatus for performing constrained spectral clustering of digital image data |
CN106548130A (zh) * | 2016-10-12 | 2017-03-29 | 国政通科技股份有限公司 | 一种视频图像提取及识别方法与系统 |
CN109726674A (zh) * | 2018-12-28 | 2019-05-07 | 上海依图网络科技有限公司 | 一种人脸识别方法及装置 |
CN110069989A (zh) * | 2019-03-15 | 2019-07-30 | 上海拍拍贷金融信息服务有限公司 | 人脸图像处理方法及装置、计算机可读存储介质 |
CN110688901A (zh) * | 2019-08-26 | 2020-01-14 | 苏宁云计算有限公司 | 一种人脸识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
马 宁 等: "一种基于 long short-term memory 的唇语识别方法", 《中 国 科 学 院 大 学 学 报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023284183A1 (en) * | 2021-07-13 | 2023-01-19 | Zhejiang Dahua Technology Co., Ltd. | Image recognition method, electronic device, and computer-readable storage medium |
CN118503463A (zh) * | 2024-07-19 | 2024-08-16 | 南京宁远人力资源有限公司 | 一种人事档案图像的数字化加工、存储和阅览方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109284729B (zh) | 基于视频获取人脸识别模型训练数据的方法、装置和介质 | |
JP5037627B2 (ja) | 顔認識を用いた画像の識別 | |
WO2020259099A1 (zh) | 一种信息处理方法及装置、存储介质 | |
CN106156347A (zh) | 云相册分类展示方法、装置及服务器 | |
TWI740537B (zh) | 一種資訊處理方法及裝置、儲存介質 | |
CN110472082B (zh) | 数据处理方法、装置、存储介质及电子设备 | |
CN110929770A (zh) | 一种基于图像处理的智能追踪方法、系统、设备及可读介质 | |
CN113052079B (zh) | 一种基于人脸聚类的区域客流统计方法、系统、设备和介质 | |
CA2781105A1 (en) | Automatically mining person models of celebrities for visual search applications | |
CN111814923B (zh) | 一种图像聚类方法、系统、设备和介质 | |
CN111598012B (zh) | 一种图片聚类管理方法、系统、设备及介质 | |
CN112016623B (zh) | 一种人脸聚类方法、装置、设备及存储介质 | |
US11403875B2 (en) | Processing method of learning face recognition by artificial intelligence module | |
US20180181836A1 (en) | Information processing method, information processing device and video surveillance system | |
CN111368867B (zh) | 档案归类方法及系统、计算机可读存储介质 | |
CN111178455B (zh) | 图像聚类方法、系统、设备及介质 | |
US20130343618A1 (en) | Searching for Events by Attendants | |
CN111694979A (zh) | 一种基于图像的档案管理方法、系统、设备和介质 | |
CN111597921A (zh) | 场景识别方法、装置、计算机设备和存储介质 | |
Bharadwaj et al. | Aiding face recognition with social context association rule based re-ranking | |
CN111783786B (zh) | 图片的识别方法、系统、电子设备及存储介质 | |
CN111797175A (zh) | 数据存储方法、装置、存储介质及电子设备 | |
CN115546846A (zh) | 图像识别处理方法、装置、电子设备及存储介质 | |
CN113691525A (zh) | 一种流量数据处理方法、装置、设备及存储介质 | |
Dong et al. | Research on fast face retrieval optimization algorithm based on fuzzy clustering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200922 |
|
RJ01 | Rejection of invention patent application after publication |