CN110705475A - 用于目标对象识别的方法、装置、介质以及设备 - Google Patents
用于目标对象识别的方法、装置、介质以及设备 Download PDFInfo
- Publication number
- CN110705475A CN110705475A CN201910943937.5A CN201910943937A CN110705475A CN 110705475 A CN110705475 A CN 110705475A CN 201910943937 A CN201910943937 A CN 201910943937A CN 110705475 A CN110705475 A CN 110705475A
- Authority
- CN
- China
- Prior art keywords
- class information
- inter
- intra
- target object
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Library & Information Science (AREA)
- General Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Abstract
公开了一种用于目标对象识别的方法、装置、介质以及设备。其中的方法包括:获取与预设底库中的同一目标对象相匹配的多个图像的第一类内信息集合和第一类间信息集合;根据所述第一类内信息集合和第一类间信息集合,确定修订信息,其中,所述修订信息包括:用于描述由类内信息变更为类间信息和/或由类间信息变更为类内信息的信息;根据所述修订信息,确定所述预设底库中的同一目标对象的参考阈值;根据所述参考阈值,设置所述预设底库中的同一目标对象的识别阈值;其中,所述识别阈值用于确定预设底库中的与待识别图像中的待识别目标对象相匹配的目标对象。本公开有利于客观的衡量目标对象识别效果,并有利于提高目标对象识别准确性。
Description
技术领域
本公开涉及计算机视觉技术,尤其涉及一种用于目标对象识别的方法、用于目标对象识别的装置、存储介质以及电子设备。
背景技术
人脸识别、人体识别以及物体识别等目标对象识别,通常需要先提取图像的特征向量,然后,计算该特征向量与预设底库中的各目标对象的特征向量之间的相似度,之后,通过将计算出的各相似度与预先设置的识别阈值进行比较,可以确定出预设底库中是否存在与该图像匹配的目标对象,从而实现目标对象识别。
上述预先设置的识别阈值可能会影响目标对象识别的准确性,如何设置识别阈值,以提高目标对象识别的准确性,是一个值得关注的技术问题。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种用于目标对象识别的方法、装置、存储介质以及电子设备。
根据本公开实施例的一个方面,提供一种用于目标对象识别的方法,所述方法包括:获取待识别图像中的待识别目标对象的特征;确定所述待识别目标对象的特征与预设底库中的至少一目标对象的特征的相似度;根据所述相似度和所述至少一目标对象各自对应的识别阈值,确定所述待识别目标对象的标识信息;其中,所述预设底库中的各目标对象各自对应的识别阈值中,至少两个识别阈值不相同。
根据本公开实施例的另一个方面,提供一种用于目标对象识别的方法,所述方法包括:获取与预设底库中的同一目标对象相匹配的多个图像的第一类内信息集合和第一类间信息集合;根据所述第一类内信息集合和第一类间信息集合,确定修订信息,其中,所述修订信息包括:用于描述由类内信息变更为类间信息和/或由类间信息变更为类内信息的信息;根据所述修订信息,确定所述预设底库中的同一目标对象的参考阈值;根据所述参考阈值,设置所述预设底库中的同一目标对象的识别阈值;其中,所述识别阈值用于确定预设底库中的与待识别图像中的待识别目标对象相匹配的目标对象。
根据本公开实施例的又一个方面,提供一种用于目标对象识别的装置,所述装置包括:获取特征模块,用于获取待识别图像中的待识别目标对象的特征;确定相似度模块,用于确定所述获取特征模块获取的待识别目标对象的特征与预设底库中的至少一目标对象的特征的相似度;确定属性信息模块,用于根据所述确定相似度模块确定出的相似度和所述至少一目标对象各自对应的识别阈值,确定所述待识别目标对象的标识信息;其中,所述预设底库中的各目标对象各自对应的识别阈值中,至少两个识别阈值不相同。
根据本公开实施例的再一个方面,提供一种用于目标对象识别的装置,所述装置包括:获取集合模块,用于获取与预设底库中的同一目标对象相匹配的多个图像的第一类内信息集合和第一类间信息集合;确定修订信息模块,用于根据所述获取集合模块获取的第一类内信息集合和第一类间信息集合,确定修订信息,其中,所述修订信息包括:用于描述由类内信息变更为类间信息和/或由类间信息变更为类内信息的信息;确定参考阈值模块,用于根据所述确定修订信息模块确定出的修订信息,确定所述预设底库中的同一目标对象的参考阈值;阈值设置模块,用于根据所述确定参考阈值模块确定出的参考阈值,设置所述预设底库中的同一目标对象的识别阈值;其中,所述识别阈值用于确定预设底库中的与待识别图像中的待识别目标对象相匹配的目标对象。
基于本公开上述实施例提供的一种用于目标对象识别的方法和装置,由于预设底库中的多个目标对象各自对应的识别阈值并不是一个统一的识别阈值,因此,在预设底库中的不同目标对象的图像质量存在差异的情况下,可以通过不同的识别阈值来衡量相似度,从而有利于避免待识别目标对象的漏识别或者错误的将待识别目标对象识别为预设底库中的一目标对象的现象。由此可知,本公开提供的技术方案有利于提高目标对象识别准确性。
基于本公开上述实施例提供的一种用于目标对象识别的方法和装置,由于本公开中的修订信息包括由类内信息变更为类间信息和/或由类间信息变更为类内信息的信息,因此,修订信息可以在一定程度上反映出目标对象识别的效果,从而利用该修订信息来确定用于目标对象识别的参考阈值,有利于为用于目标对象识别的识别阈值提供合适的参考。由此可知,本公开提供的技术方案有利于客观的衡量目标对象识别效果,并有利于提高目标对象识别准确性。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征以及优势将变得更加明显。附图用来提供对本公开实施例的进一步的理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本公开所适用的场景示意图;
图2为本公开的用于目标对象识别的方法一个实施例的流程图;
图3为本公开的用于目标对象识别的方法另一个实施例的流程图;
图4为理想状态下,第一类内信息集合中的所有类内信息和第一类间信息集合中的所有类间信息的分布示意图;
图5为在识别阈值设置的过松的情况下,第一类内信息集合中的所有类内信息和第一类间信息集合中的所有类间信息的分布示意图;
图6为本公开的确定修订信息一个实施例的流程图;
图7为本公开的用于目标对象识别的方法另一个实施例的流程图;
图8为本公开的用于目标对象识别的装置一个实施例的结构示意图;
图9为本公开的用于目标对象识别的装置另一个实施例的结构示意图;
图10是本申请一示例性实施例提供的电子设备的结构图。
具体实施方式
下面将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅是一种描述关联对象的关联关系,表示可以存在三种关系,如A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开的实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或者专用计算系统环境或配置一起操作。适于与终端设备、计算机系统或者服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境等等。
终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施。在分布式云计算环境中,任务可以是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
本公开概述
在实现本公开的过程中,发明人发现,目标对象识别(例如,人脸识别等)通常需要使用预设底库。预设底库中通常设置有多条记录,每一条记录用于存储一个用户的用户信息,例如,目标对象的标识信息、目标对象的底图以及底图中的目标对象的特征(例如,人脸特征向量)等。然而,不同用户的底图质量往往存在差异,例如,在底图的光线强弱或者底图中的目标对象姿态的端正程度或者底图中的目标对象的清晰程度等方面,往往存在差异。而不同质量的底图会使底图中的目标对象的特征质量随之发生变化,从而可能会给目标对象识别带来困扰,进而可能会影响目标对象的识别准确性。
另外,在目标对象识别过程中,通常会使用识别阈值来衡量待识别目标对象的特征与预设底库中的目标对象的特征之间的相似度,并根据衡量的结果确定待识别目标对象的标识信息(例如,人脸ID等)。如果能够将目标对象的识别结果作为调整识别阈值的一个参考因素,则有利于及时的调整识别阈值,从而有利于提高目标对象识别的准确性。
示例性概述
本公开的技术方案的适用场景的一个例子如图1所示。
图1中,在银行或者机场或者证券营业厅等场所的一业务办理柜台100位置处,预先设置有摄像装置101和设备102,摄像装置101与设备102连接,摄像装置101和设备102之间可以进行信息交互。设备102可以通过网络与后台服务器连接。摄像装置101可以处于录像状态,从而形成视频,视频中的一个或者多个视频帧可以被作为用户103的照片。另外,摄像装置101也可以在用户103位于业务办理柜台100前时,执行拍照操作;例如,摄像装置101检测到有效人脸图像后,自动执行拍照操作;再例如,业务人员控制摄像装置101执行拍照操作。
设备102可以从摄像装置101处获得至少包含有用户103的脸部区域的至少一张照片,该照片可以称为用户103的人脸图像104。下面以设备102针对一张人脸图像104进行处理为例,进行描述。
设备102或者后台服务器对摄像装置101拍照获得人脸图像104进行特征提取处理,设备102或者后台服务器获得人脸图像104的人脸特征。之后,设备102或者后台服务器,根据人脸图像104的人脸特征以及预设底库105(例如,设置于后台服务器中的预设底库105)中的各条用户信息中的底图中的用户的人脸特征,利用识别阈值来判断预设底库105中是否存在与用户103相匹配的用户信息。
如果预设底库105中存在与用户103相匹配的用户信息,则本次成功识别出用户103,设备102获得用户103的标识信息以及用户姓名等用户信息,业务人员可以根据设备102提供的用户信息为用户103办理相应业务,例如,存取款业务、行李托运业务或者账户信息变更业务等。
如果预设底库105中不存在与用户103相匹配的用户信息,则本次未成功识别出用户103。业务人员可以利用设备102在预设底库105中为用户103创建一条用户信息,且当前创建的该条用户信息可以包括:为用户103设置的标识信息(例如,账号或者人脸ID等)、用户103的姓名、人脸图像104以及人脸图像104的人脸特征等。
在上述适用场景的描述中,识别阈值可以采用本公开提供的技术方案中的识别阈值。
示例性方法
图2为本公开的用于目标对象识别的方法一个实施例的流程图。如图2所示的方法包括:S200、S201以及S202。下面对各步骤分别进行说明。
S200、获取待识别图像中的待识别目标对象的特征。
本公开中的待识别图像可以是指至少包含有目标对象的图像。例如,至少包含有目标对象人脸的图像。再例如,至少包含有目标对象人体的图像。本公开中的待识别目标对象的特征可以是指用于描述待识别图像中的目标对象的特征。例如,用于描述待识别图像中的目标对象人脸的人脸特征向量。再例如,用于描述待识别图像中的目标对象人体的人体特征向量。
S201、确定待识别目标对象的特征与预设底库中的至少一目标对象的特征的相似度。
本公开中的预设底库可以是指包含有目标对象识别所需信息的信息集合。例如,预设底库可以是指:包含有人脸识别所需信息的信息集合。一个更具体的例子,预设底库可以是多条用户信息的信息集合,一条用户信息可以包括:目标对象ID(例如,人脸ID、人体ID、用户身份证号码或用户工号等)、用户身份信息(例如,用户姓名、所在部门以及职务等)、用户的底图(例如,用户的人脸底图或者用户的人体底图)以及底图中的目标对象的特征(例如,用户的人脸特征或者人体特征)等。其中的用户即为目标对象。
本公开中的预设底库可以包括但不限于:能够存储目标对象的特征的列表或者数据库等。
本公开中的相似度可以是指特征之间的距离,例如,欧式距离等。通常情况下,距离越小,相似度越高。
S202、根据上述相似度和上述至少一目标对象各自对应的识别阈值,确定待识别目标对象的标识信息。即根据上述相似度和上述至少一目标对象各自对应的识别阈值,判断预设底库中与待识别目标对象相匹配的目标对象,相匹配的目标对象的标识信息被作为待识别目标对象的标识信息。
在本公开的预设底库中的各目标对象各自对应的识别阈值中,至少两个识别阈值不相同。
一个例子,本公开可以为预设底库中的每一个目标对象分别设置一个识别阈值。也就是说,预设底库中的每一个目标对象均具有仅属于自己的识别阈值。在该情况下,本公开可以在确定出待识别目标对象的特征与预设底库中的一目标对象的特征的相似度之后,判断该相似度与属于该目标对象自己的识别阈值之间的大小关系是否满足一定的条件,如果满足一定的条件,则确定出待识别目标对象为预设底库中的该目标对象,获得该待识别目标对象的标识信息,从而成功识别出该待识别目标对象;而在判断出该相似度与属于该目标对象自己的识别阈值之间的大小关系不满足一定的条件时,确定出待识别目标对象不为预设底库中的该目标对象,在待识别目标对象不为预设底库中的任一目标对象时,本次未成功识别出该待识别目标对象。
另一个例子,本公开可以为预设底库中的每一组目标对象分别设置一个识别阈值。也就是说,预设底库包括多组目标对象,每一组目标对象共用一个识别阈值。属于同一组的各目标对象的底图的质量通常具有相似性。在该情况下,本公开可以在确定出待识别目标对象的特征与预设底库中的一目标对象的特征的相似度之后,判断该相似度与该目标对象所在组的识别阈值之间的大小关系是否满足一定的条件,如果满足一定的条件,则确定出待识别目标对象为预设底库中的该目标对象,获得该待识别目标对象的标识信息,从而成功识别出该待识别目标对象;而在判断出该相似度与该目标对象所在组的识别阈值之间的大小关系不满足一定的条件时,确定出待识别目标对象不为预设底库中的该目标对象,在待识别目标对象不为预设底库中的任一目标对象时,本次未成功识别出该待识别目标对象。
可选的,在本次未成功识别出该待识别目标对象的情况下,本公开可以在预设底库中存储该待识别目标对象的相关信息,例如,为该待识别目标对象新建一条记录,并为该待识别目标对象设置标识信息等,将该待识别目标对象的标识信息、待识别目标对象的底图以及底图中的待识别目标对象的特征等用户信息存储在该条记录中。另外,该条记录中还可以存储待识别目标对象所对应的识别阈值。
本公开中的待识别目标对象的标识信息可以是指能够唯一标识出一个目标对象的信息,例如,预设底库中的用户ID或者预设底库中的人脸ID等。
本公开并未为预设底库中的所有目标对象设置一个统一的识别阈值,并利用该统一的识别阈值判断待识别目标是否为预设底库中的相应的目标对象。而是为预设底库中的所有目标对象设置多个识别阈值,这样,在预设底库中的不同目标对象的图像质量存在差异的情况下,可以在不影响其他目标对象的识别阈值的情况下,灵活的调整相应目标对象所对应的识别阈值的大小,从而可以通过不同的识别阈值来衡量待识别目标对象与预设底库中的不同目标对象的相似度,有利于避免在统一识别阈值被设置的过小而出现的待识别目标对象的漏识别现象、以及在统一识别阈值被设置的过大而出现的错误的将待识别目标对象识别为预设底库中的一目标对象的现象。由此可知,本公开有利于提高目标对象识别准确性。
在一个可选示例中,本公开可以在目标对象识别过程中调整相应目标对象对应的识别阈值,以尝试不断的优化相应目标对象对应的识别阈值。本公开优化识别阈值的一个例子如图3所示。
S300、获取与预设底库中的同一目标对象相匹配的多个图像的第一类内信息集合和第一类间信息集合。
为了便于描述,下述将预设底库中的同一目标对象称为预设底库中的第一目标对象。在图像中的目标对象被识别为预设底库中的第一目标对象的情况下,该图像被认为是与预设底库中的第一目标对象相匹配的图像。也就是说,本公开中的多个图像中的每一个图像中的目标对象均被识别为预设底库中的第一目标对象。需要特别说明的是,上述多个图像有可能包括:所包含的目标对象被错误的识别为预设底库中的第一目标对象的图像以及所包含的目标对象被正确的识别为预设底库中的第一目标对象的图像。
可选的,本公开中的第一类内信息集合可以是指多个图像中的每一个图像中的目标对象的特征分别与第一目标对象的特征之间的相似度所形成的集合。相似度可以为欧式距离等。由于多个图像中的目标对象均被识别为预设底库中的第一目标对象,因此,多个图像中的目标对象与预设底库中的第一目标对象均为相同的目标对象,即多个图像中的目标对象与第一目标对象为同类目标对象,从而同类目标对象的特征之间的相似度可以称为类内信息,多个类内信息形成类内信息集合,该类内信息集合即为第一类内信息集合。在特征之间的相似度采用距离(例如,欧式距离)来表示的情况下,第一类内信息集合可以称为第一类内距离集合。
可选的,本公开中的第一类间信息集合可以是指多个图像中的每一个图像中的目标对象的特征分别与预设底库中的其他目标对象的特征之间的相似度(例如,欧式距离)所形成的集合。由于多个图像中的目标对象均被识别为预设底库中的第一目标对象,因此,多个图像中的目标对象与预设底库中的除了第一目标对象之外的其他目标对象不是相同的目标对象,即多个图像中的目标对象与其他目标对象均不为同类目标对象,从而不同类目标对象的特征之间的相似度可以称为类间信息,多个类间信息形成类间信息集合,该类间信息集合即为第一类间信息集合。在特征之间的相似度采用距离(例如,欧式距离)表示的情况下,第一类间信息集合可以称为第一类间距离集合。
可选的,针对多个图像中的任一图像而言,该图像中的目标对象的特征与其他目标对象的特征之间的类间信息可以具体为:该图像中的目标对象的特征与预设底库中的除了第一目标对象之外的多个目标对象的特征之间的类间距离中的最小类间距离。由此可知,针对多个图像中的每一个图像,本公开均可以获得一个最小类间距离,从而可以获得多个最小类间距离,多个最小类间距离形成第一类间信息集合。
本公开通过利用类内距离和类间距离,可以方便快捷的形成第一类内信息集合和第二类间信息集合。
S301、根据第一类内信息集合和第一类间信息集合,确定修订信息。
本公开中的修订信息(revise)可以是指用于表示出对第一类内信息集合中的类内信息和/或第一类间信息集合中的类间信息的修正的信息。本公开中的修订信息可以包括:用于描述由类内信息变更为类间信息和/或由类间信息变更为类内信息的信息。修订信息的具体体现方式可以为多种,下面例举几种修订信息的具体体现方式。
方式一、修订信息包括:由类内信息变更为类间信息的数量。
方式二、修订信息包括:由类间信息变更为类内信息的数量。
方式三、修订信息包括:由类内信息变更为类间信息的数量以及由类间信息变更为类内信息的数量。
方式四、修订信息包括:为第一类内信息集合中的变更为类间信息的类内信息设置的标志位。
方式五、修订信息包括:为第一类间信息集合中的变更为类内信息的类间信息设置的标志位。
方式六、修订信息包括:为第一类内信息集合中的变更为类间信息的类内信息设置的标志位以及为第一类间信息集合中的变更为类内信息的类间信息设置的标志位。
方式七、修订信息包括:由类内信息变更为类间信息的类内信息。
方式八、修订信息包括:由类间信息变更为类内信息的类间信息。
方式九、修订信息包括:由类内信息变更为类间信息的类内信息以及由类间信息变更为类内信息的类间信息。
方式十、修订信息包括:由第一类内信息集合中的未变更为类间信息的类内信息和第一类间信息集合中的变更为类内信息的类间信息形成的集合、以及由第一类内信息集合中的变更为类间信息的类内信息和第一类间信息集合中的未变更为类内信息的类间信息形成的集合。
可选的,本公开可以通过对第一类内信息集合中的所有类内信息和第一类间信息集合中的所有类间信息,重新进行类内信息和类间信息划分的方式,来确定修订信息。在重新划分类内信息和类间信息之后,可以同样形成两个集合,即第二类内信息集合和第二类间信息集合。第二类内信息集合中可能包含有第一类内信息集合中的类内信息以及第一类间信息集合中的类间信息,而第二类间信息集合中可能包含有第一类间信息集合中的类间信息以及第一类内信息集合中的类内信息。
在理想状态下,第一类内信息集合中的所有类内信息和第一类间信息集合中的所有类间信息的分布可以如图4所示。图4中,波峰400表示第一类内信息集合中的所有类内信息的分布,波峰401表示第一类间信息集合中的所有类间信息的分布。
然而,在识别阈值设置的过松(如识别阈值设置的过大)的情况下,实际应属于第一类间信息集合的类间信息被作为类内信息而出现在第一类内信息集合中。此时,第一类内信息集合中的所有类内信息和第一类间信息集合中的所有类间信息的分布可以如图5所示。图5中,波峰500表示第一类内信息集合中的所有类内信息的分布,波峰501表示第一类间信息集合中的所有类间信息的分布。
另外,在识别阈值设置的过紧(如识别阈值设置的过小)的情况下,原本应为一个目标对象,却被作为多个目标对象设置在预设底库中,这样,原本应属于第一类内信息集合的类内信息,却被作为类间信息而出现在第一类间信息集合中。
在图4-图5中,横坐标可以均为相似度,例如,欧式距离等。纵坐标均为具有相同相似度的目标对象的个数。
本公开确定修订信息的一个具体例子如下述针对图6的描述,在此不再详细说明。
S302、根据修订信息,确定上述预设底库中的同一目标对象的参考阈值。
可选的,本公开中的参考阈值可以是指用于为识别阈值的调整提供参考的数值。也就是说,在调整识别阈值时,调整后的识别阈值的大小可以是在参考阈值的基础上确定的。
可选的,本公开中的一个参考阈值可以对应一个或多个目标对象相对应。例如,在预设底库中的一个目标对象对应一个识别阈值的情况下,一个参考阈值对应一个目标对象。再例如,在预设底库包括多组目标对象,在一组目标对象对应一个识别阈值,不同组目标对象对应不同识别阈值的情况下,一个参考阈值对应该组中的所有目标对象。
可选的,本公开可以在判断出修订信息满足一定条件的情况下,执行确定第一目标对象的参考阈值的操作;在判断出修订信息不满足一定条件的情况下,本次可以不执行确定第一目标对象的参考阈值的操作。修订信息满足一定条件可以表示出多个图像中的目标对象可能不应均被识别为第一目标对象,且可能错误的识别达到了预定程度。修订信息不满足一定条件可以表示出多个图像中的目标对象均被识别为第一目标对象可能是准确,或者也可以表示出虽然多个图像中的目标对象可能不应均被识别为第一目标对象,但是可能错误的识别并未达到预定程度。
可选的,上述修订信息满足一定条件可以为:由类内信息变更为类间信息的数量占第一类内信息中的类内信息数量的比例满足第二预定条件,例如,比例达到或者超过第一预定比值等。
可选的,上述修订信息满足一定条件也可以为:由类间信息变更为类内信息的数量占第一类间信息中的类间信息数量的比例满足第二预定条件,例如,比例达到或者超过第二预定比值等。
可选的,上述修订信息满足一定条件还可以为:由类内信息变更为类间信息的数量与由类间信息变更为类内信息的数量之和,占第一类内信息中的类内信息数量和第一类间信息中的类间信息数量之和的比例满足第二预定条件,例如,比例达到或者超过第三预定比值等。
本公开通过确定出比例,并在该比例满足第二预定条件的情况下,执行确定第一目标对象的参考阈值的操作,可以在目标对象的识别准确性较差(如未达到识别准确性要求)的情况下,为识别阈值提供合适的参考值;而在目标对象的识别准确性较好(如已达到识别准确性要求)的情况下,保持当前的识别阈值;从而有利于提高目标对象识别的准确性。
可选的,本公开在修订信息满足一定条件的情况下,可以利用第二类内信息集合中的类内信息和第二类间信息集合中的类间信息,确定预设底库中的第一目标对象的参考阈值。例如,本公开根据第二类内信息集合中的最大类内信息以及第二类间信息集合中的最小类间信息,确定预设底库中的第一目标对象的参考阈值。更进一步的,本公开可以通过对上述最大类内信息和最小类间信息进行计算(如计算两者的均值等),获得计算结果,并将该计算结果作为预设底库中的第一目标对象的参考阈值。
由于最大类内信息和最小类间信息可以反映出第二类内信息集合和第二类间信息集合之间的最小差距(例如,最小距离差距),因此,通过利用最大类内信息和最小类间信息来确定参考阈值,可以为第二类内信息集合中的所有类内信息和第二类间信息集合中的所有类间信息设置一个区分的界线,从而有利于确定出合适的参考阈值。
S303、根据参考阈值,设置上述预设底库中的同一目标对象的识别阈值。
可选的,本公开可以在确定出第一目标对象的参考阈值时,对第一目标对象的识别阈值进行实时更新。本公开也可以采用非实时更新的方式对第一目标对象的识别阈值进行更新。例如,本公开可以累积确定出的参考阈值各自对应的目标对象的数量,在判断出该累积出的数量满足第三预定条件时,输出目标对象识别效果告警信息;这样,运维人员可以及时的获知当前的目标对象识别系统的准确性可能存在异常,运维人员可以自主决定是否更新各目标对象的识别阈值,运维人员在决定更新目标对象的识别阈值时,可以下发阈值调整控制命令,从而本公开可以在接收到阈值调整控制命令时,根据当前累积的各目标对象的参考阈值调整相应的目标对象的识别阈值。当然,本公开也可以采用其他非实时更新的方式对第一目标对象的识别阈值进行更新,例如,在监听到目标对象识别效果告警信息后,自动的在预定时间(如凌晨12:00等)下发阈值调整控制命令,以便于调整相应的目标对象的识别阈值。由于本公开可以自动更新预设底库中的各目标对象的识别阈值,因此,有利于避免预设底库中的内容外露的现象,从而有利于保证预设底库的安全性。
另外,本公开还可以实现对预设底库中的目标对象进行维护,例如,可以根据第二类内信息集合中的属于第一类间信息集合的所有类内信息,确定出预设底库中的至少一条记录,该条记录可能与预设底库中的第一目标对象所在的记录属于同一个目标对象,本公开可以通过合并多条记录或者删除多条记录中的部分记录的方式,对预设底库中的目标对象进行维护。
可选的,上述累积出的数量满足第三预定条可以包括但不限于:积累出的数量与预设底库中的所有目标对象的数量的比值达到或者超过预定比值。累积出的数量满足第三预定条件可以表示出目标对象的总体识别效果较差,即总体识别效果没有达到期望的识别准确性要求。
本公开通过采用非实时更新的方式对第一目标对象的识别阈值进行更新,有利于避免预设底库中的目标对象对应的识别阈值的更新过程,对目标对象识别的干扰,有利于保证目标对象识别过程的可靠性。
由于本公开中的修订信息包括由类内信息变更为类间信息和/或由类间信息变更为类内信息的信息,因此,修订信息可以在一定程度上反映出目标对象识别的效果,从而利用该修订信息来确定用于目标对象识别的参考阈值,有利于为用于目标对象识别的识别阈值提供合适的参考,进而本公开有利于客观的衡量目标对象识别效果,并有利于提高目标对象识别准确性。
本公开根据第一类内信息集合和第一类间信息集合,确定修订信息的一个过程如图6所示。
S600、对第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理,获得第二类内信息集合和/或第二类间信息集合。
可选的,本公开可以在第一类内信息集合中的类内信息的数量满足第一预定条件时,对第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理。例如,本公开可以在第一类内信息集合中的类内信息的数量达到或者超过第一数量时,对第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理。
可选的,本公开可以在第一类间信息集合中的类间信息的数量满足第一预定条件时,对第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理。例如,本公开可以在第一类间信息集合中的类间信息的数量达到或者超过第二数量时,对第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理。
可选的,本公开可以在第一类内信息集合中的类内信息的数量与第一类间信息集合中的类间信息的数量之和满足第一预定条件时,对第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理。例如,本公开可以在第一类内信息集合中的类内信息的数量与第一类间信息集合中的类间信息的数量之和达到或者超过第三数量时,对第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理。
可选的,本公开可以采用聚类中心的数量为2的k-means(k均值)聚类算法,对第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理。本公开通过采用K-Means算法进行聚类处理,可以方便快捷且较为准确的区分出类内信息和类间信息。另外,本公开也可以采用其他聚类算法,例如,DBSCAN(Density-Based SpatialClustering of Applications with Noise,具有噪声应用的基于密度的空间聚类)算法或者基于Max-Min(最大-最小)的聚类算法等,本公开对聚类算法不作限定。
本公开通过在数量满足一定条件时,进行聚类处理,有利于保证聚类处理结果的准确性,从而有利于提高修订信息的准确性。
S601、根据第二类内信息集合和/或第二类间信息集合,确定修订信息。
可选的,本公开可以直接将第二类内信息集合和第二类间信息集合作为修订信息。
可选的,本公开可以通过比较第一类内信息集合和第二类内信息集合中的类内信息间的差异,获得修订信息。例如,可以获得由类内信息变更为类间信息的数量和/或由类间信息变更为类内信息的数量。再例如,可以获得由类内信息变更为类间信息的类内信息和/或由类间信息变更为类内信息的类间信息。
可选的,本公开可以通过比较第一类间信息集合和第二类间信息集合中的类间信息间的差异,获得修订信息。例如,可以获得由类内信息变更为类间信息的数量和/或由类间信息变更为类内信息的数量。再例如,可以获得由类内信息变更为类间信息的类内信息和/或由类间信息变更为类内信息的类间信息。
可选的,本公开可以通过比较第一类内信息集合和第二类内信息集合中的类内信息间的差异以及第一类间信息集合和第二类间信息集合中的类间信息间的差异,获得修订信息。例如,可以获得由类内信息变更为类间信息的数量和/或由类间信息变更为类内信息的数量。再例如,可以获得由类内信息变更为类间信息的类内信息和/或由类间信息变更为类内信息的类间信息。
本公开对第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理,并通过比较聚类处理前的集合与聚类处理后的集合之间的差异,可以便捷准确的获得多种表现类型的修订信息。
图7为本公开的用于识别目标对象的方法的一个实施例的流程图。
S700、累积与预设底库中的第一目标对象相匹配的多个图像的第一类内信息集合和第一类间信息集合。
可选的,对于预设底库中的任一目标对象(即第一目标对象)而言,在确定出一待识别图像中的待识别目标对象的特征与该第一目标对象的特征之间的距离小于识别阈值时,将该距离作为类内距离添加在第一类内信息集合中,并将该待识别目标对象的特征与预设底库中的其他目标对象的特征之间的距离中的最小距离作为类间距离,添加在第一类间信息集合中。
S701、判断第一类内信息集合中的类内距离和/或第一类间信息集合中的类间距离的数量是否满足第一预定条件。如果满足第一预定条件,则到S702,如果不满足第一预定条件,则到S708。
例如,判断第一类内信息集合中的类内距离的数量是否达到或者超过第一数量。再例如,判断第一类间信息集合中的类间距离的数量是否达到或者超过第二数量。再例如,判断第一类内信息集合中的类内距离的数量与第一类间信息集合中的类间距离的数量之和是否达到或者超过第三数量。
S702、对第一类内信息集合中的类内距离和第一类间信息集合中的类间距离进行聚类处理,例如,聚类中心的数量为2的聚类处理,从而对所有类内距离和类间距离重新进行划分,获得第二类内信息集合和第二类间信息集合。
S703、计算第二类内信息集合中的属于第一类间信息集合的类内信息的数量与第二类间信息集合中的属于第一类内信息集合的类间信息的数量之和,记为第一和值,计算第一类内信息集合中的所有类内距离数量和第一类间信息集合中的所有类间距离数量之和,记为第二和值。计算第一和值与的第二和值的比值。
S704、判断上述比值是否满足第二预定条件,例如,判断该比值是否达到或者超过一预定比值等。如果满足第二预定条件,则到S705,如果不满足第二预定条件,则到S708。
S705、利用第二类内信息集合中的类内信息和第二类间信息集合中的类间信息,确定预设底库中的第一目标对象的参考阈值。并累积预设底库中的参考阈值的数量,即累积预设底库中的具有参考阈值的目标对象的数量。
可选的,本公开可以根据第二类内信息集合中的最大类内信息以及第二类间信息集合中的最小类间信息,确定预设底库中的第一目标对象的参考阈值。更进一步的,本公开可以通过对上述最大类内信息和最小类间信息进行计算(如计算两者的均值等),获得计算结果,并将该计算结果作为预设底库中的第一目标对象的参考阈值。
S706、判断累积出的数量是否满足第三预定条件,如果满足第三预定条件,则到S707;如果不满足第三预定条件,则到S708。
S707、产生目标对象识别效果异常的告警。之后,在接收到阈值调整控制命令的情况下,可以自动根据当前累积的各目标对象的参考阈值调整预设底库中的相应的目标对象的识别阈值。
S708、本次用于识别目标对象的方法结束。
示例性装置
图8为本公开的用于目标对象识别的装置一个实施例的结构示意图。该实施例的装置可用于实现本公开相应的方法实施例。图8所示的装置包括:获取特征模块800、确定相似度模块801以及确定属性信息模块802。可选的,该装置还可以包括:获取集合模块803、确定修订信息模块804、确定参考阈值模块805以及阈值设置模块806。
获取特征模块800用于获取待识别图像中的待识别目标对象的特征。
确定相似度模块801用于确定获取特征模块800获取的待识别目标对象的特征与预设底库中的至少一目标对象的特征的相似度。
确定属性信息模块802用于根据确定相似度模块801确定出的相似度和上述预设底库中的至少一目标对象各自对应的识别阈值,确定待识别目标对象的标识信息。其中,预设底库中的各目标对象各自对应的识别阈值中,至少两个识别阈值不相同。
获取集合模块803用于获取与预设底库中的同一目标对象(即第一目标对象)相匹配的多个图像的第一类内信息集合和第一类间信息集合。
可选的,获取集合模块803可以分别获取与预设底库中的第一目标对象相匹配的多个图像的类内距离,形成第一类内信息集合,并分别获取多个图像分别与预设底库中的其他目标对象之间的最小类间距离,形成第一类间信息集合。
确定修订信息模块804用于根据获取集合模块803获取的第一类内信息集合和第一类间信息集合,确定修订信息,其中,修订信息包括:用于描述由类内信息变更为类间信息和/或由类间信息变更为类内信息的信息。一个例子:
首先,确定修订信息模块804可以对第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理,例如,在第一类内信息集合中的类内信息和/或第一类间信息集合中的类间信息的数量满足第一预定条件时,确定修订信息模块804对第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理,获得第二类内信息集合和/或第二类间信息集合。
其次,确定修订信息模块804可以根据第二类内信息集合和/或第二类间信息集合,确定修订信息。例如,确定修订信息模块804比较第一类内信息集合和第二类内信息集合中的类内信息间的差异、以及第一类间信息集合和第二类间信息集合中的类间信息间的差异;确定修订信息模块804可以根据比较获得的差异,获得修订信息。
确定参考阈值模块805用于根据确定修订信息模块804确定出的修订信息,确定预设底库中的同一目标对象的参考阈值。一个例子:
首先,确定参考阈值模块805可以获取第二类内信息集合中的属于第一类间信息集合的类内信息数量和/或第二类间信息集合中的属于第一类内信息集合的类间信息数量,占第一类内信息集合中的类内信息数量和/或第一类间信息集合中的类间信息数量的比例。
其次,在上述比例满足第二预定条件时,确定参考阈值模块805根据第二类内信息集合中的类内信息和第二类间信息集合中的类间信息,确定预设底库中的第一目标对象的参考阈值。例如,确定参考阈值模块805根据第二类内信息集合中的最大类内信息以及第二类间信息集合中的最小类间信息,确定预设底库中的第一目标对象的参考阈值。
阈值设置模块806用于根据确定参考阈值模块805确定出的参考阈值,设置所述预设底库中的同一目标对象的识别阈值。
可选的,阈值设置模块806可以在确定参考阈值模块805确定出第一目标对象的参考阈值时,对第一目标对象的识别阈值进行实时更新。阈值设置模块806也可以采用非实时更新的方式对第一目标对象的识别阈值进行更新。
例如,阈值设置模块806累积确定出的参考阈值各自对应的目标对象的数量,在累积出的数量满足第三预定条件时,阈值设置模块806输出目标对象识别效果告警信息;阈值设置模块806在接收到阈值调整控制命令时,再根据累积的各目标对象的参考阈值调整相应的目标对象的识别阈值。
图9为本公开的用于目标对象识别的装置一个实施例的结构示意图。该实施例的装置可用于实现本公开相应的方法实施例。图9所示的装置包括:获取集合模块903、确定修订信息模块904、确定参考阈值模块905以及阈值设置模块906。
确定修订信息模块904用于根据获取集合模块903获取的第一类内信息集合和第一类间信息集合,确定修订信息,其中,修订信息包括:用于描述由类内信息变更为类间信息和/或由类间信息变更为类内信息的信息。一个例子:
首先,确定修订信息模块904可以对第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理,例如,在第一类内信息集合中的类内信息和/或第一类间信息集合中的类间信息的数量满足第一预定条件时,确定修订信息模块904对第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理,获得第二类内信息集合和/或第二类间信息集合。
其次,确定修订信息模块904可以根据第二类内信息集合和/或第二类间信息集合,确定修订信息。例如,确定修订信息模块904比较第一类内信息集合和第二类内信息集合中的类内信息间的差异、以及第一类间信息集合和第二类间信息集合中的类间信息间的差异;确定修订信息模块904可以根据比较获得的差异,获得修订信息。
确定参考阈值模块905用于根据确定修订信息模块904确定出的修订信息,确定预设底库中的同一目标对象的参考阈值。一个例子:
首先,确定参考阈值模块905可以获取第二类内信息集合中的属于第一类间信息集合的类内信息数量和/或第二类间信息集合中的属于第一类内信息集合的类间信息数量,占第一类内信息集合中的类内信息数量和/或第一类间信息集合中的类间信息数量的比例。
其次,在上述比例满足第二预定条件时,确定参考阈值模块905根据第二类内信息集合中的类内信息和第二类间信息集合中的类间信息,确定预设底库中的第一目标对象的参考阈值。例如,确定参考阈值模块905根据第二类内信息集合中的最大类内信息以及第二类间信息集合中的最小类间信息,确定预设底库中的第一目标对象的参考阈值。
阈值设置模块906用于根据确定参考阈值模块905确定出的参考阈值,设置所述预设底库中的同一目标对象的识别阈值。
可选的,阈值设置模块906可以在确定参考阈值模块905确定出第一目标对象的参考阈值时,对第一目标对象的识别阈值进行实时更新。阈值设置模块906也可以采用非实时更新的方式对第一目标对象的识别阈值进行更新。
例如,阈值设置模块906累积确定出的参考阈值各自对应的目标对象的数量,在累积出的数量满足第三预定条件时,阈值设置模块906输出目标对象识别效果告警信息;阈值设置模块906在接收到阈值调整控制命令时,再根据累积的各目标对象的参考阈值调整相应的目标对象的识别阈值。
示例性电子设备
下面参考图10来描述根据本公开实施例的电子设备。图10示出了根据本公开实施例的电子设备的框图。如图10所示,电子设备101包括一个或多个处理器1011和存储器1012。
处理器1011可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备101中的其他组件以执行期望的功能。
存储器1012可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器,例如,可以包括:随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器,例如,可以包括:只读存储器(ROM)、硬盘以及闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器1011可以运行所述程序指令,以实现上文所述的本公开的各个实施例的用于目标对象识别的方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备101还可以包括:输入装置1013以及输出装置1014等,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。此外,该输入设备1013还可以包括例如键盘、鼠标等等。该输出装置1014可以向外部输出各种信息。该输出设备1014可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图10中仅示出了该电子设备101中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备101还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的用于目标对象识别的方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的用于目标对象识别的方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列举)可以包括:具有一个或者多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势以及效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备以及系统。诸如“包括”、“包含、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述,以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改等对于本领域技术人员而言,是非常显而易见的,并且在此定义的一般原理可以应用于其他方面,而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式中。尽管以上已经讨论了多个示例方面以及实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (22)
1.一种用于目标对象识别的方法,包括:
获取待识别图像中的待识别目标对象的特征;
确定所述待识别目标对象的特征与预设底库中的至少一目标对象的特征的相似度;
根据所述相似度和所述至少一目标对象各自对应的识别阈值,确定所述待识别目标对象的标识信息;
其中,所述预设底库中的各目标对象各自对应的识别阈值中,至少两个识别阈值不相同。
2.根据权利要求1所述的方法,其中,所述识别阈值的设置方式包括:
获取与预设底库中的同一目标对象相匹配的多个图像的第一类内信息集合和第一类间信息集合;
根据所述第一类内信息集合和第一类间信息集合,确定修订信息,其中,所述修订信息包括:用于描述由类内信息变更为类间信息和/或由类间信息变更为类内信息的信息;
根据所述修订信息,确定所述预设底库中的同一目标对象的参考阈值;
根据所述参考阈值,设置所述预设底库中的同一目标对象的识别阈值。
3.根据权利要求2所述的方法,其中,所述获取与预设底库中的同一目标对象相匹配的多个图像的第一类内信息集合和第一类间信息集合,包括:
分别获取与预设底库中的同一目标对象相匹配的多个图像的类内距离,形成第一类内信息集合;
分别获取所述多个图像分别与所述预设底库中的其他目标对象之间的最小类间距离,形成第一类间信息集合。
4.根据权利要求2或3所述的方法,其中,所述根据所述第一类内信息集合和第一类间信息集合,确定修订信息,包括:
对所述第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理,获得第二类内信息集合和/或第二类间信息集合;
根据所述第二类内信息集合和/或第二类间信息集合,确定修订信息。
5.根据权利要求4所述的方法,其中,所述对所述第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理,包括:
在所述第一类内信息集合中的类内信息和/或第一类间信息集合中的类间信息的数量满足第一预定条件时,对所述第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理。
6.根据权利要求4或5所述的方法,其中,所述根据所述第二类内信息集合和/或第二类间信息集合,确定修订信息,包括:
比较第一类内信息集合和第二类内信息集合中的类内信息间的差异、以及第一类间信息集合和第二类间信息集合中的类间信息间的差异;
根据所述比较获得的差异,获得所述修订信息。
7.根据权利要求4至6中任一项所述的方法,其中,所述根据所述修订信息,确定所述预设底库中的同一目标对象的参考阈值,包括:
获取所述第二类内信息集合中的属于第一类间信息集合的类内信息数量和/或第二类间信息集合中的属于第一类内信息集合的类间信息数量,占第一类内信息集合中的类内信息数量和/或第一类间信息集合中的类间信息数量的比例;
在所述比例满足第二预定条件时,根据第二类内信息集合中的类内信息和第二类间信息集合中的类间信息,确定所述预设底库中的同一目标对象的参考阈值。
8.根据权利要求7所述的方法,其中,所述根据第二类内信息集合中的类内信息和第二类间信息集合中的类间信息,确定所述预设底库中的同一目标对象的参考阈值,包括:
根据所述第二类内信息集合中的最大类内信息以及所述第二类间信息集合中的最小类间信息,确定所述预设底库中的同一目标对象的参考阈值。
9.根据权利要求7至8中任一项所述的方法,其中,所述根据所述参考阈值,设置所述预设底库中的同一目标对象的识别阈值,包括:
累积确定出的参考阈值各自对应的目标对象的数量;
在所述数量满足第三预定条件时,输出目标对象识别效果告警信息;
在接收到阈值调整控制命令时,根据累积的各目标对象的参考阈值调整相应的目标对象的识别阈值。
10.一种用于目标对象识别的方法,包括:
获取与预设底库中的同一目标对象相匹配的多个图像的第一类内信息集合和第一类间信息集合;
根据所述第一类内信息集合和第一类间信息集合,确定修订信息,其中,所述修订信息包括:用于描述由类内信息变更为类间信息和/或由类间信息变更为类内信息的信息;
根据所述修订信息,确定所述预设底库中的同一目标对象的参考阈值;
根据所述参考阈值,设置所述预设底库中的同一目标对象的识别阈值;
其中,所述识别阈值用于确定预设底库中的与待识别图像中的待识别目标对象相匹配的目标对象。
11.根据权利要求10所述的方法,其中,所述获取与预设底库中的同一目标对象相匹配的多个图像的第一类内信息集合和第一类间信息集合,包括:
分别获取与预设底库中的同一目标对象相匹配的多个图像的类内距离,形成第一类内信息集合;
分别获取所述多个图像分别与所述预设底库中的其他目标对象之间的最小类间距离,形成第一类间信息集合。
12.根据权利要求10或11所述的方法,其中,所述根据所述第一类内信息集合和第一类间信息集合,确定修订信息,包括:
对所述第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理,获得第二类内信息集合和/或第二类间信息集合;
根据所述第二类内信息集合和/或第二类间信息集合,确定修订信息。
13.根据权利要求12所述的方法,其中,所述对所述第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理,包括:
在所述第一类内信息集合中的类内信息和/或第一类间信息集合中的类间信息的数量满足第一预定条件时,对所述第一类内信息集合中的各类内信息和第一类间信息集合中的各类间信息进行聚类处理。
14.根据权利要求12或13所述的方法,其中,所述根据所述第二类内信息集合和/或第二类间信息集合,确定修订信息,包括:
比较第一类内信息集合和第二类内信息集合中的类内信息间的差异、以及第一类间信息集合和第二类间信息集合中的类间信息间的差异;
根据所述比较获得的差异,获得所述修订信息。
15.根据权利要求12至14中任一项所述的方法,其中,所述根据所述修订信息,确定所述预设底库中的同一目标对象的参考阈值,包括:
获取所述第二类内信息集合中的属于第一类间信息集合的类内信息数量和/或第二类间信息集合中的属于第一类内信息集合的类间信息数量,占第一类内信息集合中的类内信息数量和/或第一类间信息集合中的类间信息数量的比例;
在所述比例满足第二预定条件时,根据第二类内信息集合中的类内信息和第二类间信息集合中的类间信息,确定所述预设底库中的同一目标对象的参考阈值。
16.根据权利要求15所述的方法,其中,所述根据第二类内信息集合中的类内信息和第二类间信息集合中的类间信息,确定所述预设底库中的同一目标对象的参考阈值,包括:
根据所述第二类内信息集合中的最大类内信息以及所述第二类间信息集合中的最小类间信息,确定所述预设底库中的同一目标对象的参考阈值。
17.根据权利要求15至16中任一项所述的方法,其中,所述根据所述参考阈值,设置所述预设底库中的同一目标对象的识别阈值,包括:
累积确定出的参考阈值各自对应的目标对象的数量;
在所述数量满足第三预定条件时,输出目标对象识别效果告警信息;
在接收到阈值调整控制命令时,根据累积的各目标对象的参考阈值调整相应的目标对象的识别阈值。
18.一种用于目标对象识别的装置,包括:
获取特征模块,用于获取待识别图像中的待识别目标对象的特征;
确定相似度模块,用于确定所述获取特征模块获取的待识别目标对象的特征与预设底库中的至少一目标对象的特征的相似度;
确定属性信息模块,用于根据所述确定相似度模块确定出的相似度和所述至少一目标对象各自对应的识别阈值,确定所述待识别目标对象的标识信息;
其中,所述预设底库中的各目标对象各自对应的识别阈值中,至少两个识别阈值不相同。
19.根据权利要求18所述的装置,其中,所述装置还包括:
获取集合模块,用于获取与预设底库中的同一目标对象相匹配的多个图像的第一类内信息集合和第一类间信息集合;
确定修订信息模块,用于根据所述获取集合模块获取的第一类内信息集合和第一类间信息集合,确定修订信息,其中,所述修订信息包括:用于描述由类内信息变更为类间信息和/或由类间信息变更为类内信息的信息;
确定参考阈值模块,用于根据所述确定修订信息模块确定出的修订信息,确定所述预设底库中的同一目标对象的参考阈值;
阈值设置模块,用于根据所述确定参考阈值模块确定出的参考阈值,设置所述预设底库中的同一目标对象的识别阈值。
20.一种用于目标对象识别的装置,包括:
获取集合模块,用于获取与预设底库中的同一目标对象相匹配的多个图像的第一类内信息集合和第一类间信息集合;
确定修订信息模块,用于根据所述获取集合模块获取的第一类内信息集合和第一类间信息集合,确定修订信息,其中,所述修订信息包括:用于描述由类内信息变更为类间信息和/或由类间信息变更为类内信息的信息;
确定参考阈值模块,用于根据所述确定修订信息模块确定出的修订信息,确定所述预设底库中的同一目标对象的参考阈值;
阈值设置模块,用于根据所述确定参考阈值模块确定出的参考阈值,设置所述预设底库中的同一目标对象的识别阈值;
其中,所述识别阈值用于确定预设底库中的与待识别图像中的待识别目标对象相匹配的目标对象。
21.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-17中任一项所述的方法。
22.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于执行上述权利要求1-17中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910943937.5A CN110705475B (zh) | 2019-09-30 | 2019-09-30 | 用于目标对象识别的方法、装置、介质以及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910943937.5A CN110705475B (zh) | 2019-09-30 | 2019-09-30 | 用于目标对象识别的方法、装置、介质以及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110705475A true CN110705475A (zh) | 2020-01-17 |
CN110705475B CN110705475B (zh) | 2022-05-17 |
Family
ID=69197810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910943937.5A Active CN110705475B (zh) | 2019-09-30 | 2019-09-30 | 用于目标对象识别的方法、装置、介质以及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110705475B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112906574A (zh) * | 2020-07-16 | 2021-06-04 | 云从科技集团股份有限公司 | 一种动态阈值管理方法及系统 |
CN113538075A (zh) * | 2020-04-14 | 2021-10-22 | 阿里巴巴集团控股有限公司 | 数据的处理方法、模型的训练方法、装置和设备 |
CN113676414A (zh) * | 2021-09-01 | 2021-11-19 | 中国银行股份有限公司 | 信息合并方法、装置、电子设备、介质及产品 |
CN113792168A (zh) * | 2021-08-11 | 2021-12-14 | 同盾科技有限公司 | 人脸底库自维护的方法、系统、电子装置和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103902689A (zh) * | 2014-03-26 | 2014-07-02 | 小米科技有限责任公司 | 聚类方法、增量聚类方法及相关装置 |
CN106250821A (zh) * | 2016-07-20 | 2016-12-21 | 南京邮电大学 | 一种聚类再分类的人脸识别方法 |
US20160379043A1 (en) * | 2013-11-25 | 2016-12-29 | Ehsan FAZL ERSI | System and method for face recognition |
CN108171191A (zh) * | 2018-01-05 | 2018-06-15 | 百度在线网络技术(北京)有限公司 | 用于检测人脸的方法和装置 |
CN108564067A (zh) * | 2018-04-28 | 2018-09-21 | 深圳卡安兴科技有限公司 | 人脸比对的阈值确定方法及系统 |
CN109800744A (zh) * | 2019-03-18 | 2019-05-24 | 深圳市商汤科技有限公司 | 图像聚类方法及装置、电子设备和存储介质 |
-
2019
- 2019-09-30 CN CN201910943937.5A patent/CN110705475B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160379043A1 (en) * | 2013-11-25 | 2016-12-29 | Ehsan FAZL ERSI | System and method for face recognition |
CN103902689A (zh) * | 2014-03-26 | 2014-07-02 | 小米科技有限责任公司 | 聚类方法、增量聚类方法及相关装置 |
CN106250821A (zh) * | 2016-07-20 | 2016-12-21 | 南京邮电大学 | 一种聚类再分类的人脸识别方法 |
CN108171191A (zh) * | 2018-01-05 | 2018-06-15 | 百度在线网络技术(北京)有限公司 | 用于检测人脸的方法和装置 |
CN108564067A (zh) * | 2018-04-28 | 2018-09-21 | 深圳卡安兴科技有限公司 | 人脸比对的阈值确定方法及系统 |
CN109800744A (zh) * | 2019-03-18 | 2019-05-24 | 深圳市商汤科技有限公司 | 图像聚类方法及装置、电子设备和存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113538075A (zh) * | 2020-04-14 | 2021-10-22 | 阿里巴巴集团控股有限公司 | 数据的处理方法、模型的训练方法、装置和设备 |
CN112906574A (zh) * | 2020-07-16 | 2021-06-04 | 云从科技集团股份有限公司 | 一种动态阈值管理方法及系统 |
CN113792168A (zh) * | 2021-08-11 | 2021-12-14 | 同盾科技有限公司 | 人脸底库自维护的方法、系统、电子装置和存储介质 |
CN113676414A (zh) * | 2021-09-01 | 2021-11-19 | 中国银行股份有限公司 | 信息合并方法、装置、电子设备、介质及产品 |
Also Published As
Publication number | Publication date |
---|---|
CN110705475B (zh) | 2022-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110705475B (zh) | 用于目标对象识别的方法、装置、介质以及设备 | |
US20150234881A1 (en) | Person Authentication Dictionary Update Method, Person Authentication Dictionary Update Apparatus, Recording Medium, and Person Authentication System | |
CN110795584B (zh) | 一种用户标识生成方法、装置及终端设备 | |
JP2015504215A (ja) | 画像を比較するための方法およびシステム | |
US11915519B2 (en) | Information processing system, method for managing object to be authenticated, and program | |
CN115187331A (zh) | 基于多模态数据的产品推荐方法、装置、设备及存储介质 | |
CN117707444B (zh) | 一种云打印机异常状态识别维护管理系统 | |
CN110717458A (zh) | 人脸识别方法及识别装置 | |
CN114595765A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN111984815B (zh) | 用于人脸识别的底库更新方法、装置、介质和设备 | |
CN111680346A (zh) | 户型图补全方法和装置、计算机可读存储介质、电子设备 | |
CN111125322B (zh) | 信息搜索方法和装置、电子设备和存储介质 | |
JP6857373B1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US10832419B2 (en) | Cognitive search analytics for multi-dimensional objects | |
CN114331663A (zh) | 适用于财务信息的多维路径比对式数据处理方法及装置 | |
CN114140730A (zh) | 目标匹配方法、装置、设备及存储介质 | |
CN113704566A (zh) | 识别号主体识别方法、存储介质和电子设备 | |
CN112991418A (zh) | 图像深度预测和神经网络训练方法和装置、介质、设备 | |
CN113158706A (zh) | 脸部抓拍方法、装置、介质以及电子设备 | |
CN112329624A (zh) | 活体检测方法和装置、存储介质、电子设备 | |
CN114581360A (zh) | 光伏组件标签检测方法、装置、设备和计算机存储介质 | |
CN112950329A (zh) | 商品动态信息生成方法、装置、设备及计算机可读介质 | |
CN112434656A (zh) | 一种物联网设备的图像识别方法、装置及计算机设备 | |
CN111651555A (zh) | 业务处理方法、系统和计算机可读存储介质 | |
EP2857989A1 (en) | Image search system and image search method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |