CN112308101A - 进行对象识别的方法和装置 - Google Patents
进行对象识别的方法和装置 Download PDFInfo
- Publication number
- CN112308101A CN112308101A CN201910696479.XA CN201910696479A CN112308101A CN 112308101 A CN112308101 A CN 112308101A CN 201910696479 A CN201910696479 A CN 201910696479A CN 112308101 A CN112308101 A CN 112308101A
- Authority
- CN
- China
- Prior art keywords
- feature
- loss value
- features
- model
- extraction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/757—Matching configurations of points or features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/771—Feature selection, e.g. selecting representative features from a multi-dimensional feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/12—Fingerprints or palmprints
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本公开提供了一种进行对象识别的方法和装置,属于计算机技术领域。所述方法包括:将目标对象使用第一提取模型提取的第一特征,通过第一特征转换模型转换到第二提取模型的特征空间,得到目标对象在特征空间中的第二特征,将目标对象的第二特征,与匹配库中的对象的特征进行匹配,得到与目标对象的第二特征相匹配的目标特征,将目标特征所属的对象,确定为目标对象的匹配对象。采用本公开,可以节约时长。
Description
技术领域
本公开涉及计算机技术领域,特别涉及一种进行对象识别的方法和装置。
背景技术
随着计算机技术的发展,对象识别已经在多个领域中部署应用。例如,人脸识别、指纹识别、声纹识别等。
相关技术中,在进行对象识别时,一般是使用提取模型,提取待识别对象的特征,然后将提取的特征与匹配库中各对象的特征进行比对,确定相似度最高的特征,将相似度最高的特征所属的对象确定为待识别对象的匹配对象,将匹配对象的身份信息确定为待识别对象的身份信息。
随着时间推移,提取模型会进行更新,而匹配库中的特征还是使用低版本提取模型提取的,有可能会出现高版本提取模型提取的特征无法与匹配库的特征进行匹配的情况,这时,就需要使用高版本的提取模型,从样本中重新提取一遍每个对象的特征形成匹配库,然而样本(如,图片、指纹、音频)的数量较大时,提取过程中涉及的数据量就会更加庞大,会花费大量的时间。
发明内容
本公开实施例提供了一种进行对象识别的方法和装置,至少能够解决升级模型后,重新提取匹配库中的特征,花费时间长的问题。所述技术方案如下:
第一方面,提供了一种进行对象识别的方法,所述方法包括:
将目标对象使用第一提取模型提取的第一特征,通过第一特征转换模型转换到第二提取模型的特征空间,得到所述目标对象在所述特征空间中的第二特征;
将所述目标对象的第二特征,与匹配库中的对象的特征进行匹配,得到与所述目标对象的第二特征相匹配的目标特征;
将所述目标特征所属的对象,确定为所述目标对象的匹配对象。
可选的,所述方法还包括:
获取多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征;
将所述多个样本对象中目标数目个样本对象经过所述第一提取模型提取的特征,输入到第一初始特征转换模型,得到第一输出结果;
确定所述第一输出结果与所述目标数目个样本对象经过所述第二提取模型提取的特征的第一损失值;
根据所述第一损失值、所述第一初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型。
可选的,所述方法还包括:
将所述第一输出结果输入到第二初始特征转换模型,得到第二输出结果;
确定所述第二输出结果与所述目标数目个样本对象经过所述第一提取模型提取的特征的第二损失值;
所述根据所述第一损失值、所述第一初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型,包括:
根据所述第一损失值、所述第二损失值、所述第一初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型。
可选的,所述方法还包括:
将所述多个样本对象中目标数目个样本对象经过第二提取模型提取的特征,输入到所述第二初始特征转换模型,得到第三输出结果;
确定所述第三输出结果与所述目标数目个样本对象经过第一提取模型提取的特征的第三损失值;
将所述第三输出结果输入到所述第一初始特征转换模型中,得到第四输出结果;
确定所述第四输出结果与所述目标数目个样本对象经过第二提取模型提取的特征的第四损失值;
所述根据所述第一损失值、所述第二损失值、所述第一初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型,包括:
根据所述第一损失值、所述第二损失值、所述第三损失值、所述第四损失值、所述第一初始特征转换模型、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型。
可选的,所述第一损失值、所述第二损失值、所述第三损失值和所述第四损失值均为L1损失得到的损失值;或者,
所述第一损失值、所述第二损失值、所述第三损失值和所述第四损失值均为L2损失得到的损失值;或者,
所述第一损失值和所述第三损失值为L1损失得到的损失值,所述第二损失值和所述第四损失值为L2损失得到的损失值。
第二方面,提供了一种进行对象识别的方法,所述方法包括:
将匹配库中各对象使用第二提取模型提取的第三特征,分别通过第二特征转换模型转换到第一提取模型的特征空间,得到所述各对象在所述特征空间中的第四特征;
将目标对象使用所述第一提取模型提取的特征与所述各对象在所述特征空间中的第四特征进行匹配,得到与所述目标对象使用所述第一提取模型提取的特征相匹配的目标特征;
将所述目标特征所属的对象,确定为所述目标对象的匹配对象。
可选的,所述方法还包括:
获取多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征;
将所述多个样本对象中目标数目个样本对象经过第二提取模型提取的特征,输入到第二初始特征转换模型,得到第五输出结果;
确定所述第五输出结果与所述目标数目个样本对象经过第一提取模型提取的特征的第五损失值;
根据所述第五损失值、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第二特征转换模型。
可选的,所述方法还包括:
将所述第五输出结果输入到第一初始特征转换模型,得到第六输出结果;
确定所述第六输出结果与所述目标数目个样本对象经过第二提取模型提取的特征的第六损失值;
所述根据所述第五损失值、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第二特征转换模型,包括:
根据所述第五损失值、所述第六损失值、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第二特征转换模型。
可选的,所述方法还包括:
将所述多个样本对象中目标数目个样本对象经过第一提取模型提取的特征,输入到所述第一初始特征转换模型,得到第七输出结果;
确定所述第七输出结果与所述目标数目个样本对象经过第二提取模型提取的特征的第七损失值;
将所述第七输出结果输入到所述第二初始特征转换模型中,得到第八输出结果;
确定所述第八输出结果与所述目标数目个样本对象经过第一提取模型提取的特征的第八损失值;
所述根据所述第五损失值、所述第六损失值、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第二特征转换模型,包括:
根据所述第五损失值、所述第六损失值、第七损失值、第八损失值、所述第一初始特征转换模型、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第二特征转换模型。
可选的,所述第五损失值、所述第六损失值、所述第七损失值和所述第八损失值均为L1损失得到的损失值;或者,
所述第五损失值、所述第六损失值、所述第七损失值和所述第八损失值均为L2损失得到的损失值;或者,
所述第五损失值和所述第七损失值为L1损失得到的损失值,所述第六损失值和所述第八损失值为L2损失得到的损失值。
第三方面,提供了一种进行对象识别的装置,该装置包括:
转换模块,用于将目标对象使用第一提取模型提取的第一特征,通过第一特征转换模型转换到第二提取模型的特征空间,得到所述目标对象在所述特征空间中的第二特征;
匹配模块,用于:
将所述目标对象的第二特征,与匹配库中的对象的特征进行匹配,得到与所述目标对象的第二特征相匹配的目标特征;
将所述目标特征所属的对象,确定为所述目标对象的匹配对象。
可选的,所述装置还包括训练模块,用于:
获取多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征;
将所述多个样本对象中目标数目个样本对象经过所述第一提取模型提取的特征,输入到第一初始特征转换模型,得到第一输出结果;
确定所述第一输出结果与所述目标数目个样本对象经过所述第二提取模型提取的特征的第一损失值;
根据所述第一损失值、所述第一初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型。
可选的,所述训练模块,还用于:
将所述第一输出结果输入到第二初始特征转换模型,得到第二输出结果;
确定所述第二输出结果与所述目标数目个样本对象经过所述第一提取模型提取的特征的第二损失值;
所述训练模块,用于:
根据所述第一损失值、所述第二损失值、所述第一初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型。
可选的,所述训练模块,还用于:
将所述多个样本对象中目标数目个样本对象经过第二提取模型提取的特征,输入到所述第二初始特征转换模型,得到第三输出结果;
确定所述第三输出结果与所述目标数目个样本对象经过第一提取模型提取的特征的第三损失值;
将所述第三输出结果输入到所述第一初始特征转换模型中,得到第四输出结果;
确定所述第四输出结果与所述目标数目个样本对象经过第二提取模型提取的特征的第四损失值;
所述训练模块,用于:
根据所述第一损失值、所述第二损失值、所述第三损失值、所述第四损失值、所述第一初始特征转换模型、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型。
可选的,所述第一损失值、所述第二损失值、所述第三损失值和所述第四损失值均为L1损失得到的损失值;或者,
所述第一损失值、所述第二损失值、所述第三损失值和所述第四损失值均为L2损失得到的损失值;或者,
所述第一损失值和所述第三损失值为L1损失得到的损失值,所述第二损失值和所述第四损失值为L2损失得到的损失值。
第四方面,提供了一种进行对象识别的装置,该装置包括:
转换模块,用于将匹配库中各对象使用第二提取模型提取的第三特征,分别通过第二特征转换模型转换到第一提取模型的特征空间,得到所述各对象在所述特征空间中的第四特征;
匹配模块,用于:
将目标对象使用所述第一提取模型提取的特征与所述各对象在所述特征空间中的第四特征进行匹配,得到与所述目标对象使用所述第一提取模型提取的特征相匹配的目标特征;
将所述目标特征所属的对象,确定为所述目标对象的匹配对象。
可选的,所述装置还包括训练模块,用于:
获取多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征;
将所述多个样本对象中目标数目个样本对象经过第二提取模型提取的特征,输入到第二初始特征转换模型,得到第五输出结果;
确定所述第五输出结果与所述目标数目个样本对象经过第一提取模型提取的特征的第五损失值;
根据所述第五损失值、所述第二初始特征转换模型、所述多个样本对象经过第一提取模型提取的特征和经过第二提取模型提取的特征,确定所述第二特征转换模型。
可选的,所述训练模块,还用于:
将所述第五输出结果输入到第一初始特征转换模型,得到第六输出结果;
确定所述第六输出结果与所述目标数目个样本对象经过第二提取模型提取的特征的第六损失值;
所述训练模块,用于:
根据所述第五损失值、所述第六损失值、所述第二初始特征转换模型、所述多个样本对象经过第一提取模型提取的特征和经过第二提取模型提取的特征,确定所述第二特征转换模型。
可选的,所述训练模块,还用于:
将所述多个样本对象中目标数目个样本对象经过第一提取模型提取的特征,输入到所述第一初始特征转换模型,得到第七输出结果;
确定所述第七输出结果与所述目标数目个样本对象经过第二提取模型提取的特征的第七损失值;
将所述第七输出结果输入到所述第二初始特征转换模型中,得到第八输出结果;
确定所述第八输出结果与所述目标数目个样本对象经过第一提取模型提取的特征的第八损失值;
所述训练模块,用于:
根据所述第五损失值、所述第六损失值、第七损失值、第八损失值、所述第一初始特征转换模型、所述第二初始特征转换模型、所述多个样本对象经过第一提取模型提取的特征和经过第二提取模型提取的特征,确定所述第二特征转换模型。
可选的,所述第五损失值、所述第六损失值、所述第七损失值和所述第八损失值均为L1损失得到的损失值;或者,
所述第五损失值、所述第六损失值、所述第七损失值和所述第八损失值均为L2损失得到的损失值;或者,
所述第五损失值和所述第七损失值为L1损失得到的损失值,所述第六损失值和所述第八损失值为L2损失得到的损失值。
第三方面,提供了一种计算机可读存储介质,该存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现上述第一方面和第二方面所述的进行对象识别的方法。
第四方面,提供了一种服务器,该服务器包括处理器和存储器,其中,所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存放的程序,实现上述第一方面和第二方面所述的进行对象识别的方法。
本公开实施例提供的技术方案带来的有益效果至少包括:
本公开实施例中,将目标对象使用第一提取模型提取的第一特征,通过第一特征转换模型转换到第二提取模型的特征空间,得到目标对象在特征空间中的第二特征,将目标对象的第二特征,与匹配库中的对象的特征进行匹配,得到与目标对象的第二特征相匹配的目标特征,将目标特征所属的对象,确定为目标对象的匹配对象。这样,在经过第一提取模型提取的特征与经过第二提取模型提取的特征不能直接匹配时,可以将第一提取模型提取的特征转换到第二提取模型的特征空间,经过第一提取模型提取的特征就能与经过第二提取模型提取的特征进行匹配,由于特征转换的处理量远远小于重新提取匹配库中的特征,所以可以节约时长。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本公开实施例提供的一种对象识别的示意图;
图2是本公开实施例提供的一种进行对象识别的方法流程图;
图3是本公开实施例提供的一种训练的示意图;
图4是本公开实施例提供的一种训练的示意图;
图5是本公开实施例提供的一种进行对象识别的方法流程图;
图6是本公开实施例提供的一种进行对象识别的装置的结构示意图;
图7是本公开实施例提供的一种进行对象识别的装置的结构示意图;
图8是本公开实施例提供的一种进行对象识别的装置的结构示意图;
图9是本公开实施例提供的一种进行对象识别的装置的结构示意图;
图10是本公开实施例提供的一种服务器的结构示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
在进行实施前,首先介绍一下本公开实施例的应用场景,以及本公开实施例可能涉及的名词概念:
本公开实施例可以是应用于人脸识别、指纹识别、行为特征识别、声纹识别等生物特征识别场景中。如图1所示,在人脸识别场景中,匹配库中预先存储有各人脸图片的特征,在确定待识别人脸图片与匹配库中的某个人脸图片匹配时,可以提取待识别人脸图片的特征,然后将该特征与匹配库中各人脸图片的特征进行比对,确定相似度最高的人脸图片且相似度高于一定数值,可以确定该人脸图片与待识别人脸图片相匹配,即该人脸图片与待识别人脸图片属于同一身份。
生物特征识别,指通过计算机利用人体固有的生理特征(如指纹、虹膜、面相等)或行为特征进行个人身份的鉴定。
特征提取,指通过对样本进行建模,抽取出最具统计意义特征的降维过程。
特征比对,对待识别对象先进行特征提取,再在匹配库中进行目标搜索,依次比较后根据特征相似程度找出最佳匹配对象。
本公开实施例提供了一种进行对象识别的方法,该方法的执行主体可以是服务器。其中,服务器中可以包括处理器、存储器和收发器等,处理器可以用于进行对象识别的过程的处理,存储器可以用于存储进行对象识别过程中需要的数据以及产生的数据,收发器可以用于接收以及发送数据。
本公开实施例提供了一种进行对象识别的方法,可以将待识别对象的特征转换为可以兼容低版本提取模型提取的特征,如图2所示,该方法的执行流程可以如下:
步骤201,将目标对象使用第一提取模型提取的特征,通过第一特征转换模型转换为使用第二提取模型提取的特征。
其中,目标对象为待识别对象,也即还未确定身份的对象,目标对象可以是人脸图片、声纹、指纹等。本公开实施例以目标对象为人脸图片为例进行说明。第一特征转换模型可以是全连接的神经网络,在进行对象识别时,为了兼容低版本提取模型提取的特征,可以将高版本模型提取的特征转换到使用低版本提取模型提取的特征,第一提取模型为高版本提取模型,第二提取模型为低版本提取模型。可以预先训练一个第一特征转换模型(训练过程在后面进行说明),用于将某个对象使用第一提取模型提取的特征转换到第二提取模型的特征空间。
在实施中,在获取到目标对象后,可以将目标对象输入到第一提取模型,得到目标对象的第一特征。然后获取第一特征转换模型,将目标对象的第一特征输入到第一特征转换模型,将目标对象的第一特征转换到第二提取模型的特征空间,得到目标对象在该特征空间中的第二特征,第二提取模型的特征空间可以指利用第二提取模型提取的特征对应的特征空间,这样,就得到目标对象在第二提取模型的特征空间中的第二特征。例如,在抓拍到人脸图片时,要对人脸图片进行识别,人脸图片即为目标对象。
需要说明的是,第一提取模型为高版本提取模型,第二提取模型为低版本提取模型,高版本提取模型的性能要高于低版本提取模型的性能。上述将第一特征转换到第二提取模型的特征空间,可以是通过一个非线性的映射函数或者其它转换关系,将第一特征转换为与第二提取模型的特征空间中的特征维度一样的特征,例如,若目标对像直接使用第二提取模型的提取的特征的维度为5维,将第一特征转换到第二提取模型的特征空间后,第二特征的维度也为5维。
步骤202,将目标对象的第二特征,与匹配库中的对象的特征进行匹配,得到与目标对象的第二特征相匹配的目标特征。
其中,匹配库中各对象的特征是使用第二提取模型提取的。在某个对象入库时,可以将该对象输入到第二提取模型中,输出则为该对象使用第二提取模型提取的特征,然后将该对象的特征存储在匹配库中。
在实施中,在获取到目标对象在第二提取模型的特征空间中的第二特征后,可以将目标对象的第二特征与匹配库中各对象的特征进行比对,得到目标对象的第二特征与匹配库中各对象的特征的相似度,将相似度最大,且大于目标数值的特征,确定为与目标对象的第二特征相匹配的目标特征。
需要说明的是,计算相似度的过程可以是计算余弦距离,将特征的余弦距离,确定为特征之间的相似度。上述目标数值可以预设,并且存储至服务器中,目标数值可以为0.6。另外,由于目标对象经过第一提取模型提取的特征已经转换到第二提取模型的特征空间中,所以可以与匹配库中的各对象的特征进行直接比较。
步骤203,将目标特征所属的对象,确定为目标对象的匹配对象。
在实施中,在确定目标特征之后,可以将目标特征所属的对象,确定为目标对象的匹配对象,这样,可以将目标对象的匹配对象的身份信息确定为目标对象的身份信息,目标对象不再是待识别对象。
可选的,本公开实施例中,还提供了训练第一特征转换模型的过程,处理可以如下:
获取多个样本对象经过第一提取模型提取的特征和经过第二提取模型提取的特征,将多个样本对象中目标数目个样本对象经过第一提取模型提取的特征,输入到第一初始特征转换模型,得到第一输出结果,确定第一输出结果与目标数目个样本对象经过第二提取模型提取的特征的第一损失值,根据第一损失值、第一初始特征转换模型、多个样本对象经过第一提取模型提取的特征和经过第二提取模型提取的特征,确定第一特征转换模型。
在实施中,可以获取多个样本对象,将多个样本对象输入到第一提取模型,得到多个样本对象经过第一提取模型提取的特征,并将多个样本对象输入到第二提取模型,得到多个样本经过第二提取模型提取的特征。
然后将多个样本对象中目标数目个样本对象经过第一提取模型提取的特征,输入到第一初始特征转换模型,得到第一输出结果,将第一输出结果与该目标数目个样本对象经过第二提取模型提取的特征的第一损失值。使用第一损失值作为约束,并使用梯度下降算法,调整第一初始特征转换模型中参数的参数值,然后重新在多个样本对象中选取目标数目个样本对象,执行上述过程,也能得到一个第一损失值,继续调整第一初始特征转换模型中参数的参数值,直到使第一损失值最小,选择使第一损失值最小时的参数的参数值代入第一初始特征转换模型,得到第一特征转换模型。如图3所示,样本对象经过第一提取模型提取的特征使用f-s表示,样本对象经过第二提取模型提取的特征使用f-t表示,f-s经过第一初始特征转换模型的第一输出结果为f-t1,f-t1与f-t之间的损失为第一损失值。
可选的,为了使第一特征转换模型性能更好,可以使用更多的约束,进行训练,相应的处理可以如下:
将第一输出结果输入到第二初始特征转换模型,得到第二输出结果,确定第二输出结果与目标数目个样本对象经过第一提取模型提取的特征的第二损失值,根据第一损失值、第二损失值、第一初始特征转换模型、多个样本对象经过第一提取模型提取的特征和经过第二提取模型提取的特征,确定第一特征转换模型。
其中,经过第二初始特征转换模型转换后的特征,会从第二提取模型的特征空间转换到第一提取模型的特征空间。
在实施中,在得到第一输出结果之后,可以将第一输出结果输入到第二初始特征转换模型,得到第二输出结果。然后确定第二输出结果与目标数目个样本对象经过第一提取模型提取的特征的第二损失值。然后可以使用梯度下降算法调整第一初始特征转换模型和第二初始特征转换模型中的参数的参数值,直到某一组参数值,可以使第一损失值和第二损失值均最小,即得到第一特征转换模型和第二特征转换模型,后续可以仅使用第一特征转换模型。
这样,由于使用了两个损失进行约束,所以可以使训练出的第一特征转换模型性能更好。
可选的,为了使第一特征转换模型的性能更好,可以使用更多的约束来训练第一特征转换模型,处理可以如下:
将多个样本对象中目标数目个样本对象经过第二提取模型提取的特征,输入到第二初始特征转换模型,得到第三输出结果,确定第三输出结果与目标数目个样本对象经过第一提取模型提取的特征的第三损失值,将第三输出结果输入到第一初始特征转换模型中,得到第四输出结果;确定第四输出结果与目标数目个样本对象经过第二提取模型提取的特征的第四损失值,根据第一损失值、第二损失值、第三损失值、第四损失值、第一初始特征转换模型、第二初始特征转换模型、多个样本对象经过第一提取模型提取的特征和经过第二提取模型提取的特征,确定第一特征转换模型。
在实施中,可以将多个样本对象中目标数目个样本对象经过第二提取模型提取的特征,输入到第二初始特征转换模型中,得到第三输出结果。计算第三输出结果与目标数目个样本对象经过第一提取模型提取的特征的第三损失值。将第三输出结果再输入到第一初始特征转换模型中,得到第四输出结果。确定第四输出结果与目标数目个样本对象经过第二提取模型提取的特征的第四损失值。这样,会有四个损失值,即第一损失值、第二损失值、第三损失值和第四损失值。如图4所示,样本对象经过第一提取模型提取的特征使用f-s表示,样本对象经过第二提取模型提取的特征使用f-t表示。f-s经过第一初始特征转换模型的第一输出结果为f-t1,f-t1与f-t之间的损失为第一损失值,f-t1经过第二初始特征转换模型的第二输出结果为f-s2,f-s2与f-s之间的损失为第二损失值。f-t经过第二初始特征转换模型的第三输出结果为f-s1,f-s1与f-s之间的损失为第三损失值,第三输出结果f-s1经过第一初始特征转换模型的第四输出结果为f-t2,f-t2与f-t之间的损失为第四损失值。
然后可以使用梯度下降算法调整第一初始特征转换模型和第二初始特征转换模型中的参数的参数值,直到某一组参数值,可以使第一损失值、第二损失值、第三损失值和第四损失值均最小,即得到第一特征转换模型和第二特征转换模型,后续可以仅使用第一特征转换模型。
需要说明的是,上述第一损失值、第二损失值、第三损失值和第四损失值中“第一”、“第二”、“第三”和“第四”用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
可选的,上述第一损失值、第二损失值、第三损失值和第四损失值均为L1损失得到的损失值。L1损失用公式表示可以为:
或者,上述第一损失值、第二损失值、第三损失值和第四损失值均为L2损失得到的损失值。L2损失用公式表示可以为:
或者,上述第二损失值和第四损失值为L2损失得到的损失值,第一损失值和第三损失值为L1损失得到的损失值。
在实施中,L1损失和L2损失的表达式可以见上述描述,由于第一损失值是实际值与经过一次转换的估计值之间的损失值,第三损失值是实际值与经过一次转换的估计值之间的损失值,第一损失值和第三损失值采用L1损失得到的损失值,由于L1损失的鲁棒性更好,所以使用L1损失作为约束,训练出的第一特征转换模型和第二特征转换模型的性能更好。
本公开实施例中,将目标对象使用第一提取模型提取的第一特征,通过第一特征转换模型转换到第二提取模型的特征空间,得到目标对象在特征空间中的第二特征,将目标对象的第二特征,与匹配库中的对象的特征进行匹配,得到与目标对象的第二特征相匹配的目标特征,将目标特征所属的对象,确定为目标对象的匹配对象。这样,在经过第二提取模型提取的特征与经过第一提取模型提取的特征不能直接匹配时,可以将第一提取模型提取的特征转换到第二提取模型的特征空间,经过第一提取模型提取的特征就能与经过第二提取模型提取的特征进行匹配,由于特征转换的处理量远远小于重新提取匹配库中的特征,所以可以节约时长。
另外,在特征转换后,进行匹配,虽然性能要低于直接使用第一提取模型提取特征时的匹配,但是要高于第二提取模型提取特征时的匹配。
本公开实施例提供了一种进行对象识别的方法,可以将匹配库的特征转换为可以兼容高版本的提取模型提取的特征,如图5所示,该方法的执行流程可以如下:
步骤501,将匹配库中各对象使用第二提取模型提取的第三特征,分别通过第二特征转换模型转换到第一提取模型的特征空间,得到各对象在特征空间中的第四特征。
在实施中,在进行对象识别时,为了兼容高版本提取模型提取的特征,可以将低版本提取模型提取的特征转换到高版本提取模型的特征空间,第一提取模型为高版本提取模型,第二提取模型为低版本提取模型。可以预先训练一个特征转换模型(即第二特征转换模型),用于将第二提取模型提取的特征转换到第一提取模型的特征空间。
在有高版本的提取模型出现后,可以使用第二特征转换模型,将匹配库中各对象经过第二提取模型提取的第三特征,转换到第一提取模型的特征空间,这样,就可以得到匹配库中各对象在第一提取模型的特征空间中的第四特征。
需要说明的是,第一提取模型为高版本提取模型,第二提取模型为低版本提取模型,高版本提取模型的性能要高于低版本提取模型的性能。上述将第三特征转换到第一提取模型的特征空间,可以是通过一个非线性的映射函数,将第三特征转换为与第一提取模型的特征空间中的特征维度一样的特征,例如,若匹配库中某个对象直接使用第二提取模型的提取的特征的维度为5维,将第三特征转换到第一提取模型的特征空间后,第四特征的维度也为5维。
步骤502,将目标对象使用第一提取模型提取的特征与各对象在特征空间中的第四特征进行匹配,得到与目标对象使用第一提取模型提取的特征相匹配的目标特征。
在实施中,在对目标对象进行识别时,可以使用第一提取模型提取目标对象的特征,得到目标对象的特征,将目标对象的特征与各对象在第一提取模型的特征空间中的第四特征进行匹配,得到目标对象的特征与各对象在该特征空间中的第四特征的相似度,选取相似度最大,且大于目标数值的目标特征。
步骤504,将目标特征所属的对象,确定为目标对象的匹配对象。
在实施中,在选取出目标特征之后,可以将目标特征所属的对象,确定为目标对象的匹配对象。
这样,由于匹配库中的各对象的特征与目标对象的特征均属于第一提取模型所属的特征空间,所以可以直接进行匹配。
可选的,本公开实施例中,还提供了训练第二特征转换模型的过程,处理可以如下:
获取多个样本对象经过第一提取模型提取的特征和经过第二提取模型提取的特征,将多个样本对象中目标数目个样本对象经过第二提取模型提取的特征,输入到第二初始特征转换模型,得到第五输出结果,确定第五输出结果与目标数目个样本对象经过第一提取模型提取的特征的第五损失值,根据第五损失值、第二初始特征转换模型、多个样本对象经过第一提取模型提取的特征和经过第二提取模型提取的特征,确定第二特征转换模型。
在实施中,可以获取多个样本对象,将多个样本对象输入到第一提取模型,得到多个样本对象经过第一提取模型提取的特征,并将多个样本对象输入到第二提取模型,得到多个样本经过第二提取模型提取的特征。
然后将多个样本对象中目标数目个样本对象经过第二提取模型提取的特征,输入到第二初始特征转换模型,得到第五输出结果,计算第五输出结果与该目标数目个样本对象经过第一提取模型提取的特征的第五损失值。使用第五损失值作为约束,使用梯度下降算法,调整第二初始特征转换模型中参数的参数值,然后重新在多个样本对象中选取目标数目个样本对象,执行上述过程,也能得到一个第五损失值,继续调整第二初始特征转换模型中参数的参数值,直到使第五损失值最小,选择使第五损失值最小时的参数的参数值代入第二初始特征转换模型,得到第二特征转换模型。
可选的,为了使第二特征转换模型性能更好,可以使用更多的约束,进行训练,相应的处理可以如下:
将第五输出结果输入到第一初始特征转换模型,得到第六输出结果,确定第六输出结果与目标数目个样本对象经过第二提取模型提取的特征的第六损失值,根据第五损失值、第六损失值、第二初始特征转换模型、多个样本对象经过第一提取模型提取的特征和经过第二提取模型提取的特征,确定第二特征转换模型。
其中,经过第一初始特征转换模型转换后的特征,会从第一提取模型的特征空间转换到第二提取模型的特征空间。
在实施中,在得到第五输出结果之后,可以将第五输出结果输入到第一初始特征转换模型,得到第六输出结果。然后确定第六输出结果与目标数目个样本对象经过第二提取模型提取的特征的第六损失值,然后可以使用梯度下降算法调整第一初始特征转换模型和第二初始特征转换模型中的参数的参数值,直到某一组参数值,可以使第五损失值和第六损失值均最小,即得到第一特征转换模型和第二特征转换模型,后续可以仅使用第二特征转换模型。
这样,由于使用了两个损失进行约束,所以可以使训练出的第二特征转换模型性能更好。
可选的,为了使第二特征转换模型的性能更好,可以使用更多的约束来训练第二特征转换模型,处理可以如下:
将多个样本对象中目标数目个样本对象经过第一提取模型提取的特征,输入到第一初始特征转换模型,得到第七输出结果,确定第七输出结果与目标数目个样本对象经过第二提取模型提取的特征的第七损失值,将第七输出结果输入到第二初始特征转换模型中,得到第八输出结果,确定第八输出结果与目标数目个样本对象经过第一提取模型提取的特征的第八损失值,根据第五损失值、第六损失值、第七损失值、第八损失值、第一初始特征转换模型、第二初始特征转换模型、多个样本对象经过第一提取模型提取的特征和经过第二提取模型提取的特征,确定第二特征转换模型。
在实施中,可以将多个样本对象中目标数目个样本对象经过第一提取模型提取的特征,输入到第一初始特征转换模型中,得到第七输出结果。计算第七输出结果与目标数目个样本对象经过第二提取模型提取的特征的第七损失值。将第七输出结果再输入到第二初始特征转换模型中,得到第八输出结果。确定第八输出结果与目标数目个样本对象经过第一提取模型提取的特征的第八损失值。这样,会有四个损失值,即第五损失值、第六损失值、第七损失值和第八损失值。
然后可以使用梯度下降算法调整第一初始特征转换模型和第二初始特征转换模型中的参数的参数值,直到某一组参数值,可以使第五损失值、第六损失值、第七损失值和第八损失值均最小,即得到第一特征转换模型和第二特征转换模型,后续可以仅使用第二特征转换模型。
需要说明的是,上述第五损失值、第六损失值、第七损失值和第八损失值中“第五”、“第六”、“第七”和“第八”用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
可选的,上述第五损失值、第六损失值、第七损失值和第八损失值均为L1损失得到的损失值。L1损失用公式可以见前面。
或者,上述第五损失值、第六损失值、第七损失值和第八损失值均为L2损失得到的损失值。L2损失用公式可以见前面。
或者,上述第五损失值和第七损失值为L1损失得到的损失值,第六损失值和第八损失值为L2损失得到的损失值。
在实施中,L1损失和L2损失的表达式可以见上述描述,由于第五损失值是实际值与经过一次转换的估计值之间的损失值,第七损失值是实际值与经过一次转换的估计值之间的损失值,所以第五损失值和第七损失值采用L1损失得到的损失值,这是由于L1损失的鲁棒性更好,所以使用L1损失作为约束,训练出的第一特征转换模型和第二特征转换模型的性能更好。
本公开实施例中,获取第二特征转换模型,将匹配库中各对象使用第二提取模型提取的第三特征,分别通过第二特征转换模型转换到第一提取模型的特征空间,得到各对象在特征空间中的第四特征,将目标对象使用第一提取模型提取的特征与各对象在特征空间中的第四特征进行匹配,得到与目标对象使用第一提取模型提取的特征相匹配的目标特征,将目标特征所属的对象,确定为目标对象的匹配对象。这样,在经过第二提取模型提取的特征与经过第一提取模型提取的特征不能直接匹配时,可以将第二提取模型提取的特征转换到第一提取模型的特征空间,经过第一提取模型提取的特征就能与经过第二提取模型提取的特征进行匹配,而不需要重新使用第一提取模型提取匹配库中的特征,所以可以节约时长。
另外需要说明的是,上述第二特征转换模型在对某个对象的特征,进行特征换换时,计算量比较小,远低于使用第一提取模型重新提取该对象的特征。
另外,为了更方便理解本公开两个实施例,还提供了本公开两个实施例的思想,由于识别算法本身对特定的对象测试集具有相似的辨别能力,各特征所完成的任务目标也一致,因此,不同版本的提取模型的特征之间虽然不具备直接的线性相关性,但是可以假设存在一个非线性的映射函数,能够将特征从高版本提取模型的特征空间映射到低版本提取模型的特征空间。
由于神经网络是一种优秀的非线性映射器,所以上述第一特征转换模型和第二特征转换模型可以是一种神经网络模型。第一特征转换模型和第二特征转换模型可以是多层的全连接神经网络,结构可以包括归一化层(Norm)、全连接层(Fully connected layer)、批归一化层(batch normalization layer)、双曲正切函数处理层。归一化层可以用于使向量的模长为1,批归一化层的作用是在梯度下降时,收敛更好,训练出的第一特征转换模型使性能更好。双曲正切函数是一个非线性函数,可以用于拟合非线性的映射函数。
例如,第一特征转换模型包括4层全连接神经网络,每层全连接神经网络包括一个归一化层、一个全连接层、一个批归一化层和一个双曲正切函数层,在第一个全连接层的输入为256个通道数,输出为512个通道数,在第二个全连接层的输入为512个通道数,输出为768个通道数,在第三个全连接层的输入为768个通道数,输出为1024个通道数,在第四个全连接层的输入为1024和通道数,输出为256个通道数。
还需要说明的是,在上述两个实施例中,训练特征转换模型时,每次调整参数的参数值后,会在多个样本对象中,重新选择一批样本对象进行训练。
还需要说明的是,上述两个实施例中,第一提取模型和第二提取模型,是任意的可以用于提取特征的模型,只要第一提取模型的版本高于第二提取模型的版本即可,本公开实施例不做限定。
基于相同的技术构思,本公开实施例还提供了一种进行对象识别的装置,如图6所示,该装置包括:
转换模块610,用于将目标对象使用第一提取模型提取的第一特征,通过第一特征转换模型转换到第二提取模型的特征空间,得到所述目标对象在所述特征空间中的第二特征;
匹配模块620,用于:
将所述目标对象的第二特征,与匹配库中的对象的特征进行匹配,得到与所述目标对象的第二特征相匹配的目标特征;
将所述目标特征所属的对象,确定为所述目标对象的匹配对象。
可选的,如图7所示,所述装置还包括训练模块630,用于:
获取多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征;
将所述多个样本对象中目标数目个样本对象经过所述第一提取模型提取的特征,输入到第一初始特征转换模型,得到第一输出结果;
确定所述第一输出结果与所述目标数目个样本对象经过所述第二提取模型提取的特征的第一损失值;
根据所述第一损失值、所述第一初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型。
可选的,所述训练模块630,还用于:
将所述第一输出结果输入到第二初始特征转换模型,得到第二输出结果;
确定所述第二输出结果与所述目标数目个样本对象经过所述第一提取模型提取的特征的第二损失值;
所述训练模块630,用于:
根据所述第一损失值、所述第二损失值、所述第一初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型。
可选的,所述训练模块630,还用于:
将所述多个样本对象中目标数目个样本对象经过第二提取模型提取的特征,输入到所述第二初始特征转换模型,得到第三输出结果;
确定所述第三输出结果与所述目标数目个样本对象经过第一提取模型提取的特征的第三损失值;
将所述第三输出结果输入到所述第一初始特征转换模型中,得到第四输出结果;
确定所述第四输出结果与所述目标数目个样本对象经过第二提取模型提取的特征的第四损失值;
所述训练模块630,用于:
根据所述第一损失值、所述第二损失值、所述第三损失值、所述第四损失值、所述第一初始特征转换模型、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型。
可选的,所述第一损失值、所述第二损失值、所述第三损失值和所述第四损失值均为L1损失得到的损失值;或者,
所述第一损失值、所述第二损失值、所述第三损失值和所述第四损失值均为L2损失得到的损失值;或者,
所述第一损失值和所述第三损失值为L1损失得到的损失值,所述第二损失值和所述第四损失值为L2损失得到的损失值。
本公开实施例中,将目标对象使用第一提取模型提取的第一特征,通过第一特征转换模型转换到第二提取模型的特征空间,得到目标对象在特征空间中的第二特征,将目标对象的第二特征,与匹配库中的对象的特征进行匹配,得到与目标对象的第二特征相匹配的目标特征,将目标特征所属的对象,确定为目标对象的匹配对象。这样,在经过第一提取模型提取的特征与经过第二提取模型提取的特征不能直接匹配时,可以将第一提取模型提取的特征转换到第二提取模型的特征空间,经过第一提取模型提取的特征就能与经过第二提取模型提取的特征进行匹配,由于特征转换的处理量远远小于重新提取匹配库中的特征,所以可以节约时长。
需要说明的是:上述实施例提供的进行对象识别的装置在进行对象识别时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的进行对象识别的装置与进行对象识别的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
基于相同的技术构思,本公开实施例还提供了一种进行对象识别的装置,如图8所示,该装置包括:
转换模块810,用于将匹配库中各对象使用第二提取模型提取的第三特征,分别通过第二特征转换模型转换到第一提取模型的特征空间,得到所述各对象在所述特征空间中的第四特征;
匹配模块820,用于:
将目标对象使用所述第一提取模型提取的特征与所述各对象在所述特征空间中的第四特征进行匹配,得到与所述目标对象使用所述第一提取模型提取的特征相匹配的目标特征;
将所述目标特征所属的对象,确定为所述目标对象的匹配对象。
可选的,如图9所示,所述装置还包括训练模块830,用于:
获取多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征;
将所述多个样本对象中目标数目个样本对象经过第二提取模型提取的特征,输入到第二初始特征转换模型,得到第五输出结果;
确定所述第五输出结果与所述目标数目个样本对象经过第一提取模型提取的特征的第五损失值;
根据所述第五损失值、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第二特征转换模型。
可选的,所述训练模块830,还用于:
将所述第五输出结果输入到第一初始特征转换模型,得到第六输出结果;
确定所述第六输出结果与所述目标数目个样本对象经过第二提取模型提取的特征的第六损失值;
所述训练模块830,用于:
根据所述第五损失值、所述第六损失值、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第二特征转换模型。
可选的,所述训练模块830,还用于:
将所述多个样本对象中目标数目个样本对象经过第一提取模型提取的特征,输入到所述第一初始特征转换模型,得到第七输出结果;
确定所述第七输出结果与所述目标数目个样本对象经过第二提取模型提取的特征的第七损失值;
将所述第七输出结果输入到所述第二初始特征转换模型中,得到第八输出结果;
确定所述第八输出结果与所述目标数目个样本对象经过第一提取模型提取的特征的第八损失值;
所述训练模块830,用于:
根据所述第五损失值、所述第六损失值、第七损失值、第八损失值、所述第一初始特征转换模型、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第二特征转换模型。
可选的,所述第五损失值、所述第六损失值、所述第七损失值和所述第八损失值均为L1损失得到的损失值;或者,
所述第五损失值、所述第六损失值、所述第七损失值和所述第八损失值均为L2损失得到的损失值;或者,
所述第五损失值和所述第七损失值为L1损失得到的损失值,所述第六损失值和所述第八损失值为L2损失得到的损失值。
本公开实施例中,获取第二特征转换模型,将匹配库中各对象使用第二提取模型提取的第三特征,分别通过第二特征转换模型转换到第一提取模型的特征空间,得到各对象在特征空间中的第四特征,将目标对象使用第一提取模型提取的特征与各对象在特征空间中的第四特征进行匹配,得到与目标对象使用第一提取模型提取的特征相匹配的目标特征,将目标特征所属的对象,确定为目标对象的匹配对象。这样,在经过第二提取模型提取的特征与经过第一提取模型提取的特征不能直接匹配时,可以将第二提取模型提取的特征转换到第一提取模型的特征空间,经过第一提取模型提取的特征就能与经过第二提取模型提取的特征进行匹配,而不需要重新使用第一提取模型提取匹配库中的特征,所以可以节约时长。
需要说明的是:上述实施例提供的进行对象识别的装置在进行对象识别时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的进行对象识别的装置与进行对象识别的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图10是本发明实施例提供的一种服务器的结构示意图,该服务器1000可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器1001和一个或一个以上的存储器1002,其中,所述存储器1002中存储有至少一条指令,所述至少一条指令由所述处理器1001加载并执行以实现上述进行对象识别的方法中的各个步骤。
本公开实施例中,还提供了一种计算机可读存储介质,该存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现上述进行对象识别的方法。
本公开实施例中,还提供了一种服务器,该服务器包括处理器和存储器,其中,所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存放的程序,实现上述进行对象识别的方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本公开的较佳实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (12)
1.一种进行对象识别的方法,其特征在于,所述方法包括:
将目标对象使用第一提取模型提取的第一特征,通过第一特征转换模型转换到第二提取模型的特征空间,得到所述目标对象在所述特征空间中的第二特征;
将所述目标对象的第二特征,与匹配库中的对象的特征进行匹配,得到与所述目标对象的第二特征相匹配的目标特征;
将所述目标特征所属的对象,确定为所述目标对象的匹配对象。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征;
将所述多个样本对象中目标数目个样本对象经过所述第一提取模型提取的特征,输入到第一初始特征转换模型,得到第一输出结果;
确定所述第一输出结果与所述目标数目个样本对象经过所述第二提取模型提取的特征的第一损失值;
根据所述第一损失值、所述第一初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
将所述第一输出结果输入到第二初始特征转换模型,得到第二输出结果;
确定所述第二输出结果与所述目标数目个样本对象经过所述第一提取模型提取的特征的第二损失值;
所述根据所述第一损失值、所述第一初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型,包括:
根据所述第一损失值、所述第二损失值、所述第一初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
将所述多个样本对象中目标数目个样本对象经过第二提取模型提取的特征,输入到所述第二初始特征转换模型,得到第三输出结果;
确定所述第三输出结果与所述目标数目个样本对象经过第一提取模型提取的特征的第三损失值;
将所述第三输出结果输入到所述第一初始特征转换模型中,得到第四输出结果;
确定所述第四输出结果与所述目标数目个样本对象经过第二提取模型提取的特征的第四损失值;
所述根据所述第一损失值、所述第二损失值、所述第一初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型,包括:
根据所述第一损失值、所述第二损失值、所述第三损失值、所述第四损失值、所述第一初始特征转换模型、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第一特征转换模型。
5.根据权利要求4所述的方法,其特征在于,所述第一损失值、所述第二损失值、所述第三损失值和所述第四损失值均为L1损失得到的损失值;或者,
所述第一损失值、所述第二损失值、所述第三损失值和所述第四损失值均为L2损失得到的损失值;或者,
所述第一损失值和所述第三损失值为L1损失得到的损失值,所述第二损失值和所述第四损失值为L2损失得到的损失值。
6.一种进行对象识别的方法,其特征在于,所述方法包括:
将匹配库中各对象使用第二提取模型提取的第三特征,分别通过第二特征转换模型转换到第一提取模型的特征空间,得到所述各对象在所述特征空间中的第四特征;
将目标对象使用所述第一提取模型提取的特征与所述各对象在所述特征空间中的第四特征进行匹配,得到与所述目标对象使用所述第一提取模型提取的特征相匹配的目标特征;
将所述目标特征所属的对象,确定为所述目标对象的匹配对象。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
获取多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征;
将所述多个样本对象中目标数目个样本对象经过第二提取模型提取的特征,输入到第二初始特征转换模型,得到第五输出结果;
确定所述第五输出结果与所述目标数目个样本对象经过第一提取模型提取的特征的第五损失值;
根据所述第五损失值、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第二特征转换模型。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
将所述第五输出结果输入到第一初始特征转换模型,得到第六输出结果;
确定所述第六输出结果与所述目标数目个样本对象经过第二提取模型提取的特征的第六损失值;
所述根据所述第五损失值、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第二特征转换模型,包括:
根据所述第五损失值、所述第六损失值、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第二特征转换模型。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
将所述多个样本对象中目标数目个样本对象经过第一提取模型提取的特征,输入到所述第一初始特征转换模型,得到第七输出结果;
确定所述第七输出结果与所述目标数目个样本对象经过第二提取模型提取的特征的第七损失值;
将所述第七输出结果输入到所述第二初始特征转换模型中,得到第八输出结果;
确定所述第八输出结果与所述目标数目个样本对象经过第一提取模型提取的特征的第八损失值;
所述根据所述第五损失值、所述第六损失值、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第二特征转换模型,包括:
根据所述第五损失值、所述第六损失值、第七损失值、第八损失值、所述第一初始特征转换模型、所述第二初始特征转换模型、所述多个样本对象经过所述第一提取模型提取的特征和经过所述第二提取模型提取的特征,确定所述第二特征转换模型。
10.根据权利要求9所述的方法,其特征在于,所述第五损失值、所述第六损失值、所述第七损失值和所述第八损失值均为L1损失得到的损失值;或者,
所述第五损失值、所述第六损失值、所述第七损失值和所述第八损失值均为L2损失得到的损失值;或者,
所述第五损失值和所述第七损失值为L1损失得到的损失值,所述第六损失值和所述第八损失值为L2损失得到的损失值。
11.一种进行对象识别的装置,其特征在于,所述装置包括:
转换模块,用于将目标对象使用第一提取模型提取的第一特征,通过第一特征转换模型转换到第二提取模型的特征空间,得到所述目标对象在所述特征空间中的第二特征;
匹配模块,用于:
将所述目标对象的第二特征,与匹配库中的对象的特征进行匹配,得到与所述目标对象的第二特征相匹配的目标特征;
将所述目标特征所属的对象,确定为所述目标对象的匹配对象。
12.一种进行对象识别的装置,其特征在于,所述装置包括:
转换模块,用于将匹配库中各对象使用第二提取模型提取的第三特征,分别通过第二特征转换模型转换到第一提取模型的特征空间,得到所述各对象在所述特征空间中的第四特征;
匹配模块,用于:
将目标对象使用所述第一提取模型提取的特征与所述各对象在所述特征空间中的第四特征进行匹配,得到与所述目标对象使用所述第一提取模型提取的特征相匹配的目标特征;
将所述目标特征所属的对象,确定为所述目标对象的匹配对象。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910696479.XA CN112308101B (zh) | 2019-07-30 | 2019-07-30 | 进行对象识别的方法和装置 |
EP20846719.1A EP4006775A4 (en) | 2019-07-30 | 2020-07-29 | METHOD AND DEVICE FOR OBJECT RECOGNITION |
PCT/CN2020/105500 WO2021018189A1 (zh) | 2019-07-30 | 2020-07-29 | 进行对象识别的方法和装置 |
US17/631,446 US20220277588A1 (en) | 2019-07-30 | 2020-07-29 | Methods and apparatuses for performing object recognition |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910696479.XA CN112308101B (zh) | 2019-07-30 | 2019-07-30 | 进行对象识别的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112308101A true CN112308101A (zh) | 2021-02-02 |
CN112308101B CN112308101B (zh) | 2023-08-22 |
Family
ID=74228391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910696479.XA Active CN112308101B (zh) | 2019-07-30 | 2019-07-30 | 进行对象识别的方法和装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220277588A1 (zh) |
EP (1) | EP4006775A4 (zh) |
CN (1) | CN112308101B (zh) |
WO (1) | WO2021018189A1 (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5031225A (en) * | 1987-12-09 | 1991-07-09 | Ricoh Company, Ltd. | Character recognition method for recognizing character in an arbitrary rotation position |
CN101165682A (zh) * | 2006-10-20 | 2008-04-23 | 北京北大方正电子有限公司 | 一种文档文件的处理方法及系统 |
CN107832058A (zh) * | 2017-10-31 | 2018-03-23 | 北京小米移动软件有限公司 | 数据处理方法及装置 |
CN108108357A (zh) * | 2018-01-12 | 2018-06-01 | 京东方科技集团股份有限公司 | 口音转换方法及装置、电子设备 |
CN108509539A (zh) * | 2018-03-16 | 2018-09-07 | 联想(北京)有限公司 | 信息处理方法电子设备 |
CN108595927A (zh) * | 2018-04-04 | 2018-09-28 | 北京市商汤科技开发有限公司 | 身份认证、解锁及支付方法、装置、存储介质、产品和设备 |
CN108765295A (zh) * | 2018-06-12 | 2018-11-06 | 腾讯科技(深圳)有限公司 | 图像处理方法、图像处理装置及存储介质 |
CN108806716A (zh) * | 2018-06-15 | 2018-11-13 | 想象科技(北京)有限公司 | 用于基于情感框架的计算机化匹配的方法与装置 |
US20190114545A1 (en) * | 2017-10-13 | 2019-04-18 | Electronics And Telecommunications Research Institute | Apparatus and method of constructing neural network translation model |
CN110009018A (zh) * | 2019-03-25 | 2019-07-12 | 腾讯科技(深圳)有限公司 | 一种图像生成方法、装置以及相关设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975861A (zh) * | 2016-05-27 | 2016-09-28 | 百度在线网络技术(北京)有限公司 | 应用检测方法和装置 |
US9870615B2 (en) * | 2017-07-19 | 2018-01-16 | Schwalb Consulting, LLC | Morphology identification in tissue samples based on comparison to named feature vectors |
-
2019
- 2019-07-30 CN CN201910696479.XA patent/CN112308101B/zh active Active
-
2020
- 2020-07-29 WO PCT/CN2020/105500 patent/WO2021018189A1/zh unknown
- 2020-07-29 EP EP20846719.1A patent/EP4006775A4/en active Pending
- 2020-07-29 US US17/631,446 patent/US20220277588A1/en active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5031225A (en) * | 1987-12-09 | 1991-07-09 | Ricoh Company, Ltd. | Character recognition method for recognizing character in an arbitrary rotation position |
CN101165682A (zh) * | 2006-10-20 | 2008-04-23 | 北京北大方正电子有限公司 | 一种文档文件的处理方法及系统 |
US20190114545A1 (en) * | 2017-10-13 | 2019-04-18 | Electronics And Telecommunications Research Institute | Apparatus and method of constructing neural network translation model |
CN107832058A (zh) * | 2017-10-31 | 2018-03-23 | 北京小米移动软件有限公司 | 数据处理方法及装置 |
CN108108357A (zh) * | 2018-01-12 | 2018-06-01 | 京东方科技集团股份有限公司 | 口音转换方法及装置、电子设备 |
CN108509539A (zh) * | 2018-03-16 | 2018-09-07 | 联想(北京)有限公司 | 信息处理方法电子设备 |
CN108595927A (zh) * | 2018-04-04 | 2018-09-28 | 北京市商汤科技开发有限公司 | 身份认证、解锁及支付方法、装置、存储介质、产品和设备 |
CN108765295A (zh) * | 2018-06-12 | 2018-11-06 | 腾讯科技(深圳)有限公司 | 图像处理方法、图像处理装置及存储介质 |
CN108806716A (zh) * | 2018-06-15 | 2018-11-13 | 想象科技(北京)有限公司 | 用于基于情感框架的计算机化匹配的方法与装置 |
CN110009018A (zh) * | 2019-03-25 | 2019-07-12 | 腾讯科技(深圳)有限公司 | 一种图像生成方法、装置以及相关设备 |
Non-Patent Citations (2)
Title |
---|
XUESONG ZHANG, ET AL.: "Online Feature Transformation Learning for Cross-Domain Object Category Recognition", 《IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARRNING SYSTEMS》, vol. 29, no. 7, XP011685824, DOI: 10.1109/TNNLS.2017.2705113 * |
沈惠玲;万永菁;: "一种基于预测谱偏移的自适应高斯混合模型在语音转换中的应用", 《华东理工大学学报(自然科学版)》, no. 4 * |
Also Published As
Publication number | Publication date |
---|---|
EP4006775A4 (en) | 2022-08-31 |
CN112308101B (zh) | 2023-08-22 |
US20220277588A1 (en) | 2022-09-01 |
EP4006775A1 (en) | 2022-06-01 |
WO2021018189A1 (zh) | 2021-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bishay et al. | Tarn: Temporal attentive relation network for few-shot and zero-shot action recognition | |
CN108694225B (zh) | 一种图像搜索方法、特征向量的生成方法、装置及电子设备 | |
CN111324774B (zh) | 一种视频去重方法和装置 | |
Wang et al. | Industrial cyber-physical systems-based cloud IoT edge for federated heterogeneous distillation | |
CN111476268A (zh) | 翻拍识别模型训练、图像识别方法、装置、设备及介质 | |
CN111832581B (zh) | 肺部特征识别方法、装置、计算机设备及存储介质 | |
CN112801054B (zh) | 人脸识别模型的处理方法、人脸识别方法及装置 | |
CN113298197B (zh) | 数据聚类方法、装置、设备及可读存储介质 | |
CN113191461B (zh) | 一种图片识别方法、装置、设备及可读存储介质 | |
JP2019153092A (ja) | 位置特定装置、位置特定方法及びコンピュータプログラム | |
KR20200083119A (ko) | 사용자 인증 장치 및 방법 | |
CN114494809A (zh) | 特征提取模型优化方法、装置及电子设备 | |
CN114241585A (zh) | 一种跨年龄人脸识别模型训练方法、识别方法及装置 | |
CN112257689A (zh) | 人脸识别模型的训练和识别方法、存储介质及相关设备 | |
CN112308101B (zh) | 进行对象识别的方法和装置 | |
CN110633647A (zh) | 活体检测方法及装置 | |
CN115222047A (zh) | 一种模型训练方法、装置、设备及存储介质 | |
CN115146092A (zh) | 特征模型的获取方法、图像处理方法、装置及计算机设备 | |
CN115248914A (zh) | 一种计算机系统及其用户的身份识别方法 | |
CN109146058B (zh) | 具有变换不变能力且表达一致的卷积神经网络 | |
CN115082873A (zh) | 基于通路融合的图像识别方法、装置及存储介质 | |
CN112633369A (zh) | 图像匹配方法、装置、电子设备、计算机可读存储介质 | |
CN111598144A (zh) | 图像识别模型的训练方法和装置 | |
KR20200140571A (ko) | 데이터 인식 방법 및 장치 | |
CN117351246B (zh) | 一种误匹配对去除方法、系统及可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |