具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了减少用户身份误识别情况的发生,本说明书实施例提供一种用户身份确定方法及装置,该方法和装置可以应用于需要进行用户身份识别的监控系统中。例如,现如今的商圈,处处设有摄像头,商家非常希望利用商圈中的已有的摄像监控网络,当会员出现在商圈中的时候,能够立刻基于摄像头采集到的信息识别出自己的会员,以快速地查询出该会员的历史消费数据和消费习惯等,从而更好地为该会员提供服务。且为了便于说明,下文中以确定进入商圈中的用户身份为例,对本说明书实施例提供的用户身份确定方法及装置进行介绍。
下面结合附图1至图8对本说明书实施例提供的一种用户身份确定方法进行详细的说明。
如图1所示,本说明书实施例提供的一种用户身份确定方法,可以包括如下步骤:
在步骤102处,采集目标用户的目标多维特征信息,所述目标多维特征信息包括生物特征信息和/或非生物特征信息中的至少两种特征信息。
目标用户,可以是需要进行身份确定、识别或鉴定的用户。例如,进入某一商圈(例如某一商场)的顾客。
其中,目标多维特征信息包括生物特征信息和/或非生物特征信息中的至少两种特征信息,可以理解为是,目标多维生物特征信息包括生物特征信息中的至少两种特征信息;或者,目标多维生物特征信息包括非生物特征信息中的至少两种特征信息;或者,目标多维生物特征信息包括生物特征信息和非生物特征信息中的至少两种特征信息。
举例来说,生物特征信息可以包括:人脸特征信息、躯干特征信息、步态特征信息、服饰特征信息、年龄特征信息和性别特征信息,等等。可选地,为了更进一步地减少用户身份误识别情况的发生,其中,人脸特征信息可以包括多姿态下的人脸特征信息,例如,正面、45度侧面等姿态的人脸特征信息,在实际应用中可以通过多个摄像头采集得到多姿态下的人脸特征信息;同理,躯干特征信息也可以包括多姿态下躯干特征信息,正面、45度侧面等姿态的躯干特征信息;步态特征信息可以包括走、跑等状态下的步态特征信息。
非生物特征信息可以包括:用户ID信息、地理位置信息、时间信息和WiFi地址信息,等等。用户ID信息又可以包括能够唯一标识用户身份的信息,例如,用户手机号、用户证件号和用户手机MAC信息中的一种或多种。时间信息可以是需要确定目标用户的身份时的时间信息。
当目标多维特征信息包括目标用户的生物特征信息时,在步骤102处,可以通过图像采集装置采集得到,例如可以利用商圈中设置的摄像头采集获得目标用户的图像,然后对采集到的图像进行分析,从中得到目标用户的人脸特征信息、躯干特征信息、步态特征信息、服饰特征信息、年龄特征信息和性别特征信息等生物特征信息。
当目标多维特征信息包括目标用户的非生物特征信息时,在步骤102处,可以通过其他方式获得目标用户的ID信息和地理位置信息,等等。例如,可以通过商圈中的WiFi探测得到目标用户的手机MAC信息,并将目标用户的手机MAC信息作为目标用户的ID信息;可以通过商圈本身的位置信息确定目标用户的位置信息。
在步骤104处,将所述目标多维特征信息与多个指定用户的多维特征信息分别进行比对,获得比对结果。
指定用户,可以是预先存储的身份已知的用户,例如,某一商圈的用户身份监控系统中预先存储的会员。
可以理解,通过将采集到的目标用户的目标多维特征信息,与已知身份的多个指定用户的多维特征信息进行比对,可以分别确定出目标用户与多个指定用户的相似值,并将确定出的相似值作为比对结果,以在步骤106处确定目标用户的身份。
在一个例子中,可以将多维特征信息中各特征信息对应的相似值的加权和作为目标用户与指定用户的相似值。例如,假设是将目标用户的A、B、C、D四个特征信息,分别与指定用户的A、B、C、D四个特征信息比对,且可以对应得到a、b、c、d四个相似值,则可以将a、b、c、d四个相似值的加权和作为目标用户与指定用户的相似值。其中,不同特征信息对应的权重可以根据该特征信息的重要程度来确定。
在实际应用中,可以预先建立一个存储有指定用户的用户ID信息与该指定用户的多维特征信息的对应关系的第一数据库,这样在比对时,可以将目标用户的目标多维特征信息与预先建立的第一数据库中的指定用户的多维特征信息进行比对,得到比对结果。
下面结合图2至图4对构建上述第一数据库的过程进行简要地说明。
在一个例子中,如图2所示,假设指定用户的多维特征信息中包括生物特征信息,其中,生物特征信息具体包括:人脸(face)特征信息、躯干(body)特征信息、步态(gait)特征信息、服饰(cloth)特征信息、年龄(age)特征信息和性别(gender)特征信息。继续参考图3可知,其中,人脸特征信息可以包括不同表情、不同姿态下的人脸特征信息。参考图4可知,步态特征信息可以包括走、跑等状态下的步态特征信息。
具体如图2所示,对指定用户1(对应的用户ID信息表示为ID1),可以从摄像头采集获得的监控视频中获取人脸1、人脸2、躯干1、躯干2、步态1、步态2、年龄和性别等生物特征信息,并保存至上述第一数据库中。同样的,对指定用户2(对应的用户ID信息表示为ID2),可以从摄像头采集获得的监控视频中获取人脸1、人脸2、躯干1、躯干2、步态1、步态2、年龄和性别等生物特征信息,并保存至上述第一数据库中。
此外,如图2所示,由于用户的生物特征信息会随着时间的推移或者季节的变化而变化,因此,可以记录保存指定用户1、指定用户2在不同时间(图2中的时间1、时间2)的上述生物特征信息。以及,可选地,第一数据库中还可以记录保存指定用户的空间维度特征,具体体现在由不同的摄像头从不同的角度拍摄得到指定用户的人脸、躯干、步态等特征信息。
再有,如图2所示,还可以考虑不同用户之间的关系,并将这种关系也保存至上述第一数据库中。
在另一个例子中,还可以将指定用户的非生物特征信息与指定用户的ID信息对应保存至上述第一数据库中。
在步骤106处,基于所述比对结果,确定所述目标用户的身份。
沿用步骤104中所举的例子,如果比对结果为目标用户与多个指定用户的相似值,则在步骤106中,可以将多个指定用户中与目标用户的相似值最大且大于预设阈值的指定用户的身份,确定为目标用户的身份;相应的,如果说多个指定用户中不存在与目标用户的相似程度大于预设阈值的指定用户,则可以将目标用户确定为是一个新用户或非会员用户。其中,预设阈值可以人为设定,例如预设阈值可以等于80%。
本说明书实施例提供的一种用户身份确定方法,由于是基于目标用户的多维特征信息确定目标用户的身份,而不是采用单一的人脸或声音等特征信息确定用户的身份,因此可以减少用户身份被误识别的情况的发生,提高了用户身份确定结果的可靠性。
由于一般情况下,需要与目标用户进行比对的多个指定用户的数量较为庞大(也即上文中述及的第一数据库中存储的指定用户的数量较为庞大),当将目标用户的目标多维特征信息直接与多个指定用户的多维特征信息分别进行比对时,会导致比对数据量大,进而导致比对效率较为低下,相应的导致确定目标用户身份的效率比较低下。
为了提高确定目标用户身份的效率,可选地,在另一个实施例中,如图5所示,上述步骤104可以包括如下子步骤:
子步骤502、基于所述目标多维特征信息,确定所述目标用户的多个索引特征。
索引(index)特征,可以理解为是能够唯一标识原始特征信息(例如步骤102中所获取的特征信息),且数据量小于原始特征信息的特征。
上述多个索引特征可以包括:针对同一类型的特征信息的单一索引特征,针对同一时刻出现的至少两种类型的特征信息的复合索引特征,或针对同一时刻出现的不同用户的特征信息的复合索引特征。
其中,单一索引特征,可以是由一种特征信息确定出的索引特征。复合索引特征,可以是由两种或两种以上的特征信息确定出的索引特征。
其中,针对同一类型的特征信息的单一索引特征,例如可以是:针对地理位置信息的地理位置索引特征,或者,针对某一角度的人脸特征信息的人脸索引特征,等等。其中,针对同一时刻出现的至少两种类型的特征信息的复合索引特征,例如可以是:由具有明显地躯干特征和明显的服饰特征构成的复合索引特征。其中,针对同一时刻出现的不同用户的特征信息的复合索引特征,例如可以是:同时出现在某一商场中购物的夫妻脸构成的复合索引特征。
下面通过举例对确定目标用户的多个索引特征的过程进行说明。
在第一个例子中,假设目标用户的目标多维信息中包含目标用户的地理位置信息,则上述子步骤502可以包括:基于所述目标用户的地理位置信息,确定所述目标用户的一级地理位置索引特征;或者,基于所述目标用户的地理位置信息,确定所述目标用户的一级地理位置索引特征和二级地理位置索引特征;或者,基于所述目标用户的地理位置信息,确定所述目标用户的一级地理位置索引特征、二级地理位置索引特征和三级地理位置索引特征。其中,所述三级地理位置索引特征属于所述二级地理位置索引的子索引,所述二级地理位置索引属于所述一级地理位置索引的子索引。
例如,可以将商场、大厦、写字楼、小区等常见的固定人流量区域确定为一级地理位置索引特征;将商场的楼层或店铺、将大厦的楼层或房间、小区的单元或楼层确定为二级地理位置索引特征;将将商场中的店铺中的摄像头所在的位置确定为三级地理位置索引特征。
在第二个例子中,假设所述目标多维特征信息包括所述目标用户的生物特征信息,例如,人脸特征信息、躯干特征信息和服饰特征信息等等,则上述子步骤502可以包括:对所述目标用户的生物特征信息进行主成分分析(Principal Component Analysis,PCA),得到所述生物特征信息的降维特征;对所述降维特征进行分桶,得到表征所述生物特征信息的多个桶;将所述多个桶的ID确定为所述目标用户的多个索引特征。例如,得到步态桶索引特征、服饰桶索引特征、性别桶索引特征、人脸桶索引特征、年龄桶索引特征和躯干桶索引特征,等等。其中,桶ID可以是1、2、3、4这样的编号。
此外,假设所述目标多维特征信息包括所述目标用户的ID信息和时间信息,则基于子步骤502还可以确定出时间索引特征(可称为时间戳)和ID索引特征。以及基于目标多维特征信息,确定出的关系人脸符复合索引特征、人脸与躯干复合索引特征,等等。
子步骤504、将所述多个索引特征与所述多个指定用户的多个索引特征分别进行比对,从所述多个指定用户中确定出多个第一用户。
同图1所示的实施例,在实际应用中,也可以预先建立一个存储有指定用户的用户ID信息与该指定用户的多个索引特征的对应关系的第二数据库,这样在比对时,可以将目标用户的多个索引特征与第二数据库中指定用户的多个索引特征进行比对,得到多个第一用户。其中,确定指定用户的多个索引特征的方式与上文中确定目标用户的多个索引特征的方式类似,此处不再赘述。
例如,最终确定出的第二数据库中保存的索引特征可以包括:步态桶索引特征、服饰桶索引特征、性别桶索引特征、人脸桶索引特征、年龄桶索引特征、躯干桶索引特征、时间索引特征(可称为时间戳)、ID索引特征、关系人脸符复合索引特征,以及人脸与躯干复合索引特征,等等。
需要说明的是,在本说明书提供的实施例中,第一数据库和第二数据库可以是同一个数据库,也可以是不同的数据库。
作为一个例子,在子步骤504中,可以将目标用户的多个索引特征与多个指定用户的索引特征分别进行比对,从所述多个指定用户中确定出多个索引特征中的一个或多个与目标用户的相应索引特征匹配的用户,作为多个第一用户。在此处,索引特征匹配,可以理解为索引特征相同或相似。例如,假设目标用户的多个索引特征包括:地理位置索引特征和人脸索引特征,则可以从多个指定用户中查询出地理位置索引特征和人脸索引特征,与目标用户的地理位置索引特征和人脸索引特征均相同的多个用户作为多个第一用户。
作为另一个例子,在子步骤504中,可以先对目标用户的多个索引特征按一定的规则排序,例如,按照随机的方式排序,或者按照识别用户身份的准确程度排序,等等;然后,从所述多个指定用户中确定出与排序在第一位的索引特征匹配的多个用户,再从这多个用户中确定出与排序在第二位的索引特征匹配的多个用户,以此类推,依次从依据排序在前一位的索引特征匹配获得的确定结果中,进一步确定出与排序在后一位的索引特征匹配的多个用户,最后将依据排序在最后一位的索引特征匹配的多个用户作为多个第一用户。下面结合图6和图7对依据该例子中的方式确定多个第一用户的过程进行说明。
如图6所示,首先采集目标用户的多维特征信息601:人脸1、人脸2和人脸3,具体可以在需要确定目标用户身份的时刻,通过多个摄像头从不同的角度采集目标用户的“人脸1、人脸2和人脸3”三个特征信息;其次,基于采集到的目标用户的多维特征信息,确定目标用户的多个索引特征;然后,将目标用户的多个索引特征与第二数据库602中存储的多个指定用户的相应索引特征(例如,复合索引特征——关系人脸特征、单一索引特征——人脸特征)进行比对,确定出x个第一用户;最后,利用下述子步骤506中的方式,将“人脸1、人脸2和人脸3”三个特征信息作为目标用户的特定特征信息,与“x个第一用户的特定特征信息”603进行比对,确定目标用户与x个第一用户的相似值。
如图7所示,首先采集目标用户的多维特征信息601:人脸1、人脸2和人脸3,具体可以在需要确定目标用户身份的时刻,通过多个摄像头从不同的角度采集目标用户的“人脸1、人脸2和人脸3”三个特征信息;其次,基于采集到的目标用户的多维特征信息,确定目标用户的多个索引特征;然后,将目标用户的多个索引特征与第二数据库602中存储的多个指定用户的相应索引特征(例如,复合索引特征——关系人脸特征,以及单一索引特征——人脸特征和WiFi地址604)进行比对,确定出x个第一用户;最后,利用下述子步骤506中的方式,将“人脸1、人脸2和人脸3”三个特征信息作为目标用户的特定特征信息,与“x个第一用户的特定特征信息”603进行比对,确定目标用户与x个第一用户的相似值。
子步骤506、将所述目标多维特征信息中的特定特征信息,与所述多个第一用户的特定特征信息分别进行比对,确定所述目标用户与所述多个第一用户的相似值。
子步骤506是在子步骤504确定出的多个第一用户的基础上,进一步依据特定特征信息的比对,分别确定出目标用户与多个第一用户的相似值。
特定特征信息,可以是目标用户的生物特征信息,例如,人脸特征信息、躯干特征信息、服饰特征信息等能。
子步骤508、将所述目标用户与所述多个第一用户的相似值,确定为所述比对结果。
在此基础上,上述步骤106可以包括:将所述比对结果中所述相似值最大且大于预设阈值的用户身份,确定为所述目标用户的身份。也即将多个第一用户中,与目标用户的相似值最大且大于预设阈值的用户的身份,确定为目标用户的身份。
可以理解,在图5所示的实施例中,由于是先依据数据量较少的索引特征的比对,从多个指定用户中确定出与目标用户可能相似的多个候选用户(也即多个第一用户),缩小比对范围,然后在该小范围内,依据特定特征信息的比对确定目标用户的身份,因此可以提高确定目标用户身份的效率。
为了提高确定目标用户身份的效率,可选地,在又一个实施例中,如图8所示,上述步骤104可以包括如下子步骤:
子步骤802、基于所述目标多维特征信息,确定所述目标用户的多个索引特征。
子步骤804、将所述多个索引特征与所述多个指定用户的多个索引特征分别进行比对,从所述多个指定用户中确定出多个第一用户。
上述子步骤802和子步骤804的具体实施方式,与图5所示的实施例中的子步骤502和子步骤504对应相同,此处不再重复描述。
子步骤806、基于所述多个第一用户的历史行为数据,从所述多个第一用户中选取多个第二用户。
在一个例子中,可以先基于所述多个第一用户的历史行为数据,对所述多个第一用户进行排序,然后从所述多个第一用户中,选取排名符合预设条件的多个第二用户。
当以确定进入商圈中的用户身份为例时,上述历史行为数据可以是历史消费次数、历史进场次数、历史消费金额等;相应的,在对多个第一用户排序时,可以将历史消费次数多、历史进场次数多或历史消费金额大的第一用户排在前面,将历史消费次数少、历史进场次数少或历史消费金额小的第一用户排在后面。
在另一个例子中,可以基于预设的排序模型对多个第一用户进行排序,然后从所述多个第一用户中,选取排名符合预设条件的多个第二用户。其中,预设的排序模型可以是现有技术中的排序模型。
上述从所述多个第一用户中,选取排名符合预设条件的多个第二用户的步骤,可以包括:从多个第一用户中选取排名在前的几个用户作为多个第二用户。
子步骤808、将所述目标多维特征信息中的特定特征信息,与所述多个第二用户的特定特征信息分别进行比对,确定所述目标用户与所述多个第二用户的相似值。
子步骤810、将所述目标用户与所述多个第二用户的相似值,确定为所述比对结果。
上述子步骤808和子步骤810的具体实施方式,与图5所示的实施例中的子步骤506和子步骤508对应相似,此处不再重复描述。
在图8所示的实施例的基础上,上述步骤106可以包括:将所述比对结果中所述相似值最大且大于预设阈值的用户身份,确定为所述目标用户的身份。也即将多个第二用户中,与目标用户的相似值最大且大于预设阈值的用户的身份,确定为目标用户的身份。
图8所示的实施例与图5所示的实施例相比,除了先依据数据量较少的索引特征的比对,从多个指定用户中确定出与目标用户可能相似的多个候选用户(也即多个第一用户),缩小比对范围,还从多个第一用户进一步地选出多个第二用户,进一步地缩小比对范围;然后,在该进一步缩小的范围内,依据特定特征信息的比对确定目标用户的身份,因此可以进一步提高确定目标用户身份的效率。
以上是对本说明书提供一种用户身份确定方法的说明,下面对本说明书提供的电子设备进行介绍。
图9是本说明书的一个实施例提供的电子设备的结构示意图。请参考图9,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成用户身份确定装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
采集目标用户的目标多维特征信息,所述目标多维特征信息包括生物特征信息和/或非生物特征信息中的至少两种特征信息;
将所述目标多维特征信息与多个指定用户的多维特征信息分别进行比对,获得比对结果;
基于所述比对结果,确定所述目标用户的身份。
上述如本说明书图1所示实施例揭示的用户身份确定方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书一个或多个实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书一个或多个实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1的用户身份确定方法,本说明书在此不再赘述。
当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下操作:
采集目标用户的目标多维特征信息,所述目标多维特征信息包括生物特征信息和/或非生物特征信息中的至少两种特征信息;
将所述目标多维特征信息与多个指定用户的多维特征信息分别进行比对,获得比对结果;
基于所述比对结果,确定所述目标用户的身份。
下面对本说明书提供的一种用户身份确定装置进行说明。
图10是本说明书提供的用户身份确定装置1000的结构示意图。请参考图10,在一种软件实施方式中,用户身份确定装置1000可包括:采集模块1001、比对模块1002和确定模块1003。
采集模块1001,用于采集目标用户的目标多维特征信息,所述目标多维特征信息包括生物特征信息和/或非生物特征信息中的至少两种特征信息。
其中,所述生物特征信息包括:人脸特征信息、躯干特征信息、步态特征信息、服饰特征信息、年龄特征信息和性别特征信息;
其中,所述非生物特征信息包括:用户ID信息、地理位置信息和时间信息,所述用户ID信息包括用户手机号、用户证件号和用户手机MAC信息中的一种或多种。
比对模块1002,用于将所述目标多维特征信息与多个指定用户的多维特征信息分别进行比对,获得比对结果。
作为一个例子,比对模块1002具体可以用于,将所述目标多维特征信息与多个指定用户的多维特征信息分别进行比对,获得所述目标用户与所述多个指定用户的相似值;将所述目标用户与所述多个指定用户的相似值,确定为所述比对结果。
确定模块1003,用于基于所述比对结果,确定所述目标用户的身份。
本说明书实施例提供的一种用户身份确定装置,由于是基于目标用户的多维特征信息确定目标用户的身份,而不是采用单一的人脸或声音等特征信息确定用户的身份,因此可以减少用户身份被误识别的情况的发生,提高了用户身份确定结果的可靠性。
可选地,在另一个实施例中,如图11所示,上述比对模块1002具体可包括:第一索引确定子模块1101、第一用户确定子模块1102、第一相似值确定子模块1103和第一结果确定子模块1104。
第一索引确定子模块1101,用于基于所述目标多维特征信息,确定所述目标用户的多个索引特征。
其中,所述多个索引特征包括:针对同一类型的特征信息的单一索引特征,针对同一时刻出现的至少两种类型的特征信息的复合索引特征,或针对同一时刻出现的不同用户的特征信息的复合索引特征。
作为一个例子,如果所述目标多维特征信息包括所述目标用户的地理位置信息,则所述基于所述目标多维特征信息,确定所述目标用户的多个索引特征,包括:基于所述目标用户的地理位置信息,确定所述目标用户的一级地理位置索引特征;或者,基于所述目标用户的地理位置信息,确定所述目标用户的一级地理位置索引特征和二级地理位置索引特征;或者,基于所述目标用户的地理位置信息,确定所述目标用户的一级地理位置索引特征、二级地理位置索引特征和三级地理位置索引特征;其中,所述三级地理位置索引特征属于所述二级地理位置索引的子索引,所述二级地理位置索引属于所述一级地理位置索引的子索引。
作为另一个例子,如果所述目标多维特征信息包括所述目标用户的生物特征信息,则所述基于所述目标多维特征信息,确定所述目标用户的多个索引特征,包括:对所述目标用户的生物特征信息进行主成分分析PCA,得到所述生物特征信息的降维特征;对所述降维特征进行分桶,得到表征所述生物特征信息的多个桶;将所述多个桶的ID确定为所述目标用户的多个索引特征。
第一用户确定子模块1102,用于将所述多个索引特征与所述多个指定用户的多个索引特征分别进行比对,从所述多个指定用户中确定出多个第一用户。
作为一个例子,在第一用户确定子模块1102中,可以将目标用户的多个索引特征与多个指定用户的索引特征分别进行比对,从所述多个指定用户中确定出多个索引特征中的一个或多个与目标用户的相应索引特征匹配的用户,作为多个第一用户。在此处,索引特征匹配,可以理解为索引特征相同或相似。
作为另一个例子,在第一用户确定子模块1102中,可以先对目标用户的多个索引特征按一定的规则排序,例如,按照随机的方式排序,或者按照识别用户身份的准确程度排序,等等;然后,从所述多个指定用户中确定出与排序在第一位的索引特征匹配的多个用户,再从这多个用户中确定出与排序在第二位的索引特征匹配的多个用户,以此类推,依次从依据排序在前一位的索引特征匹配获得的确定结果中,进一步确定出与排序在后一位的索引特征匹配的多个用户,最后将依据排序在最后一位的索引特征匹配的多个用户作为多个第一用户。
第一相似值确定子模块1103,用于将所述目标多维特征信息中的特定特征信息,与所述多个第一用户的特定特征信息分别进行比对,确定所述目标用户与所述多个第一用户的相似值。
作为一个例子,第一相似值确定子模块1103是在第一用户确定子模块1102确定出的多个第一用户的基础上,进一步依据特定特征信息的比对,分别确定出目标用户与多个第一用户的相似值。
特定特征信息,可以是目标用户的生物特征信息,例如,人脸特征信息、躯干特征信息、服饰特征信息等能。
第一结果确定子模块1104,用于将所述目标用户与所述多个第一用户的相似值,确定为所述比对结果。
在此基础上,上述确定模块1003具体可以用于,将所述比对结果中所述相似值最大且大于预设阈值的用户身份,确定为所述目标用户的身份。也即将多个第一用户中,与目标用户的相似值最大且大于预设阈值的用户的身份,确定为目标用户的身份。
可以理解,在图11所示的实施例中,由于是先依据数据量较少的索引特征的比对,从多个指定用户中确定出与目标用户可能相似的多个候选用户(也即多个第一用户),缩小比对范围,然后在该小范围内,依据特定特征信息的比对确定目标用户的身份,因此可以提高确定目标用户身份的效率。
可选地,在又一个实施例中,如图12所示,上述比对模块1002具体可包括:第二索引确定子模块1201、第二用户确定子模块1202、第三用户确定子模块1203、第二相似值确定子模块1204和第二结果确定子模块1205。
第二索引确定子模块1201,用于基于所述目标多维特征信息,确定所述目标用户的多个索引特征。
第二用户确定子模块1202,用于将所述多个索引特征与所述多个指定用户的多个索引特征分别进行比对,从所述多个指定用户中确定出多个第一用户。
上述第二索引确定子模块1201和第二用户确定子模块1202的具体实施方式,与图11所示的实施例中的第一索引确定子模块1101和第一用户确定子模块1102对应相同,此处不再重复描述。
第三用户确定子模块1203,用于基于所述多个第一用户的历史行为数据,从所述多个第一用户中选取多个第二用户。
在一个例子中,第三用户确定子模块1203可以先基于所述多个第一用户的历史行为数据,对所述多个第一用户进行排序,然后从所述多个第一用户中,选取排名符合预设条件的多个第二用户。
在另一个例子中,第三用户确定子模块1203可以基于预设的排序模型对多个第一用户进行排序,然后从所述多个第一用户中,选取排名符合预设条件的多个第二用户。其中,预设的排序模型可以是现有技术中的排序模型。
在第三用户确定子模块1203中,从所述多个第一用户中选取排名符合预设条件的多个第二用户,可以包括:从多个第一用户中选取排名在前的几个用户作为多个第二用户。
第二相似值确定子模块1204,用于将所述目标多维特征信息中的特定特征信息,与所述多个第二用户的特定特征信息分别进行比对,确定所述目标用户与所述多个第二用户的相似值。
第二结果确定子模块1205,用于将所述目标用户与所述多个第二用户的相似值,确定为所述比对结果。
上述第二相似值确定子模块1204和第二结果确定子模块1205的具体实施方式,与图11所示的实施例中的第一相似值确定子模块1103和第一结果确定子模块1104对应相似,此处不再重复描述。
在图12所示的实施例的基础上,上述确定模块1003具体可以用于,将所述比对结果中所述相似值最大且大于预设阈值的用户身份,确定为所述目标用户的身份。也即将多个第二用户中,与目标用户的相似值最大且大于预设阈值的用户的身份,确定为目标用户的身份。
图12所示的实施例与图11所示的实施例相比,除了先依据数据量较少的索引特征的比对,从多个指定用户中确定出与目标用户可能相似的多个候选用户(也即多个第一用户),缩小比对范围,还从多个第一用户进一步地选出多个第二用户,进一步地缩小比对范围;然后,在该进一步缩小的范围内,依据特定特征信息的比对确定目标用户的身份,因此可以进一步提高确定目标用户身份的效率。
需要说明的是,用户身份确定装置1000能够实现图1的方法实施例的方法,具体可参考图1所示实施例的用户身份确定方法,不再赘述。
总之,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的保护范围之内。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制时,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。