CN105678625A - 一种确定用户身份信息的方法及设备 - Google Patents

一种确定用户身份信息的方法及设备 Download PDF

Info

Publication number
CN105678625A
CN105678625A CN201511018445.3A CN201511018445A CN105678625A CN 105678625 A CN105678625 A CN 105678625A CN 201511018445 A CN201511018445 A CN 201511018445A CN 105678625 A CN105678625 A CN 105678625A
Authority
CN
China
Prior art keywords
identity information
social
remarks
information
subscriber identity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201511018445.3A
Other languages
English (en)
Other versions
CN105678625B (zh
Inventor
张惠亮
刘胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Union Mobile Pay Co Ltd
Original Assignee
Union Mobile Pay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Union Mobile Pay Co Ltd filed Critical Union Mobile Pay Co Ltd
Priority to CN201511018445.3A priority Critical patent/CN105678625B/zh
Publication of CN105678625A publication Critical patent/CN105678625A/zh
Application granted granted Critical
Publication of CN105678625B publication Critical patent/CN105678625B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

本发明实施例涉及数据挖掘技术领域,尤其涉及一种确定用户身份信息的方法及设备,用于确定出用户的身份信息。本发明实施例中,获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。如此,则可更为准确的确定出所述待处理用户的身份信息。

Description

一种确定用户身份信息的方法及设备
技术领域
本发明实施例涉及数据挖掘技术领域,尤其涉及一种确定用户身份信息的方法及设备。
背景技术
随着互联网、移动互联网技术的不断发展,人们越来越频繁的使用社交网络和家人、同事、朋友进行沟通交流,社交网络已经成为人们生活中不可分割的一部分,是人们获取信息的重要媒体。用户在社交网络上所使用的注册信息往往是虚拟的,比如用户注册的昵称等。但是很多应用场景均需要确定出用户的身份信息,比如,根据用户的身份信息向用户进行更精准的电商网站推荐,或者当用户使用在社交网络上虚拟的注册信息在网上发布谣言、进行诈骗等犯罪活动时,根据确定出的该用户的身份信息对该用户进行抓捕。
现有技术中主要通过用户自行填写的方式获取用户的身份信息。具体来说,社交网络在注册页面增加用户的身份信息的填写项,比如用户的姓名、用户所在单位、用户的职位等等信息,用户在该社交网络上进行注册时,用户在注册页面自行填写用户的身份信息。但是在具体实施中,用户会非常反感填写此类身份信息,通常仅仅会填写一些虚拟的信息,比如网名等。或者当该类身份信息不是必填项时,用户不进行填写,有时,甚至由于该社交网络需要填写此类身份信息,用户不使用该社交网络。
综上,亟需一种确定用户身份信息的方法及设备,用于确定出用户的身份信息。
发明内容
本发明实施例提供一种确定用户身份信息的方法及设备,用于确定出用户的身份信息。
本发明实施例提供一种确定用户身份信息的方法,包括:
获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;
从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。
可选地,待处理用户的身份信息至少包括待处理用户的社会属性信息;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的社会属性字段进行匹配;
将成功匹配出社会属性字段的备注用户身份信息,确定为社会属性备选信息;
根据所有社会属性备选信息,确定待处理用户的社会属性信息。
可选地,针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的社会属性字段进行匹配,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,执行:
将备注用户身份信息中的所有字段与身份信息匹配库中的社会属性字段进行匹配;
在确定备注用户身份信息的所有字段中存在与身份信息匹配库中的社会属性字段中的至少一个社会属性字段相同或相近的词时,确定备注用户身份信息为社会属性备选信息。
可选地,根据社会属性备选信息,确定待处理用户的社会属性信息,具体包括:
针对所有社会属性备选信息中的每个社会属性备选信息,确定社会属性备选信息中与社会属性字段相匹配的社会属性字段,将与社会属性字段相匹配的社会属性字段确定为社会属性备选信息对应的第一备选社会属性信息;
统计各第一备选社会属性信息的数量,将数量最多的第一备选社会属性信息确定为第二备选社会属性信息;
根据第二备选社会属性信息,确定待处理用户的社会属性信息。
可选地,根据第二备选社会属性信息,确定待处理用户的社会属性信息,具体包括:
将第二备选社会属性信息确定为待处理用户的社会属性信息;或者
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性信息;或者,
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性;其中,第一社会属性阈值不小于第二社会属性阈值;或者,
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,且第二备选社会属性信息的数量大于第三社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性;其中,第一社会属性阈值不小于第二社会属性阈值。
可选地,待处理用户的身份信息为待处理用户与其它联系人之间的社会关系;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,执行:
将每个备注用户身份信息与身份信息匹配库中的社会关系字段进行匹配;
在确定备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段时,将备注用户身份信息中与社会属性字段相匹配的字段确定为备注用户身份信息对应的第一社会关系字段;
根据备注用户身份信息对应的第一社会关系字段,确定备注用户身份信息对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系。
可选地,将每个备注用户身份信息与身份信息匹配库中的社会关系字段进行匹配,具体包括:
将备注用户身份信息与社会关系字段进行匹配;
在确定备注用户身份信息中存在与社会关系字段中的任一个社会关系字段相同或相近的词时,确定备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段。
可选地,根据备注用户身份信息对应的第一社会关系字段,确定备注用户身份信息对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系之后,还包括:
从待处理用户的社交网络通讯录中确定第一社会关系字段对应的联系人的备注用户身份信息;
将第一社会关系字段对应的联系人的备注用户身份信息与社会关系字段进行匹配;
在确定第一社会关系字段对应的联系人的备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段时,将与社会属性字段相匹配的字段确定为第一社会关系字段对应的联系人与待处理用户的第二社会关系字段;
在确定第一社会关系字段和第二社会关系字段与预设的社会关系相匹配时,确定第一社会关系字段对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系校验成功;
其中,预设的社会关系中包括成对的社会关系字段。
可选地,待处理用户的身份信息至少包括待处理用户的姓名;
根据所有社会属性备选信息,确定待处理用户的社会属性信息之后,还包括:
从M个备注用户身份信息中确定出待处理备注用户身份信息;其中,待处理备注用户身份信息包括:针对M个备注用户身份信息中的未与身份信息匹配库中的社会属性字段匹配成功的备注用户身份信息,以及与身份信息匹配库中的社会属性字段匹配成功且备注用户身份信息中字段长度大于预设字段长度的备注用户身份信息;
针对每个待处理备注用户身份信息,将每个待处理备注用户身份信息与身份信息匹配库中的姓字段进行匹配;
将成功匹配出姓字段的待处理备注用户身份信息,与身份信息匹配库中的名字段进行匹配;
将成功匹配出名字段的待处理备注用户身份信息,确定为姓名备选信息;
根据所有姓名备选信息,确定待处理用户的姓名。
可选地,根据M个备注用户身份信息,确定出待处理用户的身份信息之后,还包括:
获取所待处理用户在社交网络上的标识信息;
根据待处理用户在社交网络上的标识信息,确定出待处理用户在社交网络上的标识信息所对应的在与社交网络有关联的网络上的标识信息;
根据待处理用户在与社交网络有关联的网络上的标识信息,获取待处理用户在与社交网络有关联的网络上所输入的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,根据M个备注用户身份信息,确定出待处理用户的身份信息之后,还包括:
调用存储有待处理用户的身份信息的网站接口,根据存储的待处理用户的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,获取待处理用户的社交网络通讯录,具体包括:
周期性获取待处理用户的社交网络通讯录;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
根据M个备注用户身份信息及预设的身份信息匹配库,确定出当前周期内待处理用户的身份信息;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息之后,还包括:
将待处理用户的身份信息,与当前周期之前的周期内确定的待处理用户的身份信息进行比对。
本发明实施例提供一种确定用户身份信息的设备,包括:
获取单元,用于获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
确定单元,用于根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
处理单元,用于根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。
本发明实施例提供一种确定用户身份信息的方法,包括:
获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;
从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。
可选地,获取待处理用户的社交网络通讯录,具体包括:
在确定N大于联系人数量阈值时,获取待处理用户的社交网络通讯录。
可选地,待处理用户的身份信息至少包括待处理用户的姓名;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的姓字段和名字段进行匹配;
将成功匹配出姓字段和名字段的备注用户身份信息,确定为姓名备选信息;
根据所有姓名备选信息,确定待处理用户的姓名。
可选地,待处理用户的身份信息至少包括待处理用户的姓名;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的姓字段进行匹配;
将成功匹配出姓字段的备注用户身份信息,与身份信息匹配库中的名字段进行匹配;
将成功匹配出名字段的备注用户身份信息,确定为姓名备选信息;
根据所有姓名备选信息,确定待处理用户的姓名。
可选地,将成功匹配出姓字段的备注用户身份信息,与身份信息匹配库中的名字段进行匹配,具体包括:
将成功匹配出姓字段的备注用户身份信息中,与姓字段相匹配的姓之后的所有字段与身份信息匹配库中的名字段进行匹配。
可选地,根据所有姓名备选信息,确定待处理用户的姓名,具体包括:
针对所有姓名备选信息中的每个姓名备选信息,确定姓名备选信息中与身份信息匹配库中的姓字段相匹配的姓,以及与身份信息匹配库中的名字段中相匹配的名,将与身份信息匹配库中的姓字段相匹配的姓和与身份信息匹配库中的名字段中相匹配的名确定为姓名备信息对应的第一备选姓名;
统计各第一备选姓名的数量,将数量最多的第一备选姓名确定为第二备选姓名;
根据第二备选姓名,确定待处理用户的姓名。
可选地,根据第二备选姓名,确定待处理用户的姓名,具体包括:
将第二备选姓名确定为待处理用户的姓名;或者
在确定第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,则将第二备选姓名确定为待处理用户的姓名;或者
在确定第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,且第二备选姓名的数量与N的比值大于第二姓名阈值时,则将第二备选姓名确定为待处理用户的姓名;其中,第一姓名阈值不小于第二姓名阈值。
可选地,根据M个备注用户身份信息,确定出待处理用户的身份信息之后,还包括:
获取待处理用户在与社交网络通讯录对应的社交网络上的标识信息;
根据待处理用户在社交网络上的标识信息,确定出待处理用户在与社交网络有关联的网络上的标识信息;
根据待处理用户在与社交网络有关联的网络上的标识信息,获取待处理用户在与社交网络有关联的网络上所输入的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,根据M个备注用户身份信息,确定出待处理用户的身份信息之后,还包括:
调用存储有待处理用户的身份信息的网站接口,根据存储的待处理用户的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,获取待处理用户的社交网络通讯录,具体包括:
周期性获取待处理用户的社交网络通讯录;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
根据M个备注用户身份信息及预设的身份信息匹配库,确定出当前周期内待处理用户的身份信息;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息之后,还包括:
将待处理用户的身份信息,与当前周期之前的周期内确定的待处理用户的身份信息进行比对。
本发明实施例提供一种确定用户身份信息的设备,包括:
获取单元,用于获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
确定单元,用于根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
处理单元,用于根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。
本发明实施例中,获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。由于用户为了联系方便或清楚的为自己的联系人归类,通常都会为自己的联系人设置用于表示该联系人的身份信息的备注用户身份信息;同样的待处理用户的联系人也会为该待处理用户设置用于表示该待处理用户的身份信息的备注用户身份信息,且该备注用户身份信息通常都是准确的身份信息,如此,则根据待处理用户的联系人为待处理用户设置的M个备注用户身份信息及预设的身份信息匹配库,可更为准确的确定出待处理用户的身份信息,且无需用户亲自输入该身份信息,为用户简化了注册过程,且进一步可根据识别出的用户的身份信息为用户更好的提供服务。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a为本发明实施例适用的一种社交网络通讯录的示意图;
图1b为本发明实施例适用的另一种社交网络通讯录的示意图;
图1c为本发明实施例适用的另一种社交网络通讯录的示意图;
图2为本发明实施例提供的一种确定用户身份信息的方法流程示意图;
图3为本发明实施例提供的一种确定用户身份信息的设备的结构示意图;
图4为本发明实施例提供的另一种确定用户身份信息的设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例中,用户使用注册信息注册社交网络后,会把自己的家人、同事、朋友等日常社交范围里经常联系的人加入到自己的通讯录中,以便于联系方便。社交网络可为脸书(Facebook)、QQ、微信等等。社交网络为了帮助用户更好的识别联系人,都有为联系人设置备注身份信息的功能。通常情况下,为了日后交流方便,用户都会将自己的通讯录中的联系人的备注身份信息设置为现实社会中的真实身份,而用户在社交网络上的注册信息可能是虚拟的。用户为联系人设置的备注身份信息可能包括以下几类中的任一类或者任几类的组合:
第一类,备注身份信息包括姓名,比如备注身份信息为张三、李四;
第二类,备注身份信息包括社会属性信息,比如用户的单位,在单位的职位等信息,比如备注身份信息为教育局局长、派出所所长;
第三类,备注身份信息包括用户与其它联系人之间的社会关系,用户与其它联系人之间的社会关系可为父子、母子、姑侄等等,此时,备注身份信息为爸爸、妈妈;
第四类,备注身份信息包括用户的兴趣爱好,比如,备注身份信息为滑板高手、街舞高手等等。
备注身份信息包括任几类的组合,比如备注身份信息为“教育局张三”、“教育局-局长-张三”等等。
本发明实施例中的备注身份信息中可能包括一些特殊字符,比如“教育局-局长-张三”中“-”,或者“教育局+局长+张三”中“+”,包括特殊字符的备注身份信息可能同时包括姓名和社会属性信息,或者姓名和用户与其它联系人之间的社会关系等等多种类别。若备注身份信息中不特殊字符,比如“教育局张三”、“张三”,则当字符长度大于长度阈值时,比如字符长度大于3,说明备注身份信息可能同时包括姓名和社会属性信息,或者姓名和用户与其它联系人之间的社会关系等等多种类别。当字符长度不大于长度阈值时,比如字符长度不大于3,说明备注身份信息可能仅包括姓名,或者仅包括社会属性信息,或者仅包括用户与其它联系人之间的社会关系,比如“张三”、“姑姑”。
图1a示例性示出了本发明实施例适用的一种社交网络通讯录的示意图,图1b示例性示出了本发明实施例适用的另一种社交网络通讯录的示意图,图1c示例性示出了本发明实施例适用的另一种社交网络通讯录的示意图。如图1a所示,在社交网络上,用户A0为用户A0在社交网络中的标识信息,可为用户A0的邮箱、手机号或者昵称等等。用户A0的通讯录101中包括用户A0的联系人,用户A0可为他的联系人设置备注用户身份信息,比如,为在社交网络上的注册信息为A1的用户设置的备注用户身份信息为张三,为在社交网络上的注册信息为A2的用户设置的备注用户身份信息为爸爸,为在社交网络上的注册信息为A3的用户设置的备注用户身份信息为“公司A-经理-李四”,为在社交网络上的注册信息为A4的用户设置的备注用户身份信息为公司A部长王五,为在社交网络上的注册信息为A5的用户设置的备注用户身份信息为教育局赵六,为在社交网络上的注册信息为A6的用户设置的备注用户身份信息为地税局局长,没有为在社交网络上的注册信息为A7的用户设置备注用户身份信息,此时用户A7在用户A0的通讯录中的备注用户身份信息为空。
类似的,如图1b所示,用户A1的通讯录102中包括用户A1的联系人,用户A1可为他的联系人设置备注用户身份信息,比如,为在社交网络上的注册信息为A0的用户设置的备注用户身份信息为李明,为在社交网络上的注册信息为A2的用户设置的备注用户身份信息为李强,为在社交网络上的注册信息为A3的用户设置的备注用户身份信息为“公司A-经理-李四”,为在社交网络上的注册信息为A4的用户设置的备注用户身份信息为公司A部长王五,为在社交网络上的注册信息为A5的用户设置的备注用户身份信息为教育局赵六,为在社交网络上的注册信息为A6的用户设置的备注用户身份信息为地税局局长,为在社交网络上的注册信息为A7的用户设置的备注用户身份信息为公安局局长赵六。
类似的,如图1c所示,用户A2的通讯录103中包括用户A2的联系人,用户A2可为他的联系人设置备注用户身份信息,比如,为在社交网络上的注册信息为A0的用户设置的备注用户身份信息为李明,另一种可能是用户A2为在社交网络上的注册信息为A0的用户设置的备注用户身份信息为儿子;为在社交网络上的注册信息为A1的用户设置的备注用户身份信息为张三,为在社交网络上的注册信息为A3的用户设置的备注用户身份信息为“公司A-经理-李四”,为在社交网络上的注册信息为A4的用户设置的备注用户身份信息为公司A部长王五,为在社交网络上的注册信息为A5的用户设置的备注用户身份信息为教育局赵六,为在社交网络上的注册信息为A6的用户设置的备注用户身份信息为地税局局长,为在社交网络上的注册信息为A7的用户设置的备注用户身份信息为公安局局长赵六。
本发明实施例中,用户A1为用户A0设置的备注身份信息为李明,用户A2为用户A0设置的备注用户身份信息为李明或者儿子,还可能存在其它用户A0的联系人为用户A0设置的备注身份信息为总经理李明、总经理-李明、公司B总经理李明、公司B-总经理-李明、小明、侄子、外甥、滑板高手、网游朋友、驴友等等。可见,用户A0的联系人会根据用户A0的身份信息为用户A0设置备注身份信息,联系人的备注身份信息可能表示出用户A0的姓名、所在单位、在单位中的职位,比如“公司B-总经理-李明”;还能表示出用户A0与联系人之间的关系,比如“侄子”,还有可能表示出用户A0的兴趣爱好,比如“滑板高手”。可见,用户的联系人为该用户设置的备注身份信息中包括有该用户的身份信息。
用户可为联系人设置备注用户身份信息,也可不设置,比如用户A0没有为用户A7设置备注用户身份信息,但是用户A7有多个联系人,其它联系人会为用户A7设置备注用户身份信息,比如用户A1为用户A7设置的备注用户身份信息为公安局局长赵六。
用户A0与用户A1之间相互为联系人,但是用户A0与用户A1可以有共同的联系人,比如,用户A0与用户A1的联系人中都有用户A2、用户A3等等。但是,用户A0与用户A1也可以没有共同的联系人。本发明实施例中仅仅关注一个用户的通讯录中的所有联系人为该用户设置的备注用户身份,但是并不关系用户的联系人的通讯录中都包括有谁。
可见,具体实施中,用户为了联系方便或清楚的为自己的联系人归类,通常都会为自己的联系人设置用于表示该联系人的身份信息的备注用户身份信息;同样的待处理用户的联系人也会为该待处理用户设置用于表示该待处理用户的身份信息的备注用户身份信息,且该备注用户身份信息通常都是准确的身份信息。基于此,本发明实施例中提供如下实施例,用于更为准确的确定出待处理用户的身份信息,且无需用户亲自输入该身份信息,为用户简化了注册过程,且进一步可根据识别出的用户的身份信息为用户更好的提供服务。
图2示例性示出了本发明实施例提供的一种确定用户身份信息的方法流程示意图。
基于上述论述,如图2所示,本发明实施例提供的一种确定用户身份信息的方法,可由确定用户身份信息的设备完成,比如一个处理器等等,该方法包括:
步骤201,获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
步骤202,根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;
步骤203,从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
步骤204,根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。
由于具体实施中,用户为了联系方便或清楚的为自己的联系人归类,通常都会为自己的联系人设置用于表示该联系人的身份信息的备注用户身份信息;同样的待处理用户的联系人也会为该待处理用户设置用于表示该待处理用户的身份信息的备注用户身份信息,且该备注用户身份信息通常都是准确的身份信息,如此,则根据待处理用户的联系人为待处理用户设置的M个备注用户身份信息及预设的身份信息匹配库,可更为准确的确定出待处理用户的身份信息,且无需用户亲自输入该身份信息,为用户简化了注册过程,且进一步可根据识别出的用户的身份信息为用户更好的提供服务。
本发明实施例中,可选地,待处理用户的身份信息可为多种,比如用户的姓名、社会属性信息、与其它联系人的社会关系等等,社会属性信息包括用户的单位、用户在单位中的职位等等在社会中的一些属性信息。下面通过以下几个实施例分别进行介绍。
上述步骤204中,身份信息匹配库中可包括多个字段、比如社会属性字段、社会关系字段、姓字段、名字段,或者姓名字段。预设的身份信息匹配库中包括多种类型的字段,可以用数据库的形式储存,也可以用数据表的形式储存,比如身份信息匹配库中包括多个数据库,一个数据库用于存储社会属性字段、一个数据库用于存储社会关系字段,一个数据库用于存储姓字段、一个数据库用于存储名字段等等。或者身份信息匹配库中包括多个数据表,一个数据表用于存储社会属性字段、一个数据表用于存储社会关系字段,一个数据表用于存储姓字段、一个数据表用于存储名字段等等。或者身份信息匹配库中包括多个字典,一个字典用于存储社会属性字段、一个字典用于存储社会关系字段,一个字典用于存储姓字段、一个字典用于存储名字段等等。身份信息匹配库中存储信息的形式可有多种,本发明实施例不做限制。
身份信息匹配库中包括的社会属性字段为一些能够表示用户在社会中所具有的社会属性的字段,比如一些公司的名称,一些职位的名称等等,举个例子,中国石油公司、中国移动公司等等公司名称,经理、局长、部长等等职位名称。身份信息匹配库中包括社会属性字段中可包括中文,也可包括英文,也可包括阿拉巴数字等等一些列文字。
身份信息匹配库中包括的社会关系字段为一些能够表示用户之间的某种社会关系的字段,比如爸爸、姑姑、二姨、大伯等等。身份信息匹配库中包括社会关系字段中可包括中文,也可包括英文,也可包括阿拉巴数字等等一些列文字。
身份信息匹配库中包括的姓字段为在姓名中的姓所常使用的字段,比如百家姓中的张、王、李、赵等等,或者一些英文名字中的姓(familyname)。身份信息匹配库中包括的名字段为在中国姓名中的名所常使用的字段,比如玲、强、伟等等,或者一些英文名字中的名,比如tom、lily等等。身份信息匹配库中包括姓字段或名字段中可包括中文,也可包括英文,也可包括阿拉巴数字等等一些列文字。
可选地,身份信息匹配库中包括姓名字段,姓名字段为常用姓名,比如王伟、李明等等。身份信息匹配库中包括姓字段或名字段中可包括中文,也可包括英文,也可包括阿拉巴数字等等一些列文字。
示例一
可选地,待处理用户的身份信息至少包括待处理用户的社会属性信息。
可选地,上述步骤201中,在确定N大于联系人数量阈值时,获取待处理用户的社交网络通讯录。比如,本发明实施例中的联系人数量阈值为一个经验值,本发明实施例不做限制,举个例子,联系人数量阈值取值100。如此,联系人数量越多,得到的待处理用户的身份信息越准确。
上述步骤204中,根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的社会属性字段进行匹配;将成功匹配出社会属性字段的备注用户身份信息,确定为社会属性备选信息;根据所有社会属性备选信息,确定待处理用户的社会属性信息。
举个例子,用户A0的M个联系人中的一个联系人A8,联系人A8在联系人A8的通讯录中为用户A0设置的备注用户身份信息是“中国石油公司-总经理-李明”,此时,将备注用户身份信息“中国石油公司-总经理-李明”与预设的身份信息匹配库中的社会属性字段进行匹配,可选地,将备注用户身份信息中的文字与预设的身份信息匹配库中的社会属性字段进行匹配,即一种实施方式为,在匹配至特殊字符“-”时跳过,直接匹配下一个文字,或者先将备注用户身份信息中的特殊字符去除,得到一个文字串“中国石油公司总经理李明”将该文字串与身份信息匹配库中的社会属性字段进行匹配。或者将备注用户身份信息从特殊字符处进行分割,得到多个文字串,分别为“中国石油公司”“总经理”“李明”,分别将每个字符串与身份信息匹配库中的社会属性字段进行匹配。
另一种实现方式中,用户A0的M个联系人中的一个联系人A9,联系人A9在联系人A9的通讯录中为用户A0设置的备注用户身份信息是“中国石油公司总经理李明”,此时,将备注用户身份信息“中国石油公司总经理李明”与预设的身份信息匹配库中的社会属性字段进行匹配,可选地,一种实施方式为,将“中国石油公司总经理李明”与身份信息匹配库中的社会属性字段进行匹配。或者另一种实现方式为将备注用户身份信息进行分割,得到多个文字串,基于一些可分割的词语,比如公司之类的常用分割词,系统可将长度过长的备注用户身份信息从分歌词处进行分割,得到多个文字串,分别为“中国石油公司”“总经理”“李明”,分别将每个字符串与身份信息匹配库中的社会属性字段进行匹配。
可选地,针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的社会属性字段进行匹配,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,执行:
将备注用户身份信息中的所有字段与身份信息匹配库中的社会属性字段进行匹配;在确定备注用户身份信息的所有字段中存在与身份信息匹配库中的社会属性字段中的至少一个社会属性字段相同或相近的词时,确定备注用户身份信息为社会属性备选信息。
一种实现方式为,备注身份信息中包括“中国石油公司”,但是通常人们会使用简称,比如将“中国石油公司”简称为“中石油”,为了能够识别出一些社会属性信息的简称词,在将每个备注用户身份信息与身份信息匹配库中的社会属性字段进行匹配时,一种方式为精准匹配,即备注用户身份信息中的关键词与身份信息匹配库中的社会属性字段中一个关键词完全相同,比如,备注身份信息中包括“中国石油公司”,身份信息匹配库中包括一个社会属性字段“中国石油公司”。另一种方式为模糊匹配,即备注用户身份信息中为“中石油”,由于“中石油”与“中国石油公司”相近,因此,可将“中石油”与身份信息匹配库中的社会属性字段“中国石油公司”匹配成功。
如此,则可尽可能多的识别出联系人为待处理用户设置的备注身份信息,避免遗漏,从而更准确的确定出用户的身份信息。
可选地,根据社会属性备选信息,确定待处理用户的社会属性信息,具体包括:
针对所有社会属性备选信息中的每个社会属性备选信息,确定社会属性备选信息中与社会属性字段相匹配的社会属性字段,将与社会属性字段相匹配的社会属性字段确定为社会属性备选信息对应的第一备选社会属性信息;
统计各第一备选社会属性信息的数量,将数量最多的第一备选社会属性信息确定为第二备选社会属性信息;根据第二备选社会属性信息,确定待处理用户的社会属性信息。
可选地,根据第二备选社会属性信息,确定待处理用户的社会属性信息,具体包括:
将第二备选社会属性信息确定为待处理用户的社会属性信息;或者
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性信息;或者,
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性;其中,第一社会属性阈值不小于第二社会属性阈值;或者,
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,且第二备选社会属性信息的数量大于第三社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性;其中,第一社会属性阈值不小于第二社会属性阈值。
举个例子,N为100,即待处理用户有100个联系人,其中确定出40个人为待处理用户设置的备注用户身份信息与身份信息匹配库中的社会属性字段中的至少一个社会属性字段匹配成功,即确定出40个社会属性备选信息。在40个社会属性备选信息中,有30个社会属性备选信息匹配成功的社会属性字段为“公司A”,还有10个为“公司B”,则第一备选社会属性信息为“公司A”和“公司B”,此时公司A的数量最多,第二备选社会属性信息为“公司A”,此时,可存在以下几种判定方法:
第一种,将第二备选社会属性信息确定为待处理用户的社会属性信息;即,待处理用户的社会属性信息即为“公司A”;
第二种,在“公司A”的数量30在所有第一备选社会属性信息的数量40中占比大于第一社会属性阈值时,则待处理用户的社会属性信息即为“公司A”;比如,第一社会属性阈值可为70%
第三种,在“公司A”的数量30在所有第一备选社会属性信息的数量40中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量30与100的比值大于第二社会属性阈值,比如第二社会属性阈值为20%时,则待处理用户的社会属性信息即为“公司A”;其中,第一社会属性阈值不小于第二社会属性阈值;如此,可更加准确的判定出第二备选社会属性信息是否为用户的真正的身份信息。
第四种,在“公司A”的数量30在所有第一备选社会属性信息的数量40中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量30与100的比值大于第二社会属性阈值,比如第二社会属性阈值为20%时,且第二备选社会属性信息的数量30大于第三社会属性阈值,比如第三社会属性阈值为10,则待处理用户的社会属性信息即为“公司A”;其中,第一社会属性阈值不小于第二社会属性阈值;如此,可更加准确的判定出第二备选社会属性信息是否为用户的真正的身份信息。
示例二
可选地,待处理用户的身份信息为待处理用户与其它联系人之间的社会关系。
可选地,上述步骤201中,在确定N大于联系人数量阈值时,获取待处理用户的社交网络通讯录。比如,本发明实施例中的联系人数量阈值为一个经验值,本发明实施例不做限制,举个例子,联系人数量阈值取值100。如此,联系人数量越多,得到的待处理用户的身份信息越准确。
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,执行:
将每个备注用户身份信息与身份信息匹配库中的社会关系字段进行匹配;
在确定备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段时,将备注用户身份信息中与社会属性字段相匹配的字段确定为备注用户身份信息对应的第一社会关系字段;
根据备注用户身份信息对应的第一社会关系字段,确定备注用户身份信息对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系。
可选地,将每个备注用户身份信息与身份信息匹配库中的社会关系字段进行匹配,具体包括:
将备注用户身份信息与社会关系字段进行匹配;
在确定备注用户身份信息中存在与社会关系字段中的任一个社会关系字段相同或相近的词时,确定备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段。
可选地,根据备注用户身份信息对应的第一社会关系字段,确定备注用户身份信息对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系之后,还包括:
从待处理用户的社交网络通讯录中确定第一社会关系字段对应的联系人的备注用户身份信息;
将第一社会关系字段对应的联系人的备注用户身份信息与社会关系字段进行匹配;
在确定第一社会关系字段对应的联系人的备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段时,将与社会属性字段相匹配的字段确定为第一社会关系字段对应的联系人与待处理用户的第二社会关系字段;
在确定第一社会关系字段和第二社会关系字段与预设的社会关系相匹配时,确定第一社会关系字段对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系校验成功;
其中,预设的社会关系中包括成对的社会关系字段。
举个例子,用户A0的M个联系人中的一个联系人A10,联系人A10在联系人A10的通讯录中为用户A0设置的备注用户身份信息是“儿子”,此时,身份信息匹配库中的社会关系字段包括“儿子”,将该备注用户身份信息与身份信息匹配库中的社会关系字段进行匹配,匹配成功,即将备注用户身份信息中与社会属性字段相匹配的字段“儿子”确定为备注用户身份信息对应的第一社会关系字段“儿子”,即备注用户身份信息对应的联系人A10与用户A0之间的社会关系为父子,且联系人A10为用户A0的父亲。
可选地,在进行匹配时,一种方式为精准匹配,即备注用户身份信息中的关键词与身份信息匹配库中的社会关系字段中一个关键词完全相同,比如,备注身份信息中包括“儿子”,身份信息匹配库中包括一个社会关系字段“儿子”。另一种方式为模糊匹配,即备注用户身份信息中为“儿子的英文son”,由于“son””与“儿子”意义相同,因此判定该两个词相近,因此,可将“son”与身份信息匹配库中的社会关系字段“儿子”匹配成功。如此,则可尽可能多的识别出联系人为待处理用户设置的备注身份信息,避免遗漏,从而更准确的确定出用户的身份信息。
可选地,本发明实施例提供一种校验方法,即当确定联系人A10与用户A0之间的社会关系为父子,且联系人A10为用户A0的父亲时,获取用户A0的社交网络通讯录,并获取用户A0为联系人A10设置的备注用户身份信息,将用户A0为联系人A10设置的备注用户身份信息与社会关系字段进行匹配;在确定第一社会关系字段对应的联系人的备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段时,将与社会属性字段相匹配的字段确定为第一社会关系字段对应的联系人与待处理用户的第二社会关系字段;比如,第二社会关系字段为“爸爸”。此时,第一社会关系字段为“儿子”。预设的社会关系中“爸爸”与“儿子”存在对应关系,因此,确定第一社会关系字段和第二社会关系字段与预设的社会关系相匹配。即确定第一社会关系字段对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系校验成功。即进一步确认联系人A10与用户A0之间的社会关系为父子,且联系人A10为用户A0的父亲。
本发明实施例中,预设的社会关系中包括成对的社会关系字段。比如,在社会中,成对的社会关系字段为:爸爸和儿子、爸爸和女儿、妈妈和儿子、妈妈和女儿、姑姑和侄子等等。成对的社会关系字段可为具有社会关系的双方对对方的称呼。
示例三
可选地,待处理用户的身份信息至少包括待处理用户的姓名。
可选地,上述步骤201中,在确定N大于联系人数量阈值时,获取待处理用户的社交网络通讯录。比如,本发明实施例中的联系人数量阈值为一个经验值,本发明实施例不做限制,举个例子,联系人数量阈值取值100。如此,联系人数量越多,得到的待处理用户的身份信息越准确。
根据所有社会属性备选信息,确定待处理用户的社会属性信息之后,还包括:
从M个备注用户身份信息中确定出待处理备注用户身份信息;其中,待处理备注用户身份信息包括:针对M个备注用户身份信息中的未与身份信息匹配库中的社会属性字段匹配成功的备注用户身份信息,以及与身份信息匹配库中的社会属性字段匹配成功且备注用户身份信息中字段长度大于预设字段长度的备注用户身份信息;
针对每个待处理备注用户身份信息,将每个待处理备注用户身份信息与身份信息匹配库中的姓字段进行匹配;将成功匹配出姓字段的待处理备注用户身份信息,与身份信息匹配库中的名字段进行匹配;将成功匹配出名字段的待处理备注用户身份信息,确定为姓名备选信息;根据所有姓名备选信息,确定待处理用户的姓名。
另一种实施方式为,根据所有社会属性备选信息,确定待处理用户的社会属性信息之后,还包括:
从M个备注用户身份信息中确定出待处理备注用户身份信息;其中,待处理备注用户身份信息包括:针对M个备注用户身份信息中的未与身份信息匹配库中的社会属性字段匹配成功的备注用户身份信息,以及与身份信息匹配库中的社会属性字段匹配成功且备注用户身份信息中字段长度大于预设字段长度的备注用户身份信息;
针对每个待处理备注用户身份信息,将每个待处理备注用户身份信息与身份信息匹配库中的姓字段进行匹配;将成功匹配出姓字段和名字段的待处理备注用户身份信息,确定为姓名备选信息;根据所有姓名备选信息,确定待处理用户的姓名。
举例来说,M为40,但是仅仅30个备注身份信息与身份信息匹配库中的社会属性字段匹配成功,还有10个备注身份信息未与身份信息匹配库中的社会属性字段匹配成功。在30个与身份信息匹配库中的社会属性字段匹配成功的备注身份信息中,备注身份信息字符过长,比如6个字符、10个字符,则此类备注身份信息中还可能包一些姓名。因此,本发明实施例中,可选地,从M个备注用户身份信息中确定出待处理备注用户身份信息,将每个待处理备注用户身份信息与身份信息匹配库中的姓字段和名字段进行匹配,以便再次获取待处理用户的姓名。具体姓名匹配过程可参见示例四中的论述,在此先不做详细描述。
示例四
可选地,待处理用户的身份信息至少包括待处理用户的姓名。
可选地,上述步骤201中,在确定N大于联系人数量阈值时,获取待处理用户的社交网络通讯录。比如,本发明实施例中的联系人数量阈值为一个经验值,本发明实施例不做限制,举个例子,联系人数量阈值取值100。如此,联系人数量越多,得到的待处理用户的身份信息越准确。
本发明实施例中将备注用户身份信息与预设的身份信息匹配库进行匹配时,一种可选地实施方式为将备注用户身份信息与预设的身份信息匹配库中的姓名字段进行匹配,比如,备注用户身份信息为“王伟”,身份信息匹配库中的姓名字段也包括“王伟”,如此,则备注用户身份信息与身份信息匹配库中的姓名字段“王伟”匹配成功。
另一种可选地实施方式为,根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的姓字段和名字段进行匹配;将成功匹配出姓字段和名字段的备注用户身份信息,确定为姓名备选信息;根据所有姓名备选信息,确定待处理用户的姓名。
具体来说,身份信息匹配库中包括姓字段和名字段,姓字段中包括“王”,名字段中包括“伟”,此时备注用户身份信息为“王伟”,则将备注用户身份信息“王伟”分别与姓字段和名字段进行匹配,匹配出姓字段中的“王”,以及“名字段”中的“伟”,身如此,则备注用户身份信息与身份信息匹配库中的姓字段和名字段均匹配成功。在匹配过程中,先匹配姓字段,在匹配成功时再匹配名字段,或者先匹配名字段,在匹配成功时再匹配姓字段均可。
第三种可选地实施方式为,根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的姓字段进行匹配;将成功匹配出姓字段的备注用户身份信息,与身份信息匹配库中的名字段进行匹配;将成功匹配出名字段的备注用户身份信息,确定为姓名备选信息;根据所有姓名备选信息,确定待处理用户的姓名。
具体来说,身份信息匹配库中包括姓字段和名字段,姓字段中包括“王”,名字段中包括“伟”,此时备注用户身份信息为“王伟”,则将备注用户身份信息“王伟”先与姓字段匹配,在姓字段匹配成功时,才与名字段进行匹配,具体来说,先将备注用户身份信息“王伟”在姓字段中成功匹配出姓字段中的“王”,之后才将备注用户身份信息“王伟”与名字段进行匹配,如此,且若与姓字段匹配失败时,无需再去匹配名字段,加快匹配进程。
第五种可选地实施方式为,根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的姓字段进行匹配;将成功匹配出姓字段的备注用户身份信息中,与姓字段相匹配的姓之后的所有字段与身份信息匹配库中的名字段进行匹配;将成功匹配出名字段的备注用户身份信息,确定为姓名备选信息;根据所有姓名备选信息,确定待处理用户的姓名。
具体来说,身份信息匹配库中包括姓字段和名字段,姓字段中包括“王”,名字段中包括“伟”,此时备注用户身份信息为“公司B王伟”,则将备注用户身份信息“公司B王伟”先与姓字段匹配,在姓字段匹配成功时,成功匹配出“王”,之后将与姓字段相匹配的姓“王”之后的所有字段“伟”与身份信息匹配库中的名字段进行匹配,如此,且若与姓字段匹配失败时,无需再去匹配名字段,加快匹配进程。
可选地,根据所有姓名备选信息,确定待处理用户的姓名,具体包括:
针对所有姓名备选信息中的每个姓名备选信息,确定姓名备选信息中与身份信息匹配库中的姓字段相匹配的姓,以及与身份信息匹配库中的名字段中相匹配的名,将与身份信息匹配库中的姓字段相匹配的姓和与身份信息匹配库中的名字段中相匹配的名确定为姓名备信息对应的第一备选姓名;
统计各第一备选姓名的数量,将数量最多的第一备选姓名确定为第二备选姓名;根据第二备选姓名,确定待处理用户的姓名。
可选地,根据第二备选姓名,确定待处理用户的姓名,具体包括:
将第二备选姓名确定为待处理用户的姓名;或者
在确定第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,则将第二备选姓名确定为待处理用户的姓名;或者
在确定第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,且第二备选姓名的数量与N的比值大于第二姓名阈值时,则将第二备选姓名确定为待处理用户的姓名;其中,第一姓名阈值不小于第二姓名阈值。
举个例子,N为100,即待处理用户有100个联系人,其中,成功匹配出名字段的备注用户身份信息有80个,即姓名备选信息有80个。80个姓名备选信息中有65个姓名备选信息与身份信息匹配库中的姓字段相匹配的姓为“张”,且与身份信息匹配库中的名字段相匹配的名为“三”。即65个姓名备选信息对应的第一备选姓名为“张三”,其余15个姓名备选信息对应的第一备选姓名为其它姓名。此时,将数量最多的“张三”确定为第二备选姓名。
之后,有以下几种判定方式:
第一种,将第二备选姓名“张三”确定为待处理用户的姓名;
第二种,在确定第二备选姓名“张三”的数量65在所有第一备选姓名的数量80中占比大于第一姓名阈值时,比如,第一姓名阈值为80%,则将第二备选姓名“张三”确定为待处理用户的姓名;
第三种,在确定第二备选姓名“张三”的数量65在所有第一备选姓名的数量80中占比大于第一姓名阈值时,比如,第一姓名阈值为80%;且第二备选姓名的数量65与100的比值大于第二姓名阈值时,比如,第一姓名阈值为50%;,则将第二备选姓名“张三”确定为待处理用户的姓名;其中,第一姓名阈值不小于第二姓名阈值。如此,可更加准确的判定出第二备选社会属性信息是否为用户的真正的身份信息。
本发明实施例中,根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体详细步骤可参见上述示例一、示例二、示例三和示例四的论述。
在确定了待处理用户的身份信息之后,可选地,对待处理用户的身份信息进行校验。比如对用户的姓名进行校验,对用户的单位、在单位中的职位等社会属性信息进行校验等等。
第一种可选地校验方式为:
获取待处理用户在与社交网络通讯录对应的社交网络上的标识信息;
根据待处理用户在社交网络上的标识信息,确定出待处理用户在与社交网络有关联的网络上的标识信息;
根据待处理用户在与社交网络有关联的网络上的标识信息,获取待处理用户在与社交网络有关联的网络上所输入的身份信息,对确定出的待处理用户的身份信息进行校验。
举例来说,待处理用户A0在第一社交网络上的标识信息为A0,在第一社交网络上根据根据待处理用户A0的M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。待处理用户A0使用在第一社交网络上的标识信息去注册第二社交网络,此时,待处理用户A0在第二社交网络上的标识信息为B0,第一社交网络中用户A0的标识信息与第二社交网络上的标识信息B0之间建立了对应关系,此时,第二社交网络上需要用户A0输入用户的身份信息,由于第一社交网络中用户A0的标识信息与第二社交网络上的标识信息B0之间建立了对应关系,因此,可获取用户A0在第二社交网络上的标识信息B0对应的用户的身份信息,并将该第二社交网络上的标识信息B0对应的用户的身份信息与在第一社交网络上确定出的用户A0的身份信息进行比对,在比对成功时,则校验成功,在比对失败时,则校验失败。
第二种校验方式为:
调用存储有待处理用户的身份信息的网站接口,根据存储的待处理用户的身份信息,对确定出的待处理用户的身份信息进行校验。
具体来说,一些网站,比如公安系统网站,或者银行系统网站中均存储有待处理用户的身份信息,在获取授权的情况下,可调用存储有待处理用户的身份信息的网站接口,并根据此类网站中存储的待处理用户的身份信息,对确定出的待处理用户的身份信息进行校验。
本发明实施例中,可选地,周期性获取待处理用户的社交网络通讯录;比如,一个月获取一次待处理用户的社交网络通讯录,每个周期均执行一次上述方法实例,每个周期根据当前周期内的备注用户身份信息及预设的身份信息匹配库,确定出当前周期内待处理用户的身份信息。之后,可选地,将待处理用户的身份信息,与当前周期之前的周期内确定的待处理用户的身份信息进行比对。
可选地,周期性确定用户的身份信息,第一个周期内,对第一社交网络中的所有用户执行上述方法流程,确定出当时第一社交网络中所有的用户的身份信息,比如确定出用户A0在第一个周期内的身份信息以及用户B0在第一个周期内的身份信息。之后在第二个周期内,新增了用户C0,在第二个周期内,确定出用户A0在第二个周期内的身份信息以及用户B0在第二个周期内的身份信息,确定出用户C0在第二个周期内的身份信息。此时,将用户A0在第一周期内的身份信息与第二周期内的身份信息进行比对,若两次结果一致,则确认该身份信息较为准确,若两次结果不一致,则保存两次结果,以便后续查看。同样的,将用户B0在第一周期内的身份信息与第二周期内的身份信息进行比对。另一种实施方式中,可根据同一个用户在不同的周期内的身份信息确认结果,判断上述方法的可靠性,进而对上述方法中的参数进行调整和优化。
从上述内容可以看出:本发明实施例中,获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。由于用户为了联系方便或清楚的为自己的联系人归类,通常都会为自己的联系人设置用于表示该联系人的身份信息的备注用户身份信息;同样的待处理用户的联系人也会为该待处理用户设置用于表示该待处理用户的身份信息的备注用户身份信息,且该备注用户身份信息通常都是准确的身份信息,如此,则根据待处理用户的联系人为待处理用户设置的M个备注用户身份信息及预设的身份信息匹配库,可更为准确的确定出待处理用户的身份信息,且无需用户亲自输入该身份信息,为用户简化了注册过程,且进一步可根据识别出的用户的身份信息为用户更好的提供服务。
图3示例性示出了本发明实施例提供的一种确定用户身份信息的设备的结构示意图。
基于相同构思,本发明实施例提供一种确定用户身份信息的设备,用于执行上述方法流程,如图3所示,确定用户身份信息的设备300包括获取单元301、确定单元302、处理单元303,可选地,还包括校验单元304:
获取单元,用于获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
确定单元,用于根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
处理单元,用于根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。
可选地,待处理用户的身份信息至少包括待处理用户的社会属性信息;
处理单元,具体用于:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的社会属性字段进行匹配;
将成功匹配出社会属性字段的备注用户身份信息,确定为社会属性备选信息;
根据所有社会属性备选信息,确定待处理用户的社会属性信息。
可选地,处理单元,具体用于:
在针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的社会属性字段进行匹配时,针对M个备注用户身份信息中的每个备注用户身份信息,执行:
将备注用户身份信息中的所有字段与身份信息匹配库中的社会属性字段进行匹配;
在确定备注用户身份信息的所有字段中存在与身份信息匹配库中的社会属性字段中的至少一个社会属性字段相同或相近的词时,确定备注用户身份信息为社会属性备选信息。
可选地,处理单元,具体用于:
在根据社会属性备选信息,确定待处理用户的社会属性信息时,针对所有社会属性备选信息中的每个社会属性备选信息,确定社会属性备选信息中与社会属性字段相匹配的社会属性字段,将与社会属性字段相匹配的社会属性字段确定为社会属性备选信息对应的第一备选社会属性信息;
统计各第一备选社会属性信息的数量,将数量最多的第一备选社会属性信息确定为第二备选社会属性信息;
根据第二备选社会属性信息,确定待处理用户的社会属性信息。
可选地,处理单元,具体用于:
将第二备选社会属性信息确定为待处理用户的社会属性信息;或者
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性信息;或者,
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性;其中,第一社会属性阈值不小于第二社会属性阈值;或者,
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,且第二备选社会属性信息的数量大于第三社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性;其中,第一社会属性阈值不小于第二社会属性阈值。
可选地,待处理用户的身份信息为待处理用户与其它联系人之间的社会关系;
处理单元,具体用于:
针对M个备注用户身份信息中的每个备注用户身份信息,执行:
将每个备注用户身份信息与身份信息匹配库中的社会关系字段进行匹配;
在确定备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段时,将备注用户身份信息中与社会属性字段相匹配的字段确定为备注用户身份信息对应的第一社会关系字段;
根据备注用户身份信息对应的第一社会关系字段,确定备注用户身份信息对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系。
可选地,处理单元,具体用于:
在将每个备注用户身份信息与身份信息匹配库中的社会关系字段进行匹配时,将备注用户身份信息与社会关系字段进行匹配;
在确定备注用户身份信息中存在与社会关系字段中的任一个社会关系字段相同或相近的词时,确定备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段。
可选地,处理单元,还用于:
从待处理用户的社交网络通讯录中确定第一社会关系字段对应的联系人的备注用户身份信息;
将第一社会关系字段对应的联系人的备注用户身份信息与社会关系字段进行匹配;
在确定第一社会关系字段对应的联系人的备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段时,将与社会属性字段相匹配的字段确定为第一社会关系字段对应的联系人与待处理用户的第二社会关系字段;
在确定第一社会关系字段和第二社会关系字段与预设的社会关系相匹配时,确定第一社会关系字段对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系校验成功;
其中,预设的社会关系中包括成对的社会关系字段。
可选地,待处理用户的身份信息至少包括待处理用户的姓名;
处理单元,还用于:
从M个备注用户身份信息中确定出待处理备注用户身份信息;其中,待处理备注用户身份信息包括:针对M个备注用户身份信息中的未与身份信息匹配库中的社会属性字段匹配成功的备注用户身份信息,以及与身份信息匹配库中的社会属性字段匹配成功且备注用户身份信息中字段长度大于预设字段长度的备注用户身份信息;
针对每个待处理备注用户身份信息,将每个待处理备注用户身份信息与身份信息匹配库中的姓字段进行匹配;
将成功匹配出姓字段的待处理备注用户身份信息,与身份信息匹配库中的名字段进行匹配;
将成功匹配出名字段的待处理备注用户身份信息,确定为姓名备选信息;
根据所有姓名备选信息,确定待处理用户的姓名。
可选地,还包括校验单元,用于:
获取所待处理用户在社交网络上的标识信息;
根据待处理用户在社交网络上的标识信息,确定出待处理用户在社交网络上的标识信息所对应的在与社交网络有关联的网络上的标识信息;
根据待处理用户在与社交网络有关联的网络上的标识信息,获取待处理用户在与社交网络有关联的网络上所输入的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,还包括校验单元,用于:
调用存储有待处理用户的身份信息的网站接口,根据存储的待处理用户的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,获取单元,具体用于:
周期性获取待处理用户的社交网络通讯录;
处理单元,具体用于:
根据M个备注用户身份信息及预设的身份信息匹配库,确定出当前周期内待处理用户的身份信息;
还包括校验单元,用于:
将待处理用户的身份信息,与当前周期之前的周期内确定的待处理用户的身份信息进行比对。
从上述内容可以看出:本发明实施例中,获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。由于用户为了联系方便或清楚的为自己的联系人归类,通常都会为自己的联系人设置用于表示该联系人的身份信息的备注用户身份信息;同样的待处理用户的联系人也会为该待处理用户设置用于表示该待处理用户的身份信息的备注用户身份信息,且该备注用户身份信息通常都是准确的身份信息,如此,则根据待处理用户的联系人为待处理用户设置的M个备注用户身份信息及预设的身份信息匹配库,可更为准确的确定出待处理用户的身份信息,且无需用户亲自输入该身份信息,为用户简化了注册过程,且进一步可根据识别出的用户的身份信息为用户更好的提供服务。
图4示例性示出了本发明实施例提供的一种确定用户身份信息的设备的结构示意图。
基于相同构思,本发明实施例提供一种确定用户身份信息的设备,用于执行上述方法流程,如图4所示,确定用户身份信息的设备400包括获取单元401、确定单元402、处理单元403,可选地,还包括校验单元404:
获取单元,用于获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
确定单元,用于根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
处理单元,用于根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。
可选地,获取单元,具体用于:
在确定N大于联系人数量阈值时,获取待处理用户的社交网络通讯录。
可选地,待处理用户的身份信息至少包括待处理用户的姓名;
处理单元,具体用于:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的姓字段和名字段进行匹配;
将成功匹配出姓字段和名字段的备注用户身份信息,确定为姓名备选信息;
根据所有姓名备选信息,确定待处理用户的姓名。
可选地,待处理用户的身份信息至少包括待处理用户的姓名;
处理单元,具体用于:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的姓字段进行匹配;
将成功匹配出姓字段的备注用户身份信息,与身份信息匹配库中的名字段进行匹配;
将成功匹配出名字段的备注用户身份信息,确定为姓名备选信息;
根据所有姓名备选信息,确定待处理用户的姓名。
可选地,处理单元,具体用于:
在将成功匹配出姓字段的备注用户身份信息,与身份信息匹配库中的名字段进行匹配时,将成功匹配出姓字段的备注用户身份信息中,与姓字段相匹配的姓之后的所有字段与身份信息匹配库中的名字段进行匹配。
可选地,处理单元,具体用于:
在根据所有姓名备选信息,确定待处理用户的姓名时,针对所有姓名备选信息中的每个姓名备选信息,确定姓名备选信息中与身份信息匹配库中的姓字段相匹配的姓,以及与身份信息匹配库中的名字段中相匹配的名,将与身份信息匹配库中的姓字段相匹配的姓和与身份信息匹配库中的名字段中相匹配的名确定为姓名备信息对应的第一备选姓名;
统计各第一备选姓名的数量,将数量最多的第一备选姓名确定为第二备选姓名;
根据第二备选姓名,确定待处理用户的姓名。
可选地,处理单元,具体用于:
将第二备选姓名确定为待处理用户的姓名;或者
在确定第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,则将第二备选姓名确定为待处理用户的姓名;或者
在确定第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,且第二备选姓名的数量与N的比值大于第二姓名阈值时,则将第二备选姓名确定为待处理用户的姓名;其中,第一姓名阈值不小于第二姓名阈值。
可选地,还包括校验单元,用于:
获取待处理用户在与社交网络通讯录对应的社交网络上的标识信息;
根据待处理用户在社交网络上的标识信息,确定出待处理用户在与社交网络有关联的网络上的标识信息;
根据待处理用户在与社交网络有关联的网络上的标识信息,获取待处理用户在与社交网络有关联的网络上所输入的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,还包括校验单元,用于:
调用存储有待处理用户的身份信息的网站接口,根据存储的待处理用户的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,获取单元,具体用于:
周期性获取待处理用户的社交网络通讯录;
处理单元,具体用于:
根据M个备注用户身份信息及预设的身份信息匹配库,确定出当前周期内待处理用户的身份信息;
还包括校验单元,用于:
将待处理用户的身份信息,与当前周期之前的周期内确定的待处理用户的身份信息进行比对。
从上述内容可以看出:本发明实施例中,获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。由于用户为了联系方便或清楚的为自己的联系人归类,通常都会为自己的联系人设置用于表示该联系人的身份信息的备注用户身份信息;同样的待处理用户的联系人也会为该待处理用户设置用于表示该待处理用户的身份信息的备注用户身份信息,且该备注用户身份信息通常都是准确的身份信息,如此,则根据待处理用户的联系人为待处理用户设置的M个备注用户身份信息及预设的身份信息匹配库,可更为准确的确定出待处理用户的身份信息,且无需用户亲自输入该身份信息,为用户简化了注册过程,且进一步可根据识别出的用户的身份信息为用户更好的提供服务。
本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或流程和/或方框图一个方框或方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或流程和/或方框图一个方框或方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或流程和/或方框图一个方框或方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (24)

1.一种确定用户身份信息的方法,其特征在于,包括:
获取待处理用户的社交网络通讯录,所述社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
根据所述N个联系人的标识信息,确定出所述N个联系人中每个联系人的社交网络通讯录;
从所述N个联系人中每个联系人的社交网络通讯录中,获取为所述待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
根据所述M个备注用户身份信息及预设的身份信息匹配库,确定出所述待处理用户的身份信息。
2.如权利要求1所述的方法,其特征在于,所述待处理用户的身份信息至少包括所述待处理用户的社会属性信息;
所述根据所述M个备注用户身份信息及预设的身份信息匹配库,确定出所述待处理用户的身份信息,具体包括:
针对所述M个备注用户身份信息中的每个备注用户身份信息,将所述每个备注用户身份信息与所述身份信息匹配库中的社会属性字段进行匹配;
将成功匹配出社会属性字段的备注用户身份信息,确定为社会属性备选信息;
根据所有所述社会属性备选信息,确定所述待处理用户的社会属性信息。
3.如权利要求2所述的方法,其特征在于,所述针对所述M个备注用户身份信息中的每个备注用户身份信息,将所述每个备注用户身份信息与所述身份信息匹配库中的社会属性字段进行匹配,具体包括:
针对所述M个备注用户身份信息中的每个备注用户身份信息,执行:
将备注用户身份信息中的所有字段与所述身份信息匹配库中的社会属性字段进行匹配;
在确定所述备注用户身份信息的所有字段中存在与所述身份信息匹配库中的社会属性字段中的至少一个社会属性字段相同或相近的词时,确定所述备注用户身份信息为所述社会属性备选信息。
4.如权利要求3所述的方法,其特征在于,所述根据所述社会属性备选信息,确定所述待处理用户的社会属性信息,具体包括:
针对所有所述社会属性备选信息中的每个社会属性备选信息,确定社会属性备选信息中与所述社会属性字段相匹配的社会属性字段,将与所述社会属性字段相匹配的社会属性字段确定为所述社会属性备选信息对应的第一备选社会属性信息;
统计各第一备选社会属性信息的数量,将数量最多的第一备选社会属性信息确定为第二备选社会属性信息;
根据所述第二备选社会属性信息,确定所述待处理用户的社会属性信息。
5.如权利要求4所述的方法,其特征在于,所述根据所述第二备选社会属性信息,确定所述待处理用户的社会属性信息,具体包括:
将所述第二备选社会属性信息确定为所述待处理用户的社会属性信息;或者
在确定所述第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,则将所述第二备选社会属性信息确定为所述待处理用户的社会属性信息;或者,
在确定所述第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且所述第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,则将所述第二备选社会属性信息确定为所述待处理用户的社会属性;其中,所述第一社会属性阈值不小于所述第二社会属性阈值;或者,
在确定所述第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且所述第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,且所述第二备选社会属性信息的数量大于第三社会属性阈值时,则将所述第二备选社会属性信息确定为所述待处理用户的社会属性;其中,所述第一社会属性阈值不小于所述第二社会属性阈值。
6.如权利要求1所述的方法,其特征在于,所述待处理用户的身份信息为所述待处理用户与其它联系人之间的社会关系;
所述根据所述M个备注用户身份信息及预设的身份信息匹配库,确定出所述待处理用户的身份信息,具体包括:
针对所述M个备注用户身份信息中的每个备注用户身份信息,执行:
将所述每个备注用户身份信息与所述身份信息匹配库中的社会关系字段进行匹配;
在确定备注用户身份信息中存在与所述社会关系字段中的任一个相匹配的字段时,将所述备注用户身份信息中与所述社会属性字段相匹配的字段确定为所述备注用户身份信息对应的第一社会关系字段;
根据所述备注用户身份信息对应的第一社会关系字段,确定所述备注用户身份信息对应的联系人与所述待处理用户之间的社会关系为所述第一社会关系字段对应的社会关系。
7.如权利要求6所述的方法,其特征在于,所述将所述每个备注用户身份信息与所述身份信息匹配库中的社会关系字段进行匹配,具体包括:
将所述备注用户身份信息与所述社会关系字段进行匹配;
在确定所述备注用户身份信息中存在与所述社会关系字段中的任一个社会关系字段相同或相近的词时,确定备注用户身份信息中存在与所述社会关系字段中的任一个相匹配的字段。
8.如权利要求7所述的方法,其特征在于,所述根据所述备注用户身份信息对应的第一社会关系字段,确定所述备注用户身份信息对应的联系人与所述待处理用户之间的社会关系为所述第一社会关系字段对应的社会关系之后,还包括:
从所述待处理用户的所述社交网络通讯录中确定所述第一社会关系字段对应的联系人的备注用户身份信息;
将所述第一社会关系字段对应的联系人的备注用户身份信息与所述社会关系字段进行匹配;
在确定所述第一社会关系字段对应的联系人的备注用户身份信息中存在与所述社会关系字段中的任一个相匹配的字段时,将与所述社会属性字段相匹配的字段确定为所述第一社会关系字段对应的联系人与所述待处理用户的第二社会关系字段;
在确定所述第一社会关系字段和所述第二社会关系字段与预设的社会关系相匹配时,确定所述第一社会关系字段对应的联系人与所述待处理用户之间的社会关系为所述第一社会关系字段对应的社会关系校验成功;
其中,所述预设的社会关系中包括成对的社会关系字段。
9.如权利要求2所述的方法,其特征在于,所述待处理用户的身份信息至少包括所述待处理用户的姓名;
所述根据所有所述社会属性备选信息,确定所述待处理用户的社会属性信息之后,还包括:
从所述M个备注用户身份信息中确定出待处理备注用户身份信息;其中,所述待处理备注用户身份信息包括:针对所述M个备注用户身份信息中的未与所述身份信息匹配库中的社会属性字段匹配成功的备注用户身份信息,以及与所述身份信息匹配库中的社会属性字段匹配成功且备注用户身份信息中字段长度大于预设字段长度的备注用户身份信息;
针对每个待处理备注用户身份信息,将所述每个待处理备注用户身份信息与所述身份信息匹配库中的姓字段进行匹配;
将成功匹配出姓字段的待处理备注用户身份信息,与所述身份信息匹配库中的名字段进行匹配;
将成功匹配出名字段的待处理备注用户身份信息,确定为姓名备选信息;
根据所有所述姓名备选信息,确定所述待处理用户的姓名。
10.如权利要求1至9任一权利要求所述的方法,其特征在于,所述根据所述M个备注用户身份信息,确定出所述待处理用户的身份信息之后,还包括:
获取所待处理用户在所述社交网络上的标识信息;
根据所述待处理用户在所述社交网络上的标识信息,确定出所述待处理用户在所述社交网络上的标识信息所对应的在与所述社交网络有关联的网络上的标识信息;
根据所述待处理用户在与所述社交网络有关联的网络上的标识信息,获取所述待处理用户在所述与所述社交网络有关联的网络上所输入的身份信息,对确定出的所述待处理用户的身份信息进行校验。
11.如权利要求1至9任一权利要求所述的方法,其特征在于,所述根据所述M个备注用户身份信息,确定出所述待处理用户的身份信息之后,还包括:
调用存储有所述待处理用户的身份信息的网站接口,根据存储的所述待处理用户的身份信息,对确定出的所述待处理用户的身份信息进行校验。
12.如权利要求1至9任一权利要求所述的方法,其特征在于,所述获取待处理用户的社交网络通讯录,具体包括:
周期性获取待处理用户的社交网络通讯录;
所述根据所述M个备注用户身份信息及预设的身份信息匹配库,确定出所述待处理用户的身份信息,具体包括:
根据所述M个备注用户身份信息及所述预设的身份信息匹配库,确定出当前周期内所述待处理用户的身份信息;
所述根据所述M个备注用户身份信息及预设的身份信息匹配库,确定出所述待处理用户的身份信息之后,还包括:
将所述待处理用户的身份信息,与所述当前周期之前的周期内确定的所述待处理用户的身份信息进行比对。
13.一种确定用户身份信息的设备,其特征在于,包括:
获取单元,用于获取待处理用户的社交网络通讯录,所述社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
确定单元,用于根据所述N个联系人的标识信息,确定出所述N个联系人中每个联系人的社交网络通讯录;从所述N个联系人中每个联系人的社交网络通讯录中,获取为所述待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
处理单元,用于根据所述M个备注用户身份信息及预设的身份信息匹配库,确定出所述待处理用户的身份信息。
14.如权利要求13所述的设备,其特征在于,所述待处理用户的身份信息至少包括所述待处理用户的社会属性信息;
所述处理单元,具体用于:
针对所述M个备注用户身份信息中的每个备注用户身份信息,将所述每个备注用户身份信息与所述身份信息匹配库中的社会属性字段进行匹配;
将成功匹配出社会属性字段的备注用户身份信息,确定为社会属性备选信息;
根据所有所述社会属性备选信息,确定所述待处理用户的社会属性信息。
15.如权利要求14所述的设备,其特征在于,所述处理单元,具体用于:
在针对所述M个备注用户身份信息中的每个备注用户身份信息,将所述每个备注用户身份信息与所述身份信息匹配库中的社会属性字段进行匹配时,针对所述M个备注用户身份信息中的每个备注用户身份信息,执行:
将备注用户身份信息中的所有字段与所述身份信息匹配库中的社会属性字段进行匹配;
在确定所述备注用户身份信息的所有字段中存在与所述身份信息匹配库中的社会属性字段中的至少一个社会属性字段相同或相近的词时,确定所述备注用户身份信息为所述社会属性备选信息。
16.如权利要求15所述的设备,其特征在于,所述处理单元,具体用于:
在根据所述社会属性备选信息,确定所述待处理用户的社会属性信息时,针对所有所述社会属性备选信息中的每个社会属性备选信息,确定社会属性备选信息中与所述社会属性字段相匹配的社会属性字段,将与所述社会属性字段相匹配的社会属性字段确定为所述社会属性备选信息对应的第一备选社会属性信息;
统计各第一备选社会属性信息的数量,将数量最多的第一备选社会属性信息确定为第二备选社会属性信息;
根据所述第二备选社会属性信息,确定所述待处理用户的社会属性信息。
17.如权利要求16所述的设备,其特征在于,所述处理单元,具体用于:
将所述第二备选社会属性信息确定为所述待处理用户的社会属性信息;或者
在确定所述第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,则将所述第二备选社会属性信息确定为所述待处理用户的社会属性信息;或者,
在确定所述第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且所述第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,则将所述第二备选社会属性信息确定为所述待处理用户的社会属性;其中,所述第一社会属性阈值不小于所述第二社会属性阈值;或者,
在确定所述第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且所述第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,且所述第二备选社会属性信息的数量大于第三社会属性阈值时,则将所述第二备选社会属性信息确定为所述待处理用户的社会属性;其中,所述第一社会属性阈值不小于所述第二社会属性阈值。
18.如权利要求13所述的设备,其特征在于,所述待处理用户的身份信息为所述待处理用户与其它联系人之间的社会关系;
所述处理单元,具体用于:
针对所述M个备注用户身份信息中的每个备注用户身份信息,执行:
将所述每个备注用户身份信息与所述身份信息匹配库中的社会关系字段进行匹配;
在确定备注用户身份信息中存在与所述社会关系字段中的任一个相匹配的字段时,将所述备注用户身份信息中与所述社会属性字段相匹配的字段确定为所述备注用户身份信息对应的第一社会关系字段;
根据所述备注用户身份信息对应的第一社会关系字段,确定所述备注用户身份信息对应的联系人与所述待处理用户之间的社会关系为所述第一社会关系字段对应的社会关系。
19.如权利要求18所述的设备,其特征在于,所述处理单元,具体用于:
在将所述每个备注用户身份信息与所述身份信息匹配库中的社会关系字段进行匹配时,将所述备注用户身份信息与所述社会关系字段进行匹配;
在确定所述备注用户身份信息中存在与所述社会关系字段中的任一个社会关系字段相同或相近的词时,确定备注用户身份信息中存在与所述社会关系字段中的任一个相匹配的字段。
20.如权利要求18所述的设备,其特征在于,所述处理单元,还用于:
从所述待处理用户的所述社交网络通讯录中确定所述第一社会关系字段对应的联系人的备注用户身份信息;
将所述第一社会关系字段对应的联系人的备注用户身份信息与所述社会关系字段进行匹配;
在确定所述第一社会关系字段对应的联系人的备注用户身份信息中存在与所述社会关系字段中的任一个相匹配的字段时,将与所述社会属性字段相匹配的字段确定为所述第一社会关系字段对应的联系人与所述待处理用户的第二社会关系字段;
在确定所述第一社会关系字段和所述第二社会关系字段与预设的社会关系相匹配时,确定所述第一社会关系字段对应的联系人与所述待处理用户之间的社会关系为所述第一社会关系字段对应的社会关系校验成功;
其中,所述预设的社会关系中包括成对的社会关系字段。
21.如权利要求14所述的设备,其特征在于,所述待处理用户的身份信息至少包括所述待处理用户的姓名;
所述处理单元,还用于:
从所述M个备注用户身份信息中确定出待处理备注用户身份信息;其中,所述待处理备注用户身份信息包括:针对所述M个备注用户身份信息中的未与所述身份信息匹配库中的社会属性字段匹配成功的备注用户身份信息,以及与所述身份信息匹配库中的社会属性字段匹配成功且备注用户身份信息中字段长度大于预设字段长度的备注用户身份信息;
针对每个待处理备注用户身份信息,将所述每个待处理备注用户身份信息与所述身份信息匹配库中的姓字段进行匹配;
将成功匹配出姓字段的待处理备注用户身份信息,与所述身份信息匹配库中的名字段进行匹配;
将成功匹配出名字段的待处理备注用户身份信息,确定为姓名备选信息;
根据所有所述姓名备选信息,确定所述待处理用户的姓名。
22.如权利要求13至21任一权利要求所述的设备,其特征在于,还包括校验单元,用于:
获取所待处理用户在所述社交网络上的标识信息;
根据所述待处理用户在所述社交网络上的标识信息,确定出所述待处理用户在所述社交网络上的标识信息所对应的在与所述社交网络有关联的网络上的标识信息;
根据所述待处理用户在与所述社交网络有关联的网络上的标识信息,获取所述待处理用户在所述与所述社交网络有关联的网络上所输入的身份信息,对确定出的所述待处理用户的身份信息进行校验。
23.如权利要求13至21任一权利要求所述的设备,其特征在于,还包括校验单元,用于:
调用存储有所述待处理用户的身份信息的网站接口,根据存储的所述待处理用户的身份信息,对确定出的所述待处理用户的身份信息进行校验。
24.如权利要求13至21任一权利要求所述的设备,其特征在于,所述获取单元,具体用于:
周期性获取待处理用户的社交网络通讯录;
所述处理单元,具体用于:
根据所述M个备注用户身份信息及所述预设的身份信息匹配库,确定出当前周期内所述待处理用户的身份信息;
还包括校验单元,用于:
将所述待处理用户的身份信息,与所述当前周期之前的周期内确定的所述待处理用户的身份信息进行比对。
CN201511018445.3A 2015-12-29 2015-12-29 一种确定用户身份信息的方法及设备 Active CN105678625B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511018445.3A CN105678625B (zh) 2015-12-29 2015-12-29 一种确定用户身份信息的方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511018445.3A CN105678625B (zh) 2015-12-29 2015-12-29 一种确定用户身份信息的方法及设备

Publications (2)

Publication Number Publication Date
CN105678625A true CN105678625A (zh) 2016-06-15
CN105678625B CN105678625B (zh) 2019-09-17

Family

ID=56298042

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511018445.3A Active CN105678625B (zh) 2015-12-29 2015-12-29 一种确定用户身份信息的方法及设备

Country Status (1)

Country Link
CN (1) CN105678625B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678129A (zh) * 2015-12-29 2016-06-15 联动优势科技有限公司 一种确定用户身份信息的方法及设备
CN106204295A (zh) * 2016-07-08 2016-12-07 乐视控股(北京)有限公司 基于自然语言的社交方法及装置
CN106875183A (zh) * 2016-06-28 2017-06-20 阿里巴巴集团控股有限公司 确定银行账号、身份证号、待查信息状态的方法和装置
CN108573134A (zh) * 2018-04-04 2018-09-25 阿里巴巴集团控股有限公司 一种识别身份的方法、装置及电子设备
CN109376927A (zh) * 2018-10-24 2019-02-22 阿里巴巴集团控股有限公司 一种用户年龄预测方法、装置及设备
CN109598529A (zh) * 2017-09-30 2019-04-09 北京国双科技有限公司 一种用户标识的识别方法及装置
CN112241760A (zh) * 2020-08-25 2021-01-19 浙江大学 网络小额贷款服务中的黑中介自动挖掘方法与系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101808163A (zh) * 2010-05-05 2010-08-18 北京中星微电子有限公司 一种手机通讯录信息的展现方法和应用该方法的手机
CN103024698A (zh) * 2013-01-06 2013-04-03 中兴通讯股份有限公司 一种整合各联系人的信息的方法、系统及移动终端
CN103209116A (zh) * 2013-04-13 2013-07-17 新浪网技术(中国)有限公司 多平台信息发布方法和系统
CN103617267A (zh) * 2013-12-03 2014-03-05 北京奇虎科技有限公司 社交化扩展搜索方法及装置、系统
CN104933139A (zh) * 2015-06-17 2015-09-23 中国科学院计算技术研究所 一种社交网络用户身份虚实映射的方法及装置
CN104965878A (zh) * 2015-06-12 2015-10-07 微梦创科网络科技(中国)有限公司 一种基于分组信息进行用户工作单位挖掘的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101808163A (zh) * 2010-05-05 2010-08-18 北京中星微电子有限公司 一种手机通讯录信息的展现方法和应用该方法的手机
CN103024698A (zh) * 2013-01-06 2013-04-03 中兴通讯股份有限公司 一种整合各联系人的信息的方法、系统及移动终端
CN103209116A (zh) * 2013-04-13 2013-07-17 新浪网技术(中国)有限公司 多平台信息发布方法和系统
CN103617267A (zh) * 2013-12-03 2014-03-05 北京奇虎科技有限公司 社交化扩展搜索方法及装置、系统
CN104965878A (zh) * 2015-06-12 2015-10-07 微梦创科网络科技(中国)有限公司 一种基于分组信息进行用户工作单位挖掘的方法及装置
CN104933139A (zh) * 2015-06-17 2015-09-23 中国科学院计算技术研究所 一种社交网络用户身份虚实映射的方法及装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678129A (zh) * 2015-12-29 2016-06-15 联动优势科技有限公司 一种确定用户身份信息的方法及设备
CN105678129B (zh) * 2015-12-29 2018-11-16 联动优势科技有限公司 一种确定用户身份信息的方法及设备
CN106875183A (zh) * 2016-06-28 2017-06-20 阿里巴巴集团控股有限公司 确定银行账号、身份证号、待查信息状态的方法和装置
CN106875183B (zh) * 2016-06-28 2020-07-28 阿里巴巴集团控股有限公司 确定银行账号、身份证号、待查信息状态的方法和装置
CN106204295A (zh) * 2016-07-08 2016-12-07 乐视控股(北京)有限公司 基于自然语言的社交方法及装置
CN109598529A (zh) * 2017-09-30 2019-04-09 北京国双科技有限公司 一种用户标识的识别方法及装置
CN108573134A (zh) * 2018-04-04 2018-09-25 阿里巴巴集团控股有限公司 一种识别身份的方法、装置及电子设备
CN109376927A (zh) * 2018-10-24 2019-02-22 阿里巴巴集团控股有限公司 一种用户年龄预测方法、装置及设备
CN112241760A (zh) * 2020-08-25 2021-01-19 浙江大学 网络小额贷款服务中的黑中介自动挖掘方法与系统

Also Published As

Publication number Publication date
CN105678625B (zh) 2019-09-17

Similar Documents

Publication Publication Date Title
CN105678625A (zh) 一种确定用户身份信息的方法及设备
CN105678129A (zh) 一种确定用户身份信息的方法及设备
CN109065054A (zh) 语音识别纠错方法、装置、电子设备及可读存储介质
CN106973384B (zh) 一种无线保真Wi-Fi连接方法及移动终端
US11409789B2 (en) Determining identity in an image that has multiple people
CN106202041A (zh) 一种解决知识图谱中的实体对齐问题的方法和装置
CN106559314A (zh) 一种跨平台的通信处理方法、装置
CN104346365A (zh) 确定与特定业务相关的关联日志的方法和装置
CN110022315A (zh) 一种块链式账本中的权重管理方法、装置及设备
CN105100029A (zh) 对用户进行身份验证的方法和装置
CN110245145A (zh) 关系型数据库到Hadoop数据库的结构同步方法和装置
CN107832448A (zh) 数据库操作方法、装置及设备
CN111400504A (zh) 企业关键人的识别方法和装置
CN106559555A (zh) 一种通信录的构建方法、装置
CN108776587A (zh) 数据获取方法、装置、计算机设备以及存储介质
CN108616361B (zh) 一种识别设备唯一性的方法及装置
CN112491885B (zh) 一种电子凭证的传输方法、装置及设备
CN112036125B (zh) 一种文档管理方法、装置及计算机设备
CN111382403A (zh) 用户行为识别模型的训练方法、装置、设备及存储介质
CN114238883A (zh) 一种身份验证方法、装置、设备及存储介质
CN113408254A (zh) 一种页面表单信息填写方法、装置、设备和可读介质
CN109816543A (zh) 一种图像查找方法及装置
CN111488464B (zh) 实体属性处理方法、装置、设备及介质
CN108810803A (zh) 寻找失联用户的方法及系统
CN106559554A (zh) 一种通信处理方法、装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant