CN105678129A - 一种确定用户身份信息的方法及设备 - Google Patents
一种确定用户身份信息的方法及设备 Download PDFInfo
- Publication number
- CN105678129A CN105678129A CN201511018527.8A CN201511018527A CN105678129A CN 105678129 A CN105678129 A CN 105678129A CN 201511018527 A CN201511018527 A CN 201511018527A CN 105678129 A CN105678129 A CN 105678129A
- Authority
- CN
- China
- Prior art keywords
- identity information
- name
- remarks
- pending user
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000010168 coupling process Methods 0.000 claims description 37
- 230000008878 coupling Effects 0.000 claims description 35
- 238000005859 coupling reaction Methods 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 32
- 230000013011 mating Effects 0.000 claims description 14
- 238000012795 verification Methods 0.000 claims description 14
- 238000007418 data mining Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 20
- 239000003208 petroleum Substances 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 238000004590 computer program Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 206010008190 Cerebrovascular accident Diseases 0.000 description 1
- 241000283074 Equus asinus Species 0.000 description 1
- 241000234435 Lilium Species 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例涉及数据挖掘技术领域,尤其涉及一种确定用户身份信息的方法及设备,用于确定出用户的身份信息。本发明实施例中,获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。如此,则可更为准确的确定出所述待处理用户的身份信息。
Description
技术领域
本发明实施例涉及数据挖掘技术领域,尤其涉及一种确定用户身份信息的方法及设备。
背景技术
随着互联网、移动互联网技术的不断发展,人们越来越频繁的使用社交网络和家人、同事、朋友进行沟通交流,社交网络已经成为人们生活中不可分割的一部分,是人们获取信息的重要媒体。用户在社交网络上所使用的注册信息往往是虚拟的,比如用户注册的昵称等。但是很多应用场景均需要确定出用户的身份信息,比如,根据用户的身份信息向用户进行更精准的电商网站推荐,或者当用户使用在社交网络上虚拟的注册信息在网上发布谣言、进行诈骗等犯罪活动时,根据确定出的该用户的身份信息对该用户进行抓捕。
现有技术中主要通过用户自行填写的方式获取用户的身份信息。具体来说,社交网络在注册页面增加用户的身份信息的填写项,比如用户的姓名、用户所在单位、用户的职位等等信息,用户在该社交网络上进行注册时,用户在注册页面自行填写用户的身份信息。但是在具体实施中,用户会非常反感填写此类身份信息,通常仅仅会填写一些虚拟的信息,比如网名等。或者当该类身份信息不是必填项时,用户不进行填写,有时,甚至由于该社交网络需要填写此类身份信息,用户不使用该社交网络。
综上,亟需一种确定用户身份信息的方法及设备,用于确定出用户的身份信息。
发明内容
本发明实施例提供一种确定用户身份信息的方法及设备,用于确定出用户的身份信息。
本发明实施例提供一种确定用户身份信息的方法,包括:
获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;
从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。
可选地,获取待处理用户的社交网络通讯录,具体包括:
在确定N大于联系人数量阈值时,获取待处理用户的社交网络通讯录。
可选地,待处理用户的身份信息至少包括待处理用户的姓名;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的姓字段和名字段进行匹配;
将成功匹配出姓字段和名字段的备注用户身份信息,确定为姓名备选信息;
根据所有姓名备选信息,确定待处理用户的姓名。
可选地,待处理用户的身份信息至少包括待处理用户的姓名;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的姓字段进行匹配;
将成功匹配出姓字段的备注用户身份信息,与身份信息匹配库中的名字段进行匹配;
将成功匹配出名字段的备注用户身份信息,确定为姓名备选信息;
根据所有姓名备选信息,确定待处理用户的姓名。
可选地,将成功匹配出姓字段的备注用户身份信息,与身份信息匹配库中的名字段进行匹配,具体包括:
将成功匹配出姓字段的备注用户身份信息中,与姓字段相匹配的姓之后的所有字段与身份信息匹配库中的名字段进行匹配。
可选地,根据所有姓名备选信息,确定待处理用户的姓名,具体包括:
针对所有姓名备选信息中的每个姓名备选信息,确定姓名备选信息中与身份信息匹配库中的姓字段相匹配的姓,以及与身份信息匹配库中的名字段中相匹配的名,将与身份信息匹配库中的姓字段相匹配的姓和与身份信息匹配库中的名字段中相匹配的名确定为姓名备信息对应的第一备选姓名;
统计各第一备选姓名的数量,将数量最多的第一备选姓名确定为第二备选姓名;
根据第二备选姓名,确定待处理用户的姓名。
可选地,根据第二备选姓名,确定待处理用户的姓名,具体包括:
将第二备选姓名确定为待处理用户的姓名;或者
在确定第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,则将第二备选姓名确定为待处理用户的姓名;或者
在确定第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,且第二备选姓名的数量与N的比值大于第二姓名阈值时,则将第二备选姓名确定为待处理用户的姓名;其中,第一姓名阈值不小于第二姓名阈值。
可选地,根据M个备注用户身份信息,确定出待处理用户的身份信息之后,还包括:
获取待处理用户在与社交网络通讯录对应的社交网络上的标识信息;
根据待处理用户在社交网络上的标识信息,确定出待处理用户在与社交网络有关联的网络上的标识信息;
根据待处理用户在与社交网络有关联的网络上的标识信息,获取待处理用户在与社交网络有关联的网络上所输入的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,根据M个备注用户身份信息,确定出待处理用户的身份信息之后,还包括:
调用存储有待处理用户的身份信息的网站接口,根据存储的待处理用户的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,获取待处理用户的社交网络通讯录,具体包括:
周期性获取待处理用户的社交网络通讯录;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
根据M个备注用户身份信息及预设的身份信息匹配库,确定出当前周期内待处理用户的身份信息;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息之后,还包括:
将待处理用户的身份信息,与当前周期之前的周期内确定的待处理用户的身份信息进行比对。
本发明实施例提供一种确定用户身份信息的设备,包括:
获取单元,用于获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
确定单元,用于根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
处理单元,用于根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。
本发明实施例提供一种确定用户身份信息的方法,包括:
获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;
从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。
可选地,待处理用户的身份信息至少包括待处理用户的社会属性信息;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的社会属性字段进行匹配;
将成功匹配出社会属性字段的备注用户身份信息,确定为社会属性备选信息;
根据所有社会属性备选信息,确定待处理用户的社会属性信息。
可选地,针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的社会属性字段进行匹配,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,执行:
将备注用户身份信息中的所有字段与身份信息匹配库中的社会属性字段进行匹配;
在确定备注用户身份信息的所有字段中存在与身份信息匹配库中的社会属性字段中的至少一个社会属性字段相同或相近的词时,确定备注用户身份信息为社会属性备选信息。
可选地,根据社会属性备选信息,确定待处理用户的社会属性信息,具体包括:
针对所有社会属性备选信息中的每个社会属性备选信息,确定社会属性备选信息中与社会属性字段相匹配的社会属性字段,将与社会属性字段相匹配的社会属性字段确定为社会属性备选信息对应的第一备选社会属性信息;
统计各第一备选社会属性信息的数量,将数量最多的第一备选社会属性信息确定为第二备选社会属性信息;
根据第二备选社会属性信息,确定待处理用户的社会属性信息。
可选地,根据第二备选社会属性信息,确定待处理用户的社会属性信息,具体包括:
将第二备选社会属性信息确定为待处理用户的社会属性信息;或者
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性信息;或者,
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性;其中,第一社会属性阈值不小于第二社会属性阈值;或者,
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,且第二备选社会属性信息的数量大于第三社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性;其中,第一社会属性阈值不小于第二社会属性阈值。
可选地,待处理用户的身份信息为待处理用户与其它联系人之间的社会关系;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,执行:
将每个备注用户身份信息与身份信息匹配库中的社会关系字段进行匹配;
在确定备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段时,将备注用户身份信息中与社会属性字段相匹配的字段确定为备注用户身份信息对应的第一社会关系字段;
根据备注用户身份信息对应的第一社会关系字段,确定备注用户身份信息对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系。
可选地,将每个备注用户身份信息与身份信息匹配库中的社会关系字段进行匹配,具体包括:
将备注用户身份信息与社会关系字段进行匹配;
在确定备注用户身份信息中存在与社会关系字段中的任一个社会关系字段相同或相近的词时,确定备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段。
可选地,根据备注用户身份信息对应的第一社会关系字段,确定备注用户身份信息对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系之后,还包括:
从待处理用户的社交网络通讯录中确定第一社会关系字段对应的联系人的备注用户身份信息;
将第一社会关系字段对应的联系人的备注用户身份信息与社会关系字段进行匹配;
在确定第一社会关系字段对应的联系人的备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段时,将与社会属性字段相匹配的字段确定为第一社会关系字段对应的联系人与待处理用户的第二社会关系字段;
在确定第一社会关系字段和第二社会关系字段与预设的社会关系相匹配时,确定第一社会关系字段对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系校验成功;
其中,预设的社会关系中包括成对的社会关系字段。
可选地,待处理用户的身份信息至少包括待处理用户的姓名;
根据所有社会属性备选信息,确定待处理用户的社会属性信息之后,还包括:
从M个备注用户身份信息中确定出待处理备注用户身份信息;其中,待处理备注用户身份信息包括:针对M个备注用户身份信息中的未与身份信息匹配库中的社会属性字段匹配成功的备注用户身份信息,以及与身份信息匹配库中的社会属性字段匹配成功且备注用户身份信息中字段长度大于预设字段长度的备注用户身份信息;
针对每个待处理备注用户身份信息,将每个待处理备注用户身份信息与身份信息匹配库中的姓字段进行匹配;
将成功匹配出姓字段的待处理备注用户身份信息,与身份信息匹配库中的名字段进行匹配;
将成功匹配出名字段的待处理备注用户身份信息,确定为姓名备选信息;
根据所有姓名备选信息,确定待处理用户的姓名。
可选地,根据M个备注用户身份信息,确定出待处理用户的身份信息之后,还包括:
获取所待处理用户在社交网络上的标识信息;
根据待处理用户在社交网络上的标识信息,确定出待处理用户在社交网络上的标识信息所对应的在与社交网络有关联的网络上的标识信息;
根据待处理用户在与社交网络有关联的网络上的标识信息,获取待处理用户在与社交网络有关联的网络上所输入的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,根据M个备注用户身份信息,确定出待处理用户的身份信息之后,还包括:
调用存储有待处理用户的身份信息的网站接口,根据存储的待处理用户的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,获取待处理用户的社交网络通讯录,具体包括:
周期性获取待处理用户的社交网络通讯录;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
根据M个备注用户身份信息及预设的身份信息匹配库,确定出当前周期内待处理用户的身份信息;
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息之后,还包括:
将待处理用户的身份信息,与当前周期之前的周期内确定的待处理用户的身份信息进行比对。
本发明实施例提供一种确定用户身份信息的设备,包括:
获取单元,用于获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
确定单元,用于根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
处理单元,用于根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。
本发明实施例中,获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。由于用户为了联系方便或清楚的为自己的联系人归类,通常都会为自己的联系人设置用于表示该联系人的身份信息的备注用户身份信息;同样的待处理用户的联系人也会为该待处理用户设置用于表示该待处理用户的身份信息的备注用户身份信息,且该备注用户身份信息通常都是准确的身份信息,如此,则根据待处理用户的联系人为待处理用户设置的M个备注用户身份信息及预设的身份信息匹配库,可更为准确的确定出待处理用户的身份信息,且无需用户亲自输入该身份信息,为用户简化了注册过程,且进一步可根据识别出的用户的身份信息为用户更好的提供服务。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a为本发明实施例适用的一种社交网络通讯录的示意图;
图1b为本发明实施例适用的另一种社交网络通讯录的示意图;
图1c为本发明实施例适用的另一种社交网络通讯录的示意图;
图2为本发明实施例提供的一种确定用户身份信息的方法流程示意图;
图3为本发明实施例提供的一种确定用户身份信息的设备的结构示意图;
图4为本发明实施例提供的另一种确定用户身份信息的设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例中,用户使用注册信息注册社交网络后,会把自己的家人、同事、朋友等日常社交范围里经常联系的人加入到自己的通讯录中,以便于联系方便。社交网络可为脸书(Facebook)、QQ、微信等等。社交网络为了帮助用户更好的识别联系人,都有为联系人设置备注身份信息的功能。通常情况下,为了日后交流方便,用户都会将自己的通讯录中的联系人的备注身份信息设置为现实社会中的真实身份,而用户在社交网络上的注册信息可能是虚拟的。用户为联系人设置的备注身份信息可能包括以下几类中的任一类或者任几类的组合:
第一类,备注身份信息包括姓名,比如备注身份信息为张三、李四;
第二类,备注身份信息包括社会属性信息,比如用户的单位,在单位的职位等信息,比如备注身份信息为教育局局长、派出所所长;
第三类,备注身份信息包括用户与其它联系人之间的社会关系,用户与其它联系人之间的社会关系可为父子、母子、姑侄等等,此时,备注身份信息为爸爸、妈妈;
第四类,备注身份信息包括用户的兴趣爱好,比如,备注身份信息为滑板高手、街舞高手等等。
备注身份信息包括任几类的组合,比如备注身份信息为“教育局张三”、“教育局-局长-张三”等等。
本发明实施例中的备注身份信息中可能包括一些特殊字符,比如“教育局-局长-张三”中“-”,或者“教育局+局长+张三”中“+”,包括特殊字符的备注身份信息可能同时包括姓名和社会属性信息,或者姓名和用户与其它联系人之间的社会关系等等多种类别。若备注身份信息中不特殊字符,比如“教育局张三”、“张三”,则当字符长度大于长度阈值时,比如字符长度大于3,说明备注身份信息可能同时包括姓名和社会属性信息,或者姓名和用户与其它联系人之间的社会关系等等多种类别。当字符长度不大于长度阈值时,比如字符长度不大于3,说明备注身份信息可能仅包括姓名,或者仅包括社会属性信息,或者仅包括用户与其它联系人之间的社会关系,比如“张三”、“姑姑”。
图1a示例性示出了本发明实施例适用的一种社交网络通讯录的示意图,图1b示例性示出了本发明实施例适用的另一种社交网络通讯录的示意图,图1c示例性示出了本发明实施例适用的另一种社交网络通讯录的示意图。如图1a所示,在社交网络上,用户A0为用户A0在社交网络中的标识信息,可为用户A0的邮箱、手机号或者昵称等等。用户A0的通讯录101中包括用户A0的联系人,用户A0可为他的联系人设置备注用户身份信息,比如,为在社交网络上的注册信息为A1的用户设置的备注用户身份信息为张三,为在社交网络上的注册信息为A2的用户设置的备注用户身份信息为爸爸,为在社交网络上的注册信息为A3的用户设置的备注用户身份信息为“公司A-经理-李四”,为在社交网络上的注册信息为A4的用户设置的备注用户身份信息为公司A部长王五,为在社交网络上的注册信息为A5的用户设置的备注用户身份信息为教育局赵六,为在社交网络上的注册信息为A6的用户设置的备注用户身份信息为地税局局长,没有为在社交网络上的注册信息为A7的用户设置备注用户身份信息,此时用户A7在用户A0的通讯录中的备注用户身份信息为空。
类似的,如图1b所示,用户A1的通讯录102中包括用户A1的联系人,用户A1可为他的联系人设置备注用户身份信息,比如,为在社交网络上的注册信息为A0的用户设置的备注用户身份信息为李明,为在社交网络上的注册信息为A2的用户设置的备注用户身份信息为李强,为在社交网络上的注册信息为A3的用户设置的备注用户身份信息为“公司A-经理-李四”,为在社交网络上的注册信息为A4的用户设置的备注用户身份信息为公司A部长王五,为在社交网络上的注册信息为A5的用户设置的备注用户身份信息为教育局赵六,为在社交网络上的注册信息为A6的用户设置的备注用户身份信息为地税局局长,为在社交网络上的注册信息为A7的用户设置的备注用户身份信息为公安局局长赵六。
类似的,如图1c所示,用户A2的通讯录103中包括用户A2的联系人,用户A2可为他的联系人设置备注用户身份信息,比如,为在社交网络上的注册信息为A0的用户设置的备注用户身份信息为李明,另一种可能是用户A2为在社交网络上的注册信息为A0的用户设置的备注用户身份信息为儿子;为在社交网络上的注册信息为A1的用户设置的备注用户身份信息为张三,为在社交网络上的注册信息为A3的用户设置的备注用户身份信息为“公司A-经理-李四”,为在社交网络上的注册信息为A4的用户设置的备注用户身份信息为公司A部长王五,为在社交网络上的注册信息为A5的用户设置的备注用户身份信息为教育局赵六,为在社交网络上的注册信息为A6的用户设置的备注用户身份信息为地税局局长,为在社交网络上的注册信息为A7的用户设置的备注用户身份信息为公安局局长赵六。
本发明实施例中,用户A1为用户A0设置的备注身份信息为李明,用户A2为用户A0设置的备注用户身份信息为李明或者儿子,还可能存在其它用户A0的联系人为用户A0设置的备注身份信息为总经理李明、总经理-李明、公司B总经理李明、公司B-总经理-李明、小明、侄子、外甥、滑板高手、网游朋友、驴友等等。可见,用户A0的联系人会根据用户A0的身份信息为用户A0设置备注身份信息,联系人的备注身份信息可能表示出用户A0的姓名、所在单位、在单位中的职位,比如“公司B-总经理-李明”;还能表示出用户A0与联系人之间的关系,比如“侄子”,还有可能表示出用户A0的兴趣爱好,比如“滑板高手”。可见,用户的联系人为该用户设置的备注身份信息中包括有该用户的身份信息。
用户可为联系人设置备注用户身份信息,也可不设置,比如用户A0没有为用户A7设置备注用户身份信息,但是用户A7有多个联系人,其它联系人会为用户A7设置备注用户身份信息,比如用户A1为用户A7设置的备注用户身份信息为公安局局长赵六。
用户A0与用户A1之间相互为联系人,但是用户A0与用户A1可以有共同的联系人,比如,用户A0与用户A1的联系人中都有用户A2、用户A3等等。但是,用户A0与用户A1也可以没有共同的联系人。本发明实施例中仅仅关注一个用户的通讯录中的所有联系人为该用户设置的备注用户身份,但是并不关系用户的联系人的通讯录中都包括有谁。
可见,具体实施中,用户为了联系方便或清楚的为自己的联系人归类,通常都会为自己的联系人设置用于表示该联系人的身份信息的备注用户身份信息;同样的待处理用户的联系人也会为该待处理用户设置用于表示该待处理用户的身份信息的备注用户身份信息,且该备注用户身份信息通常都是准确的身份信息。基于此,本发明实施例中提供如下实施例,用于更为准确的确定出待处理用户的身份信息,且无需用户亲自输入该身份信息,为用户简化了注册过程,且进一步可根据识别出的用户的身份信息为用户更好的提供服务。
图2示例性示出了本发明实施例提供的一种确定用户身份信息的方法流程示意图。
基于上述论述,如图2所示,本发明实施例提供的一种确定用户身份信息的方法,可由确定用户身份信息的设备完成,比如一个处理器等等,该方法包括:
步骤201,获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
步骤202,根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;
步骤203,从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
步骤204,根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。
由于具体实施中,用户为了联系方便或清楚的为自己的联系人归类,通常都会为自己的联系人设置用于表示该联系人的身份信息的备注用户身份信息;同样的待处理用户的联系人也会为该待处理用户设置用于表示该待处理用户的身份信息的备注用户身份信息,且该备注用户身份信息通常都是准确的身份信息,如此,则根据待处理用户的联系人为待处理用户设置的M个备注用户身份信息及预设的身份信息匹配库,可更为准确的确定出待处理用户的身份信息,且无需用户亲自输入该身份信息,为用户简化了注册过程,且进一步可根据识别出的用户的身份信息为用户更好的提供服务。
本发明实施例中,可选地,待处理用户的身份信息可为多种,比如用户的姓名、社会属性信息、与其它联系人的社会关系等等,社会属性信息包括用户的单位、用户在单位中的职位等等在社会中的一些属性信息。下面通过以下几个实施例分别进行介绍。
上述步骤204中,身份信息匹配库中可包括多个字段、比如社会属性字段、社会关系字段、姓字段、名字段,或者姓名字段。预设的身份信息匹配库中包括多种类型的字段,可以用数据库的形式储存,也可以用数据表的形式储存,比如身份信息匹配库中包括多个数据库,一个数据库用于存储社会属性字段、一个数据库用于存储社会关系字段,一个数据库用于存储姓字段、一个数据库用于存储名字段等等。或者身份信息匹配库中包括多个数据表,一个数据表用于存储社会属性字段、一个数据表用于存储社会关系字段,一个数据表用于存储姓字段、一个数据表用于存储名字段等等。或者身份信息匹配库中包括多个字典,一个字典用于存储社会属性字段、一个字典用于存储社会关系字段,一个字典用于存储姓字段、一个字典用于存储名字段等等。身份信息匹配库中存储信息的形式可有多种,本发明实施例不做限制。
身份信息匹配库中包括的社会属性字段为一些能够表示用户在社会中所具有的社会属性的字段,比如一些公司的名称,一些职位的名称等等,举个例子,中国石油公司、中国移动公司等等公司名称,经理、局长、部长等等职位名称。身份信息匹配库中包括社会属性字段中可包括中文,也可包括英文,也可包括阿拉巴数字等等一些列文字。
身份信息匹配库中包括的社会关系字段为一些能够表示用户之间的某种社会关系的字段,比如爸爸、姑姑、二姨、大伯等等。身份信息匹配库中包括社会关系字段中可包括中文,也可包括英文,也可包括阿拉巴数字等等一些列文字。
身份信息匹配库中包括的姓字段为在姓名中的姓所常使用的字段,比如百家姓中的张、王、李、赵等等,或者一些英文名字中的姓(familyname)。身份信息匹配库中包括的名字段为在中国姓名中的名所常使用的字段,比如玲、强、伟等等,或者一些英文名字中的名,比如tom、lily等等。身份信息匹配库中包括姓字段或名字段中可包括中文,也可包括英文,也可包括阿拉巴数字等等一些列文字。
可选地,身份信息匹配库中包括姓名字段,姓名字段为常用姓名,比如王伟、李明等等。身份信息匹配库中包括姓字段或名字段中可包括中文,也可包括英文,也可包括阿拉巴数字等等一些列文字。
示例一
可选地,待处理用户的身份信息至少包括待处理用户的社会属性信息。
可选地,上述步骤201中,在确定N大于联系人数量阈值时,获取待处理用户的社交网络通讯录。比如,本发明实施例中的联系人数量阈值为一个经验值,本发明实施例不做限制,举个例子,联系人数量阈值取值100。如此,联系人数量越多,得到的待处理用户的身份信息越准确。
上述步骤204中,根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的社会属性字段进行匹配;将成功匹配出社会属性字段的备注用户身份信息,确定为社会属性备选信息;根据所有社会属性备选信息,确定待处理用户的社会属性信息。
举个例子,用户A0的M个联系人中的一个联系人A8,联系人A8在联系人A8的通讯录中为用户A0设置的备注用户身份信息是“中国石油公司-总经理-李明”,此时,将备注用户身份信息“中国石油公司-总经理-李明”与预设的身份信息匹配库中的社会属性字段进行匹配,可选地,将备注用户身份信息中的文字与预设的身份信息匹配库中的社会属性字段进行匹配,即一种实施方式为,在匹配至特殊字符“-”时跳过,直接匹配下一个文字,或者先将备注用户身份信息中的特殊字符去除,得到一个文字串“中国石油公司总经理李明”将该文字串与身份信息匹配库中的社会属性字段进行匹配。或者将备注用户身份信息从特殊字符处进行分割,得到多个文字串,分别为“中国石油公司”“总经理”“李明”,分别将每个字符串与身份信息匹配库中的社会属性字段进行匹配。
另一种实现方式中,用户A0的M个联系人中的一个联系人A9,联系人A9在联系人A9的通讯录中为用户A0设置的备注用户身份信息是“中国石油公司总经理李明”,此时,将备注用户身份信息“中国石油公司总经理李明”与预设的身份信息匹配库中的社会属性字段进行匹配,可选地,一种实施方式为,将“中国石油公司总经理李明”与身份信息匹配库中的社会属性字段进行匹配。或者另一种实现方式为将备注用户身份信息进行分割,得到多个文字串,基于一些可分割的词语,比如公司之类的常用分割词,系统可将长度过长的备注用户身份信息从分歌词处进行分割,得到多个文字串,分别为“中国石油公司”“总经理”“李明”,分别将每个字符串与身份信息匹配库中的社会属性字段进行匹配。
可选地,针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的社会属性字段进行匹配,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,执行:
将备注用户身份信息中的所有字段与身份信息匹配库中的社会属性字段进行匹配;在确定备注用户身份信息的所有字段中存在与身份信息匹配库中的社会属性字段中的至少一个社会属性字段相同或相近的词时,确定备注用户身份信息为社会属性备选信息。
一种实现方式为,备注身份信息中包括“中国石油公司”,但是通常人们会使用简称,比如将“中国石油公司”简称为“中石油”,为了能够识别出一些社会属性信息的简称词,在将每个备注用户身份信息与身份信息匹配库中的社会属性字段进行匹配时,一种方式为精准匹配,即备注用户身份信息中的关键词与身份信息匹配库中的社会属性字段中一个关键词完全相同,比如,备注身份信息中包括“中国石油公司”,身份信息匹配库中包括一个社会属性字段“中国石油公司”。另一种方式为模糊匹配,即备注用户身份信息中为“中石油”,由于“中石油”与“中国石油公司”相近,因此,可将“中石油”与身份信息匹配库中的社会属性字段“中国石油公司”匹配成功。
如此,则可尽可能多的识别出联系人为待处理用户设置的备注身份信息,避免遗漏,从而更准确的确定出用户的身份信息。
可选地,根据社会属性备选信息,确定待处理用户的社会属性信息,具体包括:
针对所有社会属性备选信息中的每个社会属性备选信息,确定社会属性备选信息中与社会属性字段相匹配的社会属性字段,将与社会属性字段相匹配的社会属性字段确定为社会属性备选信息对应的第一备选社会属性信息;
统计各第一备选社会属性信息的数量,将数量最多的第一备选社会属性信息确定为第二备选社会属性信息;根据第二备选社会属性信息,确定待处理用户的社会属性信息。
可选地,根据第二备选社会属性信息,确定待处理用户的社会属性信息,具体包括:
将第二备选社会属性信息确定为待处理用户的社会属性信息;或者
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性信息;或者,
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性;其中,第一社会属性阈值不小于第二社会属性阈值;或者,
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,且第二备选社会属性信息的数量大于第三社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性;其中,第一社会属性阈值不小于第二社会属性阈值。
举个例子,N为100,即待处理用户有100个联系人,其中确定出40个人为待处理用户设置的备注用户身份信息与身份信息匹配库中的社会属性字段中的至少一个社会属性字段匹配成功,即确定出40个社会属性备选信息。在40个社会属性备选信息中,有30个社会属性备选信息匹配成功的社会属性字段为“公司A”,还有10个为“公司B”,则第一备选社会属性信息为“公司A”和“公司B”,此时公司A的数量最多,第二备选社会属性信息为“公司A”,此时,可存在以下几种判定方法:
第一种,将第二备选社会属性信息确定为待处理用户的社会属性信息;即,待处理用户的社会属性信息即为“公司A”;
第二种,在“公司A”的数量30在所有第一备选社会属性信息的数量40中占比大于第一社会属性阈值时,则待处理用户的社会属性信息即为“公司A”;比如,第一社会属性阈值可为70%
第三种,在“公司A”的数量30在所有第一备选社会属性信息的数量40中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量30与100的比值大于第二社会属性阈值,比如第二社会属性阈值为20%时,则待处理用户的社会属性信息即为“公司A”;其中,第一社会属性阈值不小于第二社会属性阈值;如此,可更加准确的判定出第二备选社会属性信息是否为用户的真正的身份信息。
第四种,在“公司A”的数量30在所有第一备选社会属性信息的数量40中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量30与100的比值大于第二社会属性阈值,比如第二社会属性阈值为20%时,且第二备选社会属性信息的数量30大于第三社会属性阈值,比如第三社会属性阈值为10,则待处理用户的社会属性信息即为“公司A”;其中,第一社会属性阈值不小于第二社会属性阈值;如此,可更加准确的判定出第二备选社会属性信息是否为用户的真正的身份信息。
示例二
可选地,待处理用户的身份信息为待处理用户与其它联系人之间的社会关系。
可选地,上述步骤201中,在确定N大于联系人数量阈值时,获取待处理用户的社交网络通讯录。比如,本发明实施例中的联系人数量阈值为一个经验值,本发明实施例不做限制,举个例子,联系人数量阈值取值100。如此,联系人数量越多,得到的待处理用户的身份信息越准确。
根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,执行:
将每个备注用户身份信息与身份信息匹配库中的社会关系字段进行匹配;
在确定备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段时,将备注用户身份信息中与社会属性字段相匹配的字段确定为备注用户身份信息对应的第一社会关系字段;
根据备注用户身份信息对应的第一社会关系字段,确定备注用户身份信息对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系。
可选地,将每个备注用户身份信息与身份信息匹配库中的社会关系字段进行匹配,具体包括:
将备注用户身份信息与社会关系字段进行匹配;
在确定备注用户身份信息中存在与社会关系字段中的任一个社会关系字段相同或相近的词时,确定备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段。
可选地,根据备注用户身份信息对应的第一社会关系字段,确定备注用户身份信息对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系之后,还包括:
从待处理用户的社交网络通讯录中确定第一社会关系字段对应的联系人的备注用户身份信息;
将第一社会关系字段对应的联系人的备注用户身份信息与社会关系字段进行匹配;
在确定第一社会关系字段对应的联系人的备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段时,将与社会属性字段相匹配的字段确定为第一社会关系字段对应的联系人与待处理用户的第二社会关系字段;
在确定第一社会关系字段和第二社会关系字段与预设的社会关系相匹配时,确定第一社会关系字段对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系校验成功;
其中,预设的社会关系中包括成对的社会关系字段。
举个例子,用户A0的M个联系人中的一个联系人A10,联系人A10在联系人A10的通讯录中为用户A0设置的备注用户身份信息是“儿子”,此时,身份信息匹配库中的社会关系字段包括“儿子”,将该备注用户身份信息与身份信息匹配库中的社会关系字段进行匹配,匹配成功,即将备注用户身份信息中与社会属性字段相匹配的字段“儿子”确定为备注用户身份信息对应的第一社会关系字段“儿子”,即备注用户身份信息对应的联系人A10与用户A0之间的社会关系为父子,且联系人A10为用户A0的父亲。
可选地,在进行匹配时,一种方式为精准匹配,即备注用户身份信息中的关键词与身份信息匹配库中的社会关系字段中一个关键词完全相同,比如,备注身份信息中包括“儿子”,身份信息匹配库中包括一个社会关系字段“儿子”。另一种方式为模糊匹配,即备注用户身份信息中为“儿子的英文son”,由于“son””与“儿子”意义相同,因此判定该两个词相近,因此,可将“son”与身份信息匹配库中的社会关系字段“儿子”匹配成功。如此,则可尽可能多的识别出联系人为待处理用户设置的备注身份信息,避免遗漏,从而更准确的确定出用户的身份信息。
可选地,本发明实施例提供一种校验方法,即当确定联系人A10与用户A0之间的社会关系为父子,且联系人A10为用户A0的父亲时,获取用户A0的社交网络通讯录,并获取用户A0为联系人A10设置的备注用户身份信息,将用户A0为联系人A10设置的备注用户身份信息与社会关系字段进行匹配;在确定第一社会关系字段对应的联系人的备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段时,将与社会属性字段相匹配的字段确定为第一社会关系字段对应的联系人与待处理用户的第二社会关系字段;比如,第二社会关系字段为“爸爸”。此时,第一社会关系字段为“儿子”。预设的社会关系中“爸爸”与“儿子”存在对应关系,因此,确定第一社会关系字段和第二社会关系字段与预设的社会关系相匹配。即确定第一社会关系字段对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系校验成功。即进一步确认联系人A10与用户A0之间的社会关系为父子,且联系人A10为用户A0的父亲。
本发明实施例中,预设的社会关系中包括成对的社会关系字段。比如,在社会中,成对的社会关系字段为:爸爸和儿子、爸爸和女儿、妈妈和儿子、妈妈和女儿、姑姑和侄子等等。成对的社会关系字段可为具有社会关系的双方对对方的称呼。
示例三
可选地,待处理用户的身份信息至少包括待处理用户的姓名。
可选地,上述步骤201中,在确定N大于联系人数量阈值时,获取待处理用户的社交网络通讯录。比如,本发明实施例中的联系人数量阈值为一个经验值,本发明实施例不做限制,举个例子,联系人数量阈值取值100。如此,联系人数量越多,得到的待处理用户的身份信息越准确。
根据所有社会属性备选信息,确定待处理用户的社会属性信息之后,还包括:
从M个备注用户身份信息中确定出待处理备注用户身份信息;其中,待处理备注用户身份信息包括:针对M个备注用户身份信息中的未与身份信息匹配库中的社会属性字段匹配成功的备注用户身份信息,以及与身份信息匹配库中的社会属性字段匹配成功且备注用户身份信息中字段长度大于预设字段长度的备注用户身份信息;
针对每个待处理备注用户身份信息,将每个待处理备注用户身份信息与身份信息匹配库中的姓字段进行匹配;将成功匹配出姓字段的待处理备注用户身份信息,与身份信息匹配库中的名字段进行匹配;将成功匹配出名字段的待处理备注用户身份信息,确定为姓名备选信息;根据所有姓名备选信息,确定待处理用户的姓名。
另一种实施方式为,根据所有社会属性备选信息,确定待处理用户的社会属性信息之后,还包括:
从M个备注用户身份信息中确定出待处理备注用户身份信息;其中,待处理备注用户身份信息包括:针对M个备注用户身份信息中的未与身份信息匹配库中的社会属性字段匹配成功的备注用户身份信息,以及与身份信息匹配库中的社会属性字段匹配成功且备注用户身份信息中字段长度大于预设字段长度的备注用户身份信息;
针对每个待处理备注用户身份信息,将每个待处理备注用户身份信息与身份信息匹配库中的姓字段进行匹配;将成功匹配出姓字段和名字段的待处理备注用户身份信息,确定为姓名备选信息;根据所有姓名备选信息,确定待处理用户的姓名。
举例来说,M为40,但是仅仅30个备注身份信息与身份信息匹配库中的社会属性字段匹配成功,还有10个备注身份信息未与身份信息匹配库中的社会属性字段匹配成功。在30个与身份信息匹配库中的社会属性字段匹配成功的备注身份信息中,备注身份信息字符过长,比如6个字符、10个字符,则此类备注身份信息中还可能包一些姓名。因此,本发明实施例中,可选地,从M个备注用户身份信息中确定出待处理备注用户身份信息,将每个待处理备注用户身份信息与身份信息匹配库中的姓字段和名字段进行匹配,以便再次获取待处理用户的姓名。具体姓名匹配过程可参见示例四中的论述,在此先不做详细描述。
示例四
可选地,待处理用户的身份信息至少包括待处理用户的姓名。
可选地,上述步骤201中,在确定N大于联系人数量阈值时,获取待处理用户的社交网络通讯录。比如,本发明实施例中的联系人数量阈值为一个经验值,本发明实施例不做限制,举个例子,联系人数量阈值取值100。如此,联系人数量越多,得到的待处理用户的身份信息越准确。
本发明实施例中将备注用户身份信息与预设的身份信息匹配库进行匹配时,一种可选地实施方式为将备注用户身份信息与预设的身份信息匹配库中的姓名字段进行匹配,比如,备注用户身份信息为“王伟”,身份信息匹配库中的姓名字段也包括“王伟”,如此,则备注用户身份信息与身份信息匹配库中的姓名字段“王伟”匹配成功。
另一种可选地实施方式为,根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的姓字段和名字段进行匹配;将成功匹配出姓字段和名字段的备注用户身份信息,确定为姓名备选信息;根据所有姓名备选信息,确定待处理用户的姓名。
具体来说,身份信息匹配库中包括姓字段和名字段,姓字段中包括“王”,名字段中包括“伟”,此时备注用户身份信息为“王伟”,则将备注用户身份信息“王伟”分别与姓字段和名字段进行匹配,匹配出姓字段中的“王”,以及“名字段”中的“伟”,身如此,则备注用户身份信息与身份信息匹配库中的姓字段和名字段均匹配成功。在匹配过程中,先匹配姓字段,在匹配成功时再匹配名字段,或者先匹配名字段,在匹配成功时再匹配姓字段均可。
第三种可选地实施方式为,根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的姓字段进行匹配;将成功匹配出姓字段的备注用户身份信息,与身份信息匹配库中的名字段进行匹配;将成功匹配出名字段的备注用户身份信息,确定为姓名备选信息;根据所有姓名备选信息,确定待处理用户的姓名。
具体来说,身份信息匹配库中包括姓字段和名字段,姓字段中包括“王”,名字段中包括“伟”,此时备注用户身份信息为“王伟”,则将备注用户身份信息“王伟”先与姓字段匹配,在姓字段匹配成功时,才与名字段进行匹配,具体来说,先将备注用户身份信息“王伟”在姓字段中成功匹配出姓字段中的“王”,之后才将备注用户身份信息“王伟”与名字段进行匹配,如此,且若与姓字段匹配失败时,无需再去匹配名字段,加快匹配进程。
第五种可选地实施方式为,根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体包括:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的姓字段进行匹配;将成功匹配出姓字段的备注用户身份信息中,与姓字段相匹配的姓之后的所有字段与身份信息匹配库中的名字段进行匹配;将成功匹配出名字段的备注用户身份信息,确定为姓名备选信息;根据所有姓名备选信息,确定待处理用户的姓名。
具体来说,身份信息匹配库中包括姓字段和名字段,姓字段中包括“王”,名字段中包括“伟”,此时备注用户身份信息为“公司B王伟”,则将备注用户身份信息“公司B王伟”先与姓字段匹配,在姓字段匹配成功时,成功匹配出“王”,之后将与姓字段相匹配的姓“王”之后的所有字段“伟”与身份信息匹配库中的名字段进行匹配,如此,且若与姓字段匹配失败时,无需再去匹配名字段,加快匹配进程。
可选地,根据所有姓名备选信息,确定待处理用户的姓名,具体包括:
针对所有姓名备选信息中的每个姓名备选信息,确定姓名备选信息中与身份信息匹配库中的姓字段相匹配的姓,以及与身份信息匹配库中的名字段中相匹配的名,将与身份信息匹配库中的姓字段相匹配的姓和与身份信息匹配库中的名字段中相匹配的名确定为姓名备信息对应的第一备选姓名;
统计各第一备选姓名的数量,将数量最多的第一备选姓名确定为第二备选姓名;根据第二备选姓名,确定待处理用户的姓名。
可选地,根据第二备选姓名,确定待处理用户的姓名,具体包括:
将第二备选姓名确定为待处理用户的姓名;或者
在确定第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,则将第二备选姓名确定为待处理用户的姓名;或者
在确定第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,且第二备选姓名的数量与N的比值大于第二姓名阈值时,则将第二备选姓名确定为待处理用户的姓名;其中,第一姓名阈值不小于第二姓名阈值。
举个例子,N为100,即待处理用户有100个联系人,其中,成功匹配出名字段的备注用户身份信息有80个,即姓名备选信息有80个。80个姓名备选信息中有65个姓名备选信息与身份信息匹配库中的姓字段相匹配的姓为“张”,且与身份信息匹配库中的名字段相匹配的名为“三”。即65个姓名备选信息对应的第一备选姓名为“张三”,其余15个姓名备选信息对应的第一备选姓名为其它姓名。此时,将数量最多的“张三”确定为第二备选姓名。
之后,有以下几种判定方式:
第一种,将第二备选姓名“张三”确定为待处理用户的姓名;
第二种,在确定第二备选姓名“张三”的数量65在所有第一备选姓名的数量80中占比大于第一姓名阈值时,比如,第一姓名阈值为80%,则将第二备选姓名“张三”确定为待处理用户的姓名;
第三种,在确定第二备选姓名“张三”的数量65在所有第一备选姓名的数量80中占比大于第一姓名阈值时,比如,第一姓名阈值为80%;且第二备选姓名的数量65与100的比值大于第二姓名阈值时,比如,第一姓名阈值为50%;,则将第二备选姓名“张三”确定为待处理用户的姓名;其中,第一姓名阈值不小于第二姓名阈值。如此,可更加准确的判定出第二备选社会属性信息是否为用户的真正的身份信息。
本发明实施例中,根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息,具体详细步骤可参见上述示例一、示例二、示例三和示例四的论述。
在确定了待处理用户的身份信息之后,可选地,对待处理用户的身份信息进行校验。比如对用户的姓名进行校验,对用户的单位、在单位中的职位等社会属性信息进行校验等等。
第一种可选地校验方式为:
获取待处理用户在与社交网络通讯录对应的社交网络上的标识信息;
根据待处理用户在社交网络上的标识信息,确定出待处理用户在与社交网络有关联的网络上的标识信息;
根据待处理用户在与社交网络有关联的网络上的标识信息,获取待处理用户在与社交网络有关联的网络上所输入的身份信息,对确定出的待处理用户的身份信息进行校验。
举例来说,待处理用户A0在第一社交网络上的标识信息为A0,在第一社交网络上根据根据待处理用户A0的M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。待处理用户A0使用在第一社交网络上的标识信息去注册第二社交网络,此时,待处理用户A0在第二社交网络上的标识信息为B0,第一社交网络中用户A0的标识信息与第二社交网络上的标识信息B0之间建立了对应关系,此时,第二社交网络上需要用户A0输入用户的身份信息,由于第一社交网络中用户A0的标识信息与第二社交网络上的标识信息B0之间建立了对应关系,因此,可获取用户A0在第二社交网络上的标识信息B0对应的用户的身份信息,并将该第二社交网络上的标识信息B0对应的用户的身份信息与在第一社交网络上确定出的用户A0的身份信息进行比对,在比对成功时,则校验成功,在比对失败时,则校验失败。
第二种校验方式为:
调用存储有待处理用户的身份信息的网站接口,根据存储的待处理用户的身份信息,对确定出的待处理用户的身份信息进行校验。
具体来说,一些网站,比如公安系统网站,或者银行系统网站中均存储有待处理用户的身份信息,在获取授权的情况下,可调用存储有待处理用户的身份信息的网站接口,并根据此类网站中存储的待处理用户的身份信息,对确定出的待处理用户的身份信息进行校验。
本发明实施例中,可选地,周期性获取待处理用户的社交网络通讯录;比如,一个月获取一次待处理用户的社交网络通讯录,每个周期均执行一次上述方法实例,每个周期根据当前周期内的备注用户身份信息及预设的身份信息匹配库,确定出当前周期内待处理用户的身份信息。之后,可选地,将待处理用户的身份信息,与当前周期之前的周期内确定的待处理用户的身份信息进行比对。
可选地,周期性确定用户的身份信息,第一个周期内,对第一社交网络中的所有用户执行上述方法流程,确定出当时第一社交网络中所有的用户的身份信息,比如确定出用户A0在第一个周期内的身份信息以及用户B0在第一个周期内的身份信息。之后在第二个周期内,新增了用户C0,在第二个周期内,确定出用户A0在第二个周期内的身份信息以及用户B0在第二个周期内的身份信息,确定出用户C0在第二个周期内的身份信息。此时,将用户A0在第一周期内的身份信息与第二周期内的身份信息进行比对,若两次结果一致,则确认该身份信息较为准确,若两次结果不一致,则保存两次结果,以便后续查看。同样的,将用户B0在第一周期内的身份信息与第二周期内的身份信息进行比对。另一种实施方式中,可根据同一个用户在不同的周期内的身份信息确认结果,判断上述方法的可靠性,进而对上述方法中的参数进行调整和优化。
从上述内容可以看出:本发明实施例中,获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。由于用户为了联系方便或清楚的为自己的联系人归类,通常都会为自己的联系人设置用于表示该联系人的身份信息的备注用户身份信息;同样的待处理用户的联系人也会为该待处理用户设置用于表示该待处理用户的身份信息的备注用户身份信息,且该备注用户身份信息通常都是准确的身份信息,如此,则根据待处理用户的联系人为待处理用户设置的M个备注用户身份信息及预设的身份信息匹配库,可更为准确的确定出待处理用户的身份信息,且无需用户亲自输入该身份信息,为用户简化了注册过程,且进一步可根据识别出的用户的身份信息为用户更好的提供服务。
图3示例性示出了本发明实施例提供的一种确定用户身份信息的设备的结构示意图。
基于相同构思,本发明实施例提供一种确定用户身份信息的设备,用于执行上述方法流程,如图3所示,确定用户身份信息的设备300包括获取单元301、确定单元302、处理单元303,可选地,还包括校验单元304:
获取单元,用于获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
确定单元,用于根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
处理单元,用于根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。
可选地,待处理用户的身份信息至少包括待处理用户的社会属性信息;
处理单元,具体用于:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的社会属性字段进行匹配;
将成功匹配出社会属性字段的备注用户身份信息,确定为社会属性备选信息;
根据所有社会属性备选信息,确定待处理用户的社会属性信息。
可选地,处理单元,具体用于:
在针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的社会属性字段进行匹配时,针对M个备注用户身份信息中的每个备注用户身份信息,执行:
将备注用户身份信息中的所有字段与身份信息匹配库中的社会属性字段进行匹配;
在确定备注用户身份信息的所有字段中存在与身份信息匹配库中的社会属性字段中的至少一个社会属性字段相同或相近的词时,确定备注用户身份信息为社会属性备选信息。
可选地,处理单元,具体用于:
在根据社会属性备选信息,确定待处理用户的社会属性信息时,针对所有社会属性备选信息中的每个社会属性备选信息,确定社会属性备选信息中与社会属性字段相匹配的社会属性字段,将与社会属性字段相匹配的社会属性字段确定为社会属性备选信息对应的第一备选社会属性信息;
统计各第一备选社会属性信息的数量,将数量最多的第一备选社会属性信息确定为第二备选社会属性信息;
根据第二备选社会属性信息,确定待处理用户的社会属性信息。
可选地,处理单元,具体用于:
将第二备选社会属性信息确定为待处理用户的社会属性信息;或者
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性信息;或者,
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性;其中,第一社会属性阈值不小于第二社会属性阈值;或者,
在确定第二备选社会属性信息的数量在所有第一备选社会属性信息的数量中占比大于第一社会属性阈值时,且第二备选社会属性信息的数量与N的比值大于第二社会属性阈值时,且第二备选社会属性信息的数量大于第三社会属性阈值时,则将第二备选社会属性信息确定为待处理用户的社会属性;其中,第一社会属性阈值不小于第二社会属性阈值。
可选地,待处理用户的身份信息为待处理用户与其它联系人之间的社会关系;
处理单元,具体用于:
针对M个备注用户身份信息中的每个备注用户身份信息,执行:
将每个备注用户身份信息与身份信息匹配库中的社会关系字段进行匹配;
在确定备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段时,将备注用户身份信息中与社会属性字段相匹配的字段确定为备注用户身份信息对应的第一社会关系字段;
根据备注用户身份信息对应的第一社会关系字段,确定备注用户身份信息对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系。
可选地,处理单元,具体用于:
在将每个备注用户身份信息与身份信息匹配库中的社会关系字段进行匹配时,将备注用户身份信息与社会关系字段进行匹配;
在确定备注用户身份信息中存在与社会关系字段中的任一个社会关系字段相同或相近的词时,确定备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段。
可选地,处理单元,还用于:
从待处理用户的社交网络通讯录中确定第一社会关系字段对应的联系人的备注用户身份信息;
将第一社会关系字段对应的联系人的备注用户身份信息与社会关系字段进行匹配;
在确定第一社会关系字段对应的联系人的备注用户身份信息中存在与社会关系字段中的任一个相匹配的字段时,将与社会属性字段相匹配的字段确定为第一社会关系字段对应的联系人与待处理用户的第二社会关系字段;
在确定第一社会关系字段和第二社会关系字段与预设的社会关系相匹配时,确定第一社会关系字段对应的联系人与待处理用户之间的社会关系为第一社会关系字段对应的社会关系校验成功;
其中,预设的社会关系中包括成对的社会关系字段。
可选地,待处理用户的身份信息至少包括待处理用户的姓名;
处理单元,还用于:
从M个备注用户身份信息中确定出待处理备注用户身份信息;其中,待处理备注用户身份信息包括:针对M个备注用户身份信息中的未与身份信息匹配库中的社会属性字段匹配成功的备注用户身份信息,以及与身份信息匹配库中的社会属性字段匹配成功且备注用户身份信息中字段长度大于预设字段长度的备注用户身份信息;
针对每个待处理备注用户身份信息,将每个待处理备注用户身份信息与身份信息匹配库中的姓字段进行匹配;
将成功匹配出姓字段的待处理备注用户身份信息,与身份信息匹配库中的名字段进行匹配;
将成功匹配出名字段的待处理备注用户身份信息,确定为姓名备选信息;
根据所有姓名备选信息,确定待处理用户的姓名。
可选地,还包括校验单元,用于:
获取所待处理用户在社交网络上的标识信息;
根据待处理用户在社交网络上的标识信息,确定出待处理用户在社交网络上的标识信息所对应的在与社交网络有关联的网络上的标识信息;
根据待处理用户在与社交网络有关联的网络上的标识信息,获取待处理用户在与社交网络有关联的网络上所输入的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,还包括校验单元,用于:
调用存储有待处理用户的身份信息的网站接口,根据存储的待处理用户的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,获取单元,具体用于:
周期性获取待处理用户的社交网络通讯录;
处理单元,具体用于:
根据M个备注用户身份信息及预设的身份信息匹配库,确定出当前周期内待处理用户的身份信息;
还包括校验单元,用于:
将待处理用户的身份信息,与当前周期之前的周期内确定的待处理用户的身份信息进行比对。
从上述内容可以看出:本发明实施例中,获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。由于用户为了联系方便或清楚的为自己的联系人归类,通常都会为自己的联系人设置用于表示该联系人的身份信息的备注用户身份信息;同样的待处理用户的联系人也会为该待处理用户设置用于表示该待处理用户的身份信息的备注用户身份信息,且该备注用户身份信息通常都是准确的身份信息,如此,则根据待处理用户的联系人为待处理用户设置的M个备注用户身份信息及预设的身份信息匹配库,可更为准确的确定出待处理用户的身份信息,且无需用户亲自输入该身份信息,为用户简化了注册过程,且进一步可根据识别出的用户的身份信息为用户更好的提供服务。
图4示例性示出了本发明实施例提供的一种确定用户身份信息的设备的结构示意图。
基于相同构思,本发明实施例提供一种确定用户身份信息的设备,用于执行上述方法流程,如图4所示,确定用户身份信息的设备400包括获取单元401、确定单元402、处理单元403,可选地,还包括校验单元404:
获取单元,用于获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
确定单元,用于根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
处理单元,用于根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。
可选地,获取单元,具体用于:
在确定N大于联系人数量阈值时,获取待处理用户的社交网络通讯录。
可选地,待处理用户的身份信息至少包括待处理用户的姓名;
处理单元,具体用于:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的姓字段和名字段进行匹配;
将成功匹配出姓字段和名字段的备注用户身份信息,确定为姓名备选信息;
根据所有姓名备选信息,确定待处理用户的姓名。
可选地,待处理用户的身份信息至少包括待处理用户的姓名;
处理单元,具体用于:
针对M个备注用户身份信息中的每个备注用户身份信息,将每个备注用户身份信息与身份信息匹配库中的姓字段进行匹配;
将成功匹配出姓字段的备注用户身份信息,与身份信息匹配库中的名字段进行匹配;
将成功匹配出名字段的备注用户身份信息,确定为姓名备选信息;
根据所有姓名备选信息,确定待处理用户的姓名。
可选地,处理单元,具体用于:
在将成功匹配出姓字段的备注用户身份信息,与身份信息匹配库中的名字段进行匹配时,将成功匹配出姓字段的备注用户身份信息中,与姓字段相匹配的姓之后的所有字段与身份信息匹配库中的名字段进行匹配。
可选地,处理单元,具体用于:
在根据所有姓名备选信息,确定待处理用户的姓名时,针对所有姓名备选信息中的每个姓名备选信息,确定姓名备选信息中与身份信息匹配库中的姓字段相匹配的姓,以及与身份信息匹配库中的名字段中相匹配的名,将与身份信息匹配库中的姓字段相匹配的姓和与身份信息匹配库中的名字段中相匹配的名确定为姓名备信息对应的第一备选姓名;
统计各第一备选姓名的数量,将数量最多的第一备选姓名确定为第二备选姓名;
根据第二备选姓名,确定待处理用户的姓名。
可选地,处理单元,具体用于:
将第二备选姓名确定为待处理用户的姓名;或者
在确定第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,则将第二备选姓名确定为待处理用户的姓名;或者
在确定第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,且第二备选姓名的数量与N的比值大于第二姓名阈值时,则将第二备选姓名确定为待处理用户的姓名;其中,第一姓名阈值不小于第二姓名阈值。
可选地,还包括校验单元,用于:
获取待处理用户在与社交网络通讯录对应的社交网络上的标识信息;
根据待处理用户在社交网络上的标识信息,确定出待处理用户在与社交网络有关联的网络上的标识信息;
根据待处理用户在与社交网络有关联的网络上的标识信息,获取待处理用户在与社交网络有关联的网络上所输入的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,还包括校验单元,用于:
调用存储有待处理用户的身份信息的网站接口,根据存储的待处理用户的身份信息,对确定出的待处理用户的身份信息进行校验。
可选地,获取单元,具体用于:
周期性获取待处理用户的社交网络通讯录;
处理单元,具体用于:
根据M个备注用户身份信息及预设的身份信息匹配库,确定出当前周期内待处理用户的身份信息;
还包括校验单元,用于:
将待处理用户的身份信息,与当前周期之前的周期内确定的待处理用户的身份信息进行比对。
从上述内容可以看出:本发明实施例中,获取待处理用户的社交网络通讯录,社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;根据N个联系人的标识信息,确定出N个联系人中每个联系人的社交网络通讯录;从N个联系人中每个联系人的社交网络通讯录中,获取为待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;根据M个备注用户身份信息及预设的身份信息匹配库,确定出待处理用户的身份信息。由于用户为了联系方便或清楚的为自己的联系人归类,通常都会为自己的联系人设置用于表示该联系人的身份信息的备注用户身份信息;同样的待处理用户的联系人也会为该待处理用户设置用于表示该待处理用户的身份信息的备注用户身份信息,且该备注用户身份信息通常都是准确的身份信息,如此,则根据待处理用户的联系人为待处理用户设置的M个备注用户身份信息及预设的身份信息匹配库,可更为准确的确定出待处理用户的身份信息,且无需用户亲自输入该身份信息,为用户简化了注册过程,且进一步可根据识别出的用户的身份信息为用户更好的提供服务。
本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或流程和/或方框图一个方框或方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或流程和/或方框图一个方框或方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或流程和/或方框图一个方框或方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (20)
1.一种确定用户身份信息的方法,其特征在于,包括:
获取待处理用户的社交网络通讯录,所述社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
根据所述N个联系人的标识信息,确定出所述N个联系人中每个联系人的社交网络通讯录;
从所述N个联系人中每个联系人的社交网络通讯录中,获取为所述待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
根据所述M个备注用户身份信息及预设的身份信息匹配库,确定出所述待处理用户的身份信息。
2.如权利要求1所述的方法,其特征在于,所述获取待处理用户的社交网络通讯录,具体包括:
在确定所述N大于联系人数量阈值时,获取待处理用户的社交网络通讯录。
3.如权利要求1所述的方法,其特征在于,所述待处理用户的身份信息至少包括所述待处理用户的姓名;
所述根据所述M个备注用户身份信息及预设的身份信息匹配库,确定出所述待处理用户的身份信息,具体包括:
针对所述M个备注用户身份信息中的每个备注用户身份信息,将所述每个备注用户身份信息与所述身份信息匹配库中的姓字段和名字段进行匹配;
将成功匹配出姓字段和名字段的备注用户身份信息,确定为姓名备选信息;
根据所有所述姓名备选信息,确定所述待处理用户的姓名。
4.如权利要求1所述的方法,其特征在于,所述待处理用户的身份信息至少包括所述待处理用户的姓名;
所述根据所述M个备注用户身份信息及预设的身份信息匹配库,确定出所述待处理用户的身份信息,具体包括:
针对所述M个备注用户身份信息中的每个备注用户身份信息,将所述每个备注用户身份信息与所述身份信息匹配库中的姓字段进行匹配;
将成功匹配出姓字段的备注用户身份信息,与所述身份信息匹配库中的名字段进行匹配;
将成功匹配出名字段的备注用户身份信息,确定为姓名备选信息;
根据所有所述姓名备选信息,确定所述待处理用户的姓名。
5.如权利要求4所述的方法,其特征在于,所述将成功匹配出姓字段的备注用户身份信息,与所述身份信息匹配库中的名字段进行匹配,具体包括:
将成功匹配出姓字段的备注用户身份信息中,与姓字段相匹配的姓之后的所有字段与所述身份信息匹配库中的名字段进行匹配。
6.如权利要求3或4所述的方法,其特征在于,所述根据所有所述姓名备选信息,确定所述待处理用户的姓名,具体包括:
针对所有所述姓名备选信息中的每个姓名备选信息,确定姓名备选信息中与所述身份信息匹配库中的姓字段相匹配的姓,以及与所述身份信息匹配库中的名字段中相匹配的名,将与所述身份信息匹配库中的姓字段相匹配的姓和与所述身份信息匹配库中的名字段中相匹配的名确定为所述姓名备信息对应的第一备选姓名;
统计各第一备选姓名的数量,将数量最多的第一备选姓名确定为第二备选姓名;
根据所述第二备选姓名,确定所述待处理用户的姓名。
7.如权利要求6所述的方法,其特征在于,所述根据所述第二备选姓名,确定所述待处理用户的姓名,具体包括:
将所述第二备选姓名确定为所述待处理用户的姓名;或者
在确定所述第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,则将所述第二备选姓名确定为所述待处理用户的姓名;或者
在确定所述第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,且所述第二备选姓名的数量与N的比值大于第二姓名阈值时,则将所述第二备选姓名确定为所述待处理用户的姓名;其中,所述第一姓名阈值不小于所述第二姓名阈值。
8.如权利要求1所述的方法,其特征在于,所述根据所述M个备注用户身份信息,确定出所述待处理用户的身份信息之后,还包括:
获取所述待处理用户在与所述社交网络通讯录对应的社交网络上的标识信息;
根据所述待处理用户在所述社交网络上的标识信息,确定出所述待处理用户在与所述社交网络有关联的网络上的标识信息;
根据所述待处理用户在与所述社交网络有关联的网络上的标识信息,获取所述待处理用户在所述与所述社交网络有关联的网络上所输入的身份信息,对确定出的所述待处理用户的身份信息进行校验。
9.如权利要求1所述的方法,其特征在于,所述根据所述M个备注用户身份信息,确定出所述待处理用户的身份信息之后,还包括:
调用存储有所述待处理用户的身份信息的网站接口,根据存储的所述待处理用户的身份信息,对确定出的所述待处理用户的身份信息进行校验。
10.如权利要求1所述的方法,其特征在于,所述获取待处理用户的社交网络通讯录,具体包括:
周期性获取待处理用户的社交网络通讯录;
所述根据所述M个备注用户身份信息及预设的身份信息匹配库,确定出所述待处理用户的身份信息,具体包括:
根据所述M个备注用户身份信息及所述预设的身份信息匹配库,确定出当前周期内所述待处理用户的身份信息;
所述根据所述M个备注用户身份信息及预设的身份信息匹配库,确定出所述待处理用户的身份信息之后,还包括:
将所述待处理用户的身份信息,与所述当前周期之前的周期内确定的所述待处理用户的身份信息进行比对。
11.一种确定用户身份信息的设备,其特征在于,包括:
获取单元,用于获取待处理用户的社交网络通讯录,所述社交网络通讯录包括N个联系人的标识信息;其中,N为大于等于1的整数;
确定单元,用于根据所述N个联系人的标识信息,确定出所述N个联系人中每个联系人的社交网络通讯录;从所述N个联系人中每个联系人的社交网络通讯录中,获取为所述待处理用户设置的M个备注用户身份信息;M为小于等于N,且大于等于1的整数;
处理单元,用于根据所述M个备注用户身份信息及预设的身份信息匹配库,确定出所述待处理用户的身份信息。
12.如权利要求11所述的设备,其特征在于,所述获取单元,具体用于:
在确定所述N大于联系人数量阈值时,获取待处理用户的社交网络通讯录。
13.如权利要求11所述的设备,其特征在于,所述待处理用户的身份信息至少包括所述待处理用户的姓名;
所述处理单元,具体用于:
针对所述M个备注用户身份信息中的每个备注用户身份信息,将所述每个备注用户身份信息与所述身份信息匹配库中的姓字段和名字段进行匹配;
将成功匹配出姓字段和名字段的备注用户身份信息,确定为姓名备选信息;
根据所有所述姓名备选信息,确定所述待处理用户的姓名。
14.如权利要求11所述的设备,其特征在于,所述待处理用户的身份信息至少包括所述待处理用户的姓名;
所述处理单元,具体用于:
针对所述M个备注用户身份信息中的每个备注用户身份信息,将所述每个备注用户身份信息与所述身份信息匹配库中的姓字段进行匹配;
将成功匹配出姓字段的备注用户身份信息,与所述身份信息匹配库中的名字段进行匹配;
将成功匹配出名字段的备注用户身份信息,确定为姓名备选信息;
根据所有所述姓名备选信息,确定所述待处理用户的姓名。
15.如权利要求14所述的设备,其特征在于,所述处理单元,具体用于:
在将成功匹配出姓字段的备注用户身份信息,与所述身份信息匹配库中的名字段进行匹配时,将成功匹配出姓字段的备注用户身份信息中,与姓字段相匹配的姓之后的所有字段与所述身份信息匹配库中的名字段进行匹配。
16.如权利要求13或14所述的设备,其特征在于,所述处理单元,具体用于:
在根据所有所述姓名备选信息,确定所述待处理用户的姓名时,针对所有所述姓名备选信息中的每个姓名备选信息,确定姓名备选信息中与所述身份信息匹配库中的姓字段相匹配的姓,以及与所述身份信息匹配库中的名字段中相匹配的名,将与所述身份信息匹配库中的姓字段相匹配的姓和与所述身份信息匹配库中的名字段中相匹配的名确定为所述姓名备信息对应的第一备选姓名;
统计各第一备选姓名的数量,将数量最多的第一备选姓名确定为第二备选姓名;
根据所述第二备选姓名,确定所述待处理用户的姓名。
17.如权利要求16所述的设备,其特征在于,所述处理单元,具体用于:
将所述第二备选姓名确定为所述待处理用户的姓名;或者
在确定所述第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,则将所述第二备选姓名确定为所述待处理用户的姓名;或者
在确定所述第二备选姓名的数量在所有第一备选姓名的数量中占比大于第一姓名阈值时,且所述第二备选姓名的数量与N的比值大于第二姓名阈值时,则将所述第二备选姓名确定为所述待处理用户的姓名;其中,所述第一姓名阈值不小于所述第二姓名阈值。
18.如权利要求11所述的设备,其特征在于,还包括校验单元,用于:
获取所述待处理用户在与所述社交网络通讯录对应的社交网络上的标识信息;
根据所述待处理用户在所述社交网络上的标识信息,确定出所述待处理用户在与所述社交网络有关联的网络上的标识信息;
根据所述待处理用户在与所述社交网络有关联的网络上的标识信息,获取所述待处理用户在所述与所述社交网络有关联的网络上所输入的身份信息,对确定出的所述待处理用户的身份信息进行校验。
19.如权利要求11所述的设备,其特征在于,还包括校验单元,用于:
调用存储有所述待处理用户的身份信息的网站接口,根据存储的所述待处理用户的身份信息,对确定出的所述待处理用户的身份信息进行校验。
20.如权利要求11所述的设备,其特征在于,所述获取单元,具体用于:
周期性获取待处理用户的社交网络通讯录;
所述处理单元,具体用于:
根据所述M个备注用户身份信息及所述预设的身份信息匹配库,确定出当前周期内所述待处理用户的身份信息;
还包括校验单元,用于:
将所述待处理用户的身份信息,与所述当前周期之前的周期内确定的所述待处理用户的身份信息进行比对。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511018527.8A CN105678129B (zh) | 2015-12-29 | 2015-12-29 | 一种确定用户身份信息的方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511018527.8A CN105678129B (zh) | 2015-12-29 | 2015-12-29 | 一种确定用户身份信息的方法及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105678129A true CN105678129A (zh) | 2016-06-15 |
CN105678129B CN105678129B (zh) | 2018-11-16 |
Family
ID=56189738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201511018527.8A Active CN105678129B (zh) | 2015-12-29 | 2015-12-29 | 一种确定用户身份信息的方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105678129B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106228453A (zh) * | 2016-08-08 | 2016-12-14 | 联动优势科技有限公司 | 一种获得用户职业信息的方法和装置 |
CN106294813A (zh) * | 2016-08-15 | 2017-01-04 | 歌尔股份有限公司 | 一种智能设备人物识别的方法和装置 |
CN108990061A (zh) * | 2018-07-09 | 2018-12-11 | 中国联合网络通信集团有限公司 | 一种身份证号防盗用的方法、装置及系统 |
CN109040329A (zh) * | 2018-06-11 | 2018-12-18 | 平安科技(深圳)有限公司 | 联系人标签的确定方法、终端设备及介质 |
CN110968887A (zh) * | 2018-09-28 | 2020-04-07 | 第四范式(北京)技术有限公司 | 在数据隐私保护下执行机器学习的方法和系统 |
EP3518487A4 (en) * | 2016-09-26 | 2020-04-29 | Alibaba Group Holding Limited | METHOD AND DEVICE FOR IDENTITY DETECTION |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120015737A1 (en) * | 2009-09-30 | 2012-01-19 | Darren Ryan Craine | Finding friends for multiuser online games |
CN103345606A (zh) * | 2013-05-31 | 2013-10-09 | 东莞宇龙通信科技有限公司 | 一种保护移动终端通讯录联系人信息的方法及装置 |
CN104618561A (zh) * | 2015-01-08 | 2015-05-13 | 深圳市中兴移动通信有限公司 | 一种移动终端及其设置和查看通讯录动态的方法和装置 |
CN104933139A (zh) * | 2015-06-17 | 2015-09-23 | 中国科学院计算技术研究所 | 一种社交网络用户身份虚实映射的方法及装置 |
CN104965878A (zh) * | 2015-06-12 | 2015-10-07 | 微梦创科网络科技(中国)有限公司 | 一种基于分组信息进行用户工作单位挖掘的方法及装置 |
CN105072238A (zh) * | 2015-09-10 | 2015-11-18 | 陈包容 | 一种根据新增号码的备注信息创建通讯录的方法及装置 |
CN105678625A (zh) * | 2015-12-29 | 2016-06-15 | 联动优势科技有限公司 | 一种确定用户身份信息的方法及设备 |
-
2015
- 2015-12-29 CN CN201511018527.8A patent/CN105678129B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120015737A1 (en) * | 2009-09-30 | 2012-01-19 | Darren Ryan Craine | Finding friends for multiuser online games |
CN103345606A (zh) * | 2013-05-31 | 2013-10-09 | 东莞宇龙通信科技有限公司 | 一种保护移动终端通讯录联系人信息的方法及装置 |
CN104618561A (zh) * | 2015-01-08 | 2015-05-13 | 深圳市中兴移动通信有限公司 | 一种移动终端及其设置和查看通讯录动态的方法和装置 |
CN104965878A (zh) * | 2015-06-12 | 2015-10-07 | 微梦创科网络科技(中国)有限公司 | 一种基于分组信息进行用户工作单位挖掘的方法及装置 |
CN104933139A (zh) * | 2015-06-17 | 2015-09-23 | 中国科学院计算技术研究所 | 一种社交网络用户身份虚实映射的方法及装置 |
CN105072238A (zh) * | 2015-09-10 | 2015-11-18 | 陈包容 | 一种根据新增号码的备注信息创建通讯录的方法及装置 |
CN105678625A (zh) * | 2015-12-29 | 2016-06-15 | 联动优势科技有限公司 | 一种确定用户身份信息的方法及设备 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106228453A (zh) * | 2016-08-08 | 2016-12-14 | 联动优势科技有限公司 | 一种获得用户职业信息的方法和装置 |
CN106294813A (zh) * | 2016-08-15 | 2017-01-04 | 歌尔股份有限公司 | 一种智能设备人物识别的方法和装置 |
WO2018032931A1 (zh) * | 2016-08-15 | 2018-02-22 | 歌尔股份有限公司 | 一种智能设备人物识别的方法和装置 |
US10963550B2 (en) | 2016-08-15 | 2021-03-30 | Goertek Inc. | Method and apparatus for person identification by a smart device |
EP3518487A4 (en) * | 2016-09-26 | 2020-04-29 | Alibaba Group Holding Limited | METHOD AND DEVICE FOR IDENTITY DETECTION |
US11210417B2 (en) | 2016-09-26 | 2021-12-28 | Advanced New Technologies Co., Ltd. | Identity recognition method and device |
CN109040329A (zh) * | 2018-06-11 | 2018-12-18 | 平安科技(深圳)有限公司 | 联系人标签的确定方法、终端设备及介质 |
CN109040329B (zh) * | 2018-06-11 | 2021-06-08 | 平安科技(深圳)有限公司 | 联系人标签的确定方法、终端设备及介质 |
CN108990061A (zh) * | 2018-07-09 | 2018-12-11 | 中国联合网络通信集团有限公司 | 一种身份证号防盗用的方法、装置及系统 |
CN110968887A (zh) * | 2018-09-28 | 2020-04-07 | 第四范式(北京)技术有限公司 | 在数据隐私保护下执行机器学习的方法和系统 |
CN110968887B (zh) * | 2018-09-28 | 2022-04-05 | 第四范式(北京)技术有限公司 | 在数据隐私保护下执行机器学习的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105678129B (zh) | 2018-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105678625A (zh) | 一种确定用户身份信息的方法及设备 | |
CN105678129A (zh) | 一种确定用户身份信息的方法及设备 | |
CN106202041B (zh) | 一种解决知识图谱中的实体对齐问题的方法和装置 | |
US20160014120A1 (en) | Method, server, client and system for verifying verification codes | |
CN109065054A (zh) | 语音识别纠错方法、装置、电子设备及可读存储介质 | |
US10552471B1 (en) | Determining identities of multiple people in a digital image | |
CN109033772A (zh) | 一种验证信息的输入方法及装置 | |
CN106559314A (zh) | 一种跨平台的通信处理方法、装置 | |
CN111883140A (zh) | 基于知识图谱和声纹识别的认证方法、装置、设备及介质 | |
CN104346365A (zh) | 确定与特定业务相关的关联日志的方法和装置 | |
CN105100029A (zh) | 对用户进行身份验证的方法和装置 | |
CN107580032B (zh) | 数据处理方法、装置及设备 | |
CN112036125B (zh) | 一种文档管理方法、装置及计算机设备 | |
CN106485155A (zh) | 一种基于字段注释的加密方法和设备 | |
CN110022315A (zh) | 一种块链式账本中的权重管理方法、装置及设备 | |
CN107832448A (zh) | 数据库操作方法、装置及设备 | |
CN108616361A (zh) | 一种识别设备唯一性的方法及装置 | |
CN108446366A (zh) | 一种分类存储/快速匹配数据的方法及装置 | |
CN107451036A (zh) | 输入提示方法、装置和设备 | |
CN111488464B (zh) | 实体属性处理方法、装置、设备及介质 | |
CN109885555B (zh) | 一种用户信息管理方法及装置 | |
CN106559554A (zh) | 一种通信处理方法、装置 | |
CN106911634A (zh) | 一种登录方法和设备 | |
CN105187508A (zh) | 用户关系处理方法及系统 | |
CN107733767B (zh) | 一种社交关系网的建立方法、装置和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |