CN103164416B - 一种用户关系的识别方法及设备 - Google Patents

一种用户关系的识别方法及设备 Download PDF

Info

Publication number
CN103164416B
CN103164416B CN201110412484.7A CN201110412484A CN103164416B CN 103164416 B CN103164416 B CN 103164416B CN 201110412484 A CN201110412484 A CN 201110412484A CN 103164416 B CN103164416 B CN 103164416B
Authority
CN
China
Prior art keywords
identification
item
user
relation
relationship type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110412484.7A
Other languages
English (en)
Other versions
CN103164416A (zh
Inventor
张正威
张立柱
杨廷辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110412484.7A priority Critical patent/CN103164416B/zh
Publication of CN103164416A publication Critical patent/CN103164416A/zh
Priority to HK13109681.0A priority patent/HK1182469A1/zh
Application granted granted Critical
Publication of CN103164416B publication Critical patent/CN103164416B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种用户关系的识别方法及设备,识别设备从不同渠道采集各用户的识别信息,所述识别信息中包含预先设定的若干个识别项,针对任意两个用户,所述识别设备判断该两个用户的识别信息中是否具备内容相同的识别项,若是,则识别设备根据确定的所述两个用户的识别信息中内容相同的识别项所对应的关系类型,确定所述两个用户的关系,使得所述两个用户关系的建立更为准确、真实,解决了现有网络中用户关系无法准确、真实地反映用户实际关系,从而造成网络信息安全性存在较高风险的问题。

Description

一种用户关系的识别方法及设备
技术领域
本申请涉及互联网技术领域,尤其涉及一种用户关系的识别方法及设备。
背景技术
随着互联网技术的不断发展,互联网业务也得到飞速发展,用户可以利用各种互联网网站与同处互联网的另一用户进行商品的买卖以及交友活动等,从而与该用户在互联网网站上建立相应的用户关系,如交易关系、朋友关系等,将现实生活中人与人之间的关系扩展到虚拟网络领域。
如用户利用互联网网站进行交友活动时,可以根据自身的爱好、教育水平、所处地区等选择另一用户并与之建立朋友关系,或者是具有真实朋友关系的用户使用在交友网站中的用户账号,相互呼叫建立互联网中的朋友关系。
当用户之间建立用户关系后,可通过该用户关系扩展互联网业务。例如:用户A与用户B网络上是朋友关系,且用户A注册在某一网站服务器中,当用户B也希望注册在该网站服务器时,网站服务器可根据用户A和用户B之间的朋友关系,确定用户B的安全性,允许用户B的注册。
但由于目前互联网网站并没有提供用户身份验证的机制,无法判断各用户所提供的关于自身信息的真假,因此,上述任意两个用户之间朋友关系的建立是没有准确的依据的,可能存在网络上两个用户为朋友关系但现实生活中两者并无关系的情况,也就是说,用户在网络上的关系信息并不能反映实际中用户的关系,当网站服务器或第三方机构利用网络上用户之间的关系进行相应的互联网业务时,可能会存在由于用户关系的真实度欠缺所造成的网络信息安全性存在风险的问题。
因此,如果能找到一种能够准确反映用户实际关系的用户关系识别方案,识别出具有真实关系的用户之间在互联网上的用户关系,则可以将所述识别出的互联网中的用户关系应用在需要较高网络信息安全性的互联网业务中,如第三方机构利用所述识别出的互联网中的用户关系,有效地分析、跟踪用户行为,得到对该用户较为准确的评价,从而进行相应的互联网业务,如贷款调查等。
发明内容
本申请的目的在于:提供一种用户关系的识别方法及设备,用以解决现有网络中用户关系无法准确、真实地反映用户实际关系,从而造成网络信息安全性存在风险的问题。
一种用户关系的识别方法,包括:
识别设备分别采集各用户的识别信息,所述识别信息中包含预先设定的N个识别项,所述N为正整数;
针对任意两个用户,所述识别设备判断所述两个用户的识别信息中是否具备内容相同的识别项,若是,则识别设备根据预先设定的识别项和关系类型的对应关系,确定所述内容相同的识别项对应的第一关系类型,并根据该第一关系类型确定所述两个用户的关系。
一种用户关系的识别方法,包括:
识别设备分别采集各用户的识别信息,所述识别信息中包含预先设定的N个识别项,且根据识别项所表示的用户之间的相关性,为所述N个识别项分别设定权重值,所述N为正整数;
针对任意两个用户,所述识别设备判断所述两个用户的识别信息中是否具备内容相同的识别项,若是,则识别设备根据所述内容相同的识别项的权重值,确定所述两个用户之间的关系值;
识别设备根据关系值区间与关系类型的对应关系,确定该关系值所在的关系值区间对应的第二关系类型,并根据该第二关系类型确定所述两个用户的关系。
一种用户关系的识别设备,包括:
数据采集模块,用于采集各用户的识别信息,所述识别信息中包含预先设定的N个识别项,所述N为正整数;
关系识别模块,用于针对任意两个用户,判断所述两个用户的识别信息中是否具备内容相同的识别项,若是,则根据预先设定的识别项和关系类型的对应关系,确定所述内容相同的识别项对应的第一关系类型,并根据该第一关系类型确定所述两个用户的关系。
一种用户关系的识别设备,包括:
数据采集模块,用于采集各用户的识别信息,所述识别信息中包含预先设定的N个识别项,所述N为正整数;
权重分配模块,用于根据识别项所表示的用户之间的相关性,为所述N个识别项分别设定权重值;
关系识别模块,用于针对任意两个用户,判断所述两个用户的识别信息中是否具备内容相同的识别项,若是,则根据所述内容相同的识别项的权重值,确定所述两个用户之间的关系值,根据关系值区间与关系类型的对应关系,确定该关系值所在的关系值区间对应的第二关系类型,并根据该第二关系类型确定所述两个用户的关系。
本申请的有益效果如下:
本申请实施例提供了一种用户关系的识别方法及设备,识别设备采集各用户的识别信息,所述识别信息中包含预先设定的若干个识别项,针对任意两个用户,所述识别设备根据所述两个用户的识别信息中内容相同的识别项所对应的关系类型,确定所述两个用户的关系,使得所述两个用户关系的建立更为准确、真实,解决了现有网络中用户关系无法准确、真实地反映用户实际关系,从而造成网络信息安全性存在较高风险的问题。
附图说明
图1所示为本申请实施例一中用户关系的识别方法流程示意图;
图2所示为用户A的多维网状关系示意图;
图3所示为本申请实施例二中用户关系的识别方法流程示意图;
图4所示为本申请实施例三中用户关系的识别设备结构示意图;
图5所示为本申请实施例四中用户关系的识别设备结构示意图。
具体实施方式
为实现本申请目的,本申请实施例提出了一种用户关系的识别方法及设备,识别设备采集各用户的识别信息,由于针对每个用户的识别信息中包含预先设定的N个识别项,因此,所述识别设备可以针对任意两个用户,判断这两个用户的识别信息中是否具备内容相同的识别项,若是,则根据这两个用户相同的识别项,最终确定这两个用户的关系,通过本申请的用户关系识别方案,使得任意两个用户之间的关系建立得更为准确、真实,避免了网络信息安全的高风险问题。
下面结合说明书附图对本申请实施例的方案进行详细描述。
实施例一
如图1所示,为本申请实施例一中用户关系的识别方法流程示意图,所述识别方法包括以下步骤:
步骤101:识别设备分别采集各用户的识别信息,所述识别信息中包含预先设定的N个识别项,所述N为正整数。
所述用户可以为在互联网网站上进行用户账号注册、从而进行相应互联网业务行为的个人、企业或组织等。
具体地,所述识别设备至少可以通过以下两种方式来采集各用户的识别信息:
(1)采用主动挖掘的方式。
识别设备通过用户注册或登录互联网网站时,在网站服务器中存储的字段,主动搜索并采集与各个字段匹配、相似的信息。
例如,可以在用户登录相应网站时,采集登录时所使用的IP地址或者MAC信息等,再例如,还可以采集该用户在该网站内的用户账号信息,如登录ID,采集的所述IP地址、MAC信息、登录ID与该用户的用户账号信息相关联,成为该用户的识别信息。
(2)采用定时更新的方式。
识别设备通过与各个识别信息渠道建立更新机制,实时监测记录了多种渠道产生的识别信息的数据库,当某一数据库中保存的识别信息发生变化时,则可通过API接口、文件包等形式,同步获取更新后的识别信息。
例如,实时监测交易平台的数据库,当某一用户在该交易平台上进行了一次交易,则在该数据库中将更新该用户的交易信息,此时,可通过数据库的接口,同步获取数据库中该用户更新后的交易信息。所述交易信息包括:买家用户标识、卖家用户标识、交易标的物、交易金额、交易时间等与一次交易过程相关的明细。
所述识别信息渠道包括但不限于:可以实现用户间业务交易的电子商务平台;银行网银系统、企业征信系统、个人征信系统等第三方网站或平台;即时聊天工具、在线交易软件;工商单位、民事单位、司法单位等各种政府、民间机构等。
所述识别信息是用于识别用户的信息,包含一个或多个识别项。针对个人用户,所述识别信息可以为身份证号码、姓名、登录ID、聊天ID、电子邮箱、家庭电话、交易信息、担保信息、借贷信息等,其中身份证号码、登录账号等即为识别信息中的识别项。
针对企业用户,所述识别信息可以为机构代码、企业名称、企业类型、客户资源、企业邮箱、企业地址等。
在进行识别信息的采集之前,识别设备可预先设定一个或多个用于进行用户分析的识别项,这样做的目的为:由于表示用户的识别信息可以有多种,若针对所有的识别项来进行用户分析的话,可能会使得分析的数据量过大,同时也不一定利于用户关系的识别,因此,可以从大量的识别项中选择部分比较有代表性的识别项,一方面可以减少分析的数据量,另一方面,这种精准的分析也能够提高用户关系确定的准确性。
例如:识别设备可按照表1所示,预先设定多个识别项的列表,并将采集的识别信息与所述列表中的各识别项进行匹配,得到可用于进行关系分析的标准格式的识别信息。
表1
假设采集的个人用户A的识别信息为:姓名、家庭电话、交易信息、登录ID、MAC地址,可得到该用户A的识别信息如表2所示:
表2
识别设备采集的识别信息中并不一定包含预先设定的所有N个识别项,也就是说,若将预设的N个识别项以表1的形式设置,针对每次采集的用户的识别信息,将识别信息中的内容填充至表1所示的数据表中时,可能存在某些识别项中有内容,某些识别项中内容为空的情况,如表2所示。
当针对某次采集的用户的识别信息,不包含表1所示的某些识别项的内容,即出现表2所示的某些识别项为空的情况时,识别设备可以采取主动获取的方式或定时更新的方式,重复多次采集该用户的识别信息,以期使采集的识别信息中尽可能地包含所述N个识别项的内容,使得表2所示的识别信息达到相对完整的状态。
需要说明的是,由于识别信息是从不同的识别信息渠道采集获得,可能出现针对同一用户的相同名称的识别项出现不同内容的情况,例如:通过第一渠道的数据库采集到用户A的家庭电话与通过第二渠道的数据库采集到的用户A的家庭电话不同的情况,本实施例包括但不限于以下两种做法:
第一种做法:识别设备根据识别信息采集的来源不同,为不同来源的识别信息分配权重,当针对同一用户的相同名称的识别项出现不同内容的情况时,确定不同内容所属来源的权重,保留权重较高的来源提供的内容,同时标明所述识别项内容的渠道来源。
第二种做法:识别设备将不同来源的针对同一识别项的不同的内容,都作为该识别项的内容保留,同时标明所述识别项内容的渠道来源。
在采集到各用户的识别信息后,所述识别设备可将该识别信息以表2所示的数据表的形式存储至数据库中,较优地,可为存储的识别信息分配标识,通过该分配的标识不仅可以从数据库中查询出各用户的识别信息,还可以识别出该用户是个人用户还是企业用户等。例如:针对表2所示的个人用户A的识别信息分配的标识可为A_001,其中,A表示对应的识别信息是个人用户的识别信息,001为个人用户中的识别信息的序列号。再例如,针对某一企业用户的识别信息分配的标识可为B_001,其中,B表示对应的识别信息是企业用户的识别信息,001为企业用户中的识别信息的序列号。
另外,为了使本申请中采集的识别信息能够方便地进行数据库存储并进行分析,采集的识别信息中各识别项的指代需一致。例如:针对表1中名称为姓名的识别项,不论从何处采集的识别信息,针对姓名这一识别项,其内容都应当表示用户的姓名。
需要说明的是,在本步骤101中,由于各用户在不同互联网网站或平台已注册的用户账号可能有多个,且所述同一用户的多个用户账号可能并不相同,因此,识别设备在进行用户的识别信息的采集时,可以先确定同一用户所注册的各个用户账号,具体可以采用以下步骤来确定各个用户账号是否为同一用户所注册:
步骤一:识别设备采集各用户账号的识别信息,所述识别信息中包含设定的关键字段和模型字段。
所述关键字段表示能够唯一或是接近唯一地识别用户账号信息注册者的身份的识别信息,例如,针对个人用户,关键字段的名称可以为身份证号码、护照号码等,针对身份证号码这一关键字段,其内容可以为用户在注册用户账号时填写的身份证号码。
所述模型字段为识别信息中的非关键字段,例如,针对个人用户,模型字段的名称可以为性别、出生日期、国籍、电子邮箱、教育水平,针对出生日期这一模型字段,其内容可以为用户在注册用户账号时填写的出生日期。
步骤二:针对任意两个用户账号的识别信息,所述识别设备判断所述两个用户账号的识别信息中是否有至少一个关键字段的内容相同;若是,则确定该两个用户账号是由同一用户注册的;否则,确定识别信息中的模型字段的内容相似度,判断所述两个用户账号的识别信息中的模型字段的内容相似度是否达到设定条件,若是,则确定该两个用户账号是由同一用户注册的,否则,确定该两个用户账号是由不同用户注册的。
具体地,所述识别设备确定识别信息中的模型字段的内容相似度包括以下方法:
方法一:
识别设备确定各模型字段的权重值,分别将两个用户账号的识别信息中名称相同的模型字段的内容进行相似度运算,并将各运算结果与对应的模型字段的权重值进行加权求和,得到模型字段的内容相似度。
方法二:
识别设备确定识别信息中的注册信息、从第三方获取的信息和用户账号运行时产生的信息的权重值,分别将两个用户账号的识别信息中名称相同的模型字段的内容进行相似度运算,并确定进行相似度运算的内容所属信息的权重值;将各运算结果与进行相似度运算的内容所属信息的权重值进行加权求和,得到模型字段的内容相似度。
识别设备通过上述步骤识别出同一用户所注册的多个用户账号后,可以按照该用户所对应的多个用户账号来进行所述用户识别信息的采集,确保针对每一用户所采集到的识别信息更加全面。
另外,所述识别设备也可以将不同互联网网站或平台上已注册的各用户账号看成是与用户为一一对应关系,即一个用户账号代表一个用户。
步骤102:识别设备设定用户的识别信息中识别项和关系类型的对应关系。
具体地,所述识别设备可以通过以下方式设定所述识别项和关系类型的对应关系:
识别设备将所述N个识别项划分为多组,并为划分后的每一组设定对应的关系类型,其中,每一组内包含至少一个识别项,且任意两组内的识别项至少不完全相同。
具体地,假设预先设定3个识别项,分别为识别项A、识别项B和识别项C,则可将所述识别项划分为7组:组1为识别项A;组2为识别项B;组3为识别项C;组4为识别项A、B;组5为识别项A、C;组6为识别项B、C;组7为识别项A、B、C。
识别设备可为上述7组分别设定对应的关系类型,也可只为其中部分组分别设定对应的关系类型。针对设定了关系类型的组,一组对应一个关系类型,多组可对应同一关系类型。
例如:可将组7设定对应第一维关系,组5设定对应第二维关系,组2设定对应第三维关系。由于组7内的识别项包含组5内的识别项且多于组5内的识别项,因此,第一维关系所表示的用户之间的相关性高于第二维关系所表示的用户之间的相关性;同理,第二维关系所表示的用户之间的相关性高于第三维关系所表示的用户之间的相关性。例如:第一维关系表示两个用户之间的相关性最高,如用户自身;第二维关系表示两个用户之间的相关性较高,但低于第一维关系表示的用户之间的相关性,如家庭成员、朋友等;第三维关系表示两个用户之间的相关性较低,如朋友的朋友、交易伙伴等。
优选地,识别设备可根据识别项所能够反映的用户之间具有的相应关系,进一步设定包含识别项的组对应的关系类型,如家庭成员类型、朋友类型、交易者类型等。
例如:若识别项A、B、C分别是反映用户之间交易的信息,如:交易平台ID、交易时间、交易标的物、交易价格等,则若两个用户的识别信息中,针对反映用户之间交易信息的识别项A、B、C都相同,则可确定这两个用户的关系为交易者,此时,组7(识别项A、B、C)对应的关系类型为交易伙伴类型。
步骤103:针对任意两个未经识别的用户,识别设备判断所述两个用户的识别信息中是否具备内容相同的识别项,若是则进行步骤104,否则进行步骤106。
具体地,可以采用精确匹配或者模糊匹配的方式来逐个比较采集到的所述两个用户的识别信息中名称相同的各识别项的内容是否相同,并以数据表的形式存储内容相同的所述识别项。
步骤104:识别设备根据预先设定的识别项和关系类型的对应关系,确定所述内容相同的识别项对应的第一关系类型,并根据该第一关系类型确定所述两个用户的关系。
具体地,识别设备可以通过以下步骤确定内容相同的识别项对应的第一关系类型:
第一步:识别设备根据步骤103中确定的内容相同的识别项,从步骤102中划分的多个组中选择出至少一组,其中,选择出的组中包含的全部识别项是所述内容相同的识别项中的部分项或全部项。
具体地,假设针对用户A和用户B,确定的所述内容相同的识别项为识别项A和识别项C,仍以步骤102中划分的7个组为例,可选择组5、组1、组3中任意一组或多组。
第二步:识别设备根据为每一组设定的对应关系类型,确定选择出的组对应的关系类型,作为所述内容相同的识别项对应的第一关系类型。
假设在第一步中选择了多组,且多组对应多个关系类型,则可将任一关系类型作为所述第一关系类型;或者,将对应的多个关系类型中,表示关系相关性最高的关系类型作为第一关系类型。
识别设备在确定所述内容相同的识别项对应的第一关系类型后,则可以根据该第一关系类型确定所述两个用户的关系,如上述第二步中,若确定第一关系类型为家庭成员类型,则可确定两个用户的关系为家庭成员。
进一步地,为了更加准确地识别所述两个用户的关系,在本申请实施例一的方案中,识别设备还可以通过以下方式确定两个用户之间的第二关系类型,进而结合第一关系类型确定两个用户之间的最终关系。
具体地,识别设备可以通过以下步骤确定两个用户之间的第二关系类型:
步骤一:识别设备根据识别项所表示的用户之间的相关性,为所述N个识别项分别设定权重值。
具体地,对于表示用户之间的相关性越高的识别项,识别设备为其分配的权重也就越高,较优地,本实施例中可以采用模型算法来确定各识别项的权重值,具体可以采用层次分析模型的方式,通过建立层次结构模型、构造成对比较阵、计算权向量并做一致性检验的步骤来得到各识别项的权重值。
进一步地,识别设备还可以根据采集到的各识别项的渠道来源,按照渠道来源的真实度,调整所述N个识别项的权重值,对于渠道来源真实度越高的识别项,为其分配的权重值也越高。
步骤二:识别设备根据步骤103确定的内容相同的识别项,利用所述识别项的权重值,确定所述两个用户之间的关系值。
具体地,可以将所述内容相同的识别项的权重值进行相加求和,按照权重值之和的大小来确定所述两个用户之间的关系值,例如:权重值之和越大,两个用户之间的关系值越大。
步骤三:识别设备根据关系值区间与关系类型的对应关系,确定该关系值所在的关系值区间对应的第二关系类型。
具体地,识别设备可以按照关系值的高低来设定各关系值所对应的关系类型,如关系值越高,则其对应的关系类型所表示的用户的相关性也越高。
步骤四:识别设备根据确定的所述第一关系类型和所述第二关系类型确定所述两个用户的关系。
具体地,可以将所述第一关系类型和所述第二关系类型均作为确定的所述两个用户的关系,也可以选择其中相关性较低的关系类型作为所述两个用户的最终关系。
步骤105:采用人工干预的方式,对确定的所述两个用户的用户关系进行再次判定。
较优地,为了保证判断结果的可靠性,还可以对步骤104的结果进一步采用人工干预的方式再次进行判定,本实施例的方案也不限于:若人工干预的方式再次判定的结果与步骤104的确定结果不同时,以人工干预的结果为准。
在步骤105中若进行过人工干预操作,则识别设备可以通过日志信息的方式记录人工干预的操作过程以及操作结果。
步骤106:识别设备判断是否还存在两个用户的用户关系没有进行识别,若是,则跳转至步骤103,否则,结束本次用户关系的识别过程。
当识别设备识别出网络中任意两个用户的关系后,可以建立一个针对任一用户的关系网,图2所示即为针对用户A的多维网状关系展示图,对于用户A来说,按照确定的其他用户与用户A的关系相关性的高低,建立了一个针对用户A的三维关系网,处在第一维关系的可以为用户A自身,或者经过用户关系识别确定的与用户A为同一用户的用户,处在第二维关系的可以为与用户A为家庭成员、朋友等关系的用户,处在第三维关系的可以为与用户A的朋友为朋友关系等的用户、与用户A为交易伙伴关系的用户等。
通过本申请实施例一的方案,识别设备可以采用较低的成本、快速采集到各识别信息渠道中更新后的用户的识别信息,降低了大量用户识别信息的获取成本;针对任意两个用户,识别设备根据确定的所述两个用户的识别信息中内容相同的识别项所对应的关系类型,可以识别出任意两个用户之间的关系;利用识别出的所述用户的关系,识别设备可以建立一个针对任一用户的更为准确、真实的用户关系网,并且可以将所述用户的关系网应用在需要较高网络信息安全性的互联网业务中,如第三方机构利用所述用户的关系网,有效地分析、跟踪所述用户的行为,得到对该用户较为准确的评价,从而进行相应的互联网业务,如贷款调查等。
实施例二
在实施例一的方案中,识别设备是根据预先设定的识别项和关系类型的对应关系,来确定两个用户的第一关系类型的,在本实施例二的方案中,提出了根据各识别项的权重值来确定两个用户的第二关系类型的方案,如图3所示,为本实施例二中用户关系的识别方法流程示意图,包括以下步骤:
步骤201:识别设备分别采集各用户的识别信息,所述识别信息中包含N个识别项。
本步骤201与实施例一中的步骤101的方案相同,此处不再赘述。
步骤202:识别设备根据识别项所表示的用户之间的相关性,为所述N个识别项分别设定权重值。
步骤203:针对任意两个未经识别的用户,所述识别设备判断所述两个用户的识别信息中是否具备内容相同的识别项,若是,则执行步骤203,否则,执行步骤207。
本步骤203与实施例一中的步骤103的方案相同,此处不再赘述。
步骤204:识别设备根据确定的内容相同的识别项,利用所述识别项的权重值,确定所述两个用户之间的关系值。
具体地,可以将所述内容相同的识别项的权重值进行相加求和,按照权重值之和的大小来确定所述两个用户之间的关系值,例如:权重值之和越大,两个用户之间的关系值越大。
步骤205:识别设备根据关系值区间与关系类型的对应关系,确定该关系值所在的关系值区间对应的第二关系类型,根据确定的所述第二关系类型确定所述两个用户的关系。
具体地,识别设备可以按照关系值的高低来设定各关系值所对应的关系类型,如关系值越高,则为其设定的对应的关系类型所表示的用户的相关性也越高。
步骤206:采用人工干预的方式,对确定的所述两个用户的用户关系进行再次判定。
本步骤206与实施例一中的步骤105的方案相同,此处不再赘述。
步骤207:识别设备判断是否还存在两个用户的用户关系没有进行识别,若是,则跳转至步骤203,否则,结束本次用户关系的识别过程。
实施例三
如图4所示,为与本申请实施例一属于同一发明构思下的用户关系的识别设备结构示意图,所述用户关系的识别设备包括数据采集模块11和关系识别模块12。
所述数据采集模块11用于采集各用户的识别信息,所述识别信息中包含预先设定的N个识别项,所述N为正整数。
具体地,所述数据采集模块11至少可以通过以下两种方式来采集各用户的识别信息:
(1)采用主动挖掘的方式。
通过用户注册或登录互联网网站时,在网站服务器中存储的字段,主动搜索并采集与各个字段匹配、相似的信息。
例如,可以在用户登录相应网站时,采集登录时所使用的IP地址或者MAC信息等,再例如,还可以采集该用户在该网站内的用户账号信息,如登录ID,采集的所述IP地址、MAC信息、登录ID与该用户的用户账号信息相关联,成为该用户的识别信息。
(2)采用定时更新的方式。
通过与各个识别信息渠道建立更新机制,实时监测记录了多种渠道产生的识别信息的数据库,当某一数据库中保存的识别信息发生变化时,则可通过API接口、文件包等形式,同步获取更新后的识别信息。
例如,实时监测交易平台的数据库,当某一用户在该交易平台上进行了一次交易,则在该数据库中将更新该用户的交易信息,此时,可通过数据库的接口,同步获取数据库中该用户更新后的交易信息。所述交易信息包括:买家用户标识、卖家用户标识、交易标的物、交易金额、交易时间等与一次交易过程相关的明细。
所述识别信息渠道包括但不限于:可以实现用户间业务交易的电子商务平台;银行网银系统、企业征信系统、个人征信系统等第三方网站或平台;即时聊天工具、在线交易软件;工商单位、民事单位、司法单位等各种政府、民间机构等。
所述识别信息是用于识别用户的信息,包含一个或多个识别项。针对个人用户,所述识别信息可以为身份证号码、姓名、登录ID、聊天ID、电子邮箱、家庭电话、交易信息、担保信息、借贷信息等,其中身份证号码、登录账号等即为识别信息中的识别项。
针对企业用户,所述识别信息可以为机构代码、企业名称、企业类型、客户资源、企业邮箱、企业地址等。
所述关系识别模块12用于针对任意两个用户,判断所述两个用户的识别信息中是否具备内容相同的识别项,若是,则根据预先设定的识别项和关系类型的对应关系,确定所述内容相同的识别项对应的第一关系类型,并根据该第一关系类型确定所述两个用户的关系。
具体地,所述用户的识别设备还包括关系对应模块13,所述关系对应模块13用于将所述N个识别项划分为多组,并为划分后的每一组设定对应的关系类型,其中,每一组内包含至少一个识别项,且任意两组内的识别项至少不完全相同。
具体地,所述关系识别模块12用于从划分的多组识别项中选择出至少一组,其中,选择出的组中包含的全部识别项是所述内容相同的识别项中的部分项或全部项,并根据为每一组设定的对应关系类型,确定选择出的组对应的关系类型,作为所述内容相同的识别项对应的第一关系类型,并根据该第一关系类型确定所述两个用户的关系。
优选地,所述用户的识别设备还可以包括权重分配模块14,所述权重分配模块14用于根据识别项所表示的用户之间的相关性,为所述N个识别项分别设定权重值;具体地,对于表示用户之间的相关性越高的识别项,其分配的权重也就越高,较优地,还可以采用模型算法的方式来确定各识别项的权重值,进一步地,还可以根据采集到的各识别项的渠道来源,按照渠道来源的真实度,调整所述N个识别项的权重值,对于渠道来源真实度越高的识别项,为其分配的权重值也越高。
具体地,所述关系识别模块12还用于在针对任意两个用户,判断所述两个用户的识别信息中具备内容相同的识别项后,根据所述内容相同的识别项的权重值,确定所述两个用户之间的关系值,根据关系值区间与关系类型的对应关系,确定该关系值所在的关系值区间对应的第二关系类型,并根据所述第一关系类型和所述第二关系类型确定所述两个用户的关系。
较优地,所述用户关系的识别设备还可以包括数据存储模块15和人工识别模块16。
所述数据存储模块15用于存储数据采集模块11所采集到的各用户的识别信息;较优地,可为存储的识别信息分配标识,通过该分配的标识不仅可以从数据存储模块15中查询出各用户的识别信息,还可以识别出该用户是个人用户还是企业用户等。
所述人工识别模块16用于提供操作界面来接收人工干预信息,利用接收到的人工干预信息对关系识别模块12所得到的识别结果再次进行判定,若人工干预的方式再次判定的结果与关系识别模块12的确定结果不一致时,以人工干预的结果为准。
较优地,当采用人工干预的方式对识别结果再次进行判定时,可以设定多名网络管理员并为其分配唯一编号和相应的权限,同时需要记录各网络管理员操作过程中的MAC地址和IP地址,在本IP段内允许所述网络管理员行使人工干预权限,非本IP段则提示出错,以保证识别信息的安全。
较优地,所述数据存储模块15还用于将确定的任意两个用户的关系识别结果进行存储,如可以采用数据表或关系网等方式进行存储,同时采用日志信息的方式记录人工识别模块16对本地存储的任意两个用户的关系识别结果进行的相应操作结果和操作过程。
较优地,所述数据存储模块15还可以提供用户关系识别结果查询接口和导出接口给其它系统;通过所述查询接口,可以查询识别出的任意两个用户的关系,并可以通过多维关系网展示图的方式来显示。
较优地,所述用户关系的识别设备还可以具有识别结果自学习功能,如:当采用人工干预的方式,将用户关系识别设备识别出的100个A关系均更改为B关系时,则识别设备可以对遇到的下一个类似的关系直接定为B关系。
实施例四
如图5所示,为与本申请实施例二属于同一发明构思下的用户关系的识别设备结构示意图,所述用户关系的识别设备包括数据采集模块11、关系识别模块12和权重分配模块14。
所述数据采集模块11用于采集各用户的识别信息,所述识别信息中包含预先设定的N个识别项,所述N为正整数;所述权重分配模块14用于根据识别项所表示的用户之间的相关性,为所述N个识别项分别设定权重值;所述关系识别模块12用于针对任意两个用户,判断所述两个用户的识别信息中是否具备内容相同的识别项,若是,则根据所述内容相同的识别项的权重值,确定所述两个用户之间的关系值,根据关系值区间与关系类型的对应关系,确定该关系值所在的关系值区间对应的第二关系类型,并根据该第二关系类型确定所述两个用户的关系。
较优地,所述用户关系的识别设备还可以包括数据存储模块15和人工识别模块16。
所述数据存储模块15用于存储数据采集模块11所采集到的各用户的识别信息;较优地,可为存储的识别信息分配标识,通过该分配的标识不仅可以从数据存储模块15中查询出各用户的识别信息,还可以识别出该用户是个人用户还是企业用户等。
所述人工识别模块16用于提供操作界面来接收人工干预信息,利用接收到的人工干预信息对关系识别模块12所得到的识别结果再次进行判定,若人工干预的方式再次判定的结果与关系识别模块12的确定结果不一致时,以人工干预的结果为准。
较优地,所述数据存储模块15还用于将确定的任意两个用户的关系识别结果进行存储,如可以采用数据表或关系网等方式进行存储,同时采用日志信息的方式记录人工识别模块16对本地存储的任意两个用户的关系识别结果进行的相应操作结果和操作过程。
较优地,所述数据存储模块15还可以提供用户关系识别结果查询接口和导出接口给其它系统;通过所述查询接口,可以查询识别出的任意两个用户的关系,并可以通过多维关系网展示图的方式来显示。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (7)

1.一种用户关系的识别方法,其特征在于,包括:
识别设备分别采集各用户的识别信息,所述识别信息中包含预先设定的N个识别项,所述N为正整数;
针对任意两个用户,所述识别设备判断所述两个用户的识别信息中是否具备内容相同的识别项,若是,则识别设备根据预先设定的识别项和关系类型的对应关系,确定所述内容相同的识别项对应的第一关系类型;以及,
识别设备根据识别项所表示的用户之间的相关性,为所述N个识别项分别设定权重值,并根据采集到的各识别项的渠道来源,按照渠道来源的真实度,调整所述N个识别项的权重值;并根据所述内容相同的识别项的权重值,确定所述两个用户之间的关系值,以及根据关系值区间与关系类型的对应关系,确定该关系值所在的关系值区间对应的第二关系类型;
所述识别设备根据所述第一关系类型和所述第二关系类型确定所述两个用户的关系。
2.如权利要求1所述的用户关系的识别方法,其特征在于,所述识别设备通过以下方式设定识别项和关系类型的对应关系:
识别设备将所述N个识别项划分为多组,并为划分后的每一组设定对应的关系类型,其中,每一组内包含至少一个识别项,且任意两组内的识别项至少不完全相同;
确定所述内容相同的识别项对应的第一关系类型,具体包括:
识别设备从划分的多组中选择出至少一组,其中,选择出的组中包含的全部识别项是所述内容相同的识别项中的部分项或全部项;
识别设备根据为每一组设定的对应关系类型,确定选择出的组对应的关系类型,作为所述内容相同的识别项对应的第一关系类型。
3.一种用户关系的识别方法,其特征在于,包括:
识别设备分别采集各用户的识别信息,所述识别信息中包含预先设定的N个识别项,且根据识别项所表示的用户之间的相关性,为所述N个识别项分别设定权重值,并根据采集到的各识别项的渠道来源,按照渠道来源的真实度,调整所述N个识别项的权重值;所述N为正整数;
针对任意两个用户,所述识别设备判断所述两个用户的识别信息中是否具备内容相同的识别项,若是,则识别设备根据所述内容相同的识别项的权重值,确定所述两个用户之间的关系值;
识别设备根据关系值区间与关系类型的对应关系,确定该关系值所在的关系值区间对应的第二关系类型,并根据该第二关系类型确定所述两个用户的关系。
4.一种用户关系的识别设备,其特征在于,包括:
数据采集模块,用于采集各用户的识别信息,所述识别信息中包含预先设定的N个识别项,所述N为正整数;
关系识别模块,用于针对任意两个用户,判断所述两个用户的识别信息中是否具备内容相同的识别项,若是,则根据预先设定的识别项和关系类型的对应关系,确定所述内容相同的识别项对应的第一关系类型;
权重分配模块,用于根据识别项所表示的用户之间的相关性,为所述N个识别项分别设定权重值;并根据采集到的各识别项的渠道来源,按照渠道来源的真实度,调整所述N个识别项的权重值;
所述关系识别模块,还用于针对任意两个用户,在判断所述两个用户的识别信息中具备内容相同的识别项时,根据所述内容相同的识别项的权重值,确定所述两个用户之间的关系值,根据关系值区间与关系类型的对应关系,确定该关系值所在的关系值区间对应的第二关系类型,并根据所述第一关系类型和所述第二关系类型确定所述两个用户的关系。
5.如权利要求4所述的用户关系的识别设备,其特征在于,还包括:
关系对应模块,用于将所述N个识别项划分为多组,并为划分后的每一组设定对应的关系类型,其中,每一组内包含至少一个识别项,且任意两组内的识别项至少不完全相同;
所述关系识别模块,具体用于从划分的多组识别项中选择出至少一组,其中,选择出的组中包含的全部识别项是所述内容相同的识别项中的部分项或全部项,并根据为每一组设定的对应关系类型,确定选择出的组对应的关系类型,作为所述内容相同的识别项对应的第一关系类型,并根据该第一关系类型确定所述两个用户的关系。
6.如权利要求4或5所述的用户关系的识别设备,其特征在于,还包括:
人工识别模块,用于提供操作界面来接收人工干预信息,利用接收到的人工干预信息对关系识别模块所得到的识别结果再次进行判定。
7.一种用户关系的识别设备,其特征在于,包括:
数据采集模块,用于采集各用户的识别信息,所述识别信息中包含预先设定的N个识别项,并根据采集到的各识别项的渠道来源,按照渠道来源的真实度,调整所述N个识别项的权重值;所述N为正整数;
权重分配模块,用于根据识别项所表示的用户之间的相关性,为所述N个识别项分别设定权重值;
关系识别模块,用于针对任意两个用户,判断所述两个用户的识别信息中是否具备内容相同的识别项,若是,则根据所述内容相同的识别项的权重值,确定所述两个用户之间的关系值,根据关系值区间与关系类型的对应关系,确定该关系值所在的关系值区间对应的第二关系类型,并根据该第二关系类型确定所述两个用户的关系。
CN201110412484.7A 2011-12-12 2011-12-12 一种用户关系的识别方法及设备 Active CN103164416B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110412484.7A CN103164416B (zh) 2011-12-12 2011-12-12 一种用户关系的识别方法及设备
HK13109681.0A HK1182469A1 (zh) 2011-12-12 2013-08-20 種用戶關係的識別方法及設備

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110412484.7A CN103164416B (zh) 2011-12-12 2011-12-12 一种用户关系的识别方法及设备

Publications (2)

Publication Number Publication Date
CN103164416A CN103164416A (zh) 2013-06-19
CN103164416B true CN103164416B (zh) 2016-08-03

Family

ID=48587511

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110412484.7A Active CN103164416B (zh) 2011-12-12 2011-12-12 一种用户关系的识别方法及设备

Country Status (2)

Country Link
CN (1) CN103164416B (zh)
HK (1) HK1182469A1 (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104378331B (zh) 2013-08-14 2019-11-29 腾讯科技(北京)有限公司 网络媒介信息的播放及响应处理方法、装置和系统
CN104850567A (zh) * 2014-02-19 2015-08-19 阿里巴巴集团控股有限公司 一种识别网络用户之间关联关系的方法和装置
CN105099729B (zh) * 2014-04-22 2018-07-20 阿里巴巴集团控股有限公司 一种识别用户身份标识的方法和装置
CN104021206A (zh) * 2014-06-19 2014-09-03 江苏威盾网络科技有限公司 一种人联网系统
CN105225116A (zh) * 2014-06-24 2016-01-06 阿里巴巴集团控股有限公司 交易操作的识别方法及服务器
CN105450678B (zh) * 2014-07-09 2018-12-21 阿里巴巴集团控股有限公司 一种信息确认方法及装置
CN105306425B (zh) * 2014-07-15 2020-01-10 腾讯科技(深圳)有限公司 一种对账号归属进行认证的方法及装置
CN105550175B (zh) * 2014-10-28 2019-03-01 阿里巴巴集团控股有限公司 恶意账户识别方法及装置
CN104574038B (zh) * 2014-12-10 2018-11-23 百度在线网络技术(北京)有限公司 关联主体识别及管理方法、装置及设备
CN105740299B (zh) * 2014-12-12 2019-06-21 阿里巴巴集团控股有限公司 识别网络关系的方法、装置及服务器
CN105988998B (zh) * 2015-01-27 2021-02-26 创新先进技术有限公司 关系网络构建方法及装置
CN106570699A (zh) * 2015-10-08 2017-04-19 平安科技(深圳)有限公司 客户联系信息挖掘方法及服务器
CN106570010A (zh) * 2015-10-09 2017-04-19 阿里巴巴集团控股有限公司 识别交互数据中连号用户的方法及装置
CN106682900B (zh) * 2015-11-10 2020-07-31 阿里巴巴集团控股有限公司 一种判断交易是否安全的方法和设备
CN105630978A (zh) * 2015-12-25 2016-06-01 曙光信息产业(北京)有限公司 信息收集方法和装置
CN107135137B (zh) * 2016-02-26 2020-03-27 阿里巴巴集团控股有限公司 网络群组识别方法及装置
CN107180030B (zh) * 2016-03-09 2020-11-17 创新先进技术有限公司 一种网络上的关系数据生成方法及装置
CN105824921A (zh) * 2016-03-16 2016-08-03 广州彩瞳网络技术有限公司 用户社会关系识别装置和方法
CN105978717A (zh) * 2016-05-09 2016-09-28 深圳市永兴元科技有限公司 网络账号识别方法和装置
CN107666404B (zh) * 2016-07-29 2021-04-20 中国电信股份有限公司 宽带网络用户识别方法和装置
CN107679046A (zh) * 2016-08-01 2018-02-09 上海前隆信息科技有限公司 一种欺诈用户的检测方法及装置
CN107728482A (zh) * 2016-08-11 2018-02-23 阿里巴巴集团控股有限公司 控制系统、控制处理方法及装置
CN107800608A (zh) * 2016-09-05 2018-03-13 腾讯科技(深圳)有限公司 一种用户信息的处理方法及装置
CN109389405B (zh) * 2017-08-02 2022-01-11 华为技术有限公司 一种关系校验的方法和装置
CN107908673B (zh) * 2017-10-25 2019-06-25 平安科技(深圳)有限公司 社交平台用户的现实关系匹配方法、装置及可读存储介质
CN109560981A (zh) * 2018-07-04 2019-04-02 蔚来汽车有限公司 确定节点关联度的方法和设备、计算机存储介质
CN109446276B (zh) * 2018-09-19 2024-02-02 平安科技(深圳)有限公司 基于关系数据模型的订单拦截方法、装置、设备及介质
CN109508879B (zh) * 2018-11-09 2023-07-18 创新先进技术有限公司 一种风险的识别方法、装置及设备
CN111324741B (zh) * 2018-12-17 2023-08-18 中国移动通信集团山西有限公司 用户关系识别方法、装置、设备及介质
CN110163714A (zh) * 2019-04-01 2019-08-23 阿里巴巴集团控股有限公司 一种基于相似度算法挖掘隐藏风险商户的方法和装置
CN111241502B (zh) * 2020-01-14 2023-01-17 恩亿科(北京)数据科技有限公司 跨设备的用户识别方法及装置、电子设备、存储介质
CN113793174A (zh) * 2021-09-01 2021-12-14 北京爱笔科技有限公司 数据关联方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101499101A (zh) * 2009-03-10 2009-08-05 腾讯科技(深圳)有限公司 一种社会化网络中特征关系圈的提取方法及装置
CN101510856A (zh) * 2009-03-12 2009-08-19 腾讯科技(深圳)有限公司 一种sns网络中成员关系圈的提取方法和装置
CN102035891A (zh) * 2010-12-17 2011-04-27 百度在线网络技术(北京)有限公司 一种网络交友平台中推荐好友的方法和装置
CN102044009A (zh) * 2009-10-23 2011-05-04 华为技术有限公司 群组推荐方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101499101A (zh) * 2009-03-10 2009-08-05 腾讯科技(深圳)有限公司 一种社会化网络中特征关系圈的提取方法及装置
CN101510856A (zh) * 2009-03-12 2009-08-19 腾讯科技(深圳)有限公司 一种sns网络中成员关系圈的提取方法和装置
CN102044009A (zh) * 2009-10-23 2011-05-04 华为技术有限公司 群组推荐方法和系统
CN102035891A (zh) * 2010-12-17 2011-04-27 百度在线网络技术(北京)有限公司 一种网络交友平台中推荐好友的方法和装置

Also Published As

Publication number Publication date
HK1182469A1 (zh) 2013-11-29
CN103164416A (zh) 2013-06-19

Similar Documents

Publication Publication Date Title
CN103164416B (zh) 一种用户关系的识别方法及设备
US20210329094A1 (en) Discovering signature of electronic social networks
US10812354B2 (en) Parallel computational framework and application server for determining path connectivity
CN103118043B (zh) 一种用户账号的识别方法及设备
CN102890696B (zh) 基于社交网络的上下文排序
KR20080027237A (ko) 사회망에서 사용자들의 일치성 점수화
CN103678659A (zh) 一种基于随机森林算法的电子商务网站欺诈用户识别方法及系统
CN107580022A (zh) 一种数据共享系统和方法
CN109214784A (zh) 一种消防检查管理的方法、客户端、服务器与系统
CN108833453A (zh) 一种确定应用账号的方法及设备
CN106251114A (zh) 应用中实现审批的方法和装置
US20150019311A1 (en) Contact importer
CN105160173B (zh) 安全评估方法和装置
CN101465752A (zh) 一种联系人排序方法及系统
CN108932646A (zh) 基于运营商的用户标签验证方法、装置和电子设备
CN110502670A (zh) 基于人工智能的网络社交关系知识图谱生成方法和系统
CN104462305A (zh) 一种数据分析方法和装置
CN101295388A (zh) 一种信用评估方法及系统
CN106470200A (zh) 一种身份验证方法及相关装置
CN109829593B (zh) 目标对象的信用度确定方法、装置、存储介质及电子装置
CN110188291A (zh) 基于代理日志的文档处理
CN109087129A (zh) 用户评价方法、装置及计算机可读存储介质
CN107341645A (zh) 人力资源需求信息处理方法、装置、计算机设备和存储介质
CN115442139B (zh) 一种面向局域网的多层网络拓扑关系构建方法和系统
CN116629599A (zh) 云治理评估方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1182469

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1182469

Country of ref document: HK

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20191210

Address after: P.O. Box 31119, grand exhibition hall, hibiscus street, 802 West Bay Road, Grand Cayman, Cayman Islands

Patentee after: Innovative advanced technology Co., Ltd

Address before: Cayman Islands Grand Cayman capital building, a four storey No. 847 mailbox

Patentee before: Alibaba Group Holding Co., Ltd.