具体实施方式
为了实现本申请的目的,本申请实施例提供了一种基于网络关系数据确定网络关系稳定度、互联网业务推荐方法和设备,获取与第一用户标识相关联的网络关系数据,所述网络关系数据用于表征所述第一用户标识对应的第一用户与至少一个第二用户之间通过互联网平台建立网络联系,所述网络关系数据中包含所述至少一个第二用户标识;根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定所述第一用户在所述互联网平台上的网络关系稳定度,所述网络关系稳定度用于表征所述第一用户出现信用风险的概率,所述网络关系稳定度越高,所述第一用户出现信用风险的概率越低。这样,本申请实施例通过采集与第一用户标识相关联的网络关系数据,对所述第一用户在所述互联网平台上的网络关系稳定度进行估计,借助用户的网络关系稳定度判断用户是否存在信用风险,为后续产生的互联网业务提供安全保障,尤其降低互联网金融业务中出现的欺诈风险。
需要说明的是,本申请实施例所述的互联网业务操作可以是指与互联网有关的业务操作,也可以是指与互联网金融业务有关的业务操作。这里的互联网金融业务可以包括但不限于:点对点(英文:Peer-to-Peer;缩写:P2P)信贷业务、第三方支付(英文:Third-Party Payment)业务。
下面结合说明书附图对本申请作进一步地详细描述。显然,所描述的实施例仅仅是本申请一部份实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
图1为本申请实施例提供的一种基于网络关系数据确定网络关系稳定度的方法的流程示意图。所述方法可以如下所述。
步骤101:获取与第一用户标识相关联的网络关系数据。
其中,所述网络关系数据用于表征所述第一用户标识对应的第一用户与至少一个第二用户之间通过互联网平台建立网络联系,所述网络关系数据中包含所述至少一个第二用户标识。
在步骤101中,随着互联网技术的发展,用户使用互联网的情形越来越多,那么在互联网上留下的痕迹也越来越多,这种痕迹可以被称之为网络数据。在这些痕迹中存在一种网络关系数据,即用户在社交网络中与不同的其他用户建立网络联系的数据。
例如:第一用户在某一个社交网站上与多个其他用户建立好友关系,那么在该社交网站的服务器中存储该第一用户标识与其建立好友关系的其他用户标识之间的对应关系,这种对应关系即可被称为一种网络关系数据。
需要说明的是,网络关系数据除了包含不同的两个用户之间建立好友关系之外,还包含好友关系发生变化的数据等等。从广义来说,网络关系数据可以包含与网络关系相关联的所有数据。
还需要说明的是,本发明实施例中所述的网络关系数据在现实生活中还可以称之为人脉关系数据,那么网络关系架构还可以是指用户的人脉关系架构。
步骤102:根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定所述第一用户在所述互联网平台上的网络关系稳定度。
其中,所述网络关系稳定度用于表征所述第一用户出现信用风险的概率,所述网络关系稳定度越高,所述第一用户出现信用风险的概率越低。
在步骤102中,在获取到与第一用户标识相关联的网络关系数据时,从不同的维度对获取的网络关系数据进行分析,进而确定所述第一用户在所述互联网平台上的网络关系稳定度。
具体地,首先,根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定所述第一用户在所述互联网平台上的网络关系特征。
其中,所述网络关系特征用于表征所述第一用户在所述互联网平台上建立网络联系的状态。
本申请实施例中所记载的维度包括但不限于以下三种维度:第一种维度用于表征所述第一用户的网络关系结构稳定度;第二种维度用于表征与所述第一用户建立强网络关系的第二用户的网络关系结构稳定度;第三种维度用于表征所述第一用户的网络关系结构发生变化。
需要说明的是,上述三种维度的确定方式可以是预先设定的,也可以是根据大量数据分析得到的,这里不做限定。
在从不同的维度对获取的网络关系数据进行分析时,可以分析不同维度内包含的网络关系特征。
具体地,针对用于表征所述第一用户的网络关系结构稳定度,在一个社交网络中,若两个不同的用户A和用户B分别与用户C建立好友关系,那么说明未来的某个时间用户A和用户B也可能建立好友关系,这种方式又被称为三元闭包,如图2所示,为社交网络中形成的三元闭包结构示意图。此外,如果3个以上的用户之间相互建立好友关系,这种好友关系表征了一种网络关系结构的稳定性。这样,通过对第一用户的网络关系数据的分析,可以确定用于表征所述第一用户的网络关系结构稳定度的至少一个第一特征。
即根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定用于表征所述第一用户的网络关系结构稳定度的至少一个第一特征。
其中,所述第一特征包含与所述第一用户建立好友关系的用户个数、所述第一用户与其好友之间建立的连接数、所述第一用户的网络关系结构稳定度中的至少一种。
例如:根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定与所述第一用户建立好友关系的第二用户的用户个数;还可以根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定所述第一用户与其建立好友关系的至少一个第二用户之间建立的连接数;还可以根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,计算所述第一用户的网络关系结构稳定度。
需要说明的是,计算所述第一用户的网络关系结构稳定度的方法可以采用下述方法,也可以采用其他方法,这里不做限定:
在本申请实施例中,利用网络聚类方法计算所述第一用户的网络关系结构稳定度:
其中,RCS为计算得到的所述第一用户的网络关系结构稳定度;N为与所述第一用户建立好友关系的第二用户的个数;M为与所述第一用户的好友建立好友关系的数量。
针对第二维度用于表征与所述第一用户建立强网络关系的第二用户的网络关系结构稳定度,由于在社交网络中,与第一用户建立强网络关系的第二用户的数量越多(或者与第一用户建立强网络关系的第二用户的数量占与第一用户建立好友关系的第二用户的总数量的比例越大),说明与所述第一用户建立强网络关系的第二用户的网络关系结构稳定度越高,基于传递性,也说明所述第一用户在该社交网络中的网络关系结构稳定度越高。
其中,所述强网络关系用于表征在设定时间周期内所述第一用户与所述第二用户之间的网络交互次数大于设定数值。
例如:用户A与用户B建立好友关系、用户A与用户C建立好友关系,用户A在设定时间周期内与用户B之间通过网络交互的次数达到100次;而在相同的时间周期内,用户A与用户C之间通过网络交互的次数低于10次,此时,可以确定用户B属于与用户A建立强网络关系的用户,用户C则不属于与用户A建立强网络关系的用户。
具体地,根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定用于表征与所述第一用户建立强网络关系的第二用户的网络关系结构稳定度的至少一个第二特征。
其中,所述第二特征包含与所述第一用户建立强网络关系的第二用户的个数、与所述第一用户建立强网络关系的第二用户的网络关系结构稳定度的平均值中的至少一种。
针对第三维度用于表征所述第一用户的网络关系结构发生变化,由于第一用户在与多个不同的第二用户建立好友关系之后,随着时间的发展,不同时间周期与第一用户保持联系的用户数量不同,如图3所示,为所述第一用户的网络关系结构发生变化的结构示意图。从图3中可以看出,随着时间周期的延长,与第一用户保持联系的用户数量逐渐减少。
需要说明的是,图3中T1对应的时间长度大于T2对应的时间长度;T2对应的时间长度大于T3对应的时间长度;T3对应的时间长度大于T4对应的时间长度。
借助时间因素考察第一用户的网络关系结构发生变化也能进一步对第一用户的网络关系结构的稳定度进行判断。
具体地,根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定用于表征所述第一用户的网络关系结构发生变化的至少一个第三特征。
其中,所述第三特征包含不同时间周期内与所述第一用户建立网络联系的用户个数、与所述第一用户建立网络联系中联系次数小于设定次数的用户个数中的至少一种。
即在采集到第一用户的网络关系数据之后,按照时间周期,统计在不同时间周期内与所述第一用户建立网络联系(即与第一用户进行一次网络联系)的用户个数,并进一步确定建立网络联系的用户个数占与第一用户建立好友关系的用户总个数的比例。
在本申请的另一个实施例中,在得到不同维度的网络关系特征之后,所述方法还包括:
对得到的网络关系特征进行筛选,选择出对所述第一用户在所述互联网平台上的网络关系稳定度贡献比较大的网络关系特征。
需要说明的是,这里的贡献比较大的网络关系特征可以理解为最能表征所述第一用户在所述互联网平台上的网络关系稳定度的网络关系特征。
在本申请实施例中用来衡量贡献大小的参数可以为信息值,即网络关系特征对于网络关系稳定度的影响程度值。
具体地,在本申请实施例中计算每一个网络关系特征的信息值的方式可以采用以下方式:
第一步,采取样本。
这里采集的样本包含正样本(即网络关系稳定度高的用户信息)和负样本(即网络关系稳定度低的用户信息)。
例如:正样本可以包含互联网金融业务中信用风险较低的用户信息;负样本可以包含互联网金融业务中信用风险较高的用户信息。
第二步,对得到的每一种网络关系特征进行离散处理。
具体地,采用等频区间、或者等宽区间的方式对每一种网络关系特征进行离散处理。在离散处理的过程中,采用卡方分析方法判断离散得到的区间是否需要合并。
这里的卡方分析的基本思路是对于精确的离散化,一个区间内的类分布应该完全一致,这样,如果相邻区间具有相似的类分布,那么将相邻区间合并为一个区间。离散处理的具体步骤包括:
根据离散处理的目标网络关系特征,对每一个样本进行取值,使得每一个样本属于一个区间;计算每一组相邻区间的卡方值,将卡方值最小的一组相邻区间合并。在合并后的区间个数符合预先设定的区间个数时,离散处理结束。
这里计算每一组相邻区间的卡方值可以为:
其中,m=2,表示每一次计算的相邻两个区间;k=2,表示样本类型的数量,即正样本和负样本;Aij表示第i区间内第j类样本的样本点数量;Eij表示Aij的期望频率,具体计算可以表示为:
需要说明的是,本申请实施例中所述设定的区间个数可以根据需要确定,例如:5个。
第三步,计算每一个网络关系特征在离散处理后得到的每一个区间的权重值。
这里的权重值表征每一个网络关系特征的每一个区间对所述第一用户的网络关系稳定度的影响大小值。
假设针对每一个网络关系特征得到的区间为5个,那么针对每一个区间计算得到的权重值可以表示为:
WOE(j)=In(P0j/P1j);
其中,WOE(j)表示为第j个区间的权重值,P1j表示第j个区间内负样本点数与总负样本数的比值,P0j表示第j个区间内正样本点数与总正样本数的比值。
第四步,利用网络关系特征矩阵以及每一个网络关系特征的信息值,筛选出对所述第一用户在所述互联网平台上的网络关系稳定度贡献比较大的网络关系特征。
具体地,利用以下方式计算得到每一个网络关系特征的信息值:
其中,IV表示为一种网络关系特征的信息值。
在计算得到每一个网络关系特征的信息值时,选择信息大于设定门限值的网络关系特征作为对所述第一用户在所述互联网平台上的网络关系稳定度贡献比较大的网络关系特征。
其次,根据所述网络关系特征,计算得到所述第一用户在所述互联网平台上的网络关系稳定度指数。
具体地,根据确定的所述至少一个第一特征、所述至少一个第二特征以及所述至少一个第三特征,基于逻辑回归模型,计算得到所述第一用户在所述互联网平台上的网络关系稳定度指数。
例如:假设确定的网络关系特征个数为9个,那么利用以下方式计算得到所述第一用户在所述互联网平台上的网络关系稳定度指数:
其中,SCORE表示得到所述第一用户在所述互联网平台上的网络关系稳定度指数,θ0至θ9表示逻辑回归系数。
其中,逻辑回归系统可以通过训练样本集和极大似然估计计算得到。
最后,利用所述网络关系稳定度指数,确定所述第一用户在互联网平台上的网络关系稳定度。
具体地,在计算得到第一用户的网络关系稳定度指数之后,可以确定所述网络关系稳定度指数越高,说明所述第一用户在互联网平台上的网络关系稳定度越高,那么第一用户信用风险越低;反之,说明第一用户信用风险越高。
通过本申请实施例的技术方案,获取与第一用户标识相关联的网络关系数据,所述网络关系数据用于表征所述第一用户标识对应的第一用户与至少一个第二用户之间通过互联网平台建立网络联系,所述网络关系数据中包含所述至少一个第二用户标识;根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定所述第一用户在所述互联网平台上的网络关系稳定度,所述网络关系稳定度用于表征所述第一用户出现信用风险的概率,所述网络关系稳定度越高,所述第一用户出现信用风险的概率越低。这样,本申请实施例通过采集与第一用户标识相关联的网络关系数据,对所述第一用户在所述互联网平台上的网络关系稳定度进行估计,借助用户的网络关系稳定度判断用户是否存在信用风险,为后续产生的互联网业务提供安全保障,尤其降低互联网金融业务中出现的欺诈风险。
图4为本申请实施例提供的一种互联网业务推荐方法的流程示意图。所述方法可以如下所示。
步骤401:确定第一用户在互联网平台上的网络关系稳定度。
其中,所述网络关系稳定度用于表征所述第一用户出现信用风险的概率,所述网络关系稳定度越高,所述第一用户出现信用风险的概率越低。
需要说明的是,本申请实施例中确定网络关系稳定度的方式可以采用图1中所示的方式进行,也可以采用其他方式,这里不做限定。
步骤402:根据网络关系稳定度与互联网业务类型之间的对应关系,确定与所述第一用户的网络关系稳定度对应的互联网业务类型。
在步骤402中,为了降低互联网业务的违约风险,为不同互联网业务确定网络关系稳定度,这样可以根据计算出的第一用户的网络关系稳定度,为该第一用户确定相匹配的互联网业务。
步骤403:将确定的所述互联网业务类型中包含的至少一种互联网业务推荐给所述第一用户。
需要说明的是,本申请实施例中所述的互联网业务不仅限于互联网金融业务。对于本申请实施例提供的确定网络关系稳定度的使用也不限于互联网业务推荐,还可以涉及到其他方面,这里不做一一详细描述。
图5为本申请实施例提供的一种确定网络关系稳定度的设备的结构示意图。所述设备包括:获取单元51和确定单元52,其中:
获取单元51,用于获取与第一用户标识相关联的网络关系数据,其中,所述网络关系数据用于表征所述第一用户标识对应的第一用户与至少一个第二用户之间通过互联网平台建立网络联系,所述网络关系数据中包含所述至少一个第二用户标识;
确定单元52,用于根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定所述第一用户在所述互联网平台上的网络关系稳定度,其中,所述网络关系稳定度用于表征所述第一用户出现信用风险的概率,所述网络关系稳定度越高,所述第一用户出现信用风险的概率越低。
具体地,所述确定单元51,具体用于根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定所述第一用户在所述互联网平台上的网络关系特征,其中,所述网络关系特征用于表征所述第一用户在所述互联网平台上建立网络联系的状态;
根据所述网络关系特征,计算得到所述第一用户在所述互联网平台上的网络关系稳定度指数;
利用所述网络关系稳定度指数,确定所述第一用户在互联网平台上的网络关系稳定度。
具体地,所述确定单元51根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定所述第一用户在所述互联网平台上的网络关系特征,具体包括:
根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定用于表征所述第一用户的网络关系结构稳定度的至少一个第一特征,其中,所述第一特征包含与所述第一用户建立好友关系的用户个数、所述第一用户与其好友之间建立的连接数、所述第一用户的网络关系结构稳定度中的至少一种。
具体地,所述确定单元51根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定所述第一用户在所述互联网平台上的网络关系特征,具体包括:
根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定用于表征与所述第一用户建立强网络关系的第二用户的网络关系结构稳定度的至少一个第二特征,其中,所述强网络关系用于表征在设定时间周期内所述第一用户与所述第二用户之间的网络交互次数大于设定数值,所述第二特征包含与所述第一用户建立强网络关系的第二用户的个数、与所述第一用户建立强网络关系的第二用户的网络关系结构稳定度的平均值中的至少一种。
具体地,所述确定单元51根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定所述第一用户在所述互联网平台上的网络关系特征,具体包括:
根据采集到的所述网络关系数据中包含的所述至少一个第二用户标识,确定用于表征所述第一用户的网络关系结构发生变化的至少一个第三特征,其中,所述第三特征包含不同时间周期内与所述第一用户建立网络联系的用户个数、与所述第一用户建立网络联系中联系次数小于设定次数的用户个数中的至少一种。
具体地,所述确定单元51根据所述网络关系特征,计算得到所述第一用户在所述互联网平台上的网络关系稳定度指数,具体包括:
根据确定的所述至少一个第一特征、所述至少一个第二特征以及所述至少一个第三特征,基于逻辑回归模型,计算得到所述第一用户在所述互联网平台上的网络关系稳定度指数。
需要说明的是,本申请实施例中提供的设备可以采用计算机硬件的方式实现,也可以采用软件方式实现,这里不做限定。
图6为本申请实施例提供的一种互联网业务推荐设备的结构示意图。所述设备包括:确定单元61和推荐单元62,其中:
确定单元61,用于确定第一用户在互联网平台上的网络关系稳定度,其中,所述网络关系稳定度用于表征所述第一用户出现信用风险的概率,所述网络关系稳定度越高,所述第一用户出现信用风险的概率越低;
推荐单元62,用于根据网络关系稳定度与互联网业务类型之间的对应关系,确定与所述第一用户的网络关系稳定度对应的互联网业务类型;并将确定的所述互联网业务类型中包含的至少一种互联网业务推荐给所述第一用户。
需要说明的是,本申请实施例中提供的设备可以采用计算机硬件的方式实现,也可以采用软件方式实现,这里不做限定。
本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。这样,倘若本申请的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。