CN110009216A

CN110009216A - 信用风险用户识别方法及装置

Info

Publication number: CN110009216A
Application number: CN201910243085.9A
Authority: CN
Inventors: 方精丽; 方彦明; 钟娙雩; 赵凤; 贾全慧
Original assignee: Alibaba Group Holding Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2019-03-28
Filing date: 2019-03-28
Publication date: 2019-07-12

Abstract

本公开提供一种用于识别信用风险用户的方法及装置。在该方法中，基于若干用户的网络关联关系数据，构建用户关系图，所述用户关系图用于表示所述若干用户之间的关联关系。对用户关系图执行社区发现，以找出至少一个用户社区。基于至少一个用户社区的至少一个信用风险指标，从至少一个用户社区中确定出高信用风险用户社区。然后，将高信用风险用户社区中的用户识别为信用风险用户。利用该方法，能够高效地识别信用风险用户。

Description

信用风险用户识别方法及装置

技术领域

本公开通常涉及计算机技术领域，更具体地，涉及用于识别信用风险用户的方法及装置。

背景技术

随着社会的快速发展，“信用”已经悄无声息地渗透到人们的生活当中，成为人们的无形财产。在实际生活中，一旦用户发生信用风险，比如用户因种种原因不愿或无力履行交易合同条件而构成违约所造成的信用风险，则会使得与该用户进行交易的交易方遭受损失。因此，在信息爆炸时代，如何识别信用风险用户就变得至关重要。

发明内容

鉴于上述，本公开提供了一种信用风险用户识别方法及装置。利用该信用风险用户识别方法及装置，能够高效地识别信用风险用户。

根据本公开的一个方面，提供了一种用于识别信用风险用户的方法，包括：基于若干用户的网络关联关系数据，构建用户关系图，所述用户关系图用于表示所述若干用户之间的关联关系；对所述用户关系图执行社区发现，以找出至少一个用户社区；基于所述至少一个用户社区的至少一个信用风险指标，从所述至少一个用户社区中确定出高信用风险用户社区；以及将所述高信用风险用户社区中的用户识别为信用风险用户。

可选地，在上述方面的一个示例中，所述若干用户的网络关联关系数据包括下述网络关联关系数据中的至少一种：若干用户的经由社交网络生成的社交关系数据；若干用户的经由各种媒介网络生成的关系数据；和若干用户的用户网络行为轨迹数据。

可选地，在上述方面的一个示例中，在所述若干用户的网络关联关系数据包括多种网络关联关系数据的情况下，基于若干用户的网络关联关系数据，构建所述用户关系图包括：基于若干用户的各种网络关联关系数据，确定所述若干用户之间的对应关联关系；对所确定出的所述若干用户之间的对应关联关系进行组合；以及基于组合后的所述若干用户之间的关联关系，构建所述用户关系图。

可选地，在上述方面的一个示例中，对所确定出的所述若干用户之间的对应关联关系进行组合包括：对所得到的各种关联关系进行归一化处理；以及对经过归一化处理后的各种关联关系进行组合。

可选地，在上述方面的一个示例中，所述若干用户的网络关联关系数据是时序关联关系数据，以及所述网络关联关系数据具有随时间增加而降低的权重。

可选地，在上述方面的一个示例中，所述方法还可以包括：从所构建的用户关系图中去除与信用风险用户无关联的用户所对应的用户关系，以得到信用风险用户关系网，以及对所述用户关系图执行社区发现，以找出至少一个用户社区包括：对所述信用风险用户关系图执行社区发现，以找出至少一个用户社区。

可选地，在上述方面的一个示例中，在所述至少一个信用风险指标包括与多个信用风险相关的信用风险指标时，所述多个信用风险是同质的信用风险。

可选地，在上述方面的一个示例中，基于所述至少一个用户社区的至少一个信用风险指标，从所述至少一个用户社区中确定出高信用风险用户社区可以包括：基于所述至少一个用户社区的至少一个信用风险指标来对所述至少一个用户社区进行信用风险评分；以及将所述至少一个用户社区中的信用风险评分超过预定阈值的用户社区，确定为高信用风险用户社区。

根据本公开的另一方面，提供一种用于识别信用风险用户的装置，包括：用户关系图构建单元，被配置为基于若干用户的网络关联关系数据，构建用户关系图，所述用户关系图用于表示所述若干用户之间的关联关系；社区发现单元，被配置为对所述用户关系图执行社区发现，以找出至少一个用户社区；高风险用户社区确定单元，被配置为基于所述至少一个用户社区的至少一个信用风险指标，从所述至少一个用户社区中确定出高信用风险用户社区；以及信用风险用户识别单元，被配置为将所述高信用风险用户社区中的用户识别为信用风险用户。

可选地，在上述方面的一个示例中，在所述若干用户的网络关联关系数据包括多种网络关联关系数据的情况下，所述用户关系图构建单元包括：关联关系确定模块，被配置为基于若干用户的各种网络关联关系数据，确定所述若干用户之间的对应关联关系；组合模块，被配置为对所确定出的所述若干用户之间的对应关联关系进行组合；以及用户关系图构建模块，被配置为基于组合后的所述若干用户之间的关联关系，构建所述用户关系图。

可选地，在上述方面的一个示例中，所述组合模块被配置为：对所得到的各种关联关系进行归一化处理；以及对经过归一化处理后的各种关联关系进行组合。

可选地，在上述方面的一个示例中，所述装置还可以包括：用户关系去除单元，被配置为从所构建的用户关系图中去除与信用风险用户无关联的用户所对应的用户关系，以得到信用风险用户关系网，以及所述社区发现单元被配置为：对所述信用风险用户关系图执行社区发现，以找出至少一个用户社区。

可选地，在上述方面的一个示例中，所述高风险用户社区确定单元包括：信用风险评分模块，被配置为基于所述至少一个用户社区的至少一个信用风险指标来对所述至少一个用户社区进行信用风险评分；以及高风险用户社区确定模块，被配置为将所述至少一个用户社区中的信用风险评分超过预定阈值的用户社区，确定为高信用风险用户社区。

根据本公开的另一方面，提供一种计算设备，包括：至少一个处理器，以及与所述至少一个处理器耦合的存储器，所述存储器存储指令，当所述指令被所述至少一个处理器执行时，使得所述至少一个处理器执行如上所述的用于识别信用风险用户的方法。

根据本公开的另一方面，提供一种非暂时性机器可读存储介质，其存储有可执行指令，所述指令当被执行时使得所述机器执行如上所述的用于识别信用风险用户的方法。

附图说明

通过参照下面的附图，可以实现对于本公开内容的本质和优点的进一步理解。在附图中，类似组件或特征可以具有相同的附图标记。

图1示出了根据本公开的实施例的用于识别信用风险用户的方法的流程图；

图2示出了在用户的网络关联关系数据包括多种网络关联关系数据的情况下的用户关系图构建过程的示例的流程图；

图3示出了根据本公开的实施例的高风险信用用户社区确定过程的一个示例的流程图；

图4示出了根据本公开的实施例的用户关系图去除过程的一个示例的示意图；

图5示出了根据本公开的实施例的信用风险用户识别装置的方框图；

图6示出了根据本公开的实施例的用户关系图构建单元的一个示例的方框图；

图7示出了根据本公开的实施例的高风险用户社区确定单元的一个示例的方框图；

图8示出了根据本公开的实施例的用于信用风险用户识别的计算设备的方框图。

具体实施方式

现在将参考示例实施方式讨论本文描述的主题。应该理解，讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题，并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本公开内容的保护范围的情况下，对所讨论的元素的功能和排列进行改变。各个示例可以根据需要，省略、替代或者添加各种过程或组件。例如，所描述的方法可以按照与所描述的顺序不同的顺序来执行，以及各个步骤可以被添加、省略或者组合。另外，相对一些示例所描述的特征在其它例子中也可以进行组合。

如本文中使用的，术语“包括”及其变型表示开放的术语，含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义，无论是明确的还是隐含的。除非上下文中明确地指明，否则一个术语的定义在整个说明书中是一致的。

在实际生活中，由于批量的信用风险需要一定的技术手段、经验知识和特有的渠道，从而使得批量的信用风险用户往往并不是独立存在，而是很多人聚集在一个真实或者虚拟的群体中，例如QQ群、微信群或者以薅羊毛中介为中心的虚拟群等，并且在群体中共享信息，由此使得信用风险用户在网络关系上通常具有一定的聚集性和时序性。

在本公开所提出的信用风险识别方案中，获取至少一个用户的网络关联关系，并基于至少一个用户的网络关联关系来进行社区聚集，从而找出各个用户社区。然后，评估各个用户社区的信用风险，并且将被评估为高信用风险的用户社区中的用户识别为信用风险用户，从而可以利用信用风险用户在网络关系上呈现出的聚集性来识别信用风险用户群体，进而识别出信用风险用户。

下面将结合附图来详细描述根据本公开的实施例的用于发现风险用户群体的方法及装置。

图1示出了根据本公开的实施例的用于发现风险用户群体的方法的流程图。

如图1所示，在块110，基于若干用户的网络关联关系数据，构建用户关系图，所述用户关系图用于表示若干用户之间的关联关系。

这里，若干用户的网络关联关系数据可以是通过收集该若干用户的网络数据来获取。例如，通过收集规定时间段(例如，近三个月)内的网络数据来获取。所述若干用户的关联关系数据例如可以包括：若干用户的经由社交网络生成的关系数据(下文中称为“社交网络关系数据”)，若干用户的经由各种媒介网络生成的关系数据(下文中称为媒介网络关系数据)，和/或若干用户的用户网络行为轨迹数据。所述媒介网络可以包括LBS网络、WiFi网络等。所述用户网络行为轨迹数据可以包括用户访问网络所使用的网络访问设备信息、用户访问网络所使用的网络IP地址和/或用户访问网络的网络操作行为。网络访问设备信息可以使用网络访问设备的设备唯一标识信息来表示，比如，网络访问设备的国际移动设备识别码(IMEI：International Mobile Equipment Identification Number)或者MAC地址等。网络操作行为可以包括用户在网络上执行的操作行为，比如，用户经常浏览哪些网页、用户经常使用哪些账户购买商品等。

在本公开中，用户关系图用于指示各个用户之间的关联关系。例如，使用关系图R＝(V，E)来表示用户关系图，其中，V是关系图R中的用户集合，以及E是关系图R中的边，用于指示用户之间的关联关系。在用户A和B之间的E存在取值时，说明用户A和B之间存在关联关系，并且E的取值大小用于指示用户A和B之间的关联关系强度值。

在本公开中，在若干用户的网络关联关系数据包括多种网络关联关系数据时，可以为各种网络关联关系数据赋予不同的关联关系强度值，例如，通过对所收集的网络关联关系数据进行统计建模分析，分别为社交关系数据、媒介网络关系数据和用户网络行为轨迹数据确定不同的关联关系强度值。更为具体地，在各种网络关联关系数据具有更为细分的属性数据，可以针对各种网络关联关系数据中的各种属性数据，确定各自对应的关联关系强度值。

此外，在本公开中，所述网络关联关系数据可以是时序关联关系数据，即，网络关联关系数据具有时间属性。相应地，可以为网络关联关系数据设置随时间变化的权重值，该权重值随时间增加而变小，例如，可以是时间衰减因子。例如，假设用户A与B在一周前成为“好友关系”，以及用户A与C在一个月前成为“好友关系”，则用户A与B之间的对应网络关联关系的权重值大于用户A与“C之间的对应网络关联关系的权重值，从而虽然都是经由“好友关系”来建立关联关系，但是用户A与B之间的关联关系强度值大于用户A与C之间的关联关系强度值。

在本公开的一个示例中，在若干用户的网络关联关系数据包括一种网络关联关系数据的情况下，可以基于该种网络关联关系数据来构建用户关系图。在本公开的另一示例中，在若干用户的网络关联关系数据包括多种网络关联关系数据的情况下，需要基于多种网络关联关系数据来构建用户关系图。

图2示出了在用户的网络关联关系数据包括多种网络关联关系数据的情况下的用户关系图构建过程的示例的流程图。

如图2所示，在块111，基于若干用户的各种网络关联关系数据，确定所述若干用户之间的对应关联关系。例如，假设用户的网络关联关系数据包括社交网络关系数据和媒介网络关系数据。针对若干用户中的两个用户A和B，分别基于用户A和B之间的社交网络关系数据和媒介网络关系数据来得到各自对应的关联关系强度值。例如用户A和B之间的社交网络关系数据和媒介网络关系的强度值分别为a、b，通过数据分析出，社交网络关系数据和媒介网络关系对用户A和B之间关系的贡献度分别为w1和w2，那么用户A和B之间的关系强度为(a*w1+b*w2)。如何基于各种网络关联关系数据来得到对应的关联关系强度值，可以参照上面对应部分的描述，在此不再赘述。

接着，在块113，对所确定出的若干用户之间的对应关联关系进行组合。例如，在一个示例中，可以通过对所得到的各个关联关系强度值进行求和来得到组合后的若干用户之间的对应关联关系强度值。或者，在另一示例中，各个网络关联关系数据被分配有各自的权重值。相应地，可以通过对所得到的各个关联关系强度值进行加权求和来得到组合后的若干用户之间的对应关联关系强度值。在另一示例中，在计算组合后的关联关系强度值时，针对各个网络关联关系数据，还可以引入与时间对应的权重值来进行加权处理。

此外，在针对不同网络关联关系数据的关联关系强度值所对应的单位不统一的情况下，还可以先对各个关联关系强度值进行归一化处理，然后基于归一化后的关联关系强度值来得到相应的用户之间的关联关系强度值。

然后，在块115，基于组合后的若干用户之间的关联关系，构建用户关系图。

回到图1，在如上构建出用户关系图后，在块120，对用户关系图执行社区发现，以找出至少一个用户社区。在本公开中，可以使用本领域公知的各种社区发现算法来执行上述社区发现过程，例如，使用比如标签传播聚类算法(Label Propagation Algorithm，LPA)的无监督学习算法来执行上述社区发现过程。

然后，在块130，基于所述至少一个用户社区的至少一个信用风险指标，从至少一个用户社区中确定出高信用风险用户社区。在一个示例中，例如可以通过计算用户社区中的信用风险用户的占比，并且在所计算出的信用风险用户占比超过预定值(例如，50％)时，确定该用户社区为高信用风险用户社区。

图3示出了根据本公开的实施例的高信用风险用户社区确定过程的另一示例的流程图。

如图3所示，在块131，基于至少一个用户社区的至少一个信用风险指标来对至少一个用户社区进行风险评分。例如，可以采用预定的信用风险评分模型来基于各个用户社区的信用风险指标进行风险评分。此外，在至少一个信用风险指标包括多个信用风险指标的情况下，还可以为每个信用风险指标设定权重值，并且基于各个信用风险指标以及对应的权重值来进行风险评分。此外，在所述至少一个信用风险指标包括与多个信用风险相关的信用风险指标时，所述多个信用风险是同质的信用风险。这里，“同质”是指该多个信用风险反映的是同一类型的信用风险。例如，信用风险“贷款逾期”和信用风险“老赖用户”都反映的是欠款不还的信用风险，它们属于同质风险。

然后，在块133，将至少一个用户社区中的信用风险评分超过预定阈值的用户社区，确定为高信用风险用户社区。

回到图1，在如上确定出高信用风险用户社区后，在块140，将高信用风险用户社区中的用户识别为信用风险用户。

如上参照图1到图3描述了根据本公开的实施例的用于识别信用风险用户的方法。这里要说明的是，图1到图3示出的仅仅是根据本公开的用于识别信用风险用户的方法的一个实施例，在本公开的其它实施例中，还可以对图1到图3中示出的用于识别信用风险用户的方法进行修改。

例如，在本公开的另一实施例中，在获得用户关系网后，所述方法还可以包括：从所构建的用户关系图中去除与信用风险用户无关联的用户所对应的用户关系，以得到信用风险用户关系网。然后，对所述信用风险用户关系图执行社区发现，以找出至少一个用户社区。

图4示出了根据本公开的实施例的用户关系图去除过程的一个示例的示意图。在图4中示出的用户关系图中，带阴影的圆圈表示的是具有高信用风险的用户(例如，信用逾期用户)，以及不带阴影的圆圈表示的是正常用户。参考标记401所示出的是基于至少一个用户的网络关联关系数据所构建的用户关系图，以及参考标记402所示出的是经过用户关系去除操作后的信用风险用户关系网。从图4中可以看出，与参考标记401所示出的用户关系图相比，参考标记402所示出的信用风险用户关系网中去掉了用户E和F。

利用根据本公开的用于识别信用风险用户的方法，可以基于用户的网络关联关系数据来构建用户关系图，并基于用户关系图来进行社区发现，从而对至少一个用户进行社区聚集。然后，基于用户社区的信用风险指标来进行高信用风险用户社区判定，并且将判定为该信用风险用户社区的用户社区中的用户识别为信用风险用户，从而可以实现信用风险用户识别。

利用根据本公开的用于识别信用风险用户的方法，通过使用包括社交关系网络数据、媒介关系网络数据和/或用户网络行为轨迹数据的多种网络关联关系数据来构建用户关系图，可以提高用户关系图的准确度，从而提高信用风险用户的识别精度。

此外，利用根据本公开的用于识别信用风险用户的方法，通过从所构建的用户关系图中去除与信用风险用户无关联的用户所对应的用户关系，以得到信用风险用户关系网，然后基于所述信用风险用户关系图来执行社区发现，从而可以降低信用风险用户识别的复杂度，并且提高信用风险用户的识别精度。

此外，利用根据本公开的用于识别信用风险用户的方法，由于网络关联关系数据具有时间属性，从而使得网络关联关系数据所对应的关联关系强度值随流逝时间的增加而降低，由此可以提高时间更新的网络关联关系数据的权重，从而提升信用风险用户的识别精度。

此外，利用根据本公开的用于识别信用风险用户的方法，在进行用户社区信用风险识别时，使用多个信用风险指标来进行风险评估，并且在所述多个信用风险指标包括与多个信用风险相关的信用风险指标时，所述多个信用风险是同质的信用风险，从而可以提高信用风险识别的准确度，进而提升信用风险用户的识别精度，同时不会造成由于非同质信用风险而带来的不利影响。

图5示出了根据本公开的实施例的信用风险用户识别装置500的方框图。如图5所示，信用风险用户识别装置500包括用户关系图构建单元510、社区发现单元520、高风险用户社区确定单元530和信用风险用户识别单元540。

用户关系图构建单元510被配置为基于若干用户的网络关联关系数据，构建用户关系图，所述用户关系图用于表示所述若干用户之间的关联关系。用户关系图构建单元510的操作可以参考上面参照图1描述的块110的操作以及参照图2描述的操作。

社区发现单元520被配置为对用户关系图执行社区发现，以找出至少一个用户社区。社区发现单元520的操作可以参考上面参照图1描述的块120的操作。

高风险用户社区确定单元530被配置为基于至少一个用户社区的至少一个信用风险指标，从至少一个用户社区中确定出高信用风险用户社区。高风险用户社区确定单元530的操作可以参考上面参照图1描述的块130的操作以及参照图3描述的操作。

信用风险用户识别单元540被配置为将高信用风险用户社区中的用户识别为信用风险用户。信用风险用户识别单元540的操作可以参考上面参照图1描述的块140的操作。

在本公开的一个示例中，所述若干用户的网络关联关系数据包括下述网络关联关系数据中的至少一种：若干用户的经由社交网络生成的社交关系数据；若干用户的经由各种媒介网络生成的关系数据；和若干用户的用户网络行为轨迹数据。

图6示出了根据本公开的实施例的用户关系图构建单元510的一个示例的方框图。图6中所示的用户关系图构建单元被配置为在若干用户的网络关联关系数据包括多种网络关联关系数据的情况下执行用户关系图构建。如图6所示，用户关系图构建单元510包括关联关系确定模块511、组合模块513和用户关系图构建模块515。

关联关系确定模块511被配置为基于若干用户的各种网络关联关系数据，确定若干用户之间的对应关联关系。组合模块513被配置为对所确定出的若干用户之间的对应关联关系进行组合。例如，在一个示例中，组合模块513可以被配置为：对所得到的各种关联关系进行归一化处理；以及对经过归一化处理后的各种关联关系进行组合。然后，用户关系图构建模块515基于组合后的若干用户之间的关联关系，构建所述用户关系图。

图7示出了根据本公开的实施例的高风险用户社区确定单元530的一个示例的方框图。如图7所示，高风险用户社区确定单元530包括信用风险评分模块531和高风险用户社区确定模块533。

信用风险评分模块531被配置为基于所述至少一个用户社区的至少一个信用风险指标来对所述至少一个用户社区进行信用风险评分。高风险用户社区确定模块533被配置为将所述至少一个用户社区中的信用风险评分超过预定阈值的用户社区，确定为高信用风险用户社区。

此外，可选地，在本公开的一个示例中，信用风险用户识别装置还可以包括用户关系去除单元(未示出)。所述用户关系去除单元被配置为从所构建的用户关系图中去除与信用风险用户无关联的用户所对应的用户关系，以得到信用风险用户关系网。然后，社区发现单元520对所述信用风险用户关系图执行社区发现，以找出至少一个用户社区。

如上参照图1到图7，对根据本公开的信用风险用户识别方法及信用风险用户识别装置的实施例进行了描述。上面的信用风险用户识别装置可以采用硬件实现，也可以采用软件或者硬件和软件的组合来实现。

图8示出了根据本公开的实施例的用于信用风险用户识别的计算设备800的硬件结构图。如图8所示，计算设备800可以包括至少一个处理器810、存储器820、内存830和通信接口840，并且至少一个处理器810、存储器820、内存830和通信接口840经由总线860连接在一起。至少一个处理器810执行在存储器中存储或编码的至少一个计算机可读指令(即，上述以软件形式实现的元素)。

在一个实施例中，在存储器中存储计算机可执行指令，其当执行时使得至少一个处理器810：基于若干用户的网络关联关系数据，构建用户关系图，所述用户关系图用于表示所述若干用户之间的关联关系；对所述用户关系图执行社区发现，以找出至少一个用户社区；基于所述至少一个用户社区的至少一个信用风险指标，从所述至少一个用户社区中确定出高信用风险用户社区；以及将所述高信用风险用户社区中的用户识别为信用风险用户。

应该理解，在存储器中存储的计算机可执行指令当执行时使得至少一个处理器810进行本公开的各个实施例中以上结合图1-7描述的各种操作和功能。

在本公开中，计算设备800可以包括但不限于：个人计算机、服务器计算机、工作站、桌面型计算机、膝上型计算机、笔记本计算机、移动计算设备、智能电话、平板计算机、蜂窝电话、个人数字助理(PDA)、手持装置、消息收发设备、可佩戴计算设备、消费电子设备等等。

根据一个实施例，提供了一种比如非暂时性机器可读介质的程序产品。非暂时性机器可读介质可以具有指令(即，上述以软件形式实现的元素)，该指令当被机器执行时，使得机器执行本公开的各个实施例中以上结合图1-7描述的各种操作和功能。具体地，可以提供配有可读存储介质的系统或者装置，在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码，且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。

在这种情况下，从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能，因此机器可读代码和存储机器可读代码的可读存储介质构成了本发明的一部分。

可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地，可以由通信网络从服务器计算机上或云上下载程序代码。

本领域技术人员应当理解，上面公开的各个实施例可以在不偏离发明实质的情况下做出各种变形和修改。因此，本发明的保护范围应当由所附的权利要求书来限定。

需要说明的是，上述各流程和各系统结构图中不是所有的步骤和单元都是必须的，可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的，可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构，也可以是逻辑结构，即，有些单元可能由同一物理实体实现，或者，有些单元可能分由多个物理实体实现，或者，可以由多个独立设备中的某些部件共同实现。

以上各实施例中，硬件单元或模块可以通过机械方式或电气方式实现。例如，一个硬件单元、模块或处理器可以包括永久性专用的电路或逻辑(如专门的处理器，FPGA或ASIC)来完成相应操作。硬件单元或处理器还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器)，可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。

上面结合附图阐述的具体实施方式描述了示例性实施例，但并不表示可以实现的或者落入权利要求书的保护范围的所有实施例。在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”，并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的，具体实施方式包括具体细节。然而，可以在没有这些具体细节的情况下实施这些技术。在一些实例中，为了避免对所描述的实施例的概念造成难以理解，公知的结构和装置以框图形式示出。

本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说，对本公开内容进行的各种修改是显而易见的，并且，也可以在不脱离本公开内容的保护范围的情况下，将本文所定义的一般性原理应用于其它变型。因此，本公开内容并不限于本文所描述的示例和设计，而是与符合本文公开的原理和新颖性特征的最广范围相一致。

Claims

1.一种用于识别信用风险用户的方法，包括：

基于若干用户的网络关联关系数据，构建用户关系图，所述用户关系图用于表示所述若干用户之间的关联关系；

对所述用户关系图执行社区发现，以找出至少一个用户社区；

基于所述至少一个用户社区的至少一个信用风险指标，从所述至少一个用户社区中确定出高信用风险用户社区；以及

将所述高信用风险用户社区中的用户识别为信用风险用户。

2.如权利要求1所述的方法，其中，所述若干用户的网络关联关系数据包括下述网络关联关系数据中的至少一种：

若干用户的经由社交网络生成的社交关系数据；

若干用户的经由各种媒介网络生成的关系数据；和

若干用户的用户网络行为轨迹数据。

3.如权利要求2所述的方法，其中，在所述若干用户的网络关联关系数据包括多种网络关联关系数据的情况下，基于若干用户的网络关联关系数据，构建所述用户关系图包括：

基于若干用户的各种网络关联关系数据，确定所述若干用户之间的对应关联关系；

对所确定出的所述若干用户之间的对应关联关系进行组合；以及

基于组合后的所述若干用户之间的关联关系，构建所述用户关系图。

4.如权利要求3所述的方法，其中，对所确定出的所述若干用户之间的对应关联关系进行组合包括：

对所得到的各种关联关系进行归一化处理；以及

对经过归一化处理后的各种关联关系进行组合。

5.如权利要求1所述的方法，其中，所述若干用户的网络关联关系数据是时序关联关系数据，以及所述网络关联关系数据具有随时间增加而降低的权重。

6.如权利要求1到5中任一所述的方法，还包括：

从所构建的用户关系图中去除与信用风险用户无关联的用户所对应的用户关系，以得到信用风险用户关系网，以及

对所述用户关系图执行社区发现，以找出至少一个用户社区包括：

对所述信用风险用户关系图执行社区发现，以找出至少一个用户社区。

7.如权利要求1所述的方法，其中，在所述至少一个信用风险指标包括与多个信用风险相关的信用风险指标时，所述多个信用风险是同质的信用风险。

8.如权利要求1所述的方法，其中，基于所述至少一个用户社区的至少一个信用风险指标，从所述至少一个用户社区中确定出高信用风险用户社区包括：

基于所述至少一个用户社区的至少一个信用风险指标来对所述至少一个用户社区进行信用风险评分；以及

将所述至少一个用户社区中的信用风险评分超过预定阈值的用户社区，确定为高信用风险用户社区。

9.一种用于识别信用风险用户的装置，包括：

用户关系图构建单元，被配置为基于若干用户的网络关联关系数据，构建用户关系图，所述用户关系图用于表示所述若干用户之间的关联关系；

社区发现单元，被配置为对所述用户关系图执行社区发现，以找出至少一个用户社区；

高风险用户社区确定单元，被配置为基于所述至少一个用户社区的至少一个信用风险指标，从所述至少一个用户社区中确定出高信用风险用户社区；以及

信用风险用户识别单元，被配置为将所述高信用风险用户社区中的用户识别为信用风险用户。

10.如权利要求9所述的装置，其中，所述若干用户的网络关联关系数据包括下述网络关系数据中的至少一种：

若干用户的经由社交网络生成的社交关系数据；

若干用户的经由各种媒介网络生成的关系数据；和

若干用户的用户网络行为轨迹数据。

11.如权利要求10所述的装置，其中，在所述若干用户的网络关联关系数据包括多种网络关联关系数据的情况下，所述用户关系图构建单元包括：

关联关系确定模块，被配置为基于若干用户的各种网络关联关系数据，确定所述若干用户之间的对应关联关系；

组合模块，被配置为对所确定出的所述若干用户之间的对应关联关系进行组合；以及

用户关系图构建模块，被配置为基于组合后的所述若干用户之间的关联关系，构建所述用户关系图。

12.如权利要求11所述的装置，其中，所述组合模块被配置为：

对所得到的各种关联关系进行归一化处理；以及

对经过归一化处理后的各种关联关系进行组合。

13.如权利要求9所述的装置，其中，所述若干用户的网络关联关系数据是时序关联关系数据，以及所述网络关联关系数据具有随时间增加而降低的权重。

14.如权利要求9到13中任一所述的装置，还包括：

用户关系去除单元，被配置为从所构建的用户关系图中去除与信用风险用户无关联的用户所对应的用户关系，以得到信用风险用户关系网，以及

所述社区发现单元被配置为：对所述信用风险用户关系图执行社区发现，以找出至少一个用户社区。

15.如权利要求9所述的装置，其中，所述高风险用户社区确定单元包括：

信用风险评分模块，被配置为基于所述至少一个用户社区的至少一个信用风险指标来对所述至少一个用户社区进行信用风险评分；以及

高风险用户社区确定模块，被配置为将所述至少一个用户社区中的信用风险评分超过预定阈值的用户社区，确定为高信用风险用户社区。

16.一种计算设备，包括：

至少一个处理器，以及

与所述至少一个处理器耦合的存储器，所述存储器存储指令，当所述指令被所述至少一个处理器执行时，使得所述至少一个处理器执行如权利要求1到8中任一所述的方法。

17.一种非暂时性机器可读存储介质，其存储有可执行指令，所述指令当被执行时使得所述机器执行如权利要求1到8中任一所述的方法。