CN109428760A - 一种基于运营商数据的用户信用评估方法 - Google Patents
一种基于运营商数据的用户信用评估方法 Download PDFInfo
- Publication number
- CN109428760A CN109428760A CN201710785781.3A CN201710785781A CN109428760A CN 109428760 A CN109428760 A CN 109428760A CN 201710785781 A CN201710785781 A CN 201710785781A CN 109428760 A CN109428760 A CN 109428760A
- Authority
- CN
- China
- Prior art keywords
- user
- community
- interior
- node
- call
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 239000011159 matrix material Substances 0.000 claims description 25
- 230000006399 behavior Effects 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 8
- 230000006835 compression Effects 0.000 claims description 5
- 238000007906 compression Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000003860 storage Methods 0.000 claims description 5
- 241001632427 Radiola Species 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 10
- 238000011156 evaluation Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 4
- 238000007667 floating Methods 0.000 description 4
- 238000012502 risk assessment Methods 0.000 description 4
- 230000002401 inhibitory effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5061—Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
- H04L41/5064—Customer relationship management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0609—Buyer or seller confidence or verification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Computer Networks & Wireless Communication (AREA)
- Development Economics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种基于运营商数据的用户信用评估的方法及装置,该方法包括:根据预设时间段的通话话单,确定通话话单内每个用户在预设时间段的通话关系网;根据通话关系网内各用户之间的通话行为关系,将通话关系网划分为n个社群Cn;根据社群Cn内种子用户的公允信用评分,确定所述社群Cn内其余用户的基础信用评分,其中,所述种子用户为在征信机构具有公允信用评分的用户;根据所述社群Cn内各用户之间的主被叫关系,确定所述社群Cn内每个用户的重要性等级;根据所述基础信用评分和所述重要性等级,确定所述社群Cn内每个用户的个体信用评分。本发明实施例能够有效解决银行及金融机构对新增客户的评级问题并扩大信用评分产品的覆盖用户。
Description
技术领域
本发明实施例涉及大数据业务技术领域,特别涉及一种基于运营商数据的用户信用评估的方法及装置。
背景技术
随着资本市场的蓬勃发展,信用的管理与控制已经成为现代企业内部管理的重要工作之一,信用作为一种根本的社会关系,已经成为了除市场以外的另一种资源配置方式。当前运营商对信用评估的应用主要集中在对内业务上,对外应用的场景还鲜有尝试。对内应用通常是对客户欠费和坏账等“违约”行为进行风险分析与评估,实现客户服务的合理订制,提高盈利水平。
当前运营商对内业务信用评级的技术方案主要参照国际通用的FICO信用评分模型,综合考虑客户违约情况、客户个人资料及信用消费信息等多种因素,利用统计挖掘算法从多个维度量化影响用户信用水平的因素,对每个因素的量化结果构建评分卡,输出各因素得分,再通过熵值法计算各因素权重,最终得到加权后信用总得分及各影响因素得分,通过量化的评分标准,将客户划分为N类信用等级;
现有的用户信用评估方法存在如下缺陷:第一、过于依赖用户前期消费信用记录等信息,对用户数据质量要求比较高,需在完备的输入用户字段信息的前提下才能输出有效的信用评分,对于数据质量不高的客户,缺乏信用判别方法;第二、现有运营商用户评估体系,对用户评估只能局限于个体层面信息,例如入网时长、套餐、虚拟网、话费、流量使用等层面,用户能够采取一些措施进行规避,可靠性无法确保。
发明内容
为解决现有技术存在的过于依赖用户前期消费信用记录等信息,对数据质量不高的客户缺乏有效的信用判别方法,以及现有的运营商用户评估体系仅基于用户个体层面信息,信用评估结果可靠性低等问题,本发明提供一种基于运营商数据的用户信用评估的方法。
第一方面,本发明实施例提供一种基于运营商数据的用户信用评估的方法,该方法包括:
根据预设时间段的通话话单,确定所述通话话单内每个用户在所述预设时间段的通话关系网;
根据所述通话关系网内各用户之间的通话行为关系,将所述通话关系网划分为n个社群Cn,其中n为大于1的整数;
根据社群Cn内种子用户的公允信用评分,确定所述社群Cn内其余用户的基础信用评分,其中,所述种子用户为在征信机构具有公允信用评分的用户;
根据所述社群Cn内各用户之间的主被叫关系,确定所述社群Cn内每个用户的重要性等级;
根据所述基础信用评分和所述重要性等级,确定所述社群Cn内每个用户的个体信用评分。
第二方面,本发明实施例提供一种基于运营商数据的用户信用评估的装置,其特征在于,包括:
数据汇总处理单元,根据预设时间段的通话话单,确定所述通话话单内每个用户在所述预设时间段的通话关系网;
社群关系发现单元,根据所述通话关系网内各用户之间的通话行为关系,将所述通话关系网划分为n个社群Cn,其中n为大于1的整数;
基础信用评分单元,根据社群Cn内种子用户的公允信用评分,确定所述社群Cn内其余用户的基础信用评分,其中,所述种子用户为在征信机构具有公允信用评分的用户;
用户排序单元,根据所述社群Cn内各用户之间的主被叫关系,确定所述社群Cn内每个用户的重要性等级;
用户打分单元,根据所述基础信用评分和所述重要性等级,确定所述社群Cn内每个用户的个体信用评分。
第三方面,本发明实施例提供一种电子设备,该电子设备包括存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:根据预设时间段的通话话单,确定所述通话话单内每个用户在所述预设时间段的通话关系网;根据所述通话关系网内各用户之间的通话行为关系,将所述通话关系网划分为n个社群Cn,其中n为大于1的整数;根据社群Cn内种子用户的公允信用评分,确定所述社群Cn内其余用户的基础信用评分,其中,所述种子用户为在征信机构具有公允信用评分的用户;根据所述社群Cn内各用户之间的主被叫关系,确定所述社群Cn内每个用户的重要性等级;根据所述基础信用评分和所述重要性等级,确定所述社群Cn内每个用户的个体信用评分。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如下方法:根据预设时间段的通话话单,确定所述通话话单内每个用户在所述预设时间段的通话关系网;根据所述通话关系网内各用户之间的通话行为关系,将所述通话关系网划分为n个社群Cn,其中n为大于1的整数;根据社群Cn内种子用户的公允信用评分,确定所述社群Cn内其余用户的基础信用评分,其中,所述种子用户为在征信机构具有公允信用评分的用户;根据所述社群Cn内各用户之间的主被叫关系,确定所述社群Cn内每个用户的重要性等级;根据所述基础信用评分和所述重要性等级,确定所述社群Cn内每个用户的个体信用评分。
本发明实施例提供的基于运营商数据的用户信用评估的方法及装置,基于用户之间相互通话的通话话单,统计各用户之间的通话行为的紧密程度,将联系密切的用户分配至同一个社群,认为同一个社群中的用户有着相近的社会属性,有着相近的信用风险情况,进而对该社群中基本信息不足的用户进行信用评估。因此,本发明实施例提供的方法及装置弥补了传统信用评分体系大量依赖于用户基础信息的缺点,可有效解决银行及金融机构对新增客户的评级问题,对金融机构新增客户、流动人口客户等进行风险评估有着重要意义;并且能够突破运营商之间的网络限制,对异网号码客户也能进行客观地信用评分,有效地扩大了信用评分产品的覆盖用户。
附图说明
图1为本发明实施例提供的基于运营商数据的用户信用评估的方法的流程示意图;
图2为本发明实施例提供的每个用户在一个月内的通话关系网的示意图;
图3为本发明实施例提供的社群合并的示意图。
图4为本发明实施例提供的某社群内各用户之间的主被叫关系的示意图;
图5为本发明实施例提供的基于运营商数据的用户信用评估的装置的结构示意图;
图6为本发明实施例提供的电子设备的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的基于运营商数据的用户信用评估的方法的流程示意图。如图1所示,该方法包括以下步骤:
S101、根据预设时间段的通话话单,确定所述通话话单内每个用户在所述预设时间段的通话关系网;
具体地,通过收集预设时间段的通话话单,基于所述通话话单,可以获知每个用户在该预设时间段内的通话记录,进而基于所述通话记录,可以确定每个用户的通话关系网。所述预设时间段,可以根据用户信用评分的更新频率进行调整。例如,若用户信用评分每月更新一次,可以收集该更新日起前3个月内的通话话单作为评估信用的基础数据。
图2为本发明实施例提供的每个用户在一个月内的通话关系网的示意图。
S102、根据所述通话关系网内各用户之间的通话行为关系,将所述通话关系网划分为n个社群Cn,其中n为大于1的整数;
具体地,所述通话行为关系用于指示用户之间的联系紧密程度。例如,是否存在通话记录、通话记录中的主被叫关系、通话次数、每次通话时长等均可以间接反映用户之间的社交关系。基于各用户之间的通话行为关系,将联系程度较为紧密的用户分配至同一个社群,从而将所述通话关系网划分为n个社群Cn。
例如,如图2所示,基于图中所涉及到的9个用户之间的通话行为关系,可知用户1、用户2、用户3及用户4这4个用户之间互有通话记录,联系比较紧密;类似地,用户5、用户6、用户7、用户8及用户9之间互有通话记录,联系比较紧密;虽然用户3、用户4及用户8之间也有通话记录,但从整体上看,可以将用户1、用户2、用户3及用户4分配至同一个社群,用户5、用户6、用户7、用户8及用户9分配至另一社群。
S103、根据社群Cn内种子用户的公允信用评分,确定所述社群Cn内其余用户的基础信用评分,其中,所述种子用户为在征信机构具有公允信用评分的用户;
具体地,同一个社群包括多个用户,认为同一个社群中的多个用户有着相近的社会属性,有着相近的信用风险情况。所谓种子用户是指前期消费信用记录比较全面,数据质量较高,可以在征信机构查到其公允信用评分。因此,在可以获取该社群内种子用户的公允信用评分的情况下,可以根据该已知公允信用评分,确定该社群内其余用户的基础信用评分。所谓基础信用评分是指该社群的信用参考分,这样就可以以该参考分对基本信息不足的用户进行信用评分。
S104、根据所述社群Cn内各用户之间的主被叫关系,确定所述社群Cn内每个用户的重要性等级;
具体地,所述重要性等级是指每个用户在该社群中的活跃度。例如,若该社群中的某用户A作为主叫或作为被叫与其他用户之间均有联系,而其他用户之间均没有互相联系,则可知该用户A在该社群中最重要,等级最高;其他用户之间也可用类似的原理,进行确定各自在社群中的重要性等级。
S105、根据所述基础信用评分和所述重要性等级,确定所述社群Cn内每个用户的个体信用评分。
具体地,社群内的每个用户均有自己在该社群的重要性等级,基于该社群的基础信用平分,则可计算该社群内每个用户的个体信用评分。用户在社群内的重要性等级越高,用户的个体信用评分则越高。以社群为单位,逐次计算其他社群内的用户的个体信用评分,最终可得到该通话关系网内所有用户的个体信用评分。
可选地,可以将每个用户的个体信用评分进行存储,以便业务人员后期使用。
本发明实施例提供的基于运营商数据的用户信用评估的方法,基于用户之间相互通话的通话话单,统计各用户之间的通话行为的紧密程度,将联系密切的用户分配至同一个社群,认为同一个社群中的用户有着相近的社会属性,有着相近的信用风险情况,进而对该社群中基本信息不足的用户进行信用评估。因此,本发明实施例提供的方法及装置弥补了传统信用评分体系大量依赖于用户基础信息的缺点,可有效解决银行及金融机构对新增客户的评级问题,对金融机构新增客户、流动人口客户等进行风险评估有着重要意义;并且能够突破运营商之间的网络限制,对异网号码客户也能进行客观地信用评分,有效地扩大了信用评分产品的覆盖用户。
在上述实施例的基础上,该方法中的所述根据预设时间段的通话话单,确定所述通话话单内每个用户在所述预设时间段的通话关系网,具体包括:
根据预设时间段内的通话话单,确定所述通话话单内每两个用户之间的主被叫关系和通话次数;
具体地,每两个用户在预设时间段内的通话记录可以被规整为类似以下的记录列表:
表1:某月份用户A与用户B之间的通话记录
主叫用户 | 被叫用户 | 通话次数 |
A用户 | B用户 | 10 |
B用户 | A用户 | 21 |
如此类推,A用户与C用户之间的通话记录,C用户与D用户之间的通话记录等均可被规整为类似上述的记录列表。
可选地,为了进一步提高信用评估的可靠性,在整理每个用户在预设时间段内的通话记录时,可以进行筛选,例如,通话时长大于等于30秒的通话记为一次通话,忽略通话时长小于30秒的通话记录。
可选地,还可以在上述记录列表的基础上,增加一列“通话时长”。如下表所示。
表2:某月份用户A与用户B之间的通话记录
主叫用户 | 被叫用户 | 通话次数 | 通话时长(分) |
A用户 | B用户 | 10 | 50 |
B用户 | A用户 | 21 | 84 |
所述通话关系网为以各个用户为节点,以所述主被叫关系为边,以所述通话次数为边权重的网状图。
可选地,以所述主被叫关系为边,以通话次数作为边权重,可以包括2种情况:第一、不区分主叫用户和被叫用户,以两个用户之间的总的通话次数为边权重,此时两个用户若有通话记录,则认为二者之间具有主被叫关系,但不区分谁是主叫和谁是主叫,二者用一条连线作为边。第二、区分主叫用户和被叫用户,当用户A为主叫,用户B为被叫,用户A和用户B的通话次数为边权重1;当用户A为被叫,用户B为主叫,用户A和用户B的通话次数为边权重2,此时每两个用户之间可以具有两条边,箭头方向用于表示主被叫关系。
可选地,还可各个用户为节点,以所述主被叫关系为边,以每次平均通话时长为边权重形成每个用户的通话关系网。
例如,如图2所示,该图中未区分主叫用户和被叫用户,因此边权重表示两个用户之间的总的通话次数。例如,用户1与用户2之间的在一个月内共通话5次,则二者之间的通话次数为5。
本发明实施例提供的基于运营商数据的用户信用评估的方法,通过统计每两个用户之间的通话记录,可以全面的收集每个用户的社交信息,基于此对每个用户的信用进行评估时,可以极大地提高用户信用评估的可靠性。
在上述各实施例的基础上,该方法中的所述根据所述通话关系网内各用户之间的通话行为关系,将所述通话关系网划分为n个社群Cn,具体包括:
将所述通话关系网内的节点i依次分配至与所述节点i具有主被叫关系的邻居节点j所在的社群,并根据下式
确定所述节点i与所述邻居节点j之间的模块化指标Qij;
根据所述模块化指标Qij,将所述节点i重新分配至满足第一预设分配条件的邻居节点k所在的社群,所述第一预设分配条件为:所述节点i与所述邻居节点k之间的模块化指标Qik取值最大;
其中,ki为所述节点i的度,Aij为所述节点i与所有邻居节点j构成的无相邻接矩阵,m的取值为所述邻接矩阵Aij内各个元素之和的1/2;当所述节点i与所述邻居节点j位于同一社群时,δ(ci,cj)取值为1,当所述节点i与所述邻居节点j不位于同一社群时,δ(ci,cj)取值为0;其中i,j均为大于1的整数,k=1,2,3,…,j。
具体地,首先,将通话关系网中的每个节点看成一个独立的社群,此时社群的数目与节点的数目相同;然后,定义模块化指标如下:
其中Qij值越大,说明节点i与节点j越适合位于同一社群;ki为节点i的度,为节点i的各边权重之和。Aij是邻接矩阵,描述用户之间相互通话行为,具体的构建方法下面以举例子的形式进行描述,此处不再赘述;m是邻接矩阵Aij内元素和的1/2;δ(ci,cj)表示点i,点j是否属于一个社群。接着,对每个节点i,依次尝试把节点i分配到其每个邻居节点j所在的社区,计算分配前与分配后的ΔQ,并记录ΔQ最大的那个邻居节点,如果maxΔQ>0,则把节点i分配至使得ΔQ最大的那个邻居节点所在的社区,否则保持不变。优化目标是找到最佳的社群划分使得Qij最大。
例如,在图2所示的通话关系网的基础上,对于用户1来讲,用户2、用户3及用户4均为用户1的邻居节点。用户1与用户2之间的边权重为5,用户1与用户3之间的边权重为21,用户1与用户4之间的边权重为8,因此k1=5+21+8=34。
在构建邻接矩阵Aij时,具体步骤为:由于用户1的邻居节点共有3个,加上用户1本身,故该矩阵为4(=3+1)行4(=3+1)列矩阵;矩阵内元素(1,2)表示用户1指向用户2的边权重;元素(1,3)表示用户1指向用户2的边权重;元素(2,1)表示用户2指向用户1的边权重,同理,可以按照上述方法构造邻接矩阵。由于图2中,并未区分主叫用户和被叫用户,因此,元素(2,1)和元素(1,2)的取值是相同的,均为5。
本发明实施例提供的基于运营商数据的用户信用评估的方法,通过定义模块化指标,将划分用户社群的问题转化为寻找最佳模块化指标的问题,在实际应用中,便于操作,利于方法的推广实施;并且,该计算方法简单,提高了用户信用评估效率,而为避免了复杂计算方法引入的误差,进一步提高了用户信用评估结果的可靠性和准确性。
在上述各实施例的基础上,该方法还包括:
若判断获知所述n个社群Cn中包括满足预设合并条件的待合并社群Cd,则按照预设合并规则对所述待合并社群进行合并;
其中,所述预设合并条件包括:
所述待合并社群Cd中不包括所述种子用户;
所述预设合并规则包括:
将所述社群Cn内所有节点压缩成对应所述社群Cn的新节点n,所述社群Cn内各节点之间的边权重为所述新节点n的环权重,每两个所述社群Cn之间的边权重为每两个所述新节点n之间的边权重;
将待合并节点d分配至满足第二预设分配条件的新节点m所对应的社群Cm中;
其中,所述待合并节点d为所述待合并社群Cd压缩形成的节点,所述社群Cm为包含种子用户的社群,所述第二预设分配条件为:所述待合并节点d与所述新节点m之间的模块化指标Qdm取值最大。
具体地,当初次形成的社群中,无法找到合适的种子用户作为基础信用评分的参照时,需要进行社群之间的合并。社群合并规则主要包括两个步骤:第一,对社群进行压缩,形成新节点;第二,计算新节点间的模块化指标,寻找最佳模块化指标,从而得到合适规模的新社群。
例如,图3为本发明实施例提供的社群合并的示意图。如图3所示,初次形成的社群有4个(分别用不同的填充图案表示):社群1(包括用户0、1、2、4、5);社群2(包括用户3、6、7);社群3(包括用户8、9、10、12、14、15);及社群4(包括用户11和12)。若判断获知,社群2和社群3中均不包括种子用户,需要将这两个社群合并到其他社群中。
此时,如图3中的虚线框所示,首先对原有的4个社群进行压缩;为了方便示例,此时默认所有社群内的各用户之间的边权重均为1。因此,对于社群1,社群内各用户之间的连线共有7条,并且此时各边权重均为1,则该社群内的边权重之和为7*2,则社群1通过压缩形成新节点1的环权重为14(=7*2);类似地,社群2通过压缩形成新节点2的环权重为4(=2*2);社群3通过压缩形成新节点3的环权重为16(=8*2);社群4通过压缩形成新节点4的环权重为2(=1*2)。社群1与社群2的连线为4,则新节点1和新节点2之间的边权重为4;类似地,新节点1和新节点3之间的边权重为1;新节点1和新节点4之间的边权重为1,其他不再赘述。
然后,通过上述操作形成新的节点之间的通话关系网,对该新通话关系网按照初次形成社群的方法进行合并即可,此处不再赘述。
可选地,也可根据业务需求,使得社群的个数控制在一定数量范围内。例如,有些情况下,仅仅定性地想知道某用户的信用是好或不好,此时可以将社群的个数控制地相对较小;若进一步地想知道某用户的信用具体在好的哪一个层面上,则可以将社群的个数控制地相对较大。
本发明实施例提供的基于运营商数据的用户信用评估的方法,通过进行社群合并,可以保证最终形成的社群中均可以找到种子用户作为信用参照;并且根据不同的情况,可以灵活调整社群规模,尽可能满足不同的业务需求。
在上述各实施例的基础上,该方法中的所述根据所述社群Cn内各用户之间的主被叫关系,确定所述社群Cn内每个用户的重要性等级,具体包括:
所述重要性等级为个体rank值;
根据所述社群Cn内各用户之间的主被叫关系,确定所述社群的有相邻接矩阵M;
根据所述有相邻接矩阵M和所述社群Cn上一次的rank值v(q-1),根据下式
v(q)=αMv(q-1)+(1-α)e
确定所述社群Cn内每个用户的个体rank值;
其中,α为预设常数,e为所述社群Cn的初始rank值,q为迭代次数。
具体地,所述个体rank值越大,则表明用户在该社群中越重要。在实际应用中,可根据社群内各用户之间的主被叫关系,先构建一张关联图,这样可清晰地看到各用户之间的联系。然后,根据该关联图,进行有相邻接矩阵M的构建,与上述无相邻接矩阵不同之处在于,在构建相邻接矩阵M时,规定每个用户作为主叫用户的通话次数为1,具体构建过程,下面将举例说明,此处不再赘述。所述初始rank值为列矩阵,该列矩阵的行数为社群内的用户个数。一般来讲,初始rank值通常设定为元素均为1的列矩阵,表示所有用户都同样重要。所述α用于调整用户之间的区别度,一般设置为0.85,需要说明的是,如果该值不能较好地区分各用户的信用,则可以进行调整。q为迭代次数,一般情况下设置为10至20次,即可得到较为准确的rank值。
图4为本发明实施例提供的某社群内各用户之间的主被叫关系的示意图。如图4所示,箭头方向用于表示主被叫关系,例如,以用户A为起点的箭头有3条,表示用户A作为主叫,用户B、C、D均作为被叫。该社群内共有4个用户,即用户A,B,C,D,也即共有四个节点,所以M矩阵是4*4的矩阵。首先将A,B,C,D分别映射成1,2,3,4;矩阵元素(1,2)代表A点指向B点,矩阵元素(1,3)代表A点指向C点,图4中A点对外指向的箭头有三个,A没有指向自己的箭头,所以(1,1)是0,(1,2)、(1,3)、(1,4)为1/3,构成了M矩阵的第一列。同理,可以构造出矩阵的其他列的元素。
最终可得到
因为该社群中有4个用户,所以可以令初始值则则
按照每一轮的rank值迭代计算公式:v(q)=αMv(q-1)+(1-α)e,可以计算v(2);根据v(2),可以计算v(3);类推,根据v(q-1),可以计算v(q);迭代次数q一般设置为10至20次,按照经验,经过迭代之后基本能够对于社群中的用户进行区分并较好排序了。最终可得到每个用户的个体rank值。
本发明实施例提供的基于运营商数据的用户信用评估的方法,通过定义rank值计算公式,对每个社群内的用户进行排序,从而对同一个社群内的用户进一步进行区分,进一步提高了用户信用评估结果的可靠性和准确性;并且计算方法方便简捷,提高了用户信用评估的效率。
在上述各实施例的基础上,上述各实施例中的根据社群Cn内种子用户的公允信用评分,确定所述社群Cn内其余用户的基础信用评分,具体包括:
以所述社群Cn内所有种子用户的公允信用评分的平均值作为所述社群Cn内其余用户的基础信用评分。
例如,对于某社群,其中用户甲、乙、丙的信息最为全面,征信机构对其的评分平均值为600分,则甲、乙、丙用户成为种子用户,则该社群中的其余所有用户的基础信用评分为600分。
在上述各实施例的基础上,该方法中的所述根据所述基础信用评分和所述重要性等级,确定所述社群Cn内每个用户的个体信用评分,具体包括:
其中,所述样本rank值为所述社群Cn内的所有种子用户的个体rank值的平均值,a、b为预设常数。
具体地,对于同一个社群中,如果希望不同的用户之间分数差异较大,则a和b设置的较大;如果希望不同的用户之间分数较为接近,则a和b都设置的较小,调整时根据实际业务需求进行调整。一般情况下,基础数据是a设置为0.25(a为0到1之间的小数),b设置为2(b为正整数)。
本发明实施例提供的基于运营商数据的用户信用评估的方法,基于用户之间相互通话的通话话单,统计各用户之间的通话行为的紧密程度,将联系密切的用户分配至同一个社群,认为同一个社群中的用户有着相近的社会属性,有着相近的信用风险情况,进而对该社群中基本信息不足的用户进行信用评估,弥补了传统信用评分体系大量依赖于用户基础信息的缺点,可有效解决银行及金融机构对新增客户的评级问题,对金融机构新增客户、流动人口客户等进行风险评估有着重要意义;并且能够突破运营商之间的网络限制,对异网号码客户也能进行客观地信用评分,有效地扩大了信用评分产品的覆盖用户。
图5为本发明实施例提供的基于运营商数据的用户信用评估的装置的结构示意图。如图5所示,该装置包括:数据汇总处理单元501、社群关系发现单元502、基础信用评分单元503、用户排序单元504以及用户打分单元505。其中:
数据汇总处理单元501根据预设时间段的通话话单,确定所述通话话单内每个用户在所述预设时间段的通话关系网;社群关系发现单元502根据所述通话关系网内各用户之间的通话行为关系,将所述通话关系网划分为n个社群Cn,其中n为大于1的整数;基础信用评分单元503根据社群Cn内种子用户的公允信用评分,确定所述社群Cn内其余用户的基础信用评分,其中,所述种子用户为在征信机构具有公允信用评分的用户;用户排序单元504根据所述社群Cn内各用户之间的主被叫关系,确定所述社群Cn内每个用户的重要性等级;用户打分单元505根据所述基础信用评分和所述重要性等级,确定所述社群Cn内每个用户的个体信用评分。
具体地,数据汇总处理单元501基于用户在预设时间段内的通话话单进行汇总,确定每个用户的通话关系网;社群关系发现单元502接收该通话关系网,并对该通话关系网进行社群划分;接着,基础信用评分单元503针对每个社群,选取每个社群内的种子用户,获取每个种子用户的公允信用评分,从而确定每个社群的基础信用评分;同时,用户排序单元504针对每个社群,对社群内的用户进行重要性等级排序,每个社群内每个用户的重要性等级;最后,用户打分单元505根据每个社群的基础信用评分和每个用户的重要性等级,对用户进行打分;进一步地,用户打分单元505还可以将每个用户的评分固化在数据库中,供业务人员使用。
需要说明的是,本发明实施例提供的基于运营商数据的用户信用评估的装置,是为了实现上述方法的,其功能具体可参考上述方法实施例,此处不再赘述。
本发明实施例提供的基于运营商数据的用户信用评估的装置,弥补了传统信用评分装置大量依赖于用户基础信息的缺点,可有效解决银行及金融机构对新增客户的评级问题,对金融机构新增客户、流动人口客户等进行风险评估有着重要意义;并且能够突破运营商之间的网络限制,对异网号码客户也能进行客观地信用评分,有效地扩大了信用评分产品的覆盖用户。
图6为本发明实施例提供的电子设备的结构框图。如图6所示,该电子设备包括:存储器602和处理器601,所述处理器601和所述存储器602通过总线603完成相互间的通信;所述存储器602存储有可被所述处理器执行的程序指令,所述处理器601调用所述程序指令能够执行如下方法,例如包括:根据预设时间段的通话话单,确定所述通话话单内每个用户在所述预设时间段的通话关系网;根据所述通话关系网内各用户之间的通话行为关系,将所述通话关系网划分为n个社群Cn,其中n为大于1的整数;根据社群Cn内种子用户的公允信用评分,确定所述社群Cn内其余用户的基础信用评分,其中,所述种子用户为在征信机构具有公允信用评分的用户;根据所述社群Cn内各用户之间的主被叫关系,确定所述社群Cn内每个用户的重要性等级;根据所述基础信用评分和所述重要性等级,确定所述社群Cn内每个用户的个体信用评分。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:根据预设时间段的通话话单,确定所述通话话单内每个用户在所述预设时间段的通话关系网;根据所述通话关系网内各用户之间的通话行为关系,将所述通话关系网划分为n个社群Cn,其中n为大于1的整数;根据社群Cn内种子用户的公允信用评分,确定所述社群Cn内其余用户的基础信用评分,其中,所述种子用户为在征信机构具有公允信用评分的用户;根据所述社群Cn内各用户之间的主被叫关系,确定所述社群Cn内每个用户的重要性等级;根据所述基础信用评分和所述重要性等级,确定所述社群Cn内每个用户的个体信用评分。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:根据预设时间段的通话话单,确定所述通话话单内每个用户在所述预设时间段的通话关系网;根据所述通话关系网内各用户之间的通话行为关系,将所述通话关系网划分为n个社群Cn,其中n为大于1的整数;根据社群Cn内种子用户的公允信用评分,确定所述社群Cn内其余用户的基础信用评分,其中,所述种子用户为在征信机构具有公允信用评分的用户;根据所述社群Cn内各用户之间的主被叫关系,确定所述社群Cn内每个用户的重要性等级;根据所述基础信用评分和所述重要性等级,确定所述社群Cn内每个用户的个体信用评分。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于运营商数据的用户信用评估的方法,其特征在于,包括:
根据预设时间段的通话话单,确定所述通话话单内每个用户在所述预设时间段的通话关系网;
根据所述通话关系网内各用户之间的通话行为关系,将所述通话关系网划分为n个社群Cn,其中n为大于1的整数;
根据社群Cn内种子用户的公允信用评分,确定所述社群Cn内其余用户的基础信用评分,其中,所述种子用户为在征信机构具有公允信用评分的用户;
根据所述社群Cn内各用户之间的主被叫关系,确定所述社群Cn内每个用户的重要性等级;
根据所述基础信用评分和所述重要性等级,确定所述社群Cn内每个用户的个体信用评分。
2.根据权利要求1所述的方法,其特征在于,所述根据预设时间段的通话话单,确定所述通话话单内每个用户在所述预设时间段的通话关系网,具体包括:
根据预设时间段内的通话话单,确定所述通话话单内每两个用户之间的主被叫关系和通话次数;
所述通话关系网为以各个用户为节点,以所述主被叫关系为边,以所述通话次数为边权重的网状图。
3.根据权利要求2所述的方法,其特征在于,所述根据所述通话关系网内各用户之间的通话行为关系,将所述通话关系网划分为n个社群Cn,具体包括:
将所述通话关系网内的节点i依次分配至与所述节点i具有主被叫关系的邻居节点j所在的社群,并根据下式
确定所述节点i与所述邻居节点j之间的模块化指标Qij;
根据所述模块化指标Qij,将所述节点i重新分配至满足第一预设分配条件的邻居节点k所在的社群,所述第一预设分配条件为:所述节点i与所述邻居节点k之间的模块化指标Qik取值最大;
其中,ki为所述节点i的度,Aij为所述节点i与所有邻居节点j构成的无相邻接矩阵,m的取值为所述邻接矩阵Aij内各个元素之和的1/2;当所述节点i与所述邻居节点j位于同一社群时,δ(ci,cj)取值为1,当所述节点i与所述邻居节点j不位于同一社群时,δ(ci,cj)取值为0;其中i,j均为大于1的整数,k=1,2,3,…,j。
4.根据权利要求3所述的方法,其特征在于,还包括:
若判断获知所述n个社群Cn中包括满足预设合并条件的待合并社群Cd,则按照预设合并规则对所述待合并社群进行合并;
其中,所述预设合并条件包括:
所述待合并社群Cd中不包括所述种子用户;
所述预设合并规则包括:
将所述社群Cn内所有节点压缩成对应所述社群Cn的新节点n,所述社群Cn内各节点之间的边权重为所述新节点n的环权重,每两个所述社群Cn之间的边权重为每两个所述新节点n之间的边权重;
将待合并节点d分配至满足第二预设分配条件的新节点m所对应的社群Cm中;
其中,所述待合并节点d为所述待合并社群Cd压缩形成的节点,所述社群Cm为包含种子用户的社群,所述第二预设分配条件为:所述待合并节点d与所述新节点m之间的模块化指标Qdm取值最大。
5.根据权利要求1所述的方法,其特征在于,所述根据所述社群Cn内各用户之间的主被叫关系,确定所述社群Cn内每个用户的重要性等级,具体包括:
所述重要性等级为个体rank值;
根据所述社群Cn内各用户之间的主被叫关系,确定所述社群的有相邻接矩阵M;
根据所述有相邻接矩阵M和所述社群Cn上一次的rank值v(q-1),根据下式
v(q)=αMv(q-1)+(1-α)e
确定所述社群Cn内每个用户的个体rank值;
其中,α为预设常数,e为所述社群Cn的初始rank值,q为迭代次数。
6.根据权利要求1所述的方法,其特征在于,所述根据社群Cn内种子用户的公允信用评分,确定所述社群Cn内其余用户的基础信用评分,具体包括:
以所述社群Cn内所有种子用户的公允信用评分的平均值作为所述社群Cn内其余用户的基础信用评分。
7.根据权利要求5所述的方法,其特征在于,所述根据所述基础信用评分和所述重要性等级,确定所述社群Cn内每个用户的个体信用评分,具体包括:
其中,所述样本rank值为所述社群Cn内的所有种子用户的个体rank值的平均值,a、b为预设常数。
8.一种基于运营商数据的用户信用评估的装置,其特征在于,包括:
数据汇总处理单元,根据预设时间段的通话话单,确定所述通话话单内每个用户在所述预设时间段的通话关系网;
社群关系发现单元,根据所述通话关系网内各用户之间的通话行为关系,将所述通话关系网划分为n个社群Cn,其中n为大于1的整数;
基础信用评分单元,根据社群Cn内种子用户的公允信用评分,确定所述社群Cn内其余用户的基础信用评分,其中,所述种子用户为在征信机构具有公允信用评分的用户;
用户排序单元,根据所述社群Cn内各用户之间的主被叫关系,确定所述社群Cn内每个用户的重要性等级;
用户打分单元,根据所述基础信用评分和所述重要性等级,确定所述社群Cn内每个用户的个体信用评分。
9.一种电子设备,其特征在于,包括:
存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至7任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710785781.3A CN109428760B (zh) | 2017-09-04 | 2017-09-04 | 一种基于运营商数据的用户信用评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710785781.3A CN109428760B (zh) | 2017-09-04 | 2017-09-04 | 一种基于运营商数据的用户信用评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109428760A true CN109428760A (zh) | 2019-03-05 |
CN109428760B CN109428760B (zh) | 2022-03-04 |
Family
ID=65513362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710785781.3A Active CN109428760B (zh) | 2017-09-04 | 2017-09-04 | 一种基于运营商数据的用户信用评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109428760B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110533528A (zh) * | 2019-08-30 | 2019-12-03 | 北京市天元网络技术股份有限公司 | 评估企业信用的方法及设备 |
CN110930242A (zh) * | 2019-11-26 | 2020-03-27 | 中国建设银行股份有限公司 | 一种可信度预测方法、装置、设备和存储介质 |
CN110971770A (zh) * | 2019-11-27 | 2020-04-07 | 武汉虹旭信息技术有限责任公司 | 基于话单数据分析的社会关系疏密度推定方法及系统 |
CN117575769A (zh) * | 2023-11-02 | 2024-02-20 | 睿智合创(北京)科技有限公司 | 一种信贷机构客户流量质量评估方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100063832A1 (en) * | 2008-09-09 | 2010-03-11 | Brown Stephen J | Incentive allocation based on thermostat settings |
CN103138981A (zh) * | 2011-11-30 | 2013-06-05 | 中国移动通信集团公司 | 一种社交网络分析方法和装置 |
CN105592405A (zh) * | 2015-10-30 | 2016-05-18 | 东北大学 | 基于派系过滤和标签传播的移动通信用户群组构造方法 |
-
2017
- 2017-09-04 CN CN201710785781.3A patent/CN109428760B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100063832A1 (en) * | 2008-09-09 | 2010-03-11 | Brown Stephen J | Incentive allocation based on thermostat settings |
CN103138981A (zh) * | 2011-11-30 | 2013-06-05 | 中国移动通信集团公司 | 一种社交网络分析方法和装置 |
CN105592405A (zh) * | 2015-10-30 | 2016-05-18 | 东北大学 | 基于派系过滤和标签传播的移动通信用户群组构造方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110533528A (zh) * | 2019-08-30 | 2019-12-03 | 北京市天元网络技术股份有限公司 | 评估企业信用的方法及设备 |
CN110930242A (zh) * | 2019-11-26 | 2020-03-27 | 中国建设银行股份有限公司 | 一种可信度预测方法、装置、设备和存储介质 |
CN110971770A (zh) * | 2019-11-27 | 2020-04-07 | 武汉虹旭信息技术有限责任公司 | 基于话单数据分析的社会关系疏密度推定方法及系统 |
CN110971770B (zh) * | 2019-11-27 | 2021-07-23 | 武汉虹旭信息技术有限责任公司 | 基于话单数据分析的社会关系疏密度推定方法及系统 |
CN117575769A (zh) * | 2023-11-02 | 2024-02-20 | 睿智合创(北京)科技有限公司 | 一种信贷机构客户流量质量评估方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109428760B (zh) | 2022-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109428760A (zh) | 一种基于运营商数据的用户信用评估方法 | |
CN106156941B (zh) | 一种用户信用评分优化方法和装置 | |
CN107767262B (zh) | 信息处理方法、装置和计算机可读存储介质 | |
CN102083010B (zh) | 一种用户信息筛选方法和设备 | |
Kumar et al. | A comparative analysis of operational performance of Cellular Mobile Telephone Service Providers in the Delhi working area using an approach of fuzzy ELECTRE | |
CN112333342B (zh) | 智能语音呼叫方法、装置、设备及存储介质 | |
CN105120486B (zh) | 一种通信网络效能的评价方法及装置 | |
CN105592405B (zh) | 基于派系过滤和标签传播的移动通信用户群组构造方法 | |
CN104244314B (zh) | 一种基于Mc接口信令的潜在集团客户识别方法 | |
CN107993142A (zh) | 一种金融反欺诈风险控制系统 | |
CN104866922B (zh) | 一种用户离网的预测方法及装置 | |
CN108305163A (zh) | 基于特征库的信用预警方法及系统 | |
CN102184196A (zh) | 一种信访综合管理信息系统 | |
CN109408228A (zh) | 基于预算调配的群智感知任务分配方法 | |
CN104021439B (zh) | 数据中心服务成熟度评价方法和系统 | |
CN106570753A (zh) | 对违约风险进行控制的方法及服务器 | |
CN109993380A (zh) | 一种信息处理方法、装置和计算机可读存储介质 | |
CN108428009A (zh) | 一种渠道分配方法及装置 | |
CN108428155A (zh) | 一种基于业务特征模型的行为处理分析方法 | |
Qiuru et al. | Telecom customer segmentation based on cluster analysis | |
CN111782711A (zh) | 一种水量数据统计方法 | |
CN104137581B (zh) | 一种多次入网用户的判断方法及装置 | |
CN108021588A (zh) | 一种面向电子商务的用户首次购数据整合方法及装置 | |
CN105871564A (zh) | 一种流量计费方法及装置 | |
CN109858669A (zh) | 一种基于熵值法的欠费停复电投诉倾向预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |