CN110930242A - 一种可信度预测方法、装置、设备和存储介质 - Google Patents
一种可信度预测方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN110930242A CN110930242A CN201911174701.6A CN201911174701A CN110930242A CN 110930242 A CN110930242 A CN 110930242A CN 201911174701 A CN201911174701 A CN 201911174701A CN 110930242 A CN110930242 A CN 110930242A
- Authority
- CN
- China
- Prior art keywords
- predicted
- community
- entity
- blacklist
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000006399 behavior Effects 0.000 claims description 60
- 238000004590 computer program Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005065 mining Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003971 tillage Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Technology Law (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了一种可信度预测方法、装置、设备和存储介质,该可信度预测方法包括:获取执行目标行为的待预测对象,并确定所述待预测对象在知识图谱中的所属社群;确定所述待预测对象与社群中实体之间的距离,社群中实体占比,以及社群中目标行为数据中的至少一项,以得到待预测对象的特征数据;根据所述待预测对象的特征数据,确定待预测对象的可信度。本发明实施例基于社群确定待预测对象的特征数据,待预测对象的特征数据反映了待预测对象与社群整体之间的关系,可以更好地表达待预测对象与社群中实体之间的关系,提高对待预测对象可信度的准确性,避免了只采用待预测对象的自身属性带来的局限性,影响预测结果的准确性。
Description
技术领域
本发明实施例涉及信息处理技术领域,尤其涉及一种可信度预测方法、装置、设备和存储介质。
背景技术
近年来,随着消费升级以及居民消费观念的改变,我国信用卡发卡量保持较快增长。与此同时,商业银行也开始在信用卡领域精耕细作,推进差异化经营,推出有竞争力的信用卡产品及活动。同时,随着我国城镇化进程的逐步推进,信用卡市场潜在客户将不断增加。在未来城镇居民年均复合增速为2.5%的情况下,假设10年后城镇居民人到均信用卡持卡量为2张,那么信用卡发卡量年均复合增速为10%,信用卡市场空间仍然是巨大的。其中在线申请信用卡以其快速便捷、低准入门槛的优势受到了市场青睐,逐渐成为传统金融机构的业务转型方向。然而,虚假申请、团伙欺诈、套现的可能性也在加大。通过与黑色产业链合作,或采用虚假身份材料办理信用卡以套现牟利,或为不符合信用卡申请资质的人提供虚假材料的现象出现,严重增加了信用卡还款风险,最终导致了银行不良信贷的产生和被冒名当事人的损失。因此,在对用户发放信用卡之前,需要对用户的信用程度进行审批。
目前,国内大多数银行的信用卡部门采取人工审核作业形式,利用人工对用户提交的信用卡办理申请进行审批;或者采用信用卡审批风险评分模型对用户的信用卡申请进行审批,信用卡审批风险评分模型利用评分卡技术对个体欺诈概率进行预测,主要采用的方法主要是基于专家规则,对存在风险的行为数据进行评分,从而对存在风险的信用卡申请进行判断。
然而,人工审核作业形式不仅效率低,而且还面临很大的欺诈违约风险。采用信用卡审批风险评分模型的方法存在对团伙之间相互配合进行虚假申请的行为判断不准确的问题。
发明内容
本发明实施例提供一种可信度预测方法、装置、设备和存储介质,以提高对信用卡欺诈团伙挖掘的准确性。
第一方面,本发明实施例提供了一种可信度预测方法,包括:
获取执行目标行为的待预测对象,并确定所述待预测对象在知识图谱中的所属社群;
确定所述待预测对象与社群中实体之间的距离,社群中实体占比,以及社群中目标行为数据中的至少一项,以得到待预测对象的特征数据;
根据所述待预测对象的特征数据,确定待预测对象的可信度。
第二方面,本发明实施例还提供了一种可信度预测装置,包括:
所属社群确定模块,用于获取执行目标行为的待预测对象,并确定所述待预测对象在知识图谱中的所属社群;
特征数据确定模块,用于确定所述待预测对象与社群中实体之间的距离,社群中实体占比,以及社群中目标行为数据中的至少一项,以得到待预测对象的特征数据;
可信度确定模块,用于根据所述待预测对象的特征数据,确定待预测对象的可信度。
第三方面,本发明实施例还提供了一种计算机设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任一实施例所述的可信度预测方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任一实施例所述的可信度预测方法。
本发明实施例基于执行目标行为的待预测对象在知识图谱中的位置确定其所属社群,并根据所属社群确定待预测对象的特征数据。其中,待预测对象的特征数据反映了待预测对象与社群整体之间的关系,可以更好地表达待预测对象与社群中实体之间的关系,根据待预测对象的特征数据对待预测对象的可信度进行预测,可以根据社群中的实体数据对待预测对象进行预测,使得提高对待预测对象可信度的准确性,避免只采用待预测对象的自身属性带来的局限性,影响预测结果的准确性。
附图说明
图1是本发明实施例一中的可信度预测方法的流程图;
图2是本发明实施例二中的可信度预测方法的流程图;
图3是本发明实施例三中的可信度预测装置的结构示意图;
图4是本发明实施例四中的计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
图1是本发明实施例一中的可信度预测方法的流程图,本实施例可适用于根据用户的所述社群数据,挖掘信用卡欺诈团伙的情况。该方法可以由可信度预测装置来执行,该装置可以采用软件和/或硬件的方式实现,并可配置在计算机设备中,例如计算机设备可以是后台服务器等具有通信和计算能力的设备。如图1所示,该方法具体包括:
步骤101、获取执行目标行为的待预测对象,并确定所述待预测对象在知识图谱中的所属社群。
其中,目标行为是指所需预测可信度的行为,示例性的,目标行为包括用户向银行递交信用卡申请的行为。待预测对象是指发出目标行为的用户,例如,发起信用卡申请的用户本人为待预测对象,需要对待预测对象进行可信度预测,进而对是否通过用户的信用卡申请进行判定。知识图谱是指显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。可选的,知识图谱中包括从用户信用卡申请信息中提取出的信息关系,例如,用户信用卡申请信息中包括申请人ID、申请人电话号码、申请人通讯地址、联系人ID、联系人电话号码以及申请设备ID等,根据这些申请信息构建知识图谱以表示不同ID、电话号码、通讯地址以及申请设备ID之间的关系以及联系紧密度。社群是指在某些边界线、地区或领域内发生作用的一切社会关系,具体的,社群是指将知识图谱中联系紧密的部分划分在一起的社会关系。可选的,根据知识图谱中实体之间的联系紧密度预先将知识图谱划分为至少两个社群。所述社群即为根据待预测对象的ID判断其属于哪一个社群,并获取社群内所有实体的信息。
具体的,在确定所述待预测对象在知识图谱中的所属社群之前,还包括:构建知识图谱。从银行获取用户信用卡申请历史信息,至少包括:申请人ID、申请人电话号码、申请人通讯地址、联系人ID、联系人电话号码以及申请设备ID,并根据信息之间的关系将各个信息代表的实体连接起来,形成知识图谱。并根据知识图谱中实体之间的联系紧密度划分社群。例如,社群可以采用Louvian算法进行划分。对社群进行划分可以将与待预测对象联系不紧密的实体剔除,避免其对待预测对象的可信度预测造成影响。确定需要进行可信度预测的信用卡申请人后,根据用户的ID确定其在知识图谱中所属社群,并获取所属社群中包含的实体信息。
步骤102、确定所述待预测对象与社群中实体之间的距离,社群中实体占比,以及社群中目标行为数据中的至少一项,以得到待预测对象的特征数据。
其中,距离是指待预测对象与实体之间构成连接关系的最短边数,其代表了待预测对象与目标实体之间的联系紧密程度,其中,目标实体包括社群中影响待预测对象可信度的对象。社群中实体占比是指某类实体的数量在社群所有实体的所占比重,其代表了该社群的整体情况。社群中目标行为数据是指社群中所求目标行为的发生整体情况,例如通过社群中信用卡申请行为数据可以反映出社群中实体申请信用卡的整体情况,便于根据整体情况对待预测对象的信用卡申请行为的可信度进行判断。特征数据是指能表示待预测对象与社群中实体之间的关系数据,根据关系数据可以对待预测对象的可信度进行预测。
具体的,确定信用卡的申请人的所在社群,并确定社群中各个实体的数据,包括每类实体与申请人之间的关系以及每类实体的数量等信息。根据社群中各个实体的数据确定申请人与实体之间的距离、社群中实体占比以及社群中目标行为数据,根据这些信息确定申请人的特征数据。
可选的,确定所述待预测对象与社群中实体之间的距离,包括:
确定所述待预测对象与社群中黑名单实体之间的距离;其中所述黑名单实体包括申请人黑名单实体、联系人黑名单实体、设备黑名单实体、地址黑名单实体和号码黑名单实体中的至少一项。
其中,黑名单实体根据银行系统中记录的历史上出现过严重逾期或已确定为信用卡欺诈的用户及其相关信息进行确定。例如说,当确定某信用卡申请人为信用卡欺诈,则其本人以及申请时提交的申请人电话号码、申请人通讯地址、联系人ID、联系人电话号码以及申请设备ID均为黑名单实体。便于对团伙之间相互配合进行信用卡欺诈进行挖掘。
具体的,在构建知识图谱时将黑名单申请人以及申请时提交的申请人电话号码、申请人通讯地址、联系人ID、联系人电话号码以及申请设备ID所代表实体标注为黑名单实体。分别计算待预测对象所表示的实体到各个黑名单实体之间的距离,例如,待预测对象的所属社群中共有三个黑名单实体,分别为号码黑名单实体、地址黑名单实体和设备黑名单实体,待预测对象与这三个实体之间构成连接关系的最短边数分别是3、2和4,则待预测对象与社群中黑名单实体之间的距离为3、2和4。根据这些距离数据得到待预测对象的特征数据。
将待预测对象与黑名单实体之间的距离作为对待预测对象可信度进行预测的一个因素,可以获取待预测对象与黑名单实体之间的联系紧密程度,以根据联系紧密程度判断待预测对象与黑名单实体之间构成信用卡欺诈团伙的概率。提高对待预测对象可信度预测的准确度。
可选的,确定社群中实体占比,包括:
确定社群中黑名单实体的占比;其中,所述黑名单实体包括申请人黑名单实体、联系人黑名单实体、设备黑名单实体、地址黑名单实体和号码黑名单实体中的至少一项。
具体的,确定社群中实体的总数以及社群中黑名单实体的数量,进而确定社群中黑名单实体的占比。例如社群中共有100个实体,且黑名单实体的数量为20个,其中包括了申请人黑名单实体、联系人黑名单实体、设备黑名单实体、地址黑名单实体和号码黑名单实体的所有数量,则社群中黑名单实体的占比为0.2。
社群中黑名单实体的占比可以表示该社群中发生信用卡欺诈行为的概率,根据占比可以确定待预测对象所属社群的可信度的整体情况,为对待预测对象的可信度预测提供依据,进而提高对待预测对象的可信度预测准确度。
可选的,确定社群中目标行为数据,包括:
确定社群中目标行为数量与实体数量之间的关系。
其中,目标行为数量是指社群中实体发生目标行为的数量,例如,社群中申请人实体发生申请信用卡的数量。实体数量是指社群中可以发生目标行为的实体数量,例如,社群中的申请人实体数量和联系人实体数量。
具体的,确定社群中申请人实体发生信用卡申请行为的数量,并确定社群中申请人实体和联系人实体的总数,根据二者的关系确定社群中目标行为数据。可选的,确定社群n天内发生信用卡申请行为的实体数量与每个实体发生申请行为的次数,其中,发生信用卡申请行为的实体集合即为A,集合A中实体个数为size(A),集合中第k个实体发生申请行为的数量为nk,则社群中目标行为数据的计算方式可以通过如下表达式进行确定:
可选的,确定所述待预测对象与社群中实体之间的距离,社群中实体占比,以及社群中目标行为数据中的至少一项,以得到待预测对象的特征数据,包括:
确定所述待预测对象与社群中实体之间的距离,社群中实体占比,社群中目标行为数据,所述待预测对象的属性数据以及社群属性数据中的至少一项,以得到待预测对象的特征数据。
其中,待预测对象的属性数据是指表示待预测对象的资产情况的信息,可选的,属性数据可以包括Aum值(资产管理规模,Asset Under Managerment),Aum值通过银行根据申请人在银行的存款,交易活跃度,交易流水总量等多种指标进行评价。引入待预测对象Aum值的目的是为了增加申请人的历史信息维度。社群属性数据是指对社群中所有申请人和联系人的资产情况进行评估的信息。
具体的,根据待预测对象与社群中实体之间的距离,社群中实体占比,社群中目标行为数据,所述待预测对象的属性数据以及社群属性数据建立待预测对象的特征向量,每个数据作为特征向量的一个维度,综合对待预测对象的可信度进行描述,提高对待预测对象可信度预测的准确性。
用待预测对象与所属社群中实体的距离、社群的整体属性以及待预测的自身属性对待预测对象的可信度进行预测,可以更好地根据社群中黑名单实体对待预测对象进行判断,使得对待预测的可信度预测结果中结合了黑名单实体对其造成的影响以及自身的属性值,提高待预测对象可信度的预测准确性。
步骤103、根据所述待预测对象的特征数据,确定待预测对象的可信度。
其中,待预测对象的可信度是指对待预测对象进行评估的数值,例如,根据可信度对待预测对象申请信用卡的行为是否通过进行评估。
具体的,根据待预测对象中的特征数据的数值对待预测对象的可信度进行确定。可选的,可以设置预设阈值对可信度进行确定。可选的,通过决策树、神经网络等分类器训练分类模型,对待预测对象的可信度进行预测。
本发明实施例基于执行目标行为的待预测对象在知识图谱中的位置确定其所属社群,并根据所属社群确定待预测对象的特征数据。其中,待预测对象的特征数据反映了待预测对象与社群整体之间的关系,其中包括与黑名单实体之间的距离以及社群目标行为数据,通过该数据可以更好地表达待预测对象与社群中实体之间的关系,根据待预测对象的特征数据对待预测对象的可信度进行预测,可以根据社群中的实体数据对待预测对象进行预测,使得提高对待预测对象可信度的准确性,避免只采用待预测对象的自身属性带来的局限性,影响预测结果的准确性。
实施例二
图2是本发明实施例二中的可信度预测方法的流程图,本实施例二在实施例一的基础上进行进一步地优化,采用可信度预测模型对待预测对象的可信度进行预测。如图2所示,所述方法包括:
步骤201、获取执行目标行为的待预测对象,并确定所述待预测对象在知识图谱中的所属社群。
步骤202、确定所述待预测对象与社群中实体之间的距离,社群中实体占比,社群中目标行为数据,所述待预测对象的属性数据以及社群属性数据中的至少一项,以得到待预测对象的特征数据。
具体的,待预测对象与社群中实体之间的距离可以通过社群中所有黑名单实体到待预测对象实体之间的距离和来确定。示例性的,待预测对象的所属社群中共有n个黑名单实体,构成黑名单实体集合{black-list},集合中包括号码黑名单实体、地址黑名单实体和设备黑名单实体,待预测对象与集合中第i个实体之间的距离为bi,则待预测对象与社群中黑名单实体之间的距离可以通过来表达。
可选的,待预测对象与社群中实体之间的距离还包括待预测对象与社群中可疑设备实体之间的距离。其中,在知识图谱中,度的概念用来表达一个实体与其他实体之间的关系数量,而可疑设备实体是指社群中的度的数量超过一定阈值的设备实体。示例性的,确定社群中度数超过预设阈值的设备实体为集合{black-device},待预测对象与可疑设备集合中第j个实体之间的距离为dj,则待预测对象与社群中可疑设备实体之间的距离可以通过来表达。
将可疑设备引入是为了增加对待预测对象可信度预测的准确性。因为,一个设备的度越大说明其在信用卡申请时被使用的次数越多,则度数越高说明其风险值越高,因此将可疑设备引入作为信用卡审批的一个参考指标,可以有效对信用卡团伙使用固定的设备进行欺诈申请进行挖掘。
社群中实体占比可以通过社群中黑名单实体占比来表达,用黑名单实体对待预测对象所在社群的整体数据进行表示,可以从一方面反映待预测对象也是黑名单实体的概率。可选的,社群中黑名单实体占比可以用blkPercent来表示,社群中实体总数为N,黑名单实体的数量为n,则blkPercent=n/N。
社群中目标行为数据可以通过来表示,示例性的,社群中在一个月内共有三个用户发起信用卡申请行为,用户集合A={user1,user2,user3},user1发起的信用卡申请行为数量n1为3个,user2发起的信用卡申请行为数量n2为2个,user3发起的信用卡申请行为数量n3为3个,则
待预测对象的属性数据通过银行系统进行确定,用Aum表示。社群属性数据可以用社群中所有申请人和联系人的综合Aum值表示。可选的,用社群中所有申请人和联系人的平均Aum值来表示,即avgAum。Aum值表示了待预测对象的历史交易情况评价,avgAum表示了社群中所有成员的历史交易情况评价。
步骤203、基于可信度预测模型,根据所述待预测对象的特征数据得到待预测对象的可信度。
其中,所述可信度预测模型是根据已知可信度的样本对象的特征数据训练得到,所述样本对象的特征数据确定依据与待预测对象的特征数据确定依据相同。
已知可信度的样本对象包括已知可信度高的样本对象即正样本,以及已知黑名单的样本对象即负样本,负样本为黑名单实体中的黑名单申请人实体和黑名单联系人实体。通过分别构建正样本的特征数据和负样本的特征数据,其特征数据的构建方法与待预测对象的特征数据构建方法相同。
采用决策树、神经网络等分类器训练可信度预测模型,使用构造好的正负样本的特征数据进行训练,得到可信度预测模型后,将待预测对象的特征数据输入到模型中,得到可信度预测结果。示例性的,通过模型得到的可信度预测结果为概率值,当概率值大于预设阈值时判定待预测对象的可信度为高风险,可将其所在社群和该待预测对象提交人工审核进一步确定。人工确定后可将结果反馈至知识图谱中对实体进行标注,进一步提高待预测对象可信度预测的准确性。
可选的,根据待预测对象的可信度确定结果对所述社群的可信度进行确定。当某一社群中黑名单实体的占比超过预设比重时,将该社群判定为高风险社群,则对该社群中的所有待预测对象的信用卡申请予以拒绝,并且可以对该社群中已经通过信用卡申请的实体予以降低额度或停止服务等处理,以减少金融风险,提高银行的效益。
本发明实施例实现了通过可信度预测模型对信用卡申请用户进行自动判定,减少了用户信用卡申请的等待时间,提高了银行的审批效率和用户体验。并且可以对用户所在社群的风险进行判别,及时发现更多的潜在风险客户,对信用卡团伙作案的挖掘度加深。本发明实施例利用了银行已有的大量用户资产信息、黑名单信息,考虑了申请用户与黑名单信息之间的距离因素、自身资产信息等个人因素以及用户所在社群的环境因素,提高对用户的整体判断准确性。并且对于基于用户社群对用户的数据进行确定,可以有效整合社会中与用户有关的社会关系,便于对信用卡团伙欺诈申请的识别。
实施例三
图3是本发明实施例三中的可信度预测装置的结构示意图,本实施例可适用于根据用户的所述社群数据,挖掘信用卡欺诈团伙的情况。如图3所示,该装置包括:
所属社群确定模块310,用于获取执行目标行为的待预测对象,并确定所述待预测对象在知识图谱中的所属社群;
特征数据确定模块320,用于确定所述待预测对象与社群中实体之间的距离,社群中实体占比,以及社群中目标行为数据中的至少一项,以得到待预测对象的特征数据;
可信度确定模块330,用于根据所述待预测对象的特征数据,确定待预测对象的可信度。
本发明实施例基于执行目标行为的待预测对象在知识图谱中的位置确定其所属社群,并根据所属社群确定待预测对象的特征数据。其中,待预测对象的特征数据反映了待预测对象与社群整体之间的关系,可以更好地表达待预测对象与社群中实体之间的关系,根据待预测对象的特征数据对待预测对象的可信度进行预测,可以根据社群中的实体数据对待预测对象进行预测,使得提高对待预测对象可信度的准确性,避免只采用待预测对象的自身属性带来的局限性,影响预测结果的准确性。
可选的,特征数据确定模块320中的确定所述待预测对象与社群中实体之间的距离,具体用于:
确定所述待预测对象与社群中黑名单实体之间的距离;其中所述黑名单实体包括申请人黑名单实体、联系人黑名单实体、设备黑名单实体、地址黑名单实体和号码黑名单实体中的至少一项。
可选的,特征数据确定模块320中的确定社群中实体占比,具体用于:
确定社群中黑名单实体的占比;其中,所述黑名单实体包括申请人黑名单实体、联系人黑名单实体、设备黑名单实体、地址黑名单实体和号码黑名单实体中的至少一项。
可选的,特征数据确定模块320中的确定社群中目标行为数据,具体用于:
确定社群中目标行为数量与实体数量之间的关系。
可选的,特征数据确定模块320,具体用于:
确定所述待预测对象与社群中实体之间的距离,社群中实体占比,社群中目标行为数据,所述待预测对象的属性数据以及社群属性数据中的至少一项,以得到待预测对象的特征数据。
可选的,可信度确定模块330,具体用于:
基于可信度预测模型,根据所述待预测对象的特征数据得到待预测对象的可信度;其中,所述可信度预测模型是根据已知可信度的样本对象的特征数据训练得到,所述样本对象的特征数据确定依据与待预测对象的特征数据确定依据相同。
本发明实施例所提供的可信度预测装置可执行本发明任意实施例所提供的可信度预测方法,具备执行可信度预测方法相应的功能模块和有益效果。
实施例四
图4是本发明实施例四提供的一种计算机设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图4显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储装置28,连接不同系统组件(包括系统存储装置28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储装置总线或者存储装置控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储装置28可以包括易失性存储装置形式的计算机系统可读介质,例如随机存取存储装置(RAM)30和/或高速缓存存储装置32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储装置28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储装置28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储装置28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的可信度预测方法,包括:
获取执行目标行为的待预测对象,并确定所述待预测对象在知识图谱中的所属社群;
确定所述待预测对象与社群中实体之间的距离,社群中实体占比,以及社群中目标行为数据中的至少一项,以得到待预测对象的特征数据;
根据所述待预测对象的特征数据,确定待预测对象的可信度。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的可信度预测方法,包括:
获取执行目标行为的待预测对象,并确定所述待预测对象在知识图谱中的所属社群;
确定所述待预测对象与社群中实体之间的距离,社群中实体占比,以及社群中目标行为数据中的至少一项,以得到待预测对象的特征数据;
根据所述待预测对象的特征数据,确定待预测对象的可信度。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种可信度预测方法,其特征在于,包括:
获取执行目标行为的待预测对象,并确定所述待预测对象在知识图谱中的所属社群;
确定所述待预测对象与社群中实体之间的距离,社群中实体占比,以及社群中目标行为数据中的至少一项,以得到待预测对象的特征数据;
根据所述待预测对象的特征数据,确定待预测对象的可信度。
2.根据权利要求1所述的方法,其特征在于,确定所述待预测对象与社群中实体之间的距离,包括:
确定所述待预测对象与社群中黑名单实体之间的距离;其中所述黑名单实体包括申请人黑名单实体、联系人黑名单实体、设备黑名单实体、地址黑名单实体和号码黑名单实体中的至少一项。
3.根据权利要求1所述的方法,其特征在于,确定社群中实体占比,包括:
确定社群中黑名单实体的占比;其中,所述黑名单实体包括申请人黑名单实体、联系人黑名单实体、设备黑名单实体、地址黑名单实体和号码黑名单实体中的至少一项。
4.根据权利要求1所述的方法,其特征在于,确定社群中目标行为数据,包括:
确定社群中目标行为数量与实体数量之间的关系。
5.根据权利要求1所述的方法,其特征在于,确定所述待预测对象与社群中实体之间的距离,社群中实体占比,以及社群中目标行为数据中的至少一项,以得到待预测对象的特征数据,包括:
确定所述待预测对象与社群中实体之间的距离,社群中实体占比,社群中目标行为数据,所述待预测对象的属性数据以及社群属性数据中的至少一项,以得到待预测对象的特征数据。
6.根据权利要求1所述的方法,其特征在于,根据所述待预测对象的特征数据,确定待预测对象的可信度,包括:
基于可信度预测模型,根据所述待预测对象的特征数据得到待预测对象的可信度;其中,所述可信度预测模型是根据已知可信度的样本对象的特征数据训练得到,所述样本对象的特征数据确定依据与待预测对象的特征数据确定依据相同。
7.一种可信度预测装置,其特征在于,包括:
所属社群确定模块,用于获取执行目标行为的待预测对象,并确定所述待预测对象在知识图谱中的所属社群;
特征数据确定模块,用于确定所述待预测对象与社群中实体之间的距离,社群中实体占比,以及社群中目标行为数据中的至少一项,以得到待预测对象的特征数据;
可信度确定模块,用于根据所述待预测对象的特征数据,确定待预测对象的可信度。
8.根据权利要求7所述的装置,其特征在于,特征数据确定模块中的确定所述待预测对象与社群中实体之间的距离,具体用于:
确定所述待预测对象与社群中黑名单实体之间的距离;其中所述黑名单实体包括申请人黑名单实体、联系人黑名单实体、设备黑名单实体、地址黑名单实体和号码黑名单实体中的至少一项。
9.一种计算机设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的可信度预测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的可信度预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911174701.6A CN110930242B (zh) | 2019-11-26 | 2019-11-26 | 一种可信度预测方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911174701.6A CN110930242B (zh) | 2019-11-26 | 2019-11-26 | 一种可信度预测方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110930242A true CN110930242A (zh) | 2020-03-27 |
CN110930242B CN110930242B (zh) | 2024-02-13 |
Family
ID=69852020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911174701.6A Active CN110930242B (zh) | 2019-11-26 | 2019-11-26 | 一种可信度预测方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110930242B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113313328A (zh) * | 2021-06-30 | 2021-08-27 | 广州酷狗计算机科技有限公司 | 信任参数确定方法、装置、计算机设备和存储介质 |
CN113868438A (zh) * | 2021-11-30 | 2021-12-31 | 平安科技(深圳)有限公司 | 信息可信度的校准方法、装置、计算机设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108492173A (zh) * | 2018-03-23 | 2018-09-04 | 上海氪信信息技术有限公司 | 一种基于双模网络图挖掘算法的信用卡反欺诈预测方法 |
CN108734479A (zh) * | 2018-04-12 | 2018-11-02 | 阿里巴巴集团控股有限公司 | 保险欺诈识别的数据处理方法、装置、设备及服务器 |
CN109191281A (zh) * | 2018-08-21 | 2019-01-11 | 重庆富民银行股份有限公司 | 一种基于知识图谱的团体欺诈识别系统 |
CN109428760A (zh) * | 2017-09-04 | 2019-03-05 | 中国移动通信集团浙江有限公司 | 一种基于运营商数据的用户信用评估方法 |
CN110110093A (zh) * | 2019-04-08 | 2019-08-09 | 深圳众赢维融科技有限公司 | 一种基于知识图谱的识别方法、装置、电子设备及存储介质 |
CN110297912A (zh) * | 2019-05-20 | 2019-10-01 | 平安科技(深圳)有限公司 | 欺诈识别方法、装置、设备及计算机可读存储介质 |
-
2019
- 2019-11-26 CN CN201911174701.6A patent/CN110930242B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109428760A (zh) * | 2017-09-04 | 2019-03-05 | 中国移动通信集团浙江有限公司 | 一种基于运营商数据的用户信用评估方法 |
CN108492173A (zh) * | 2018-03-23 | 2018-09-04 | 上海氪信信息技术有限公司 | 一种基于双模网络图挖掘算法的信用卡反欺诈预测方法 |
CN108734479A (zh) * | 2018-04-12 | 2018-11-02 | 阿里巴巴集团控股有限公司 | 保险欺诈识别的数据处理方法、装置、设备及服务器 |
CN109191281A (zh) * | 2018-08-21 | 2019-01-11 | 重庆富民银行股份有限公司 | 一种基于知识图谱的团体欺诈识别系统 |
CN110110093A (zh) * | 2019-04-08 | 2019-08-09 | 深圳众赢维融科技有限公司 | 一种基于知识图谱的识别方法、装置、电子设备及存储介质 |
CN110297912A (zh) * | 2019-05-20 | 2019-10-01 | 平安科技(深圳)有限公司 | 欺诈识别方法、装置、设备及计算机可读存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113313328A (zh) * | 2021-06-30 | 2021-08-27 | 广州酷狗计算机科技有限公司 | 信任参数确定方法、装置、计算机设备和存储介质 |
CN113868438A (zh) * | 2021-11-30 | 2021-12-31 | 平安科技(深圳)有限公司 | 信息可信度的校准方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110930242B (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Königstorfer et al. | Applications of Artificial Intelligence in commercial banks–A research agenda for behavioral finance | |
CN111340616B (zh) | 线上贷款的审批方法、装置、设备及介质 | |
US10825109B2 (en) | Predicting entity outcomes using taxonomy classifications of transactions | |
CN111429258A (zh) | 一种监测贷款资金流向的方法和装置 | |
US20150262184A1 (en) | Two stage risk model building and evaluation | |
CN111179051A (zh) | 金融目标客户确定方法、装置及电子设备 | |
CN113034046A (zh) | 一种数据风险计量方法、装置、电子设备及存储介质 | |
CN110930242A (zh) | 一种可信度预测方法、装置、设备和存储介质 | |
CN112232950A (zh) | 针对借贷风险的评估方法及装置、设备、计算机可读存储介质 | |
Murugan | Large-scale data-driven financial risk management & analysis using machine learning strategies | |
CN111046184A (zh) | 文本的风险识别方法、装置、服务器和存储介质 | |
CN113554504A (zh) | 一种车贷风控模型生成方法、装置及评分卡生成方法 | |
Li et al. | Credit Risk management of P2P network Lending | |
CN116245630A (zh) | 一种反欺诈检测方法、装置、电子设备及介质 | |
CN115545909A (zh) | 一种审批方法、装置、设备及存储介质 | |
CN114331463A (zh) | 基于线性回归模型的风险识别方法及其相关设备 | |
CN113052512A (zh) | 风险预测方法、装置和电子设备 | |
CN114066624A (zh) | 基于图计算的黑名单关联图谱挖掘方法及系统 | |
CN113159924A (zh) | 授信客户对象的确定方法及装置 | |
Arifah et al. | Artificial Intelligence in Credit Risk Management of Peer-to-Peer Lending Financial Technology: Systematic Literature Review | |
CN112950362A (zh) | 对公贷款的风险预警方法、装置、计算机设备和存储介质 | |
Hargreaves | Machine learning application to identify good credit customers | |
CN114880369A (zh) | 一种基于弱数据技术的风险授信方法和系统 | |
CN111429257A (zh) | 一种交易监控方法和装置 | |
Lee et al. | Application of machine learning in credit risk scorecard |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220920 Address after: 25 Financial Street, Xicheng District, Beijing 100033 Applicant after: CHINA CONSTRUCTION BANK Corp. Address before: 25 Financial Street, Xicheng District, Beijing 100033 Applicant before: CHINA CONSTRUCTION BANK Corp. Applicant before: Jianxin Financial Science and Technology Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |