CN110851540A - 一种基于金融业务图谱的商业银行客户流失预警方法 - Google Patents

一种基于金融业务图谱的商业银行客户流失预警方法 Download PDF

Info

Publication number
CN110851540A
CN110851540A CN201911033024.6A CN201911033024A CN110851540A CN 110851540 A CN110851540 A CN 110851540A CN 201911033024 A CN201911033024 A CN 201911033024A CN 110851540 A CN110851540 A CN 110851540A
Authority
CN
China
Prior art keywords
data
client
importance
early warning
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911033024.6A
Other languages
English (en)
Inventor
张柱
孙越恒
王文俊
潘林
武南南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201911033024.6A priority Critical patent/CN110851540A/zh
Publication of CN110851540A publication Critical patent/CN110851540A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Abstract

本发明属于知识图谱领域,具体涉及一种基于金融业务图谱的商业银行客户流失预警方法,包括如下步骤:首先进行数据清洗与图谱构建,然后计算客户重要性评价指标,最后根据重要性指标变化趋势得到具有流失风险的客户作为最终结果。首先,本方法将理论上的知识图谱和图论中的关键节点识别方法与实际应用领域的客户风险计算结合起来,理论实践相互结合,能在实践中体现理论研究的价值。

Description

一种基于金融业务图谱的商业银行客户流失预警方法
技术领域
本发明属于知识图谱领域,基于金融业务图谱,利用商业银行客户交易记录构建商业银行客户交易网络,根据此网络计算客户节点的多种拓扑结构属性与金融属性随时间变化的趋势,作为客户的重要性变化趋势,综合分析每个客户在各个指标下的重要性变化趋势,找到具有流失风险的客户提供给商业银行已达到预警的作用。
背景技术
真实世界中的各种关系都可以在一定程度上抽象为复杂网络或者说知识图谱,包括人与人的关系、人与物的关系以及物与物之间的关系,通过将这些相互之间的关系进行整合可以形成包含多个个体、多个层次的图谱,真实世界中的个体称为网络中的节点,真实世界中个体之间的关系抽象为网络中的边。商业银行业务系统中包含了多层次、多种类的丰富关系,不仅包含人、产品等实体信息,还有细致全面的事务、交易等事件信息,利用这些信息可以构建融合多元属性的银行业务图谱。这样的图谱包含客户、协议、产品、事件、地理区域等多个层次,层次内部以及层次之间相互关联产生多种类型的边。本部分主要是介绍知识图谱的应用以及客户流失预警中的客户重要性研究的研究现状。
2012年5月17日,Google正式提出知识图谱(Knowledge Graph)的概念,其初衷是为了提高搜索引擎的能力,增强用户的搜索质量以及搜索体验。目前,随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐等领域,垂直行业应用方面,知识图谱已经应用到金融、医疗、电商行业等具体领域。在金融行业中,知识图谱主要被利用来进行反欺诈或者精准营销,具有很强的适用性。
评估节点重要性的方法有很多,本质上都是源于图论以及基于图的数据挖掘。社会网络分析领域来看,一个主流的假设是:节点的重要性等价于该节点与其他节点的连接而使其具有的显著性,度量的方法主要包括节点的度(Degree)、接近度(Closeness)、介数(Betweenness)、信息(Information)、特征向量(Eigenvector)和累计提名(Cumulatednomination)等。系统科学分析领域来看,主要研究成果是系统的“核与核度”理论,通过度量节点(集)被删除后对网络连通的破坏程度来定义其重要性。信息搜索领域来看,计算机科学家也提出了很多算法来判断网页节点的重要程度,其中两个最著名、最有代表性的算法是Brin和Page在1998年提出的PageRank算法和Kleinberg在同一年提出的HITS算法。此后,Lempel和Moran在2000年提出了SALSA算法,它是HITS算法的一个变种,这些算法显式或隐式地对网页节点的重要性进行了计算、排序,在实际的应用中极大地提高了检索结果的质量。在此之后,学者们开始考量节点的相对重要性和局部重要性,Chang,Cohn和McCallum在2000年提出了一种个人化的HITS算法变种,2002年Haveliwala,Jeh和Widom也分别提出了各自的个人化的PageRank算法变种。以上的方法都是从拓扑结构属性上对目标的重要性程度进行判断,应用到具体工业领域时具有一定的局限性。
本方法基于金融业务图谱,首先利用商业银行客户交易记录构建商业银行客户交易网络,目标在于计算客户的重要性程度随时间的变化趋势,在计算客户重要性程度这一方面,本方法充分利用了知识图谱的拓扑结构特性,还综合考虑了商业银行领域的特殊场景,将客户的金融属性也加入重要性程度判断指标体系,综合整个指标体系得到客户的重要性变化趋势,综合分析每个客户在各个指标下的重要性变化趋势,能较为精确地判断客户是否具有流失风险。本方法不论是理论创新方面还是实验效果方面都有很大的突破。
发明内容
本方法主要是从拓扑结构属性和金融属性的多个指标来计算客户的重要性变化趋势,根据客户在多重指标下的重要性变化趋势综合判断是否具有流失风险,将具有流失风险的客户推荐给所属商业银行,帮助商业银行提前采取措施避免客户流失。
本方案主要分为以下三个过程,首先进行数据清洗与图谱构建,然后计算客户重要性评价指标,最后根据重要性指标变化趋势得到具有流失风险的客户作为最终结果。
(1)数据清洗与图谱构建,包含以下步骤(见图1):
a.数据表筛选:从天津市农商银行数据仓库中获取到客户交易相关数据表。
b.表格字段筛选:根据筛选到的数据表,理解其字段含义后选取构建图谱所需的字段,对不需要的字段进行剔除,字段的尽量精简可以提升后期节点拓扑结构属性计算的速度。
c.定时间切片:由于需要计算客户的重要性程度随时间的变化趋势,所以要根据数据分布和密度定下时间切片和步长。
d.数据去重:数据去重即对重合的数据进行筛选,然后剔除多余数据,以此保证数据的唯一性。
e.数据脱密:数据脱密是指在取数据的过程中,对于那些涉及个人隐私的私密数据要进行筛除或者其他隐蔽处理,不能直接取出使用。
f.实体关系抽取:数据清洗完之后,需要抽取图谱中的实体与关系类型,如企业客户实体、个人客户实体、存款协议实体、网银批量转账关系、网银单批转账关系等,这是构建金融业务图谱的重要步骤。
(2)计算客户重要性评价指标,包含以下步骤(见图2):
a.计算各个时间切片内账户级别节点出度、入度、中介中心度、接近中心度,交易金额、交易次数等。
b.计算各个时间切片内客户级别节点出度入度之和、中介中心度、接近中心度,交易金额、平均次交易金额等。
c.针对不同客户和不同指标分别绘制出其重要性分数的变化趋势线(见图3)。
(3)流失风险研判,包含以下步骤:
a.用多项式拟合趋势线(拟合方法见图4)。
b.每个指标下,按照重要性分数趋势线的下降趋势进行排序,剔除无下降趋势或下降趋势不明显的客户数据。
c.对各个指标中剩余的客户进行综合分析,若某客户在多个指标中均有明显下降趋势,则为重点目标,需要作为流失预警的重要关注对象。
有益效果
传统的基于图论的关键节点识别方法以及基于业务的客户风险计算的相关方法都比较多,但是综合两者的方法,基于知识图谱、图论的客户风险计算方法还有很多价值并未被发掘。本方法主要是有以下几个有益效果:
首先,本方法将理论上的知识图谱和图论中的关键节点识别方法与实际应用领域的客户风险计算结合起来,理论实践相互结合,能在实践中体现理论研究的价值。
其次,本方法不同于大部分机器学习方法,无需对数据提前打标签,能更好地与实际生产中的数据环境相融合。
最后,本方法有很好的扩展性,不仅可以应用于商业银行金融业务图谱上的风险客户预警,对于多数服务型行业都具有应用价值,能够帮助企业进行客户管理与精准营销。
附图说明
图1是数据清洗与图谱构建过程;
图2是客户重要性计算过程;
图3是指标分数变化趋势示例;
图4是多项式拟合趋势线方法。
具体实施方式
本文提出的基于金融业务图谱的商业银行客户流失预警方法,主要是应用于商业银行的客户管理、客户风险计算领域,帮助商业银行发现可能流失的客户,提前采取措施。在实际应用时,可按照下面描述的步骤进行:
第一步:从数据库获取用户相关交易数据,包含表的筛选和表中字段的筛选。
第二步:数据预处理和清洗,包含敏感字段的脱密,重复数据的去重等。
第三步:从数据中抽象出实体和关系,据此构建知识图谱。
第四步:在构建的图谱中分别计算用户的各个重要性指标分数。
第五步:确定时间切片后绘制用户各个指标下重要性分数的变化趋势。
第六步:用多项式拟合的方法拟合重要性分数趋势线。
第七步:综合多个指标下用户的重要性程度变化趋势,得出最终结果。
其中,前三步属于发明内容中数据清洗与图谱构建的实施方式,第四步和第五步属于发明内容中计算客户重要性评价指标的实施方式,最后两步对应发明内容中流失风险研判的实际应用方式。
具体实施例
首先进行数据清洗与图谱构建,然后计算客户重要性评价指标,最后根据重要性指标变化趋势得到具有流失风险的客户作为最终结果。
(1)数据清洗与图谱构建,包含以下步骤(见图1):
g.数据表筛选:从天津市农商银行数据仓库中获取到客户交易相关数据表。
h.表格字段筛选:根据筛选到的数据表,理解其字段含义后选取构建图谱所需的字段,对不需要的字段进行剔除,字段的尽量精简可以提升后期节点拓扑结构属性计算的速度。
i.定时间切片:由于需要计算客户的重要性程度随时间的变化趋势,所以要根据数据分布和密度定下时间切片和步长。
j.数据去重:数据去重即对重合的数据进行筛选,然后剔除多余数据,以此保证数据的唯一性。
k.数据脱密:数据脱密是指在取数据的过程中,对于那些涉及个人隐私的私密数据要进行筛除或者其他隐蔽处理,不能直接取出使用。
l.实体关系抽取:数据清洗完之后,需要抽取图谱中的实体与关系类型,如企业客户实体、个人客户实体、存款协议实体、网银批量转账关系、网银单批转账关系等,这是构建金融业务图谱的重要步骤。
(2)计算客户重要性评价指标,包含以下步骤(见图2):
d.计算各个时间切片内账户级别节点出度、入度、中介中心度、接近中心度,交易金额、交易次数等。
e.计算各个时间切片内客户级别节点出度入度之和、中介中心度、接近中心度,交易金额、平均次交易金额等。
f.针对不同客户和不同指标分别绘制出其重要性分数的变化趋势线(见图3)。
(3)流失风险研判,包含以下步骤:
d.用多项式拟合趋势线(拟合方法见图4)。
e.每个指标下,按照重要性分数趋势线的下降趋势进行排序,剔除无下降趋势或下降趋势不明显的客户数据。
f.对各个指标中剩余的客户进行综合分析,若某客户在多个指标中均有明显下降趋势,则为重点目标,需要作为流失预警的重要关注对象。

Claims (4)

1.一种基于金融业务图谱的商业银行客户流失预警方法,其特征在于,包括如下步骤:
首先进行数据清洗与图谱构建,然后计算客户重要性评价指标,最后根据重要性指标变化趋势得到具有流失风险的客户作为最终结果。
2.根据权利要求1所述的一种基于金融业务图谱的商业银行客户流失预警方法,其特征在于,所述数据清洗与图谱构建,包含以下步骤:
a.数据表筛选:数据仓库中获取到客户交易相关数据表;
b.表格字段筛选:根据筛选到的数据表,理解其字段含义后选取构建图谱所需的字段,
对不需要的字段进行剔除,字段的尽量精简可以提升后期节点拓扑结构属性计算的速度;
c.定时间切片:根据数据分布和密度定下时间切片和步长;
d.数据去重:数据去重即对重合的数据进行筛选,然后剔除多余数据;
e.数据脱密:数据脱密是指在取数据的过程中,对于那些涉及个人隐私的私密数据要进行筛除或者其他隐蔽处理,不能直接取出使用;
f.实体关系抽取:数据清洗完之后,需要抽取图谱中的实体与关系类型。
3.根据权利要求1所述的一种基于金融业务图谱的商业银行客户流失预警方法,其特征在于,所述计算客户重要性评价指标,包含以下步骤:
a.计算各个时间切片内账户级别节点出度、入度、中介中心度、接近中心度,包括交易金额、交易次数;
b.计算各个时间切片内客户级别节点出度入度之和、中介中心度、接近中心度,包括交易金额、平均次交易金额;
c.针对不同客户和不同指标分别绘制出其重要性分数的变化趋势线。
4.根据权利要求1所述的一种基于金融业务图谱的商业银行客户流失预警方法,其特征在于,所述流失风险研判,包含以下步骤:
a.用多项式拟合趋势线;
b.每个指标下,按照重要性分数趋势线的下降趋势进行排序,剔除无下降趋势或下降趋势不明显的客户数据;
c.对各个指标中剩余的客户进行综合分析,若某客户在多个指标中均有明显下降趋势,则为重点目标,需要作为流失预警的重要关注对象。
CN201911033024.6A 2019-10-28 2019-10-28 一种基于金融业务图谱的商业银行客户流失预警方法 Pending CN110851540A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911033024.6A CN110851540A (zh) 2019-10-28 2019-10-28 一种基于金融业务图谱的商业银行客户流失预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911033024.6A CN110851540A (zh) 2019-10-28 2019-10-28 一种基于金融业务图谱的商业银行客户流失预警方法

Publications (1)

Publication Number Publication Date
CN110851540A true CN110851540A (zh) 2020-02-28

Family

ID=69599633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911033024.6A Pending CN110851540A (zh) 2019-10-28 2019-10-28 一种基于金融业务图谱的商业银行客户流失预警方法

Country Status (1)

Country Link
CN (1) CN110851540A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111951052A (zh) * 2020-08-14 2020-11-17 中国工商银行股份有限公司 基于知识图谱的获取潜在客户方法及装置
CN113570141A (zh) * 2021-07-29 2021-10-29 上海明略人工智能(集团)有限公司 一种用户流失预警方法、系统、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101996381A (zh) * 2009-08-14 2011-03-30 中国工商银行股份有限公司 一种零售资产风险的计算方法及系统
CN103854065A (zh) * 2012-11-30 2014-06-11 西门子公司 一种用于客户流失预测的方法和装置
CN106327032A (zh) * 2015-06-15 2017-01-11 阿里巴巴集团控股有限公司 一种用于客户流失预警的数据分析方法和装置
CN110033279A (zh) * 2019-04-04 2019-07-19 银清科技(北京)有限公司 基于知识图谱技术的可疑账户交易确认方法及装置
CN110322085A (zh) * 2018-03-29 2019-10-11 北京九章云极科技有限公司 一种客户流失预测方法和装置
CN110335138A (zh) * 2019-06-21 2019-10-15 上海淇馥信息技术有限公司 一种预测客群资质变化的风险预警方法、装置和电子设备
CN110348914A (zh) * 2019-07-19 2019-10-18 中国银行股份有限公司 客户流失数据分析方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101996381A (zh) * 2009-08-14 2011-03-30 中国工商银行股份有限公司 一种零售资产风险的计算方法及系统
CN103854065A (zh) * 2012-11-30 2014-06-11 西门子公司 一种用于客户流失预测的方法和装置
CN106327032A (zh) * 2015-06-15 2017-01-11 阿里巴巴集团控股有限公司 一种用于客户流失预警的数据分析方法和装置
CN110322085A (zh) * 2018-03-29 2019-10-11 北京九章云极科技有限公司 一种客户流失预测方法和装置
CN110033279A (zh) * 2019-04-04 2019-07-19 银清科技(北京)有限公司 基于知识图谱技术的可疑账户交易确认方法及装置
CN110335138A (zh) * 2019-06-21 2019-10-15 上海淇馥信息技术有限公司 一种预测客群资质变化的风险预警方法、装置和电子设备
CN110348914A (zh) * 2019-07-19 2019-10-18 中国银行股份有限公司 客户流失数据分析方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111951052A (zh) * 2020-08-14 2020-11-17 中国工商银行股份有限公司 基于知识图谱的获取潜在客户方法及装置
CN111951052B (zh) * 2020-08-14 2023-10-13 中国工商银行股份有限公司 基于知识图谱的获取潜在客户方法及装置
CN113570141A (zh) * 2021-07-29 2021-10-29 上海明略人工智能(集团)有限公司 一种用户流失预警方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
Lee et al. Measurements, analyses, and insights on the entire ethereum blockchain network
CN106453357A (zh) 一种网络购票异常行为的识别方法、系统及设备
CN106844407B (zh) 基于数据集相关性的标签网络产生方法和系统
CN106776781B (zh) 一种人群关系网络分析方法及装置
CN107077486A (zh) 情感评价系统和方法
CN111340246A (zh) 用于企业智能决策分析的处理方法、装置和计算机设备
CN106897930A (zh) 一种信用评估的方法及装置
CN107895038A (zh) 一种链路预测关系推荐方法及装置
Sriramoju Review on Big Data and Mining Algorithm
Jindal et al. Construction of domain ontology utilizing formal concept analysis and social media analytics
CN110851540A (zh) 一种基于金融业务图谱的商业银行客户流失预警方法
CN106708871A (zh) 一种社交业务特征用户的识别方法和装置
CN113506113B (zh) 一种基于关联网络的信用卡套现团伙挖掘方法及系统
CN111259167A (zh) 用户请求风险识别方法及装置
Fang et al. A review of Chinese e-commerce research: 2001–2020
Girish et al. Mining the web data for classifying and predicting users’ requests
CN116523598A (zh) 一种医疗器械推荐方法、系统、存储介质
Macwan et al. Privacy preservation approaches for social network data publishing
Li et al. GeoDenStream: An improved DenStream clustering method for managing entity data within geographical data streams
CN110717089A (zh) 一种基于网络日志的用户行为分析系统及方法
Fan et al. Spatially enabled customer segmentation using a data classification method with uncertain predicates
CN110162521A (zh) 一种支付系统交易数据处理方法及系统
CN115840738A (zh) 一种数据迁移方法、装置、电子设备及存储介质
Ding et al. [Retracted] Clustering Merchants and Accurate Marketing of Products Using the Segmentation Tree Vector Space Model
Wang et al. A Markov logic network method for reconstructing association rule-mining tasks in library book recommendation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200228

WD01 Invention patent application deemed withdrawn after publication