CN112199414B - 一种金融交易数据的综合分析方法 - Google Patents

一种金融交易数据的综合分析方法 Download PDF

Info

Publication number
CN112199414B
CN112199414B CN202011023401.0A CN202011023401A CN112199414B CN 112199414 B CN112199414 B CN 112199414B CN 202011023401 A CN202011023401 A CN 202011023401A CN 112199414 B CN112199414 B CN 112199414B
Authority
CN
China
Prior art keywords
failure
under
attribute
rule
transaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011023401.0A
Other languages
English (en)
Other versions
CN112199414A (zh
Inventor
梅芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaying Shanghai Information Technology Co ltd
Original Assignee
Huaying Shanghai Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaying Shanghai Information Technology Co ltd filed Critical Huaying Shanghai Information Technology Co ltd
Priority to CN202011023401.0A priority Critical patent/CN112199414B/zh
Publication of CN112199414A publication Critical patent/CN112199414A/zh
Application granted granted Critical
Publication of CN112199414B publication Critical patent/CN112199414B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Finance (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Accounting & Taxation (AREA)
  • Fuzzy Systems (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种金融交易数据的综合分析方法,包括:S1.将待分析的金融交易数据划分到每一个对象下;S2.根据各个对象下的金融交易数据,分析出异常对象;S3.选择其中一个异常对象作为筛选分析的目标金融对象,除选定因素外给定的剩余因素作为目标金融对象的属性;S4.分析目标金融对象的单项异常属性集合D;S5.获取关联规则集合T;S6.基于失败笔数和交易失败率,对关联规则集合T中存在包含关系的关联规则进行合并,得到集合T1;S7.计算集合T1中每一个关联规则的交易失败率,并按照交易失败率从大到小进行优先级排序。本发明能够实现对金融交易数据的综合分析,得到关联规则的优先级排序,有助于快速确定交易失败的原因。

Description

一种金融交易数据的综合分析方法
技术领域
本发明涉及金融数据分析,特别是涉及一种金融交易数据的综合分析方法。
背景技术
就当今社会而言,移动支付已成主流,怎样提交交易成功率增强用户体验是各支付企业及相关商户和银行机构需要关注的问题。支付是一个长链路交易活动,参与方众多,包括:持卡人或者支付用户、商户、收单机构、发卡机构、网联或者银联等相关机构,引起交易失败的因素可能是单个因素,但更多的是多因素组合或者叠加,很多失败因素不能简单通过一个点来判断。
另外,目前交易的成功率都非常高,一般整体交易成功率在99%左右,面对海量的支付交易数据,怎样查找和发现交易失败的问题和原因是非常困难的一件事情。
发明内容
本发明的目的在于克服现有技术的不足,提供一种金融交易数据的综合分析方法,能够实现对金融交易数据的综合分析,得到关联规则的优先级排序,有助于快速确定交易失败的原因。
本发明的目的是通过以下技术方案来实现的:一种金融交易数据的综合分析方法,包括以下步骤:
S1.给定影响金融交易数据质量的多个因素,并选定其中一个因素,获取该因素下不同的对象信息,将待分析的金融交易数据划分到每一个对象下;
S2.根据各个对象下的金融交易数据,分析出异常对象;
S3.选择其中一个异常对象作为筛选分析的目标金融对象,除选定因素外给定的剩余因素作为目标金融对象的属性;
S4.分析目标金融对象的单项异常属性集合D;
S5.根据单项异常属性集合D中的各个单项异常属性,生成关联规则,每一个关联规则由一个或多个单项异常属性构成,并得到关联规则集合T;
S6.基于失败笔数和交易失败率,对关联规则集合T中存在包含关系的关联规则进行合并,得到集合T1;
S7.计算集合T1中每一个关联规则的交易失败率,并按照交易失败率从大到小进行优先级排序,关联规则的优先级排序越靠前,则由该关联规则中各个属性组合引起异常的概率越大。
优选地,所述步骤S1中给定的因素分为卡、通信路线、操作和终端四个方面,其中:
卡方面的因素包括:卡BIN、卡性质和卡介质;
通信路线方面的因素包括:受理机构标识码、发卡机构标识码、发送机构标识码和接收机构标识码;
操作方面的因素包括:交易代码、服务点输入方式和服务点条件代码;
终端方面的因素包括:商户类型、交易渠道、受卡发商户标识代码;
选定的因素为受理机构标识码或发卡机构标识码。
其中,所述步骤S2包括以下子步骤:
S201.计算每一个对象下的交易失败率和失败贡献度:
S2011.设选定的因素下共包含T个对象,统计所有对象失败的金融交易数据总数、每一个对象下的金融交易数据数量以及每一个对象下失败的金融交易数据数量;
S2012.对于第i个对象,计算对应的交易失败率ERi和失败贡献度ECi
Figure BDA0002701399680000021
Figure BDA0002701399680000022
其中,
Figure BDA0002701399680000023
为第i个对象下下失败的金融交易数据数量,Ni为第i个对象下的金融交易数据数量,NE为所有对象失败的金融交易数据总数;
S2013.在i=1,2,...,T时,重复执行步骤S2012,计算出每一个对象下的交易失败率和失败贡献度;
S202.建立投影坐标系,纵坐标为交易失败率,横坐标为失败贡献度,并在设定正常对象的边界条件;所述正常对象的边界条件即对正常对象的交易失败率和失败贡献度的范围限定;
S203.根据各个对象的交易失败率和失败贡献度,将每一个对象投影到坐标系中,并结合正常对象的边界条件,筛选出不在正常对象边界条件内的一个或多个异常对象。
其中,所述步骤S4包括以下子步骤:
S401.基于目标金融对象不同属性下的交易失败率和失败贡献度,获取目标金融对象的单项异常属性集合A,包括:
S4011.对于选择的目标金融对象P,设该对象为选定因素下的第i个对象,统计该异常对象每一个属性下失败的金融交易数据数量;
S4012.对于目标金融对象P下的第j个属性,计算对应的交易失败率ERij和失败贡献度ECij
Figure BDA0002701399680000031
Figure BDA0002701399680000032
其中,
Figure BDA0002701399680000033
表示目标金融对象P第j个属性下失败的金融交易数据数量;j=1,2,...,q;q表示目标金融对象P下的属性数量;
S4013.将目标金融对象P的每一个属性投影到坐标系中,并筛选出不在正常属性的边界条件内的异常属性;
S4014.将目标金融对象的异常属性作为多目标优化的解,根据各个异常属性的交易失败率和失败贡献度确定各个解之间的支配关系:
对于任意两个解任意两个解x(1)、x(2),分如下两种情况:
第一、当|fm(x(1))-fm(x(2))|>d时:如果(1)、(2)两个条件同时成立,那么x(1)支配x(2)即x(1)为x(2)的支配解,如果(1)、(2)不能同时成立,那么x(1)就不支配x(2)
(1)m在集合{1,2}中取任意值时,x(1)的目标函数fmx(1)都不比x(2)的目标函数fmx(2)差,即对任意的m∈{1,2}都有:
fm(x(1))≤fm(x(2));
(2)至少存在一个m∈{1,2}使得x(1)比x(2)严格优,即至少存在一个m使得:
Figure BDA0002701399680000034
第二、当|fm(x(1))-fm(x(2))|≤d时,认为x(1)和x(2)是无差异的,彼此不互相支配;
其中,m=1时fmx(1)、fmx(2)表示x(1)、x(2)的交易失败率,m=2时fmx(1)、fmx(2)表示x(1)、x(2)的失败贡献度;
S4015.对于每一个解,按照确定的支配关系,统计该解的支配解数目;
S4016.将各个解按照支配解数目的从小到大进行排序,支配解数目越少,优先级越高,将其中优先级最高的解保存到一个集合中,形成单项异常属性集合A;
S402.基于目标金融对象的失败应答码信息,分析目标金融对象的单项异常属性集合B,包括:
S4021.将目标金融对象下的失败应答码划分到该对象的每一个属性中;
S4022.统计目标金融对象下的频数信息,并据此计算相关的频率信息;所述频数信息包括:
目标金融对象下的失败应答码出现次数、目标金融对象下的失败应答码种类数目、目标金融对象每一个属性下的失败应答码出现次数、目标金融对象每一种失败应答码下的失败应答码出现次数以及目标金融对象每一个属性下每一种失败应答码的出现次数;所述频率信息包括:目标金融对象下每一个属性的失败应答码出现频率、目标金融对象每一种失败应答码下的失败应答码出现频率以及每一个属性下每一种失败应答码的出现频率;
所述计算过程包括:
A1、设目标金融对象下的失败应答码出现次数为n,目标金融对象下的失败应答码种类数目为q,目标金融对象第i个属性下的失败应答码出现次数为ni,目标金融对象第j种失败应答码下的失败应答码出现出书为nj,目标金融对象第i个属性下第j种失败应答码的出现次数为nij
则:
目标金融对象下第i个属性的失败应答码出现频率为:
Figure BDA0002701399680000041
目标金融对象第j种失败应答码下的失败应答码出现频率为:
Figure BDA0002701399680000042
目标金融对象第i个属性下第j种失败应答码的出现频率为:
Figure BDA0002701399680000043
A2、在i=1,2,...,p,j=1,2,...,q的情况下,获取ni、nj、nij,并按照步骤A1计算pi、pj、pij
S4023.定义每一个属性中各个失败应答码的卡方值,并根据卡方值得到失败应答码的聚集程度,实现对异常属性的筛选:
B1.计算第i个属性下第j个失败应答码的卡方值为:
Figure BDA0002701399680000044
B2.计算第i个属性对应的卡方值为:
Figure BDA0002701399680000051
B3.将各个属性的卡方值与预设阈值进行比较,筛选出卡方值不小于设定阈值的属性,将这些属性保存到一个集合中,得到目标金融对象的单项异常属性集合B;
S403.将单项异常属性集合A与B合并,得到并集D作为最终的单项异常属性集合,并集D中的每一个元素均为该目标金融对象的单项异常属性。
优选地,所述优先级最高的解为一个或多个:
满足条件“支配解数目最少,优先级最高”的解只有一个时,该解即为最优解,单项异常属性集合A中只有一个解;
满足条件“支配解数目最少,优先级最高”的解存在多个时,这些解均为最优解单项异常属性集合中包含多个解,情况下,这种各个最优解的支配解数目相同。
其中,所述步骤S5包括以下子步骤:
S501.统计集合D中的单项异常属性总数M;
S502.从集合D的M个单项异常属性中选择k个单项异常属性组成关联规则,穷举所有选择方式,得到
Figure BDA0002701399680000052
种关联规则;
S503.在k=1,2,...,M时,重复执行步骤S2,得到k取不同值时的所有关联规则,将所有规则加入一个集合中,得到关联规则集合T。
其中,所述步骤S6包括以下子步骤:
S601.对于关联规则集合T中存在包含关系的两个关联规则H1和H2,分别统计关联规则H1和H2下的交易失败笔数;
其中,存在包含关系是指,其中一个关联规则H1中包含另一个关联规则H2中的所有属性,且关联规则H1中的属性数目大于关联规则H2中的属性数目;此时,将关联规则H1称为子规则,关联规则H2称为父规则;
关联规则下的交易失败笔数,等于该关联规则下所有属性的失败交易笔数之和;
关联规则下的交易失败率,等于该关联规则失败交易笔数与目标金融对象金融交易数据数量的比值;
S602.基于交易失败笔数和交易失败率进行关联规则合并:
若关联规则的失败交易率不小于设定阈值:
对于存在包含关系的规则,若子规则的失败量与父规则的失败量相等时,则保留子规则、删除父规则,否则保留父规则、删除子规则;
若关联规则的失败交易率小于设定阈值:
对于存在包含关系的规则,判断子规则的失败交易率是否大于其父规则的失败交易率,若子规则的失败交易率不大于父规则的失败交易率,则丢弃子规则,保留父规则;反之则保留子规则,丢弃父规则。
S603.对于关联规则集合T中存在包含关系的任意两个关联规则,按照步骤S601~S602进行合并,直到所有存在包含关系的关联规则合并完毕,得到新的集合T1。
对于步骤S2得到的每一个异常对象,重复执行步骤S3~S7,即可完成所有异常对象的综合分析。
本发明的有益效果是:本发明基于不同属性下的交易失败率和失败贡献度,筛选出异常属性,并基于支配关系进行多目标优化,得到目标金融对象的单项异常属性集合A,然后基于目标金融对象的失败应答码信息的聚集程度,分析目标金融对象的单项异常属性集合B,再将两个集合进行合并,以实现互相关联,得到较为准确和完整的单项异常属性集合;然后生成关联规则,并进行合并和优先级排序,有助于快速确定交易失败的原因;由于进行异常对象与异常属性筛选时,综合考虑了交易失败率和失败贡献度,故能够有效降低小业务交易数据被淹没的可能性。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
如图1所示,一种金融交易数据的综合分析方法,包括以下步骤:
S1.给定影响金融交易数据质量的多个因素,并选定其中一个因素,获取该因素下不同的对象信息,将待分析的金融交易数据划分到每一个对象下;
S2.根据各个对象下的金融交易数据,分析出异常对象;
S3.选择其中一个异常对象作为筛选分析的目标金融对象,除选定因素外给定的剩余因素作为目标金融对象的属性;
S4.分析目标金融对象的单项异常属性集合D;
S5.根据单项异常属性集合D中的各个单项异常属性,生成关联规则,每一个关联规则由一个或多个单项异常属性构成,并得到关联规则集合T;
S6.基于失败笔数和交易失败率,对关联规则集合T中存在包含关系的关联规则进行合并,得到集合T1;
S7.计算集合T1中每一个关联规则的交易失败率,并按照交易失败率从大到小进行优先级排序,关联规则的优先级排序越靠前,则由该关联规则中各个属性组合引起异常的概率越大。
在本申请的实施例中,所述步骤S1中给定的因素分为卡、通信路线、操作和终端四个方面,其中:
卡方面的因素包括:卡BIN、卡性质和卡介质;
通信路线方面的因素包括:受理机构标识码、发卡机构标识码、发送机构标识码和接收机构标识码;
操作方面的因素包括:交易代码、服务点输入方式和服务点条件代码;
终端方面的因素包括:商户类型、交易渠道、受卡发商户标识代码;
选定的因素为受理机构标识码或发卡机构标识码。例如,选定的因素为受理机构标识码时,由于不同的受理机构标识码对应于不同的受理机构,故该因素下的对象其实就是各个受理机构;选定的因素为发卡机构识别码时,由于不同的发卡机构标识码对应于不同的发卡机构,故该因素的对象其实就是各个发卡机构。
其中,所述步骤S2包括以下子步骤:
S201.计算每一个对象下的交易失败率和失败贡献度:
S2011.设选定的因素下共包含T个对象,统计所有对象失败的金融交易数据总数、每一个对象下的金融交易数据数量以及每一个对象下失败的金融交易数据数量;
S2012.对于第i个对象,计算对应的交易失败率ERi和失败贡献度ECi
Figure BDA0002701399680000071
Figure BDA0002701399680000072
其中,
Figure BDA0002701399680000073
为第i个对象下下失败的金融交易数据数量,Ni为第i个对象下的金融交易数据数量,NE为所有对象失败的金融交易数据总数;
S2013.在i=1,2,...,T时,重复执行步骤S2012,计算出每一个对象下的交易失败率和失败贡献度;
S202.建立投影坐标系,纵坐标为交易失败率,横坐标为失败贡献度,并在设定正常对象的边界条件;所述正常对象的边界条件即对正常对象的交易失败率和失败贡献度的范围限定;
S203.根据各个对象的交易失败率和失败贡献度,将每一个对象投影到坐标系中,并结合正常对象的边界条件,筛选出不在正常对象边界条件内的一个或多个异常对象。
其中,所述步骤S4包括以下子步骤:
S401.基于目标金融对象不同属性下的交易失败率和失败贡献度,获取目标金融对象的单项异常属性集合A,包括:
S4011.对于选择的目标金融对象P,设该对象为选定因素下的第i个对象,统计该异常对象每一个属性下失败的金融交易数据数量;
S4012.对于目标金融对象P下的第j个属性,计算对应的交易失败率ERij和失败贡献度ECij
Figure BDA0002701399680000081
Figure BDA0002701399680000082
其中,
Figure BDA0002701399680000083
表示目标金融对象P第j个属性下失败的金融交易数据数量;j=1,2,...,q;q表示目标金融对象P下的属性数量;
S4013.将目标金融对象P的每一个属性投影到坐标系中,并筛选出不在正常属性的边界条件内的异常属性;
S4014.将目标金融对象的异常属性作为多目标优化的解,根据各个异常属性的交易失败率和失败贡献度确定各个解之间的支配关系:
对于任意两个解任意两个解x(1)、x(2),分如下两种情况:
第一、当|fm(x(1))-fm(x(2))|>d时:如果(1)、(2)两个条件同时成立,那么x(1)支配x(2)即x(1)为x(2)的支配解,如果(1)、(2)不能同时成立,那么x(1)就不支配x(2)
(1)m在集合{1,2}中取任意值时,x(1)的目标函数fmx(1)都不比x(2)的目标函数fmx(2)差,即对任意的m∈{1,2}都有:
fm(x(1))≤fm(x(2));
(2)至少存在一个m∈{1,2}使得x(1)比x(2)严格优,即至少存在一个m使得:
Figure BDA0002701399680000084
第二、当|fm(x(1))-fm(x(2))|≤d时,认为x(1)和x(2)是无差异的,彼此不互相支配;
其中,m=1时fmx(1)、fmx(2)表示x(1)、x(2)的交易失败率,m=2时fmx(1)、fmx(2)表示x(1)、x(2)的失败贡献度;
S4015.对于每一个解,按照确定的支配关系,统计该解的支配解数目;
S4016.将各个解按照支配解数目的从小到大进行排序,支配解数目越少,优先级越高,将其中优先级最高的解保存到一个集合中,形成单项异常属性集合A;
S402.基于目标金融对象的失败应答码信息,分析目标金融对象的单项异常属性集合B,包括:
S4021.将目标金融对象下的失败应答码划分到该对象的每一个属性中;
S4022.统计目标金融对象下的频数信息,并据此计算相关的频率信息;所述频数信息包括:
目标金融对象下的失败应答码出现次数、目标金融对象下的失败应答码种类数目、目标金融对象每一个属性下的失败应答码出现次数、目标金融对象每一种失败应答码下的失败应答码出现次数以及目标金融对象每一个属性下每一种失败应答码的出现次数;所述频率信息包括:目标金融对象下每一个属性的失败应答码出现频率、目标金融对象每一种失败应答码下的失败应答码出现频率以及每一个属性下每一种失败应答码的出现频率;
所述计算过程包括:
A1、设目标金融对象下的失败应答码出现次数为n,目标金融对象下的失败应答码种类数目为q,目标金融对象第i个属性下的失败应答码出现次数为ni,目标金融对象第j种失败应答码下的失败应答码出现出书为nj,目标金融对象第i个属性下第j种失败应答码的出现次数为nij
则:
目标金融对象下第i个属性的失败应答码出现频率为:
Figure BDA0002701399680000091
目标金融对象第j种失败应答码下的失败应答码出现频率为:
Figure BDA0002701399680000092
目标金融对象第i个属性下第j种失败应答码的出现频率为:
Figure BDA0002701399680000093
A2、在i=1,2,...,p,j=1,2,...,q的情况下,获取ni、nj、nij,并按照步骤A1计算pi、pj、pij
在本申请的实施例中,统计的频数信息如下表所示:
Figure BDA0002701399680000101
计算的到的频率信息如下图所示:
Figure BDA0002701399680000102
一个属性对于某个应答码是否有聚集,不能只看nij,pij的绝对值,因为虽然pij大,但若对应的第i属性失败占比pi.很大,或者第j应答码的失败占比p.j很大,则pij大不能说明属性对于某个应答码有聚集。从这一角度看pij-pi.p.j可能更好地反映了问题,因此,定义如下卡方值来分析应答码的聚集;
S4023.定义每一个属性中各个失败应答码的卡方值,并根据卡方值得到失败应答码的聚集程度,实现对异常属性的筛选:
B1.计算第i个属性下第j个失败应答码的卡方值为:
Figure BDA0002701399680000103
B2.计算第i个属性对应的卡方值为:
Figure BDA0002701399680000104
得到的卡方值如下表所示:
Figure BDA0002701399680000105
Figure BDA0002701399680000111
B3.在卡方值较大的属性上,失败应答码的聚集程度最高,由该属性引起交易失败的概率较大,因此因素为异常属性;本申请将各个属性的卡方值与预设阈值进行比较,筛选出卡方值不小于设定阈值的属性,将这些属性保存到一个集合中,得到目标金融对象的单项异常属性集合B;
S403.将单项异常属性集合A与B合并,得到并集D作为最终的单项异常属性集合,并集D中的每一个元素均为该目标金融对象的单项异常属性。
在本申请的实施例中,所述优先级最高的解为一个或多个:
满足条件“支配解数目最少,优先级最高”的解只有一个时,该解即为最优解,单项异常属性集合A中只有一个解;
满足条件“支配解数目最少,优先级最高”的解存在多个时,这些解均为最优解单项异常属性集合中包含多个解,情况下,这种各个最优解的支配解数目相同。
其中,所述步骤S5包括以下子步骤:
S501.统计集合D中的单项异常属性总数M;
S502.从集合D的M个单项异常属性中选择k个单项异常属性组成关联规则,穷举所有选择方式,得到
Figure BDA0002701399680000112
种关联规则;
S503.在k=1,2,...,M时,重复执行步骤S2,得到k取不同值时的所有关联规则,将所有规则加入一个集合中,得到关联规则集合T。
其中,所述步骤S6包括以下子步骤:
S601.对于关联规则集合T中存在包含关系的两个关联规则H1和H2,分别统计关联规则H1和H2下的交易失败笔数;
其中,存在包含关系是指,其中一个关联规则H1中包含另一个关联规则H2中的所有属性,且关联规则H1中的属性数目大于关联规则H2中的属性数目;此时,将关联规则H1称为子规则,关联规则H2称为父规则;
关联规则下的交易失败笔数,等于该关联规则下所有属性的失败交易笔数之和;
关联规则下的交易失败率,等于该关联规则失败交易笔数与目标金融对象金融交易数据数量的比值;
S602.基于交易失败笔数和交易失败率进行关联规则合并:
若关联规则的失败交易率不小于设定阈值:
对于存在包含关系的规则,若子规则的失败量与父规则的失败量相等时,则保留子规则、删除父规则,否则保留父规则、删除子规则;
若关联规则的失败交易率小于设定阈值:
对于存在包含关系的规则,判断子规则的失败交易率是否大于其父规则的失败交易率,若子规则的失败交易率不大于父规则的失败交易率,则丢弃子规则,保留父规则;反之则保留子规则,丢弃父规则。
S603.对于关联规则集合T中存在包含关系的任意两个关联规则,按照步骤S601~S602进行合并,直到所有存在包含关系的关联规则合并完毕,得到新的集合T1。
对于步骤S2得到的每一个异常对象,重复执行步骤S3~S7,即可完成所有异常对象的综合分析。
以上所述是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应该看作是对其他实施例的排除,而可用于其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (6)

1.一种金融交易数据的综合分析方法,其特征在于:包括以下步骤:
S1.给定影响金融交易数据质量的多个因素,并选定其中一个因素,获取该因素下不同的对象信息,将待分析的金融交易数据划分到每一个对象下;
S2.根据各个对象下的金融交易数据,分析出异常对象;
所述步骤S2包括以下子步骤:
S201.计算每一个对象下的交易失败率和失败贡献度:
S2011.设选定的因素下共包含T个对象,统计所有对象失败的金融交易数据总数、每一个对象下的金融交易数据数量以及每一个对象下失败的金融交易数据数量;
S2012.对于第i个对象,计算对应的交易失败率ERi和失败贡献度ECi
Figure FDA0004020557320000011
Figure FDA0004020557320000012
其中,
Figure FDA0004020557320000013
为第i个对象下下失败的金融交易数据数量,Ni为第i个对象下的金融交易数据数量,NE为所有对象失败的金融交易数据总数;
S2013.在i=1,2,...,T时,重复执行步骤S2012,计算出每一个对象下的交易失败率和失败贡献度;
S202.建立投影坐标系,纵坐标为交易失败率,横坐标为失败贡献度,并在设定正常对象的边界条件;所述正常对象的边界条件即对正常对象的交易失败率和失败贡献度的范围限定;
S203.根据各个对象的交易失败率和失败贡献度,将每一个对象投影到坐标系中,并结合正常对象的边界条件,筛选出不在正常对象边界条件内的一个或多个异常对象;
S3.选择其中一个异常对象作为筛选分析的目标金融对象,除选定因素外给定的剩余因素作为目标金融对象的属性;
S4.分析目标金融对象的单项异常属性集合D;
所述步骤S4包括以下子步骤:
S401.基于目标金融对象不同属性下的交易失败率和失败贡献度,获取目标金融对象的单项异常属性集合A,包括:
S4011.对于选择的目标金融对象P,设该对象为选定因素下的第i个对象,统计该异常对象每一个属性下失败的金融交易数据数量;
S4012.对于目标金融对象P下的第j个属性,计算对应的交易失败率ERij和失败贡献度ECij
Figure FDA0004020557320000021
Figure FDA0004020557320000022
其中,
Figure FDA0004020557320000023
表示目标金融对象P第j个属性下失败的金融交易数据数量;j=1,2,...,q;q表示目标金融对象P下的属性数量;
S4013.将目标金融对象P的每一个属性投影到坐标系中,并筛选出不在正常属性的边界条件内的异常属性;
S4014.将目标金融对象的异常属性作为多目标优化的解,根据各个异常属性的交易失败率和失败贡献度确定各个解之间的支配关系:
对于任意两个解任意两个解x(1)、x(2),分如下两种情况:
第一、当fm(x(1))-fm(x(2))>d时:如果(1)、(2)两个条件同时成立,那么x(1)支配x(2)即x(1)为x(2)的支配解,如果(1)、(2)不能同时成立,那么x(1)就不支配x(2)
(1)m在集合{1,2}中取任意值时,x(1)的目标函数fmx(1)都不比x(2)的目标函数fmx(2)差,即对任意的m∈{1,2}都有:
fm(x(1))≤fm(x(2));
(2)至少存在一个m∈{1,2}使得x(1)比x(2)严格优,即至少存在一个m使得:
fm(x(1))<fm(x(2));
第二、当fm(x(1))-fm(x(2))≤d时,认为x(1)和x(2)是无差异的,彼此不互相支配;
其中,m=1时fmx(1)、fmx(2)表示x(1)、x(2)的交易失败率,m=2时fmx(1)、fmx(2)表示x(1)、x(2)的失败贡献度;
S4015.对于每一个解,按照确定的支配关系,统计该解的支配解数目;
S4016.将各个解按照支配解数目的从小到大进行排序,支配解数目越少,优先级越高,将其中优先级最高的解保存到一个集合中,形成单项异常属性集合A;
S402.基于目标金融对象的失败应答码信息,分析目标金融对象的单项异常属性集合B,包括:
S4021.将目标金融对象下的失败应答码划分到该对象的每一个属性中;
S4022.统计目标金融对象下的频数信息,并据此计算相关的频率信息;所述频数信息包括:
目标金融对象下的失败应答码出现次数、目标金融对象下的失败应答码种类数目、目标金融对象每一个属性下的失败应答码出现次数、目标金融对象每一种失败应答码下的失败应答码出现次数以及目标金融对象每一个属性下每一种失败应答码的出现次数;所述频率信息包括:目标金融对象下每一个属性的失败应答码出现频率、目标金融对象每一种失败应答码下的失败应答码出现频率以及每一个属性下每一种失败应答码的出现频率;
所述计算过程包括:
A1、设目标金融对象下的失败应答码出现次数为n,目标金融对象下的失败应答码种类数目为q,目标金融对象第i个属性下的失败应答码出现次数为ni,目标金融对象第j种失败应答码下的失败应答码出现出书为nj,目标金融对象第i个属性下第j种失败应答码的出现次数为nij
则:
目标金融对象下第i个属性的失败应答码出现频率为:
Figure FDA0004020557320000031
目标金融对象第j种失败应答码下的失败应答码出现频率为:
Figure FDA0004020557320000032
目标金融对象第i个属性下第j种失败应答码的出现频率为:
Figure FDA0004020557320000033
A2、在i=1,2,...,p,j=1,2,...,q的情况下,获取ni、nj、nij,并按照步骤A1计算pi、pj、pij
S4023.定义每一个属性中各个失败应答码的卡方值,并根据卡方值得到失败应答码的聚集程度,实现对异常属性的筛选:
B1.计算第i个属性下第j个失败应答码的卡方值为:
Figure FDA0004020557320000034
B2.计算第i个属性对应的卡方值为:
Figure FDA0004020557320000041
B3.将各个属性的卡方值与预设阈值进行比较,筛选出卡方值不小于设定阈值的属性,将这些属性保存到一个集合中,得到目标金融对象的单项异常属性集合B;
S403.将单项异常属性集合A与B合并,得到并集D作为最终的单项异常属性集合,并集D中的每一个元素均为该目标金融对象的单项异常属性;
S5.根据单项异常属性集合D中的各个单项异常属性,生成关联规则,每一个关联规则由一个或多个单项异常属性构成,并得到关联规则集合T;
S6.基于失败笔数和交易失败率,对关联规则集合T中存在包含关系的关联规则进行合并,得到集合T1;
S7.计算集合T1中每一个关联规则的交易失败率,并按照交易失败率从大到小进行优先级排序。
2.根据权利要求1所述的一种金融交易数据的综合分析方法,其特征在于:所述步骤S1中给定的因素分为卡、通信路线、操作和终端四个方面,其中:
卡方面的因素包括:卡BIN、卡性质和卡介质;
通信路线方面的因素包括:受理机构标识码、发卡机构标识码、发送机构标识码和接收机构标识码;
操作方面的因素包括:交易代码、服务点输入方式和服务点条件代码;
终端方面的因素包括:商户类型、交易渠道、受卡发商户标识代码;
选定的因素为受理机构标识码或发卡机构标识码。
3.根据权利要求1所述的一种金融交易数据的综合分析方法,其特征在于:所述优先级最高的解为一个或多个:
满足条件“支配解数目最少,优先级最高”的解只有一个时,该解即为最优解,单项异常属性集合A中只有一个解;
满足条件“支配解数目最少,优先级最高”的解存在多个时,这些解均为最优解单项异常属性集合中包含多个解,情况下,这种各个最优解的支配解数目相同。
4.根据权利要求1所述的一种金融交易数据的综合分析方法,其特征在于:所述步骤S5包括以下子步骤:
S501.统计集合D中的单项异常属性总数M;
S502.从集合D的M个单项异常属性中选择k个单项异常属性组成关联规则,穷举所有选择方式,得到
Figure FDA0004020557320000051
种关联规则;
S503.在k=1,2,...,M时,重复执行步骤S2,得到k取不同值时的所有关联规则,将所有规则加入一个集合中,得到关联规则集合T。
5.根据权利要求1所述的一种金融交易数据的综合分析方法,其特征在于:所述步骤S6包括以下子步骤:
S601.对于关联规则集合T中存在包含关系的两个关联规则H1和H2,分别统计关联规则H1和H2下的交易失败笔数;
其中,存在包含关系是指,其中一个关联规则H1中包含另一个关联规则H2中的所有属性,且关联规则H1中的属性数目大于关联规则H2中的属性数目;此时,将关联规则H1称为子规则,关联规则H2称为父规则;
关联规则下的交易失败笔数,等于该关联规则下所有属性的失败交易笔数之和;
关联规则下的交易失败率,等于该关联规则失败交易笔数与目标金融对象金融交易数据数量的比值;
S602.基于交易失败笔数和交易失败率进行关联规则合并:
若关联规则的失败交易率不小于设定阈值:
对于存在包含关系的规则,若子规则的失败量与父规则的失败量相等时,则保留子规则、删除父规则,否则保留父规则、删除子规则;
若关联规则的失败交易率小于设定阈值:
对于存在包含关系的规则,判断子规则的失败交易率是否大于其父规则的失败交易率,若子规则的失败交易率不大于父规则的失败交易率,则丢弃子规则,保留父规则;反之则保留子规则,丢弃父规则;
S603.对于关联规则集合T中存在包含关系的任意两个关联规则,按照步骤S601~S602进行合并,直到所有存在包含关系的关联规则合并完毕,得到新的集合T1。
6.根据权利要求1所述的一种金融交易数据的综合分析方法,其特征在于:对于步骤S2得到的每一个异常对象,重复执行步骤S3~S7,完成所有异常对象的综合分析。
CN202011023401.0A 2020-09-25 2020-09-25 一种金融交易数据的综合分析方法 Active CN112199414B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011023401.0A CN112199414B (zh) 2020-09-25 2020-09-25 一种金融交易数据的综合分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011023401.0A CN112199414B (zh) 2020-09-25 2020-09-25 一种金融交易数据的综合分析方法

Publications (2)

Publication Number Publication Date
CN112199414A CN112199414A (zh) 2021-01-08
CN112199414B true CN112199414B (zh) 2023-03-21

Family

ID=74006875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011023401.0A Active CN112199414B (zh) 2020-09-25 2020-09-25 一种金融交易数据的综合分析方法

Country Status (1)

Country Link
CN (1) CN112199414B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105590245A (zh) * 2014-12-31 2016-05-18 中国银联股份有限公司 定位电子交易的故障成因的计算机实施方法和数据处理方法
CN106202389A (zh) * 2016-07-08 2016-12-07 中国银联股份有限公司 一种基于交易数据的异常监测方法及装置
CN108960833A (zh) * 2018-08-10 2018-12-07 哈尔滨工业大学(威海) 一种基于异构金融特征的异常交易识别方法,设备及存储介质
CN110390585A (zh) * 2019-07-25 2019-10-29 中国银联股份有限公司 一种识别异常对象的方法及装置
CN110678890A (zh) * 2017-03-16 2020-01-10 世界线公司 经优化平均查准率通过机器学习检测银行交易组中的异常
CN111126828A (zh) * 2019-12-19 2020-05-08 浙江邦盛科技有限公司 一种基于知识图谱的多层资金异常流向监控方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105590245A (zh) * 2014-12-31 2016-05-18 中国银联股份有限公司 定位电子交易的故障成因的计算机实施方法和数据处理方法
CN106202389A (zh) * 2016-07-08 2016-12-07 中国银联股份有限公司 一种基于交易数据的异常监测方法及装置
CN110678890A (zh) * 2017-03-16 2020-01-10 世界线公司 经优化平均查准率通过机器学习检测银行交易组中的异常
CN108960833A (zh) * 2018-08-10 2018-12-07 哈尔滨工业大学(威海) 一种基于异构金融特征的异常交易识别方法,设备及存储介质
CN110390585A (zh) * 2019-07-25 2019-10-29 中国银联股份有限公司 一种识别异常对象的方法及装置
CN111126828A (zh) * 2019-12-19 2020-05-08 浙江邦盛科技有限公司 一种基于知识图谱的多层资金异常流向监控方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于数据挖掘技术的W大型连锁企业持续审计研究;但雨昕;《中国优秀硕士学位论文全文数据库 (经济与管理科学辑)》;20190815;第36-37页 *
多目标优化;AquilaEAG;《CSDN:https://blog.csdn.net/weixin_43202635/article/details/82700342》;20180914;全文 *

Also Published As

Publication number Publication date
CN112199414A (zh) 2021-01-08

Similar Documents

Publication Publication Date Title
US7574402B2 (en) System and method for authorizing electronic payment transactions
US8805737B1 (en) Computer-implemented multiple entity dynamic summarization systems and methods
US7509282B2 (en) Auction system and method
US8065227B1 (en) Method and system for producing custom behavior scores for use in credit decisioning
WO2009134817A1 (en) Method for providing personalized recommendations of financial products based on user data
CN112232950A (zh) 针对借贷风险的评估方法及装置、设备、计算机可读存储介质
CN112199414B (zh) 一种金融交易数据的综合分析方法
RU2396598C1 (ru) Автоматизированная информационно-аналитическая система управления финансовыми рисками
Young Are Financial Statements More Comparable When GAAP Restricts Managers’ Discretion?
Goldmann et al. A new ordinal mixed-data sampling model with an application to corporate credit rating levels
CN112214528A (zh) 一种基于关联分析的金融对象单项异常属性分析方法
CN112823502B (zh) 针对资源访问规则配置的实时反馈服务
CN114240598A (zh) 授信额度模型生成方法、授信额度确定方法、装置
CN113919934A (zh) 一种银行贷款业务评分策略迭代方法
CN112767121A (zh) 一种风险等级数据的处理方法和装置
CN112184431A (zh) 用户风险确定方法和装置
CN110852392A (zh) 一种用户分群方法、装置、设备和介质
CN112214529A (zh) 一种基于多目标优化的金融对象异常因素优先级分析方法
JP3293582B2 (ja) データ分類装置、データ分類方法およびデータ分類用プログラムを記録した記録媒体
US20210192614A1 (en) Systems and methods for determining an affordability index
CN112214527A (zh) 一种基于失败应答码的金融对象异常因素筛选分析方法
CN112214522A (zh) 一种基于双目标投影的金融交易数据异常因素筛选方法
Mensah et al. Wisdom of crowds as a verification tool in bank lending: Evidence from borrowers’ customer tweets
Bellinazzi Forecast of the financial risk using time series analysis
PRODUCT et al. ISTANBUL TECHNICAL UNIVERSITY★ GRADUATE SCHOOL

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant