CN112199414B - 一种金融交易数据的综合分析方法 - Google Patents
一种金融交易数据的综合分析方法 Download PDFInfo
- Publication number
- CN112199414B CN112199414B CN202011023401.0A CN202011023401A CN112199414B CN 112199414 B CN112199414 B CN 112199414B CN 202011023401 A CN202011023401 A CN 202011023401A CN 112199414 B CN112199414 B CN 112199414B
- Authority
- CN
- China
- Prior art keywords
- failure
- under
- attribute
- rule
- transaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24564—Applying rules; Deductive queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Finance (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Accounting & Taxation (AREA)
- Fuzzy Systems (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种金融交易数据的综合分析方法,包括:S1.将待分析的金融交易数据划分到每一个对象下;S2.根据各个对象下的金融交易数据,分析出异常对象;S3.选择其中一个异常对象作为筛选分析的目标金融对象,除选定因素外给定的剩余因素作为目标金融对象的属性;S4.分析目标金融对象的单项异常属性集合D;S5.获取关联规则集合T;S6.基于失败笔数和交易失败率,对关联规则集合T中存在包含关系的关联规则进行合并,得到集合T1;S7.计算集合T1中每一个关联规则的交易失败率,并按照交易失败率从大到小进行优先级排序。本发明能够实现对金融交易数据的综合分析,得到关联规则的优先级排序,有助于快速确定交易失败的原因。
Description
技术领域
本发明涉及金融数据分析,特别是涉及一种金融交易数据的综合分析方法。
背景技术
就当今社会而言,移动支付已成主流,怎样提交交易成功率增强用户体验是各支付企业及相关商户和银行机构需要关注的问题。支付是一个长链路交易活动,参与方众多,包括:持卡人或者支付用户、商户、收单机构、发卡机构、网联或者银联等相关机构,引起交易失败的因素可能是单个因素,但更多的是多因素组合或者叠加,很多失败因素不能简单通过一个点来判断。
另外,目前交易的成功率都非常高,一般整体交易成功率在99%左右,面对海量的支付交易数据,怎样查找和发现交易失败的问题和原因是非常困难的一件事情。
发明内容
本发明的目的在于克服现有技术的不足,提供一种金融交易数据的综合分析方法,能够实现对金融交易数据的综合分析,得到关联规则的优先级排序,有助于快速确定交易失败的原因。
本发明的目的是通过以下技术方案来实现的:一种金融交易数据的综合分析方法,包括以下步骤:
S1.给定影响金融交易数据质量的多个因素,并选定其中一个因素,获取该因素下不同的对象信息,将待分析的金融交易数据划分到每一个对象下;
S2.根据各个对象下的金融交易数据,分析出异常对象;
S3.选择其中一个异常对象作为筛选分析的目标金融对象,除选定因素外给定的剩余因素作为目标金融对象的属性;
S4.分析目标金融对象的单项异常属性集合D;
S5.根据单项异常属性集合D中的各个单项异常属性,生成关联规则,每一个关联规则由一个或多个单项异常属性构成,并得到关联规则集合T;
S6.基于失败笔数和交易失败率,对关联规则集合T中存在包含关系的关联规则进行合并,得到集合T1;
S7.计算集合T1中每一个关联规则的交易失败率,并按照交易失败率从大到小进行优先级排序,关联规则的优先级排序越靠前,则由该关联规则中各个属性组合引起异常的概率越大。
优选地,所述步骤S1中给定的因素分为卡、通信路线、操作和终端四个方面,其中:
卡方面的因素包括:卡BIN、卡性质和卡介质;
通信路线方面的因素包括:受理机构标识码、发卡机构标识码、发送机构标识码和接收机构标识码;
操作方面的因素包括:交易代码、服务点输入方式和服务点条件代码;
终端方面的因素包括:商户类型、交易渠道、受卡发商户标识代码;
选定的因素为受理机构标识码或发卡机构标识码。
其中,所述步骤S2包括以下子步骤:
S201.计算每一个对象下的交易失败率和失败贡献度:
S2011.设选定的因素下共包含T个对象,统计所有对象失败的金融交易数据总数、每一个对象下的金融交易数据数量以及每一个对象下失败的金融交易数据数量;
S2012.对于第i个对象,计算对应的交易失败率ERi和失败贡献度ECi:
S2013.在i=1,2,...,T时,重复执行步骤S2012,计算出每一个对象下的交易失败率和失败贡献度;
S202.建立投影坐标系,纵坐标为交易失败率,横坐标为失败贡献度,并在设定正常对象的边界条件;所述正常对象的边界条件即对正常对象的交易失败率和失败贡献度的范围限定;
S203.根据各个对象的交易失败率和失败贡献度,将每一个对象投影到坐标系中,并结合正常对象的边界条件,筛选出不在正常对象边界条件内的一个或多个异常对象。
其中,所述步骤S4包括以下子步骤:
S401.基于目标金融对象不同属性下的交易失败率和失败贡献度,获取目标金融对象的单项异常属性集合A,包括:
S4011.对于选择的目标金融对象P,设该对象为选定因素下的第i个对象,统计该异常对象每一个属性下失败的金融交易数据数量;
S4012.对于目标金融对象P下的第j个属性,计算对应的交易失败率ERij和失败贡献度ECij:
S4013.将目标金融对象P的每一个属性投影到坐标系中,并筛选出不在正常属性的边界条件内的异常属性;
S4014.将目标金融对象的异常属性作为多目标优化的解,根据各个异常属性的交易失败率和失败贡献度确定各个解之间的支配关系:
对于任意两个解任意两个解x(1)、x(2),分如下两种情况:
第一、当|fm(x(1))-fm(x(2))|>d时:如果(1)、(2)两个条件同时成立,那么x(1)支配x(2)即x(1)为x(2)的支配解,如果(1)、(2)不能同时成立,那么x(1)就不支配x(2);
(1)m在集合{1,2}中取任意值时,x(1)的目标函数fmx(1)都不比x(2)的目标函数fmx(2)差,即对任意的m∈{1,2}都有:
fm(x(1))≤fm(x(2));
(2)至少存在一个m∈{1,2}使得x(1)比x(2)严格优,即至少存在一个m使得:
第二、当|fm(x(1))-fm(x(2))|≤d时,认为x(1)和x(2)是无差异的,彼此不互相支配;
其中,m=1时fmx(1)、fmx(2)表示x(1)、x(2)的交易失败率,m=2时fmx(1)、fmx(2)表示x(1)、x(2)的失败贡献度;
S4015.对于每一个解,按照确定的支配关系,统计该解的支配解数目;
S4016.将各个解按照支配解数目的从小到大进行排序,支配解数目越少,优先级越高,将其中优先级最高的解保存到一个集合中,形成单项异常属性集合A;
S402.基于目标金融对象的失败应答码信息,分析目标金融对象的单项异常属性集合B,包括:
S4021.将目标金融对象下的失败应答码划分到该对象的每一个属性中;
S4022.统计目标金融对象下的频数信息,并据此计算相关的频率信息;所述频数信息包括:
目标金融对象下的失败应答码出现次数、目标金融对象下的失败应答码种类数目、目标金融对象每一个属性下的失败应答码出现次数、目标金融对象每一种失败应答码下的失败应答码出现次数以及目标金融对象每一个属性下每一种失败应答码的出现次数;所述频率信息包括:目标金融对象下每一个属性的失败应答码出现频率、目标金融对象每一种失败应答码下的失败应答码出现频率以及每一个属性下每一种失败应答码的出现频率;
所述计算过程包括:
A1、设目标金融对象下的失败应答码出现次数为n,目标金融对象下的失败应答码种类数目为q,目标金融对象第i个属性下的失败应答码出现次数为ni,目标金融对象第j种失败应答码下的失败应答码出现出书为nj,目标金融对象第i个属性下第j种失败应答码的出现次数为nij;
则:
目标金融对象下第i个属性的失败应答码出现频率为:
目标金融对象第j种失败应答码下的失败应答码出现频率为:
目标金融对象第i个属性下第j种失败应答码的出现频率为:
A2、在i=1,2,...,p,j=1,2,...,q的情况下,获取ni、nj、nij,并按照步骤A1计算pi、pj、pij;
S4023.定义每一个属性中各个失败应答码的卡方值,并根据卡方值得到失败应答码的聚集程度,实现对异常属性的筛选:
B1.计算第i个属性下第j个失败应答码的卡方值为:
B2.计算第i个属性对应的卡方值为:
B3.将各个属性的卡方值与预设阈值进行比较,筛选出卡方值不小于设定阈值的属性,将这些属性保存到一个集合中,得到目标金融对象的单项异常属性集合B;
S403.将单项异常属性集合A与B合并,得到并集D作为最终的单项异常属性集合,并集D中的每一个元素均为该目标金融对象的单项异常属性。
优选地,所述优先级最高的解为一个或多个:
满足条件“支配解数目最少,优先级最高”的解只有一个时,该解即为最优解,单项异常属性集合A中只有一个解;
满足条件“支配解数目最少,优先级最高”的解存在多个时,这些解均为最优解单项异常属性集合中包含多个解,情况下,这种各个最优解的支配解数目相同。
其中,所述步骤S5包括以下子步骤:
S501.统计集合D中的单项异常属性总数M;
S503.在k=1,2,...,M时,重复执行步骤S2,得到k取不同值时的所有关联规则,将所有规则加入一个集合中,得到关联规则集合T。
其中,所述步骤S6包括以下子步骤:
S601.对于关联规则集合T中存在包含关系的两个关联规则H1和H2,分别统计关联规则H1和H2下的交易失败笔数;
其中,存在包含关系是指,其中一个关联规则H1中包含另一个关联规则H2中的所有属性,且关联规则H1中的属性数目大于关联规则H2中的属性数目;此时,将关联规则H1称为子规则,关联规则H2称为父规则;
关联规则下的交易失败笔数,等于该关联规则下所有属性的失败交易笔数之和;
关联规则下的交易失败率,等于该关联规则失败交易笔数与目标金融对象金融交易数据数量的比值;
S602.基于交易失败笔数和交易失败率进行关联规则合并:
若关联规则的失败交易率不小于设定阈值:
对于存在包含关系的规则,若子规则的失败量与父规则的失败量相等时,则保留子规则、删除父规则,否则保留父规则、删除子规则;
若关联规则的失败交易率小于设定阈值:
对于存在包含关系的规则,判断子规则的失败交易率是否大于其父规则的失败交易率,若子规则的失败交易率不大于父规则的失败交易率,则丢弃子规则,保留父规则;反之则保留子规则,丢弃父规则。
S603.对于关联规则集合T中存在包含关系的任意两个关联规则,按照步骤S601~S602进行合并,直到所有存在包含关系的关联规则合并完毕,得到新的集合T1。
对于步骤S2得到的每一个异常对象,重复执行步骤S3~S7,即可完成所有异常对象的综合分析。
本发明的有益效果是:本发明基于不同属性下的交易失败率和失败贡献度,筛选出异常属性,并基于支配关系进行多目标优化,得到目标金融对象的单项异常属性集合A,然后基于目标金融对象的失败应答码信息的聚集程度,分析目标金融对象的单项异常属性集合B,再将两个集合进行合并,以实现互相关联,得到较为准确和完整的单项异常属性集合;然后生成关联规则,并进行合并和优先级排序,有助于快速确定交易失败的原因;由于进行异常对象与异常属性筛选时,综合考虑了交易失败率和失败贡献度,故能够有效降低小业务交易数据被淹没的可能性。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
如图1所示,一种金融交易数据的综合分析方法,包括以下步骤:
S1.给定影响金融交易数据质量的多个因素,并选定其中一个因素,获取该因素下不同的对象信息,将待分析的金融交易数据划分到每一个对象下;
S2.根据各个对象下的金融交易数据,分析出异常对象;
S3.选择其中一个异常对象作为筛选分析的目标金融对象,除选定因素外给定的剩余因素作为目标金融对象的属性;
S4.分析目标金融对象的单项异常属性集合D;
S5.根据单项异常属性集合D中的各个单项异常属性,生成关联规则,每一个关联规则由一个或多个单项异常属性构成,并得到关联规则集合T;
S6.基于失败笔数和交易失败率,对关联规则集合T中存在包含关系的关联规则进行合并,得到集合T1;
S7.计算集合T1中每一个关联规则的交易失败率,并按照交易失败率从大到小进行优先级排序,关联规则的优先级排序越靠前,则由该关联规则中各个属性组合引起异常的概率越大。
在本申请的实施例中,所述步骤S1中给定的因素分为卡、通信路线、操作和终端四个方面,其中:
卡方面的因素包括:卡BIN、卡性质和卡介质;
通信路线方面的因素包括:受理机构标识码、发卡机构标识码、发送机构标识码和接收机构标识码;
操作方面的因素包括:交易代码、服务点输入方式和服务点条件代码;
终端方面的因素包括:商户类型、交易渠道、受卡发商户标识代码;
选定的因素为受理机构标识码或发卡机构标识码。例如,选定的因素为受理机构标识码时,由于不同的受理机构标识码对应于不同的受理机构,故该因素下的对象其实就是各个受理机构;选定的因素为发卡机构识别码时,由于不同的发卡机构标识码对应于不同的发卡机构,故该因素的对象其实就是各个发卡机构。
其中,所述步骤S2包括以下子步骤:
S201.计算每一个对象下的交易失败率和失败贡献度:
S2011.设选定的因素下共包含T个对象,统计所有对象失败的金融交易数据总数、每一个对象下的金融交易数据数量以及每一个对象下失败的金融交易数据数量;
S2012.对于第i个对象,计算对应的交易失败率ERi和失败贡献度ECi:
S2013.在i=1,2,...,T时,重复执行步骤S2012,计算出每一个对象下的交易失败率和失败贡献度;
S202.建立投影坐标系,纵坐标为交易失败率,横坐标为失败贡献度,并在设定正常对象的边界条件;所述正常对象的边界条件即对正常对象的交易失败率和失败贡献度的范围限定;
S203.根据各个对象的交易失败率和失败贡献度,将每一个对象投影到坐标系中,并结合正常对象的边界条件,筛选出不在正常对象边界条件内的一个或多个异常对象。
其中,所述步骤S4包括以下子步骤:
S401.基于目标金融对象不同属性下的交易失败率和失败贡献度,获取目标金融对象的单项异常属性集合A,包括:
S4011.对于选择的目标金融对象P,设该对象为选定因素下的第i个对象,统计该异常对象每一个属性下失败的金融交易数据数量;
S4012.对于目标金融对象P下的第j个属性,计算对应的交易失败率ERij和失败贡献度ECij:
S4013.将目标金融对象P的每一个属性投影到坐标系中,并筛选出不在正常属性的边界条件内的异常属性;
S4014.将目标金融对象的异常属性作为多目标优化的解,根据各个异常属性的交易失败率和失败贡献度确定各个解之间的支配关系:
对于任意两个解任意两个解x(1)、x(2),分如下两种情况:
第一、当|fm(x(1))-fm(x(2))|>d时:如果(1)、(2)两个条件同时成立,那么x(1)支配x(2)即x(1)为x(2)的支配解,如果(1)、(2)不能同时成立,那么x(1)就不支配x(2);
(1)m在集合{1,2}中取任意值时,x(1)的目标函数fmx(1)都不比x(2)的目标函数fmx(2)差,即对任意的m∈{1,2}都有:
fm(x(1))≤fm(x(2));
(2)至少存在一个m∈{1,2}使得x(1)比x(2)严格优,即至少存在一个m使得:
第二、当|fm(x(1))-fm(x(2))|≤d时,认为x(1)和x(2)是无差异的,彼此不互相支配;
其中,m=1时fmx(1)、fmx(2)表示x(1)、x(2)的交易失败率,m=2时fmx(1)、fmx(2)表示x(1)、x(2)的失败贡献度;
S4015.对于每一个解,按照确定的支配关系,统计该解的支配解数目;
S4016.将各个解按照支配解数目的从小到大进行排序,支配解数目越少,优先级越高,将其中优先级最高的解保存到一个集合中,形成单项异常属性集合A;
S402.基于目标金融对象的失败应答码信息,分析目标金融对象的单项异常属性集合B,包括:
S4021.将目标金融对象下的失败应答码划分到该对象的每一个属性中;
S4022.统计目标金融对象下的频数信息,并据此计算相关的频率信息;所述频数信息包括:
目标金融对象下的失败应答码出现次数、目标金融对象下的失败应答码种类数目、目标金融对象每一个属性下的失败应答码出现次数、目标金融对象每一种失败应答码下的失败应答码出现次数以及目标金融对象每一个属性下每一种失败应答码的出现次数;所述频率信息包括:目标金融对象下每一个属性的失败应答码出现频率、目标金融对象每一种失败应答码下的失败应答码出现频率以及每一个属性下每一种失败应答码的出现频率;
所述计算过程包括:
A1、设目标金融对象下的失败应答码出现次数为n,目标金融对象下的失败应答码种类数目为q,目标金融对象第i个属性下的失败应答码出现次数为ni,目标金融对象第j种失败应答码下的失败应答码出现出书为nj,目标金融对象第i个属性下第j种失败应答码的出现次数为nij;
则:
目标金融对象下第i个属性的失败应答码出现频率为:
目标金融对象第j种失败应答码下的失败应答码出现频率为:
目标金融对象第i个属性下第j种失败应答码的出现频率为:
A2、在i=1,2,...,p,j=1,2,...,q的情况下,获取ni、nj、nij,并按照步骤A1计算pi、pj、pij;
在本申请的实施例中,统计的频数信息如下表所示:
计算的到的频率信息如下图所示:
一个属性对于某个应答码是否有聚集,不能只看nij,pij的绝对值,因为虽然pij大,但若对应的第i属性失败占比pi.很大,或者第j应答码的失败占比p.j很大,则pij大不能说明属性对于某个应答码有聚集。从这一角度看pij-pi.p.j可能更好地反映了问题,因此,定义如下卡方值来分析应答码的聚集;
S4023.定义每一个属性中各个失败应答码的卡方值,并根据卡方值得到失败应答码的聚集程度,实现对异常属性的筛选:
B1.计算第i个属性下第j个失败应答码的卡方值为:
B2.计算第i个属性对应的卡方值为:
得到的卡方值如下表所示:
B3.在卡方值较大的属性上,失败应答码的聚集程度最高,由该属性引起交易失败的概率较大,因此因素为异常属性;本申请将各个属性的卡方值与预设阈值进行比较,筛选出卡方值不小于设定阈值的属性,将这些属性保存到一个集合中,得到目标金融对象的单项异常属性集合B;
S403.将单项异常属性集合A与B合并,得到并集D作为最终的单项异常属性集合,并集D中的每一个元素均为该目标金融对象的单项异常属性。
在本申请的实施例中,所述优先级最高的解为一个或多个:
满足条件“支配解数目最少,优先级最高”的解只有一个时,该解即为最优解,单项异常属性集合A中只有一个解;
满足条件“支配解数目最少,优先级最高”的解存在多个时,这些解均为最优解单项异常属性集合中包含多个解,情况下,这种各个最优解的支配解数目相同。
其中,所述步骤S5包括以下子步骤:
S501.统计集合D中的单项异常属性总数M;
S503.在k=1,2,...,M时,重复执行步骤S2,得到k取不同值时的所有关联规则,将所有规则加入一个集合中,得到关联规则集合T。
其中,所述步骤S6包括以下子步骤:
S601.对于关联规则集合T中存在包含关系的两个关联规则H1和H2,分别统计关联规则H1和H2下的交易失败笔数;
其中,存在包含关系是指,其中一个关联规则H1中包含另一个关联规则H2中的所有属性,且关联规则H1中的属性数目大于关联规则H2中的属性数目;此时,将关联规则H1称为子规则,关联规则H2称为父规则;
关联规则下的交易失败笔数,等于该关联规则下所有属性的失败交易笔数之和;
关联规则下的交易失败率,等于该关联规则失败交易笔数与目标金融对象金融交易数据数量的比值;
S602.基于交易失败笔数和交易失败率进行关联规则合并:
若关联规则的失败交易率不小于设定阈值:
对于存在包含关系的规则,若子规则的失败量与父规则的失败量相等时,则保留子规则、删除父规则,否则保留父规则、删除子规则;
若关联规则的失败交易率小于设定阈值:
对于存在包含关系的规则,判断子规则的失败交易率是否大于其父规则的失败交易率,若子规则的失败交易率不大于父规则的失败交易率,则丢弃子规则,保留父规则;反之则保留子规则,丢弃父规则。
S603.对于关联规则集合T中存在包含关系的任意两个关联规则,按照步骤S601~S602进行合并,直到所有存在包含关系的关联规则合并完毕,得到新的集合T1。
对于步骤S2得到的每一个异常对象,重复执行步骤S3~S7,即可完成所有异常对象的综合分析。
以上所述是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应该看作是对其他实施例的排除,而可用于其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (6)
1.一种金融交易数据的综合分析方法,其特征在于:包括以下步骤:
S1.给定影响金融交易数据质量的多个因素,并选定其中一个因素,获取该因素下不同的对象信息,将待分析的金融交易数据划分到每一个对象下;
S2.根据各个对象下的金融交易数据,分析出异常对象;
所述步骤S2包括以下子步骤:
S201.计算每一个对象下的交易失败率和失败贡献度:
S2011.设选定的因素下共包含T个对象,统计所有对象失败的金融交易数据总数、每一个对象下的金融交易数据数量以及每一个对象下失败的金融交易数据数量;
S2012.对于第i个对象,计算对应的交易失败率ERi和失败贡献度ECi:
S2013.在i=1,2,...,T时,重复执行步骤S2012,计算出每一个对象下的交易失败率和失败贡献度;
S202.建立投影坐标系,纵坐标为交易失败率,横坐标为失败贡献度,并在设定正常对象的边界条件;所述正常对象的边界条件即对正常对象的交易失败率和失败贡献度的范围限定;
S203.根据各个对象的交易失败率和失败贡献度,将每一个对象投影到坐标系中,并结合正常对象的边界条件,筛选出不在正常对象边界条件内的一个或多个异常对象;
S3.选择其中一个异常对象作为筛选分析的目标金融对象,除选定因素外给定的剩余因素作为目标金融对象的属性;
S4.分析目标金融对象的单项异常属性集合D;
所述步骤S4包括以下子步骤:
S401.基于目标金融对象不同属性下的交易失败率和失败贡献度,获取目标金融对象的单项异常属性集合A,包括:
S4011.对于选择的目标金融对象P,设该对象为选定因素下的第i个对象,统计该异常对象每一个属性下失败的金融交易数据数量;
S4012.对于目标金融对象P下的第j个属性,计算对应的交易失败率ERij和失败贡献度ECij:
S4013.将目标金融对象P的每一个属性投影到坐标系中,并筛选出不在正常属性的边界条件内的异常属性;
S4014.将目标金融对象的异常属性作为多目标优化的解,根据各个异常属性的交易失败率和失败贡献度确定各个解之间的支配关系:
对于任意两个解任意两个解x(1)、x(2),分如下两种情况:
第一、当fm(x(1))-fm(x(2))>d时:如果(1)、(2)两个条件同时成立,那么x(1)支配x(2)即x(1)为x(2)的支配解,如果(1)、(2)不能同时成立,那么x(1)就不支配x(2);
(1)m在集合{1,2}中取任意值时,x(1)的目标函数fmx(1)都不比x(2)的目标函数fmx(2)差,即对任意的m∈{1,2}都有:
fm(x(1))≤fm(x(2));
(2)至少存在一个m∈{1,2}使得x(1)比x(2)严格优,即至少存在一个m使得:
fm(x(1))<fm(x(2));
第二、当fm(x(1))-fm(x(2))≤d时,认为x(1)和x(2)是无差异的,彼此不互相支配;
其中,m=1时fmx(1)、fmx(2)表示x(1)、x(2)的交易失败率,m=2时fmx(1)、fmx(2)表示x(1)、x(2)的失败贡献度;
S4015.对于每一个解,按照确定的支配关系,统计该解的支配解数目;
S4016.将各个解按照支配解数目的从小到大进行排序,支配解数目越少,优先级越高,将其中优先级最高的解保存到一个集合中,形成单项异常属性集合A;
S402.基于目标金融对象的失败应答码信息,分析目标金融对象的单项异常属性集合B,包括:
S4021.将目标金融对象下的失败应答码划分到该对象的每一个属性中;
S4022.统计目标金融对象下的频数信息,并据此计算相关的频率信息;所述频数信息包括:
目标金融对象下的失败应答码出现次数、目标金融对象下的失败应答码种类数目、目标金融对象每一个属性下的失败应答码出现次数、目标金融对象每一种失败应答码下的失败应答码出现次数以及目标金融对象每一个属性下每一种失败应答码的出现次数;所述频率信息包括:目标金融对象下每一个属性的失败应答码出现频率、目标金融对象每一种失败应答码下的失败应答码出现频率以及每一个属性下每一种失败应答码的出现频率;
所述计算过程包括:
A1、设目标金融对象下的失败应答码出现次数为n,目标金融对象下的失败应答码种类数目为q,目标金融对象第i个属性下的失败应答码出现次数为ni,目标金融对象第j种失败应答码下的失败应答码出现出书为nj,目标金融对象第i个属性下第j种失败应答码的出现次数为nij;
则:
目标金融对象下第i个属性的失败应答码出现频率为:
目标金融对象第j种失败应答码下的失败应答码出现频率为:
目标金融对象第i个属性下第j种失败应答码的出现频率为:
A2、在i=1,2,...,p,j=1,2,...,q的情况下,获取ni、nj、nij,并按照步骤A1计算pi、pj、pij;
S4023.定义每一个属性中各个失败应答码的卡方值,并根据卡方值得到失败应答码的聚集程度,实现对异常属性的筛选:
B1.计算第i个属性下第j个失败应答码的卡方值为:
B2.计算第i个属性对应的卡方值为:
B3.将各个属性的卡方值与预设阈值进行比较,筛选出卡方值不小于设定阈值的属性,将这些属性保存到一个集合中,得到目标金融对象的单项异常属性集合B;
S403.将单项异常属性集合A与B合并,得到并集D作为最终的单项异常属性集合,并集D中的每一个元素均为该目标金融对象的单项异常属性;
S5.根据单项异常属性集合D中的各个单项异常属性,生成关联规则,每一个关联规则由一个或多个单项异常属性构成,并得到关联规则集合T;
S6.基于失败笔数和交易失败率,对关联规则集合T中存在包含关系的关联规则进行合并,得到集合T1;
S7.计算集合T1中每一个关联规则的交易失败率,并按照交易失败率从大到小进行优先级排序。
2.根据权利要求1所述的一种金融交易数据的综合分析方法,其特征在于:所述步骤S1中给定的因素分为卡、通信路线、操作和终端四个方面,其中:
卡方面的因素包括:卡BIN、卡性质和卡介质;
通信路线方面的因素包括:受理机构标识码、发卡机构标识码、发送机构标识码和接收机构标识码;
操作方面的因素包括:交易代码、服务点输入方式和服务点条件代码;
终端方面的因素包括:商户类型、交易渠道、受卡发商户标识代码;
选定的因素为受理机构标识码或发卡机构标识码。
3.根据权利要求1所述的一种金融交易数据的综合分析方法,其特征在于:所述优先级最高的解为一个或多个:
满足条件“支配解数目最少,优先级最高”的解只有一个时,该解即为最优解,单项异常属性集合A中只有一个解;
满足条件“支配解数目最少,优先级最高”的解存在多个时,这些解均为最优解单项异常属性集合中包含多个解,情况下,这种各个最优解的支配解数目相同。
5.根据权利要求1所述的一种金融交易数据的综合分析方法,其特征在于:所述步骤S6包括以下子步骤:
S601.对于关联规则集合T中存在包含关系的两个关联规则H1和H2,分别统计关联规则H1和H2下的交易失败笔数;
其中,存在包含关系是指,其中一个关联规则H1中包含另一个关联规则H2中的所有属性,且关联规则H1中的属性数目大于关联规则H2中的属性数目;此时,将关联规则H1称为子规则,关联规则H2称为父规则;
关联规则下的交易失败笔数,等于该关联规则下所有属性的失败交易笔数之和;
关联规则下的交易失败率,等于该关联规则失败交易笔数与目标金融对象金融交易数据数量的比值;
S602.基于交易失败笔数和交易失败率进行关联规则合并:
若关联规则的失败交易率不小于设定阈值:
对于存在包含关系的规则,若子规则的失败量与父规则的失败量相等时,则保留子规则、删除父规则,否则保留父规则、删除子规则;
若关联规则的失败交易率小于设定阈值:
对于存在包含关系的规则,判断子规则的失败交易率是否大于其父规则的失败交易率,若子规则的失败交易率不大于父规则的失败交易率,则丢弃子规则,保留父规则;反之则保留子规则,丢弃父规则;
S603.对于关联规则集合T中存在包含关系的任意两个关联规则,按照步骤S601~S602进行合并,直到所有存在包含关系的关联规则合并完毕,得到新的集合T1。
6.根据权利要求1所述的一种金融交易数据的综合分析方法,其特征在于:对于步骤S2得到的每一个异常对象,重复执行步骤S3~S7,完成所有异常对象的综合分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011023401.0A CN112199414B (zh) | 2020-09-25 | 2020-09-25 | 一种金融交易数据的综合分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011023401.0A CN112199414B (zh) | 2020-09-25 | 2020-09-25 | 一种金融交易数据的综合分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112199414A CN112199414A (zh) | 2021-01-08 |
CN112199414B true CN112199414B (zh) | 2023-03-21 |
Family
ID=74006875
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011023401.0A Active CN112199414B (zh) | 2020-09-25 | 2020-09-25 | 一种金融交易数据的综合分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112199414B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105590245A (zh) * | 2014-12-31 | 2016-05-18 | 中国银联股份有限公司 | 定位电子交易的故障成因的计算机实施方法和数据处理方法 |
CN106202389A (zh) * | 2016-07-08 | 2016-12-07 | 中国银联股份有限公司 | 一种基于交易数据的异常监测方法及装置 |
CN108960833A (zh) * | 2018-08-10 | 2018-12-07 | 哈尔滨工业大学(威海) | 一种基于异构金融特征的异常交易识别方法,设备及存储介质 |
CN110390585A (zh) * | 2019-07-25 | 2019-10-29 | 中国银联股份有限公司 | 一种识别异常对象的方法及装置 |
CN110678890A (zh) * | 2017-03-16 | 2020-01-10 | 世界线公司 | 经优化平均查准率通过机器学习检测银行交易组中的异常 |
CN111126828A (zh) * | 2019-12-19 | 2020-05-08 | 浙江邦盛科技有限公司 | 一种基于知识图谱的多层资金异常流向监控方法 |
-
2020
- 2020-09-25 CN CN202011023401.0A patent/CN112199414B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105590245A (zh) * | 2014-12-31 | 2016-05-18 | 中国银联股份有限公司 | 定位电子交易的故障成因的计算机实施方法和数据处理方法 |
CN106202389A (zh) * | 2016-07-08 | 2016-12-07 | 中国银联股份有限公司 | 一种基于交易数据的异常监测方法及装置 |
CN110678890A (zh) * | 2017-03-16 | 2020-01-10 | 世界线公司 | 经优化平均查准率通过机器学习检测银行交易组中的异常 |
CN108960833A (zh) * | 2018-08-10 | 2018-12-07 | 哈尔滨工业大学(威海) | 一种基于异构金融特征的异常交易识别方法,设备及存储介质 |
CN110390585A (zh) * | 2019-07-25 | 2019-10-29 | 中国银联股份有限公司 | 一种识别异常对象的方法及装置 |
CN111126828A (zh) * | 2019-12-19 | 2020-05-08 | 浙江邦盛科技有限公司 | 一种基于知识图谱的多层资金异常流向监控方法 |
Non-Patent Citations (2)
Title |
---|
基于数据挖掘技术的W大型连锁企业持续审计研究;但雨昕;《中国优秀硕士学位论文全文数据库 (经济与管理科学辑)》;20190815;第36-37页 * |
多目标优化;AquilaEAG;《CSDN:https://blog.csdn.net/weixin_43202635/article/details/82700342》;20180914;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112199414A (zh) | 2021-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7574402B2 (en) | System and method for authorizing electronic payment transactions | |
US8805737B1 (en) | Computer-implemented multiple entity dynamic summarization systems and methods | |
US7509282B2 (en) | Auction system and method | |
US8065227B1 (en) | Method and system for producing custom behavior scores for use in credit decisioning | |
WO2009134817A1 (en) | Method for providing personalized recommendations of financial products based on user data | |
CN112232950A (zh) | 针对借贷风险的评估方法及装置、设备、计算机可读存储介质 | |
CN112199414B (zh) | 一种金融交易数据的综合分析方法 | |
RU2396598C1 (ru) | Автоматизированная информационно-аналитическая система управления финансовыми рисками | |
Young | Are Financial Statements More Comparable When GAAP Restricts Managers’ Discretion? | |
Goldmann et al. | A new ordinal mixed-data sampling model with an application to corporate credit rating levels | |
CN112214528A (zh) | 一种基于关联分析的金融对象单项异常属性分析方法 | |
CN112823502B (zh) | 针对资源访问规则配置的实时反馈服务 | |
CN114240598A (zh) | 授信额度模型生成方法、授信额度确定方法、装置 | |
CN113919934A (zh) | 一种银行贷款业务评分策略迭代方法 | |
CN112767121A (zh) | 一种风险等级数据的处理方法和装置 | |
CN112184431A (zh) | 用户风险确定方法和装置 | |
CN110852392A (zh) | 一种用户分群方法、装置、设备和介质 | |
CN112214529A (zh) | 一种基于多目标优化的金融对象异常因素优先级分析方法 | |
JP3293582B2 (ja) | データ分類装置、データ分類方法およびデータ分類用プログラムを記録した記録媒体 | |
US20210192614A1 (en) | Systems and methods for determining an affordability index | |
CN112214527A (zh) | 一种基于失败应答码的金融对象异常因素筛选分析方法 | |
CN112214522A (zh) | 一种基于双目标投影的金融交易数据异常因素筛选方法 | |
Mensah et al. | Wisdom of crowds as a verification tool in bank lending: Evidence from borrowers’ customer tweets | |
Bellinazzi | Forecast of the financial risk using time series analysis | |
PRODUCT et al. | ISTANBUL TECHNICAL UNIVERSITY★ GRADUATE SCHOOL |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |