CN112214528A - 一种基于关联分析的金融对象单项异常属性分析方法 - Google Patents

一种基于关联分析的金融对象单项异常属性分析方法 Download PDF

Info

Publication number
CN112214528A
CN112214528A CN202011023418.6A CN202011023418A CN112214528A CN 112214528 A CN112214528 A CN 112214528A CN 202011023418 A CN202011023418 A CN 202011023418A CN 112214528 A CN112214528 A CN 112214528A
Authority
CN
China
Prior art keywords
failure
attribute
under
target financial
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011023418.6A
Other languages
English (en)
Inventor
梅芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaying Shanghai Information Technology Co ltd
Original Assignee
Huaying Shanghai Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaying Shanghai Information Technology Co ltd filed Critical Huaying Shanghai Information Technology Co ltd
Priority to CN202011023418.6A priority Critical patent/CN112214528A/zh
Publication of CN112214528A publication Critical patent/CN112214528A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种基于关联分析的金融对象单项异常属性分析方法,包括:S1.选定因素,获取该因素下不同的对象信息,将待筛选的金融交易数据划分到每一个对象下;S2.计算每一个对象下的交易失败率和失败贡献度;S3.建立投影坐标系;S4.筛选出异常对象;S5.选择目标金融对象,除选定因素外给定的剩余因素作为目标金融对象的属性;S6.获取目标金融对象的单项异常属性集合A;S7.分析目标金融对象的单项异常属性集合B;S8.将单项异常属性集合A与B合并,得到并集D;S9.对于不同的异常对象,重复执行步骤S5~S8,得到每一个异常对象下的单项异常属性集合。本发明能够获得较为准确的单项异常属性集合,有助于较为快速和完整地确定交易失败的原因。

Description

一种基于关联分析的金融对象单项异常属性分析方法
技术领域
本发明涉及金融数据分析,特别是涉及一种基于关联分析的金融对象单项异常属性分析 方法。
背景技术
就当今社会而言,移动支付已成主流,怎样提交交易成功率增强用户体验是各支付企业 及相关商户和银行机构需要关注的问题。支付是一个长链路交易活动,参与方众多,包括: 持卡人或者支付用户、商户、收单机构、发卡机构、网联或者银联等相关机构,引起交易失 败的因素可能是单个因素,但更多的是多因素组合或者叠加,很多失败因素不能简单通过一 个点来判断。另外,目前交易的成功率都非常高,一般整体交易成功率在99%左右,面对海 量的支付交易数据,怎样查找和发现交易失败的问题和原因是非常困难的一件事情。
对于失败交易的数据,可以通过失败数据在不同对象或不同属性下的占比来分析失败原 因,但是支付失败交易数据具有比较明显的几个特征:一、海量数据;二、数据倾斜非常严 重(失败交易占比非常少);三、小机构或者商户(包括某类业务)数据极其容易被淹没,例如: 某机构有较高的交易成功率98%,但某类新业务由于某些原因失败率却很高,几乎全部失败, 要从整体来看很难发现这类小业务量交易。
同时,对于失败的交易数据,也可以通过金融系统反馈的失败应答码来判别交易失败原 因,但是,目前有些失败应答码会涉及多个属性,这种情况下无法得到较为明确的分析结果, 不利于快速确定异常属性。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于关联分析的金融对象单项异常属 性分析方法,能够通过对金融交易数据的处理和关联分析,快速确定异常金融对象,并进行 分析筛选获得较为准确的单项异常属性集合,有助于较为快速和完整地确定交易失败的原因。
本发明的目的是通过以下技术方案来实现的:一种基于关联分析的金融对象单项异常属 性分析方法,包括以下步骤:
S1.给定影响金融交易数据质量的多个因素,并选定其中一个因素,获取该因素下不同的 对象信息,将待筛选的金融交易数据划分到每一个对象下;
S2.计算每一个对象下的交易失败率和失败贡献度;
S3.建立投影坐标系,纵坐标为交易失败率,横坐标为失败贡献度,并在设定正常对象的 边界条件和正常属性的边界条件;
S4.根据各个对象的交易失败率和失败贡献度,将每一个对象投影到坐标系中,并结合正 常对象的边界条件,筛选出不在正常对象边界条件内的一个或多个异常对象;
S5.选择其中一个异常对象作为筛选分析的目标金融对象,除选定因素外给定的剩余因素 作为目标金融对象的属性;
S6.基于目标金融对象不同属性下的交易失败率和失败贡献度,获取目标金融对象的单项 异常属性集合A;
S7.基于目标金融对象的失败应答码信息,分析目标金融对象的单项异常属性集合B;
S8.将单项异常属性集合A与B合并,得到并集D作为最终的单项异常属性集合,并集 D中的每一个元素均为该目标金融对象的单项异常属性;
S9.对于不同的异常对象,重复执行步骤S5~S8,得到每一个异常对象下的单项异常属性 集合。
优选地,所述步骤S1中给定的因素分为卡、通信路线、操作和终端四个方面,其中:
卡方面的因素包括:卡BIN、卡性质和卡介质;
通信路线方面的因素包括:受理机构标识码、发卡机构标识码、发送机构标识码和接收 机构标识码;
操作方面的因素包括:交易代码、服务点输入方式和服务点条件代码;
终端方面的因素包括:商户类型、交易渠道、受卡发商户标识代码。
所述步骤S1中,选定的因素为受理机构标识码或发卡机构标识码。
其中,所述步骤S2包括以下子步骤:
S201.设选定的因素下共包含T个对象,统计所有对象失败的金融交易数据总数、每一个 对象下的金融交易数据数量以及每一个对象下失败的金融交易数据数量;
S202.对于第i个对象,计算对应的交易失败率ERi和失败贡献度ECi
Figure BDA0002701401540000021
Figure BDA0002701401540000022
其中,
Figure BDA0002701401540000023
为第i个对象下下失败的金融交易数据数量,Ni为第i个对象下的金融交易数 据数量,NE为所有对象失败的金融交易数据总数;
S203.在i=1,2,...,T时,重复执行步骤S202,计算出每一个对象下的交易失败率和失败贡 献度。
其中,所述正常对象的边界条件即对正常对象的交易失败率和失败贡献度的范围限定; 所述正常属性的边界条件即对正常属性的交易失败率和失败贡献度的范围限定。
进一步地,所述步骤S6包括以下子步骤:
S601.对于选择的目标金融对象P,设该对象为选定因素下的第i个对象,统计该异常对 象每一个属性下失败的金融交易数据数量;
S602.对于目标金融对象P下的第j个属性,计算对应的交易失败率ERij和失败贡献度 ECij
Figure BDA0002701401540000031
Figure BDA0002701401540000032
其中,
Figure BDA0002701401540000033
表示目标金融对象P第j个属性下失败的金融交易数据数量;j=1,2,...,q;q 表示目标金融对象P下的属性数量;
S603.将目标金融对象P的每一个属性投影到坐标系中,并筛选出不在正常属性的边界条 件内的异常属性;
S604.将目标金融对象的异常属性作为多目标优化的解,根据各个异常属性的交易失败率 和失败贡献度确定各个解之间的支配关系:
对于任意两个解任意两个解x(1)、x(2),分如下两种情况:
第一、当|fm(x(1))-fm(x(2))|>d时:如果(1)、(2)两个条件同时成立,那么x(1)支配x(2)即 x(1)为x(2)的支配解,如果(1)、(2)不能同时成立,那么x(1)就不支配x(2)
(1)m在集合{1,2}中取任意值时,x(1)的目标函数fmx(1)都不比x(2)的目标函数fmx(2)差, 即对任意的m∈{1,2}都有:
fm(x(1))≤fm(x(2));
(2)至少存在一个m∈{1,2}使得x(1)比x(2)严格优,即至少存在一个m使得:
Figure BDA0002701401540000034
第二、当|fm(x(1))-fm(x(2))|≤d时,认为x(1)和x(2)是无差异的,彼此不互相支配;
其中,m=1时fmx(1)、fmx(2)表示x(1)、x(2)的交易失败率,m=2时fmx(1)、fmx(2)表示x(1)、 x(2)的失败贡献度;
S605.对于每一个解,按照确定的支配关系,统计该解的支配解数目;
S606.将各个解按照支配解数目的从小到大进行排序,支配解数目越少,优先级越高,将 其中优先级最高的解保存到一个集合中,形成单项异常属性集合A。
其中,所述优先级最高的解为一个或多个:
满足条件“支配解数目最少,优先级最高”的解只有一个时,该解即为最优解,单项异常属 性集合A中只有一个解;
满足条件“支配解数目最少,优先级最高”的解存在多个时,这些解均为最优解单项异常属 性集合中包含多个解,情况下,这种各个最优解的支配解数目相同。
进一步地,所述步骤S7包括以下子步骤:
S701.将目标金融对象下的失败应答码划分到该对象的每一个属性中;
S702.统计目标金融对象下的频数信息,并据此计算相关的频率信息;所述频数信息包括:
目标金融对象下的失败应答码出现次数、目标金融对象下的失败应答码种类数目、目标金 融对象每一个属性下的失败应答码出现次数、目标金融对象每一种失败应答码下的失败应答 码出现次数以及目标金融对象每一个属性下每一种失败应答码的出现次数;所述频率信息包 括:目标金融对象下每一个属性的失败应答码出现频率、目标金融对象每一种失败应答码下 的失败应答码出现频率以及每一个属性下每一种失败应答码的出现频率;
所述计算过程包括:
A1、设目标金融对象下的失败应答码出现次数为n,目标金融对象下的失败应答码种类数 目为q,目标金融对象第i个属性下的失败应答码出现次数为ni,目标金融对象第j种失败应 答码下的失败应答码出现出书为nj,目标金融对象第i个属性下第j种失败应答码的出现次 数为nij
则:
目标金融对象下第i个属性的失败应答码出现频率为:
Figure BDA0002701401540000041
目标金融对象第j种失败应答码下的失败应答码出现频率为:
Figure BDA0002701401540000042
目标金融对象第i个属性下第j种失败应答码的出现频率为:
Figure BDA0002701401540000043
A2、在i=1,2,...,p,j=1,2,...,q的情况下,获取ni、nj、nij,并按照步骤A1计算pi、 pj、pij
S703.定义每一个属性中各个失败应答码的卡方值,并根据卡方值得到失败应答码的聚集 程度,实现对异常属性的筛选,其中,卡方值越大,则失败应答码的聚集程度越高:
B1.计算第i个属性下第j个失败应答码的卡方值为:
Figure BDA0002701401540000051
B2.计算第i个属性对应的卡方值为:
Figure BDA0002701401540000052
B3.将各个属性的卡方值与预设阈值进行比较,筛选出卡方值不小于设定阈值的属性,将 这些属性保存到一个集合中,得到目标金融对象的单项异常属性集合B。
本发明的有益效果是:本发明基于不同属性下的交易失败率和失败贡献度,筛选出异常 属性,并基于支配关系进行多目标优化,得到目标金融对象的单项异常属性集合A,然后基 于目标金融对象的失败应答码信息的聚集程度,分析目标金融对象的单项异常属性集合B, 再将两个集合进行合并,以实现互相关联,得到较为准确和完整的单项异常属性集合,有助 于较为快速和完整地确定交易失败的原因;由于进行异常对象与异常属性筛选时,综合考虑 了交易失败率和失败贡献度,能够有效降低小业务交易数据被淹没的可能性。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所 述。
如图1所示,一种基于关联分析的金融对象单项异常属性分析方法,包括以下步骤:
S1.给定影响金融交易数据质量的多个因素,并选定其中一个因素,获取该因素下不同的 对象信息,将待筛选的金融交易数据划分到每一个对象下;
S2.计算每一个对象下的交易失败率和失败贡献度;
S3.建立投影坐标系,纵坐标为交易失败率,横坐标为失败贡献度,并在设定正常对象的 边界条件和正常属性的边界条件;
S4.根据各个对象的交易失败率和失败贡献度,将每一个对象投影到坐标系中,并结合正 常对象的边界条件,筛选出不在正常对象边界条件内的一个或多个异常对象;
S5.选择其中一个异常对象作为筛选分析的目标金融对象,除选定因素外给定的剩余因素 作为目标金融对象的属性;
S6.基于目标金融对象不同属性下的交易失败率和失败贡献度,获取目标金融对象的单项 异常属性集合A;
S7.基于目标金融对象的失败应答码信息,分析目标金融对象的单项异常属性集合B;
S8.将单项异常属性集合A与B合并,得到并集D作为最终的单项异常属性集合,并集 D中的每一个元素均为该目标金融对象的单项异常属性;
S9.对于不同的异常对象,重复执行步骤S5~S8,得到每一个异常对象下的单项异常属性 集合。
在本申请的实施例中,所述步骤S1中给定的因素分为卡、通信路线、操作和终端四个方 面,其中:
卡方面的因素包括:卡BIN、卡性质和卡介质;
通信路线方面的因素包括:受理机构标识码、发卡机构标识码、发送机构标识码和接收 机构标识码;
操作方面的因素包括:交易代码、服务点输入方式和服务点条件代码;
终端方面的因素包括:商户类型、交易渠道、受卡发商户标识代码。
所述步骤S1中,选定的因素为受理机构标识码或发卡机构标识码。例如,选定的因素为 受理机构标识码时,由于不同的受理机构标识码对应于不同的受理机构,故该因素下的对象 其实就是各个受理机构;选定的因素为发卡机构识别码时,由于不同的发卡机构标识码对应 于不同的发卡机构,故该因素的对象其实就是各个发卡机构。
其中,所述步骤S2包括以下子步骤:
S201.设选定的因素下共包含T个对象,统计所有对象失败的金融交易数据总数、每一个 对象下的金融交易数据数量以及每一个对象下失败的金融交易数据数量;
S202.对于第i个对象,计算对应的交易失败率ERi和失败贡献度ECi
Figure BDA0002701401540000061
Figure BDA0002701401540000062
其中,
Figure BDA0002701401540000063
为第i个对象下下失败的金融交易数据数量,Ni为第i个对象下的金融交易数 据数量,NE为所有对象失败的金融交易数据总数;
S203.在i=1,2,...,T时,重复执行步骤S202,计算出每一个对象下的交易失败率和失败贡 献度。
其中,所述正常对象的边界条件即对正常对象的交易失败率和失败贡献度的范围限定; 所述正常属性的边界条件即对正常属性的交易失败率和失败贡献度的范围限定。
进一步地,所述步骤S6包括以下子步骤:
S601.对于选择的目标金融对象P,设该对象为选定因素下的第i个对象,统计该异常对 象每一个属性下失败的金融交易数据数量;
S602.对于目标金融对象P下的第j个属性,计算对应的交易失败率ERij和失败贡献度 ECij
Figure BDA0002701401540000071
Figure BDA0002701401540000072
其中,
Figure BDA0002701401540000073
表示目标金融对象P第j个属性下失败的金融交易数据数量;j=1,2,...,q;q 表示目标金融对象P下的属性数量;
S603.将目标金融对象P的每一个属性投影到坐标系中,并筛选出不在正常属性的边界条 件内的异常属性;
S604.将目标金融对象的异常属性作为多目标优化的解,根据各个异常属性的交易失败率 和失败贡献度确定各个解之间的支配关系:
对于任意两个解任意两个解x(1)、x(2),分如下两种情况:
第一、当|fm(x(1))-fm(x(2))|>d时:如果(1)、(2)两个条件同时成立,那么x(1)支配x(2)即 x(1)为x(2)的支配解,如果(1)、(2)不能同时成立,那么x(1)就不支配x(2)
(1)m在集合{1,2}中取任意值时,x(1)的目标函数fmx(1)都不比x(2)的目标函数fmx(2)差, 即对任意的m∈{1,2}都有:
fm(x(1))≤fm(x(2));
(2)至少存在一个m∈{1,2}使得x(1)比x(2)严格优,即至少存在一个m使得:
Figure BDA0002701401540000074
第二、当|fm(x(1))-fm(x(2))|≤d时,认为x(1)和x(2)是无差异的,彼此不互相支配;
其中,m=1时fmx(1)、fmx(2)表示x(1)、x(2)的交易失败率,m=2时fmx(1)、fmx(2)表示x(1)、 x(2)的失败贡献度;
S605.对于每一个解,按照确定的支配关系,统计该解的支配解数目;
S606.将各个解按照支配解数目的从小到大进行排序,支配解数目越少,优先级越高,该 解对应的异常属性引起交易失败的概率越大,将其中优先级最高的解保存到一个集合中,形 成单项异常属性集合A。
其中,所述优先级最高的解为一个或多个:
满足条件“支配解数目最少,优先级最高”的解只有一个时,该解即为最优解,单项异常属 性集合A中只有一个解;
满足条件“支配解数目最少,优先级最高”的解存在多个时,这些解均为最优解单项异常属 性集合中包含多个解,情况下,这种各个最优解的支配解数目相同。
进一步地,所述步骤S7包括以下子步骤:
S701.将目标金融对象下的失败应答码划分到该对象的每一个属性中;
S702.统计目标金融对象下的频数信息,并据此计算相关的频率信息;所述频数信息包括:
目标金融对象下的失败应答码出现次数、目标金融对象下的失败应答码种类数目、目标金 融对象每一个属性下的失败应答码出现次数、目标金融对象每一种失败应答码下的失败应答 码出现次数以及目标金融对象每一个属性下每一种失败应答码的出现次数;所述频率信息包 括:目标金融对象下每一个属性的失败应答码出现频率、目标金融对象每一种失败应答码下 的失败应答码出现频率以及每一个属性下每一种失败应答码的出现频率;
所述计算过程包括:
A1、设目标金融对象下的失败应答码出现次数为n,目标金融对象下的失败应答码种类数 目为q,目标金融对象第i个属性下的失败应答码出现次数为ni,目标金融对象第j种失败应 答码下的失败应答码出现出书为nj,目标金融对象第i个属性下第j种失败应答码的出现次 数为nij
则:
目标金融对象下第i个属性的失败应答码出现频率为:
Figure BDA0002701401540000081
目标金融对象第j种失败应答码下的失败应答码出现频率为:
Figure BDA0002701401540000091
目标金融对象第i个属性下第j种失败应答码的出现频率为:
Figure BDA0002701401540000092
A2、在i=1,2,...,p,j=1,2,...,q的情况下,获取ni、nj、nij,并按照步骤A1计算pi、pj、 pij
在本申请的实施例中,统计的频数信息如下表所示:
Figure BDA0002701401540000093
计算的到的频率信息如下图所示:
Figure BDA0002701401540000094
一个属性对于某个应答码是否有聚集,不能只看nij,pij的绝对值,因为虽然pij大,但若 对应的第i属性失败占比pi.很大,或者第j应答码的失败占比p.j很大,则pij大不能说明属性 对于某个应答码有聚集。从这一角度看pij-pi.p.j可能更好地反映了问题,因此,定义如下卡 方值来分析应答码的聚集;
S703.定义每一个属性中各个失败应答码的卡方值,并根据卡方值得到失败应答码的聚集 程度,实现对异常属性的筛选,其中,卡方值越大,则失败应答码的聚集程度越高:
B1.计算第i个属性下第j个失败应答码的卡方值为:
Figure BDA0002701401540000095
B2.计算第i个属性对应的卡方值为:
Figure BDA0002701401540000101
得到的卡方值如下表所示:
Figure BDA0002701401540000102
B3.在卡方值较大的属性上,失败应答码的聚集程度最高,由该属性引起交易失败的概 率较大,因此因素为异常属性;在本申请中,将各个属性的卡方值与预设阈值进行比较,筛 选出卡方值不小于设定阈值的属性,将这些属性保存到一个集合中,得到目标金融对象的单 项异常属性集合B。
本发明基于不同属性下的交易失败率和失败贡献度,筛选出异常属性,并基于支配关系 进行多目标优化,得到目标金融对象的单项异常属性集合A,然后基于目标金融对象的失败 应答码信息的聚集程度,分析目标金融对象的单项异常属性集合B,再将两个集合进行合并, 以实现互相关联,得到较为准确和完整的单项异常属性集合,有助于较为快速和完整地确定 交易失败的原因;由于进行异常对象与异常属性筛选时,综合考虑了交易失败率和失败贡献 度,能够有效降低小业务交易数据被淹没的可能性。
以上所述是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不 应该看作是对其他实施例的排除,而可用于其他组合、修改和环境,并能够在本文所述构想 范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变 化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (8)

1.一种基于关联分析的金融对象单项异常属性分析方法,其特征在于:包括以下步骤:
S1.给定影响金融交易数据质量的多个因素,并选定其中一个因素,获取该因素下不同的对象信息,将待筛选的金融交易数据划分到每一个对象下;
S2.计算每一个对象下的交易失败率和失败贡献度;
S3.建立投影坐标系,纵坐标为交易失败率,横坐标为失败贡献度,并在设定正常对象的边界条件和正常属性的边界条件;
S4.根据各个对象的交易失败率和失败贡献度,将每一个对象投影到坐标系中,并结合正常对象的边界条件,筛选出不在正常对象边界条件内的一个或多个异常对象;
S5.选择其中一个异常对象作为筛选分析的目标金融对象,除选定因素外给定的剩余因素作为目标金融对象的属性;
S6.基于目标金融对象不同属性下的交易失败率和失败贡献度,获取目标金融对象的单项异常属性集合A;
S7.基于目标金融对象的失败应答码信息,分析目标金融对象的单项异常属性集合B;
S8.将单项异常属性集合A与B合并,得到并集D作为最终的单项异常属性集合,并集D中的每一个元素均为该目标金融对象的单项异常属性;
S9.对于不同的异常对象,重复执行步骤S5~S8,得到每一个异常对象下的单项异常属性集合。
2.根据权利要求1所述的一种基于关联分析的金融对象单项异常属性分析方法,其特征在于:所述步骤S1中给定的因素分为卡、通信路线、操作和终端四个方面,其中:
卡方面的因素包括:卡BIN、卡性质和卡介质;
通信路线方面的因素包括:受理机构标识码、发卡机构标识码、发送机构标识码和接收机构标识码;
操作方面的因素包括:交易代码、服务点输入方式和服务点条件代码;
终端方面的因素包括:商户类型、交易渠道、受卡发商户标识代码。
3.根据权利要求1所述的一种基于关联分析的金融对象单项异常属性分析方法,其特征在于:所述步骤S1中,选定的因素为受理机构标识码或发卡机构标识码。
4.根据权利要求1所述的一种基于关联分析的金融对象单项异常属性分析方法,其特征在于:所述步骤S2包括以下子步骤:
S201.设选定的因素下共包含T个对象,统计所有对象失败的金融交易数据总数、每一个对象下的金融交易数据数量以及每一个对象下失败的金融交易数据数量;
S202.对于第i个对象,计算对应的交易失败率ERi和失败贡献度ECi
Figure FDA0002701401530000021
Figure FDA0002701401530000022
其中,
Figure FDA0002701401530000023
为第i个对象下下失败的金融交易数据数量,Ni为第i个对象下的金融交易数据数量,NE为所有对象失败的金融交易数据总数;
S203.在i=1,2,...,T时,重复执行步骤S202,计算出每一个对象下的交易失败率和失败贡献度。
5.根据权利要求1所述的一种基于关联分析的金融对象单项异常属性分析方法,其特征在于:所述正常对象的边界条件即对正常对象的交易失败率和失败贡献度的范围限定;所述正常属性的边界条件即对正常属性的交易失败率和失败贡献度的范围限定。
6.根据权利要求1所述的一种基于关联分析的金融对象单项异常属性分析方法,其特征在于:所述步骤S6包括以下子步骤:
S601.对于选择的目标金融对象P,设该对象为选定因素下的第i个对象,统计该异常对象每一个属性下失败的金融交易数据数量;
S602.对于目标金融对象P下的第j个属性,计算对应的交易失败率ERij和失败贡献度ECij
Figure FDA0002701401530000024
Figure FDA0002701401530000025
其中,
Figure FDA0002701401530000026
表示目标金融对象P第j个属性下失败的金融交易数据数量;j=1,2,...,q;q表示目标金融对象P下的属性数量;
S603.将目标金融对象P的每一个属性投影到坐标系中,并筛选出不在正常属性的边界条件内的异常属性;
S604.将目标金融对象的异常属性作为多目标优化的解,根据各个异常属性的交易失败率和失败贡献度确定各个解之间的支配关系:
对于任意两个解任意两个解x(1)、x(2),分如下两种情况:
第一、当|fm(x(1))-fm(x(2))|>d时:如果(1)、(2)两个条件同时成立,那么x(1)支配x(2)即x(1)为x(2)的支配解,如果(1)、(2)不能同时成立,那么x(1)就不支配x(2)
(1)m在集合{1,2}中取任意值时,x(1)的目标函数fmx(1)都不比x(2)的目标函数fmx(2)差,即对任意的m∈{1,2}都有:
fm(x(1))≤fm(x(2));
(2)至少存在一个m∈{1,2}使得x(1)比x(2)严格优,即至少存在一个m使得:
Figure FDA0002701401530000031
第二、当|fm(x(1))-fm(x(2))|≤d时,认为x(1)和x(2)是无差异的,彼此不互相支配;
其中,m=1时fmx(1)、fmx(2)表示x(1)、x(2)的交易失败率,m=2时fmx(1)、fmx(2)表示x(1)、x(2)的失败贡献度;
S605.对于每一个解,按照确定的支配关系,统计该解的支配解数目;
S606.将各个解按照支配解数目的从小到大进行排序,支配解数目越少,优先级越高,将其中优先级最高的解保存到一个集合中,形成单项异常属性集合A。
7.根据权利要求6所述的一种基于关联分析的金融对象单项异常属性分析方法,其特征在于:所述优先级最高的解为一个或多个:
满足条件“支配解数目最少,优先级最高”的解只有一个时,该解即为最优解,单项异常属性集合A中只有一个解;
满足条件“支配解数目最少,优先级最高”的解存在多个时,这些解均为最优解单项异常属性集合中包含多个解,情况下,这种各个最优解的支配解数目相同。
8.根据权利要求6所述的一种基于关联分析的金融对象单项异常属性分析方法,其特征在于:所述步骤S7包括以下子步骤:
S701.将目标金融对象下的失败应答码划分到该对象的每一个属性中;
S702.统计目标金融对象下的频数信息,并据此计算相关的频率信息;所述频数信息包括:
目标金融对象下的失败应答码出现次数、目标金融对象下的失败应答码种类数目、目标金融对象每一个属性下的失败应答码出现次数、目标金融对象每一种失败应答码下的失败应答码出现次数以及目标金融对象每一个属性下每一种失败应答码的出现次数;所述频率信息包括:目标金融对象下每一个属性的失败应答码出现频率、目标金融对象每一种失败应答码下的失败应答码出现频率以及每一个属性下每一种失败应答码的出现频率;
所述计算过程包括:
A1、设目标金融对象下的失败应答码出现次数为n,目标金融对象下的失败应答码种类数目为q,目标金融对象第i个属性下的失败应答码出现次数为ni,目标金融对象第j种失败应答码下的失败应答码出现出书为nj,目标金融对象第i个属性下第j种失败应答码的出现次数为nij
则:
目标金融对象下第i个属性的失败应答码出现频率为:
Figure FDA0002701401530000041
目标金融对象第j种失败应答码下的失败应答码出现频率为:
Figure FDA0002701401530000042
目标金融对象第i个属性下第j种失败应答码的出现频率为:
Figure FDA0002701401530000043
A2、在i=1,2,...,p,j=1,2,...,q的情况下,获取ni、nj、nij,并按照步骤A1计算pi、pj、pij
S703.定义每一个属性中各个失败应答码的卡方值,并根据卡方值得到失败应答码的聚集程度,实现对异常属性的筛选:
B1.计算第i个属性下第j个失败应答码的卡方值为:
Figure FDA0002701401530000044
B2.计算第i个属性对应的卡方值为:
Figure FDA0002701401530000045
B3.将各个属性的卡方值与预设阈值进行比较,筛选出卡方值不小于设定阈值的属性,将这些属性保存到一个集合中,得到目标金融对象的单项异常属性集合B。
CN202011023418.6A 2020-09-25 2020-09-25 一种基于关联分析的金融对象单项异常属性分析方法 Pending CN112214528A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011023418.6A CN112214528A (zh) 2020-09-25 2020-09-25 一种基于关联分析的金融对象单项异常属性分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011023418.6A CN112214528A (zh) 2020-09-25 2020-09-25 一种基于关联分析的金融对象单项异常属性分析方法

Publications (1)

Publication Number Publication Date
CN112214528A true CN112214528A (zh) 2021-01-12

Family

ID=74051880

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011023418.6A Pending CN112214528A (zh) 2020-09-25 2020-09-25 一种基于关联分析的金融对象单项异常属性分析方法

Country Status (1)

Country Link
CN (1) CN112214528A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103365969A (zh) * 2013-06-24 2013-10-23 北京奇虎科技有限公司 一种异常数据检测处理的方法和系统
CN105590245A (zh) * 2014-12-31 2016-05-18 中国银联股份有限公司 定位电子交易的故障成因的计算机实施方法和数据处理方法
CN109787960A (zh) * 2018-12-19 2019-05-21 中国平安人寿保险股份有限公司 异常流量数据识别方法、装置、介质及电子设备
CN109886809A (zh) * 2019-01-24 2019-06-14 平安科技(深圳)有限公司 交易数据智能分析方法、电子装置及计算机可读存储介质
CN110751557A (zh) * 2019-10-10 2020-02-04 中国建设银行股份有限公司 一种基于序列模型的异常资金交易行为分析方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103365969A (zh) * 2013-06-24 2013-10-23 北京奇虎科技有限公司 一种异常数据检测处理的方法和系统
CN105590245A (zh) * 2014-12-31 2016-05-18 中国银联股份有限公司 定位电子交易的故障成因的计算机实施方法和数据处理方法
CN109787960A (zh) * 2018-12-19 2019-05-21 中国平安人寿保险股份有限公司 异常流量数据识别方法、装置、介质及电子设备
CN109886809A (zh) * 2019-01-24 2019-06-14 平安科技(深圳)有限公司 交易数据智能分析方法、电子装置及计算机可读存储介质
CN110751557A (zh) * 2019-10-10 2020-02-04 中国建设银行股份有限公司 一种基于序列模型的异常资金交易行为分析方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
AQUILAEAG: ""多目标优化"", 《CSDN:HTTPS://BLOG.CSDN.NET/WEIXIN_43202635/ARTICLE/DETAILS/82700342》 *
但雨昕: ""基于数据挖掘技术的W大型连锁企业持续审计研究"", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 *

Similar Documents

Publication Publication Date Title
US8805737B1 (en) Computer-implemented multiple entity dynamic summarization systems and methods
US8195516B2 (en) Generating retail sales report
US11037229B2 (en) Fraud detection system for the faster payments system
US8086528B2 (en) Transaction aggregator
US20150363875A1 (en) System and Method for Filtering and Analyzing Transaction Information
WO2019196549A1 (zh) 确定高风险用户的方法及装置
US20110016052A1 (en) Event Tracking and Velocity Fraud Rules for Financial Transactions
US11366635B2 (en) Systems and methods for generating enhanced data metrics
US7970673B2 (en) Method, apparatus, and computer program product for repository data maximization
US20140330718A1 (en) Paper payment receipt, processing and payment failure analytics
CN112232950A (zh) 针对借贷风险的评估方法及装置、设备、计算机可读存储介质
US9299069B2 (en) Granular, user-accessible paper payment processing indicators
US20130339244A1 (en) Methods and systems for check cashing risk analysis
US20140330708A1 (en) Paper check processing in connection with bill pay requests
US20170352022A1 (en) System and method for determining subscription information based on payment card transaction data over a payment card network
CN112214528A (zh) 一种基于关联分析的金融对象单项异常属性分析方法
CN112199414B (zh) 一种金融交易数据的综合分析方法
US20140330716A1 (en) Paper payment processing analytics
US20140330714A1 (en) Paper payment receipt, processing and real time communication with payor
Vasconcelos et al. A neural network based solution for the credit risk assessment problem
CN112823502B (zh) 针对资源访问规则配置的实时反馈服务
CN114140238A (zh) 异常交易数据识别方法、装置、计算机设备和存储介质
CN112214522A (zh) 一种基于双目标投影的金融交易数据异常因素筛选方法
US20140330717A1 (en) Paper payment receipt, processing and failure remediation
CN112214529A (zh) 一种基于多目标优化的金融对象异常因素优先级分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210112