CN111145027A - 一种疑似洗钱交易识别方法及装置 - Google Patents

一种疑似洗钱交易识别方法及装置 Download PDF

Info

Publication number
CN111145027A
CN111145027A CN201911408653.2A CN201911408653A CN111145027A CN 111145027 A CN111145027 A CN 111145027A CN 201911408653 A CN201911408653 A CN 201911408653A CN 111145027 A CN111145027 A CN 111145027A
Authority
CN
China
Prior art keywords
feature
point
points
transaction
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911408653.2A
Other languages
English (en)
Inventor
徐照晔
瞿争
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongan Information Technology Service Co Ltd
Original Assignee
Zhongan Information Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongan Information Technology Service Co Ltd filed Critical Zhongan Information Technology Service Co Ltd
Priority to CN201911408653.2A priority Critical patent/CN111145027A/zh
Publication of CN111145027A publication Critical patent/CN111145027A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Abstract

本发明公开了一种疑似洗钱交易识别方法及装置,其方法包括:获取各账户在预设期间内的交易信息,根据交易信息建立各账户在预设期间内的特征集合,特征集合的元素包括:交易总额、交易额离散度、账户转入频率、账户转出频率、操作周期离散程度;将每个账户的特征集合作为特征点,对特征点进行聚类分析,将特征点分到对应的簇中;识别簇内的异常特征点,异常特征点对应的特征集合中存在疑似洗钱交易。本发明以与账户关联的交易总额、交易额离散度、账户转入频率、账户转出频率、操作周期离散程度作为元素组成特征集合为基础进行聚类分析和异常特征点的挖掘,能够全面地对账户的交易情况进行评价,有效地识别出存在疑似洗钱交易的异常特征集合。

Description

一种疑似洗钱交易识别方法及装置
技术领域
本发明涉及数据处理技术领域,特别涉及一种疑似洗钱交易识别方法及装置。
背景技术
近年来,随着互联网金融的不断发展,一些扰乱正常金融秩序的网络金融犯罪也随之出现,网络洗钱便是其中一种。网络洗钱不仅侵犯了公民的合法权益,还会影响国家金融安全,因此打击网络洗钱不仅要依靠国家的法律法规,还应该在从业机构中完善反洗钱的机制和技术。现有技术中各从业机构的反洗钱机制主要是建立涉洗钱涉恐黑名单、识别疑似洗钱交易和可以交易报告制度,其中对疑似洗钱交易的识别方法集中在对客户身份识别的基础上,用量化阈值的手段来分析客户存取款频率以及账户余额,然而这种识别方法存在着预设标准易被规避、数据庞杂、漏报率/误报率高等问题,让识别疑似洗钱交易的准确率和反洗钱工作的效率大打折扣。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种疑似洗钱交易识别方法和装置。所述技术方案如下:
一方面,提供了一种疑似洗钱交易识别方法,包括:
获取各账户在预设期间内的交易信息,根据所述交易信息建立各账户在所述预设期间内的特征集合,所述特征集合的元素包括:交易总额、交易额离散度、账户转入频率、账户转出频率、操作周期离散程度;
将每个账户的所述特征集合作为特征点,对所述特征点进行聚类分析,将所述特征点分到对应的簇中;
识别所述簇内的异常特征点,所述异常特征点对应的特征集合中存在疑似洗钱交易。
进一步地,对所述特征点进行聚类分析,将所述特征点分到对应的簇中包括:
在所述特征点中随机选择预设数量的特征点作为各簇的中心点;
计算其他特征点与所述中心点的距离,将与所述中心点距离最小的特征点分到该所述中心点对应的簇中;
计算所述簇中的所述特征点与所述中心点的距离的平均值,根据所述平均值更新所述簇的中心点;
计算其他特征点与更新后的新中心点的距离,将与所述新中心点距离最小的特征点分到该所述新中心点对应的簇中;
重复确定所述新中心点,将所述特征点分配到对应的簇中。
进一步地,在更新所述簇的中心点时,所述方法还包括:
将所述平均值与预设平均值条件比对,若所述平均值不满足所述平均值条件,则停止更新所述簇的中心点,将独立在各所述簇外的特征点识别为所述异常特征点。
进一步地,识别所述簇内的异常特征点包括:
确定所述簇内各所述特征点的邻域,所述邻域内包括与所述特征点对应的邻居点;
计算所述邻域内所述特征点和所述邻居点的局部可达密度;
根据所述特征点和所述邻居点的局部可达密度,计算所述簇内各所述特征点的局部偏离因子,识别满足预设偏离因子条件的特征点为所述异常特征点,所述局部偏离因子为所述邻域中某个特征点的邻居点的局部可达密度的平均值与该特征点的局部可达密度的比值。
进一步地,确定所述簇内各所述特征点的邻域包括:
计算所述簇内所有特征点之间的距离,分别对每个特征点与其他特征点之间的距离进行排序,选出第k个的距离作为该特征点的k距,所述k距为该特征点的邻域,与所述该特征点距离不大于所述k距的所有特征点均为所述该特征点的邻居点。
进一步地,计算所述邻域内各所述特征点的局部可达密度包括:
计算所述邻域中所述特征点和各所述邻居点的可达距离,所述可达距离取各邻居点与其对应的特征点的距离和所述特征点的k距的最大值;
计算所述特征点对应的邻居点与所述特征点之间的平均可达距离;
所述局部可达密度取所述特征点的邻居点的数量与所述平均可达距离的比值。
进一步地,所述方法还包括:
识别所述交易总额超过预设大额参数的特征集合中存在疑似洗钱交易。
另一方面,提供了一种疑似洗钱交易识别装置,包括:
特征集合构建模块,用于获取各账户在预设期间内的交易信息,根据所述交易信息建立各账户在所述预设期间内的特征集合,所述特征集合的元素包括:交易总额、交易额离散度、账户转入频率、账户转出频率、操作周期离散程度;
聚类模块,用于将每个账户的所述特征集合作为特征点,对所述特征点进行聚类分析,将所述特征点分到对应的簇中;
簇内疑似洗钱交易识别模块,用于识别所述簇内的异常特征点,所述异常特征点对应的特征集合中存在疑似洗钱交易。
进一步地,所述聚类模块包括:
预设中心点模块,用于在所述特征点中随机选择预设数量的特征点作为各簇的中心点;
第一距离计算模块,用于计算其他特征点与所述中心点的距离,以及计算其他特征点与更新后的新中心点的距离;
中心点更新模块,用于计算所述簇中的所述特征点与所述中心点的距离的平均值,根据所述平均值更新所述簇的中心点;
归簇模块,用于将与所述中心点距离最小的特征点分到该所述中心点对应的簇中,以及将与所述新中心点距离最小的特征点分到该所述新中心点对应的簇中。
进一步地,所述装置还包括:
簇外疑似洗钱交易识别模块,用于在聚类过程中,将独立在所述簇外的特征点识别为所述异常特征点。
进一步地,所述簇内异常点识别模块包括:
邻域确定模块,用于确定所述簇内各所述特征点的邻域,所述邻域内包括与所述特征点对应的邻居点;
局部可达密度计算模块,用于计算所述邻域内所述特征点和所述邻居点的局部可达密度,所述局部可达密度取所述特征点的邻居点的数量与所述平均可达距离的比值;
局部偏离因子计算模块,用于根据所述特征点和所述邻居点的局部可达密度,计算所述簇内各所述特征点的局部偏离因子,所述局部偏离因子为所述邻域中某个特征点的邻居点的局部可达密度的平均值与该特征点的局部可达密度的比值;
识别模块,用于将所述局部偏离因子与预设偏离因子条件对比,识别满足预设偏离因子条件的特征点为所述异常特征点。
进一步地,所述邻域确定模块,具体用于计算所述簇内所有特征点之间的距离,分别对每个特征点与其他特征点之间的距离进行排序,选出第k个的距离作为该特征点的k距,所述k距为该特征点的邻域,与所述该特征点距离不大于所述k距的所有特征点均为所述该特征点的邻居点。
进一步地,所述局部可达密度计算模块包括:
可达距离计算模块,用于计算所述邻域中所述特征点和各所述邻居点的可达距离,以及计算所述特征点对应的邻居点与所述特征点之间的平均可达距离,所述可达距离取各邻居点与其对应的特征点的距离和所述特征点的k距的最大值。
进一步地,所述装置还包括:
大额交易识别模块,用于在构建所述特征集合时,将超过预设大额参数的交易总额对应的特征集合识别为存在疑似洗钱交易的特征集合。
本发明实施例提供的技术方案带来的有益效果是:
1、本发明以根据与账户关联的交易总额、交易额离散度、账户转入频率、账户转出频率、操作周期离散程度作为元素组成特征集合为基础进行聚类分析和异常特征点的挖掘,能够全面地对账户的交易情况进行评价,有效地识别出存在疑似洗钱交易的异常特征集合;
2、本发明在特征集合形成中、聚类分析中、簇内异常特征点挖掘过程中逐步识别异常特征点,能够尽可能地减小运算量,先将嫌疑大的特征点输出,再针对簇内进行异常特征点的分析,充分进行异常特征点的挖掘。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种疑似洗钱交易识别方法流程图;
图2是本发明实施例提供的一种疑似洗钱交易识别装置结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有的网络金融领域在的反洗钱工作中存在的准确性低、效率低的问题,本发明实施例提供了一种疑似洗钱交易识别方法及装置,具体技术方案如下所述。
如图1所示,一种疑似洗钱交易识别方法,包括:
获取各账户在预设期间内的交易信息,根据交易信息建立账户在预设期间内的特征集合,特征集合中的元素包括:交易总额、交易额离散度、账户转入频率、账户转出频率、操作周期离散程度;
将特征集合中的交易总额与预设大额参数比较,若满足,则识别与该交易总额对应的特征集合中存在疑似洗钱交易;
将每个账户的特征集合作为特征点,对特征点进行聚类分析,将特征点分到对应的簇中;
在聚类分析过程中,将没有分到簇内的特征点,识别为异常特征点,异常特征点对应的特征集合中存在疑似洗钱交易;
识别簇内的异常特征点,异常特征点对应的特征集合中存在疑似洗钱交易。
本发明实施例公开的方法中基于各账户的交易信息进行分析,交易信息包括:交易总额、交易额离散度、账户转入频率、账户转出频率、操作周期离散程度,其中,
交易总额Aij=∑|tn|,即在j期间内账户i的各交易的额度tn的绝对值求和;
交易额离散度Dij=SDnj/Averagenj,即在j期间内,账户i的n笔交易额的方差与他们的平均值的比值;
账户转入频率FDij=TDij/n,即在j期间内,账户i的资金转入操作次数占总操作次数n比值;
账户转出频率FWij=TWij/n,即在j期间内,账户i的资金转出操作次数占总操作次数n比值;
操作周期离散程度DPij=Pnj/Averagenj,即在j期间内,账户i的每笔交易的间隔周期与平均间隔周期的比值。
最后根据上述交易信息形成的特征集合为Cij=(Aij,Dij,FDij,FWij,DPij),多个期间内,每个账户i可形成的数据集为Si={Ci1,Ci2,Ci3,…Cij}。
本方法以交易总额、离散度、账户转入频率、账户转出频率、操作周期离散程度五个元素作为分析的基础数据,区别与现有技术中仅仅从交易总额和频率进行分析,更能够在账户的多笔交易中体现出单笔交易的异常,有利于精准确定疑似洗钱交易。
需要说明的是,在获取各账户在预设期间内的交易信息时,需现行将满足预设大额参数的交易总额输出,识别与该交易总额对应的特征集合中存在疑似洗钱交易,将对应的账户作为可疑账户,其中预设大额参数按照央行相关规定制定。
本发明实施例中对特征点进行聚类分析可采用层次聚类分析法、DBSCAN聚类分析法、K-means聚类分析法中的任意一种,由于K-means聚类分析法更适用于海量数据的处理,因此本发明实施例采用了基于K-means的聚类分析法对特征点进行聚类分析,具体的分析方法如下。
在特征点中随机选择预设数量的特征点作为各簇的中心点;
计算其他特征点与中心点的距离,将与中心点距离最小的特征点分到该中心点对应的簇中;
计算簇中特征点与中心点距离的平均值,根据平均值更新簇的中心点;
计算其他特征点与更新后的新中心点的距离,将与新中心点距离最小的特征点分到该新中心点对应的簇中;
重复后两个步骤,重新确定新中心点,将特征点分配到对应的簇中。
需要说明的是,上述方法中预设数量应当小于特征点的总量,选几个中心点就说明将各特征点划分了几个簇,一个簇配置一个中心点。计算特征点与中心点的距离采用下述公式:
Figure BDA0002349381810000081
其中Cx为特征点,Cck为中心点;Ax为特征点对应的特征集合中的交易总额,Dx为特征点对应的特征集合中的交易额离散度,FDx为特征点对应的特征集合中的账户转入频率,FWx为特征点对应的特征集合中的账户转出频率,DPx为特征点对应的特征集合中的操作周期离散程度;Ack为中心点对应的特征集合中的交易总额,Dck为中心点对应的特征集合中的交易额离散度,FDck为中心点对应的特征集合中的账户转入频率,FWck为中心点对应的特征集合中的账户转出频率,DPck为中心点对应的特征集合中的操作周期离散程度。
由于存在特征点与各簇的中心点距离较大的情况,若将该特征点强制划分到簇中,则会影响对簇中异常特征点识别的准确性,因此本发明实施例中在计算特征点与中心点的距离的平均值时上述方法还包括:簇外异常特征点识别,具体包括:
将平均值与预设平均值条件对比,若平均值不满足平均值条件,则停止更新该簇的中心点,将最终独立在各簇外的特征点识别为异常特征点。
对于簇内的异常特征点,本发明实施例采用如下所述的方法识别:
确定簇内各特征点的邻域,所述领域内包括与所述特征点对应的邻居点(K-nearest-neighbor,KNN);
计算邻域内特征点和邻居点的局部可达密度(local reachability density,LRD);
计算簇内各特征点的局部偏离因子(local outlier factor,LOF),识别满足预设偏离因子条件的特征点为异常特征点,局部偏离因子为邻域中某个特征点的邻居点的局部可达密度的平均值与该特征点的局部可达密度比值,即为:
Figure BDA0002349381810000082
其中
Figure BDA0002349381810000083
为某个特征点的邻居点的可达密度平均值,
Figure BDA0002349381810000084
为该特征点的可达密度。
需要说明的是,上述方法中,局部可达密度越小,该特征点与簇内其他特征点就越疏远,局部偏离因子越大特征点中存在疑似洗钱交易的可能性就越高。预设偏离因子条件可以是将特征点按照局部偏离因子大小排序,将满足排名序号的特征点识别为异常特征点,或者设定局部偏离因子的阈值范围,将满足该阈值范围内的特征点识别为异常特征点。
上述方法中,确定簇内各特征点的邻域包括:
计算簇内各特征点到其他特征点之间的距离,分别对每个特征点与其他特征点之间的距离进行排序,选出第k个距离作为该特征点的k距(k-distance,KD),所述k距为该特征点的邻域,与所述该特征点距离不大于所述k距的所有特征点均为所述该特征点的邻居点。
需要说明的是,选出第k个距离作为该特征点的k距,即选出距该特征点第k远的特征点的距离,在k距范围内除该特征点之外的所有的特征点均为该特征点的邻居点。
上述方法中计算邻域内特征点和邻居点的局部可达密度包括:
计算邻域中特征点和邻居点的可达距离(reachability distance,RD),可达距离取各邻居点与其对应的特征点的距离与该特征点k距的最大值,即为:
Figure BDA0002349381810000091
其中,
Figure BDA0002349381810000092
为邻域中特征点或邻居点的可达距离,KD为特征点或邻居点的k距,Distance(Cx,Ca)}为各邻居点到其对应的特征点之间的距离;
计算特征点对应的邻居点与该特征点之间的平均可达距离;
局部可达密度取特征点的邻居点的数量与平均可达距离的比值,即为:
Figure BDA0002349381810000093
其中,
Figure BDA0002349381810000094
为特征点的局部可达密度,Nkd为邻居点的数量,
Figure BDA0002349381810000095
为特征点对应的邻居点与该特征点之间的平均可达距离。
本发明实施例公开的疑似洗钱交易的识别方法中,在形成聚类分析时、簇内异常特征点识别时,均识别出了异常特征点,将这些异常特征点输出,在异常特征点在预设期间内的n笔交易中随机抽取一笔交易,判定该交易是否异常;考察异常特征点对应的特征集合中的交易额离散度。若随机抽取的交易为疑似洗钱交易,且该特征点的交易额离散度低,则识别所述异常特征点对应的账户为一级可疑账户;若随机抽取的交易为疑似洗钱交易,且该特征点的交易额离散度高,则识别所述异常特征点对应的账户为二级可疑账户;随机抽取的交易为非疑似洗钱交易,且该特征点的交易额离散度高,则识别所述异常特征点对应的账户为三级可疑账户;随机抽取的交易为非疑似洗钱交易,且该特征点的交易额离散度低,则识别所述异常特征点对应的账户为四级可疑账户。
如图2所示,为了实现上述疑似洗钱交易识别方法,本发明实施例还提供了一种疑似洗钱交易识别装置包括:特征集合构建模块、聚类模块、簇内疑似洗钱交易识别模块、簇外疑似洗钱交易识别模块、大额交易识别模块。
其中,特征集合构建模块,用于获取各账户在预设期间内的交易信息,根据所述交易信息建立各账户在所述预设期间内的特征集合,所述特征集合的元素包括:交易总额、交易额离散度、账户转入频率、账户转出频率、操作周期离散程度。
大额交易识别模块,用于在构建所述特征集合时,将超过预设大额参数的交易总额对应的特征集合识别为存在疑似洗钱交易的特征集合。
聚类模块,用于将每个账户的所述特征集合作为特征点,对所述特征点进行聚类分析,将所述特征点分到对应的簇中。具体包括:
预设中心点模块,用于在所述特征点中随机选择预设数量的特征点作为各簇的中心点;
第一距离计算模块,用于计算其他特征点与所述中心点的距离,以及计算其他特征点与更新后的新中心点的距离;
中心点更新模块,用于计算所述簇中的所述特征点与所述中心点的距离的平均值,根据所述平均值更新所述簇的中心点;
归簇模块,用于将与所述中心点距离最小的特征点分到该所述中心点对应的簇中,以及将与所述新中心点距离最小的特征点分到该所述新中心点对应的簇中。
簇外疑似洗钱交易识别模块,用于在聚类过程中,将独立在所述簇外的特征点识别为所述异常特征点。
簇内疑似洗钱交易识别模块,用于识别所述簇内的异常特征点,所述异常特征点对应的特征集合中存在疑似洗钱交易。具体包括:
邻域确定模块,用于确定所述簇内各所述特征点的邻域,所述邻域内包括与所述特征点对应的邻居点;
局部可达密度计算模块,用于计算所述邻域内所述特征点和所述邻居点的局部可达密度,所述局部可达密度取所述特征点的邻居点的数量与所述平均可达距离的比值;
局部偏离因子计算模块,用于计算所述簇内各所述特征点的局部偏离因子,所述局部偏离因子为所述邻域中某个特征点的邻居点的局部可达密度的平均值与该特征点的局部可达密度的比值;
识别模块,用于将所述局部偏离因子与预设偏离因子条件对比,识别满足预设偏离因子条件的特征点为所述异常特征点。
其中,邻域确定模块,具体用于计算所述簇内所有特征点之间的距离,分别对每个特征点与其他特征点之间的距离进行排序,选出第k个的距离作为该特征点的k距,所述k距为该特征点的邻域,与所述该特征点距离不大于所述k距的所有特征点均为所述该特征点的邻居点。
局部可达密度计算模块包括:
可达距离计算模块,用于计算所述邻域中所述特征点和各所述邻居点的可达距离,以及计算所述特征点对应的邻居点与所述特征点之间的平均可达距离,所述可达距离取各邻居点与其对应的特征点的距离和所述特征点的k距的最大值。
上述装置能够实现本发明实施例公开的疑似洗钱交易识别方法,全面地评价账户的交易,充分地将疑似洗钱交易挖掘出来。
本发明实施例提供的技术方案带来的有益效果是:
1、本发明以根据与账户关联的交易总额、交易额离散度、账户转入频率、账户转出频率、操作周期离散程度作为元素组成特征集合为基础进行聚类分析和异常特征点的挖掘,能够全面地对账户的交易情况进行评价,有效地识别出存在疑似洗钱交易的异常特征集合;
2、本发明在特征集合形成中、聚类分析中、簇内异常特征点挖掘过程中逐步识别异常特征点,能够尽可能地减小运算量,先将嫌疑大的特征点输出,再针对簇内进行异常特征点的分析,充分进行异常特征点的挖掘。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种疑似洗钱交易识别方法,其特征在于,包括:
获取各账户在预设期间内的交易信息,根据所述交易信息建立各账户在所述预设期间内的特征集合,所述特征集合的元素包括:交易总额、交易额离散度、账户转入频率、账户转出频率、操作周期离散程度;
将每个账户的所述特征集合作为特征点,对所述特征点进行聚类分析,将所述特征点分到对应的簇中;
识别所述簇内的异常特征点,所述异常特征点对应的特征集合中存在疑似洗钱交易。
2.如权利要求1所述的一种疑似洗钱交易识别方法,其特征在于,对所述特征点进行聚类分析,将所述特征点分到对应的簇中包括:
在所述特征点中随机选择预设数量的特征点作为各簇的中心点;
计算其他特征点与所述中心点的距离,将与所述中心点距离最小的特征点分到该所述中心点对应的簇中;
计算所述簇中的所述特征点与所述中心点的距离的平均值,根据所述平均值更新所述簇的中心点;
计算其他特征点与更新后的新中心点的距离,将与所述新中心点距离最小的特征点分到该所述新中心点对应的簇中;
重复确定所述新中心点,将所述特征点分配到对应的簇中。
3.如权利要求2所述的一种疑似洗钱交易识别方法,其特征在于,在更新所述簇的中心点时,所述方法还包括:
将所述平均值与预设平均值条件比对,若所述平均值不满足所述平均值条件,则停止更新所述簇的中心点,将独立在各所述簇外的特征点识别为所述异常特征点。
4.如权利要求1所述的一种疑似洗钱交易识别方法,其特征在于,识别所述簇内的异常特征点包括:
确定所述簇内各所述特征点的邻域,所述邻域内包括与所述特征点对应的邻居点;
计算所述邻域内所述特征点和所述邻居点的局部可达密度;
根据所述特征点和所述邻居点的局部可达密度,计算所述簇内各所述特征点的局部偏离因子,识别满足预设偏离因子条件的特征点为所述异常特征点,所述局部偏离因子为所述邻域中某个特征点的邻居点的局部可达密度的平均值与该特征点的局部可达密度的比值。
5.如权利要求4所述的一种疑似洗钱交易识别方法,其特征在于,确定所述簇内各所述特征点的邻域包括:
计算所述簇内所有特征点之间的距离,分别对每个特征点与其他特征点之间的距离进行排序,选出第k个的距离作为该特征点的k距,所述k距为该特征点的邻域,与所述该特征点距离不大于所述k距的所有特征点均为所述该特征点的邻居点。
6.如权利要求4所述的一种疑似洗钱交易识别方法,其特征在于,计算所述邻域内各所述特征点的局部可达密度包括:
计算所述邻域中所述特征点和各所述邻居点的可达距离,所述可达距离取各邻居点与其对应的特征点的距离和所述特征点的k距的最大值;
计算所述特征点对应的邻居点与所述特征点之间的平均可达距离;
所述局部可达密度取所述特征点的邻居点的数量与所述平均可达距离的比值。
7.如权利要求1~6中任意一项所述的一种疑似洗钱交易识别方法,其特征在于,所述方法还包括:
识别所述交易总额超过预设大额参数的特征集合中存在疑似洗钱交易。
8.一种疑似洗钱交易识别装置,其特征在于,包括:
特征集合构建模块,用于获取各账户在预设期间内的交易信息,根据所述交易信息建立各账户在所述预设期间内的特征集合,所述特征集合的元素包括:交易总额、交易额离散度、账户转入频率、账户转出频率、操作周期离散程度;
聚类模块,用于将每个账户的所述特征集合作为特征点,对所述特征点进行聚类分析,将所述特征点分到对应的簇中;
簇内疑似洗钱交易识别模块,用于识别所述簇内的异常特征点,所述异常特征点对应的特征集合中存在疑似洗钱交易。
9.如权利要求8所述的一种疑似洗钱交易识别装置,其特征在于,所述装置还包括:
簇外疑似洗钱交易识别模块,用于在聚类过程中,将独立在所述簇外的特征点识别为所述异常特征点。
10.如权利要求8所述的一种疑似洗钱交易识别装置,其特征在于,所述装置还包括:
大额交易识别模块,用于在构建所述特征集合时,将超过预设大额参数的交易总额对应的特征集合识别为存在疑似洗钱交易的特征集合。
CN201911408653.2A 2019-12-31 2019-12-31 一种疑似洗钱交易识别方法及装置 Pending CN111145027A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911408653.2A CN111145027A (zh) 2019-12-31 2019-12-31 一种疑似洗钱交易识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911408653.2A CN111145027A (zh) 2019-12-31 2019-12-31 一种疑似洗钱交易识别方法及装置

Publications (1)

Publication Number Publication Date
CN111145027A true CN111145027A (zh) 2020-05-12

Family

ID=70522393

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911408653.2A Pending CN111145027A (zh) 2019-12-31 2019-12-31 一种疑似洗钱交易识别方法及装置

Country Status (1)

Country Link
CN (1) CN111145027A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111736742A (zh) * 2020-06-04 2020-10-02 深圳追一科技有限公司 固定规则的配置方法、装置、计算机设备和存储介质
CN112435126A (zh) * 2021-01-26 2021-03-02 深圳华锐金融技术股份有限公司 账户识别方法、装置、计算机设备和存储介质
CN113011888A (zh) * 2021-03-11 2021-06-22 中南大学 一种针对数字货币的异常交易行为检测方法、装置、设备及介质
CN114742655A (zh) * 2022-06-13 2022-07-12 杭银消费金融股份有限公司 基于机器学习的反洗钱行为识别系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182803A (zh) * 2014-08-13 2014-12-03 东北电力大学 风电数据预处理方法及风电功率预测方法和系统
CN106156795A (zh) * 2016-07-05 2016-11-23 中国银联股份有限公司 一种可疑洗钱账户的确定方法及装置
CN106469181A (zh) * 2015-08-21 2017-03-01 方正国际软件(北京)有限公司 一种用户行为模式分析方法及装置
CN108206813A (zh) * 2016-12-19 2018-06-26 中国移动通信集团山西有限公司 基于k均值聚类算法的安全审计方法、装置及服务器
CN108280755A (zh) * 2018-02-28 2018-07-13 阿里巴巴集团控股有限公司 可疑洗钱团伙的识别方法和识别装置
CN108417023A (zh) * 2018-05-02 2018-08-17 长安大学 基于出租车上下客点空间聚类的交通小区中心点选取方法
CN109767327A (zh) * 2018-12-20 2019-05-17 平安科技(深圳)有限公司 基于反洗钱的客户信息采集及其使用方法
CN109872232A (zh) * 2019-01-04 2019-06-11 平安科技(深圳)有限公司 涉及非法所得合法化行为的账户分类方法、装置、计算机设备及存储介质
CN110458376A (zh) * 2018-05-07 2019-11-15 上海诺悦智能科技有限公司 一种可疑风险交易筛查方法与相应系统
CN110491475A (zh) * 2019-08-20 2019-11-22 广东美的白色家电技术创新中心有限公司 一种菜谱推荐处理方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182803A (zh) * 2014-08-13 2014-12-03 东北电力大学 风电数据预处理方法及风电功率预测方法和系统
CN106469181A (zh) * 2015-08-21 2017-03-01 方正国际软件(北京)有限公司 一种用户行为模式分析方法及装置
CN106156795A (zh) * 2016-07-05 2016-11-23 中国银联股份有限公司 一种可疑洗钱账户的确定方法及装置
CN108206813A (zh) * 2016-12-19 2018-06-26 中国移动通信集团山西有限公司 基于k均值聚类算法的安全审计方法、装置及服务器
CN108280755A (zh) * 2018-02-28 2018-07-13 阿里巴巴集团控股有限公司 可疑洗钱团伙的识别方法和识别装置
CN108417023A (zh) * 2018-05-02 2018-08-17 长安大学 基于出租车上下客点空间聚类的交通小区中心点选取方法
CN110458376A (zh) * 2018-05-07 2019-11-15 上海诺悦智能科技有限公司 一种可疑风险交易筛查方法与相应系统
CN109767327A (zh) * 2018-12-20 2019-05-17 平安科技(深圳)有限公司 基于反洗钱的客户信息采集及其使用方法
CN109872232A (zh) * 2019-01-04 2019-06-11 平安科技(深圳)有限公司 涉及非法所得合法化行为的账户分类方法、装置、计算机设备及存储介质
CN110491475A (zh) * 2019-08-20 2019-11-22 广东美的白色家电技术创新中心有限公司 一种菜谱推荐处理方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邓敏等: "《空间分析》", 测绘出版社, pages: 174 - 175 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111736742A (zh) * 2020-06-04 2020-10-02 深圳追一科技有限公司 固定规则的配置方法、装置、计算机设备和存储介质
CN111736742B (zh) * 2020-06-04 2022-02-11 深圳追一科技有限公司 固定规则的配置方法、装置、计算机设备和存储介质
CN112435126A (zh) * 2021-01-26 2021-03-02 深圳华锐金融技术股份有限公司 账户识别方法、装置、计算机设备和存储介质
CN112435126B (zh) * 2021-01-26 2021-06-18 深圳华锐金融技术股份有限公司 账户识别方法、装置、计算机设备和存储介质
CN113011888A (zh) * 2021-03-11 2021-06-22 中南大学 一种针对数字货币的异常交易行为检测方法、装置、设备及介质
CN113011888B (zh) * 2021-03-11 2024-04-02 中南大学 一种针对数字货币的异常交易行为检测方法、装置、设备及介质
CN114742655A (zh) * 2022-06-13 2022-07-12 杭银消费金融股份有限公司 基于机器学习的反洗钱行为识别系统

Similar Documents

Publication Publication Date Title
CN111145027A (zh) 一种疑似洗钱交易识别方法及装置
De Roux et al. Tax fraud detection for under-reporting declarations using an unsupervised machine learning approach
Cheng et al. MS-LSTM: A multi-scale LSTM model for BGP anomaly detection
US9953160B2 (en) Applying multi-level clustering at scale to unlabeled data for anomaly detection and security
WO2018103456A1 (zh) 一种基于特征匹配网络的社团划分方法、装置及电子设备
Ogwueleka Data mining application in credit card fraud detection system
CN110363510B (zh) 一种基于区块链的加密货币用户特征挖掘、异常用户检测方法
CN109754258B (zh) 一种基于个体行为建模的面向线上交易欺诈检测方法
CN109034194A (zh) 基于特征分化的交易欺诈行为深度检测方法
Li et al. Intelligent anti-money laundering solution based upon novel community detection in massive transaction networks on spark
CN114189347B (zh) 一种数据粒子化与网闸相结合的数据安全传输方法
CN107483451B (zh) 基于串并行结构网络安全数据处理方法及系统、社交网络
CN113064932B (zh) 一种基于数据挖掘的网络态势评估方法
WO2019200739A1 (zh) 数据欺诈识别方法、装置、计算机设备和存储介质
CN113011888A (zh) 一种针对数字货币的异常交易行为检测方法、装置、设备及介质
CN111191720B (zh) 一种业务场景的识别方法、装置及电子设备
Lata et al. A comprehensive survey of fraud detection techniques
Luo et al. Anomalous edge detection in edge exchangeable social network models
Hossain et al. Cyber attack detection model (CADM) based on machine learning approach
Zhang et al. Transaction community identification in bitcoin
Bui et al. A clustering-based shrink autoencoder for detecting anomalies in intrusion detection systems
CN115085948B (zh) 基于改进d-s证据理论的网络安全态势评估方法
CN114519605A (zh) 广告点击欺诈检测方法、系统、服务器和存储介质
Li et al. Dragnet: A method for tagging bitcoin addresses of exchanges
Smrithy et al. A statistical technique for online anomaly detection for big data streams in cloud collaborative environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination