CN114155096A - 基于三部图的银行侦测网络赌博资金非法转移行为的方法 - Google Patents
基于三部图的银行侦测网络赌博资金非法转移行为的方法 Download PDFInfo
- Publication number
- CN114155096A CN114155096A CN202111137825.4A CN202111137825A CN114155096A CN 114155096 A CN114155096 A CN 114155096A CN 202111137825 A CN202111137825 A CN 202111137825A CN 114155096 A CN114155096 A CN 114155096A
- Authority
- CN
- China
- Prior art keywords
- transaction
- bank
- transfer
- public
- account
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
- G06Q10/063114—Status monitoring or status determination for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及基于三部图的银行侦测网络赌博资金非法转移行为的方法,获取待侦测的银行对公账户名单,基于名单中各银行对公账户的交易流水,构建三部图模型;分析三部图模型,得到名单中各银行对公账户对应的一般图特征和专用图特征;将名单中各银行对公账户对应的一般特征、一般图特征和专用图特征代入网络赌博资金非法转移行为侦测模型,得到网络赌博资金非法转移行为侦测模型输出的嫌疑账户名单;本发明提高了银行识别网络赌博资金非法转移行为的可靠性,并增强了银行对网络赌博资金非法转移行为识别结果的可解释性。
Description
技术领域
本发明涉及反赌博资金非法转移领域,尤其涉及一种基于三部图的银行侦测网络赌博资金非法转移行为的方法。
背景技术
网络赌博资金非法转移行为是指在互联网上利用扑克类、麻将类、捕鱼类、各项赛事、各种博彩等赌博活动,并采用非常规手段变相将赌资合法化从而达成资金洗白目的的行为,是黑色产业链中的重要一环;由于当前参与网络赌博的用户数量庞大,赌资流动数额巨大,对金融安全和经济秩序构成了重大威胁,因此,需要对网络赌博资金非法转移行为进行侦测来抓捕非法转移赌资犯罪团伙。
目前,一般利用预先设置的反赌博资金非法转移规则、以无监督机器学习方式训练的反赌博资金非法转移模型、以有监督机器学习方式训练的反赌博资金非法转移模型和预先设置的反赌博资金非法转移知识图谱识别网络赌博资金非法转移行为。
其中,反赌博资金非法转移规则是基于由事后案例甄别的相关交易和账户,以及人工经验总结的异常交易模式和账户特征制定的,易于应用,可以实现快速侦测和响应,嫌疑对象由明确的规则和条件触发,可解释性好;但是只适用于强规则,弱规则会导致网络赌博资金非法转移行为的识别能力差,网络赌博资金非法转移行为的侦测效率不高,还会出现误识别现象,给后续运维人员带来大量的工作量。
以无监督机器学习方式训练的反赌博资金非法转移模型,以弱特征构成的样本为输入,以异常交易或者可疑团伙为输出训练的,其在训练前不需要事先对样本进行标注,在训练样本数量不够多时也能在识别新的赌博资金非法转移模式上取得较好的识别效果,主要用于侦察异常交易行为或者账号群组,并对其进行后验分析确认赌博资金非法转移行为或者非法转移赌资犯罪团伙;但是异常行为不能直接认定为赌博资金非法转移行为,因此,这种方法的误警率会比较高,结果可解释性较差。
以有监督机器学习方式训练的反赌博资金非法转移模型,从已发生网络赌博资金非法转移行为账号的相关信息和交易流水等数据中提炼特征信息,同时需要专家根据赌博资金非法转移行为对账号或交易进行打标,并基于所述特征和打标训练模型;该模型能够实现高效地识别,同时具有一定的鲁棒性;但是由于当前非法转移赌资犯罪高速发展,犯罪手法复杂隐蔽性高,且多为未使用或者较少使用的犯罪手法,模型受样本库完备性的影响,很难识别相应的犯罪行为。
反赌博资金非法转移知识图谱,对账户信息和交易行为等相关数据以图谱的形式进行组织、存储和管理;并采用图算法在图谱上进行分析和挖掘识别可疑的非法转移赌资犯罪团伙,其在关联、穿透等方面具有较强优势,能够对复杂的资金链路进行追踪并识别非法转移赌资犯罪团伙。但是可能会因无足够的数据无法构建知识图谱,同时,由于犯罪分子具有一定的反侦测经验,可能会采用一些手段影响图谱分析的效能。
发明内容
针对现有技术存在的问题,本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的一种基于三部图的银行侦测网络赌博资金非法转移行为的方法。
本发明实施例提供的一种基于三部图的银行侦测网络赌博资金非法转移行为的方法,包括:
获取待侦测的银行对公账户名单,基于所述名单中各银行对公账户的交易流水,构建三部图模型;其中,所述交易为经营性交易,所述交易流水包含交易对象、交易时间和交易金额的信息;
分析所述三部图模型,得到所述名单中各银行对公账户对应的一般图特征和专用图特征;
将所述名单中各银行对公账户对应的一般特征、一般图特征和专用图特征代入网络赌博资金非法转移行为侦测模型,得到网络赌博资金非法转移行为侦测模型输出的嫌疑账户名单;
其中,所述网络赌博资金非法转移行为侦测模型是基于已侦测的银行对公账户名单中银行对公账户的一般特征、一般图特征、专用图特征以及是否处于赌博资金非法转移黑名单内的判定信息训练得到的。
根据本发明提供的一种基于三部图的银行侦测网络赌博资金非法转移行为的方法,所述基于所述名单中各银行对公账户的交易流水,构建三部图模型,具体为:
对名单中所有银行对公账户的交易对象进行统计,确定转入账户和转出账户;其中,所述转入/转出账户为转入/转出交易流水中银行对公账户的交易对象;
以转入账户、银行对公账户和转出账户为三部图模型中第一层、第二层和第三层的节点,以各账户之间的交易为三部图模型中各账户对应节点之间的边,构建三部图模型;其中,所述三部图模型的边有其对应的属性标记,所述属性标记包括:交易时间和交易金额。
根据本发明提供的一种基于三部图的银行侦测网络赌博资金非法转移行为的方法,所述分析所述三部图模型,得到所述名单中各银行对公账户对应的专用图特征,具体为:
获取预先设定的时间窗集合;
对于时间窗集合中的每一个时间窗,基于各银行对公账户的交易流水,计算相应时间窗下三部图模型各条边的权重;
对相应时间窗下与各银行对公账户对应节点连接的边的权重进行聚合操作,得到相应时间窗下各银行对公账户的第一嫌疑度;
将相应时间窗下与转入/转出账户对应节点连接的边的权重和作为相应时间窗下转入/转出账户的嫌疑度,并对与各银行对公账户对应节点连接的边的嫌疑度进行聚合操作,得到相应时间窗下各银行对公账户的第二嫌疑度;
将各时间窗下各银行对公账户的第一嫌疑度和第二嫌疑度,作为各银行对公账户的专用图特征;
其中,所述聚合操作,包括但不限于:求和、求均值、求均值,求最大值、求最小值和求中位数。
根据本发明提供的一种基于三部图的银行侦测网络赌博资金非法转移行为的方法,所述对于时间窗集合中的每一个时间窗,基于各银行对公账户的交易流水,计算相应时间窗下三部图模型各条边的权重,具体为:
按照交易时间由前至后的顺序对各银行对公账户的交易流水进行排序;
通过滑动时间窗的方式分别对各银行对公账户的交易流水排序序列进行扫描,并将扫描过程中处于同一滑动窗口下的交易流水列入同一个交易子集中,得到相应时间窗下各银行对公账户下属的各交易子集;
基于相应时间窗下各银行对公账户下属的各交易子集的交易统计信息,计算相应时间窗下各银行对公账户在其下属的各交易子集中的嫌疑度;其中,所述交易统计信息,包括:转入账户与转出账户的数量比,转入流水与转出流水的笔数比和转入金额和转出金额的数值比;
将相应时间窗下各银行对公账户在其下属的各交易子集中的嫌疑度,作为相应时间窗下所述各交易子集的交易流水对应的边的权重。
根据本发明提供的一种基于三部图的银行侦测网络赌博资金非法转移行为的方法,所述相应时间窗下各银行对公账户在其下属的各交易子集中的嫌疑度,具体通过一下公式计算:
wij=a1f(αij)+a2f(βij)+a3g(γij)
f(αij)=tanh(bαij)
f(βij)=tanh(bβij)
上式中,a1表示第一权重系数,f(·)表示第一嫌疑度转换函数,αij表示相应时间窗下银行对公账户i下属的交易子集j中转入账户与转出账户的数量比,a2表示第二权重系数,βij表示相应时间窗下银行对公账户i下属的交易子集j中转入流水与转出流水的笔数比,a3表示第三权重系数,g(·)表示第二嫌疑度转换函数,γij表示相应时间窗下银行对公账户i下属的交易子集j中转入金额和转出金额的数值比,b表示第一嫌疑度转换参数,c表示第二嫌疑度转换参数。
根据本发明提供的一种基于三部图的银行侦测网络赌博资金非法转移行为的方法,所述分析所述三部图模型,得到所述名单中各银行对公账户对应的一般图特征,具体为:求解各银行对公账户对应节点的出度、入度、中心度和PageRank值,并将其作为各银行对公账户的一般图特征。
根据本发明提供的一种基于三部图的银行侦测网络赌博资金非法转移行为的方法,所述各银行对公账户对应的一般特征,包括:各对公账户的账户信息、以及采样时期内交易行为统计信息和其它行为统计信息;
所述账户信息,包括:自身基本信息、交易对象基本信息、有资金往来的第三方机构的基本信息、客户画像、工商登记信息和赌博资金非法转移黑名单;
所述交易行为统计信息,包括:资金留存统计信息,以及交易笔数统计信息、交易金额统计信息、交易时段统计信息和交易对象为对私账户和对公账户的统计信息;
所述其它行为统计信息,包括:登录行为统计信息和变更行为统计信息;
其中,所述基本信息,包括:登记信息和业务信息;
所述赌博资金非法转移黑名单,包括:监管规则覆盖下的赌博资金非法转移黑名单和各类监管部门下发的赌博资金非法转移黑名单;
所述登录行为,包括:登录时间和登录设备;
所述变更行为,包括:变更时间和变更项目。
本发明提供的一种基于三部图的银行侦测网络赌博资金非法转移行为的方法,利用银行对公账户交易流水构建三部图模型,以所述三部图模型为辅助,从多个时间尺度下提取银行对公账户的特征信息,并利用银行对公账户的特征信息进行网络赌博资金非法转移行为的识别,提高了银行识别网络赌博资金非法转移行为的可靠性,并增强了银行对网络赌博资金非法转移行为识别结果的可解释性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的一种基于三部图的银行侦测网络赌博资金非法转移行为的方法的流程示意图;
图2是本发明提供的网络赌博资金非法转移行为侦测模型的构建过程示意图;
图3是本发明提供的三部图模型示意图;
图4是本发明提供的三部图模型的三角形态分析图;
图5是本发明提供的得到各银行对公账户的专用图特征的实际操作流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图5描述本发明提供的一种基于三部图的银行侦测网络赌博资金非法转移行为的方法。
如图1所示,本发明提供的一种基于三部图的银行侦测网络赌博资金非法转移行为的方法,包括:
S11、获取待侦测的银行对公账户名单,基于所述名单中各银行对公账户的交易流水,构建三部图模型;其中,所述交易为经营性交易,所述交易流水包含交易对象、交易时间和交易金额的信息;
因为银行对公账户交易流水除经营性流水外,另有投资交易、管理费用、租金等其他交易流水,以及与保险、银行、政府或公共部门、同名企业不同账户的流水等正规流水,为了避免一些不必要的数据干扰,本申请的交易流水特指经营性流水。
S12、分析所述三部图模型,得到所述名单中各银行对公账户对应的一般图特征和专用图特征;
这里需要说明的是,三部图模型可以详细体现行内对公账户交易流水,对三部图模型进行分析的过程实则为对所有行内对公账户的交易行为进行分析,提取行为特征的过程,通过构建三部图模型并借助三部图模型进行特征提取,能够银行对网络赌博资金非法转移行为识别结果的可解释性。
S13、将所述名单中各银行对公账户对应的一般特征、一般图特征和专用图特征代入网络赌博资金非法转移行为侦测模型,得到网络赌博资金非法转移行为侦测模型输出的嫌疑账户名单;
在本技术领域内,本发明用于银行识别行内对公账号是否进行网络赌博资金非法转移交易,本发明方法也可适应性的用于其它金融机构组织。
其中,所述网络赌博资金非法转移行为侦测模型是基于已侦测的银行对公账户名单中银行对公账户的一般特征、一般图特征、专用图特征以及是否处于赌博资金非法转移黑名单内的判定信息训练得到的。
需要说明的是,已侦测的银行对公账户名单和待侦测的银行对公账户名单中银行对公账户的一般特征、一般图特征、专用图特征的获取过程是相同的;
另外网络赌博资金非法转移行为侦测模型为事后模型,主要用于识别银行对公账号是否进行网络赌博资金非法转移交易;
图2示例了网络赌博资金非法转移行为侦测模型的构建流程示意图,如图2所示,网络赌博资金非法转移行为侦测模型的构建过程可以分为构建三部图模型、构建数据集和训练网络赌博资金非法转移行为侦测模型三个阶段,具体步骤如下:
步骤1:构建三部图模型,具体包括以下两个子步骤:
步骤1.1:三部图模型框架设计。图3示例了三部图模型示意图,如图3所示,节点表示账号,边表示账号之间的交易。三部图模型分为三层,每一层节点之间没有边连接,第一层节点与第二层(中间层) 节点之间有边连接,第二层节点与第三层节点之间有边连接。第二层放置待侦测的账户集合,第一层/第三层放置与其转入/转出流水相关的账户,即第一层放置转入账户,第二层放置银行对公账户(后续也称之为中间账户)、第三层放置转出账户。第二层节点对应的账户为行内账户,第一层节点/第三层节点对应的账户没有限制,多数为行外账户。第一层节点和第二层节点之间的连接边表示第二层节点对应的账户的转入流水,第二层节点和第三层节点之间的连接边表示第二层节点对应的账户的转出流水。步骤1.2:数据加工上图,具体包括以下三个子步骤:
步骤1.2.1:数据准备。准备一组已侦测的银行对公账户(即确定已侦测的银行对公账户名单),预先设定采样周期,并有针对性的从银行数据库中提取名单中各银行对公账户的相关数据;
其中,所述相关数据,主要包括账户信息(包括基本信息、关联公司信息、客户画像、登陆行为和变更行为)、所有类型交易流水(采样周期一般以自然月为单位,本实施例取指定个数自然月的所有类型交易流水)以及外部数据(不限于工商登记信息、监管规则覆盖下的赌博资金非法转移黑名单、各类监管部门下发的赌博资金非法转移黑名单和有关联的第三方数据);
步骤1.2.2:加工处理。银行对公账户交易流水除经营性流水外,另有投资交易、管理费用、租金等其他交易流水,这里只保留经营性流水。同时,还需要剔除与保险缴费、银行缴费、政府或公共部门缴费、同名企业不同账户的来往流水以及其他正规流水。
步骤1.2.3:数据上图。三部图模型的中间层节点对应银行对公账户,节点属性包括账户信息和外部数据,第一层节点和第三层节点分别对应付款账户和收款账户,节点属性包括账户标签(诸如行内行外账户、对私对公账户等)和外部数据。第一层节点和中间层节点之间的边对应银行对公账户的转入流水,中间层和第三层之间的边对应银行对公账户的转出流水,边属性主要是交易信息(交易时间、交易金额、交易标记等)。
在此阶段,将银行对公账号交易流水以节点、边以及边属性标签形式表征在三部图模型中,得到最终构建的三部图模型。节点属性标签在有需要的时候也可以表征在三部图模型中。
步骤2:构建数据集。所述数据集是由从不同维度下提取银行对公账户的一般特征、一般图特征和专用图特征生成的,多维度特征丰富了训练样本的内容,进一步提升了网络赌博资金非法转移行为侦测模型识别准确度。
以银行对公账户为样本,从三部图模型中提取银行对公账户的一般图特征和专用图特征,并将银行对公账户的一般特征、一般图特征和专用图特征作为样本特征。具体表现为:
一般特征主要是指银行对公账户节点属性、交易行为统计(包括交易笔数统计、交易金额统计、交易对手统计(对私和对公)、交易时段统计、资金存留统计等)和其它行为统计(账户登陆行为统计、账户变更行为统计等)。这些特征主要是账户及其交易的基本统计,建立相应规则加工的特征,不需要依赖图模型生成。
一般图特征,包括一般图指标(不限于节点出入度、节点中心度、 PageRank等常规图指标)。
专用图特征是指结合领域经验从三部图模型上计算得到的特征。专用图特征提取通过在三部图模型上量化网络赌博资金非法转移交易行为来实现的,这里主要是在三部图模型上找一种三角形态,具体定义为:
当可疑账户处在中间层的位置上,其网络赌博资金非法转移的交易行为在三部图模型上呈现出一种三角形态。图4示出了三部图模型的三角形态分析图,如图4所示,三角形态中付款账户数量多于收款账户数量,银行对公账户的转入交易流水笔数多于转出交易流水笔数,从而形成资金的聚合以及流动,且资金在银行对公账户上的停留时间较短。
图5示出了得到各银行对公账户的专用图特征的实际操作流程图,如图5所示,设定一个时间窗集合T={T1,T2,…Td},对每个时间窗 Tk分别从三部图模型上采集专用图特征,具体包括如下四个子步骤:
步骤2.1:根据银行对公账户的交易数据划分为交易子集。假设银行对公账户i,取出相关交易数据并按时间排序,采用滑动时间窗 Tk对排序后交易数据进扫描(步长可配置,默认为Tk),落在时间窗内的转入交易和转出交易归于一个交易子集,得到银行对公账户i 下属的各交易子集;
步骤2.2:三角形态中的量化。银行对公账户i,交易子集j,分别计算αij、βij和γij;αij表示转入账户与转出账户数量之比,βij表示转入笔数与转出笔数之比,γij表示转入金额与转出金额之比,银行对公账户i在其下属的交易子集j中的嫌疑度wij为:
wij=a1f(αij)+a2f(βij)+a3g(γij)
其中,a1、a2、a3为常数项且满足a1+a2+a3=1,f(·)和g(·) 表示嫌疑度转换函数。
f(·)需要满足性质:在[0,+∞)上取值在0和1之间;在[0,+∞)上单调递增;右饱和函数。这里提供但不限于以下形式:
或者
f(x)=tanh(bx)
其中,b>0。
g(·)需要满足性质:在[0,+∞)上取值在0和1之间;在[0,1)上单调递增,在[1,+∞)上单调递减。g(·)不限于如下形式,
其中,c>1。
对于所有银行对公账户,计算其在下属的每个交易子集的嫌疑度。
步骤2.3:三部图模型中边嫌疑度的量化。假设在其下属的交易子集j中的嫌疑度为wij,对于该子集所有转入和转出交易对应的边的权重设为ωij。
对于中间层所有节点进行计算,最终计算得到在时间窗Tk条件下三部图模型所有边的权重。
步骤2.4:图特征计算。具体包括以下两个子步骤:
步骤2.4.1:对于三部图模型中间层的每个节点,对连接边权重进行嫌疑度聚合操作,不限于求和、均值、最大值、最小值、中位数等,计算得到该节点对应的银行对公账户在时间窗Tk下的第一嫌疑度。
步骤2.4.2:
对于三部图模型中间层每个节点的关联节点,分为第一层的转入交易对象对应节点和第三层的转出交易对象对应节点;分别对关联节点连接边权重求和得到第一层和第三层节点的嫌疑度。
对于三部图模型中间层的每个节点,分别对其关联节点进行嫌疑度聚合操作,不限于求和、均值、最大值、最小值、中位数等,计算得到该节点对应的银行对公账户在时间窗Tk下的第二嫌疑度。
按照上述过程,对每个时间窗进行计算,得到每一个时间尺度下的各银行对公账户的第一嫌疑度和第二嫌疑度,作为各银行对公账户的专用图特征输出。
步骤3)训练网络赌博资金非法转移行为侦测模型。采用算法在数据集上训练得到模型,这里主要采用机器学习算法(不限于树模型、贝叶斯模型、集合学习、神经网络、支持向量等)。具体包括如下三个子步骤:
步骤3.1:预处理。根据实际情况(数据、算法、应用),采用合适的数据处理技术对数据集进训练前处理(清洗、变化、规划化等)。
其中,已标注的赌博资金非法转移账户属于小样本,训练样本集中的正常账户和赌博资金非法转移账户的数量可能分布不均衡,这里根据实际情况选择运用相关技术(例如过采样和欠采样)去平衡样本;
步骤3-2)参数优化。这里主要是对算法超参数进行寻优。将数据集随机分成训练集和测试集,选定参数优化方法和评价方法(AUC、 F1等)。在训练集上进行模型训练和评估,通过参数优化方法选定下一组超参数,继续模型训练和评估,直到满足优化终止条件。根据最优的超参数组合,在训练集上生成模型,在测试集上验证泛化性能,如果性能未达预期,则返回到前面调整。
步骤3-3)输出学习模型。采用最优的超参数组合,在数据集上训练得到模型,用于侦测网络赌博资金非法转移行为。
本发明利用银行对公账户交易流水构建三部图模型,以所述三部图模型为辅助,从多个时间尺度下提取银行对公账户的特征信息,并利用银行对公账户的特征信息进行网络赌博资金非法转移行为的识别,提高了银行识别网络赌博资金非法转移行为的可靠性,并增强了银行对网络赌博资金非法转移行为识别结果的可解释性。
在上述各实施例的基础上,作为一种可选的实施例,所述基于所述名单中各银行对公账户的交易流水,构建三部图模型,具体为:
对名单中所有银行对公账户的交易对象进行统计,确定转入账户和转出账户;其中,所述转入/转出账户为转入/转出交易流水中银行对公账户的交易对象;
以转入账户、银行对公账户和转出账户为三部图模型中第一层、第二层和第三层的节点,以各账户之间的交易为三部图模型中各账户对应节点之间的边,构建三部图模型;其中,所述三部图模型的边有其对应的属性标记,所述属性标记包括:交易时间和交易金额。
这里,三部图模型共有三层节点,且节点表示账户,边表示交易流水;其中,第二层节点表示的是本行对公账户,这些对公账号是事先选定的一些待侦测行内账户,第一层节点和第三层节点分别表示的是跟银行对公账户发生经营性交易关系的付款账户(转入账户)和收款账户(转出账户)。
通常将第二层称之为中间层,将对公账户称之为中间账户。需要特别说明的是,同属于一层的节点之间没有边连接;交易双方相同时也可能出现多笔交易的情况,我们将一条边表示一笔交易,因此相同的两节点之间也可能存在多条边;第一层节点与第三层节点对应的账户不限制必须是本行账户。
本发明将银行对公账户的经营性交易行为以三部图模型的方式去呈现,通过对三部图模型的深入分析实现对银行对公账户交易行为的深度挖掘,进而达到辅助侦测网络赌博资金非法转移行为的效果。
在上述各实施例的基础上,作为一种可选的实施例,所述分析所述三部图模型,得到所述名单中各银行对公账户对应的专用图特征,具体为:
获取预先设定的时间窗集合;
对于时间窗集合中的每一个时间窗,基于各银行对公账户的交易流水,计算相应时间窗下三部图模型各条边的权重;
需要注意的是,本发明以权重去表示各银行对公账户的各笔经营性交易的嫌疑度。
对相应时间窗下与各银行对公账户对应节点连接的边的权重进行聚合操作,得到相应时间窗下各银行对公账户的第一嫌疑度;
需要注意的是,各银行对公账户在相应时间窗下的第一嫌疑度是从各银行对公账户自身角度出发去衡量的。
将相应时间窗下与转入/转出账户对应节点连接的边的权重和作为相应时间窗下转入/转出账户的嫌疑度,并对与各银行对公账户对应节点连接的边的嫌疑度进行聚合操作,得到相应时间窗下各银行对公账户的第二嫌疑度;
需要注意的是,各银行对公账户在相应时间窗下的第二嫌疑度是从各对公账户相关账户的角度出发去衡量的。
将各时间窗下各银行对公账户的第一嫌疑度和第二嫌疑度,作为各银行对公账户的专用图特征;
其中,所述聚合操作,包括但不限于:求和、求均值、求均值,求最大值、求最小值和求中位数。
需要注意的是,这里只提供了聚合操作的几种可行形式,以其它合理方式去进行聚合操作不影响本发明的执行以及效果。
本发明所指专用图特征是指结合领域经验从三部图模型上计算得到的特征,即在三部图模型上量化网络赌博资金非法转移的交易行为,并对量化后的数据进行计算得到的特征,这里是在三部图模型上寻找一种三角形态来实现网络赌博资金非法转移的交易行为的量化,三角形态为当可疑账户处在中间层的位置上,付款账户数量多于收款账户数量,可疑账户的转入交易流水笔数多于转出交易流水笔数,从而形成资金的聚合以及流动,且资金在账户上的停留时间较短。本发明借助三部图模型,从多个时间尺度下捕捉三角形态,进而实现各银行对公账户的嫌疑量化特征的提取,这一过程中对各银行对公账户的交易信息进行了充分地利用,提升了专用图特征的信息丰富度。
在上述各实施例的基础上,作为一种可选的实施例,所述对于时间窗集合中的每一个时间窗,基于各银行对公账户的交易流水,计算相应时间窗下三部图模型各条边的权重,具体为:
按照交易时间由前至后的顺序对各银行对公账户的交易流水进行排序;
通过滑动时间窗的方式分别对各银行对公账户的交易流水排序序列进行扫描,并将扫描过程中处于同一滑动窗口下的交易流水列入同一个交易子集中,得到相应时间窗下各银行对公账户下属的各交易子集;
在本技术领域中,这里时间窗滑动的步长可以根据实际情况配置,时间窗扫描将银行对公账户的所有经营性交易划分至不同的交易子集中,且划分至同一交易子集中的经营性交易的交易时间相近,有利于识别三角形态;
基于相应时间窗下各银行对公账户下属的各交易子集的交易统计信息,计算相应时间窗下各银行对公账户在其下属的各交易子集中的嫌疑度;其中,所述交易统计信息,包括:转入账户与转出账户的数量比,转入流水与转出流水的笔数比和转入金额和转出金额的数值比;
本发明利用交易子集的统计信息实现三角形态的量化,即计算各银行对公账户在其下属的各交易子集中的嫌疑度;
将相应时间窗下各银行对公账户在其下属的各交易子集中的嫌疑度,作为相应时间窗下所述各交易子集的交易流水对应的边的权重。
本发明利用三角形态的量化结果实现了经营性交易的嫌疑度的量化,并将嫌疑度作为权重进行赋值,为嫌疑量化特征的提取提供决定性帮助。
在上述各实施例的基础上,作为一种可选的实施例,所述相应时间窗下各银行对公账户在其下属的各交易子集中的嫌疑度,具体通过一下公式计算:
wij=a1f(αij)+a2f(βij)+a3g(γij)
f(αij)=tanh(bαij)
f(βij)=tanh(bβij)
上式中,a1表示第一权重系数,f(.)表示第一嫌疑度转换函数,αij表示相应时间窗下银行对公账户i下属的交易子集j中转入账户与转出账户的数量比,a2表示第二权重系数,βij表示相应时间窗下银行对公账户i下属的交易子集j中转入流水与转出流水的笔数比,a3表示第三权重系数,g()表示第二嫌疑度转换函数,γij表示相应时间窗下银行对公账户i下属的交易子集j中转入金额和转出金额的数值比,b表示第一嫌疑度转换参数,c表示第二嫌疑度转换参数。
本实施例只是提供了优选的第一嫌疑度转换函数和第二嫌疑度转换函数的表示形式,但是并不只限于此;
本实施例为三角形态的量化的提供了一种可行方式。
在上述各实施例的基础上,作为一种可选的实施例,所述分析所述三部图模型,得到所述名单中各银行对公账户对应的一般图特征,具体为:求解各银行对公账户对应节点的出度、入度、中心度和 PageRank值,并将其作为各银行对公账户的一般图特征。
本发明以多个角度提取银行对公账户的一般图特征,丰富一般图特征的种类,进而提升了网络赌博资金非法转移行为侦测模型的识别准确度。在上述各实施例的基础上,作为一种可选的实施例,所述各银行对公账户对应的一般特征,包括:各对公账户的账户信息、以及采样时期内交易行为统计信息和其它行为统计信息;
所述账户信息,包括:自身基本信息、交易对象基本信息、有资金往来的第三方机构的基本信息、客户画像、工商登记信息和赌博资金非法转移黑名单;
所述交易行为统计信息,包括:资金留存统计信息,以及交易笔数统计信息、交易金额统计信息、交易时段统计信息和交易对象为对私账户和对公账户的统计信息;
所述其它行为统计信息,包括:登录行为统计信息和变更行为统计信息;
其中,所述基本信息,包括:登记信息和业务信息;
所述赌博资金非法转移黑名单,包括:监管规则覆盖下的赌博资金非法转移黑名单和各类监管部门下发的赌博资金非法转移黑名单;
所述登录行为,包括:登录时间和登录设备;
所述变更行为,包括:变更时间和变更项目。
本发明一般特征中包括基础账户信息和统计信息,可以对网络赌博资金非法转移行为的侦测提供基础数据,增强网络赌博资金非法转移行为的识别准确度,并提升侦测结果的可解释性。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (7)
1.一种基于三部图的银行侦测网络赌博资金非法转移行为的方法,其特征在于,包括:
获取待侦测的银行对公账户名单,基于所述名单中各银行对公账户的交易流水,构建三部图模型;其中,所述交易为经营性交易,所述交易流水中包含交易对象、交易时间和交易金额的信息;
分析所述三部图模型,得到所述名单中各银行对公账户对应的一般图特征和专用图特征;
将所述名单中各银行对公账户对应的一般特征、一般图特征和专用图特征代入网络赌博资金非法转移行为侦测模型,得到网络赌博资金非法转移行为侦测模型输出的嫌疑账户名单;
其中,所述网络赌博资金非法转移行为侦测模型是基于已侦测的银行对公账户名单中银行对公账户的一般特征、一般图特征、专用图特征以及是否处于赌博资金非法转移黑名单内的判定信息训练得到的。
2.根据权利要求1所述的银行侦测网络赌博资金非法转移行为的方法,其特征在于,所述基于所述名单中各银行对公账户的交易流水,构建三部图模型,具体为:
对名单中所有银行对公账户的交易对象进行统计,确定转入账户和转出账户;其中,所述转入/转出账户为转入/转出交易流水中银行对公账户的交易对象;
以转入账户、银行对公账户和转出账户为三部图模型中第一层、第二层和第三层的节点,以各账户之间的交易为三部图模型中各账户对应节点之间的边,构建三部图模型;其中,所述三部图模型的边有其对应的属性标记,所述属性标记包括:交易时间和交易金额。
3.根据权利要求2所述的银行侦测网络赌博资金非法转移行为的方法,其特征在于,所述分析所述三部图模型,得到所述名单中各银行对公账户对应的专用图特征,具体为:
获取预先设定的时间窗集合;
对于时间窗集合中的每一个时间窗,基于各银行对公账户的交易流水,计算相应时间窗下三部图模型各条边的权重;
对相应时间窗下与各银行对公账户对应节点连接的边的权重进行聚合操作,得到相应时间窗下各银行对公账户的第一嫌疑度;
将相应时间窗下与转入/转出账户对应节点连接的边的权重和作为相应时间窗下转入/转出账户的嫌疑度,并对与各银行对公账户对应节点连接的边的嫌疑度进行聚合操作,得到相应时间窗下各银行对公账户的第二嫌疑度;
将各时间窗下各银行对公账户的第一嫌疑度和第二嫌疑度,作为各银行对公账户的专用图特征;
其中,所述聚合操作,包括但不限于:求和、求均值、求均值,求最大值、求最小值和求中位数。
4.根据权利要求3所述的银行侦测网络赌博资金非法转移行为的方法,其特征在于,所述对于时间窗集合中的每一个时间窗,基于各银行对公账户的交易流水,计算相应时间窗下三部图模型各条边的权重,具体为:
按照交易时间由前至后的顺序对各银行对公账户的交易流水进行排序;
通过滑动时间窗的方式分别对各银行对公账户的交易流水排序序列进行扫描,并将扫描过程中处于同一滑动窗口下的交易流水列入同一个交易子集中,得到相应时间窗下各银行对公账户下属的各交易子集;
基于相应时间窗下各银行对公账户下属的各交易子集的交易统计信息,计算相应时间窗下各银行对公账户在其下属的各交易子集中的嫌疑度;其中,所述交易统计信息,包括:转入账户与转出账户的数量比,转入流水与转出流水的笔数比和转入金额和转出金额的数值比;
将相应时间窗下各银行对公账户在其下属的各交易子集中的嫌疑度,作为相应时间窗下所述各交易子集的交易流水对应的边的权重。
5.根据权利要求4所述的银行侦测网络赌博资金非法转移行为的方法,其特征在于,所述相应时间窗下各银行对公账户在其下属的各交易子集中的嫌疑度,具体通过一下公式计算:
wij=a1f(αij)+a2f(βij)+a3g(γij)
f(αij)=tanh(bαij)
f(βij)=tanh(bβij)
上式中,a1表示第一权重系数,f(·)表示第一嫌疑度转换函数,αij表示相应时间窗下银行对公账户i下属的交易子集j中转入账户与转出账户的数量比,a2表示第二权重系数,βij表示相应时间窗下银行对公账户i下属的交易子集j中转入流水与转出流水的笔数比,a3表示第三权重系数,g(·)表示第二嫌疑度转换函数,γij表示相应时间窗下银行对公账户i下属的交易子集j中转入金额和转出金额的数值比,b表示第一嫌疑度转换参数,c表示第二嫌疑度转换参数。
6.根据权利要求2所述的银行侦测网络赌博资金非法转移行为的方法,其特征在于,所述分析所述三部图模型,得到所述名单中各银行对公账户对应的一般图特征,具体为:求解各银行对公账户对应节点的出度、入度、中心度和PageRank值,并将其作为各银行对公账户的一般图特征。
7.根据权利要求1所述的银行侦测网络赌博资金非法转移行为的方法,其特征在于,所述各银行对公账户对应的一般特征,包括:各对公账户的账户信息、以及采样时期内交易行为统计信息和其它行为统计信息;
所述账户信息,包括:自身基本信息、交易对象基本信息、有资金往来的第三方机构的基本信息、客户画像、工商登记信息和赌博资金非法转移黑名单;
所述交易行为统计信息,包括:资金留存统计信息,以及交易笔数统计信息、交易金额统计信息、交易时段统计信息和交易对象为对私账户和对公账户的统计信息;
所述其它行为统计信息,包括:登录行为统计信息和变更行为统计信息;
其中,所述基本信息,包括:登记信息和业务信息;
所述赌博资金非法转移黑名单,包括:监管规则覆盖下的赌博资金非法转移黑名单和各类监管部门下发的赌博资金非法转移黑名单;
所述登录行为,包括:登录时间和登录设备;
所述变更行为,包括:变更时间和变更项目。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111137825.4A CN114155096A (zh) | 2021-09-27 | 2021-09-27 | 基于三部图的银行侦测网络赌博资金非法转移行为的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111137825.4A CN114155096A (zh) | 2021-09-27 | 2021-09-27 | 基于三部图的银行侦测网络赌博资金非法转移行为的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114155096A true CN114155096A (zh) | 2022-03-08 |
Family
ID=80462662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111137825.4A Pending CN114155096A (zh) | 2021-09-27 | 2021-09-27 | 基于三部图的银行侦测网络赌博资金非法转移行为的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114155096A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114936769A (zh) * | 2022-05-13 | 2022-08-23 | 中科金审(北京)科技有限公司 | 一种利用资金数据分析网络赌博的实时追踪方法 |
-
2021
- 2021-09-27 CN CN202111137825.4A patent/CN114155096A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114936769A (zh) * | 2022-05-13 | 2022-08-23 | 中科金审(北京)科技有限公司 | 一种利用资金数据分析网络赌博的实时追踪方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yue et al. | A review of data mining-based financial fraud detection research | |
Xing et al. | Employing latent dirichlet allocation for fraud detection in telecommunications | |
CN104794192B (zh) | 基于指数平滑、集成学习模型的多级异常检测方法 | |
CN111311128A (zh) | 一种基于第三方数据的消费金融信用评分卡开发方法 | |
CN106709513A (zh) | 一种基于有监督机器学习的证券配资账户识别方法 | |
WO2005101265A2 (en) | Systems and methods for investigation of financial reporting information | |
Duman et al. | A novel and successful credit card fraud detection system implemented in a turkish bank | |
CN106952159A (zh) | 一种不动产抵押品风险控制方法、系统及存储介质 | |
CN112700324A (zh) | 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法 | |
CN110458376A (zh) | 一种可疑风险交易筛查方法与相应系统 | |
CN106408325A (zh) | 基于用户支付信息的用户消费行为预测分析方法及系统 | |
Chen et al. | Application of random forest, rough set theory, decision tree and neural network to detect financial statement fraud–taking corporate governance into consideration | |
CN113095927A (zh) | 一种反洗钱可疑交易识别方法及设备 | |
WO2019200739A1 (zh) | 数据欺诈识别方法、装置、计算机设备和存储介质 | |
US8145585B2 (en) | Automated methods and systems for the detection and identification of money service business transactions | |
CN111583033A (zh) | 基于上市公司和股东之间联系的关联分析方法及装置 | |
CN110866832A (zh) | 一种风险控制方法、系统、存储介质及计算设备 | |
CN111815207A (zh) | 一种针对供应链金融的风险定量评估方法 | |
Ramaki et al. | Credit card fraud detection based on ontology graph | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
CN114155096A (zh) | 基于三部图的银行侦测网络赌博资金非法转移行为的方法 | |
CN112085586B (zh) | 一种基于密集子图的银行信用卡反套现方法 | |
Apparao et al. | Financial statement fraud detection by data mining | |
CN113835947A (zh) | 一种基于异常识别结果确定异常原因的方法和系统 | |
WO2022143431A1 (zh) | 一种反洗钱模型的训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |