CN115204881A - 一种数据处理方法、装置、设备及存储介质 - Google Patents
一种数据处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115204881A CN115204881A CN202110377395.7A CN202110377395A CN115204881A CN 115204881 A CN115204881 A CN 115204881A CN 202110377395 A CN202110377395 A CN 202110377395A CN 115204881 A CN115204881 A CN 115204881A
- Authority
- CN
- China
- Prior art keywords
- transaction
- target
- region
- accounts
- condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 41
- 238000003860 storage Methods 0.000 title claims abstract description 29
- 238000011156 evaluation Methods 0.000 claims abstract description 240
- 238000009826 distribution Methods 0.000 claims abstract description 129
- 230000002159 abnormal effect Effects 0.000 claims abstract description 97
- 238000000034 method Methods 0.000 claims abstract description 80
- 238000012545 processing Methods 0.000 claims description 48
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 5
- 230000001960 triggered effect Effects 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 26
- 230000008569 process Effects 0.000 description 26
- 238000004900 laundering Methods 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 238000013473 artificial intelligence Methods 0.000 description 10
- 208000001613 Gambling Diseases 0.000 description 8
- 229920006225 ethylene-methyl acrylate Polymers 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 239000005043 ethylene-methyl acrylate Substances 0.000 description 6
- 230000008447 perception Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- HGVPOWOAHALJHA-UHFFFAOYSA-N ethene;methyl prop-2-enoate Chemical compound C=C.COC(=O)C=C HGVPOWOAHALJHA-UHFFFAOYSA-N 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请实施例公开了一种数据处理方法、装置、设备及存储介质,其中该方法包括:获取待评测的目标地区的目标交易信息,目标交易信息包括在目标地区产生的交易数据、目标地区的地区基本信息、目标地区内不同类型的交易账户的分布信息中的至少一种;根据目标交易信息,确定参考评测维度下目标地区的交易情况评测结果,参考评测维度包括地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况、地区间的交易情况中的至少一种;根据参考评测维度下目标地区的交易情况评测结果,确定目标地区对应的交易情况类型。该方法能准确评测地区对应的交易情况类型。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种数据处理方法、装置、设备及存储介质。
背景技术
在全球经济高速发展的大环境下,跨境交易如今已成为十分常见的交易模式,用户可以根据自身需求选择与境外账户进行交易。在跨境交易场景中,相关业务人员需要感知全球各地区的交易风险,识别存在高交易风险的地区,进而对与高交易风险地区相关的交易进行相应地处理。
相关技术目前只能粗粒度地对境外地区进行交易风险评级,例如,评测国家主权信用风险、国家风险等综合指标。然而,在实际业务中,此类综合指标由于监控粒度过粗,通常难以准确地反映相关地区的交易风险,也难以为相关业务人员提供较高的参考价值。
综上所述,如何准确地评测地区的交易风险,识别出高交易风险地区,仍是本领域亟待解决的技术问题。
发明内容
本申请实施例提供了一种数据处理方法、装置、设备及存储介质,能够准确地评测地区的交易风险,识别高交易风险地区。
有鉴于此,本申请第一方面提供了一种数据处理方法,所述方法包括:
针对待评测的目标地区,获取所述目标地区的目标交易信息;所述目标交易信息包括以下至少一种:在所述目标地区产生的交易数据、所述目标地区的地区基本信息、所述目标地区内不同类型的交易账户的分布信息;
根据所述目标交易信息,确定参考评测维度下所述目标地区对应的交易风险情况结果;所述参考评测维度包括以下至少一种:地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况、地区间的交易情况;
根据所述参考评测维度下所述目标地区对应的交易情况评测结果,确定所述目标地区对应的交易情况类型。
本申请第二方面提供了一种数据处理装置,所述装置包括:
交易信息获取模块,用于针对待评测的目标地区,获取所述目标地区的目标交易信息;所述目标交易信息包括以下至少一种:在所述目标地区产生的交易数据、所述目标地区的地区基本信息、所述目标地区内不同类型的交易账户的分布信息;
第一交易情况评测模块,用于根据所述目标交易信息,确定参考评测维度下所述目标地区对应的交易情况评测结果;所述参考评测维度包括以下至少一种:地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况、地区间的交易情况;
第二交易情况评测模块,用于根据所述参考评测维度下所述目标地区对应的交易情况评测结果,确定所述目标地区对应的交易情况类型。
本申请第三方面提供了一种设备,所述设备包括处理器以及存储器:
所述存储器用于存储计算机程序;
所述处理器用于根据所述计算机程序,执行如上述第一方面所述的数据处理方法的步骤。
本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述第一方面所述的数据处理方法的步骤。
本申请第五方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面所述的数据处理方法的步骤。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例提供了一种数据处理方法,该方法能够根据目标地区的目标交易信息,如在目标地区产生的交易数据、目标地区的地区基本信息、以及目标地区内不同类型的交易账户的分布情况中的至少一种,从地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况、以及地区间的交易情况中的至少一个参考评测维度出发,对目标地区的交易情况进行评测,进而确定目标地区对应的交易情况类型,即确定目标地区是否属于高交易风险地区。由于上述每个参考评测维度的交易情况评测结果均能在一定程度上反映地区在反洗钱金融领域中的交易风险,而地区在反洗钱金融领域中的交易风险在实际业务中通常具有更高的参考价值,能够更准确地反映地区的实际交易风险,对用户跨境交易的安全性具有更显著的影响;因此,通过本申请实施例提供的数据处理方法,对地区在反洗钱金融领域的交易风险进行监控,能够更准确地确定地区的交易风险,从而更准确地识别存在高交易风险的地区。
附图说明
图1为本申请实施例提供的数据处理方法的应用场景示意图;
图2为本申请实施例提供的数据处理方法的流程示意图;
图3为本申请实施例提供的交易数据波动情况的监控维度示意图;
图4为本申请实施例提供的确定交易类型对应的合理波动区间的实现过程示意图;
图5为本申请实施例提供的确定恶意交易账户的实现过程示意图;
图6为本申请实施例提供的构建第二黑标签库的实现过程示意图;
图7为本申请实施例提供的确定交易账户的风险等级的实现过程示意图;
图8为本申请实施例提供的确定高风险交易地区的实现过程示意图;
图9为本申请实施例提供的交易数据的加工处理过程的示意图;
图10为本申请实施例提供的确定目标数据维度的实现过程示意图;
图11为本申请实施例提供的构建交易数据表的实现过程示意图;
图12为本申请实施例提供的示例性的全球交易风险感知系统的显示界面示意图;
图13为本申请实施例提供的示例性的交易关系图谱;
图14为本申请实施例提供的一种数据处理装置的结构示意图;
图15为本申请实施例提供的另一种数据处理装置的结构示意图;
图16为本申请实施例提供的又一种数据处理装置的结构示意图;
图17为本申请实施例提供的终端设备的结构示意图;
图18为本申请实施例提供的服务器的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案涉及人工智能技术,具体通过如下实施例进行说明:
相关技术目前评测境外地区的交易风险时,通常只能评测国家主权信用风险、国家风险等综合指标,而此类综合指标的监控粒度过粗,通常难以准确地反映境外地区的实际交易风险,在实际业务中所提供的参考价值较低。
针对上述相关技术存在的问题,本申请实施例提供了一种数据处理方法,该方法能够准确地评测地区的实际交易风险,识别出存在高交易风险的地区,在实际业务中提供较高的参考价值。
具体的,在本申请实施例提供的数据处理方法中,先针对待评测的目标地区,获取该目标地区的目标交易信息,此处的目标交易信息可以包括以下至少一种:在目标地区产生的交易数据、该目标地区的地区基本信息、目标地区内不同类型的交易账户的分布信息;然后,根据所获取的目标交易信息,确定参考评测维度下目标地区对应的交易情况评测结果,此处的参考评测维度包括以下至少一种:地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况、以及地区间的交易情况;进而,根据参考评测维度下目标地区对应的交易情况评测结果,确定该目标地区对应的交易情况类型。
上述数据处理方法能够根据目标地区的目标交易信息,从地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况、以及地区间的交易情况中的至少一个参考评测维度出发,对目标地区的交易风险进行评测,进而确定目标地区对应的交易情况类型,即确定目标地区是否属于高交易风险地区。由于上述每个参考评测维度的交易情况评测结果均能在一定程度上反映地区在反洗钱金融领域中的交易风险,而地区在反洗钱金融领域中的交易风险在实际业务中通常具有更高的参考价值,能够更准确地反映地区的实际交易风险,对用户跨境交易的安全性具有更显著的影响;因此,通过本申请实施例提供的数据处理方法,对地区在反洗钱金融领域的交易风险进行监控,能够更准确地确定地区的交易风险,从而更准确地识别存在高交易风险的地区。
应理解,本申请实施例提供的数据处理方法可以由具备数据处理能力的设备执行,该设备可以是服务器或者终端设备。其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。如本申请所公开的数据处理方法,其中目标交易信息可以保存于区块链上。
为了便于理解本申请实施例提供的数据处理方法,下面对本申请实施例提供的数据处理方法的应用场景进行示例性介绍。
参见图1,图1为本申请实施例提供的数据处理方法的应用场景示意图。如图1所示,该应用场景中包括服务器110和数据库120,服务器110可以通过网络访问数据库120,或者数据库120也可以集成在服务器110中。其中,服务器110用于执行本申请实施例提供的数据处理方法,以确定待评测的目标地区对应的交易情况类型,即确定目标地区是否属于高交易风险地区。数据库120用于存储各地区的交易信息;示例性的,数据库120可以为分布式存储系统,其中包括多个子数据库,不同的子数据库用于存储不同类型的交易信息,或者存储不同地区的交易信息。
在实际应用中,当需要评测目标地区是否属于高交易风险地区时,服务器110可以从数据库120获取目标地区的目标交易信息。具体的,服务器110可以从数据库120获取在目标地区产生的交易数据、该目标地区的地区基本信息、该目标地区内不同类型的交易账户的分布信息中的至少一种,作为目标地区的目标交易信息。
其中,在目标地区产生的交易数据包括但不限于:目标地区内的交易账户之间的交易数据、目标地区的交易账户与其它地区的交易账户之间的交易数据,此处的交易数据包括但不限于:收款数据、出款数据、被拦截的出款数据。目标地区的地区基本信息包括但不限于:目标地区的名称、目标地区的地理位置信息。目标地区内不同类型的交易账户的分布信息包括但不限于:目标地区内合法交易账户与非法交易账户的分布信息、目标地区内不同风险级别的交易账户的分布信息、目标地区内对应于不同交易金额区间的交易账户的分布信息、目标地区内对应于不同注册用户类型的交易账户的分布信息。
服务器110获取到目标地区的目标交易信息后,可以根据所获取的目标交易信息,确定参考评测维度下目标地区对应的交易情况评测结果,此处的参考评测维度可以包括以下至少一种:地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况、地区间的交易情况;上述目标类型交易账户具体可以是恶意交易账户或者高风险交易账户。
示例性的,当所获取的目标交易信息包括在目标地区产生的交易数据时,服务器110可以根据在该目标地区产生的交易数据,判断目标地区内交易数据的波动情况是否正常,和/或判断目标地区与其它地区间的交易情况是否正常。当所获取的目标交易信息包括目标地区的地区基本信息时,服务器110可以根据该目标地区的地区基本信息,判断目标地区是否属于交易异常地区。当所获取的目标交易信息包括目标地区内不同类型的交易账户的分布信息时,服务器110可以根据该目标地区内不同类型的交易账户的分布信息,判断目标地区内恶意交易账户的分布情况是否正常,和/或判断目标地区内高风险交易账户的分布情况是否正常,和/或判断目标地区内交易账户的稳定情况是否正常。
进而,服务器110可以根据参考评测维度下目标地区对应的交易情况评测结果,确定该目标地区对应的交易情况类型,即确定目标地区是否属于高交易风险地区。示例性的,若服务器110仅确定了一种参考评测维度下目标地区对应的交易情况评测结果,则服务器110可以直接根据该种参考评测维度下目标地区对应的交易情况评测结果,确定目标地区是否属于高交易风险地区;若服务器110确定了多种参考评测维度下目标地区对应的交易情况评测结果,则服务器110可以综合考虑这多种参考评测维度下目标地区对应的交易情况评测结果,来确定目标地区是否属于高交易风险地区。
应理解,图1所示的应用场景仅为示例,在实际应用中,本申请实施例提供的数据处理方法还可以应用于其它场景,例如,由终端设备执行该数据处理方法,在此不对本申请实施例提供的数据处理方法的应用场景做任何限定。
下面通过方法实施例对本申请提供的数据处理方法进行详细介绍。
参见图2,图2为本申请实施例提供的数据处理方法的流程示意图。为了便于描述,下述实施例仍以该数据处理方法的执行主体为服务器为例进行介绍。如图2所示,该数据处理方法包括以下步骤:
步骤201:针对待评测的目标地区,获取所述目标地区的目标交易信息;所述目标交易信息包括以下至少一种:在所述目标地区产生的交易数据、所述目标地区的地区基本信息、所述目标地区内不同类型的交易账户的分布信息。
当服务器需要评测目标地区对应的交易情况类型,即评测目标地区是否属于高交易风险地区时,服务器需要先获取该目标地区的目标交易信息。该目标交易信息可以包括以下至少一种:在该目标地区产生的交易数据、该目标地区的地区基本信息、该目标地区内不同类型的交易账户的分布信息。
需要说明的是,在目标地区产生的交易数据是指与所属于目标地区的交易账户相关的交易数据;所属于目标地区的交易账户可以包括在目标地区登录的交易账户、注册用户属于目标地区的交易账户等等;在目标地区产生的交易数据可以包括所属于目标地区的多个交易账户间的交易数据、所属于目标地区的交易账户与所属于其它地区的交易账户间的交易数据;上述交易数据可以包括各种交易方式下的收款数据、出款数据和被拦截的出款数据,如收款总数据、出款总数据、基于普通转账的收款数据和出款数据、基于静态二维码的收款数据和出款数据、所拦截的赌博出款数据、所拦截的诈骗出款数据等等。
目标地区的地区基本信息是指目标地区的基础介绍信息,示例性的,目标地区的地区基本信息可以包括目标地区的名称、目标地区的地理位置信息等等。
在实际应用中,服务器通常会定期地从不同的维度对目标地区内的交易账户的分布情况进行统计,从而得到目标地区内不同类型的交易账户的分布信息。示例性的,该目标地区内不同类型的交易账户的分布信息可以包括:目标地区内恶意交易账户的分布信息、目标地区内不同风险级别的交易账户的分布信息、目标地区内对应于不同交易金额区间的交易账户的分布信息、目标地区内对应于不同注册用户类型的交易账户的分布信息等等。
具体实现时,服务器可以从用于存储各地区的交易信息的数据库中,获取目标地区的目标交易信息;例如,假设待评测的目标地区为A国,则服务器可以从用于存储交易数据的数据库中获取在A国产生的交易数据,可以从用于存储地区基本信息的数据库中获取A国的地区基本信息,可以从用于存储交易账户分布信息的数据库中获取A国内不同类型的交易账户的分布信息。或者,服务器也可以在需要评测目标地区的交易风险时,自主统计目标地区的目标交易信息,例如,统计在目标地区产生的交易数据、统计该目标地区内不同类型的交易账户的分布信息。本申请在此不对服务器获取目标地区的目标交易信息的方式做任何限定。
步骤202:根据所述目标交易信息,确定参考评测维度下所述目标地区对应的交易情况评测结果;所述参考评测维度包括以下至少一种:地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况、地区间的交易情况。
服务器获取到目标地区的目标交易信息后,可以根据目标地区的目标交易信息,确定该目标地区在参考评测维度下的交易情况评测结果。此处的参考评测维度可以包括以下至少一种:地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况、以及地区间的交易情况。
需要说明的是,目标地区在上述每个参考评测维度下的交易情况评测结果,均能在一定程度上反映目标地区在反洗钱金融领域中的交易风险,这种地区在反洗钱金融领域中的交易风险在实际业务中通常具有更高的参考价值,更能够体现地区实际存在的交易风险,对用户进行跨境交易的安全性具有更明显的影响。
在一种可能的实现方式中,当服务器通过步骤201获取的目标交易信息包括在目标地区产生的多种交易类型的交易数据,并且需要通过步骤202确定目标地区在交易数据的波动情况这一参考评测维度下的交易情况评测结果时,服务器可以通过以下方式确定该交易情况评测结果,即通过以下方式判断在目标地区产生的交易数据的波动情况是否正常:
针对每种交易类型,根据历史参考时段内在该目标地区产生的该种交易类型的交易数据,确定该种交易类型对应的合理波动区间;然后,判断目标时段内在目标地区产生的该种交易类型的交易数据是否处于该合理波动区间,并根据该判断结果确定目标时段内在目标地区产生的该种交易类型的交易数据对应的交易波动评测结果。进而,根据目标时段内在目标地区产生的多种交易类型的交易数据各自对应的交易波动评测结果,确定目标时段内在该目标地区产生的交易数据的波动情况是否正常。
示例性的,如图3所示,服务器对地区的交易数据波动情况进行监控时,可以从交易总量、高危场景下的交易量、拦截交易量这三个维度出发,监控多种交易类型的交易数据的波动情况。例如,服务器从交易总量这一维度监控交易数据的波动情况时,具体可以监控收款总数据和出款总数据的波动情况;服务器从高危场景下的交易量这一维度监控交易数据的波动情况时,具体可以监控普通转账收款数据、普通转账出款数据、静态二维码收款数据和静态二维码出款数据的波动情况;服务器从拦截交易量这一维度监控交易数据的波动情况时,具体可以监控赌博拦截出款数据和诈骗拦截出款数据的波动情况。当然,在实际应用中,服务器也可以根据实际业务需求,对其它维度下的交易数据的波动情况进行监控,本申请在此不对所监控的交易数据所属的交易类型做任何限定。
具体对某种交易类型的交易数据的波动情况进行监控时,可以根据历史参考时段内在目标地区产生的该种交易类型的交易数据,确定该交易类型对应的合理波动区间;进而,判断目标时段内在目标地区产生的该种交易类型的交易数据是否处于该合理波动区间,若是,则确定目标时段内在目标地区产生的该种交易类型的交易数据的波动情况正常,若否,则确定目标时段内在目标地区产生的该种交易类型的交易数据的波动情况异常。
服务器确定出目标时段内在目标地区产生的多种交易类型的交易数据各自对应的交易波动评测结果后,即确定出目标时段内在目标地区产生的多种交易类型的交易数据各自的波动情况是否正常后,可以进一步根据这多种交易类型的交易数据各自对应的交易波动评测结果,确定目标时段内在目标地区产生的交易数据的波动情况是否正常。
示例性的,如图4所示,假设服务器监控交易数据的波动情况时所需监控的交易类型包括:收款总数据、出款总数据、普通转账收款数据、普通转账出款数据、静态二维码收款数据、静态二维码出款数据、赌博拦截出款数据和诈骗拦截出款数据,则服务器可以分别计算这些交易类型各自对应的合理波动区间。进而,针对目标时段内在目标地区产生的每种交易类型的交易数据,判断该交易数据是否处于该种交易类型对应的合理波动区间内,若是,则针对该种交易类型对应的交易波动评测结果赋值0,若否,则针对该种交易类型对应的交易波动评测结果赋值1。最终,对上述所需监控的多种交易类型各自对应的交易波动评测结果进行加和处理,得到总交易波动评测结果,若该总交易波动评测结果大于2,则可以确定目标时段内在目标地区产生的交易数据的波动情况异常,反之,若该总交易波动评测结果小于或等于2,则可以确定目标时段内在目标地区产生的交易数据的波动情况正常。
应理解,上述评测目标时段内在目标地区产生的交易数据的波动情况是否正常的方式仅为示例,在实际应用中,服务器也可以采用其它方式,根据多种交易类型下的交易数据对应的交易波动评测结果,确定目标时段内在目标地区产生的交易数据的波动情况是否正常,本申请在此不对该评测方式做任何限定。
作为一种示例,服务器可以通过以下方式确定一种交易类型对应的合理波动区间:计算第一历史参考时段内在目标地区产生的该种交易类型的交易数据的均值,作为该种交易类型对应的第一参考值;通过指数移动加权平均(Exponentially WeightedMoving-Average,EWMA)算法,根据第二历史参考时段内在目标地区产生的该种交易类型的交易数据,确定该种交易类型对应的第二参考值。然后,根据该第一参考值和第二参考值,确定该种交易类型对应的目标参考值。最终,基于正态分布原理,根据该目标参考值确定该种交易类型对应的合理波动区间。
示例性的,服务器可以将目标时段的前30天作为第一历史参考时段,例如,假设服务器需要判断2020年12月1日在目标地区产生的某种交易类型的交易数据的波动情况是否正常,则服务器可以计算2020年11月1日至11月30日在目标地区产生的该种交易类型的交易数据的均值,作为该种交易类型对应的第一参考值。当然,服务器也可以根据实际需求,设置其它时段作为上述第一历史参考时段。
上述交易类型对应的第一参考值的计算公式如式(1)所示:
服务器可以将目标时段的前7天作为第二历史参考时段,例如,假设服务器需要判断2020年12月1日在目标地区产生的某种交易类型的交易数据的波动情况是否正常,则服务器可以采用EWMA算法,根据2020年11月24日至11月30日在目标地区产生的该种交易类型的交易数据,计算该种交易类型对应的第二参考值。当然,服务器也可以根据实际需求,设置其它时段作为上述第二历史时段。
EWMA算法会对观察值分别给予不同的加权系数,且各观察值的加权系数随时间呈指数式递减,越靠近当前时刻的观察值对应的加权系数越大,其原因在于,观察期的近期观察值对预测值有较大影响,其更能反映近期变化的趋势。
加权的程度通常由常数α决定,α的值介于0和1之间,在实际应用中,可以通过式(2)计算α:
其中,N为第二历史参考时段中包括的天数;为贴合此算法的强时效性,本申请以目标时段的前7天作为第二历史参考时段,故N取7,计算得到的α=0.25。
假设第t日的实际交易数据为Yt,通过EWMA算法计算得到的第t日的预测交易数据为St;已知第t-1日的预测交易数据为St-1;则计算St的方程如式(3)所示:
St=α×Yt+(1-α)×St-1 (3)
假设p=昨日(t0)的实际交易数据,则今日(t1)的预测交易数据的计算方程式如式(4)所示:
EMAt1=EMAt0+α×(p-EMAt0) (4)
将EMAt0拆解开来,其具体表现为式(5):
进而,服务器可以为上述第一参考值和第二参考值分配不同的权重,并且基于第一参考值和第二参考值各自对应的权重,对该第一参考值和该第二参考值进行加权求和处理,得到该种交易类型对应的目标参考值。最终,基于正态分布原理中的3-sigma原则,根据该种交易类型对应的目标参考值确定该种交易类型对应的合理波动区间。
正态分布原理中的3-sigma原则是指数值分布在(μ-3σ,μ+3σ)中的概率为0.9974,其中,μ代表均值,是正态分布图像的对称轴,σ代表标准差。令X为正态N(a,σ2)分布的随机变量,对于任何k>0,P{|X-a|<kσ}=2Φ(k)-1;其中Φ(·)是标准正态分布的分布函数,在k=3的情况下,P{a-3σ<X<a+3σ}=0.99730。
对于上述3-sigma原则中的μ可以通过式(6)计算:
对于上述3-sigma原则中的σ可以通过式(7)计算:
其中,s即为3-sigma原则中的σ。
为了便于理解上述交易类型对应的合理波动区间的确定方式,下面以确定A国的收款总数据对应的合理波动区间为例,对上述合理波动区间的确定方式进行举例说明。
假设当前需要判断A国在2020年12月1日产生的收款总数据的波动情况是否正常,则需要计算收款总数据对应的合理波动区间,该合理波动区间需要适用于衡量A国在2020年12月1日产生的收款总数据的波动情况。具体的,服务器可以通过式(8)计算收款总数据对应的第一参考值:
其中,P1表示收款总数据对应的第一参考值,表示2020年11月1日至11月30日的收款总数据的总和,其中,M等于30。该第一参考值能够反映2020年11月的收款总数据的集中趋势,可以为判断收款总数据的走势提供参考依据。
服务器采用EWMA算法计算收款总数据对应的第二参考值时,需要先通过式(9)计算加权常数值α:
其中,N表示第二历史参考时段的时长,在第二历史时段为2020年11月24日至11月30日的情况下,即在第二历史时段包括7天的情况下,α等于0.25。该加权常数值α可以决定加权程度。
进而,服务器可以通过式(10)计算2020年11月30日的收款总金额对应的预测值:
EMA1130=[p1130+(1-α)p1129+(1-α)2p1128+(1-α)3p1127+(1-α)4p1126+(1-α)5p1125+(1-α)6p1124]/[1+(1-α)+(1-α)2+(1-α)3+(1-α)4+(1-α)5+(1-α)6] (10)
其中,p1130至p1124分别表示2020年11月30日至11月24日的实际收款总数据。在EWMA算法中,各项收款总数据的加权系数随时间呈指数式递减,收款总数据的所属时间越靠近待评测的目标时段,则该收款总数据对应的加权系数越大,反之,收款总数据的所属时间越远离待评测的目标时段,则该收款总数据对应的加权系数越小,其原因在于,收款总数据的所属时间距离目标时段越近,则该收款总数据对于收款总数据的预测值的影响会越大,其更能反映收款总数据的变化趋势。
进而,服务器可以通过式(11)计算收款总数据对应的第二参考值:
P2=EMA1130+α*(p1130-EMA1130) (11)
服务器计算得到收款总数据对应的第一参考值P1和第二参考值P2后,可以通过式(12)对该第一参考值P1和第二参考值P2进行加权平均处理,从而计算得到收款总数据对应的目标参考值P:
P=0.4*P1+0.6*P2 (12)
应理解,在实际应用中,除了可以为第一参考值P1分配权重值0.4,为第二参考值P2分配权重值0.6外,还可以根据实际需求为第一参考值P1和第二参考值P2分配其它权重值,本申请在此不对为第一参考值P1和第二参考值P2分配的权重值做任何限定。
最终,服务器可以基于3-sigma原则,根据上述收款总数据对应的目标参考值P,确定收款总数据对应的合理波动区间。具体的,3-sigma原则是指数值分布在(μ-3σ,μ+3σ)中的概率为0.9974,其中μ表示正态分布图像的对称轴,σ表示标准差;在本申请实施例提供的技术方案中,μ可以为收款总数据对应的目标参考值P,σ可以为2020年11月1日至11月30日的收款总数据的标准差s,相应地,该收款总数据对应的合理波动区间应为(P-3s,P+3s)。
应理解,上述确定交易类型对应的合理波动区间的方式仅为示例,在实际应用中,服务器也可以采用其它方式确定交易类型对应的合理波动区间,本申请在此不对该合理波动区间的确定方式做任何限定。
在另一种可能的实现方式中,当服务器通过步骤201获取的目标交易信息包括目标地区的地区基本信息,并且需要通过步骤202确定地区与交易异常地区间的关系这一参考评测维度下的交易情况评测结果时,服务器可以通过以下方式确定该交易情况评测结果,即通过以下方式判断目标地区是否属于交易异常地区:
在交易异常地区清单中匹配该目标地区的地区基本信息,根据匹配结果确定该目标地区是否属于交易异常地区;上述交易异常地区清单中包括预先确定的交易异常地区。
作为一种示例,若所获取的目标地区的地区基本信息为目标地区的名称,交易异常地区清单中包括预先被认定为交易异常地区的地区名称,则服务器可以在交易异常地区清单中查找该目标地区,若能够查找到该目标地区,则确定该目标地区属于交易异常地区,反之,若不能查找到该目标地区,则确定该目标地区不属于交易异常地区。在该种实现方式中,交易异常地区清单具体可以为H0国家清单。
作为另一种示例,若所获取的目标地区的地区基本信息为目标地区的地理位置信息,交易异常地区清单中包括预先被认定为交易异常地区的地理区域,则服务器可以判断目标地区所处的地理位置是否在交易异常地区的地理区域内,若是,则确定该目标地区属于交易异常地区,反之,若否,则确定该目标地区不属于交易异常地区。
当然,在实际应用中,目标地区的地区基本信息还可以为其它类型的信息,交易异常地区清单中还可以包括与预先确定的交易异常地区相关的其它信息,相应地,服务器可以采用其它方式判断目标地区是否属于交易异常地区。本申请在此不对目标地区的地区基本信息、交易异常地区清单中包括的内容、以及判断目标地区是否属于交易异常地区的方式做任何限定。
在另一种可能的实现方式中,当服务器通过步骤201获取的目标交易信息包括目标地区内恶意交易账户的分布信息,并且需要通过步骤202确定地区内目标类型交易账户(该目标类型交易账户为恶意交易账户)的分布情况这一参考评测维度下的交易风险情况结果时,服务器可以通过以下方式确定该交易情况评测结果,即通过以下方式判断目标地区内恶意交易账户的分布情况是否正常:
计算目标地区内恶意交易账户在该目标地区内所有交易账户中的占比,作为该目标地区的恶意交易账户浓度;此处的恶意交易账户包括以下至少一种:存储于第一黑标签库的交易账户、所交互的交易文本与第二黑标签库匹配的交易账户,该第一黑标签库用于存储非法交易账户,该第二黑标签库用于存储交易敏感词。进而,判断该目标地区的恶意交易账户浓度是否超过预设恶意浓度阈值,并根据该判断结果确定目标地区内恶意交易账户的分布情况是否正常。
具体的,服务器可以预先确定目标地区内的恶意交易账户,从而确定目标地区内恶意交易账户的分布信息。图5所示即为确定恶意交易账户的实现过程示意图,如图5所示,服务器针对某交易账户确定其是否为恶意交易账户时,可以将该交易账户与第一黑标签库中存储的交易账户进行匹配,若第一黑标签库中存在与该交易账户相匹配的交易账户,则确定该交易账户属于恶意交易账户。此外,服务器还可以将该交易账户的交易文本与第二黑标签库中存储的交易敏感词进行匹配,若第二黑标签库中存在与该交易文本相匹配的交易敏感词,则确定该交易账户属于恶意交易账户;此处的交易文本具体是指交易账户之间进行交易时附带的文本信息,例如,A交易账户向B交易账户转账时附带的文本信息。
如此,通过上述方式确定出目标地区内的恶意交易账户后,可以计算该目标地区内的恶意交易账户在该目标地区内的所有交易账户中的占比,作为该目标地区的恶意交易账户浓度。进而,判断该目标地区的恶意交易账户浓度是否超过预设恶意浓度阈值,如4%,若超过,则可确定该目标地区内恶意交易账户的分布情况异常,反之,若未超过,则可确定该目标地区内恶意交易账户的分布情况正常。
需要说明的是,上述第一黑标签库通常是通过以下方式构建的:针对目标地区的每个交易账户,通过非法账户识别模型根据该交易账户的交易特征,确定该交易账户是否属于非法交易账户;若该交易账户属于非法交易账户,则将该交易账户添加至该第一黑标签库;其中,非法账户识别模型是基于标准非法交易账户的交易特征训练得到的。
作为一种示例,上述第一黑标签库可以专用于存储赌博交易账户和诈骗交易账户。如图5所示,在该种情况下,服务器构建该第一黑标签库时,可以通过外网线上爬虫,爬取官方发布的法律文书中所涉及的赌博交易账户和诈骗交易账户,作为用于训练非法账户识别模型的标准非法交易账户;和/或,服务器可以制定赌博交易账户和诈骗交易账户的识别策略,通过该识别策略识别交易系统中的赌博交易账户和诈骗交易账户,作为用于训练非法账户识别模型的标准非法交易账户;和/或,服务器可以与官方机构(如公安机关等)合作,获取已确定的赌博交易账户和诈骗交易账户,作为用于训练非法账户识别模型的标准非法交易账户。当然,在实际应用中,服务器也可以通过其它方式获取标准非法交易账户,本申请在此不对该标准非法交易账户的获取方式做任何限定。
然后,服务器可以基于上述标准非法交易账户的交易特征,训练非法账户识别模型。示例性的,服务器可以基于标准非法交易账户的交易金额、交易频率、交易时间、交易对象等交易特征,采用XGBoost算法进行训练建模,得到非法账户识别模型;该非法账户识别模型具备识别赌博交易账户、诈骗交易账户、以及潜在的赌博交易账户和诈骗交易账户的功能。进而,服务器可以利用该非法账户识别模型,确定目标地区内的每个交易账户属于非法交易账户的概率,并将属于非法交易账户的概率超过预设概率阈值的交易账户添加至第一黑标签库中。
需要说明的是,上述第二黑标签库通常是通过以下方式构建的:针对非法交易文本进行分词处理,得到候选交易敏感词;然后,针对每个候选交易敏感词,通过词频-逆文件频率(Term Frequency-Inverse Document Frequency,TF-IDF)算法,确定该候选交易敏感词对于该非法交易文本的重要度;进而,将对于该非法交易文本的重要度超过预设重要度阈值的候选交易敏感词,添加至该第二黑标签库。
作为一种示例,上述第二黑标签库可以专用于存储与汇兑、走私代购、传销相关的交易敏感词,如图5所示。在该种情况下,服务器可以通过图6所示的实现过程构建该第二黑标签库,具体的,服务器可以先获取已被审核确认为与汇兑、走私代购、传销相关的非法交易文本,对所获取的非法交易文本进行去重后,基于保留下来的非法交易文本确定交易敏感词。
具体的,服务器可以采用python中的jieba分词组件,对每个非法交易文本进行分词处理,从而得到若干候选交易敏感词。然后,针对每个候选交易敏感词,利用TF-IDF算法将其转换为对应的矩阵,得到该候选交易敏感词对于非法交易文本的重要度;TF-IDF算法是一种统计方法,其可以用于评估一个词语对于一个文件集或者一个语料库中的一份文件的重要度,其原理可概括为:一个词语在一个文本中出现次数越多,并且在其它文本中出现次数越少,则该词语越能代表其所属的文本。进而,将对于非法交易文本的重要度超过预设重要度阈值的候选交易敏感词,添加至第二黑标签库中。
在另一种可能的实现方式中,当服务器通过步骤201获取的目标交易信息包括目标地区内不同风险等级的交易账户的分布信息,并且需要通过步骤202确定地区内目标类型交易账户(该目标类型交易账户为高风险交易账户)的分布情况这一参考评测维度下的交易情况评测结果时,服务器可以通过以下方式确定该交易情况评测结果,即通过以下方式判断目标地区内高风险交易账户的分布情况是否正常:
计算目标地区内风险等级超过预设等级的交易账户在目标地区内所有交易账户中的占比,作为该目标地区的高风险交易账户浓度,此处的风险等级是通过风险评级模型根据交易账户的交易特征确定的;进而,判断目标地区的高风险交易账户浓度是否超过预设高风险浓度阈值,并根据该判断结果确定目标地区内高交易风险账户的分布情况是否正常。
具体的,服务器可以预先确定目标地区内各交易账户的风险等级,从而确定该目标地区内不同风险等级的交易账户的分布信息。图7所示即为确定交易账户的风险等级的实现过程示意图,如图7所示,服务器针对某交易账户确定其风险等级时,可以先在数仓特征库中搜索该交易账户的交易特征,如该交易账户的交易金额、交易频率、交易时间等等;然后,对交易特征进行离散化处理,并将离散化处理后的交易特征输入预先训练的风险评级模型,通过该风险评级模型确定该交易账户所属的风险等级;该风险评级模型通过相关专家经验和线性回归拟合的方式被优化其权重赋值,并且对所划分的风险等级进行了测试调整。此外,该风险评级模型上线应用后,后续还可以进一步迭代优化。
示例性的,假设将交易账户的风险等级划分为1级至5级,其中,1级为最低风险等级,5级为最高风险等级,则服务器获取到目标地区内1级至5级的交易账户的分布信息后,可以计算目标地区内风险等级为5级的交易账户在目标地区内所有交易账户中的占比,作为该目标地区的高风险交易用户浓度。进而,判断该目标地区的高风险交易用户浓度是否超过预设高风险浓度阈值,如50%,若是,则确定该目标地区内高风险交易账户的分布情况异常,反之,若否,则确定该目标地区内高风险交易账户的分布情况正常。
在另一种可能的实现方式中,当服务器通过步骤201获取的目标交易信息包括目标地区内的交易账户在多种参考维度下的分布信息,并且需要通过步骤202确定地区内交易账户的稳定情况这一参考评测维度下的交易情况评测结果,则服务器可以通过以下方式确定该交易情况评测结果,即通过以下方式判断目标地区内交易账户的稳定情况是否正常:
针对每种参考维度,根据历史参考时段内该目标地区内的交易账户在该参考维度下的分布信息、以及目标时段内目标地区内的交易账户在参考维度下的分布信息,确定目标时段内目标地区内的交易账户在该参考维度下的稳定性指标;然后,根据目标时段内目标地区内的交易账户在多种参考维度下的稳定性指标,确定目标时段内目标地区的交易账户的整体稳定性指标;进而,判断目标时段内目标地区内的交易账户在每种参考维度下的稳定性指标是否超过第一预设稳定性阈值,以及判断该目标时段内目标地区的交易账户的整体稳定性指标是否超过第二预设稳定性阈值,从而根据判断结果确定目标地区内交易账户的稳定情况是否正常。
示例性的,服务器获取的目标地区内的交易账户在多种参考维度下的分布信息可以包括:目标地区内新老交易账户(由交易账户的注册时长决定)的分布信息、目标地区内交易金额所属于不同区间的交易账户的分布信息、目标地区内交易账户的注册用户的年龄分布信息、目标地区内交易账户的注册用户的身份类型分布信息、目标地区内交易账户的注册用户的性别分布信息;进而,服务器可以针对每种参考维度,根据历史参考时段内目标地区内的交易账户在该参考维度下的分布信息、以及目标时段内目标地区的交易账户在该参考维度下的分布信息,计算目标时段内目标地区的交易账户在该种参考维度下的群体稳定性指标(Population Stability Index,PSI),在本申请中又可称为稳定性指标。
需要说明的是,PSI能够反映验证样本在各分数区间的分布相对于建模样本分布的稳定性,是衡量模型的预测值与实际值之间的偏差大小的指标,表示的是按分数分档后,针对不同样本或者不同时间的样本,群体的分布是否有变化,即各个分数区间内的人数在总人数中的占比是否有明显变化。PSI的计算公式具体如式(13)所示:
PSI=SUM(实际占比-预测占比)*In(实际占比/预测占比)(13)
为了便于理解,下面以计算目标时段内目标地区内交易金额所属于不同区间的交易账户这一参考维度的稳定性指标为例,对稳定性指标的计算过程进行举例说明。
假设计算2020年12月1日A国内交易金额所属于不同区间的交易账户的PSI,并且选取2020年11月24日至11月30日作为历史参考时段。2020年12月1日A国的交易金额所属于不同区间的交易账户的预测占比的计算过程可以参见表1;针对每个区间,可以计算2020年11月24日至11月30日内每日所属于该区间的交易账户的实际占比的平均值,作为2020年12月1日该区间对应的预测占比。
表1
<1k | 1k-3k | 3k-5k | 5k-1w | 1w-5w | 5w-10w | >10w | |
11.24 | 78.42 | 11.29 | 3.17 | 3.44 | 3.35 | 0.28 | 0.05 |
11.25 | 77.75 | 11.78 | 3.27 | 3.51 | 3.39 | 0.25 | 0.05 |
11.26 | 79.01 | 10.99 | 3.14 | 3.45 | 3.1 | 0.24 | 0.06 |
11.27 | 78.96 | 11.13 | 3.07 | 3.36 | 3.21 | 0.22 | 0.05 |
11.28 | 79.1 | 11.13 | 3.11 | 3.33 | 3.06 | 0.2 | 0.06 |
11.29 | 79.7 | 11.12 | 3.01 | 3.17 | 2.79 | 0.18 | 0.03 |
11.30 | 77.64 | 11.56 | 3.45 | 3.54 | 3.51 | 0.22 | 0.07 |
预测占比 | 78.65 | 11.29 | 3.17 | 3.4 | 3.20 | 0.23 | 0.05 |
进而,服务器可以基于2020年12月1日交易金额所属于各个区间的交易账户的实际占比、与表1所示的2020年12月1日交易金额所属于各个区间的交易账户的预测占比,计算该参考维度的PSI,具体计算过程可参见表2:
表2
如此,通过上述方式计算得到2020年12月1日A国内交易金额所属于不同区间的交易账户的PSI;对于其它参考维度,服务器可以采用与上述计算方式类似的方式计算其对应的PSI。
服务器计算出目标时段内目标地区内的交易账户在各种参考维度下的PSI后,可以对各种参考维度下的PSI进行加权求和处理,得到目标时段内目标地区的交易账户的整体PSI。示例性的,在所获取的目标地区内的交易账户在多种参考维度下的分布信息包括目标地区内新老交易账户的分布信息、目标地区内交易金额所属于不同区间的交易账户的分布信息、目标地区内交易账户的注册用户的年龄分布信息、目标地区内交易账户的注册用户的身份类型分布信息、目标地区内交易账户的注册用户的性别分布信息的情况下,服务器可以针对上述参考维度分别配置权重20%、30%、15%、15%和20%,进而,对目标时段内目标地区内的交易账户在这多种参考维度下的PSI进行加权求和,得到目标时段内目标地区的交易账户的整体PSI。
服务器可以预先针对每种参考维度设置对应的第一预设稳定性阈值,针对目标地区的整体稳定性设置对应的第二预设稳定性阈值。服务器计算得到目标时段内目标地区内的交易账户在各种参考维度下的PSI后,可以针对每种参考维度,判断该种参考维度下的PSI是否超过该种参考维度对应的第一预设稳定性阈值(如0.25),若是,则可以直接确定目标地区内交易账户的稳定情况异常。若各种参考维度下的PSI均未超过其对应的第一预设稳定性阈值,则进一步判断目标时段内目标地区的交易账户的整体PSI是否超过第二因素稳定性阈值(如0.25),若是,则可以确定目标地区内交易账户的稳定情况异常,若否,则可以确定目标地区内交易账户的稳定情况正常。
在另一种可能的实现方式中,当服务器通过步骤201获取的目标交易信息包括在目标地区产生的交易数据,并且需要通过步骤202确定地区间的交易情况这一参考评测维度下的交易情况评测结果时,服务器可以通过以下方式确定该交易情况评测结果,即通过以下方式判断目标地区与其它地区间的交易情况是否正常:
当目标地区为交易数据的目的地区时,确定该交易数据的源地区作为评测参考地区;当目标地区为交易数据的源地区时,确定该交易数据的目的地区作为评测参考地区;此处的源地区是指发出交易数据的地区,此处的目的地区是指接收交易数据的地区。进而,判断目标地区与评测参考地区之间是否存在交易历史,根据该判断结果确定目标地区与评测参考地区间的交易情况是否正常。
具体的,服务器获取的在目标地区产生的交易数据可以包括目标地区内的交易账户与其它地区的交易账户之间的交易数据,对于此类交易数据,服务器可以确定发出该交易数据的地区(即交易数据的源地区)、或者接收该交易数据的地区(即交易数据的目的地区)。即,当目标地区为交易数据的目的地区时,服务器可以确定该交易数据的源地区作为评测参考地区,当目标地区为交易数据的源地区时,服务器可以确定该交易数据的目的地区作为评测参考地区。
进而,服务器可以判断目标地区内的交易账户与评测参考地区内的交易账户之间此前是否有过交易历史,若有过交易历史,则可以确定目标地区与评测参考地区间的交易情况正常;反之,若没有过交易历史,则说明目标地区与该评测参考地区此前无交易往来,此时可以确定目标地区与该评测参考地区间的交易情况异常。
应理解,在实际应用中,服务器确定参考评测维度下的目标地区对应的交易情况评测结果时,可以从上述可能的实现方式中选择任意一种或多种执行,即从任意一种参考评测维度或多种参考评测维度出发,确定目标地区对应的交易情况评测结果;也可以执行上述所有可能的实现方式,即从所有参考评测维度出发,确定目标地区对应的交易情况评测结果。本申请在此不对确定目标地区对应的交易情况评测结果的参考评测维度做任何限定。
步骤203:根据所述参考评测维度下所述目标地区对应的交易情况评测结果,确定所述目标地区对应的交易情况类型。
服务器确定出参考评测维度下目标地区对应的交易情况评测结果后,可以根据该参考评测维度下目标地区对应的交易情况评测结果,确定该目标地区对应的交易情况类型,即确定目标地区是否属于高交易风险地区。
在一种可能的实现方式中,若服务器通过步骤202仅确定了一种参考评测维度下目标地区对应的交易情况评测结果,则服务器可以直接根据该种参考评测维度下目标地区对应的交易情况评测结果,判断该目标地区是否属于高交易风险地区。
示例性的,若服务器通过步骤202仅确定了地区内交易数据的波动情况这一参考评测维度下的交易情况评测结果,则服务器可以在确定目标时段内在目标地区产生的交易数据的波动情况异常的情况下,确定目标地区属于高交易风险地区。若服务器通过步骤202仅确定了地区与交易异常地区间的关系这一参考评测维度下的交易情况评测结果,则服务器可以在确定目标地区属于交易异常地区的情况下,确定目标地区属于高交易风险地区。若服务器通过步骤202仅确定了地区内恶意交易账户的分布情况这一参考评测维度下的交易情况评测结果,则服务器可以在确定目标地区内恶意交易账户的分布情况异常的情况下,确定目标地区属于高交易风险地区。若服务器通过步骤202仅确定了地区内高风险交易账户的分布情况这一参考评测维度下的交易情况评测结果,则服务器可以在确定目标地区内高风险交易账户的分布情况异常的情况下,确定目标地区属于高交易风险地区。若服务器通过步骤202仅确定了地区内交易账户的稳定情况这一参考评测维度下的交易情况评测结果,则服务器可以在确定目标地区内交易账户的稳定情况异常的情况下,确定目标地区属于高交易风险地区。若服务器通过步骤202仅确定了地区内的交易情况这一参考评测维度下的交易情况评测结果,则服务器可以在确定目标地区与其它地区的交易情况异常的情况下,确定目标地区属于高交易风险地区。
在另一种可能的实现方式中,若服务器通过步骤202确定了多种参考评测维度下目标地区对应的交易情况评测结果,则服务器可以综合考虑这多种参考评测维度下目标地区对应的交易情况评测结果,从而确定目标地区是否属于高交易风险地区。
作为一种示例,当服务器通过步骤202确定了地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内恶意交易账户的分布情况、地区内高风险交易账户的分布情况、地区内交易账户的稳定情况和地区间的交易情况这六种参考评测维度下目标地区对应的交易情况评测结果时,服务器可以通过以下方式判断目标地区是否属于高交易风险地区:
若确定目标地区属于交易异常地区,则可直接确定目标地区属于高风险交易地区。若确定目标地区不属于交易异常地区,则可以判断目标地区对应的交易风险评测结果是否包括以下至少两种:目标地区产生的交易数据的波动情况异常、目标地区内恶意交易账户的分布情况异常、目标地区内高风险交易账户的分布情况异常、目标地区内交易账户的稳定情况异常、目标地区与其它地区间的交易情况异常;若是,则确定该目标地区属于高风险交易地区;若否,则确定该目标地区不属于高风险交易地区。
示例性的,服务器可以通过图8所示的高风险交易地区确定流程,来判断目标地区是否属于高交易风险地区。如图8所示,服务器确定出一种参考评测维度下目标地区对应的交易情况评测结果后,可以根据该交易情况评测结果,确定目标地区在该参考评测维度下的得分。例如,服务器确定出地区内交易数据的波动情况这一参考评测维度下的交易情况评测结果后,可以根据该交易情况评测结果,设置目标地区在地区内交易数据的波动情况这一参考评测维度下的得分,若目标地区内交易数据的波动情况异常,则设置该得分为1,若目标地区内交易数据的波动情况正常,则设置该得分为0;服务器确定出地区与交易异常地区间的关系这一参考评测维度下的交易情况评测结果后,可以根据该交易情况评测结果,设置目标地区在地区与交易异常地区间的关系这一参考评测维度下的得分,若目标地区属于交易异常地区,则设置该得分为1,若目标地区不属于交易异常地区,则设置该得分为0;服务器确定出地区内恶意交易账户的分布情况这一参考评测维度下的交易情况评测结果后,可以根据该交易情况评测结果,设置目标地区在地区内恶意交易账户的分布情况这一参考评测维度下的得分,若目标地区内恶意交易账户的分布情况异常,则设置该得分为1,若目标地区内恶意交易账户的分布情况正常,则设置该得分为0;服务器确定出地区内高风险交易账户的分布情况这一参考评测维度下的交易情况评测结果后,可以根据该交易情况评测结果,设置目标地区在地区内高风险交易账户的分布情况这一参考评测维度下的得分,若目标地区内高风险交易账户的分布情况异常,则设置该得分为1,若目标地区内高风险交易账户的分布情况正常,则设置该得分为0;服务器确定出地区内交易账户的稳定情况这一参考评测维度下的交易风险情况结果后,可以根据该交易情况评测结果,设置目标地区在地区内交易账户的稳定情况这一参考评测维度下的得分,若目标地区内交易账户的稳定情况异常,则设置该得分为1,若目标地区内交易账户的稳定情况正常,则设置该得分为0;服务器确定出地区间的交易情况这一参考评测维度下的交易情况评测结果后,可以根据该交易情况评测结果,设置目标地区在地区间的交易情况这一参考评测维度下的得分,若目标地区与其它地区的交易情况异常,则设置该得分为1,若目标地区与其它地区的交易情况正常,则设置该得分为0。
如此,通过上述方式得到目标地区在各种参考评测维度下的得分后,可以先判断目标地区在地区与交易异常地区间的关系这一参考评测维度下的得分是否为1,若是,则直接确定该目标地区属于高交易风险地区。反之,若否,则服务器可以判断目标地区在其它参考评测维度下的得分是否存在至少两个为1,若是,则确定该目标地区属于高交易风险地区,若否,则确定该目标地区并非高交易风险地区。
需要说明的是,若服务器确定目标地区为高交易风险地区,则服务器可以通过一些告警方式,提示相关业务人员目标地区为高交易风险地区,从而便于相关业务人员及时地对与该目标地区相关的交易进行处理;例如,服务器可以通过控制相关业务处理页面(如对于目标地区的交易的处理页面)闪烁的方式进行告警,或者服务器还可以通过向相关业务人员推送邮件的方式进行告警。本申请在此不对告警高交易风险地区的形式做任何限定。
此外,本申请实施例还提出了一种以地图可视化的方式展示全球各地区的交易详情信息的方式,通过这种交易详情信息的展示方式,相关业务人员可以及时快速地感知全球各地区的交易风险,有助于提高相关业务人员的交易风险分析效率和处理效率。
作为展示交易详情信息的实现基础,服务器需要先对所要展示的交易详情信息依据的交易数据进行加工处理。具体的,服务器可以先确定目标数据维度;然后基于该目标数据维度,根据原始交易数据构建目标数据维度对应的交易数据表;进而,将该交易数据表写入目标数据库。
示例性的,图9所示为上述交易数据的加工处理过程的示意图。如图9所示,在对交易数据进行加工处理之前,需要先确定实际业务所关注的目标数据维度。图10所示为一种示例性的确定目标数据维度的实现过程示意图,如图10所示,服务器可以先统计用户所关注的交易数据(如国家地区交易规模、趋势、风险程度,国际地区交易拦截规模、趋势,交易金额较高的用户和国家等)、以及风控所涉及的数据(如交易数据、用户基础信息、投诉和拦截数据、模型数据和制裁涉税信息),进而,采用OSM(Objective、Strategy、Measurement)模型对用户所关注的交易数据以及风控所涉及的数据进行拆分,如图10中的表格所示,从而得到目标数据维度。
进而,服务器可以基于上述目标数据维度,根据原始交易数据构建目标数据维度对应的交易数据表。图11所示为一种示例性的构建交易数据表的实现过程示意图;如图11所示,服务器可以采用指标分级法,对原始交易数据进行自上而下地指标分解,例如,可以将境外整体交易笔数、金额和用户数分别拆分为各个国家的交易笔数、金额和用户数,进而,再将国家的交易笔数、金额和用户数拆分为各种交易模式(如普通转账、红包交易等)下的交易笔数、金额和用户数,等等。进而,服务器可以根据通过指标分级法拆分出的交易数据构建交易数据表,所构建的交易数据表通常能够反映全球各地区的交易风险,例如,可以构建以下交易数据表:国家地区交易日表、跨境交易日表、国家地区账户交易日表、跨境账户交易日表、国家地区画像日表、跨境画像日表、国家拦截交易日表、跨境拦截交易日表、制裁明细表和涉税明细表等。
进而,服务器可以通过PML任务,将所构建的交易数据表同步至线上的关系型数据库(MYSQL数据库);通常情况下,服务器可以定期地(如每天)构建交易数据表,并向MYSQL数据库同步所构建的交易数据表。相应地,前端页面可以基于vue框架中的+echart,进行数据可视化处理及展示。
具体展示交易详情信息时,服务器可以响应于针对地图上的交易地区触发的交易信息查看操作,从上述目标数据库中调取交易数据表,进而显示该交易数据库中交易地区对应的交易详情信息。
示例性的,在服务器所支持的全球交易风险感知系统的显示界面上,可以显示全球地图,该全球地图上不同的地区上可以显示与其交易概况(区分出款交易概况和入款交易概况)相对应的颜色,此外,该显示界面上还可以显示30天境外交易金额或者交易笔数的变化趋势、30天境外交易金额或者交易笔数排名靠前的国家或地区、30天境外拦截的交易金额或者交易笔数的变化趋势、全球各地区的风险标签占比以及风险等级分布;图12所示即为一种示例性的全球交易风险感知系统的显示界面示意图。通过该显示界面,相关业务人员可以快速地感知个国家的交易、拦截以及风险状况。
上述全球交易风险感知系统的显示界面中还可以包括工具栏,该工具栏可以提供显示维度筛选功能,示例性的,该工具栏可以支持以下功能指标:交易数据统计维度切换选项、展示国家选项、染色方案选项、交易场景选择选项、时间范围选择选项等。该显示界面还可以提供列举各交易场景下交易金额排名靠前的地区的功能。
此外,上述全球交易风险感知系统的显示界面,还可以根据全球各地区的风险等级对各地区进行染色处理。并且,相关业务人员可以在上述全球交易风险感知系统的显示界面触发交易信息查看操作,例如,相关业务人员控制鼠标光标悬停至地图上的某一地区时,可以相应地显示该地区的中文全称、英文全称、国家三位英文缩写、国家制裁或者涉税或者交易风险级别;相关业务人员鼠标点击某一地区时,可以弹出对话框显示该地区的地区交易画像缩略图,以反映该地区的交易概况;进一步点击该地区交易画像缩略图,可以显示该地区近7天趋势看板、国家基础信息、国家交易画像、国家特征画像、风控拦截信息等信息。并且,上述全球交易风险感知系统的显示界面,还可以支持滚轮缩放功能,即能够从整体地图具体至某一地区。
此外,对于全球范围内交易金额排名靠前的交易账户,还可以根据该交易账户的交易关系构建交易关系图谱,如图13所示;根据该交易关系图谱,可以确定出与该交易账户具有密切交易关系的交易账户,进而可以将这些交易账户作为重点监控账户,基于这些重点监控账户可以进行交易风险挖掘分析。
上述数据处理方法能够根据目标地区的目标交易信息,从地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况、以及地区间的交易情况中的至少一个参考评测维度出发,对目标地区的交易风险进行评测,进而确定目标地区是否属于高交易风险地区。由于上述每个参考评测维度的交易情况评测结果均能在一定程度上反映地区在反洗钱金融领域中的交易风险,而地区在反洗钱金融领域中的交易风险在实际业务中通常具有更高的参考价值,能够更准确地反映地区的实际交易风险,对用户跨境交易的安全性具有更显著的影响;因此,通过本申请实施例提供的数据处理方法,对地区在反洗钱金融领域的交易风险进行监控,能够更准确地确定地区的交易风险,从而更准确地识别存在高交易风险的地区。
针对上文描述的数据处理方法,本申请还提供了对应的数据处理装置,以使上述数据处理方法在实际中得以应用和实现。
参见图14,图14是与上文图2所示的数据处理方法对应的数据处理装置1400的结构示意图。如图14所示,该数据处理装置1400包括:
交易信息获取模块1401,用于针对待评测的目标地区,获取所述目标地区的目标交易信息;所述目标交易信息包括以下至少一种:在所述目标地区产生的交易数据、所述目标地区的地区基本信息、所述目标地区内不同类型的交易账户的分布信息;
第一交易情况评测模块1402,用于根据所述目标交易信息,确定参考评测维度下所述目标地区对应的交易情况评测结果;所述参考评测维度包括以下至少一种:地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况、地区间的交易情况;
第二交易情况评测模块1403,用于根据所述参考评测维度下所述目标地区对应的交易情况评测结果,确定所述目标地区对应的交易情况类型。
可选的,在图14所示的数据处理装置的基础上,当所述目标交易信息包括在所述目标地区产生的多种交易类型的交易数据,所述参考评测维度包括地区内交易数据的波动情况时,所述第一交易情况评测模块1402具体用于:
针对每种交易类型,根据历史参考时段内在所述目标地区产生的所述交易类型的交易数据,确定所述交易类型对应的合理波动区间;判断目标时段内在所述目标地区产生的所述交易类型的交易数据是否处于所述合理波动区间,根据判断结果确定所述目标时段内在所述目标地区产生的所述交易类型的交易数据对应的交易波动评测结果;
根据所述目标时段内在所述目标地区产生的所述多种交易类型的交易数据各自对应的交易波动评测结果,确定所述目标时段内在所述目标地区产生的交易数据的波动情况是否正常。
可选的,所述第一交易情况评测模块1402具体通过以下方式确定所述交易类型对应的合理波动区间:
计算第一历史参考时段内在所述目标地区产生的所述交易类型的交易数据的均值,作为所述交易类型对应的第一参考值;
通过指数移动加权平均算法,根据第二历史参考时段内在所述目标地区产生的所述交易类型的交易数据,确定所述交易类型对应的第二参考值;
根据所述第一参考值和所述第二参考值,确定目标参考值;
基于正态分布原理,根据所述目标参考值确定所述交易类型对应的合理波动区间。
可选的,在图14所示的数据处理装置的基础上,当所述目标交易信息包括所述目标地区的地区基本信息,所述参考评测维度包括地区与交易异常地区间的关系时,所述第一交易情况评测模块1402具体用于:
在交易异常地区清单中匹配所述目标地区的地区基本信息,根据匹配结果确定所述目标地区是否属于所述交易异常地区;所述交易异常地区清单中包括预先确定的交易异常地区。
可选的,在图14所示的数据处理装置的基础上,当所述目标交易信息包括所述目标地区内恶意交易账户的分布信息,所述参考评测维度包括地区内恶意交易账户的分布情况时,所述第一交易情况评测模块1402具体用于:
计算所述目标地区内恶意交易账户在所述目标地区内所有交易账户中的占比,作为所述目标地区的恶意交易账户浓度;所述恶意交易账户包括以下至少一种:存储于第一黑标签库的交易账户、所交互的交易文本与第二黑标签库匹配的交易账户;所述第一黑标签库用于存储非法交易账户,所述第二黑标签库用于存储交易敏感词;
判断所述目标地区的恶意交易账户浓度是否超过预设恶意浓度阈值,根据判断结果确定所述目标地区内恶意交易账户的分布情况是否正常。
可选的,所述第一黑标签库是通过以下方式构建的:
针对所述目标地区的每个交易账户,通过非法账户识别模型根据所述交易账户的交易特征,确定所述交易账户是否属于非法交易账户;若所述交易账户属于非法交易账户,则将所述交易账户添加至所述第一黑标签库;
其中,所述非法账户识别模型是基于标准非法交易账户的交易特征训练得到的;
所述第二黑标签库是通过以下方式构建的:
对非法交易文本进行分词处理,得到候选交易敏感词;
针对每个所述候选交易敏感词,通过词频-逆文件频率算法确定所述候选交易敏感词对于所述非法交易文本的重要度;
将对于所述非法交易文本的重要度超过预设重要度阈值的所述候选交易敏感词,添加至所述第二黑标签库。
可选的,在图14所示的数据处理装置的基础上,当所述目标交易信息包括所述目标地区内不同风险等级的交易账户的分布信息,所述参考评测维度包括地区内高风险交易账户的分布情况时,所述第一交易情况评测模块1402具体用于:
计算所述目标地区内风险等级超过预设等级的交易账户在所述目标地区内所有交易账户中的占比,作为所述目标地区的高风险交易账户浓度;所述风险等级是通过风险评级模型根据交易账户的交易特征确定的;
判断所述目标地区的高风险交易账户浓度是否超过预设高风险浓度阈值,根据判断结果确定所述目标地区内高风险交易账户的分布情况是否正常。
可选的,在图14所示的数据处理装置的基础上,当所述目标交易信息包括所述目标地区内的交易账户在多种参考维度下的分布信息,所述参考评测维度包括地区内交易账户的稳定情况时,所述第一交易情况评测模块1402具体用于:
针对每种所述参考维度,根据历史参考时段内所述目标地区内的交易账户在所述参考维度下的分布信息、以及目标时段内所述目标地区内的交易账户在所述参考维度下的分布信息,确定所述目标时段内所述目标地区内的交易账户在所述参考维度下的稳定性指标;
根据所述目标时段内所述目标地区内的交易账户在所述多种参考维度下的稳定性指标,确定所述目标时段内所述目标地区的交易账户的整体稳定性指标;
判断所述目标时段内所述目标地区内的交易账户在每种所述参考维度下的稳定性指标是否超过第一预设稳定性阈值,以及判断所述目标时段内所述目标地区的交易账户的整体稳定性指标是否超过第二预设稳定性阈值;根据判断结果确定所述目标地区内交易账户的稳定情况是否正常。
可选的,在图14所示的数据处理装置的基础上,当所述目标交易信息包括在所述目标地区产生的交易数据,所述参考评测维度包括地区间的交易情况时,所述第一交易情况评测模块1402具体用于:
当所述目标地区为所述交易数据的目的地区时,确定所述交易数据的源地区作为评测参考地区;当所述目标地区为所述交易数据的源地区时,确定所述交易数据的目的地区作为评测参考地区;所述源地区是发出所述交易数据的地区,所述目的地区是接收所述交易数据的地区;
判断所述目标地区与所述评测参考地区之间是否存在交易历史,根据判断结果确定所述目标地区与所述评测参考地区间的交易情况是否正常。
可选的,在图14所示的数据处理装置的基础上,当所述参考评测维度包括地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内恶意交易账户的分布情况、地区内高风险交易账户的分布情况、地区内交易账户的稳定情况和地区间的交易情况时,所述第二交易情况评测模块1403具体用于:
若确定所述目标地区属于所述交易异常地区,则确定所述目标地区属于高风险交易地区;
若确定所述目标地区不属于所述交易异常地区,则判断所述目标地区对应的交易风险评测结果是否包括以下至少两种:所述目标地区产生的交易数据的波动情况异常、所述目标地区内恶意交易账户的分布情况异常、所述目标地区内高风险交易账户的分布情况异常、所述目标地区内交易账户的稳定情况异常、所述目标地区与其它地区间的交易情况异常;
若是,则确定所述目标地区属于高风险交易地区;若否,则确定所述目标地区不属于高风险交易地区。
可选的,在图14所示的数据处理装置的基础上,参见图15,图15为本申请实施例提供的数据处理装置1500的结构示意图。如图15所示,该数据处理装置1500还包括:
数据加工模块1501,用于确定目标数据维度;基于所述目标数据维度,根据原始交易数据构建所述目标数据维度对应的交易数据表;将所述交易数据表写入目标数据库。
可选的,在图15所示的数据处理装置的基础上,参见图16,图16为本申请实施例提供的数据处理装置1600的结构示意图。如图16所示,该数据处理装置1600还包括:
信息显示模块1601,用于响应于针对地图上的交易地区触发的交易信息查看操作,从所述目标数据库中调取所述交易数据表,显示所述交易数据表中所述交易地区对应的交易详情信息。
上述数据处理装置能够根据目标地区的目标交易信息,从地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内恶意交易账户的分布情况、地区内高风险交易账户的分布情况、地区内交易账户的稳定情况、以及地区间的交易情况中的至少一个参考评测维度出发,对目标地区的交易情况进行评测,进而确定目标地区是否属于高交易风险地区。由于上述每个参考评测维度的交易情况评测结果均能在一定程度上反映地区在反洗钱金融领域中的交易风险,而地区在反洗钱金融领域中的交易风险在实际业务中通常具有更高的参考价值,能够更准确地反映地区的实际交易风险,对用户跨境交易的安全性具有更显著的影响;因此,通过本申请实施例提供的数据处理装置,对地区在反洗钱金融领域的交易风险进行监控,能够更准确地确定地区的交易风险,从而更准确地识别存在高交易风险的地区。
本申请实施例还提供了一种用于评测交易风险的设备,该设备具体可以是终端设备或者服务器,下面将从硬件实体化的角度对本申请实施例提供的终端设备和服务器进行介绍。
参见图17,图17是本申请实施例提供的终端设备的结构示意图。如图17所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(英文全称:PersonalDigital Assistant,英文缩写:PDA)、销售终端(英文全称:Point of Sales,英文缩写:POS)、车载电脑等任意终端设备,以终端为计算机为例:
图17示出的是与本申请实施例提供的终端相关的计算机的部分结构的框图。参考图17,计算机包括:射频(英文全称:Radio Frequency,英文缩写:RF)电路1710、存储器1720、输入单元1730、显示单元1740、传感器1750、音频电路1760、无线保真(英文全称:wireless fidelity,英文缩写:WiFi)模块1770、处理器1780、以及电源1790等部件。本领域技术人员可以理解,图17中示出的计算机结构并不构成对计算机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储器1720可用于存储软件程序以及模块,处理器1780通过运行存储在存储器1720的软件程序以及模块,从而执行计算机的各种功能应用以及数据处理。存储器1720可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1720可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器1780是计算机的控制中心,利用各种接口和线路连接整个计算机的各个部分,通过运行或执行存储在存储器1720内的软件程序和/或模块,以及调用存储在存储器1720内的数据,执行计算机的各种功能和处理数据,从而对计算机进行整体监控。可选的,处理器1780可包括一个或多个处理单元;优选的,处理器1780可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1780中。
在本申请实施例中,该终端所包括的处理器1780还具有以下功能:
针对待评测的目标地区,获取所述目标地区的目标交易信息;所述目标交易信息包括以下至少一种:在所述目标地区产生的交易数据、所述目标地区的地区基本信息、所述目标地区内不同类型的交易账户的分布信息;
根据所述目标交易信息,确定参考评测维度下所述目标地区对应的交易情况评测结果;所述参考评测维度包括以下至少一种:地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况、地区间的交易情况;
根据所述参考评测维度下所述目标地区对应的交易情况评测结果,确定所述目标地区对应的交易情况类型。
可选的,所述处理器1780还用于执行本申请实施例提供的数据处理方法的任意一种实现方式的步骤。
参见图18,图18为本申请实施例提供的一种服务器1800的结构示意图。该服务器1800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1822(例如,一个或一个以上处理器)和存储器1832,一个或一个以上存储应用程序1842或数据1844的存储介质1830(例如一个或一个以上海量存储设备)。其中,存储器1832和存储介质1830可以是短暂存储或持久存储。存储在存储介质1830的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1822可以设置为与存储介质1830通信,在服务器1800上执行存储介质1830中的一系列指令操作。
服务器1800还可以包括一个或一个以上电源1826,一个或一个以上有线或无线网络接口1850,一个或一个以上输入输出接口1858,和/或,一个或一个以上操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由服务器所执行的步骤可以基于该图18所示的服务器结构。
其中,CPU 1822用于执行如下步骤:
针对待评测的目标地区,获取所述目标地区的目标交易信息;所述目标交易信息包括以下至少一种:在所述目标地区产生的交易数据、所述目标地区的地区基本信息、所述目标地区内不同类型的交易账户的分布信息;
根据所述目标交易信息,确定参考评测维度下所述目标地区对应的交易情况评测结果;所述参考评测维度包括以下至少一种:地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况、地区间的交易情况;
根据所述参考评测维度下所述目标地区对应的交易情况评测结果,确定所述目标地区对应的交易情况类型。
可选的,CPU 1822还可以用于执行本申请实施例提供的数据处理方法的任意一种实现方式的步骤。
本申请实施例还提供一种计算机可读存储介质,用于存储计算机程序,该计算机程序用于执行前述各个实施例所述的一种数据处理方法中的任意一种实施方式。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前述各个实施例所述的一种数据处理方法中的任意一种实施方式。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储计算机程序的介质。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (15)
1.一种数据处理方法,其特征在于,所述方法包括:
针对待评测的目标地区,获取所述目标地区的目标交易信息;所述目标交易信息包括以下至少一种:在所述目标地区产生的交易数据、所述目标地区的地区基本信息、所述目标地区内不同类型的交易账户的分布信息;
根据所述目标交易信息,确定参考评测维度下所述目标地区对应的交易情况评测结果;所述参考评测维度包括以下至少一种:地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况、地区间的交易情况;
根据所述参考评测维度下所述目标地区对应的交易情况评测结果,确定所述目标地区对应的交易情况类型。
2.根据权利要求1所述的方法,其特征在于,当所述目标交易信息包括在所述目标地区产生的多种交易类型的交易数据,所述参考评测维度包括地区内交易数据的波动情况时,所述根据所述目标交易信息,确定参考评测维度下所述目标地区对应的交易情况评测结果,包括:
针对每种交易类型,根据历史参考时段内在所述目标地区产生的所述交易类型的交易数据,确定所述交易类型对应的合理波动区间;判断目标时段内在所述目标地区产生的所述交易类型的交易数据是否处于所述合理波动区间,根据判断结果确定所述目标时段内在所述目标地区产生的所述交易类型的交易数据对应的交易波动评测结果;
根据所述目标时段内在所述目标地区产生的所述多种交易类型的交易数据各自对应的交易波动评测结果,确定所述目标时段内在所述目标地区产生的交易数据的波动情况是否正常。
3.根据权利要求2所述的方法,其特征在于,所述根据历史参考时段内在所述目标地区产生的所述交易类型的交易数据,确定所述交易类型对应的合理波动区间,包括:
计算第一历史参考时段内在所述目标地区产生的所述交易类型的交易数据的均值,作为所述交易类型对应的第一参考值;
通过指数移动加权平均算法,根据第二历史参考时段内在所述目标地区产生的所述交易类型的交易数据,确定所述交易类型对应的第二参考值;
根据所述第一参考值和所述第二参考值,确定目标参考值;
基于正态分布原理,根据所述目标参考值确定所述交易类型对应的合理波动区间。
4.根据权利要求1所述的方法,其特征在于,当所述目标交易信息包括所述目标地区的地区基本信息,所述参考评测维度包括地区与交易异常地区间的关系时,所述根据所述目标交易信息,确定参考评测维度下所述目标地区对应的交易情况评测结果,包括:
在交易异常地区清单中匹配所述目标地区的地区基本信息,根据匹配结果确定所述目标地区是否属于所述交易异常地区;所述交易异常地区清单中包括预先确定的交易异常地区。
5.根据权利要求1所述的方法,其特征在于,当所述目标交易信息包括所述目标地区内恶意交易账户的分布信息,所述参考评测维度包括地区内目标类型交易账户的分布情况时,所述目标类型交易账户为恶意交易账户;所述根据所述目标交易信息,确定参考评测维度下所述目标地区对应的交易情况评测结果,包括:
计算所述目标地区内恶意交易账户在所述目标地区内所有交易账户中的占比,作为所述目标地区的恶意交易账户浓度;所述恶意交易账户包括以下至少一种:存储于第一黑标签库的交易账户、所交互的交易文本与第二黑标签库匹配的交易账户;所述第一黑标签库用于存储非法交易账户,所述第二黑标签库用于存储交易敏感词;
判断所述目标地区的恶意交易账户浓度是否超过预设恶意浓度阈值,根据判断结果确定所述目标地区内恶意交易账户的分布情况是否正常。
6.根据权利要求5所述的方法,其特征在于,通过以下方式构建所述第一黑标签库:
针对所述目标地区的每个交易账户,通过非法账户识别模型根据所述交易账户的交易特征,确定所述交易账户是否属于非法交易账户;若所述交易账户属于非法交易账户,则将所述交易账户添加至所述第一黑标签库;
其中,所述非法账户识别模型是基于标准非法交易账户的交易特征训练得到的;
通过以下方式构建所述第二黑标签库:
对非法交易文本进行分词处理,得到候选交易敏感词;
针对每个所述候选交易敏感词,通过词频-逆文件频率算法确定所述候选交易敏感词对于所述非法交易文本的重要度;
将对于所述非法交易文本的重要度超过预设重要度阈值的所述候选交易敏感词,添加至所述第二黑标签库。
7.根据权利要求1所述的方法,其特征在于,当所述目标交易信息包括所述目标地区内不同风险等级的交易账户的分布信息,所述参考评测维度包括地区内目标类型交易账户的分布情况时,所述目标类型交易账户为高风险交易账户;所述根据所述目标交易信息,确定参考评测维度下所述目标地区对应的交易情况评测结果,包括:
计算所述目标地区内风险等级超过预设等级的交易账户在所述目标地区内所有交易账户中的占比,作为所述目标地区的高风险交易账户浓度;所述风险等级是通过风险评级模型根据交易账户的交易特征确定的;
判断所述目标地区的高风险交易账户浓度是否超过预设高风险浓度阈值,根据判断结果确定所述目标地区内高风险交易账户的分布情况是否正常。
8.根据权利要求1所述的方法,其特征在于,当所述目标交易信息包括所述目标地区内的交易账户在多种参考维度下的分布信息,所述参考评测维度包括地区内交易账户的稳定情况时,所述根据所述目标交易信息,确定参考评测维度下所述目标地区对应的交易情况评测结果,包括:
针对每种所述参考维度,根据历史参考时段内所述目标地区内的交易账户在所述参考维度下的分布信息、以及目标时段内所述目标地区内的交易账户在所述参考维度下的分布信息,确定所述目标时段内所述目标地区内的交易账户在所述参考维度下的稳定性指标;
根据所述目标时段内所述目标地区内的交易账户在所述多种参考维度下的稳定性指标,确定所述目标时段内所述目标地区的交易账户的整体稳定性指标;
判断所述目标时段内所述目标地区内的交易账户在每种所述参考维度下的稳定性指标是否超过第一预设稳定性阈值,以及判断所述目标时段内所述目标地区的交易账户的整体稳定性指标是否超过第二预设稳定性阈值;根据判断结果确定所述目标地区内交易账户的稳定情况是否正常。
9.根据权利要求1所述的方法,其特征在于,当所述目标交易信息包括在所述目标地区产生的交易数据,所述参考评测维度包括地区间的交易情况时,所述根据所述目标交易信息,确定参考评测维度下所述目标地区对应的交易情况评测结果,包括:
当所述目标地区为所述交易数据的目的地区时,确定所述交易数据的源地区作为评测参考地区;当所述目标地区为所述交易数据的源地区时,确定所述交易数据的目的地区作为评测参考地区;所述源地区是发出所述交易数据的地区,所述目的地区是接收所述交易数据的地区;
判断所述目标地区与所述评测参考地区之间是否存在交易历史,根据判断结果确定所述目标地区与所述评测参考地区间的交易情况是否正常。
10.根据权利要求1至9任一项所述的方法,其特征在于,当所述参考评测维度包括地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况和地区间的交易情况时,所述目标类型交易账户包括恶意交易账户和高风险交易账户,所述根据所述参考评测维度下所述目标地区对应的交易情况评测结果,确定所述目标地区对应的交易情况类型,包括:
若确定所述目标地区属于所述交易异常地区,则确定所述目标地区对应的交易情况类型为高风险;
若确定所述目标地区不属于所述交易异常地区,则判断所述目标地区对应的交易风险评测结果是否包括以下至少两种:所述目标地区产生的交易数据的波动情况异常、所述目标地区内恶意交易账户的分布情况异常、所述目标地区内高风险交易账户的分布情况异常、所述目标地区内交易账户的稳定情况异常、所述目标地区与其它地区间的交易情况异常;
若是,则确定所述目标地区对应的交易情况类型为高风险;若否,则确定所述目标地区对应的交易情况类型并非高风险。
11.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定目标数据维度;
基于所述目标数据维度,根据原始交易数据构建所述目标数据维度对应的交易数据表;
将所述交易数据表写入目标数据库。
12.根据权利要求11所述的方法,其特征在于,所述方法还包括:
响应于针对地图上的交易地区触发的交易信息查看操作,从所述目标数据库中调取所述交易数据表,显示所述交易数据表中所述交易地区对应的交易详情信息。
13.一种数据处理装置,其特征在于,所述装置包括:
交易信息获取模块,用于针对待评测的目标地区,获取所述目标地区的目标交易信息;所述目标交易信息包括以下至少一种:在所述目标地区产生的交易数据、所述目标地区的地区基本信息、所述目标地区内不同类型的交易账户的分布信息;
第一交易情况评测模块,用于根据所述目标交易信息,确定参考评测维度下所述目标地区对应的交易情况评测结果;所述参考评测维度包括以下至少一种:地区内交易数据的波动情况、地区与交易异常地区间的关系、地区内目标类型交易账户的分布情况、地区内交易账户的稳定情况、地区间的交易情况;
第二交易情况评测模块,用于根据所述参考评测维度下所述目标地区对应的交易情况评测结果,确定所述目标地区对应的交易情况类型。
14.一种设备,其特征在于,所述设备包括处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于根据所述计算机程序执行权利要求1至12中任一项所述的数据处理方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行权利要求1至12中任一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110377395.7A CN115204881A (zh) | 2021-04-08 | 2021-04-08 | 一种数据处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110377395.7A CN115204881A (zh) | 2021-04-08 | 2021-04-08 | 一种数据处理方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115204881A true CN115204881A (zh) | 2022-10-18 |
Family
ID=83571140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110377395.7A Pending CN115204881A (zh) | 2021-04-08 | 2021-04-08 | 一种数据处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115204881A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115545935A (zh) * | 2022-11-18 | 2022-12-30 | 中国信息通信研究院 | 区块链交易账户的处理方法和装置、设备和介质 |
CN115760119A (zh) * | 2022-11-28 | 2023-03-07 | 海口春帆网络科技有限公司 | 基于数据处理和特征识别的金融支付监管系统及方法 |
-
2021
- 2021-04-08 CN CN202110377395.7A patent/CN115204881A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115545935A (zh) * | 2022-11-18 | 2022-12-30 | 中国信息通信研究院 | 区块链交易账户的处理方法和装置、设备和介质 |
CN115545935B (zh) * | 2022-11-18 | 2023-02-28 | 中国信息通信研究院 | 区块链交易账户的处理方法和装置、设备和介质 |
CN115760119A (zh) * | 2022-11-28 | 2023-03-07 | 海口春帆网络科技有限公司 | 基于数据处理和特征识别的金融支付监管系统及方法 |
CN115760119B (zh) * | 2022-11-28 | 2024-03-12 | 西安乐刷宝网络科技有限公司 | 基于数据处理和特征识别的金融支付监管系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7200607B2 (en) | Data analysis system for creating a comparative profile report | |
US20200234218A1 (en) | Systems and methods for entity performance and risk scoring | |
US11934415B2 (en) | Computer-based systems for dynamic data discovery and methods thereof | |
CN109285092A (zh) | 网上房地产信息提供系统,房地产放心交易服务提供系统 | |
CN113095408A (zh) | 风险的确定方法、装置和服务器 | |
CN110705307A (zh) | 信息变更指标监控方法、装置、计算机设备和存储介质 | |
CN113393306A (zh) | 产品推荐方法、装置、电子设备及计算机可读介质 | |
CN115204881A (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN113569162A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN115983900A (zh) | 用户营销策略的构建方法、装置、设备、介质和程序产品 | |
Bhambri | Data mining as a tool to predict churn behavior of customers | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
CN111383072A (zh) | 一种用户信用评分方法、存储介质及服务器 | |
CN112950359A (zh) | 一种用户识别方法和装置 | |
JP6031165B1 (ja) | 有望顧客予測装置、有望顧客予測方法及び有望顧客予測プログラム | |
CN116542696A (zh) | 用户群体分类方法、装置、设备及存储介质 | |
CN107844874A (zh) | 企业营运问题分析系统及其方法 | |
US20220101359A1 (en) | System and method for automated sales forecast on deal level during black swan scenario | |
Fitrianto et al. | Development of direct marketing strategy for banking industry: The use of a Chi-squared Automatic Interaction Detector (CHAID) in deposit subscription classification | |
CN114022184A (zh) | 数据管理方法、装置、电子设备及存储介质 | |
Zhu et al. | Building of safer urban hubs: Insights from a comparative study on cyber telecom scams and early warning design | |
Maclaurin et al. | Understanding the Combined Impacts of Aggregation and Spatial Non‐Stationarity: The Case of Migration‐Environment Associations in Rural S outh A frica | |
CN111882339A (zh) | 预测模型训练及响应率预测方法、装置、设备及存储介质 | |
Vercosa et al. | Analysis of Distinct Feature Groups in the Credit Scoring Problem | |
CN113672800B (zh) | 实名认证自然人用户的事项推荐方法及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |