CN112132693A - 交易验证方法、装置、计算机设备与计算机可读存储介质 - Google Patents
交易验证方法、装置、计算机设备与计算机可读存储介质 Download PDFInfo
- Publication number
- CN112132693A CN112132693A CN202011039267.3A CN202011039267A CN112132693A CN 112132693 A CN112132693 A CN 112132693A CN 202011039267 A CN202011039267 A CN 202011039267A CN 112132693 A CN112132693 A CN 112132693A
- Authority
- CN
- China
- Prior art keywords
- data
- user
- transaction
- identification
- suspected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012795 verification Methods 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000003860 storage Methods 0.000 title claims abstract description 21
- 238000012550 audit Methods 0.000 claims description 18
- 238000003066 decision tree Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 238000004140 cleaning Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000004900 laundering Methods 0.000 abstract description 26
- 238000012502 risk assessment Methods 0.000 abstract 1
- 238000004422 calculation algorithm Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 6
- 230000008520 organization Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种交易验证方法,包括:接收用户的多个图片数据;将每个所述图片数据输入至识别模型中进行识别,得到识别数据;将所述识别数据与第三方数据平台中的存储数据进行匹配,以得到每个所述图片数据的验证结果;当多个所述图片数据对应的验证结果均为通过时,获取所述用户的交易数据;通过预先训练的审核模型与预设规则分析所述交易数据,得到所述用户的嫌疑值;若所述嫌疑值大于预设阈值,将所述用户确定为嫌疑用户,并加入黑名单中。本发明还公开了一种交易验证装置、计算机设备与计算机可读存储介质。本发明还包括将所述用户的嫌疑值存储至区块链中。本发明可以应用于企业风险分析,可以快速高效的识别可疑的洗钱交易。
Description
技术领域
本发明实施例涉及数据安全领域,尤其涉及一种交易验证方法、装置、计算机设备与计算机可读存储介质。
背景技术
在预防、监控洗钱活动方面,保险公司通常是以客户识别、大额交易、可疑交易报告以及记录保存等制度为核心内容,通过资金监测实现反洗钱工作目标。从方式上看,保险反洗钱工作的开展,主要依赖于反洗钱专家的经验规则。
然而,单纯依靠经验规则的反洗钱工作流程,在当前反洗钱监管环境下遇到的问题越来越明显。最大的困难在于客户身份识别缺乏有效的手段,同时快速增加的交易量导致案件成倍增加与有限人力资源之间的矛盾,不能够准确、高效地识别可疑的洗钱交易。
发明内容
有鉴于此,本发明实施例的目的是提供一种交易验证方法、装置、计算机设备与计算机可读存储介质,可以快速高效的识别洗钱交易。
为实现上述目的,本发明实施例提供了一种交易验证方法,包括:
接收用户的多个图片数据;
将每个所述图片数据输入至识别模型中进行识别,得到识别数据;
将所述识别数据与第三方数据平台中的存储数据进行匹配,以得到每个所述图片数据的验证结果;
当多个所述图片数据对应的验证结果均为通过时,获取所述用户的交易数据;
通过预先训练的审核模型与预设规则分析所述交易数据,得到所述用户的嫌疑值;
若所述嫌疑值大于预设阈值,将所述用户确定为嫌疑用户,并加入黑名单中。
进一步地,所述将每个所述图片数据输入至识别模型中进行识别,得到识别数据包括:
对所述图片数据进行预处理,得到标准图片;
通过所述识别模型对所述标准图片进行字符识别,得到多个字段信息,所述字段信息为识别数据。
进一步地,所述获取所述用户的交易数据之前,包括:
获取在金融交易过程中产生的原始数据;
根据预设的数据清洗规则对所述原始数据进行清洗;
采用预设的数据加工模板对清洗后的所述原始数据进行加工,得到交易数据。
进一步地,所述通过预先训练的审核模型与预设规则分析所述交易数据,得到所述用户的嫌疑值包括:
将所述交易数据输入至预先训练的审核模型中,通过所述审核模型对所述交易数据进行标签匹配,得到目标标签;
根据预设规则对所述目标标签对应的权重值进行计算,输出所述嫌疑值。
进一步地,所述训练所述审核模型包括:
获取历史交易数据集,其中,所述历史交易数据集包括样本用户的多个历史交易数据以及各个所述历史交易数据各自对应的标签,所述标签用于表示对应的历史交易数据是否为嫌疑交易数据;
将所述历史交易数据作为决策树模型的输入,所述标签作为所述决策树模型的输出,对所述决策树模型进行训练,得到所述审核模型。
进一步地,所述若所述嫌疑值大于预设阈值,将所述用户确定为嫌疑用户,并加入黑名单中方法还包括:
将所述嫌疑值大于预设阈值的用户确定为嫌疑用户,为所述确定为嫌疑用户设置嫌疑标识:
基于所述嫌疑标识将所述嫌疑用户加入黑名单中,并将所述黑名单存储至区块链将所述用户的嫌疑值存储至区块链中。
进一步地,所述将所述识别数据与第三方数据平台中的存储数据进行匹配,以得到每个所述图片数据的验证结果包括:
获取所述第三方平台的存储数据;
将所述识别数据与所述存储数据进行相似度计算,根据相似度值得到每个所述图片数据的验证结果。
为实现上述目的,本发明实施例还提供了一种交易验证装置,包括:
接收模块,用于接收用户的多个图片数据;
识别模块,用于将每个所述图片数据输入至识别模型中进行识别,得到识别数据;
匹配模块,用于将所述识别数据与第三方数据平台中的存储数据进行匹配,以得到每个所述图片数据的验证结果;
获取模块,用于当多个所述图片数据对应的验证结果均为通过时,获取所述用户的交易数据;
计算模块,用于通过预先训练的审核模型与预设规则分析所述交易数据,得到所述用户的嫌疑值;
确定模块,用于若所述嫌疑值大于预设阈值,将所述用户确定为嫌疑用户,并加入黑名单中。
为实现上述目的,本发明实施例还提供了一种计算机设备,所述计算机设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的交易验证方法的步骤。
为实现上述目的,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如上所述的交易验证方法的步骤。
本发明实施例提供的交易验证方法、装置、计算机设备与计算机可读存储介质,通过对用户的图片数据进行验证,对用户进行初步审核,可以大大加快了反洗钱审核的效率,且,通过审核模型对验证结果为通过的用户进行嫌疑值计算,得到嫌疑值,以此确定是否为嫌疑用户。由传统的人工核验洗钱风险以及识别客户身份信息,交由系统以及客户来完成,有效的减少了中间过程的消耗,同时对于技术的利用也可一定程度上减少差错。
附图说明
图1为本发明交易验证方法实施例一的流程图。
图2为本发明交易验证方法实施例一中步骤S102的流程图.
图3为本发明交易验证方法实施例一中步骤S104的流程图。
图4为本发明交易验证方法实施例一中步骤S108的流程图
图5为本发明交易验证装置实施例二的程序模块示意图。
图6为本发明计算机设备实施例三的硬件结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
参阅图1,示出了本发明实施例一之交易验证方法的步骤流程图。可以理解,本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以计算机设备2为执行主体进行示例性描述。具体如下。
步骤S100,接收用户的多个图片数据。
具体地,可提供线上、线下等多种渠道,采用拍照上传或者扫描的方式由用户上传图片数据,对用户的图片数据进行获取,用户包括公司与个人。当用户为公司时,图片数据包括三证的图片,三证分别是:营业执照、组织机构代码证以及税务登记证。一般采用三证合一的形式进行验证,就是将企业依次申请的工商营业执照、组织机构代码证和税务登记证三证合为一证,提高市场准入效率。用户为个人:通过推送微信消息、短信息等方式触达客户,在统一的客户端验证H5页面获取用户输入的图片数据,可以为人脸图片或者身份证图片。
步骤S102,将每个所述图片数据输入至识别模型中进行识别,得到识别数据。
具体地,若为公司用户可以通过光学字符识别技术(OCR,Optical CharacterRecognition)构建的识别模型对图片数据进行识别,得到识别数据。若为个人用户,可以通过人脸识别模型对图片数据进行人脸识别,人脸识别主要包括四个组成部分,分别为:人脸图像采集及检测、人脸图像预处理、人脸图像特征提取以及匹配与识别。一般采用的人脸识别算法为:基于人脸特征点的识别算法、基于整幅人脸图像的识别算法、基于模板的识别算法、利用神经网络进行识别的算法等算法。
示例性地,参阅图2,所述步骤S102具体包括:
步骤S102A,对所述图片数据进行预处理,得到标准图片。
具体地,预处理主要包括:二值化,噪声去除,倾斜较正等。二值化包括:对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,可以简单的分为前景与背景,为了让计算机更快的,更好的识别文字,需要先对彩色图进行处理,使图片只前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图了。噪声去除:对于不同的文档,对噪声的定义可以不同,根据噪声的特征进行去噪,就叫做噪声去除。倾斜较正:由于一般用户,在拍照文档时,都比较随意,因此拍照出来的图片不可避免的产生倾斜,此时需要进行较正。经过上述一系列预处理后,得到标准图片。
步骤S102B,通过所述识别模型对所述标准图片进行字符识别,得到多个字段信息,所述字段信息为识别数据。
具体地,可以通过模板匹配和特征提取进行字符识别,由于拍照条件的限制,经常造成字符粘连,断笔,因此极大限制了识别系统的性能,这就需要识别模型有字符切割功能。提取后的特征可以通过分类器进行识别,分类器就对其进行分类,输出该特征对应识别成哪个字符。利用谱聚类算法、K近邻算法及K值参数空间自动搜索算法确定对切分的字符进行识别,识别出为哪一个字符,识别后得到图片数据的内容,并且根据特定的语言上下文的关系,对识别结果进行较正,得到识别数据。该步骤中,针对个人用户的图片数据为身份证信息。
步骤S104,将所述识别数据与第三方数据平台中的存储数据进行匹配,以得到每个所述图片数据的验证结果。
具体地,将识别数据与在第三方数据平台中的存储数据进行数据直连,对调取的信息进行相似度匹配,来确定第一用户的真实身份与投保信息的一致性。
示例性地,参阅图3,所述步骤S104具体包括:
步骤S104A,获取所述第三方平台的存储数据。
具体地,为公司的用户的第三方数据平台可以为组织代码中心,与组织代码中心的存储数据进行匹配。为个人的用户的第三方数据平台的存储数据为公安系统人口数据,将识别数据与公安系统人口数据直连进行相似度匹对,来确定用户的真实性。
步骤S104B,将所述识别数据与所述存储数据进行相似度计算,根据相似度值得到每个所述图片数据的验证结果。
具体地,采用的相似度匹配算法不限于余弦相似度计算与曼哈顿距离等,验证结果根据相似度值确定为通过或者不通过,例如相似度值大于百分之80为通过。
步骤S106,当多个所述图片数据对应的验证结果均为通过时,获取所述用户的交易数据。
具体地,当在第三方数据平台中查询到对应的匹配数据时,则验证结果为通过;也可以理解为,相似度阈值大于某值时,验证结果为通过。当身份验证通过时,查询对应的交易记录。若验证结果为不通过,则将该用户确定为嫌疑用户,将其加入黑名单中。交易数据不限于用户的保险投保、退保、理赔的行为数据。
示例性地,所述步骤S106之前,包括:
获取在金融交易过程中产生的原始数据。
具体地,该金融交易过程为用户在进行保险投保、退保、理赔相关等操作时产生的数据,比如交易时间、交易账户、用户信息、交易金额和交易类型等数据。
根据预设的数据清洗规则对所述原始数据进行清洗。
具体地,在获取到原始数据后,根据预设的数据清洗规则对这些原始数据进行清洗。比如:系统每天从银行ODS系统接收交易、客户、账户等原始数据,并运行数据清洗规则对这些数据进行清洗、转换。如将用户所属机构转换为监管登记的机构,将国籍字段清洗为符合GB/T2659-2000世界各国和地区名称代码(将“HK”、“香港”、“中国香港”清洗为“HKG”),将货币代码清洗为符合GB/T12406-1996,ISO-4217的数据(将“RMB”、“人民币”清洗为“CHY”)等等。
采用预设的数据加工模板对清洗后的所述原始数据进行加工,得到交易数据。
具体地,对清洗后的原始数据进行标准化,生成基础数据表,基础数据表可以理解为预设的数据加工模板,具体为根据清洗后的原始数据对应的日期、交易类型及交易渠道,生成基础数据表,以数据表的形式记录交易数据。
步骤S108,通过预先训练的审核模型与预设规则分析所述交易数据,得到所述用户的嫌疑值。
具体地,审核模型进行预先训练,该审核模型进行标签标记,再利用采用预设规则的打分制,每个用户有一个初始分值,根据用户的交易数据对分值做调整,正常的保险行为加分,有洗钱特殊的动作扣分。例如保单存续达到一定期限会加分,客户名下保单频繁退保会扣分。而用户的嫌疑值依据分值来判定,根据不同的业务场景可设定阀值。当达到设定阈值时,将其作为嫌疑用户。
示例性地,参阅图4,所述步骤S108具体包括:
步骤S108A,将所述交易数据输入至预先训练的审核模型中,通过所述审核模型对所述交易数据进行标签匹配,得到目标标签。
具体地,标签包括洗钱、正常,可根据需求进行自定义设置,将交易数据输入审核模型进行标签识别,例如某一单交易的交易值大于一千万,但交易账户为外国账户,交易账户、用户信息均为中小银行,则识别为洗钱活动,标注标签为洗钱,并根据识别到的特征对目标标签进行权重值调节。
步骤S108B,根据预设规则对所述目标标签对应的权重值进行计算,输出所述嫌疑值。
具体地,预设规则为,首先设置初始分值,将目标标签权重值大于预设阈值的洗钱的标签,在初始分值上进行减分操作;将目标标签为正常的标签,在初始分值上进行加分操作,得到用户的嫌疑值。
示例性地,所述训练所述审核模型包括:
获取历史交易数据集,其中,所述历史交易数据集包括样本用户的多个历史交易数据以及各个所述历史交易数据各自对应的标签,所述标签用于表示对应的历史交易数据是否为嫌疑交易数据;
将所述历史交易数据作为决策树模型的输入,所述标签作为所述决策树模型的输出,对所述决策树模型进行训练,得到所述审核模型。
具体地,基于大数据,对用户的交易操作进行训练,可以根据用户的性质不同,设置不同的审核模型,也可以合并进行训练处理,选择洗钱操作中比较明显的特征作为训练节点,例如:交易金额和交易类型等,交易类型可以为退保、投保等,交易金额为大于十万、十万到五十万、五十万到一百万等,输出对应的标签,例如交易类型为投保,交易金额为五十万到一百万,标签为洗钱。
步骤S110,若所述嫌疑值大于预设阈值,将所述用户确定为嫌疑用户,并加入黑名单中。
具体地,若用户的嫌疑值大于预设阈值,则将该用户确定为嫌疑用户,加入黑名单中,以此确定该用户存在洗钱的风险。对于可疑度较低的用户,通过以上用户识别的方式,由用户自主完成身份认证即可;对于可疑度较高的少量用户,交易数据需要做进一步核验。
示例性地,所述步骤S110具体包括:
将所述嫌疑值大于预设阈值的用户确定为嫌疑用户,为所述确定为嫌疑用户设置嫌疑标识。
具体地,预先建立嫌疑标识与黑名单之间的联系,当识别到嫌疑标识后,立即将嫌疑用户加入黑名单中。
基于所述嫌疑标识将所述嫌疑用户加入黑名单中,并将所述黑名单存储至区块链。
具体地,将用户的黑名单及交易数据上传至区块链可保证其安全性和对用户的公正透明性。用户设备可以从区块链中下载得该黑名单及交易数据,以便查证交易数据是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
实施例二
请继续参阅图5,示出了本发明交易验证装置实施例二的程序模块示意图。在本实施例中,交易验证装置20可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述交易验证方法。本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述交易验证装置20在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:
接收模块200,用于接收用户的多个图片数据。
具体地,可提供线上、线下等多种渠道,采用拍照上传或者扫描的方式由用户上传图片数据,对用户的图片数据进行获取,用户包括公司与个人。当用户为公司时,图片数据包括三证的图片,三证分别是:营业执照、组织机构代码证以及税务登记证。一般采用三证合一的形式进行验证,就是将企业依次申请的工商营业执照、组织机构代码证和税务登记证三证合为一证,提高市场准入效率。用户为个人:通过推送微信消息、短信息等方式触达客户,在统一的客户端验证H5页面获取用户输入的图片数据,可以为人脸图片或者身份证图片。
识别模块202,用于将每个所述图片数据输入至识别模型中进行识别,得到识别数据。
具体地,若为公司用户可以通过光学字符识别技术(OCR,Optical CharacterRecognition)构建的识别模型对图片数据进行识别,得到识别数据。若为个人用户,可以通过人脸识别模型对图片数据进行人脸识别,人脸识别主要包括四个组成部分,分别为:人脸图像采集及检测、人脸图像预处理、人脸图像特征提取以及匹配与识别。一般采用的人脸识别算法为:基于人脸特征点的识别算法、基于整幅人脸图像的识别算法、基于模板的识别算法、利用神经网络进行识别的算法等算法。
示例性地,所述识别模块202具体用于:
对所述图片数据进行预处理,得到标准图片。
具体地,预处理主要包括:二值化,噪声去除,倾斜较正等。二值化包括:对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,可以简单的分为前景与背景,为了让计算机更快的,更好的识别文字,需要先对彩色图进行处理,使图片只前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图了。噪声去除:对于不同的文档,对噪声的定义可以不同,根据噪声的特征进行去噪,就叫做噪声去除。倾斜较正:由于一般用户,在拍照文档时,都比较随意,因此拍照出来的图片不可避免的产生倾斜,此时需要进行较正。经过上述一系列预处理后,得到标准图片。
通过所述识别模型对所述标准图片进行字符识别,得到多个字段信息,所述字段信息为识别数据。
具体地,可以通过模板匹配和特征提取进行字符识别,由于拍照条件的限制,经常造成字符粘连,断笔,因此极大限制了识别系统的性能,这就需要识别模型有字符切割功能。提取后的特征可以通过分类器进行识别,分类器就对其进行分类,输出该特征对应识别成哪个字符。利用谱聚类算法、K近邻算法及K值参数空间自动搜索算法确定对切分的字符进行识别,识别出为哪一个字符,识别后得到图片数据的内容,并且根据特定的语言上下文的关系,对识别结果进行较正,得到识别数据。该步骤中,针对个人用户的图片数据为身份证信息。
匹配模块204,用于将所述识别数据与第三方数据平台中的存储数据进行匹配,以得到每个所述图片数据的验证结果。
具体地,将识别数据与在第三方数据平台中的存储数据进行数据直连,对调取的信息进行相似度匹配,来确定第一用户的真实身份与投保信息的一致性。
示例性地,所述匹配模块204具体用于:
获取所述第三方平台的存储数据。
具体地,为公司的用户的第三方数据平台可以为组织代码中心,与组织代码中心的存储数据进行匹配。为个人的用户的第三方数据平台的存储数据为公安系统人口数据,将识别数据与公安系统人口数据直连进行相似度匹对,来确定用户的真实性。
将所述识别数据与所述存储数据进行相似度计算,根据相似度值得到每个所述图片数据的验证结果。
具体地,采用的相似度匹配算法不限于余弦相似度计算与曼哈顿距离等,验证结果根据相似度值确定为通过或者不通过,例如相似度值大于百分之80为通过。
获取模块206,用于当多个所述图片数据对应的验证结果均为通过时,获取所述用户的交易数据。
具体地,当在第三方数据平台中查询到对应的匹配数据时,则验证结果为通过;也可以理解为,相似度阈值大于某值时,验证结果为通过。当身份验证通过时,查询对应的交易记录。若验证结果为不通过,则将该用户确定为嫌疑用户,将其加入黑名单中。交易数据不限于用户的保险投保、退保、理赔的行为数据。
计算模块208,用于通过预先训练的审核模型与预设规则分析所述交易数据,得到所述用户的嫌疑值。
具体地,审核模型进行预先训练,该审核模型进行标签标记,再利用采用预设规则的打分制,每个用户有一个初始分值,根据用户的交易数据对分值做调整,正常的保险行为加分,有洗钱特殊的动作扣分。例如保单存续达到一定期限会加分,客户名下保单频繁退保会扣分。而用户的嫌疑值依据分值来判定,根据不同的业务场景可设定阀值。当达到设定阈值时,将其作为嫌疑用户。
示例性地,所述计算模块208具体用于:
将所述交易数据输入至预先训练的审核模型中,通过所述审核模型对所述交易数据进行标签匹配,得到目标标签。
具体地,标签包括洗钱、正常,可根据需求进行自定义设置,将交易数据输入审核模型进行标签识别,例如某一单交易的交易值大于一千万,但交易账户为外国账户,交易账户、用户信息均为中小银行,则识别为洗钱活动,标注标签为洗钱,并根据识别到的特征对目标标签进行权重值调节。
根据预设规则对所述目标标签对应的权重值进行计算,输出所述嫌疑值。
具体地,预设规则为,首先设置初始分值,将目标标签权重值大于预设阈值的洗钱的标签,在初始分值上进行减分操作;将目标标签为正常的标签,在初始分值上进行加分操作,得到用户的嫌疑值。
示例性地,所述训练所述审核模型包括:
获取历史交易数据集,其中,所述历史交易数据集包括样本用户的多个历史交易数据以及各个所述历史交易数据各自对应的标签,所述标签用于表示对应的历史交易数据是否为嫌疑交易数据;
将所述历史交易数据作为决策树模型的输入,所述标签作为所述决策树模型的输出,对所述决策树模型进行训练,得到所述审核模型。
具体地,基于大数据,对用户的交易操作进行训练,可以根据用户的性质不同,设置不同的审核模型,也可以合并进行训练处理,选择洗钱操作中比较明显的特征作为训练节点,输出对应的标签。
确定模块210,用于若所述嫌疑值大于预设阈值,将所述用户确定为嫌疑用户,并加入黑名单中。
具体地,若用户的嫌疑值大于预设阈值,则将该用户确定为嫌疑用户,加入黑名单中,以此确定该用户存在洗钱的风险。对于可疑度较低的用户,通过以上用户识别的方式,由用户自主完成身份认证即可;对于可疑度较高的少量用户,交易数据需要做进一步核验。
示例性地,所述确定模块210具体用于:
将所述嫌疑值大于预设阈值的用户确定为嫌疑用户,为所述确定为嫌疑用户设置嫌疑标识。
具体地,预先建立嫌疑标识与黑名单之间的联系,当识别到嫌疑标识后,立即将嫌疑用户加入黑名单中。
基于所述嫌疑标识将所述嫌疑用户加入黑名单中,并将所述黑名单存储至区块链。
具体地,将用户的黑名单及交易数据上传至区块链可保证其安全性和对用户的公正透明性。用户设备可以从区块链中下载得该黑名单及交易数据,以便查证交易数据是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
实施例三
参阅图6,是本发明实施例三之计算机设备的硬件架构示意图。本实施例中,所述计算机设备2是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。该计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图6所示,所述计算机设备2至少包括,但不限于,可通过系统总线相互通信连接存储器21、处理器22、网络接口23、以及交易验证装置20。其中:
本实施例中,存储器21至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备2的内部存储单元,例如该计算机设备2的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备2的外部存储设备,例如该计算机设备2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件,例如实施例二的交易验证装置20的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备2的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如运行交易验证装置20,以实现实施例一的交易验证方法。
所述网络接口23可包括无线网络接口或有线网络接口,该网络接口23通常用于在所述服务器2与其他电子装置之间建立通信连接。例如,所述网络接口23用于通过网络将所述服务器2与外部终端相连,在所述服务器2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(Wideband CodeDivision Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。需要指出的是,图6仅示出了具有部件20-23的计算机设备2,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。在本实施例中,存储于存储器21中的所述交易验证装置20还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21中,并由一个或多个处理器(本实施例为处理器22)所执行,以完成本发明。
例如,图5示出了所述实现交易验证装置20实施例二的程序模块示意图,该实施例中,所述交易验证装置20可以被划分为接收模块200、识别模块202、匹配模块204、获取模块206、计算模块208以及确定模块210。其中,本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述所述交易验证装置20在所述计算机设备2中的执行过程。所述程序模块200-210的具体功能在实施例二中已有详细描述,在此不再赘述。
实施例四
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储计算机程序,被处理器执行时实现实施例一的交易验证方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种交易验证方法,其特征在于,包括:
接收用户的多个图片数据;
将每个所述图片数据输入至识别模型中进行识别,得到识别数据;
将所述识别数据与第三方数据平台中的存储数据进行匹配,以得到每个所述图片数据的验证结果;
当多个所述图片数据对应的验证结果均为通过时,获取所述用户的交易数据;
通过预先训练的审核模型与预设规则分析所述交易数据,得到所述用户的嫌疑值;
若所述嫌疑值大于预设阈值,将所述用户确定为嫌疑用户,并加入黑名单中。
2.根据权利要求1所述的交易验证方法,其特征在于,所述将每个所述图片数据输入至识别模型中进行识别,得到识别数据包括:
对所述图片数据进行预处理,得到标准图片;
通过所述识别模型对所述标准图片进行字符识别,得到多个字段信息,所述字段信息为识别数据。
3.根据权利要求1所述的交易验证方法,其特征在于,所述获取所述用户的交易数据之前,包括:
获取在金融交易过程中产生的原始数据;
根据预设的数据清洗规则对所述原始数据进行清洗;
采用预设的数据加工模板对清洗后的所述原始数据进行加工,得到交易数据。
4.根据权利要求1所述的交易验证方法,其特征在于,所述通过预先训练的审核模型与预设规则分析所述交易数据,得到所述用户的嫌疑值包括:
将所述交易数据输入至预先训练的审核模型中,通过所述审核模型对所述交易数据进行标签匹配,得到目标标签;
根据预设规则对所述目标标签对应的权重值进行计算,输出所述嫌疑值。
5.根据权利要求4所述的交易验证方法,其特征在于,所述训练所述审核模型包括:
获取历史交易数据集,其中,所述历史交易数据集包括样本用户的多个历史交易数据以及各个所述历史交易数据各自对应的标签,所述标签用于表示对应的历史交易数据是否为嫌疑交易数据;
将所述历史交易数据作为决策树模型的输入,所述标签作为所述决策树模型的输出,对所述决策树模型进行训练,得到所述审核模型。
6.根据权利要求1所述的交易验证方法,其特征在于,所述若所述嫌疑值大于预设阈值,将所述用户确定为嫌疑用户,并加入黑名单中包括:
将所述嫌疑值大于预设阈值的用户确定为嫌疑用户,为所述确定为嫌疑用户设置嫌疑标识:
基于所述嫌疑标识将所述嫌疑用户加入黑名单中,并将所述黑名单存储至区块链。
7.根据权利要求1所述的交易验证方法,其特征在于,所述将所述识别数据与第三方数据平台中的存储数据进行匹配,以得到每个所述图片数据的验证结果包括:
获取所述第三方平台的存储数据;
将所述识别数据与所述存储数据进行相似度计算,根据相似度值得到每个所述图片数据的验证结果。
8.一种交易验证装置,其特征在于,包括:
接收模块,用于接收用户的多个图片数据;
识别模块,用于将每个所述图片数据输入至识别模型中进行识别,得到识别数据;
匹配模块,用于将所述识别数据与第三方数据平台中的存储数据进行匹配,以得到每个所述图片数据的验证结果;
获取模块,用于当多个所述图片数据对应的验证结果均为通过时,获取所述用户的交易数据;
计算模块,用于通过预先训练的审核模型与预设规则分析所述交易数据,得到所述用户的嫌疑值;
确定模块,用于若所述嫌疑值大于预设阈值,将所述用户确定为嫌疑用户,并加入黑名单中。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述的交易验证方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如权利要求1-7中任一项所述的交易验证方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011039267.3A CN112132693A (zh) | 2020-09-28 | 2020-09-28 | 交易验证方法、装置、计算机设备与计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011039267.3A CN112132693A (zh) | 2020-09-28 | 2020-09-28 | 交易验证方法、装置、计算机设备与计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112132693A true CN112132693A (zh) | 2020-12-25 |
Family
ID=73839551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011039267.3A Pending CN112132693A (zh) | 2020-09-28 | 2020-09-28 | 交易验证方法、装置、计算机设备与计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112132693A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116402512A (zh) * | 2023-05-31 | 2023-07-07 | 无锡锡商银行股份有限公司 | 一种基于人工智能的账户安全排查管理方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109345375A (zh) * | 2018-09-27 | 2019-02-15 | 中国银行股份有限公司 | 一种可疑洗钱行为识别方法及装置 |
CN109615386A (zh) * | 2018-11-28 | 2019-04-12 | 优钱付(浙江)信息科技有限公司 | 循环写入区块链的kyc反洗钱方法、装置、设备及介质 |
CN110046993A (zh) * | 2018-12-15 | 2019-07-23 | 深圳壹账通智能科技有限公司 | 非法所得合法化行为监测方法、系统、计算机装置及介质 |
-
2020
- 2020-09-28 CN CN202011039267.3A patent/CN112132693A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109345375A (zh) * | 2018-09-27 | 2019-02-15 | 中国银行股份有限公司 | 一种可疑洗钱行为识别方法及装置 |
CN109615386A (zh) * | 2018-11-28 | 2019-04-12 | 优钱付(浙江)信息科技有限公司 | 循环写入区块链的kyc反洗钱方法、装置、设备及介质 |
CN110046993A (zh) * | 2018-12-15 | 2019-07-23 | 深圳壹账通智能科技有限公司 | 非法所得合法化行为监测方法、系统、计算机装置及介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116402512A (zh) * | 2023-05-31 | 2023-07-07 | 无锡锡商银行股份有限公司 | 一种基于人工智能的账户安全排查管理方法 |
CN116402512B (zh) * | 2023-05-31 | 2023-08-22 | 无锡锡商银行股份有限公司 | 一种基于人工智能的账户安全排查管理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9946865B2 (en) | Document authentication based on expected wear | |
US10839238B2 (en) | Remote user identity validation with threshold-based matching | |
CN108256591B (zh) | 用于输出信息的方法和装置 | |
CN111178219A (zh) | 票据识别管理方法、装置、存储介质及电子设备 | |
CN112052781A (zh) | 特征提取模型训练方法、人脸识别方法、装置、设备及介质 | |
CN110489415B (zh) | 一种数据更新方法及相关设备 | |
CN111681091A (zh) | 基于时间域信息的金融风险预测方法、装置及存储介质 | |
CN110647896B (zh) | 一种基于logo图像的钓鱼页面识别方法及相关设备 | |
CN112036145A (zh) | 财务报表的识别方法、装置、计算机设备与可读存储介质 | |
CN110766275A (zh) | 数据验证方法、装置、计算机设备及存储介质 | |
US20210272084A1 (en) | System and process for electronic payments | |
CN110795714A (zh) | 一种身份验证方法、装置、计算机设备及存储介质 | |
CN112418167A (zh) | 图像的聚类方法、装置、设备和存储介质 | |
CN111932363A (zh) | 授权书的识别审核方法、装置、设备及系统 | |
CN110647895B (zh) | 一种基于登录框图像的钓鱼页面识别方法及相关设备 | |
CN111126370A (zh) | 一种基于ocr识别结果的最长公共子串自动纠错方法及系统 | |
CN112036488A (zh) | 基于图像识别的事件识别方法、装置、设备及存储介质 | |
CN114090985A (zh) | 区块链中用户操作权限的设置方法、装置和电子设备 | |
CN113792659B (zh) | 文档识别方法、装置及电子设备 | |
CN112132693A (zh) | 交易验证方法、装置、计算机设备与计算机可读存储介质 | |
CN117252429A (zh) | 风险用户的识别方法、装置、存储介质及电子设备 | |
CN110992155A (zh) | 竞标入围处理方法及相关产品 | |
CN112699871A (zh) | 字段内容识别方法、系统、设备及计算机可读存储介质 | |
CN113077355B (zh) | 保险理赔方法、装置、电子设备及存储介质 | |
WO2021174869A1 (zh) | 用户图片数据的处理方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |