CN112053151A - 行为的确定方法及装置、存储介质、电子设备 - Google Patents
行为的确定方法及装置、存储介质、电子设备 Download PDFInfo
- Publication number
- CN112053151A CN112053151A CN202010792353.5A CN202010792353A CN112053151A CN 112053151 A CN112053151 A CN 112053151A CN 202010792353 A CN202010792353 A CN 202010792353A CN 112053151 A CN112053151 A CN 112053151A
- Authority
- CN
- China
- Prior art keywords
- transaction
- behavior
- transaction behavior
- roll
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000006399 behavior Effects 0.000 claims abstract description 348
- 230000015654 memory Effects 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 13
- 238000013145 classification model Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000004069 differentiation Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 8
- 230000000694 effects Effects 0.000 abstract description 6
- 238000012545 processing Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/389—Keeping log of transactions for guaranteeing non-repudiation of a transaction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Technology Law (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种行为的确定方法及装置、存储介质、电子设备。其中,该方法通过获取目标对象的历史交易行为信息;根据历史交易行为信息确定目标对象的历史交易行为的交易行为特征;使用第一模型对交易行为特征进行分析,确定交易行为特征所对应的历史交易行为中是否存在违规交易行为,进而解决了相关技术中违规行为的识别效率不高并且准确率较低的技术问题,达到了提高目标对象的行为识别效率的技术效果。
Description
技术领域
本发明涉及行为分析领域,具体而言,涉及一种行为的确定方法及装置、存储介质、电子设备。
背景技术
银行从业人员具有自己的行为规范,但是依然不排除有部分员工存在违规行为。这就需要对银行从业人员进行违规识别,目前技术中,主要的识别渠道来自客户举报,或者通过简单的规则筛选(比如操作金额超过一定额度)后人工查看交易明细以发现可疑违规行为,然后进一步确认其是否行为违规。这种方式不仅效率低,并且准确率不高。
针对相关技术中如何高效识别目标对象是否存在违规行为,尚不存在较好的解决方案。
发明内容
本发明实施例提供了一种行为的确定方法及装置、存储介质、电子设备,以至少解决相关技术中如何高效识别目标对象是否存在违规行为的技术问题。
根据本发明实施例的一个方面,提供了一种行为的确定方法,包括:
获取目标对象的历史交易行为信息;
根据所述历史交易行为信息确定所述目标对象的历史交易行为的交易行为特征;
使用第一模型对所述交易行为特征进行分析,确定所述交易行为特征所对应的所述历史交易行为中是否存在违规交易行为,其中,所述第一模型为使用多组数据进行训练所得到的,所述多组数据中的每组数据均包括:样本交易行为特征和所述样本交易行为特征的违规标识,其中,所述样本交易行为特征是根据样本对象的样本交易行为信息所确定的,所述违规标识用于指示所述样本交易行为信息所对应的样本交易行为是否是违规交易行为。
根据本发明实施例的另一方面,还提供了一种行为的确定装置,包括:
获取模块,用于获取目标对象的历史交易行为信息;
确定模块,用于根据所述历史交易行为信息确定所述目标对象的历史交易行为的交易行为特征;
分析模块,用于使用第一模型对所述交易行为特征进行分析,确定所述交易行为特征所对应的所述历史交易行为中是否存在违规交易行为,其中,所述第一模型为使用多组数据进行训练所得到的,所述多组数据中的每组数据均包括:样本交易行为特征和所述样本交易行为特征的违规标识,其中,所述样本交易行为特征是根据样本对象的样本交易行为信息所确定的,所述违规标识用于指示所述样本交易行为信息所对应的样本交易行为是否是违规交易行为。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述行为的确定方法。
根据本发明实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过所述计算机程序执行上述的行为的确定方法。
在本发明实施例中,通过获取目标对象的历史交易行为信息;根据历史交易行为信息确定目标对象的历史交易行为的交易行为特征;使用第一模型对交易行为特征进行分析,确定交易行为特征所对应的历史交易行为中是否存在违规交易行为,进而解决了相关技术中违规行为的识别效率不高并且准确率较低的技术问题,达到了提高目标对象的行为识别效率的技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的行为的确定方法的流程图;
图2是根据本发明实施例的行为的确定装置的结构框图;
图3是根据本发明示例实施方式的行为的确定方法的流程示意图;
图4是根据本发明实施例的一种可选的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种行为的确定方法,可选地,作为一种可选的实施方式,本实施例中的行为的确定方法可以通过计算机程序的方式执行,并且,可以应用在终端或者服务器或者类似的运算装置或者电子设备中。示例性的,该运算装置或者电子设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器,还可以包括用于通信功能的传输设备以及输入输出设备。还可以包括比前述更多或者更少的组件,或者具有与前述所示不同的配置。存储器可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的行为的确定方法对应的计算机程序,处理器通过运行存储在存储器内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
示例性的,作为一种可选的实施方式,图1是根据本发明实施例的行为的确定方法的流程图,如图1所示,行为的确定方法包括:
步骤S101,获取目标对象的历史交易行为信息;
步骤S103,根据该历史交易行为信息确定该目标对象的历史交易行为的交易行为特征;
步骤S105,使用第一模型对该交易行为特征进行分析,确定该交易行为特征所对应的该历史交易行为中是否存在违规交易行为,其中,该第一模型为使用多组数据进行训练所得到的,该多组数据中的每组数据均包括:样本交易行为特征和该样本交易行为特征的违规标识,其中,该样本交易行为特征是根据样本对象的样本交易行为信息所确定的,该违规标识用于指示该样本交易行为信息所对应的样本交易行为是否是违规交易行为。
通过上述步骤,获取目标对象的历史交易行为信息;根据历史交易行为信息确定目标对象的历史交易行为的交易行为特征;使用第一模型对交易行为特征进行分析,确定交易行为特征所对应的历史交易行为中是否存在违规交易行为,进而解决了相关技术中违规行为的识别效率不高并且准确率较低的技术问题,达到了提高目标对象的行为识别效率的技术效果。
需要说明的是,本实施例中,样本交易行为特征的确定方式与目标对象的历史交易行为的交易行为特征的确定方法一致,在此不再赘述。
在一个示例性的实施方式中,该根据该历史交易行为信息确定该目标对象的历史交易行为的交易行为特征,包括:
根据该历史交易行为信息确定该目标对象的历史交易行为的第一交易行为特征和第二交易行为特征,其中,该第一交易行为特征用于指示该历史交易行为中的转出交易额与转入交易额的差别,该第二交易行为特征用于指示该历史交易行为中的转出交易额与交易余额的关系。
在一个示例性的实施方式中,该根据该历史交易行为信息确定该目标对象的历史交易行为的第一交易行为特征和第二交易行为特征,包括:
根据该历史交易行为信息确定该历史交易行为中的第一笔转入交易之后的每笔转出交易的第一交易行为子特征和第二交易行为子特征,其中,该第一交易行为特征包括多个第一交易行为子特征,该第二交易行为特征包括多个第二交易行为子特征,该历史交易行为信息中的第一笔转入交易之后的每笔转出交易分别对应了一个第一交易行为子特征和一个第二交易行为子特征;
对于该历史交易行为信息中的第一指定转出交易,该第一指定转出交易的该第一交易行为子特征为第一转出交易额与第一转入交易额的比值,该第一指定转出交易的第二交易行为子特征为该第一转出交易额与第一交易余额的比值;
其中,该第一指定转出交易为历史交易行为中的第一笔转入交易之后的每笔转出交易中的任意一笔转出交易,该第一转出交易额为第一数额与第二数额之和,该第一数额为该历史交易行为信息中,该第一指定转出交易之前与该第一指定转出交易在时间上连续的全部转出交易的转出交易额,该第二数额为该第一指定转出交易的转出交易额,在该第一指定转出交易之前不存在与该第一指定转出交易在时间上连续的转出交易的情况下,该第一数额为零;该第一转入交易额为该第一指定转出交易的上一段在时间上连续的一笔或多笔转入交易的转入交易总额;该第一交易余额为该第一指定转出交易的上一段在时间上连续的全部转入交易之前的交易余额。
需要说明的是,本实施例中所述的一段、上一段等表述,可以指一段在时间上连续发生的同性质的交易,以下举例说明:历史交易行为中,存在着一些在时间上连续发生的转出交易或者转入交易,例如,按照时间的顺序,连续发生了两笔转入交易,之后,又发生了三笔转出交易,之后,又发生了一笔转入交易;则,该时间上连续的两笔转入交易,或者该时间上连续的三笔转出交易,都可以称为“一段”交易,后三笔转出交易的上一段交易即是该两笔转入交易。
在一个示例性的实施方式中,该使用第一模型对该交易行为特征进行分析,确定该交易行为特征所对应的该历史交易行为中是否存在违规交易行为,包括:使用分类模型对该交易行为特征进行分析,得到该交易行为特征所对应的该历史交易行为中的每笔转出交易行为的违规概率评分;在指定转出交易行为所对应的该违规概率评分超过预先设定的评分阈值的情况下,确定该指定转出交易行为是违规交易行为。
在一个示例性的实施方式中,在该使用分类模型对该交易行为特征进行分析,得到该交易行为特征所对应的该历史交易行为中的每笔转出交易行为的违规概率评分之后,该方法还包括:使用模型风险区分能力指标对该每笔转出交易行为的违规概率评分进行筛选;将满足预先设定的条件的该模型风险区分能力指标所对应的违规概率评分作为该评分阈值。
在一个示例性的实施方式中,该目标对象的历史交易行为信息中包括交易行为的目标对象标识信息和交易行为标识信息,其中,该目标对象标识信息用于标识该交易行为的目标对象,该交易行为标识信息用于唯一的标识一个交易行为;
在该使用第一模型对该交易行为特征进行分析,确定该交易行为特征所对应的该历史交易行为中是否存在违规交易行为之后,该行为的确定方法还包括:
在确定该历史交易行为中存在违规交易行为的情况下,根据确定的该违规交易行为的目标对象标识信息和交易行为标识信息分别确定该违规交易行为所对应的目标对象和交易行为。
在一个示例性的实施方式中,在该根据该历史交易行为信息确定该目标对象的历史交易行为的交易行为特征之前,该方法还包括:对获取到的该历史交易行为信息进行信息预处理,其中,该信息预处理用于修正该历史交易行为信息。
在本实施例中还提供了一种行为的确定装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图2是根据本发明实施例的行为的确定装置的结构框图,如图2所示,该装置包括:
获取模块22,用于获取目标对象的历史交易行为信息;
确定模块24,用于根据该历史交易行为信息确定该目标对象的历史交易行为的交易行为特征;
分析模块26,用于使用第一模型对该交易行为特征进行分析,确定该交易行为特征所对应的该历史交易行为中是否存在违规交易行为,其中,该第一模型为使用多组数据进行训练所得到的,该多组数据中的每组数据均包括:样本交易行为特征和该样本交易行为特征的违规标识,其中,该样本交易行为特征是根据样本对象的样本交易行为信息所确定的,该违规标识用于指示该样本交易行为信息所对应的样本交易行为是否是违规交易行为。
通过上述步骤,获取目标对象的历史交易行为信息;根据历史交易行为信息确定目标对象的历史交易行为的交易行为特征;使用第一模型对交易行为特征进行分析,确定交易行为特征所对应的历史交易行为中是否存在违规交易行为,进而解决了相关技术中违规行为的识别效率不高并且准确率较低的技术问题,达到了提高目标对象的行为识别效率的技术效果。
还需要说明的是,本实施例的其他实施方式同上述实施例,此处不再赘述。
示例实施方式
以下结合具体场景对本发明实施例进行进一步解释说明。例如,某银行风险管理相关部门想要找到员工账户代为转账的行为,包括接受他人(对公对私账户)的资金存入员工账户,并由员工操作代为转至第三方,该行为通常具有三个典型特征:1)转入转出间隔时间短,2)转入转出金额差别较小,3)与平时交易金额差别较大。
该方案通过数据挖掘技术,基于员工过去一段时间的交易数据,以及员工违规交易标识,挖掘出有过违规行为的员工交易行为特征,并形成违规行为打分模型,用于员工违规行为发现。考虑到该违规行为同时涉及转入转出交易,并且最终以转出交易结束,因此该技术方案重点关注员工每笔转出交易。具体分为以下几步:
数据获取:
获取该银行的全部员工基本信息(包括员工id、年龄、身份证号、所属分行等),对应的员工交易明细数据,包括员工id、交易id、交易时间、交易金额、交易后余额、交易账号、交易类型、借贷方式、交易对手名称、交易对手账号、交易备注及员工管理资产余额数据,以及违规员工交易记录标识。
数据处理:
对上述数据进行质量检查,舍弃缺失率在50%以上的数据及分布极度不平衡的数据。删除掉员工理财、结息等和客户无关的交易。
特征加工:
基于筛选过的数据,加工出员工交易特征,特征包括两大类,一类是直接获取或者通过简单计算获取,一类是通过迭代算法加工获取。
通过简单计算获取的特征:包括员工年龄、性别、转出交易金额、转出交易后余额、转出交易备注是否有敏感字、上月交易次数与本月交易次数比、上月交易金额与本月交易金额比、当前交易日余额与前一日余额差值、当前交易日余额与前三日交易日余额、上一个月非同名转入交易额、上一个月非同名转入次数、上月管理资产、上月月日均、与上一次交易间隔时常;
通过迭代算法加工获取的特征:
(a)转出交易额与转入交易额差别指数=每一次session内的截至当前累计转出交易额/转入交易额;其中,转出交易额与转入交易额差别指数相当于上述实施例中的第一交易行为特征,该指数为了探索员工截至当前转出交易额与上次转入交易金额差别。该具体的算法说明如下:将数据按员工、交易时间(精确到秒)升序排列,产生一个交易方向及交易金额的序列,如员工ID1对应的数据如下表1所示:
表1
将上表1中每两次相邻的转出交易间的转入交易额汇总,作为加工后的转入交易金额;将截至当前连续转出交易额汇总,作为加工后的转出交易金额。将每一次连续的转出交易和上一次连续的转入交易作为一次session,得到如下表2所示的结果:
表2
然后计算每笔加工后的转出交易额占该session内加工后的转入交易额比值。得到如下表3所示的结果:
表3
(b)转出交易额与平时交易额差别指数=每一次session内的截至当前累计转出交易额/上一个session最后一笔转出交易后的余额;其中,转出交易额与平时交易额差别指数相当于上述实施例中的第二交易行为特征,该指数用于探索员工该次转出交易与平时余额的比值,得到结果如下表4所示:
表4
为了便于理解上述的两个差别指数是如何计算得到的,以下进一步举例说明:
如员工001存在如下表5所示的交易明细:
表5
则,每笔转出交易额与转入交易额差别指数以及每笔转出交易额与平时交易额差别指数如下表6所示:
表6
模型训练与应用:
将加工好的数据(包含员工id、员工转出交易id、上述加工的特征、该笔交易违规标识)分成训练集和测试集,训练集用有监督学习的模型进行模型训练,模型可以选择分类模型,比如逻辑回归、xgboost、xgboost+逻辑回归等。训练出的模型应用到测试集,给每笔转出交易进行违规概率评分。
针对评分,使用挖掘模型ks(Kolmogorov-Smirnov)指标进行阈值筛选,选取ks值最大时对应的评分作为阈值R0。至此模型训练过程完成。
将上述模型应用在按上述特征工程加工好的待评分数据上,即可得到每笔转出交易的违规概率评分,取评分大于R0的交易数据,即为可疑的违规交易。。
相比于当前通过简单规则去筛选的方法,本发明实施例能更全面的覆盖员工的交易行为,并且科学的挖掘出违规行为对应的员工行为特征。该方法识别的可疑违规行为更多,同时依赖计算机的计算效率,会大大提升可疑违规行为识别效率。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
根据本发明实施例的又一个方面,还提供了一种用于实施上述行为的确定方法的电子设备,图4是根据本发明实施例的一种可选的电子设备的结构示意图,如图4所示,该电子设备包括存储器402和处理器404,该存储器402中存储有计算机程序,该处理器404被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取目标对象的历史交易行为信息;
S2,根据该历史交易行为信息确定该目标对象的历史交易行为的交易行为特征;
S3,使用第一模型对该交易行为特征进行分析,确定该交易行为特征所对应的该历史交易行为中是否存在违规交易行为,其中,该第一模型为使用多组数据进行训练所得到的,该多组数据中的每组数据均包括:样本交易行为特征和该样本交易行为特征的违规标识,其中,该样本交易行为特征是根据样本对象的样本交易行为信息所确定的,该违规标识用于指示该样本交易行为信息所对应的样本交易行为是否是违规交易行为。
通过上述步骤,获取目标对象的历史交易行为信息;根据历史交易行为信息确定目标对象的历史交易行为的交易行为特征;使用第一模型对交易行为特征进行分析,确定交易行为特征所对应的历史交易行为中是否存在违规交易行为,进而解决了相关技术中违规行为的识别效率不高并且准确率较低的技术问题,达到了提高目标对象的行为识别效率的技术效果。
可选地,本领域普通技术人员可以理解,图4所示的结构仅为示意,电子设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD、服务器等终端设备。图4其并不对上述电子装置、电子设备的结构造成限定。例如,电子装置、电子设备还可包括比图4中所示更多或者更少的组件(如网络接口等),或者具有与图4所示不同的配置。
其中,存储器402可用于存储软件程序以及模块,如本发明实施例中的行为的确定方法和装置对应的程序指令/模块,处理器404通过运行存储在存储器402内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的行为的确定方法。存储器402可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器402可进一步包括相对于处理器404远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器402具体可以但不限于用于存储物品的样本特征与目标虚拟资源账号等信息。
可选地,上述的传输装置406用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置406包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置406为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子设备还包括:显示器408,用于显示上述待处理的订单信息;和连接总线410,用于连接上述电子设备中的各个模块部件。
在其他实施例中,上述终端设备或者服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点(P2P,Peer To Peer)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
根据本发明的实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取目标对象的历史交易行为信息;
S2,根据该历史交易行为信息确定该目标对象的历史交易行为的交易行为特征;
S3,使用第一模型对该交易行为特征进行分析,确定该交易行为特征所对应的该历史交易行为中是否存在违规交易行为,其中,该第一模型为使用多组数据进行训练所得到的,该多组数据中的每组数据均包括:样本交易行为特征和该样本交易行为特征的违规标识,其中,该样本交易行为特征是根据样本对象的样本交易行为信息所确定的,该违规标识用于指示该样本交易行为信息所对应的样本交易行为是否是违规交易行为。
通过上述步骤,获取目标对象的历史交易行为信息;根据历史交易行为信息确定目标对象的历史交易行为的交易行为特征;使用第一模型对交易行为特征进行分析,确定交易行为特征所对应的历史交易行为中是否存在违规交易行为,进而解决了相关技术中违规行为的识别效率不高并且准确率较低的技术问题,达到了提高目标对象的行为识别效率的技术效果。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种行为的确定方法,包括:
获取目标对象的历史交易行为信息;
根据所述历史交易行为信息确定所述目标对象的历史交易行为的交易行为特征;
使用第一模型对所述交易行为特征进行分析,确定所述交易行为特征所对应的所述历史交易行为中是否存在违规交易行为,其中,所述第一模型为使用多组数据进行训练所得到的,所述多组数据中的每组数据均包括:样本交易行为特征和所述样本交易行为特征的违规标识,其中,所述样本交易行为特征是根据样本对象的样本交易行为信息所确定的,所述违规标识用于指示所述样本交易行为信息所对应的样本交易行为是否是违规交易行为。
2.根据权利要求1所述的行为的确定方法,其特征在于,所述根据所述历史交易行为信息确定所述目标对象的历史交易行为的交易行为特征,包括:
根据所述历史交易行为信息确定所述目标对象的历史交易行为的第一交易行为特征和第二交易行为特征,其中,所述第一交易行为特征用于指示所述历史交易行为中的转出交易额与转入交易额的差别,所述第二交易行为特征用于指示所述历史交易行为中的转出交易额与交易余额的关系。
3.根据权利要求2所述的行为的确定方法,其特征在于,所述根据所述历史交易行为信息确定所述目标对象的历史交易行为的第一交易行为特征和第二交易行为特征,包括:
根据所述历史交易行为信息确定所述历史交易行为中的第一笔转入交易之后的每笔转出交易的第一交易行为子特征和第二交易行为子特征,其中,所述第一交易行为特征包括多个第一交易行为子特征,所述第二交易行为特征包括多个第二交易行为子特征,所述历史交易行为信息中的第一笔转入交易之后的每笔转出交易分别对应了一个第一交易行为子特征和一个第二交易行为子特征;
对于所述历史交易行为信息中的第一指定转出交易,所述第一指定转出交易的所述第一交易行为子特征为第一转出交易额与第一转入交易额的比值,所述第一指定转出交易的第二交易行为子特征为所述第一转出交易额与第一交易余额的比值;
其中,所述第一指定转出交易为历史交易行为中的第一笔转入交易之后的每笔转出交易中的任意一笔转出交易,所述第一转出交易额为第一数额与第二数额之和,所述第一数额为所述历史交易行为信息中,所述第一指定转出交易之前与所述第一指定转出交易在时间上连续的全部转出交易的转出交易额,所述第二数额为所述第一指定转出交易的转出交易额,在所述第一指定转出交易之前不存在与所述第一指定转出交易在时间上连续的转出交易的情况下,所述第一数额为零;所述第一转入交易额为所述第一指定转出交易的上一段在时间上连续的一笔或多笔转入交易的转入交易总额;所述第一交易余额为所述第一指定转出交易的上一段在时间上连续的全部转入交易之前的交易余额。
4.根据权利要求1至3中的任一项所述的行为的确定方法,其特征在于,所述使用第一模型对所述交易行为特征进行分析,确定所述交易行为特征所对应的所述历史交易行为中是否存在违规交易行为,包括:
使用分类模型对所述交易行为特征进行分析,得到所述交易行为特征所对应的所述历史交易行为中的每笔转出交易行为的违规概率评分;
在指定转出交易行为所对应的所述违规概率评分超过预先设定的评分阈值的情况下,确定所述指定转出交易行为是违规交易行为。
5.根据权利要求4所述的行为的确定方法,其特征在于,在所述使用分类模型对所述交易行为特征进行分析,得到所述交易行为特征所对应的所述历史交易行为中的每笔转出交易行为的违规概率评分之后,所述方法还包括:
使用模型风险区分能力指标对所述每笔转出交易行为的违规概率评分进行筛选;
将满足预先设定的条件的所述模型风险区分能力指标所对应的违规概率评分作为所述评分阈值。
6.根据权利要求1所述的行为的确定方法,其特征在于,所述目标对象的历史交易行为信息中包括交易行为的目标对象标识信息和交易行为标识信息,其中,所述目标对象标识信息用于标识所述交易行为的目标对象,所述交易行为标识信息用于唯一的标识一个交易行为;
在所述使用第一模型对所述交易行为特征进行分析,确定所述交易行为特征所对应的所述历史交易行为中是否存在违规交易行为之后,所述行为的确定方法还包括:
在确定所述历史交易行为中存在违规交易行为的情况下,根据确定的所述违规交易行为的目标对象标识信息和交易行为标识信息分别确定所述违规交易行为所对应的目标对象和交易行为。
7.根据权利要求1所述的行为的确定方法,其特征在于,在所述根据所述历史交易行为信息确定所述目标对象的历史交易行为的交易行为特征之前,所述行为的确定方法还包括:
对获取到的所述历史交易行为信息进行信息预处理,其中,所述信息预处理用于修正所述历史交易行为信息。
8.一种行为的确定装置,其特征在于,包括:
获取模块,用于获取目标对象的历史交易行为信息;
确定模块,用于根据所述历史交易行为信息确定所述目标对象的历史交易行为的交易行为特征;
分析模块,用于使用第一模型对所述交易行为特征进行分析,确定所述交易行为特征所对应的所述历史交易行为中是否存在违规交易行为,其中,所述第一模型为使用多组数据进行训练所得到的,所述多组数据中的每组数据均包括:样本交易行为特征和所述样本交易行为特征的违规标识,其中,所述样本交易行为特征是根据样本对象的样本交易行为信息所确定的,所述违规标识用于指示所述样本交易行为信息所对应的样本交易行为是否是违规交易行为。
9.一种计算机可读的存储介质,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行所述权利要求1至7任一项中所述的方法。
10.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010792353.5A CN112053151A (zh) | 2020-08-09 | 2020-08-09 | 行为的确定方法及装置、存储介质、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010792353.5A CN112053151A (zh) | 2020-08-09 | 2020-08-09 | 行为的确定方法及装置、存储介质、电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112053151A true CN112053151A (zh) | 2020-12-08 |
Family
ID=73602548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010792353.5A Pending CN112053151A (zh) | 2020-08-09 | 2020-08-09 | 行为的确定方法及装置、存储介质、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112053151A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113095805A (zh) * | 2021-04-08 | 2021-07-09 | 中国工商银行股份有限公司 | 对象识别方法、装置、计算机系统及可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022921A (zh) * | 2016-05-16 | 2016-10-12 | 杭州铜板街互联网金融信息服务有限公司 | 一种交易数据处理方法及系统 |
CN108629582A (zh) * | 2017-03-17 | 2018-10-09 | 华为软件技术有限公司 | 业务处理方法及装置 |
CN108734573A (zh) * | 2017-04-14 | 2018-11-02 | 腾讯科技(深圳)有限公司 | 一种数据分析方法和装置 |
CN109493086A (zh) * | 2018-10-26 | 2019-03-19 | 中国银联股份有限公司 | 一种确定违规商户的方法及装置 |
CN110163612A (zh) * | 2019-04-02 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 一种支付风控方法及装置 |
-
2020
- 2020-08-09 CN CN202010792353.5A patent/CN112053151A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022921A (zh) * | 2016-05-16 | 2016-10-12 | 杭州铜板街互联网金融信息服务有限公司 | 一种交易数据处理方法及系统 |
CN108629582A (zh) * | 2017-03-17 | 2018-10-09 | 华为软件技术有限公司 | 业务处理方法及装置 |
CN108734573A (zh) * | 2017-04-14 | 2018-11-02 | 腾讯科技(深圳)有限公司 | 一种数据分析方法和装置 |
CN109493086A (zh) * | 2018-10-26 | 2019-03-19 | 中国银联股份有限公司 | 一种确定违规商户的方法及装置 |
CN110163612A (zh) * | 2019-04-02 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 一种支付风控方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113095805A (zh) * | 2021-04-08 | 2021-07-09 | 中国工商银行股份有限公司 | 对象识别方法、装置、计算机系统及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112668859A (zh) | 基于大数据的客户风险评级方法、装置、设备及存储介质 | |
CN109345417B (zh) | 基于身份认证的业务人员的在线考核方法及终端设备 | |
CN107423613A (zh) | 依据相似度确定设备指纹的方法、装置及服务器 | |
CN107784504A (zh) | 客户回访事件的生成方法及终端设备 | |
CN112801498A (zh) | 风险识别模型的训练方法、风险识别方法、装置及设备 | |
CN110717189A (zh) | 数据泄露识别方法、装置及设备 | |
CN108897800A (zh) | 一种管理日志信息的方法、装置及系统 | |
WO2018078761A1 (ja) | クラスタリングシステム、方法およびプログラム、並びに、レコメンドシステム | |
CN111612616A (zh) | 区块链账户评估方法、装置、终端设备及计算机可读介质 | |
CN112437034A (zh) | 虚假终端检测方法和装置、存储介质及电子装置 | |
CN112053151A (zh) | 行为的确定方法及装置、存储介质、电子设备 | |
CN113011886B (zh) | 帐号类型的确定方法和装置及电子设备 | |
CN113011966A (zh) | 基于深度学习的信用评分方法及装置 | |
CN113034295A (zh) | 险种推荐方法、装置、电子设备及存储介质 | |
CN113065748A (zh) | 业务风险评估方法、装置、设备及存储介质 | |
CN112837140A (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN109472457B (zh) | 贷款申请在线面审方法及终端设备 | |
CN109450963B (zh) | 消息推送方法及终端设备 | |
CN113987186A (zh) | 一种基于知识图谱生成营销方案的方法和装置 | |
CN110570301B (zh) | 风险识别方法、装置、设备及介质 | |
CN113487440A (zh) | 模型生成、健康险理赔的确定方法、装置、设备及介质 | |
CN112184410A (zh) | 一种高风险客户识别的方法、系统及存储介质 | |
CN113743838A (zh) | 目标用户识别方法、装置、计算机设备和存储介质 | |
CN111882339A (zh) | 预测模型训练及响应率预测方法、装置、设备及存储介质 | |
CN113313505B (zh) | 异常定位方法、装置及计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |