CN117034067A - 订单类型确定方法、装置、计算机设备和存储介质 - Google Patents
订单类型确定方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN117034067A CN117034067A CN202211150343.7A CN202211150343A CN117034067A CN 117034067 A CN117034067 A CN 117034067A CN 202211150343 A CN202211150343 A CN 202211150343A CN 117034067 A CN117034067 A CN 117034067A
- Authority
- CN
- China
- Prior art keywords
- order
- target
- dimension
- feature
- aggregation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 230000002776 aggregation Effects 0.000 claims abstract description 397
- 238000004220 aggregation Methods 0.000 claims abstract description 397
- 230000002159 abnormal effect Effects 0.000 claims description 203
- 238000012795 verification Methods 0.000 claims description 71
- 238000004364 calculation method Methods 0.000 claims description 47
- 238000010200 validation analysis Methods 0.000 claims description 43
- 230000005856 abnormality Effects 0.000 claims description 36
- 238000004590 computer program Methods 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 19
- 238000012512 characterization method Methods 0.000 claims description 18
- 230000008030 elimination Effects 0.000 claims description 13
- 238000003379 elimination reaction Methods 0.000 claims description 13
- 230000001976 improved effect Effects 0.000 abstract description 9
- 238000004422 calculation algorithm Methods 0.000 description 18
- 238000005516 engineering process Methods 0.000 description 17
- 238000012549 training Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 11
- 238000013473 artificial intelligence Methods 0.000 description 10
- 230000003993 interaction Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000001960 triggered effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000009795 derivation Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
- G06Q30/0635—Processing of requisition or of purchase orders
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Educational Administration (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种订单类型确定方法、装置、计算机设备和存储介质。涉及到支付金融领域,包括:基于目标订单在多个预设订单特征维度下的特征值,得到目标订单的订单特征;基于目标订单的订单特征和历史订单集合中历史订单的订单特征,确定目标订单的聚集度特征值;聚集度特征值,用于表征在按照订单特征进行分布的情况下目标订单与历史订单的聚集程度;将目标订单在至少一个预设订单特征维度下的特征值与聚集度特征值进行组合,得到目标组合特征;利用目标组合特征预测目标订单所属的订单类型。采用本方法能够提高订单类型的预测准确度。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种订单类型确定方法、装置、计算机设备和存储介质。
背景技术
随着计算机和互联网技术的发展,越来越多的采用互联网进行交易,例如,可以通过互联网进行支付以购买商品,随着互联网交易的不断发展,不断的出现异常的交易订单。例如,在社交应用支付中存在异常支付的情况。
传统技术中,为了预测异常的交易订单,通常采用对交易订单进行评分来判断交易是异常的交易订单还是正常的交易订单,然而评分主要依赖经验以及主观因素,评分的可靠性较低,从而导致交易订单的类型的预测准确度较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高订单类型的预测准确度的订单类型确定方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
一方面,本申请提供了一种订单类型确定方法。所述方法包括:基于目标订单在多个预设订单特征维度下的特征值,得到所述目标订单的订单特征;基于所述目标订单的订单特征和历史订单集合中历史订单的订单特征,确定所述目标订单的聚集度特征值;所述聚集度特征值,用于表征在按照订单特征进行分布的情况下,所述目标订单与所述历史订单的聚集程度;所述历史订单集合中包括正常历史订单以及异常历史订单;将所述目标订单在至少一个所述预设订单特征维度下的特征值与所述聚集度特征值进行组合,得到所述目标订单的目标组合特征;利用所述目标组合特征预测所述目标订单所属的订单类型。
另一方面,本申请还提供了一种订单类型确定装置。所述装置包括:订单特征得到模块,用于基于目标订单在多个预设订单特征维度下的特征值,得到所述目标订单的订单特征;聚集度得到模块,用于基于所述目标订单的订单特征和历史订单集合中历史订单的订单特征,确定所述目标订单的聚集度特征值;所述聚集度特征值,用于表征在按照订单特征进行分布的情况下,所述目标订单与所述历史订单的聚集程度;所述历史订单集合中包括正常历史订单以及异常历史订单;组合特征得到模块,用于将所述目标订单在至少一个所述预设订单特征维度下的特征值与所述聚集度特征值进行组合,得到所述目标订单的目标组合特征;订单类型预测模块,用于利用所述目标组合特征预测所述目标订单所属的订单类型。
在一些实施例中,所述目标订单是属于社交应用中的目标对象的订单;所述组合特征得到模块,还用于确定所述目标对象在所述社交应用中的关联对象;基于所述关联对象在指定时间段内的订单异常信息,编码得到所述关联对象的订单异常特征;将所述目标订单在至少一个所述预设订单特征维度下的特征值、所述聚集度特征值以及所述订单异常特征进行组合,得到所述目标订单的目标组合特征。
在一些实施例中,所述聚集度得到模块,还用于基于所述目标订单的订单特征和历史订单集合中历史订单的订单特征,确定所述目标订单在目标聚集度维度下的特征值,得到所述目标订单的聚集度特征值;所述组合特征得到模块,还用于将所述目标订单在目标订单特征维度下的特征值与在所述目标聚集度维度下的特征值进行组合,得到所述目标订单的目标组合特征;所述目标订单特征维度以及所述目标聚集度维度,是对所述多个预设订单特征维度和多个预设聚集度维度进行去冗余处理所得到的。
在一些实施例中,所述装置还包括用于确定所述目标订单特征维度以及所述目标聚集度维度的维度确定模块,所述维度确定模块,用于对于所述历史订单集合中的每个历史订单,采用多个预设聚集度维度分别对应的预设聚集度计算方法,确定所述历史订单在各所述预设聚集度维度下的聚集度特征值;将所述历史订单的订单特征与所述历史订单在各所述预设聚集度维度下的聚集度特征值进行组合,得到所述历史订单的初始组合特征;针对各所述预设聚集度维度以及各所述预设订单特征维度中的每个特征维度,将各所述历史订单的初始组合特征中所述特征维度的特征值进行统计,得到所述特征维度的维度权重;根据维度权重对各所述预设聚集度维度以及各所述预设订单特征维度进行去冗余处理,得到所述目标订单特征维度以及所述目标聚集度维度。
在一些实施例中,所述维度确定模块,还用于按照维度权重从大到小的顺序,从各所述预设聚集度维度以及各所述预设订单特征维度中,选取得到至少一个所述预设订单特征维度和至少一个所述预设聚集度维度,组成特征维度集合;对于所述特征维度集合中的任意两个特征维度,计算所述任意两个特征维度之间的相关度;在所述相关度大于相关度阈值的情况下,将所述任意两个特征维度中的一个特征维度从所述特征维度集合中移除,得到所述目标订单特征维度以及所述目标聚集度维度。
在一些实施例中,所述组合特征得到模块,还用于获取聚集度参考值;所述聚集度参考值,是对多个正常订单的聚集度特征值进行统计得到的;计算所述目标订单对应的聚集度特征值与所述聚集度参考值之间的差值,得到所述目标订单的聚集度差异值;将所述目标订单在目标订单特征维度下的特征值、所述在所述目标聚集度维度下的特征值以及所述目标订单的聚集度差异值进行组合,得到所述目标订单的目标组合特征。
在一些实施例中,所述组合特征得到模块,还用于从所述历史订单集合中确定真实订单类型为正常订单的正常历史订单;采用指定聚集度计算方法计算各所述正常历史订单的聚集度特征值,得到聚集度特征值集合;对所述聚集度特征值集合中的聚集度特征值进行统计,得到所述聚集度参考值。
在一些实施例中,所述目标订单所属的订单类型是基于已训练的异常分数预测模型以及异常分数阈值预测出的;所述订单类型预测模块,还用于将所述目标组合特征输入到所述已训练的异常分数预测模型中,预测得到所述目标订单的订单异常分数;在所述目标订单的订单异常分数大于所述异常分数阈值的情况下,确定所述目标订单所属的订单类型为异常订单。
在一些实施例中,所述装置还包括用于得到所述已训练的异常分数预测模型的模型训练模块,所述模型训练模块,用于对于所述历史订单集合中的每个历史订单,将所述历史订单在所述目标订单特征维度的特征值与所述历史订单在目标聚集度维度下的特征值进行组合,得到所述历史订单的历史组合特征;将各所述历史订单的历史组合特征输入到待训练的异常分数预测模型中,得到各所述历史订单的预测异常分数;基于各所述历史订单的预测异常分数与各所述历史订单的真实异常分数,调整所述异常分数预测模型的模型参数,得到所述已训练的异常分数预测模型。
在一些实施例中,所述模型训练模块,还用于基于各所述历史订单的预测异常分数与各所述历史订单的真实异常分数,调整所述异常分数预测模型的模型参数,得到参数调整后的异常分数预测模型;利用所述参数调整后的异常分数预测模型预测多个验证订单分别所属的订单类型,得到各所述验证订单的预测异常分数;基于所述验证订单的预测异常分数确定所述验证订单的预测订单类型;确定各所述验证订单中真实订单类型为异常订单的验证订单的数量,得到第一订单数量,确定各所述验证订单中预测订单类型和真实订单类型均为异常订单的验证订单的数量,得到第二订单数量;基于所述第一订单数量以及所述第二订单数量,确定所述参数调整后的异常分数预测模型的异常订单覆盖率;在所述异常订单覆盖率大于覆盖率阈值的情况下,将所述参数调整后的异常分数预测模型确定为所述已训练的异常分数预测模型。
在一些实施例中,所述模型训练模块,还用于基于各所述验证订单的预测异常分数进行统计,得到异常分数阈值;基于所述验证订单的预测异常分数和异常分数阈值,确定所述验证订单的预测订单类型;确定各所述验证订单中预测订单类型为异常订单的验证订单的数量,得到第三订单数量;基于所述第三订单数量以及所述第二订单数量,确定所述异常分数阈值的准确度表征值;在所述异常订单覆盖率大于覆盖率阈值且所述异常分数阈值的准确度表征值小于表征值阈值的情况下,将所述参数调整后的异常分数预测模型确定为所述已训练的异常分数预测模型。
在一些实施例中,所述模型训练模块,还用于基于各所述历史订单的预测异常分数与各所述历史订单的真实异常分数,生成各所述历史订单分别对应的订单损失值;确定正常订单权重以及异常订单权重;所述异常订单权重大于所述正常订单权重;利用所述正常订单权重以及所述异常订单权重,对各所述历史订单分别对应的订单损失值进行统计,得到模型损失值;基于所述模型损失值调整所述异常分数预测模型的模型参数,得到所述已训练的异常分数预测模型。
另一方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述订单类型确定方法中的步骤。
另一方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述订单类型确定方法中的步骤。
另一方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述订单类型确定方法中的步骤。
上述订单类型确定方法、装置、计算机设备、存储介质和计算机程序产品,由于历史订单集合中包括正常历史订单以及异常历史订单,聚集度特征值,用于表征在按照订单特征进行分布的情况下目标订单与历史订单的聚集程度,从而聚集度特征值反映了目标订单与正常订单以及异常订单之间的关系,由于目标订单在预设订单特征维度下的特征值反映了目标订单本身的特征,从而基于聚合度特征值以及目标订单在预设订单特征维度下的特征值组成的目标组合特征预测目标订单所属的订单类型,在考虑订单本身的特征的情况下还考虑了目标订单与不同类型的订单之间的关系,提高了订单类型的预测准确度。
附图说明
图1为一些实施例中订单类型确定方法的应用环境图;
图2为一些实施例中订单类型确定方法的流程示意图;
图3为一些实施例中按照订单特征对订单进行分布所得到的分布图;
图4为一些实施例中订单类型确定方法的应用环境图;
图5为一些实施例中订单类型确定方法的流程示意图;
图6为一些实施例中选择特征维度的原理图;
图7为一些实施例中订单类型确定方法的流程示意图;
图8为一些实施例中订单类型确定装置的结构框图;
图9为一些实施例中计算机设备的内部结构图;
图10为一些实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的订单类型确定方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他服务器上。终端102可以安装有社交应用,社交应用包括但不限于是面向个人的即时通讯应用或面向团体的即时通讯应用。终端102上安装的社交应用可以提供有支付功能,从而用户可以利用该支付功能实现交易。服务器104可以为社交应用的后台服务所在的服务器。
具体地,终端102获取通过社交应用提供的支付功能触发的支付操作的情况下,向服务器104发送用于支付的订单,用于支付的订单也可以称为交易订单,以该用于支付的订单为目标订单为例,服务器104接收到终端102发送的目标订单的情况下,可以响应于通过社交应用触发的该目标订单,基于目标订单在多个预设订单特征维度下的特征值,得到目标订单的订单特征,基于目标订单的订单特征和历史订单集合中历史订单的订单特征,确定目标订单的聚集度特征值,将目标订单在至少一个预设订单特征维度下的特征值与聚集度特征值进行组合,得到目标订单的目标组合特征,利用目标组合特征预测目标订单所属的订单类型,在确定目标订单所属的订单类型为异常订单的情况下,通过社交应用进行异常提示,例如,服务器104可以向终端102发送订单异常提示信息,终端102可以将在社交应用中显示该订单异常提示信息。其中,聚集度特征值,用于表征在按照订单特征进行分布的情况下目标订单与历史订单的聚集程度,历史订单集合中包括正常历史订单以及异常历史订单。
其中,终端102可以但不限于是各种台式计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能家电、车载终端、智能语音交互设备、飞行器、智能车载设备等。智能家电可为智能音箱、智能电视、智能空调等,便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
本申请实施例提供的订单类型确定方法可以涉及支付金融技术领域,例如,本申请实施例提供的订单类型确定方法中的历史订单以及目标订单均为支付金融技术领域中的交易订单。
本申请实施例提供的订单类型确定方法可以涉及区块链技术领域,例如,服务器104可以为区块链中的某个节点,服务器104可以将预测出的目标订单所属的订单类型存储到区块链中,服务器104还可以将历史订单集合、历史订单的订单特征、目标订单的订单特征或已训练的异常分数预测模型中的至少一个存储到区块链中。
其中,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
区块链底层平台可以包括基础服务以及智能合约等处理模块。基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能。
平台产品服务层提供典型应用的基本能力和实现框架,开发人员可以基于这些基本能力,叠加业务的特性,完成业务逻辑的区块链实现。应用服务层提供基于区块链方案的应用服务给业务参与方进行使用。
本申请实施例提供的订单类型确定方法可以涉及人工智能领域。例如,服务器104可以利用已训练的异常分数预测模型预测得到目标订单所属的订单类型,异常分数预测模型属于人工智能领域中的神经网络模型。
其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供的方案涉及人工智能的机器学习等技术,具体通过如下实施例进行说明:
在一些实施例中,如图2所示,提供了一种订单类型确定方法,该方法可以由终端或服务器执行,还可以由终端和服务器共同执行,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
步骤202,基于目标订单在多个预设订单特征维度下的特征值,得到目标订单的订单特征。
其中,社交应用包括但不限于是面向个人的即时通讯应用或面向团体的即时通讯应用。目标订单可以是由目标对象登录的社交应用触发的,目标订单属于该目标对象。目标订单是在社交应用中触发的进行资源转移的订单,例如目标订单包括但不限于好友转账、扫码转账、发红包等的进行资源转移的订单。资源是指存在于电子账户中、能够进行流通的资源,例如能够通过账户在互联网上进行流通的资源。账户可以包括银行卡号或互联网支付账号中的至少一个。资源可以包括账户中的资金、虚拟红包、游戏币或虚拟物品等。资源转移是指将资源从一个账户转移到另一个账号,例如从一个对象登录的社交应用中的支付账号转移到另外一个对象登录的社交应用中的支付账号。
预设订单特征维度为多个,多个是指至少两个,预设订单特征维度是与订单的资源转出方、资源转入方、资源转入方与资源转出方之间的关系相关的特征维度,资源转出方例如为支付方,资源转入方例如为收款方,资源转出方相关的特征维度包括但不限于是支付方的基本账户信息、支付方的资金流水、销赃行为等中的至少一个,资源转入方相关的特征维度包括但不限于是收款方的基本账户信息、支付方与收款方之间的亲密程度、支付方的资金流水、销赃行为等中的至少一个。资源转入方与资源转出方之间的关系相关的特征维度包括但不限于是支付方与收款方之间的亲密程度,支付方与收款方之间的亲密程度可以根据支付方与收款方之间的亲属关系或社交关系中的至少一个确定,社交关系包括但不限于是线下的互动或线上的互动,线上的互动例如可以是电话互动、短信互动或在社交应用中的互动,例如,在社交应用中的互动程度越大,则亲密程度越大。在预设订单特征维度下的特征值是指预设订单特征维度的取值。目标订单的订单特征包括目标订单在多个预设订单特征维度下的特征值。具体地,服务器在确定社交应用触发了目标订单的情况下,可以确定目标订单在多个预设订单特征维度下的数据,分别对各预设订单特征维度下的数据进行编码得到各预设订单特征维度下的特征值,将得到的各特征值组合得到目标订单的订单特征。例如,该多个预设订单特征维度分别为支付方的账户名称、收款方的账户名称、支付金额,目标订单中支付方的账户名称为“张三”,收款方的账户名称为“李四”,支付金额的100元人民币,则服务器可以对“张三”、“李四”、“100”进行编码,得到“张三”、“李四”、“100”分别对应的特征值,将“张三”的特征值、“李四”的特征值、“100”的特征值组合得到目标订单的订单特征。
在一些实施例中,服务器可以根据预设订单特征维度下的数据的数据类型,对预设订单特征维度下的数据进行编码,预设订单特征维度下的数据可以包括数值型的数据,还可以包括非数值型的数据,数值型分为连续型和离散型,非数值型分为类别型和顺序型。在数据的数据类型为非数值型的情况下,服务器可以采用one-hot encoding(独热编码)方法进行编码,得到该数据对应的特征值。若数据的数据类型为数值型,则服务器可以对数据进行归一化处理,将归一化后的结果作为该数据对应的特征值。在得到各预设订单特征维度下的数据分别对应的特征值的情况下,服务器可以将各预设订单特征维度下的数据分别对应的特征值进行组合得到目标订单的订单特征。
步骤204,基于目标订单的订单特征和历史订单集合中历史订单的订单特征,确定目标订单的聚集度特征值;聚集度特征值,用于表征在按照订单特征进行分布的情况下,目标订单与历史订单的聚集程度;历史订单集合中包括正常历史订单以及异常历史订单。
其中,正常历史订单是指真实的订单类型为正常订单的历史订单,异常历史订单是指真实的订单类型为异常订单的历史订单。历史订单集合中正常历史订单多于异常历史订单。正常订单是指合理合法的订单,例如合理合法的交易订单,异常订单是指存在不合理或不合法问题的订单,例如存在社交欺诈问题的交易订单。社交欺诈例如可以是黑产诱导用户社交应用支付场景进行支付。
历史订单集合中的各历史订单的真实订单类型是已知的。例如,可以为每个历史订单设置订单类型标签,历史订单的订单类型标签为1,则表示历史订单的真实订单类型为异常订单,历史订单的订单类型标签为0,则表示历史订单的真实订单类型为正常订单。例如,L={(x1,y1),...,(xn,yn)}∈Rn×d表示设置有订单类型标签的各历史订单的订单特征组成的集合,其中,xn代表历史订单集合中第n个历史订单的订单特征,yn代表第n个历史订单的订单类型标签,d代表订单特征的维度。历史订单集合中的各历史订单的订单特征构成的特征空间可以称为原始特征空间,例如,若历史订单集合包括n个历史订单,每个历史订单的订单特征包括d个数据点,则原始特征空间表示n个具有d个特征的数据点的集合。
目标订单的聚集度特征值,用于表征在按照订单特征进行分布的情况下,目标订单与历史订单集合中的历史订单的聚集程度,例如,可以按照目标订单的订单特征和历史订单的订单特征,将目标订单和历史订单集合中的各历史订单进行分布,得到分布图,目标订单的聚集度特征值则表征了在分布图中目标订单与周围的历史订单的聚集程度。如图3所示,展示了按照订单特征对订单进行分布所得到的分布图。其中,周围的历史订单可以是分布图中与目标订单距离较近的k个历史订单,k为大于等于1的正整数,可以根据需要设置,例如可以为10或50等。聚集度特征值越小,则表征聚集程度越大,聚集度特征值越大,则表征聚集程度越小,即聚集度特征值与聚集程度成负相关关系,例如聚集度特征值可以为离群值。
目标订单的聚集度特征值可以为一个或多个,多个是指至少两个,目标订单的各聚集度特征值可以是采用不同的预设聚集度计算方法分别计算出的,预设聚集度计算方法是能够计算聚集度特征值的方法,例如可以是能够计算离群值的离群值检测函数,预设聚集度计算方法或离群值检测函数包括但不限于是KNN(K Nearest Neighbors,K最邻近)算法、K-mean(k均值聚类)算法、Avg-KNN算法、One-Class SVM(单分类支持向量机,One-ClassSupport Vector Machine)算法、孤立森林等。
具体地,服务器可以利用多个预设聚集度计算方法中的每个预设聚集度计算方法,计算目标订单的聚集度特征值,得到目标订单的多个聚集度特征值。预设聚集度计算方法与预设聚集度维度一一对应,预设聚集度计算方法计算出的聚集度特征值,为该预设聚集度计算方法对应的预设聚集度维度下的特征值。
在一些实施例中,目标订单的聚集度特征值也可以是利用目标聚集度计算方法计算出的聚集度特征值,目标聚集度计算方法属于该多个预设聚集度计算方法。目标订单的订单特征可以称为目标订单特征,历史订单的订单特征可以称为历史订单特征,以目标聚集度计算方法为K-mean为例,聚集度特征值为离群值为例,采用目标聚集度计算方法计算聚集度特征值的过程例如为:服务器可以计算目标订单特征与每个历史订单特征之间的特征差值,按照特征差值从小到大的顺序对特征差值进行排列,得到特征差值序列,特征差值越小,则特征差值在特征差值序列中的位置越靠前。服务器可以特征差值序列中获取排列在前的预设数量的特征差值,对获取的特征差值进行均值计算,将计算的结果确定为目标订单的聚集度特征值。
步骤206,将目标订单在至少一个预设订单特征维度下的特征值与聚集度特征值进行组合,得到目标订单的目标组合特征。
具体地,服务器可以将目标订单在至少一个预设订单特征维度下的特征值,与目标订单在至少一个预设聚集度维度下的特征值进行组合,得到目标订单的目标组合特征。例如,可以将目标订单在各预设订单特征维度下的特征值与目标订单在各预设聚集度维度下的特征值进行组合,得到目标订单的目标组合特征。
在一些实施例中,目标订单是属于社交应用中的目标对象的订单,服务器可以确定目标对象在社交应用中的关联对象,基于关联对象在指定时间段内的订单异常信息,编码得到关联对象的订单异常特征,将目标订单在至少一个预设订单特征维度下的特征值、目标订单在至少一个预设聚集度维度下的特征值以及关联对应的订单异常特征进行组合,得到目标订单的目标组合特征。
在一些实施例中,服务器可以获取聚集度参考值,该聚集度参考值,是对多个正常订单的聚集度特征值进行统计得到的,服务器可以计算目标订单对应的聚集度特征值与聚集度参考值之间的差值,得到目标订单的聚集度差异值,服务器可以将目标订单在至少一个预设订单特征维度下的特征值、目标订单在至少一个预设聚集度维度下的特征值以及目标订单的聚集度差异值进行组合,得到目标订单的目标组合特征。
在一些实施例中,服务器可以将目标订单在至少一个预设订单特征维度下的特征值、目标订单在至少一个预设聚集度维度下的特征值、关联对象的订单异常特征、目标订单的聚集度差异值进行组合,得到目标订单的目标组合特征。
在一些实施例中,服务器可以将目标订单在目标订单特征维度下的特征值,与目标订单在目标聚集度维度下的特征值进行组合,得到目标订单的目标组合特征。其中,目标订单特征维度为至少一个,目标聚集度维度为至少一个,目标订单特征维度以及目标聚集度维度,是对各预设订单特征维度和个预设聚集度维度进行去冗余处理所得到的。例如,服务器可以利用采用贪婪算法选择预设聚集度维度以对增广特征空间进行剪枝,从而控制计算复杂度,提高预测的准确性。增广特征空间是指在订单特征的基础上扩展其他特征后的特征空间,其他特征包括但不限于是聚集度特征值。
在一些实施例中,服务器可以将目标订单在目标订单特征维度下的特征值、目标订单在目标聚集度维度下的特征值、关联对象的订单异常特征进行组合,得到目标订单的目标组合特征。
在一些实施例中,服务器可以将目标订单在目标订单特征维度下的特征值、在目标聚集度维度下的特征值以及目标订单的聚集度差异值进行组合,得到目标订单的目标组合特征。
在一些实施例中,服务器可以将目标订单在目标订单特征维度下的特征值、目标订单在目标聚集度维度下的特征值、关联对象的订单异常特征、目标订单的聚集度差异值进行组合,得到目标订单的目标组合特征。
步骤208,利用目标组合特征预测目标订单所属的订单类型。
其中,目标订单所属的订单类型可以是基于已训练的异常分数预测模型预测出的,异常分数预测模型是用于预测订单类型的神经网络模型。异常分数预测模型可以是通过对待训练的异常分数预测模型进行训练得到的。异常分数预测模型用于预测目标订单的订单异常分数,订单异常分数表征目标订单属于异常订单的概率,订单异常分数越大,则目标订单属于异常订单的概率越大。
具体地,服务器可以将目标组合特征输入到已训练的异常分数预测模型中,预测得到目标订单对应的订单异常分数,在目标订单的订单异常分数大于异常分数阈值的情况下,服务器可以确定目标订单所属的订单类型为异常订单。
在一些实施例中,在确定目标订单所属的订单类型为异常订单的情况下,服务器还可以干预目标订单,干预目标订单包括但不限于是拦截目标订单或异常提示中的至少一个。例如,在确定目标订单所属的订单类型为异常订单的情况下,服务器可以通过社交应用进行异常提示,例如可以目标订单所属的目标对象所登录的社交应用中,显示表示目标订单存在异常的异常提示信息。在确定目标订单所属的订单类型为异常订单的情况下,服务器还可以拦截目标订单,例如中止执行与目标订单相关的后续业务,例如中止目标订单对应的支付业务。如图4所示,终端的社交应用触发订单,服务器利用数据库中存储的异常分数预测模型预测订单的订单异常分数,在确定订单为异常订单的情况下,向终端发送异常提示信息,终端在社交应用中显示异常提示信息即“订单存在异常”。
在一些实施例中,服务器可以结合订单异常分数和目标订单的订单特征确定是否干预订单,如图5所示,目标订单例如为图5中的新交易订单,特征层面环节生成目标订单的目标组合特征,模型实时预测环节利用异常分数预测模型对目标组合特征进行异常分数预测,输出订单恶意评分,订单恶意评分表示订单异常分数,订单恶意评分越大,订单异常分数越大,实时策略引擎环节,将订单恶意评分与异常分数阈值进行对比,在订单恶意评分大于异常分数阈值的情况下,进入判断订单恶意程度的环节,判断订单恶意程度的环节中,根据订单特征确定目标订单的恶意程度,在恶意程度达到指定恶意程度的情况下,拦截或提醒订单,恶意程度可以与订单中的交易金额成正相关关系,指定恶意程度可以预设。
上述订单类型确定方法中,由于历史订单集合中包括正常历史订单以及异常历史订单,聚集度特征值,用于表征在按照订单特征进行分布的情况下目标订单与历史订单的聚集程度,从而聚集度特征值反映了目标订单与正常订单以及异常订单之间的关系,由于目标订单在预设订单特征维度下的特征值反映了目标订单本身的特征,从而基于聚合度特征值以及目标订单在预设订单特征维度下的特征值组成的目标组合特征预测目标订单所属的订单类型,在考虑订单本身的特征的情况下还考虑了目标订单与不同类型的订单之间的关系,提高了订单类型的预测准确度。
在一些实施例中,目标订单是属于社交应用中的目标对象的订单;将目标订单在至少一个预设订单特征维度下的特征值与聚集度特征值进行组合,得到目标订单的目标组合特征包括:确定目标对象在社交应用中的关联对象;基于关联对象在指定时间段内的订单异常信息,编码得到关联对象的订单异常特征;将目标订单在至少一个预设订单特征维度下的特征值、聚集度特征值以及订单异常特征进行组合,得到目标订单的目标组合特征。
其中,目标对象是社交应用中的用户,目标对象登录社交应用,可以在社交应用触发目标订单,即目标订单是在目标对象登录的社交应用中触发的订单。目标对象在社交应用中的关联对象是指在社交应用中与目标对象之间存在交互的对象。目标对象在社交应用中的关联对象包括但不限于是社交应用中目标对象的好友或目标对象关注的用户中的至少一种。指定时间段可以根据需要设置,例如,可以为最近1周、最近1个月或最近6个月等中的任意一个,订单异常信息包括但不限于是异常订单发生的频率、异常订单的数量或触发异常订单的时间点等中的至少一个。
具体地,服务器可以对关联对象在指定时间段内的订单异常信息进行编码,得到关联对象的订单异常特征,服务器可以根据订单异常信息中的数据的数据类型,对订单异常信息中包括的数据进行编码,订单异常信息可以包括数值型的数据,还可以包括非数值型的数据,数值型分为连续型和离散型,非数值型分为类别型和顺序型。在数据的数据类型为非数值型的情况下,服务器可以采用one-hot encoding(独热编码)方法进行编码,得到该数据对应的特征值。若数据的数据类型为数值型,则服务器可以对数据进行归一化处理,将归一化后的结果作为该数据对应的特征值。在得到订单异常信息中各数据分别对应的特征值的情况下,服务器可以将各数据分别对应的特征值进行组合为订单异常特征。
在一些实施例中,服务器可以将目标订单在至少一个预设订单特征维度下的特征值、聚集度特征值以及订单异常特征进行组合,得到目标订单的目标组合特征。服务器可以将目标订单在目标订单特征维度下的特征值、目标订单在目标聚集度维度下的聚集度特征值、关联对象的订单异常特征进行组合,得到目标订单的目标组合特征。
在一些实施例中,服务器可以获取聚集度参考值;聚集度参考值,是对多个正常订单的聚集度特征值进行统计得到的,计算目标订单对应的聚集度特征值与聚集度参考值之间的差值,得到目标订单的聚集度差异值。服务器可以将目标订单在目标订单特征维度下的特征值、目标订单在目标聚集度维度下的聚集度特征值、目标订单的聚集度差异值、关联对象的订单异常特征进行组合,得到目标订单的目标组合特征。
本实施例中,将目标订单在至少一个预设订单特征维度下的特征值、聚集度特征值以及订单异常特征进行组合,得到目标订单的目标组合特征,由于订单异常特征是基于关联对象在指定时间段内的订单异常信息编码得到的,故订单异常特征反映了关联对象的发生异常订单的情况,而由于目标对象在社交应用中的关联对象是与目标对象在社交应用中具有交互的对象,从而关联对象与目标对象在发生异常订单的情况上具有一定的关联性,故结合关联对象的订单异常特征得到目标组合特征,可以丰富目标组合特征所表达的信息量,从而提高订单类型的预测准确度。
在一些实施例中,基于目标订单的订单特征和历史订单集合中历史订单的订单特征,确定目标订单的聚集度特征值包括:基于目标订单的订单特征和历史订单集合中历史订单的订单特征,确定目标订单在目标聚集度维度下的特征值,得到目标订单的聚集度特征值;将目标订单在至少一个预设订单特征维度下的特征值与聚集度特征值进行组合,得到目标订单的目标组合特征包括:将目标订单在目标订单特征维度下的特征值与在目标聚集度维度下的特征值进行组合,得到目标订单的目标组合特征;目标订单特征维度以及目标聚集度维度,是对多个预设订单特征维度和多个预设聚集度维度进行去冗余处理所得到的。
其中,多个预设订单特征维度是指至少两个预设订单特征维度,例如为3或6个。预设订单特征维度与预设聚集度计算方法一一对应方法,预设订单特征维度不同,则预设订单特征维度对应的预设聚集度计算方法也不同。聚集度计算方法是用于计算聚集度特征值的方法,预设聚集度计算方法是预先选取的聚集度计算方法,该多个预设聚集度计算方法包括但不限于是KNN(K Nearest Neighbors,K最邻近)算法、K-mean(k均值聚类)算法、Avg-KNN算法、One-Class SVM(单分类支持向量机,One-Class Support Vector Machine)算法、孤立森林中的至少两种。目标聚集度维度是从该多个预设订单特征维度中选出的,目标聚集度维度为一个或多个,多个是指至少两个。
由于目标订单的订单特征,是通过将目标订单在该多个预设订单特征维度下的特征值进行组合所得到的特征。故将历史订单的订单特征与历史订单在各预设聚集度维度下的聚集度特征值进行组合,相当于是将目标订单在该多个预设订单特征维度下的特征值、历史订单在各预设聚集度维度下的聚集度特征值进行组合。
具体地,每个预设聚集度维度和每个预设订单特征维度分别为一个特征维度。针对各预设聚集度维度以及各预设订单特征维度中的每个特征维度,服务器可以将各历史订单的初始组合特征中特征维度的特征值进行统计,得到各特征维度分别对应的维度权重,利用各特征维度分别对应的维度权重,对各预设订单特征维度和各预设聚集度维度进行去冗余处理,例如服务器可以按照维度权重从大到小的顺序,从各预设聚集度维度以及各预设订单特征维度中去除维度权重较小的特征维度,将剩下的预设订单特征维度确定为目标订单特征维度,将剩下的预设聚集度维度确定为目标聚集度维度。
在一些实施例中,对于历史订单集合中的每个历史订单,服务器可以采用多个预设聚集度维度分别对应的预设聚集度计算方法,确定历史订单在各预设聚集度维度下的聚集度特征值,将历史订单的订单特征与历史订单在各预设聚集度维度下的聚集度特征值进行组合,得到历史订单的初始组合特征。从而实现了对原始特征空间的扩充。可以将各历史订单在各预设聚集度维度下的聚集度特征值采用矩阵表示,例如可以利用矩阵Φ(X)=[Φ1(X)T,...,ΦK(X)T]∈Rn×K表示,其中X代表各历史订单的订单特征,K代表预设聚集度维度的种类,这K类预设聚集度维度分别对应不同的预设聚集度计算方法。ΦK(X)T代表各历史订单在第K个预设聚集度维度下的聚集度特征值组合的向量。在原始特征空间的基于上可以利用矩阵Φ(X)进行扩充,从而得到增广特征空间,增广特征空间包括原始特征空间中的数据以及矩阵Φ(X)中的数据。例如,增广特征空间Xnew可以表示为Xnew=[X,S]∈Rn×(d+K),其中,Xnew代表增广特征空间,X代表原始特征空间,S即上述的Φ(X),即S中包括各历史订单的各聚集度特征值。
例如,历史订单集合包括3个历史订单,分别为历史订单1、历史订单2和历史订单3,共有2种预设聚集度维度,分别为预设聚集度维度1和预设聚集度维度2,预设聚集度维度1对应的预设聚集度计算方法为KNN算法,预设聚集度维度2对应的预设聚集度计算方法为K-mean算法,则对于历史订单1来说,服务器可以利用KNN算法计算得到历史订单1在预设聚集度维度1下的聚集度特征值,利用K-mean算法计算得到历史订单1在预设聚集度维度2下的聚集度特征值,对于历史订单2来说,服务器可以利用KNN算法计算得到历史订单2在预设聚集度维度1下的聚集度特征值,利用K-mean算法计算得到历史订单2在预设聚集度维度2下的聚集度特征值,对于历史订单3来说,服务器可以利用KNN算法计算得到历史订单3在预设聚集度维度1下的聚集度特征值,利用K-mean算法计算得到历史订单3在预设聚集度维度2下的聚集度特征值。对于历史订单1来说,服务器可以将历史订单1的订单特征、历史订单1在预设聚集度维度1下的聚集度特征值、历史订单1在预设聚集度维度2下的聚集度特征值进行组合,得到历史订单1的初始组合特征。针对各预设聚集度维度以及各预设订单特征维度中的每个特征维度,服务器可以将各历史订单的初始组合特征中该特征维度的特征值进行统计,得到该特征维度对应的维度权重。
在一些实施例中,服务器可以将目标订单在目标订单特征维度下的特征值与在目标聚集度维度下的聚集度特征值进行组合,得到目标订单的目标组合特征。
本实施例中,由于目标订单特征维度以及目标聚集度维度,是对多个预设订单特征维度和多个预设聚集度维度进行去冗余处理所得到的,从而在结合两种特征维度进行订单类型预测的情况下,降低了特征维度的冗余,从而降低了数据复杂度,提高了计算效率。
在一些实施例中,确定目标订单特征维度以及目标聚集度维度的步骤包括:对于历史订单集合中的每个历史订单,采用多个预设聚集度维度分别对应的预设聚集度计算方法,确定历史订单在各预设聚集度维度下的聚集度特征值;将历史订单的订单特征与历史订单在各预设聚集度维度下的聚集度特征值进行组合,得到历史订单的初始组合特征;针对各预设聚集度维度以及各预设订单特征维度中的每个特征维度,将各历史订单的初始组合特征中特征维度的特征值进行统计,得到特征维度的维度权重;根据维度权重对各预设聚集度维度以及各预设订单特征维度进行去冗余处理,得到目标订单特征维度以及目标聚集度维度。
其中,维度权重与缺少率或信息价值(Infromation Value,IV)中的至少一个相关,例如,维度权重与缺少率成负相关关系,维度权重与信息价值成正相关关系。
具体地,针对各预设聚集度维度以及各预设订单特征维度中的每个特征维度,将各历史订单的初始组合特征中特征维度的特征值进行统计,得到特征维度的维度权重,例如,服务器可以从各初始组合特征中获取该特征维度下的特征值,基于获取的各特征值确定该特征维度下的特征值的缺失率,基于缺失率确定维度权重,维度权重与缺失率成负相关关系,服务器可以将各特征维度中维度权重较小的特征维度去除,将剩余的预设订单特征维度作为目标订单特征维度,将剩余的预设聚集度维度确定为目标聚集度维度。
在一些实施例中,针对每个特征维度,服务器可以从各初始组合特征中获取该特征维度下的特征值,基于获取的各特征值确定该特征维度下的特征值的信息价值,基于信息价值确定维度权重,维度权重与信息价值成正相关关系。
在一些实施例中,维度权重与缺少率成负相关关系,且维度权重与信息价值成正相关关系,服务器可以将各特征维度中维度权重较小的特征维度去除,从而去掉高缺失率和低信息价值的特征维度,剩余的特征维度的数量可以是预先设置好的,即去除的特征维度的个数也是预先设置好的,例如剩余的特征维度的数量为p个,例如,各预设聚集度维度为K个,各预设订单特征维度为d个,则服务器可以计算从(d+K)个特征维中去掉高缺失率和低信息价值的特征,留下p个特征维度。
本实施例中,针对每个特征维度,将各历史订单的初始组合特征中该特征维度下的特征值进行统计,得到该特征维度的维度权重,提高了维度权重的准确度。
在一些实施例中,根据维度权重对各预设聚集度维度以及各预设订单特征维度进行去冗余处理,得到目标订单特征维度以及目标聚集度维度包括:按照维度权重从大到小的顺序,从各预设聚集度维度以及各预设订单特征维度中,选取得到至少一个预设订单特征维度和至少一个预设聚集度维度,组成特征维度集合;对于特征维度集合中的任意两个特征维度,计算任意两个特征维度之间的相关度;在相关度大于相关度阈值的情况下,将任意两个特征维度中的一个特征维度从特征维度集合中移除,得到目标订单特征维度以及目标聚集度维度。
其中,相关度阈值可以根据预设,例如为0.8,相关度越大,则表示两个特征维度下的特征所表达的信息越相似。
具体地,服务器可以按照维度权重从大到小的顺序,对各预设聚集度维度以及各预设订单特征维度进行排列,得到特征维度序列,维度权重越大,特征维度在特征维度序列中的位置越靠前。服务器可以将特征维度序列中排列在指定位置之后的特征维度,从各预设聚集度维度以及各预设订单特征维度中移除,但是,若特征维度序列中,所有的预设聚集度维度均排列在指定位置之后,则不移除指定位置之后的第一个预设聚集度维度,同样的,若特征维度序列中,所有的预设订单特征维度均排列在指定位置之后,则不移除指定位置之后的第一个预设订单特征维度,将剩余的各预设订单特征维度以及剩余的各预设聚集度维度组成特征维度集合。其中,剩余的特征维度的数量可以是预先设置好的,即去除的特征维度的个数也是预先设置好的,例如剩余的特征维度的数量为s个。指定位置可以根据需要设置或者预先设置。
在一些实施例中,对于特征维度集合中的任意两个特征维度,服务器可以计算任意两个特征维度之间的相关度,在相关度大于相关度阈值的情况下,将任意两个特征维度中的一个特征维度从特征维度集合中移除,例如,可以将该两个特征维度中的维度权重较小的一个特征维度移除,或者将该两个特征维度中信息价值较低的一个特征维度移除,或者,根据特征维度的类型选择移除的特征维度,例如,若该两个特征维度分别为一个预设聚集度维度和一个预设订单特征维度,则可以将该两个特征维度中的预设聚集度维度移除或者预设订单特征维度移除,以保证移除后剩余的特征维度中包括至少一个预设订单特征维度和至少一个预设聚集度维度,服务器可以将移除后特征维度集合中剩余的各预设订单特征维度分别作为目标订单特征维度,将剩余的各预设聚集度维度分别作为目标聚集度维度。其中,相关度阈值可以根据需要设置或者预先设置。
在一些实施例中,在相关度大于相关度阈值的情况下,服务器可以将该任意两个特征维度中信息价值较低的一个特征维度从特征维度集合中移除。例如,特征维度集合中包括p个特征维度,特征维度集合中的2个特征维度的相关度>=0.8,则留下信息价值较高的特征,最后留下s维特征。
本实施例中,在相关度大于相关度阈值的情况下,将任意两个特征维度中的一个特征维度从特征维度集合中移除,得到目标订单特征维度以及目标聚集度维度,降低了特征维度的冗余,从而降低了数据复杂度,提高了计算效率。
在一些实施例中,将目标订单在目标订单特征维度下的特征值与在目标聚集度维度下的特征值进行组合,得到目标订单的目标组合特征包括:获取聚集度参考值;聚集度参考值,是对多个正常订单的聚集度特征值进行统计得到的;计算目标订单对应的聚集度特征值与聚集度参考值之间的差值,得到目标订单的聚集度差异值;将目标订单在目标订单特征维度下的特征值、在目标聚集度维度下的特征值以及目标订单的聚集度差异值进行组合,得到目标订单的目标组合特征。
其中,聚集度参考值是对多个正常订单的聚集度特征值进行统计得到的,聚集度参考值包括但不限于是多个正常订单的聚集度特征值的中位数、众数或均值等中的至少一个。
具体地,服务器可以计算目标订单对应的聚集度特征值与聚集度参考值之间的差值,将计算出的差值确定为目标订单的聚集度差异值。服务器可以将目标订单在各目标订单特征维度下的特征值、目标订单在各目标聚集度维度下的特征值、目标订单的聚集度差异值进行组合,得到目标订单的目标组合特征。例如,目标订单特征维度为2个,分别为z1和z2,目标聚集度维度为2个,分别为z3和z4,目标订单在z1、z2、z3、z4下的特征值分别为a1、a2、a3、a4,目标订单的聚集度差异值为s,则目标订单的目标组合特征可以为(a1,a2,a3,a4,s)。
在一些实施例中,服务器可以从历史订单集合中确定真实订单类型为正常订单的正常历史订单,采用指定聚集度计算方法对各正常历史订单的聚集度特征值进行统计,得到聚集度统计值集合,基于聚集度统计值集合确定聚集度参考值。
本实施例中,由于聚集度参考值是对多个正常订单的聚集度特征值进行统计得到的,从而目标订单的聚集度差异值反映了目标订单的聚集度特征值与正常订单的聚集度特征值的统计值之间的关系,从而目标订单的聚集度差异值一定程度上可以反映出目标订单是属于正常订单还是属于异常订单的,故将目标订单在目标订单特征维度下的特征值、在目标聚集度维度下的特征值以及目标订单的聚集度差异值进行组合,得到目标订单的目标组合特征,使得目标订单的聚集度差异值扩展了特征空间,丰富了目标组合特征所表达的信息,提高了订单类型的预测准确度。
在一些实施例中,获取聚集度参考值包括:从历史订单集合中确定真实订单类型为正常订单的正常历史订单;采用指定聚集度计算方法计算各正常历史订单的聚集度特征值,得到聚集度特征值集合;对聚集度特征值集合中的聚集度特征值进行统计,得到聚集度参考值。
其中,指定聚集度计算方法可以为任意的预设聚集度计算方法,由于不同的预设聚集度计算方法的计算准确度不同,故可以将计算准确度最高的预设聚集度计算方法确定为指定聚集度计算方法。
具体地,服务器可以从历史订单集合中获取多个正常历史订单,例如可以获取历史订单集合中的所有的正常历史订单,服务器可以采用指定聚集度计算方法,计算获取的各正常历史订单的聚集度特征值,将计算出的聚集度特征值组成聚集度特征值集合,对聚集度特征值集合中的聚集度特征值进行统计,得到聚集度参考值。
在一些实施例中,服务器可以将聚集度特征值集合中的中位数或众数中的至少一个确定为聚集度参考值。或者,服务器可以对聚集度特征值集合中的各聚集度特征值进行均值计算,将计算的结果确定为聚集度参考值。
本实施例中,对聚集度特征值集合中的聚集度特征值进行统计,得到聚集度参考值,提高了聚集度参考值的准确度。
在一些实施例中,目标订单所属的订单类型是基于已训练的异常分数预测模型以及异常分数阈值预测出的;利用目标组合特征预测目标订单所属的订单类型包括:将目标组合特征输入到已训练的异常分数预测模型中,预测得到目标订单的订单异常分数;在目标订单的订单异常分数大于异常分数阈值的情况下,确定目标订单所属的订单类型为异常订单。
其中,已训练的异常分数预测模型是利用历史订单集合中的每个历史订单,对待训练的异常分数预测模型进行训练得到的。待训练的异常分数预测模型为神经网络,可以为现有的神经网络,也可以是自定义的神经网络,包括但不限于是LightGBM(LightGradient Boosting Machine,轻量级的梯度提升机器)或xgboost中的任意一个。相比于xgboost,LightGBM具有训练速度快和内存占用率低的特点。LightGBM具有平衡数据的有点,可以利用设置参数调整正负样本的权重,LightGBM可以执行后剪枝过程,在后续过程中对聚集度特征维度剪枝选取更好的聚集度特征维度,LightGBM中的集成和正则化机制可以在不引入很大偏差的情况下实现低方差,尽量减少偏差方差。
具体地,服务器可以将目标组合特征输入到已训练的异常分数预测模型中,预测得到目标订单的订单异常分数,在目标订单的订单异常分数大于异常分数阈值的情况下,确定目标订单所属的订单类型为异常订单。
在一些实施例中,在目标订单的订单异常分数大于异常分数阈值的情况下,确定目标订单的异常程度,在目标订单的异常程度达到异常程度阈值的情况下,确定目标订单所属的订单类型为异常订单。异常程度阈值可以根据需要设置。服务器可以利用目标订单的订单异常分数确定目标订单的异常程度,例如目标订单的异常程度于目标订单的订单异常分数成正相关关系。服务器还可以结合目标订单的订单异常分数以及目标订单的订单特征,确定目标订单的异常程度,例如目标订单的异常程度与目标订单的订单特征中的金额成正相关关系。
在一些实施例中,对于历史订单集合中的每个历史订单,服务器可以将历史订单在目标订单特征维度下的特征值与历史订单在目标聚集度维度下的特征值进行组合,得到历史订单的历史组合特征;或者,服务器可以将历史订单在目标订单特征维度下的特征值、历史订单在目标聚集度维度下的特征值、该历史订单所属的对象的关联对象的订单异常特征进行组合,得到历史订单的历史组合特征;或者,服务器可以将历史订单在目标订单特征维度下的特征值、历史订单在目标聚集度维度下的特征值、该历史订单所属的对象的关联对象的订单异常特征、历史订单的聚集度差异值进行组合,得到历史订单的历史组合特征。如图6所示,将k个预设聚集度计算方法得到的k个聚集度特征值1~k与原始特征(即订单特征)进行组合,并同过特征选择将目标聚集度维度下的特征值以及目标订单特征维度下的特征值保留下来,从而得到历史订单的历史组合特征。服务器可以利用各历史订单分别对应的历史组合特征对待训练的异常分数预测模型进行训练,得到已训练的异常分数预测模型。本实施例中,基于已训练的异常分数预测模型预测目标订单所属的订单类型,提高了订单类型的预测效率。
在一些实施例中,得到已训练的异常分数预测模型的步骤包括:对于历史订单集合中的每个历史订单,将历史订单在目标订单特征维度的特征值与历史订单在目标聚集度维度下的特征值进行组合,得到历史订单的历史组合特征;将各历史订单的历史组合特征输入到待训练的异常分数预测模型中,得到各历史订单的预测异常分数;基于各历史订单的预测异常分数与各历史订单的真实异常分数,调整异常分数预测模型的模型参数,得到已训练的异常分数预测模型。
其中,在历史订单的真实订单类型为异常订单的情况下,历史订单的真实异常分数可以为1,在历史订单的真实订单类型为正常订单的情况下,历史订单的真实异常分数可以为0,异常分数预测模型输出的预测异常分数的取值范围可以为[0,1]。
具体地,对于历史订单集合中的每个历史订单,服务器可以将历史订单在目标订单特征维度下的特征值与历史订单在目标聚集度维度下的特征值进行组合,得到历史订单的历史组合特征;或者,服务器可以将历史订单在目标订单特征维度下的特征值、历史订单在目标聚集度维度下的特征值、该历史订单所属的对象的关联对象的订单异常特征进行组合,得到历史订单的历史组合特征;或者,服务器可以将历史订单在目标订单特征维度下的特征值、历史订单在目标聚集度维度下的特征值、该历史订单所属的对象的关联对象的订单异常特征、目标订单的聚集度差异值进行组合,得到历史订单的历史组合特征。
在一些实施例中,在对异常分数预测模型进行训练的过程中,针对每个历史订单,服务器可以将历史订单的历史组合特征输入到异常分数预测模型中,将异常分数预测模型的输出结果确定为该历史订单的预测异常分数,服务器可以基于各历史订单的预测异常分数与各历史订单的真实异常分数,调整异常分数预测模型的模型参数,直到模型收敛,得到已训练的异常分数预测模型。其中,模型收敛包括但不限于是模型的参数的变化量小于预设变化量、模型损失值小于预设损失值中的至少一个,预设变化量以及预设损失值可以根据需要预先设置。
在一些实施例中,服务器可以基于各历史订单的预测异常分数与各历史订单的真实异常分数,调整异常分数预测模型的模型参数,调整异常分数预测模型的模型参数,得到参数调整后的异常分数预测模型,验证参数调整后的异常分数预测模型的准确度,当准确度大于准确度阈值的情况下,将参数调整后的异常分数预测模型确定为已训练的异常分数预测模型。
本实施例中,由于历史订单集合中包括正常历史订单以及异常历史订单,从而利用历史订单集合中的各历史订单对异常分数预测模型进行训练,得到已训练的异常分数预测模型,提高了训练的准确度。
在一些实施例中,基于各历史订单的预测异常分数与各历史订单的真实异常分数,调整异常分数预测模型的模型参数,得到已训练的异常分数预测模型包括:基于各历史订单的预测异常分数与各历史订单的真实异常分数,调整异常分数预测模型的模型参数,得到参数调整后的异常分数预测模型;利用参数调整后的异常分数预测模型预测多个验证订单分别所属的订单类型,得到各验证订单的预测异常分数;基于验证订单的预测异常分数确定验证订单的预测订单类型;确定各验证订单中真实订单类型为异常订单的验证订单的数量,得到第一订单数量,确定各验证订单中预测订单类型和真实订单类型均为异常订单的验证订单的数量,得到第二订单数量;基于第一订单数量以及第二订单数量,确定参数调整后的异常分数预测模型的异常订单覆盖率;在异常订单覆盖率大于覆盖率阈值的情况下,将参数调整后的异常分数预测模型确定为已训练的异常分数预测模型。
其中,参数调整后的异常分数预测模型的准确度可以采用异常订单覆盖率衡量,异常订单覆盖率表示第二订单数量与第一订单数量的比值,第二订单数量是指各验证订单中预测订单类型以及真实订单类型均为异常订单的验证订单的数量,第一订单数量是指各验证订单中真实订单类型为异常订单的验证订单的数量。各验证订单是用于验证参数调整后的异常分数预测模型的准确度的订单。覆盖率阈值可以根据需要设置,例如可以为90%或95%等。异常订单覆盖率小于或等于1,异常订单覆盖率越接近1,则表示异常分数预测模型的准确度越高。
具体地,生成验证组合特征的过程与生成历史组合特征的过程一致,例如,在历史订单的历史组合特征是将历史订单在目标订单特征维度下的特征值与历史订单在目标聚集度维度下的特征值进行组合得到的情况下,针对每个验证订单,服务器可以将验证订单在目标订单特征维度的特征值与该验证订单在目标聚集度维度下的特征值进行组合,得到该验证订单的验证组合特征。在历史订单的历史组合特征是将历史订单在目标订单特征维度下的特征值、历史订单在目标聚集度维度下的特征值、该历史订单所属的对象的关联对象的订单异常特征进行组合得到历史订单的情况下,服务器可以将验证订单在目标订单特征维度的特征值、该验证订单在目标聚集度维度下的特征值、该验证订单所属的对象的关联对象的订单异常特征进行组合,得到该验证订单的验证组合特征。在历史订单的历史组合特征是将历史订单在目标订单特征维度下的特征值、历史订单在目标聚集度维度下的特征值、该历史订单所属的对象的关联对象的订单异常特征、历史订单的聚集度差异值进行组合得到的情况下,服务器可以将验证订单在目标订单特征维度的特征值、该验证订单在目标聚集度维度下的特征值、该验证订单所属的对象的关联对象的订单异常特征、验证订单的聚集度差异值进行组合,得到该验证订单的验证组合特征。同样的,生成目标组合特征的过程与生成历史组合特征的过程一致。
在一些实施例中,针对每个验证订单,服务器可以将该验证订单的验证组合特征输入到参数调整后的异常分数预测模型中,预测得到该验证订单的预测异常分数。服务器可以将验证订单的预测异常分数与异常分数阈值进行对比,在验证订单的预测异常分数大于或达到异常分数阈值的情况下,确定验证订单的预测订单类型为异常订单。
在一些实施例中,在验证订单的预测异常分数大于异常分数阈值的情况下,确定验证订单的异常程度,在验证订单的异常程度达到异常程度阈值的情况下,确定验证订单所属的订单类型为异常订单。异常程度阈值可以根据需要设置。服务器可以利用验证订单的预测异常分数确定验证订单的异常程度,例如验证订单的异常程度于验证订单的预测异常分数成正相关关系。服务器还可以结合验证订单的预测异常分数以及验证订单的订单特征,确定验证订单的异常程度,例如验证订单的异常程度与验证订单的订单特征中的金额成正相关关系。
在一些实施例中,服务器可以统计各验证订单中真实订单类型为异常订单的验证订单的数量,得到第一订单数量,并统计各验证订单中预测订单类型和真实订单类型均为异常订单的验证订单的数量,得到第二订单数量。服务器可以计算第二订单数量与第一订单数量的比值,将计算出的比值确定为参数调整后的异常分数预测模型的异常订单覆盖率。例如,异常订单覆盖率=第二订单数量/第一订单数量。在异常订单覆盖率大于覆盖率阈值的情况下,服务器可以将参数调整后的异常分数预测模型确定为已训练的异常分数预测模型。
本实施例中,由于第一订单数量为各验证订单中真实订单类型为异常订单的验证订单的数量,第二订单数量为各验证订单中预测订单类型和真实订单类型均为异常订单的验证订单的数量,故基于第一订单数量以及第二订单数量,确定参数调整后的异常分数预测模型的异常订单覆盖率,提高了异常订单覆盖率的准确度。
在一些实施例中,基于验证订单的预测异常分数确定验证订单的预测订单类型包括:基于各验证订单的预测异常分数进行统计,得到异常分数阈值;基于验证订单的预测异常分数和异常分数阈值,确定验证订单的预测订单类型;在异常订单覆盖率大于覆盖率阈值的情况下,将参数调整后的异常分数预测模型确定为已训练的异常分数预测模型包括:确定各验证订单中预测订单类型为异常订单的验证订单的数量,得到第三订单数量;基于第三订单数量以及第二订单数量,确定异常分数阈值的准确度表征值;在异常订单覆盖率大于覆盖率阈值且异常分数阈值的准确度表征值小于表征值阈值的情况下,将参数调整后的异常分数预测模型确定为已训练的异常分数预测模型。
具体地,异常分数预测模型的准确度还可以通过异常分数阈值的准确度表征值来反映。服务器可以统计各验证订单中预测订单类型为异常订单的验证订单的数量,将统计出的数量确定为第三订单数量。服务器可以计算第三订单数量与第二订单数量的比值,将计算出的比值确定为参数调整后的异常分数预测模型的异常分数阈值的准确度表征值。例如,异常分数阈值的准确度表征值=第三订单数量/第二订单数量。由于第三订单数量与第二订单数量的比值是大于或等于1的,故异常分数阈值的准确度表征值也是大于或等于1的,准确度表征值越接近1,则表示异常分数阈值的准确度越高,从而表示异常分数预测模型的准确度越高。表征值阈值可以根据需要设置,例如为1.1或1.2等。
在一些实施例中,服务器可以计算预测异常分数大于指定异常分数的验证订单的数量与验证订单总数中的比值,在比值达到比值阈值的情况下,将该指定异常分数确定为异常分数阈值,在比值小于比值阈值的情况下,更新指定异常分数,返回计算预测异常分数大于指定异常分数的验证订单的数量与验证订单总数的比值,直到比值达到比值阈值为止。验证订单总数是指所有验证订单的数量。占比阈值可以预设,例如为95%或98%。
本实施例中,在异常订单覆盖率大于覆盖率阈值且异常分数阈值的准确度表征值小于表征值阈值的情况下,将参数调整后的异常分数预测模型确定为已训练的异常分数预测模型,从而提高了已训练的异常分数预测模型的准确度。
在一些实施例中,基于各历史订单的预测异常分数与各历史订单的真实异常分数,调整异常分数预测模型的模型参数,得到已训练的异常分数预测模型包括:基于各历史订单的预测异常分数与各历史订单的真实异常分数,生成各历史订单分别对应的订单损失值;确定正常订单权重以及异常订单权重;异常订单权重大于正常订单权重;利用正常订单权重以及异常订单权重,对各历史订单分别对应的订单损失值进行统计,得到模型损失值;基于模型损失值调整异常分数预测模型的模型参数,得到已训练的异常分数预测模型。
其中,正常订单权重为正常订单对应的权重,异常订单权重为异常订单对应的权重,历史订单集合中的正常订单的数量大于异常订单的数量。异常订单权重大于正常订单权重,例如,异常订单权重为0.6,正常订单权重为0.4。异常订单权重以及正常订单权重可以是基于历史订单集合中正常订单的占比以及异常订单的占比确定的。
具体地,服务器可以统计历史订单集合中正常订单的数量,得到正常订单数量,统计历史订单集合中异常订单的数量,得到异常订单数量,统计历史订单集合中包括的历史订单的数量,得到总订单数量,计算正常订单数量与总订单数量的比值,得到正常订单占比,计算异常订单数量与总订单数量的比值,得到异常订单占比,基于正常订单占比确定正常订单权重,正常订单占比与正常订单权重成负相关关系,正常订单占比越大,正常订单权重越小,基于异常订单占比确定异常订单权重,异常订单占比与异常订单权重成负相关关系,异常订单占比越大,异常订单权重越小,例如,可以将异常订单占比确定为正常订单权重,将正常订单占比确定为异常订单权重。
在一些实施例中,针对每个历史订单,服务器可以基于该历史订单的预测异常分数与该历史订单的真实异常分数,生成该历史订单对应的订单损失值,将正常订单权重作为正常历史订单的订单损失值的加权权重,将异常订单权重作为异常历史订单的订单损失值的加权权重,对各历史订单分别对应的订单损失值进行加权求和计算,将加权求和计算的结果确定为模型损失值,朝着使得模型损失值减小的方向调整异常分数预测模型的模型参数,直到模型收敛,得到已训练的异常分数预测模型。
本实施例中,由于通常订单是正常的,异常订单是比较少见的,例如在社交应用支付场景中,每天正常的交易样本量会远高于欺诈类的交易量,一般高达几个数量级,即数据中的异常值往往只占数据集的小部分(数据不平衡),即历史订单集合中正常订单的数量大于异常订单的数量,设置异常订单权重大于正常订单权重,可以增大异常订单产生的损失值在总的损失值中的影响力,从而减少样本不平衡(即异常订单的数量少,而正常订单的数量多)所引起的损失值不准确的情况,提高了模型训练的准确性。从而本申请提供的订单类型确定方法,既丰富了特征空间,又解决了数据不平衡问题,有效地提高识别的精度及稳定性,降低平台、用户的被骗风险和损失。
在一些实施例中,如图7所示,提供了一种订单类型确定方法,该方法可以由终端或服务器执行,还可以由终端和服务器共同执行,以该方法应用于服务器为例进行说明,包括以下步骤:
步骤702,对于历史订单集合中的每个历史订单,采用多个预设聚集度维度分别对应的预设聚集度计算方法,确定历史订单在各预设聚集度维度下的聚集度特征值。
步骤704,将历史订单的订单特征与历史订单在各预设聚集度维度下的聚集度特征值进行组合,得到历史订单的初始组合特征。
步骤706,针对各预设聚集度维度以及各预设订单特征维度中的每个特征维度,将各历史订单的初始组合特征中特征维度的特征值进行统计,得到特征维度的维度权重。
步骤708,按照维度权重从大到小的顺序,从各预设聚集度维度以及各预设订单特征维度中,选取得到目标订单特征维度以及目标聚集度维度。
步骤710,对于历史订单集合中的每个历史订单,将历史订单在目标订单特征维度的特征值与历史订单在目标聚集度维度下的特征值进行组合,得到历史订单的历史组合特征。
步骤712,将各历史订单的历史组合特征输入到待训练的异常分数预测模型中,得到各历史订单的预测订单类型。
步骤714,基于各历史订单的预测订单类型与各历史订单的真实订单类型,调整异常分数预测模型的模型参数,得到已训练的异常分数预测模型。
步骤716,响应于通过社交应用触发的目标订单,基于目标订单在多个预设订单特征维度下的特征值,得到目标订单的订单特征。
步骤718,基于目标订单的订单特征和历史订单集合中历史订单的订单特征,确定目标订单的聚集度特征值。
步骤720,将目标订单在目标订单特征维度下的特征值与在目标聚集度维度下的聚集度特征值进行组合,得到目标订单的目标组合特征。
步骤722,将目标组合特征输入到已训练的异常分数预测模型中,预测得到目标订单的订单异常分数。
步骤724,判断目标订单的订单异常分数是否大于异常分数阈值,若是,则执行步骤726。
步骤726,基于订单异常分数以及目标订单的订单特征,确定目标订单的异常程度。
步骤728,判断目标订单的异常程度是否达到异常程度阈值,若是,则执行步骤730。
步骤730,通过社交应用进行订单干预。
随着社交应用支付业务的日益增长,黑产在社交应用支付中越来越频繁,不断的影响用户对社交应用支付的信心。而本申请提供的订单类型确定方法,通过聚集度特征值扩充原始特征空间,原始特征空间是指订单特征,从而丰富了特征空间的表示,应用于社交应用支付领域中,能够提高订单类型的预测准确度,从而能够准确的将社交应用支付领域中的异常订单识别出来。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的订单类型确定方法的订单类型确定装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个订单类型确定装置实施例中的具体限定可以参见上文中对于订单类型确定方法的限定,在此不再赘述。
在一些实施例中,如图8所示,提供了一种订单类型确定装置,包括:订单特征得到模块802、聚集度得到模块804、组合特征得到模块806和订单类型预测模块808,其中:
订单特征得到模块802,用于基于目标订单在多个预设订单特征维度下的特征值,得到目标订单的订单特征。
聚集度得到模块804,用于基于目标订单的订单特征和历史订单集合中历史订单的订单特征,确定目标订单的聚集度特征值;聚集度特征值,用于表征在按照订单特征进行分布的情况下,目标订单与历史订单的聚集程度;历史订单集合中包括正常历史订单以及异常历史订单。
组合特征得到模块806,用于将目标订单在至少一个预设订单特征维度下的特征值与聚集度特征值进行组合,得到目标订单的目标组合特征。
订单类型预测模块808,用于利用目标组合特征预测目标订单所属的订单类型。
在一些实施例中,目标订单是属于社交应用中的目标对象的订单;组合特征得到模块,还用于确定目标对象在社交应用中的关联对象;基于关联对象在指定时间段内的订单异常信息,编码得到关联对象的订单异常特征;将目标订单在至少一个预设订单特征维度下的特征值、聚集度特征值以及订单异常特征进行组合,得到目标订单的目标组合特征。
在一些实施例中,聚集度得到模块,还用于基于目标订单的订单特征和历史订单集合中历史订单的订单特征,确定目标订单在目标聚集度维度下的特征值,得到目标订单的聚集度特征值;组合特征得到模块,还用于将目标订单在目标订单特征维度下的特征值与在目标聚集度维度下的特征值进行组合,得到目标订单的目标组合特征;目标订单特征维度以及目标聚集度维度,是对多个预设订单特征维度和多个预设聚集度维度进行去冗余处理所得到的。
在一些实施例中,装置还包括用于确定目标订单特征维度以及目标聚集度维度的维度确定模块,维度确定模块,用于对于历史订单集合中的每个历史订单,采用多个预设聚集度维度分别对应的预设聚集度计算方法,确定历史订单在各预设聚集度维度下的聚集度特征值;将历史订单的订单特征与历史订单在各预设聚集度维度下的聚集度特征值进行组合,得到历史订单的初始组合特征;针对各预设聚集度维度以及各预设订单特征维度中的每个特征维度,将各历史订单的初始组合特征中特征维度的特征值进行统计,得到特征维度的维度权重;根据维度权重对各预设聚集度维度以及各预设订单特征维度进行去冗余处理,得到目标订单特征维度以及目标聚集度维度。
在一些实施例中,维度确定模块,还用于按照维度权重从大到小的顺序,从各预设聚集度维度以及各预设订单特征维度中,选取得到至少一个预设订单特征维度和至少一个预设聚集度维度,组成特征维度集合;对于特征维度集合中的任意两个特征维度,计算任意两个特征维度之间的相关度;在相关度大于相关度阈值的情况下,将任意两个特征维度中的一个特征维度从特征维度集合中移除,得到目标订单特征维度以及目标聚集度维度。
在一些实施例中,组合特征得到模块,还用于获取聚集度参考值;聚集度参考值,是对多个正常订单的聚集度特征值进行统计得到的;计算目标订单对应的聚集度特征值与聚集度参考值之间的差值,得到目标订单的聚集度差异值;将目标订单在目标订单特征维度下的特征值、在目标聚集度维度下的特征值以及目标订单的聚集度差异值进行组合,得到目标订单的目标组合特征。
在一些实施例中,组合特征得到模块,还用于从历史订单集合中确定真实订单类型为正常订单的正常历史订单;采用指定聚集度计算方法计算各正常历史订单的聚集度特征值,得到聚集度特征值集合;对聚集度特征值集合中的聚集度特征值进行统计,得到聚集度参考值。
在一些实施例中,目标订单所属的订单类型是基于已训练的异常分数预测模型以及异常分数阈值预测出的;订单类型预测模块,还用于将目标组合特征输入到已训练的异常分数预测模型中,预测得到目标订单的订单异常分数;在目标订单的订单异常分数大于异常分数阈值的情况下,确定目标订单所属的订单类型为异常订单。
在一些实施例中,装置还包括用于得到已训练的异常分数预测模型的模型训练模块,模型训练模块,用于对于历史订单集合中的每个历史订单,将历史订单在目标订单特征维度的特征值与历史订单在目标聚集度维度下的特征值进行组合,得到历史订单的历史组合特征;将各历史订单的历史组合特征输入到待训练的异常分数预测模型中,得到各历史订单的预测异常分数;基于各历史订单的预测异常分数与各历史订单的真实异常分数,调整异常分数预测模型的模型参数,得到已训练的异常分数预测模型。
在一些实施例中,模型训练模块,还用于基于各历史订单的预测异常分数与各历史订单的真实异常分数,调整异常分数预测模型的模型参数,得到参数调整后的异常分数预测模型;利用参数调整后的异常分数预测模型预测多个验证订单分别所属的订单类型,得到各验证订单的预测异常分数;基于验证订单的预测异常分数确定验证订单的预测订单类型;确定各验证订单中真实订单类型为异常订单的验证订单的数量,得到第一订单数量,确定各验证订单中预测订单类型和真实订单类型均为异常订单的验证订单的数量,得到第二订单数量;基于第一订单数量以及第二订单数量,确定参数调整后的异常分数预测模型的异常订单覆盖率;在异常订单覆盖率大于覆盖率阈值的情况下,将参数调整后的异常分数预测模型确定为已训练的异常分数预测模型。
在一些实施例中,模型训练模块,还用于基于各验证订单的预测异常分数进行统计,得到异常分数阈值;基于验证订单的预测异常分数和异常分数阈值,确定验证订单的预测订单类型;确定各验证订单中预测订单类型为异常订单的验证订单的数量,得到第三订单数量;基于第三订单数量以及第二订单数量,确定异常分数阈值的准确度表征值;在异常订单覆盖率大于覆盖率阈值且异常分数阈值的准确度表征值小于表征值阈值的情况下,将参数调整后的异常分数预测模型确定为已训练的异常分数预测模型。
在一些实施例中,模型训练模块,还用于基于各历史订单的预测异常分数与各历史订单的真实异常分数,生成各历史订单分别对应的订单损失值;确定正常订单权重以及异常订单权重;异常订单权重大于正常订单权重;利用正常订单权重以及异常订单权重,对各历史订单分别对应的订单损失值进行统计,得到模型损失值;基于模型损失值调整异常分数预测模型的模型参数,得到已训练的异常分数预测模型。
上述订单类型确定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一些实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储订单类型确定方法中涉及到的数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种订单类型确定方法。
在一些实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图10所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种订单类型确定方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置,显示屏可以是液晶显示屏或电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9和图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其下的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一些实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述订单类型确定方法中的步骤。
在一些实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述订单类型确定方法中的步骤。
在一些实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述订单类型确定方法中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (16)
1.一种订单类型确定方法,其特征在于,所述方法包括:
基于目标订单在多个预设订单特征维度下的特征值,得到所述目标订单的订单特征;
基于所述目标订单的订单特征和历史订单集合中历史订单的订单特征,确定所述目标订单的聚集度特征值;所述聚集度特征值,用于表征在按照订单特征进行分布的情况下,所述目标订单与所述历史订单的聚集程度;所述历史订单集合中包括正常历史订单以及异常历史订单;
将所述目标订单在至少一个所述预设订单特征维度下的特征值与所述聚集度特征值进行组合,得到所述目标订单的目标组合特征;
利用所述目标组合特征预测所述目标订单所属的订单类型。
2.根据权利要求1所述的方法,其特征在于,所述目标订单是属于社交应用中的目标对象的订单;所述将所述目标订单在至少一个所述预设订单特征维度下的特征值与所述聚集度特征值进行组合,得到所述目标订单的目标组合特征包括:
确定所述目标对象在所述社交应用中的关联对象;
基于所述关联对象在指定时间段内的订单异常信息,编码得到所述关联对象的订单异常特征;
将所述目标订单在至少一个所述预设订单特征维度下的特征值、所述聚集度特征值以及所述订单异常特征进行组合,得到所述目标订单的目标组合特征。
3.根据权利要求1所述的方法,其特征在于,所述基于所述目标订单的订单特征和历史订单集合中历史订单的订单特征,确定所述目标订单的聚集度特征值包括:
基于所述目标订单的订单特征和历史订单集合中历史订单的订单特征,确定所述目标订单在目标聚集度维度下的特征值,得到所述目标订单的聚集度特征值;
所述将所述目标订单在至少一个所述预设订单特征维度下的特征值与所述聚集度特征值进行组合,得到所述目标订单的目标组合特征包括:
将所述目标订单在目标订单特征维度下的特征值与在所述目标聚集度维度下的特征值进行组合,得到所述目标订单的目标组合特征;所述目标订单特征维度以及所述目标聚集度维度,是对所述多个预设订单特征维度和多个预设聚集度维度进行去冗余处理所得到的。
4.根据权利要求3所述的方法,其特征在于,确定所述目标订单特征维度以及所述目标聚集度维度的步骤包括:
对于所述历史订单集合中的每个历史订单,采用多个预设聚集度维度分别对应的预设聚集度计算方法,确定所述历史订单在各所述预设聚集度维度下的聚集度特征值;
将所述历史订单的订单特征与所述历史订单在各所述预设聚集度维度下的聚集度特征值进行组合,得到所述历史订单的初始组合特征;
针对各所述预设聚集度维度以及各所述预设订单特征维度中的每个特征维度,将各所述历史订单的初始组合特征中所述特征维度的特征值进行统计,得到所述特征维度的维度权重;
根据维度权重对各所述预设聚集度维度以及各所述预设订单特征维度进行去冗余处理,得到所述目标订单特征维度以及所述目标聚集度维度。
5.根据权利要求4所述的方法,其特征在于,所述根据维度权重对各所述预设聚集度维度以及各所述预设订单特征维度进行去冗余处理,得到所述目标订单特征维度以及所述目标聚集度维度包括:
按照维度权重从大到小的顺序,从各所述预设聚集度维度以及各所述预设订单特征维度中,选取得到至少一个所述预设订单特征维度和至少一个所述预设聚集度维度,组成特征维度集合;
对于所述特征维度集合中的任意两个特征维度,计算所述任意两个特征维度之间的相关度;
在所述相关度大于相关度阈值的情况下,将所述任意两个特征维度中的一个特征维度从所述特征维度集合中移除,得到所述目标订单特征维度以及所述目标聚集度维度。
6.根据权利要求3所述的方法,其特征在于,所述将所述目标订单在目标订单特征维度下的特征值与在所述目标聚集度维度下的特征值进行组合,得到所述目标订单的目标组合特征包括:
获取聚集度参考值;所述聚集度参考值,是对多个正常订单的聚集度特征值进行统计得到的;
计算所述目标订单对应的聚集度特征值与所述聚集度参考值之间的差值,得到所述目标订单的聚集度差异值;
将所述目标订单在目标订单特征维度下的特征值、所述在所述目标聚集度维度下的特征值以及所述目标订单的聚集度差异值进行组合,得到所述目标订单的目标组合特征。
7.根据权利要求6所述的方法,其特征在于,所述获取聚集度参考值包括:
从所述历史订单集合中确定真实订单类型为正常订单的正常历史订单;
采用指定聚集度计算方法计算各所述正常历史订单的聚集度特征值,得到聚集度特征值集合;
对所述聚集度特征值集合中的聚集度特征值进行统计,得到所述聚集度参考值。
8.根据权利要求1所述的方法,其特征在于,所述目标订单所属的订单类型是基于已训练的异常分数预测模型以及异常分数阈值预测出的;
所述利用所述目标组合特征预测所述目标订单所属的订单类型包括:
将所述目标组合特征输入到所述已训练的异常分数预测模型中,预测得到所述目标订单的订单异常分数;
在所述目标订单的订单异常分数大于所述异常分数阈值的情况下,确定所述目标订单所属的订单类型为异常订单。
9.根据权利要求8所述的方法,其特征在于,得到所述已训练的异常分数预测模型的步骤包括:
对于所述历史订单集合中的每个历史订单,将所述历史订单在所述目标订单特征维度的特征值与所述历史订单在目标聚集度维度下的特征值进行组合,得到所述历史订单的历史组合特征;
将各所述历史订单的历史组合特征输入到待训练的异常分数预测模型中,得到各所述历史订单的预测异常分数;
基于各所述历史订单的预测异常分数与各所述历史订单的真实异常分数,调整所述异常分数预测模型的模型参数,得到所述已训练的异常分数预测模型。
10.根据权利要求9所述的方法,其特征在于,所述基于各所述历史订单的预测异常分数与各所述历史订单的真实异常分数,调整所述异常分数预测模型的模型参数,得到所述已训练的异常分数预测模型包括:
基于各所述历史订单的预测异常分数与各所述历史订单的真实异常分数,调整所述异常分数预测模型的模型参数,得到参数调整后的异常分数预测模型;
利用所述参数调整后的异常分数预测模型预测多个验证订单分别所属的订单类型,得到各所述验证订单的预测异常分数;
基于所述验证订单的预测异常分数确定所述验证订单的预测订单类型;
确定各所述验证订单中真实订单类型为异常订单的验证订单的数量,得到第一订单数量,确定各所述验证订单中预测订单类型和真实订单类型均为异常订单的验证订单的数量,得到第二订单数量;
基于所述第一订单数量以及所述第二订单数量,确定所述参数调整后的异常分数预测模型的异常订单覆盖率;
在所述异常订单覆盖率大于覆盖率阈值的情况下,将所述参数调整后的异常分数预测模型确定为所述已训练的异常分数预测模型。
11.根据权利要求10所述的方法,其特征在于,所述基于所述验证订单的预测异常分数确定所述验证订单的预测订单类型包括:
基于各所述验证订单的预测异常分数进行统计,得到异常分数阈值;
基于所述验证订单的预测异常分数和异常分数阈值,确定所述验证订单的预测订单类型;
所述在所述异常订单覆盖率大于覆盖率阈值的情况下,将所述参数调整后的异常分数预测模型确定为所述已训练的异常分数预测模型包括:
确定各所述验证订单中预测订单类型为异常订单的验证订单的数量,得到第三订单数量;
基于所述第三订单数量以及所述第二订单数量,确定所述异常分数阈值的准确度表征值;
在所述异常订单覆盖率大于覆盖率阈值且所述异常分数阈值的准确度表征值小于表征值阈值的情况下,将所述参数调整后的异常分数预测模型确定为所述已训练的异常分数预测模型。
12.根据权利要求9所述的方法,其特征在于,所述基于各所述历史订单的预测异常分数与各所述历史订单的真实异常分数,调整所述异常分数预测模型的模型参数,得到所述已训练的异常分数预测模型包括:
基于各所述历史订单的预测异常分数与各所述历史订单的真实异常分数,生成各所述历史订单分别对应的订单损失值;
确定正常订单权重以及异常订单权重;所述异常订单权重大于所述正常订单权重;
利用所述正常订单权重以及所述异常订单权重,对各所述历史订单分别对应的订单损失值进行统计,得到模型损失值;
基于所述模型损失值调整所述异常分数预测模型的模型参数,得到所述已训练的异常分数预测模型。
13.一种订单类型确定装置,其特征在于,所述装置包括:
订单特征得到模块,用于基于目标订单在多个预设订单特征维度下的特征值,得到所述目标订单的订单特征;
聚集度得到模块,用于基于所述目标订单的订单特征和历史订单集合中历史订单的订单特征,确定所述目标订单的聚集度特征值;所述聚集度特征值,用于表征在按照订单特征进行分布的情况下,所述目标订单与所述历史订单的聚集程度;所述历史订单集合中包括正常历史订单以及异常历史订单;
组合特征得到模块,用于将所述目标订单在至少一个所述预设订单特征维度下的特征值与所述聚集度特征值进行组合,得到所述目标订单的目标组合特征;
订单类型预测模块,用于利用所述目标组合特征预测所述目标订单所属的订单类型。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述的方法的步骤。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
16.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211150343.7A CN117034067A (zh) | 2022-09-21 | 2022-09-21 | 订单类型确定方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211150343.7A CN117034067A (zh) | 2022-09-21 | 2022-09-21 | 订单类型确定方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117034067A true CN117034067A (zh) | 2023-11-10 |
Family
ID=88643552
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211150343.7A Pending CN117034067A (zh) | 2022-09-21 | 2022-09-21 | 订单类型确定方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117034067A (zh) |
-
2022
- 2022-09-21 CN CN202211150343.7A patent/CN117034067A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yang et al. | Ffd: A federated learning based method for credit card fraud detection | |
US11830004B2 (en) | Blockchain transaction safety | |
US10872298B2 (en) | Machine learning and prediction using graph communities | |
US10698795B2 (en) | Virtual payments environment | |
US11436430B2 (en) | Feature information extraction method, apparatus, server cluster, and storage medium | |
US20210264448A1 (en) | Privacy preserving ai derived simulated world | |
EP3416123A1 (en) | System for identification of fraudulent transactions | |
WO2021174944A1 (zh) | 基于目标对象活跃度的消息推送方法及相关设备 | |
WO2016040343A1 (en) | Stream processing | |
US11538044B2 (en) | System and method for generation of case-based data for training machine learning classifiers | |
US20190236607A1 (en) | Transaction Aggregation and Multiattribute Scoring System | |
US20210304204A1 (en) | Machine learning model and narrative generator for prohibited transaction detection and compliance | |
CN112700252A (zh) | 一种信息安全性检测方法、装置、电子设备和存储介质 | |
CN114398553A (zh) | 对象推荐方法、装置、电子设备以及存储介质 | |
US20230252517A1 (en) | Systems and methods for automatically providing customized financial card incentives | |
CN117034067A (zh) | 订单类型确定方法、装置、计算机设备和存储介质 | |
CN115907954A (zh) | 账户的识别方法、装置、计算机设备和存储介质 | |
US20220036219A1 (en) | Systems and methods for fraud detection using game theory | |
US20220277327A1 (en) | Computer-based systems for data distribution allocation utilizing machine learning models and methods of use thereof | |
CN113436020B (zh) | 违规账户的识别方法、装置、计算机设备和存储介质 | |
CN117350461B (zh) | 企业异常行为预警方法、系统、计算机设备及存储介质 | |
US20230418921A1 (en) | Intelligent authentication of users in metaverse leveraging non-fungible tokens and behavior analysis | |
US20240202816A1 (en) | Systems and methods for dynamically generating pre-approval data | |
CN116611910A (zh) | 风险评估方法、装置、计算机设备和存储介质 | |
CN117455649A (zh) | 资源的数据处理方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |