CN107133833A - 异常交易识别方法及装置 - Google Patents

异常交易识别方法及装置 Download PDF

Info

Publication number
CN107133833A
CN107133833A CN201610108558.0A CN201610108558A CN107133833A CN 107133833 A CN107133833 A CN 107133833A CN 201610108558 A CN201610108558 A CN 201610108558A CN 107133833 A CN107133833 A CN 107133833A
Authority
CN
China
Prior art keywords
characteristic variable
normalized
normalized value
value
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610108558.0A
Other languages
English (en)
Inventor
刘楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610108558.0A priority Critical patent/CN107133833A/zh
Publication of CN107133833A publication Critical patent/CN107133833A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0609Buyer or seller confidence or verification

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请公开了一种异常交易识别方法及装置,所述方法包括:获取订单数据,并根据所述订单数据,提取特征变量;将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值;将属于同一个特征类别的特征变量的归一化值进行累加,获得累加数值;将所述累加数值进行归一化处理,获得特征类别的归一化值;根据不同特征类别的归一化值,确定所述订单数据对应的交易是否为异常交易。本申请实施例实现了异常交易的有效识别,提高了识别准确度。

Description

异常交易识别方法及装置
技术领域
本申请属于电子商务技术领域,具体地说,涉及一种异常交易识别方法及装置。
背景技术
O2O(Online To Offline,线上到线下)是一种新型的电子商务模式,是指将线下的商务机会与互联网结合,让互联网成为线下交易的平台。
O2O领域是目前各大互联网公司非常关注的,也是公司未来线下发展的机遇。但是由于线下环境不同于线上环境容易监控,线下环境复杂程度远远超出线上环境。商户作弊手段层出不穷,花样翻新非常快而且作弊动机也五花八门,因此急需对作弊等异常交易进行识别,以保护平台营销资源不被浪费,保证优质商户门店得到公平的机会健康发展。
而现有技术中,并没有一种有效、准确的对异常交易进行识别的方式。
发明内容
有鉴于此,本申请供了一种异常交易识别方法及装置,所要解决的技术问题是无法实现异常交易的有效、准确识别的技术问题。
为了解决上述技术问题,本申请公开了一种异常交易识别方法,包括:
获取订单数据,并根据所述订单数据,提取特征变量;
将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值;
将属于同一个特征类别的特征变量的归一化值进行累加,获得累加数值;
将所述累加数值进行归一化处理,获得特征类别的归一化值;
根据不同特征类别的归一化值,确定所述订单数据对应的交易是否为异常交易。
优选地,所述将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值包括:
在任一个特征变量位于数据允许范围内时,确定所述特征变量的归一化值为零;
在所述特征变量超出数据允许范围时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值。
优选地,所述将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值包括:
在任一个特征变量满足任一个异常条件时,将所述特征变量按照所述任一个异常条件对应的数值调整方式进行调整,并将调整之后的特征变量进行进行归一化处理,获得所述特征变量的归一化值;
在任一个特征变量不满足任一个异常条件时,将所述特征变量进行归一化处理,获得所述特征变量的归一化值。
优选地,所述将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值包括:
在任一个特征变量对应的预设归一化模式为第一种归一化模式时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值;
在任一个特征变量对应的预设归一化模式为第二种归一化模式时,在所述特征变量位于数据允许范围内时,确定所述特征变量的归一化值为零;在所述特征变量超出数据允许范围时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值;
在任一个特征变量对应的预设归一化模式为第三种归一化模式时,在所述特征变量满足任一个异常条件时,将所述特征变量按照所述任一个异常条件对应的数值调整方式进行调整,并将调整之后的特征变量进行进行归一化处理,获得每一个特征变量的归一化值;在所述特征变量不满足任一个异常条件时,获得每一个特征变量的归一化值。
优选地,所述根据不同特征类别的归一化值,确定所述订单数据对应的交易是否为异常交易包括:
将不同特征类别的归一化值相加,获得异常交易分数;
在所述异常交易分数位于异常范围内时,确定所述订单数据对应的交易为异常交易。
一种异常交易识别装置,包括:
变量提取模块,用于获取订单数据,并根据所述订单数据,提取特征变量;
第一归一化模块,用于将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值;
计算模块,用于将属于同一个特征类别的特征变量的归一化值进行累加,获得累加数值;
第二归一化模块,用于将所述累加数值进行归一化处理,获得特征类别的归一化值;
识别模块,用于根据不同特征类别的归一化值,确定所述订单数据对应的交易是否为异常交易。
优选地,所述第一归一化模块具体用于:在任一个特征变量位于数据允许范围内时,确定所述特征变量的归一化值为零;
在所述特征变量超出数据允许范围时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值。
优选地,所述第一归一化模块具体用于:在任一个特征变量满足任一个异常条件时,将所述特征变量按照所述任一个异常条件对应的数值调整方式进行调整,并将调整之后的特征变量进行进行归一化处理,获得所述特征变量的归一化值;在任一个特征变量不满足任一个异常条件时,将所述特征变量进行归一化处理,获得所述特征变量的归一化值。
优选地,所述第一归一化模块具体用于:
在任一个特征变量对应的预设归一化模式为第一种归一化模式时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值;
在任一个特征变量对应的预设归一化模式为第二种归一化模式时,在所述特征变量位于数据允许范围内时,确定所述特征变量的归一化值为零;在所述特征变量超出数据允许范围时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值;
在任一个特征变量对应的预设归一化模式为第三种归一化模式时,在所述特征变量满足任一个异常条件时,将所述特征变量按照所述任一个异常条件对应的数值调整方式进行调整,并将调整之后的特征变量进行进行归一化处理,获得每一个特征变量的归一化值;在所述特征变量不满足任一个异常条件时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值。
优选地,所述识别模块包括:
计算单元,将不同特征类别的归一化值相加,获得异常交易分数;
识别单元,用于在所述异常交易分数位于异常范围内时,确定所述订单数据对应的交易为异常交易。
与现有技术相比,本申请可以获得包括以下技术效果:
将从订单数据中提取的特征变量进行归一化处理,获得每一个特征变量的归一化值;并将属于同个特征类别的特征变量的归一化值进行累加,对累加数值再次进行归一化处理,获得特征类别的归一化值,从而根据特征类别的归一化值进行,即可以确定所述订单数据对应的交易是否为异常交易。每一个特征类别的归一化值可以表明交易异常情况,综合考虑不同特征识别,实现了对异常交易有效、准确的识别。
当然,实施本申请的任一产品必不一定需要同时达到以上所述的所有技术效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请实施例的一种异常交易识别方法一个实施例的流程图;
图2是本申请实施例中归一化值的一种分布示意图;
图3是本申请实施例的一种异常交易识别方法又一个实施例的流程图;
图4是本申请实施例的一种异常交易识别装置一个实施例的结构示意图;
图5是本申请实施例的一种异常交易识别装置又一个实施例的结构示意图。
具体实施方式
以下将配合附图及实施例来详细说明本申请的实施方式,藉此对本申请如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
本申请技术方案可以适用于网上交易中异常交易的识别,特别是适用于存在大量异常交易的O2O(Online To Offline,线上到线下)交易的应用场景中,由于在O2O交易中,买家是进行线上支付,线下消费,卖家的销量和好评率,是影响卖家销售的主要因素,因此O2O交易中存在大量的作弊行为,异常交易出现频率更高。
为了进行异常交易识别,提高异常交易识别的准确性,实现异常交易的有效识别,发明人经过一系列研究,提出本申请技术方案,在本申请实施例中,将从订单数据中提取的特征变量进行归一化处理,获得每一个特征变量的归一化值;并将属于同个特征类别的特征变量的归一化值进行累加,对累加数值再次进行归一化处理,获得特征类别的归一化值,从而根据不同特征类别的归一化值进行,即可以确定所述订单数据对应的交易是否为异常交易,每一个特征类别的归一化值的大小表明了交易异常情况,综合考虑多个特别类别的归一化值,即可以有效准确的确定订单数据的交易是否为异常交易。本申请实施例实现了异常交易的有效识别,通过二次归一化处理,提高了异常交易识别的准确度。
下面将结合附图对本申请技术方案进行详细描述。
图1为本申请实施例提供的一种异常交易识别方法一个实施例的流程图,该方法可以包括以下几个步骤:
101:获取订单数据,并根据所述订单数据,提取特征变量。
特征变量是指网上交易中的交易特征数据,以O2O交易为例,特别变量例如可以包括“买家交易金额”、“买家交易次数”、“买家注册邮箱乱码得分”和/或“买家注册邮箱被黑名单击中次数”等。
本申请实施例中的特征变量均可以以数值进行表示。
而每一个特征变量可以归属到一个特征类别下面,比如“买家交易金额”、“买家交易次数”、“买家注册邮箱乱码得分”、“买家注册邮箱被黑名单击中次数”等可以为买家属性的特征类别,当然特征类别还可以包括卖家属性、商品属性等等,或者用户自定义的特征类别,每一个特征类别下具有一个或多个特征变量。
特征变量可以从一个或多个订单数据中提取,比如,买家交易金额等可以从当前O2O订单数据中提取,买家交易次数等可以从多个O2O订单数据中提取同一个买家标识对应的交易次数。
本申请实施例,获取的订单数据是指同一卖家标识对应的订单数据。从而可以识别该卖家是否作弊,故意进行异常交易,以增加销量或者好评率等。
其中,每获得一个订单数据,均可以触发执行本实施例的操作流程。
102:将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值。
归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为标量,以方便进行数据的比较。
归一化处理可以多种计算方式,可以实现将特征变量归一化至0~1的数值范围内。
103:将属于同一个特征类别的特征变量的归一化值进行累加,获得累加数值。
104:将所述累加数值进行归一化处理,获得特征类别的归一化值。
由于在进行异常交易识别,需要综合考虑各个特征变量。
而不同特征变量可以归属到同一个特征类别下,因此为了进一步提高识别的准确度,可以将同一个特征类别下的特征变量进行二次归一化,具体的即将属于同一个特征类别的特征变量的归一化值进行累加,对累加数值再进行归一化处理,获得的归一化值即作为该特征类别的异常交易分数。
通过二次归一化,可以排除某些特征类别包含的特征变量多,某些特征类别包含的特征变量少,导致一些特征变量个数少的特别类别,贡献度会被特征变量个数多的特征类别的贡献度掩盖掉。
105:根据不同特征类别的归一化值,确定所述订单数据对应的交易是否为异常交易。
由于特别类别可能包括多个,因此可以获得多个特征类别的归一化化值,每一个特征类别的归一化值可以表示交易的异常情况。
因此,在进行异常交易识别时,可以是根据不同特征类别的归一化值,确定所述订单数据对应的交易是否为异常交易,比如:每一个特征类别的归一化值均位于对应异常范围内或者至少一个特征类别的归一化值位于其对应的异常范围内等时,可以确定为异常交易,异常范围可以根据识别精确度等实际情况确定。
当然还可以根据实际需求以及识别精确度采用其他的识别策略等。
通过进行二次归一化,对特别类别的归一化值进行判定,可以避免少量的特征变量异常时,也会认为出现异常交易的情况。
在本实施例中,通过将特征变量进行归一化处理,并根据属于同一特征类别的特征变量,进行二次归一化处理,获得特征类别的归一化值,将对异常交易的识别转换为数值的判定,实现了异常交易的有效识别,且经过二次归一化处理,将特征变量以及特别类别综合考虑,提高了异常交易识别的准确性。
其中,所述将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值。在一种可能的实现方式中,归一化可以采用LR(LogisticRegression,逻辑回归)函数实现。
因此将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值可以具体的,将每一个特征变量按照如下LR归一化公式进行归一化处理,获得每一个特征变量的归一化值。
其中,x表示特征变量,f(x)表示特征变量归一化值,a为归一化参数,为已知参数;
所述将所述累加数值进行归一化处理,获得特征类别的归一化值可以具体是,将所述累加数值按照如下LR归一化公式进行归一化处理,获得特征类别的归一化值;
其中,y表示特征变量,f(y)表示特征变量归一化值,a为归一化参数,为已知参数。
作为又一个实施例,由于某些特征变量只有超出数据允许范围时,才会认为可能是异常交易,比如特别变量为“买家当天餐饮交易次数”,由于O2O业务中买家到店餐饮消费当天3笔是正常的,也就是买家一天可以到饭店吃早中午3顿饭,可以在一个饭店,也可以在三个饭店,这些都是正常交易,而如果买家当天餐饮交易次数超过3次,则并不是正常现象,因此为了进一步提高识别准确度,所述将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值可以包括:
在任一个特征变量位于数据允许范围内时,确定所述特征变量的归一化值为零;
在所述特征变量超出数据允许范围时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值。
如上例所述,买家当天餐饮交易次数如果小于等于3次,则其对应的归一化即为零,而如果大于3次,再进行归一化处理,获得归一化值。如图2中所示,横轴表示特征变量“买家当天餐饮交易次数”,纵轴表示特征变量“当天餐饮交易次数”的归一化值,由图2可知,买家当天餐饮交易次数小于等于3次时,对应的归一化值为0,买家当天餐饮交易次数大于3时,对应的归一化值即是将买家当天餐饮交易次数进行归一化处理后获得的。
其中,不同特征变量对应的数据允许范围可能不同。
作为又一个实施例,由于某些特征变量可能对异常交易识别结果影响很大,或者在其数值很大时,对异常交易识别结果影响很大;或者某些特征变量可能对异常交易识别结果影响很小,或者在其数值很小时,对异常交易识别结果影响很小。
因此,所述将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值可以包括:
在任一个特征变量满足任一个异常条件时,将所述特征变量按照所述任一个异常条件对应的数值调整方式进行调整,并将调整之后的特征变量进行进行归一化处理,获得每一个特征变量的归一化值;否则将所述特征变量进行归一化处理,获得每一个特征变量的归一化值。
其中,异常条件可以包括多个,每一个异常条件对应的数值调整方式不同。从而可以根据特征变量对应的异常条件,对特征变量进行对应调整。针对同一个特征变量的多个异常条件之间可以阈值不同等。
比如,特征变量为买家交易金额时,特征变量满足的任一个异常条件可以为:买家交易金额高于金额阈值,且当天同一卖家中高于金额阈值的买家账户大于第一预设数量,且当天同一卖家中高于金额阈值的买家账户与当天同一卖家消费的全部买家账户比例大于第一预设比例;
此时,即可以按照其满足的异常条件对应的数值调整方式进行调整,调整方式例如为将特征变量的数值放大三倍等,从而将调整之后的特征变量进行进行归一化处理,获得每一个特征变量的归一化值;而如果不满足任一个异常条件,则将所述特征变量直接进行归一化处理,获得特征变量的归一化值。
或者特征变量满足的该任一个异常条件可以为:买家交易金额高于金额阈值,且当天同一卖家高于金额阈值的买家账户大于第二预设数量,且当天同一卖家高于金额阈值的买家账户与当天同一卖家消费的全部买家账户比例大于第二预设比例;
此时,即可以按照其满足的异常条件对应的数值调整方式进行调整,调整方式例如为将特征变量的数值放大六倍等,从而将调整之后的特征变量进行进行归一化处理,获得每一个特征变量的归一化值;而如果不满足异常条件,则将所述特征变量进行归一化处理,获得每一个特征变量的归一化值。
不同异常条件对应的数值调整方式不同,以由当天同一卖家中买家交易金额高于金额阈值的买家账户数量以及当天同一卖家买家交易金额高于金额阈值的买家账户与当天同一卖家消费的全部买家账户比例,这两个参数取不同数值获得的多个异常条件为例,数值调整方式为数值放大,不同异常条件对应的数值放大倍数一种可能的情况可以如下表1所示,
表1:
也即买家交易金额高于金额阈值的买家账户数量在5-10区间内,若当天同一卖家买家交易金额高于金额阈值的买家账户与当天同一卖家消费的全部买家账户比例在10-50%区间时,该特征变量买家交易金额即放大2倍,其他情况可以参见上表1,不再赘述。
由上述描述可知,将每一个特征变量进行归一化处理可以有多种处理方式,包括:将特征变量进行归一化处理,也即直接将特征变量的原始数值进行归一化;
以及在特征变量位于数据允许范围内时,确定特征变量的归一化值为零;在特征变量超出数据允许范围时,再将所述特征变量进行归一化处理;
以及在特征变量满足任一个异常条件时,将特征变量按照所述任一个异常条件对应的数值调整方式进行调整,并将调整之后的特征变量进行进行归一化处理;否则再将所述特征变量进行归一化处理。
由于特征变量包括多个,不同特征变量进行归一化的处理方法可以相同也可以不同,作为又一个实施例,可以为特征编码预先设置归一化模式,哪一个特征变量采用哪一种归一化模式可以预先设置,归一化模式主要可以包括三种:第一种归一化模式可以是直接将特征变量进行归一化处理;第二种归一化模式可以是对位于数据允许范围内的特征变量,归一化值为零,对超出数据允许范围的特征变量,按照归一化处理获得归一化值;第三种归一化模式可以是特征变量与异常条件进行判断,将按照异常条件对应的调整方式进行数值调整之后的特征变量进行进行归一化处理。
比如特征变量为买家交易次数,则需要对特征变量是否在数据允许范围内进行判断,又如特征变量为买家注册邮箱乱码得分,则需要将特征变量与异常条件进行判断,又如特征变量为买家交易金额,则可以直接进行归一化。
因此,作为又一个实施例,所述将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值可以包括:
在任一个特征变量对应的预设归一化模式为第一种归一化模式时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值;
在任一个特征变量对应的预设归一化模式为第二种归一化模式时,在所述特征变量位于数据允许范围内时,确定所述特征变量的归一化值为零;在所述特征变量超出数据允许范围时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值;
在任一个特征变量对应的预设归一化模式为第三种归一化模式时,在所述特征变量满足任一个异常条件时,将所述特征变量按照所述任一个异常条件对应的数值调整方式进行调整,并将调整之后的特征变量进行进行归一化处理,获得每一个特征变量的归一化值;在所述特征变量不满足任一个异常条件时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值。
每一个特征变量对应的归一化模式可以预先设置。
需要说明的是,同一个特征类别中的特别变量可能采用不同的归一化模式进行归一化处理。
作为又一个实施例,如图3所示,该异常交易识别方法可以包括以下几个步骤:
301:获取订单数据。
302:提取订单数据中特征变量。
303:识别每一个特征变量对应的预设归一化模式,并按照任一个特征变量对应的预设归一化模式进行归一化处理。
归一化模式包括第一种归一化模式、第二种归一化模式以及第三种归一化模式。
在任一个特征变量对应的预设归一化模式为第一种归一化模式时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值;
在任一个特征变量对应的预设归一化模式为第二种归一化模式时,在所述特征变量位于数据允许范围内时,确定所述特征变量的归一化值为零;在所述特征变量超出数据允许范围时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值;
在任一个特征变量对应的预设归一化模式为第三种归一化模式时,在所述特征变量满足任一个异常条件时,将所述特征变量按照所述任一个异常条件对应的数值调整方式进行调整,并将调整之后的特征变量进行进行归一化处理,获得每一个特征变量的归一化值;在所述特征变量不满足任一个异常条件时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值。
304:将属于同一个特征类别的特征变量的归一化值进行累加,获得累加数值。
305:将所述累加数值进行归一化处理,获得特征类别的归一化值。
306:将不同特征类别的归一化值相加,获得异常交易分数;
307:在所述异常交易分数位于异常范围内时,确定所述订单数据对应的交易为异常交易。
本实施例中,将不同特征类别的归一化值相加,获得异常交易分数,从而如果异常交易分数位于异常范围内,即可以确定订单数据对应的交易为异常交易。
例如假设特征类别包括A、B以及C,特征类别A包括特征变量a1、a2以及a3,特征类别B包括特征变量b1以及b2,特征类别C包括特征变量c1。
则异常交易分数为:SCORE=LR(A)+LR(B)+LR(C)其中:
LR(A)=LR(LR(a1)+LR(a2)+LR(a3));
LR(B)=LR(LR(b1)+LR(b2));
LR(C)=LR(c1);
LR表示归一化值。
其中,该异常范围可以根据实际需求或者识别精确度进行预先设置。
在本实施例中,通过将特征变量进行归一化处理,并根据属于同一特征类别的特征变量,进行二次归一化处理,获得特征类别的归一化值,将不同特别类别的归一化值的和值作为异常交易分数,进行判定,实现了异常交易有效准确的识别。
图4为本申请实施例提供的一种异常交易识别装置一个实施例的结构示意图,该装置可以包括:
变量提取模块401,用于获取订单数据,并根据所述订单数据,提取特征变量;
第一归一化模块402,用于将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值;
计算模块403,用于将属于同一个特征类别的特征变量的归一化值进行累加,获得累加数值;
第二归一化模块404,用于将所述累加数值进行归一化处理,获得特征类别的归一化值;
识别模块405,用于根据不同特征类别的归一化值,确定所述订单数据对应的交易是否为异常交易。
其中,将每一个特征变量进行归一化处理,在一种可能的实现方式中,归一化可以采用LR(Logistic Regression,逻辑回归)函数实现。
因此第一归一化模块将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值可以具体的,将每一个特征变量按照如下LR归一化公式进行归一化处理,获得每一个特征变量的归一化值。
其中,x表示特征变量,f(x)表示特征变量归一化值,a为归一化参数,为已知参数。
第二归一化模块将所述累加数值进行归一化处理,获得特征类别的归一化值可以具体是,将所述累加数值按照如下LR归一化公式进行归一化处理,获得特征类别的归一化值;
其中,y表示特征变量,f(y)表示特征变量归一化值,a为归一化参数,为已知参数。
作为又一个实施例,由于某些特征变量只有超出数据允许范围时,才会认为可能是异常交易,比如特别变量为“买家当天餐饮交易次数”,由于O2O业务中买家到店餐饮消费当天3笔是正常的,也就是买家一天可以到饭店吃早中午3顿饭,可以在一个饭店,也可以在三个饭店,这些都是正常交易,而如果买家当天餐饮交易次数超过3次,则并不是正常现象,因此为了进一步提高识别准确度。
所述第一归一化模块402可以具体用于:在任一个特征变量位于数据允许范围内时,确定所述特征变量的归一化值为零;
在所述特征变量超出数据允许范围时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值。
其中,不同特征变量对应的数据允许范围不同。
作为又一个实施例,由于某些特征变量可能对异常交易识别结果影响很大,或者在其数值很大时,对异常交易识别结果影响很大;或者某些特征变量可能对异常交易识别结果影响很小,或者在其数值很小时,对异常交易识别结果影响很小。
因此,所述第一归一化模块402可以具体用于:在任一个特征变量满足任一个异常条件时,将所述特征变量按照所述任一个异常条件对应的数值调整方式进行调整,并将调整之后的特征变量进行进行归一化处理,获得每一个特征变量的归一化值;在任一个特征变量不满足任一个异常条件时,将所述特征变量进行归一化处理,获得所述特征变量的归一化值。
其中,异常条件可以包括多个,每一个异常条件对应的数值调整方式不同。从而可以根据特征变量对应的异常条件,对特征变量进行对应调整。针对同一个特征变量的多个异常条件之间可以阈值不同等。
由上述描述可知,将每一个特征变量进行归一化处理可以有多种处理方式,包括:将特征变量进行归一化处理,也即直接将特征变量的原始数值进行归一化;
以及在特征变量位于数据允许范围内时,确定特征变量的归一化值为零;在特征变量超出数据允许范围时,再将所述特征变量进行归一化处理;
以及在特征变量满足任一个异常条件时,将特征变量按照所述任一个异常条件对应的数值调整方式进行调整,并将调整之后的特征变量进行进行归一化处理;否则再将所述特征变量进行归一化处理。
由于特征变量包括多个,不同特征变量进行归一化的处理方法可以相同也可以不同,,作为又一个实施例,可以为特征编码预先设置归一化模式,哪一个特征变量采用哪一种归一化模式可以预先设置,归一化模式主要可以包括三种:第一种归一化模式可以是直接将特征变量进行归一化处理;第二种归一化模式可以是对位于数据允许范围内的特征变量,归一化值为零,对超出数据允许范围的特征变量,按照归一化处理获得归一化值;第三种归一化模式可以是特征变量与异常条件进行判断,将按照异常条件对应的调整方式进行数值调整之后的特征变量进行进行归一化处理。
比如特征变量为买家交易次数,则需要对特征变量是否在数据允许范围内进行判断,又如特征变量为买家注册邮箱乱码得分,则需要将特征变量与异常条件进行判断,又如特征变量为买家交易金额,则可以直接进行归一化。
因此,作为又一个实施例,所述第一归一化模块可以具体用于:
在任一个特征变量对应的预设归一化模式为第一种归一化模式时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值;
在任一个特征变量对应的预设归一化模式为第二种归一化模式时,在所述特征变量位于数据允许范围内时,确定所述特征变量的归一化值为零;在所述特征变量超出数据允许范围时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值;
在任一个特征变量对应的预设归一化模式为第三种归一化模式时,在所述特征变量满足任一个异常条件时,将所述特征变量按照所述任一个异常条件对应的数值调整方式进行调整,并将调整之后的特征变量进行进行归一化处理,获得每一个特征变量的归一化值;否则将所述特征变量进行归一化处理,获得每一个特征变量的归一化值。
每一个特征变量对应的归一化模式可以预先设置。
需要说明的是,同一个特征类别中的特别变量可能采用不同的归一化模式进行归一化处理。
由于特别类别可能包括多个,因此可以获得多个特征类别的异常交易分数,识别模块在进行异常交易识别时,可以是根据不同特征类别的归一化值,确定所述订单数据对应的交易是否为异常交易,比如每一个特征类别的归一化值均大于第一阈值或者至少一个特征类别的归一化值大于第二阈值等时,可以确定为异常交易。
当然还可以采用其他可能的实现方式,如图5所示,该识别模块405可以包括:
计算单元501,将不同特征类别的归一化值相加,获得异常交易分数;
识别单元502,用于在所述异常交易分数位于异常范围内时,确定所述订单数据对应的交易为异常交易。
通过将不同特征类别的归一化值相加,获得异常交易分数,从而如果异常交易分数位于异常范围内,即可以确定订单数据对应的交易为异常交易。
本实施例中,通过将特征变量进行归一化处理,并根据属于同一特征类别的特征变量,进行二次归一化处理,获得特征类别的归一化值,将不同特别类别的归一化值的和值作为异常交易分数,进行判定,即便用户可以修改特征变量的数值,但是经过二次归一化处理,仍可以实现准确识别,提高异常交易识别的有效性和准确性。
本申请实施例提供的异常交易识别装置在实际应用中可以配置在交易服务器中,如O2O交易服务器,或者与交易服务器连接的独立的监控设备中。
因此本申请实施例还提供了一种异常交易识别设备,该异常交易设备包括至少包括收发器、存储器以及处理器;在实际应用中该异常交易识别设备可以为交易服务器,或者与交易服务器连接的独立的监控设备中。
所述收发器,用于获取订单数据;
所述存储器用于存储一组程序指令;
所述处理器用于调用所述存储器的程序指令,执行以下操作:
根据所述订单数据,提取特征变量;
将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值;
将属于同一个特征类别的特征变量的归一化值进行累加,获得累加数值;
将所述累加数值进行归一化处理,获得特征类别的归一化值;
根据不同特征类别的归一化值,确定所述订单数据对应的交易是否为异常交易。
通过本申请实施例的异常交易识别设备,实现了异常交易的有效识别,提高异常交易识别的准确度。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。此外,“耦接”一词在此包含任何直接及间接的电性耦接手段。因此,若文中描述一第一装置耦接于一第二装置,则代表所述第一装置可直接电性耦接于所述第二装置,或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述申请构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。

Claims (10)

1.一种异常交易识别方法,其特征在于,包括:
获取订单数据,并根据所述订单数据,提取特征变量;
将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值;
将属于同一个特征类别的特征变量的归一化值进行累加,获得累加数值;
将所述累加数值进行归一化处理,获得特征类别的归一化值;
根据不同特征类别的归一化值,确定所述订单数据对应的交易是否为异常交易。
2.如权利要求1所述的方法,其特征在于,所述将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值包括:
在任一个特征变量位于数据允许范围内时,确定所述特征变量的归一化值为零;
在所述特征变量超出数据允许范围时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值。
3.如权利要求1所述的方法,其特征在于,所述将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值包括:
在任一个特征变量满足任一个异常条件时,将所述特征变量按照所述任一个异常条件对应的数值调整方式进行调整,并将调整之后的特征变量进行进行归一化处理,获得所述特征变量的归一化值;
在任一个特征变量不满足任一个异常条件时,将所述特征变量进行归一化处理,获得所述特征变量的归一化值。
4.如权利要求1所述的方法,其特征在于,所述将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值包括:
在任一个特征变量对应的预设归一化模式为第一种归一化模式时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值;
在任一个特征变量对应的预设归一化模式为第二种归一化模式时,在所述特征变量位于数据允许范围内时,确定所述特征变量的归一化值为零;在所述特征变量超出数据允许范围时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值;
在任一个特征变量对应的预设归一化模式为第三种归一化模式时,在所述特征变量满足任一个异常条件时,将所述特征变量按照所述任一个异常条件对应的数值调整方式进行调整,并将调整之后的特征变量进行进行归一化处理,获得每一个特征变量的归一化值;在所述特征变量不满足任一个异常条件时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值。
5.如权利要求1所述的方法,其特征在于,所述根据不同特征类别的归一化值,确定所述订单数据对应的交易是否为异常交易包括:
将不同特征类别的归一化值相加,获得异常交易分数;
在所述异常交易分数位于异常范围内时,确定所述订单数据对应的交易为异常交易。
6.一种异常交易识别装置,其特征在于,包括:
变量提取模块,用于获取订单数据,并根据所述订单数据,提取特征变量;
第一归一化模块,用于将每一个特征变量进行归一化处理,获得每一个特征变量的归一化值;
计算模块,用于将属于同一个特征类别的特征变量的归一化值进行累加,获得累加数值;
第二归一化模块,用于将所述累加数值进行归一化处理,获得特征类别的归一化值;
识别模块,用于根据不同特征类别的归一化值,确定所述订单数据对应的交易是否为异常交易。
7.如权利要求6所述的装置,其特征在于,所述第一归一化模块具体用于:在任一个特征变量位于数据允许范围内时,确定所述特征变量的归一化值为零;
在所述特征变量超出数据允许范围时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值。
8.如权利要求6所述的装置,其特征在于,所述第一归一化模块具体用于:在任一个特征变量满足任一个异常条件时,将所述特征变量按照所述任一个异常条件对应的数值调整方式进行调整,并将调整之后的特征变量进行进行归一化处理,获得所述特征变量的归一化值;在任一个特征变量不满足任一个异常条件时,将所述特征变量进行归一化处理,获得所述特征变量的归一化值。
9.如权利要求6所述的装置,其特征在于,所述第一归一化模块具体用于:
在任一个特征变量对应的预设归一化模式为第一种归一化模式时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值;
在任一个特征变量对应的预设归一化模式为第二种归一化模式时,在所述特征变量位于数据允许范围内时,确定所述特征变量的归一化值为零;在所述特征变量超出数据允许范围时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值;
在任一个特征变量对应的预设归一化模式为第三种归一化模式时,在所述特征变量满足任一个异常条件时,将所述特征变量按照所述任一个异常条件对应的数值调整方式进行调整,并将调整之后的特征变量进行进行归一化处理,获得每一个特征变量的归一化值;在所述特征变量不满足任一个异常条件时,将所述特征变量进行归一化处理,获得每一个特征变量的归一化值。
10.如权利要求6所述的装置,其特征在于,所述识别模块包括:
计算单元,将不同特征类别的归一化值相加,获得异常交易分数;
识别单元,用于在所述异常交易分数位于异常范围内时,确定所述订单数据对应的交易为异常交易。
CN201610108558.0A 2016-02-26 2016-02-26 异常交易识别方法及装置 Pending CN107133833A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610108558.0A CN107133833A (zh) 2016-02-26 2016-02-26 异常交易识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610108558.0A CN107133833A (zh) 2016-02-26 2016-02-26 异常交易识别方法及装置

Publications (1)

Publication Number Publication Date
CN107133833A true CN107133833A (zh) 2017-09-05

Family

ID=59720579

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610108558.0A Pending CN107133833A (zh) 2016-02-26 2016-02-26 异常交易识别方法及装置

Country Status (1)

Country Link
CN (1) CN107133833A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034583A (zh) * 2018-07-17 2018-12-18 阿里巴巴集团控股有限公司 异常交易识别方法、装置及电子设备
CN110298563A (zh) * 2019-06-14 2019-10-01 达疆网络科技(上海)有限公司 一种判别风险订单的统计方法
CN110400082A (zh) * 2019-07-29 2019-11-01 中国工商银行股份有限公司 异常交易企业的识别方法和装置
WO2020062702A1 (zh) * 2018-09-26 2020-04-02 深圳壹账通智能科技有限公司 短信发送的方法、装置、计算机设备和存储介质
CN111316308A (zh) * 2017-09-30 2020-06-19 北京嘀嘀无限科技发展有限公司 用于识别错误订单请求的系统及方法
CN111985938A (zh) * 2020-08-18 2020-11-24 支付宝(杭州)信息技术有限公司 一种跨境交易的真实性验证方法、装置及设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998032085A1 (en) * 1997-01-21 1998-07-23 Northern Telecom Limited Generic processing capability
EP1073022A3 (en) * 1999-07-26 2005-02-02 Fujitsu Limited Automatic transaction apparatus
CN102034182A (zh) * 2010-11-29 2011-04-27 深圳市爱贝信息技术有限公司 支付平台账户安全交易的方法及装置
CN103064987A (zh) * 2013-01-31 2013-04-24 五八同城信息技术有限公司 一种虚假交易信息识别方法
CN103365969A (zh) * 2013-06-24 2013-10-23 北京奇虎科技有限公司 一种异常数据检测处理的方法和系统
CN104199832A (zh) * 2014-08-01 2014-12-10 西安理工大学 基于信息熵的金融网络异常交易社区发现方法
CN104751566A (zh) * 2013-12-30 2015-07-01 中国银联股份有限公司 监测伪卡风险的方法和实现该方法的交易处理系统
CN105184574A (zh) * 2015-06-30 2015-12-23 电子科技大学 一种套用商户类别码欺诈行为的检测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998032085A1 (en) * 1997-01-21 1998-07-23 Northern Telecom Limited Generic processing capability
EP1073022A3 (en) * 1999-07-26 2005-02-02 Fujitsu Limited Automatic transaction apparatus
CN102034182A (zh) * 2010-11-29 2011-04-27 深圳市爱贝信息技术有限公司 支付平台账户安全交易的方法及装置
CN103064987A (zh) * 2013-01-31 2013-04-24 五八同城信息技术有限公司 一种虚假交易信息识别方法
CN103365969A (zh) * 2013-06-24 2013-10-23 北京奇虎科技有限公司 一种异常数据检测处理的方法和系统
CN104751566A (zh) * 2013-12-30 2015-07-01 中国银联股份有限公司 监测伪卡风险的方法和实现该方法的交易处理系统
CN104199832A (zh) * 2014-08-01 2014-12-10 西安理工大学 基于信息熵的金融网络异常交易社区发现方法
CN105184574A (zh) * 2015-06-30 2015-12-23 电子科技大学 一种套用商户类别码欺诈行为的检测方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111316308A (zh) * 2017-09-30 2020-06-19 北京嘀嘀无限科技发展有限公司 用于识别错误订单请求的系统及方法
CN111316308B (zh) * 2017-09-30 2023-04-18 北京嘀嘀无限科技发展有限公司 用于识别错误订单请求的系统及方法
CN109034583A (zh) * 2018-07-17 2018-12-18 阿里巴巴集团控股有限公司 异常交易识别方法、装置及电子设备
WO2020062702A1 (zh) * 2018-09-26 2020-04-02 深圳壹账通智能科技有限公司 短信发送的方法、装置、计算机设备和存储介质
CN110298563A (zh) * 2019-06-14 2019-10-01 达疆网络科技(上海)有限公司 一种判别风险订单的统计方法
CN110400082A (zh) * 2019-07-29 2019-11-01 中国工商银行股份有限公司 异常交易企业的识别方法和装置
CN111985938A (zh) * 2020-08-18 2020-11-24 支付宝(杭州)信息技术有限公司 一种跨境交易的真实性验证方法、装置及设备

Similar Documents

Publication Publication Date Title
CN107133833A (zh) 异常交易识别方法及装置
Li et al. Offensive pricing strategies for online platforms
CN107918905A (zh) 异常交易识别方法、装置及服务器
CN108550052A (zh) 基于用户行为数据特征的刷单检测方法及系统
Awokuse et al. Threshold effects and asymmetric price adjustments in US dairy markets
US20220148067A1 (en) System for selection of regulated products
JP6262909B1 (ja) 算出装置、算出方法及び算出プログラム
CN107665448A (zh) 用于确定消费贡献价值的方法、装置以及存储介质
CN106980999A (zh) 一种用户推荐的方法和设备
JP6194092B1 (ja) 算出装置、算出方法及び算出プログラム
TW202034248A (zh) 風險識別方法及裝置
CN106779922A (zh) 推荐方法及装置
CN108292409A (zh) 消费者决策树生成系统
CN109213936A (zh) 商品搜索方法和装置
CN106682923A (zh) 商品调整方法及系统
Venkateswarlu et al. An inventory model for time varying deterioration and price dependent quadratic demand with salvage value
CN106157118A (zh) 一种电子商务oto终端分销系统数据处理方法
Lee et al. Threshold effects in the relationships between USD and gold futures by panel smooth transition approach
WO2017167064A1 (zh) 一种数据管控的方法及系统
Sun The impact of auction characteristics on prices of agricultural products traded online: evidence from cherries
CN109389482A (zh) 辅助选标的方法、终端及计算机可读介质
Danaee et al. Classifying and Designing Customer's Strategy Pyramid by Customer LifeTime Value (CLV)(Case study: Shargh Cement Company)
CN107123016A (zh) 一种工业物料商品推荐方法
CN104899766A (zh) 选择对象属性的方法及装置
CN111192112A (zh) 一种多平台的交互方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200921

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200921

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20170905

RJ01 Rejection of invention patent application after publication