CN108550052A - 基于用户行为数据特征的刷单检测方法及系统 - Google Patents

基于用户行为数据特征的刷单检测方法及系统 Download PDF

Info

Publication number
CN108550052A
CN108550052A CN201810288917.4A CN201810288917A CN108550052A CN 108550052 A CN108550052 A CN 108550052A CN 201810288917 A CN201810288917 A CN 201810288917A CN 108550052 A CN108550052 A CN 108550052A
Authority
CN
China
Prior art keywords
user
trading activity
brush
characteristic attribute
decision tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810288917.4A
Other languages
English (en)
Inventor
陈宇
陈鹏
熊伟
汪宁
芦帅
谢伟良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Pingpeng Intelligent Technology Co Ltd
Original Assignee
Hangzhou Pingpeng Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Pingpeng Intelligent Technology Co Ltd filed Critical Hangzhou Pingpeng Intelligent Technology Co Ltd
Priority to CN201810288917.4A priority Critical patent/CN108550052A/zh
Publication of CN108550052A publication Critical patent/CN108550052A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0609Buyer or seller confidence or verification

Landscapes

  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明提出一种基于用户行为数据特征的刷单检测方法及系统,该方法包括:获取当前待检测交易的交易行为信息,包括多维度的行为特征属性;输入所述交易行为信息至预先建立的大数据离群预测模型,提取出当前待检测交易中离群的行为特征属性,而判定其对应的交易行为为异常交易行为;针对所述异常交易行为的各个离群的行为特征属性,获取基于离群对应的行为特征属性构建的决策树进行验证,以判定所述异常交易行为是否为刷单行为。有效避免现有基于订单销量统计或简单规则的反刷单方式在应对日益专业的刷单手段时识别率偏低、容易失效等缺陷。

Description

基于用户行为数据特征的刷单检测方法及系统
技术领域
本发明涉及电子商务信息技术领域,尤其涉及的是一种基于用户行为数据特征的刷单检测方法及系统。
背景技术
在电子商务飞速发展的今天,网上购物已经变得十分普及,消费者在享受电子商务带来便捷的同时,也深受电子商务发展过快所带来的信誉欺诈问题的影响。目前,在电子商务的交易中,卖家和买家都是通过网络进行交易的,买家不了解卖家的实际情况,也无法看到实物本身,不知道卖家商品的好坏,只能通过网上的一些信息去进行判断。对于消费者来说,购物最主要的就是看卖家的商品描述、卖家的信誉、别人对于自己想购买的物品的评价。
随着电子商务市场规模蓬勃发展,卖家的竞争越来越大,商家付出的广告费、推广费与商品的销量和流量都有关系,销量好的商品可以得到更多的展示机会且更容易取信消费者。因此,一些不法商家通过刷单手段,获取平台更多的资源,以达到提升展现机会和销售转化的目的,这对诚信经营的商家和被误导的消费者造成了严重的伤害。此外,虚假交易行为严重扰乱了电商市场的正常秩序,更有甚者,借用刷单行为来进行诈骗,造成了严重的社会危害。
传统的反刷单方法往往基于某一商品的订单量在某段时间内的异常增长、大量相同访问IP及相同物流编号等信息对刷单行为进行识别。这种反刷单方法准确率低、识别效率不高且难以识别隐蔽的专业刷单行为。
发明内容
本发明所要解决的技术问题是提供一种基于用户行为数据特征的刷单检测方法及系统,有效避免现有基于订单销量统计或简单规则的反刷单方式在应对日益专业的刷单手段时识别率偏低、容易失效等缺陷。
为解决上述问题,本发明提出一种基于用户行为数据特征的刷单检测方法,包括以下步骤:
S1:获取当前待检测交易的交易行为信息,包括多维度的行为特征属性;
S2:输入所述交易行为信息至预先建立的大数据离群预测模型,提取出当前待检测交易中离群的行为特征属性,而判定其对应的交易行为为异常交易行为;所述大数据离群预测模型的建立步骤如下:
获取一定时间段内一定量的用户购买商品所发生的交易行为信息;
针对各个用户的交易行为信息,统计用户的多维度的行为特征属性,并将各个用户的行为特征属性依据属性关键词进行自动分集合归类;
对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型;
S3:针对所述异常交易行为的各个离群的行为特征属性,获取基于离群对应的行为特征属性构建的决策树进行验证,以判定所述异常交易行为是否为刷单行为。
根据本发明的一个实施例,所述多维度的行为特征属性包括:交易频率、售前咨询比率、复购率、确认收货时间、长评价比率、交易前网站页面浏览时长;
所述步骤S2中,将各个用户的行为特征属性依据属性关键词进行自动分集合归类后,对应得到包含有对应行为特征属性的数据集合A-F。
根据本发明的一个实施例,所述步骤S2中,
对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型,具体为:根据分集合归类各个行为特征属性后的数据集合A-F所包含的数据值,分别计算得到各个数据集合A-F的非离群取值区间,从而建立起用于判断各个行为特征属性是否离群的预测模型;
通过预先建立的大数据离群预测模型,筛选出当前待检测交易中离群的行为特征属性,具体为:针对当前待检测交易的交易行为信息,利用所述数据集合A-F的非离群取值区间分别计算各个对应的行为特征属性是否离群,甄选出当前待检测交易中离群的行为特征属性。
根据本发明的一个实施例,所述利用所述数据集合A-F的非离群取值区间分别计算各个对应的行为特征属性是否离群通过下述公式实现,若满足则为不离群,否则离群:
其中,a为确定用户的交易频率这一属性的非离群取值区间时所设的第一预设值,为数据集合A中交易频率的平均值;b为确定用户的售前咨询比率这一属性的非离群取值区间时所设的第二预设值,为数据集合B中售前咨询比率的平均值;c为确定用户的复购率这一属性的非离群取值区间时所设的第三预设值,为数据集合C中复购率的平均值;d为确定用户的确认收货时间这一属性的非离群取值区间时所设的第四预设值,为数据集合D中确认收货时间的平均值;e为确认用户的长评价比率这一属性的非离群取值区间时所设的第五预设值,为数据集合E中长评价比率的平均值;f为确定用户的交易前网站页面浏览时长这一属性的非离群取值区间时所设的第六预设值,为数据集合F中交易前网站页面浏览时长的平均值。
根据本发明的一个实施例,所述步骤S3包括:
S31:根据各个异常交易行为所存在的各个离群的行为特征属性,建立或者获取基于离群对应的行为特征属性的决策树;
S32:将每个所述异常交易行为中存在的各个离群的行为特征属性分别通过对应的决策树来验证,若所述异常交易行为中的全部离群的行为特征属性均被验证为刷单行为,则该异常交易行为判定为刷单行为,否则该异常交易行为判定为非刷单行为。
根据本发明的一个实施例,建立基于用户的交易频率这一特征属性的决策树包括以下步骤A1和A2:
A1:设定刷单行为的判定标准,将同时具有以下特征的IP或交易账号的交易行为判定为刷单行为:相同IP或交易账号的月购买商品频数大于一定单数;相同IP或交易账号购买商品的订单均为同一卖家的比例超过一定比例;相同IP或交易账号购买商品时收货地址一致;
A2:根据先验知识提取交易频率的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户同IP或交易账号的交易频率的决策树;
采用基于用户同IP或交易账号的交易频率的决策树验证时,获取初判为异常交易行为的待检测用户的月购买商品频数、卖家信息、收货地址,通过基于用户同IP或交易账号的交易频率的决策树判断异常交易行为是否为刷单行为。
根据本发明的一个实施例,建立基于用户的售前咨询比率这一特征属性的决策树包括以下步骤B1和B2:
B1:设定刷单行为的判定标准,将同时具有以下特征的用户售前咨询行为判定为刷单行为:超过一定比例的月订单均进行售前咨询;咨询时长均大于一定时长;
B2:根据先验知识提取售前咨询比率的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的售前咨询比率的决策树;
采用基于用户的售前咨询比率的决策树验证时,获取初判为异常交易行为的待检测用户购买商品订单信息、进行售前咨询信息,通过基于用户的售前咨询比率的决策树判断异常交易行为是否为刷单行为。
根据本发明的一个实施例,建立基于用户的复购率这一特征属性的决策树包括以下步骤C1和C2:
C1:设定刷单行为的判定标准,将同时具有以下特征的用户重复购买行为判定为刷单行为:相同交易账号月购买同一商品的频数大于一定单数;相同交易账号月购买同一商品均属于同一卖家;相同交易账号月购买同一商品收货地址均一致;
C2:根据先验知识提取复购率的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的复购率的决策树;
采用基于用户的复购率的决策树验证时,获取初判为异常交易行为的交易账号信息、对应账号购买同一商品的数量信息、卖家信息、商品收货地址,通过基于用户的复购率的决策树判断异常交易行为是否为刷单行为。
根据本发明的一个实施例,建立基于确认收货时间这一特征属性的决策树构包括以下步骤D1和D2:
D1:设定刷单交易的判定标准,将具有以下特征的确认收货行为判定为刷单行为:月购买一定比例以上订单的确认收货时间与下单时间间隔不超过一定时长;
D2:根据先验知识提取确认收货时间的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的确认收货时间的决策树;
采用基于用户的确认收货时间的决策树验证时,获取初判为异常交易行为的商品订单信息、下单时间、确认收货时间,通过基于用户的确认收货时间的决策树判断异常交易行为是否为刷单行为。
根据本发明的一个实施例,建立基于长评价比率这一特征属性的决策树构包括以下步骤E1和E2:
E1:设定刷单交易的判定标准,将同时具有以下特征的评价行为判定为刷单行为:月购买一定比例以上订单均参与评价;参与评价的订单评价字数均超过一定字数;参与评价的订单评价性质均为好评;
E2:根据先验知识提取属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的长评价比率的决策树;
采用基于用户的长评价比率的决策树验证时,获取初判为异常交易行为的商品订单信息、评价字数、评价性质、所对应用户参与评价的订单数量,通过基于用户的长评价比率的决策树判断异常交易行为是否为刷单行为。
根据本发明的一个实施例,基于交易前网站页面浏览时长这一特征属性的决策树构建步骤包括以下步骤F1和F2:
F1:设定刷单行为的判定标准,将具有以下特征的评价行为判定为刷单行为:月订单一定比例以上交易前浏览其他同类商品页面时长未超过一定时长;
F2:根据先验知识提取交易前网站页面浏览时长的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的交易前网站页面浏览时长的决策树;
采用基于用户的交易前网站页面浏览时长的决策树验证时,获取初判为异常交易行为的用户交易前浏览其他商品页面的时长信息,通过基于用户的交易前网站页面浏览时长的决策树判断异常交易行为是否为刷单行为。
本发明还提供一种基于用户行为数据特征的刷单检测系统,包括:
信息获取单元,执行获取当前待检测交易的交易行为信息,包括多维度的行为特征属性;
刷单行为初判单元,执行输入所述交易行为信息至预先建立的大数据离群预测模型,提取出当前待检测交易中离群的行为特征属性,而判定其对应的交易行为为异常交易行为;所述大数据离群预测模型的建立步骤如下:
获取一定时间段内一定量的用户购买商品所发生的交易行为信息;
针对各个用户的交易行为信息,统计用户的多维度的行为特征属性,并将各个用户的行为特征属性依据属性关键词进行自动分集合归类;
对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型;
刷单行为判定单元,执行针对所述异常交易行为的各个离群的行为特征属性,获取基于离群对应的行为特征属性构建的决策树进行验证,以判定所述异常交易行为是否为刷单行为。
采用上述技术方案后,本发明相比现有技术具有以下有益效果:
本发明通过对大量用户交易记录进行多维度上的特征统计分析从而甄选出离群的异常交易记录,其中多维度包括交易频率、售前咨询比率、复购率、确认收货时间、长评价比率、交易前网站页面浏览时长,覆盖了交易的多方面,从多个维度来筛选当前交易的异常点,准确率相较于传统的反刷单方法有大大的提高,可将隐蔽的刷单行为检测出来;同时,通过大数据离群检测算法检测出当前交易各个维度的离群数据,提高了异常交易的识别效率;另外,在上述离群数据筛选结果的基础上,利用决策树算法对离群数据进行决策树交叉验证,判断所甄选的离群记录是否为刷单行为,防止将正常交易误判为刷单,进一步提高了异常交易检测的准确率。
综上,与传统技术相比,基于用户行为数据特征的刷单检测方法使得识别率更高、且采用决策树验证提高了判断的准确性;同时在很大程度上维护了消费者的正当权益,保障了网上购物的真实性,也维持了电商市场的正常秩序。
附图说明
图1为本发明实施例的基于用户行为数据特征的刷单检测方法的流程示意图;
图2为本发明实施例的基于用户进行售前咨询比率这一特征属性所构建的决策树示意图;
图3为本发明实施例的基于用户长评价比率这一特征属性所构建的决策树示意图;
图4为本发明实施例的基于用户相同IP/付款账号交易频率这一特征属性所构建的决策树示意图;
图5为本发明实施例的基于用户确认收货时间这一特征属性所构建的决策树示意图;
图6为本发明实施例的基于用户复购率这一特征属性所构建的决策树示意图;
图7为本发明实施例的基于用户交易前浏览其他网站页面时长这一特征属性构建的决策树示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施的限制。
参看图1,在一个实施例中,基于用户行为数据特征的刷单检测方法可以包括以下步骤:
S1:获取当前待检测交易的交易行为信息,包括多维度的行为特征属性;
S2:输入所述交易行为信息至预先建立的大数据离群预测模型,提取出当前待检测交易中离群的行为特征属性,而判定其对应的交易行为为异常交易行为;所述大数据离群预测模型的建立步骤如下:
获取一定时间段内一定量的用户购买商品所发生的交易行为信息;
针对各个用户的交易行为信息,统计用户的多维度的行为特征属性,并将各个用户的行为特征属性依据属性关键词进行自动分集合归类;
对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型;
S3:针对所述异常交易行为的各个离群的行为特征属性,获取基于离群对应的行为特征属性构建的决策树进行验证,以判定所述异常交易行为是否为刷单行为。
本发明针对大量虚假交易的出现并且在现有技术无法甄别有组织的专业刷单的情况下,提出基于用户行为数据特征的刷单检测方法及系统,通过对过往用户的大量购物行为在多个维度上的特征统计分析数据,筛选出那些离群的行为特征属性具有的特性,从而建立模型。之后利用模型去检测当前交易中的行为特征属性是否离群,并采用离群的行为特征属性对应的决策树进行交叉验证和确定。解决了传统甄别虚假交易方法的不足,有效避免现有基于订单销量统计或简单规则的反刷单方法在应对日益专业的刷单手段时识别率偏低、容易失效等缺陷,同时也维持了电商市场的正常秩序,维护了消费者的正当权益。
下面对本发明实施例的基于用户行为数据特征的刷单检测方法进行更具体的描述。
步骤S1中,获取当前待检测交易的交易行为信息,包括多维度的行为特征属性。该多维度的行为特征属性是步骤S2中用来进行大数据离群预测的,因而符合模型的数据输入要求。
接着执行步骤S2,输入所述交易行为信息至预先建立的大数据离群预测模型,提取出当前待检测交易中离群的行为特征属性,而判定其对应的交易行为为异常交易行为。所述大数据离群预测模型的建立步骤如下:
1、获取一定时间段内一定量的用户购买商品所发生的交易行为信息;
2、针对各个用户的交易行为信息,统计用户的多维度的行为特征属性,并将各个用户的行为特征属性依据属性关键词进行自动分集合归类;
3、对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型。
大数据离群预测模型的建立步骤中,首先,获取一定时间段内一定量的用户购买商品所发生的交易行为信息。该一定量最好是大量的,优选是上万个,具体并不限制,例如获取某网购平台上10万个用户某段时间内购买商品的交易行为信息。同样的,所述的一定时间段也并不限制,可以根据需要而选择。所获取的交易行为信息中可以提取出用户多维度的行为特征属性数据。当然,获取的数据源可以是直接从网络平台上获取,当然也可以是预存在服务器中的数据,具体不限。网络平台是可购物的任意网络平台,具体不限。
本发明实施例获取的交易行为信息是基于用户的,各个用户拥有对应的交易行为信息。这些交易行为信息可以直接提取出行为特征属性数据,或者通过一定的统计计算之后得到行为特征属性数据。
大数据离群预测模型的建立步骤中,然后,针对各个用户的交易行为信息,统计用户的多维度的行为特征属性,并将各个所述用户的行为特征属性依据属性关键词进行自动分集合归类,可利用数据库查询语言通过计算机执行自动实现。
对用户的交易行为信息进行数据预处理,计算得出用户多维度的行为特征属性,不再是单一维度,而且是基于用户的交易行为信息处理得到的行为特征属性,提高刷单行为的识别率。
优选的,所述步骤S2中,多维度的行为特征属性包括:交易频率、售前咨询比率、复购率、确认收货时间、长评价比率、交易前网站页面浏览时长。当然,步骤S1中的多维度的行为特征属性也可以包括这些内容。
交易频率可以是用户的同IP或交易账号(交易账号例如是付款账号)的交易频率。同IP/付款账号的交易频率指用户使用同一交易账号或者相同IP地址在某段时间内交易次数所占该用户总交易次数的比例。售前咨询比率指用户交易前与卖家进行商品咨询的交易次数所占该用户总交易次数的比例。复购率指单位时间段(设定)内用户使用某一交易账号对某一商品的重复购买次数。长评价比率指用户对商品进行评价的字数超过一定字数(例如是200字)的订单所占总交易订单的比例。确认收货时间指用户购买商品并付款后在交易平台与卖家确认货物已收到的时间。交易前网站页面浏览时长指用户购买商品前浏览其他同类商品网页的时长。以上统计数据的依据均为从某网购平台上获取的10万个用户某段时间内购买商品的交易行为信息,以上所涉及的用户总交易也为该笔数据中该用户的总交易。
将各个用户的行为特征属性依据属性关键词进行自动分集合归类后,对应得到包含有对应行为特征属性的数据集合A-F。
本发明实施例采用多维度统计分析,基于用户交易行为信息中多个属性角度对数据进行统计筛选,即用户同IP/付款账号的交易频率、进行售前咨询的比率、复购率、确定收货时间、长评价比率、交易前网站页面浏览时长,经统计后将数据相近的属性所对应的交易行为归为一类,从而筛选出离群的异常交易行为。
用户的数量例如是n个。在选取的用户交易行为信息中,将各个用户所对应的同IP/付款账号的交易频率A1、A2、A3...Ar这一特征属性分配至数据集合A中,即A={A1、A2、A3...An};将各个用户所对应的进行售前咨询比率B1、B2、B3...Bn这一特征属性分配至数据集合B中,即B={B1、B2、B3...Bn},将各个用户所对应的复购率C1、C2、C3...Cn这一特征属性分配至数据集合C中,即C={C1、C2、C3...Cn};将各个用户所对应的确定收货时间D1、D2、D3...Dn这一特征属性分配至数据集合D中,即D={D1、D2、D3...Dn};将各个用户所对应的长评价比率E1、E2、E3...En这一特征属性分配至数据集合E中,即E={E1、E2、E3...En},将各个用户所对应的交易前网站页面浏览时长F1、F2、F3...Fn这一特征属性分配至数据集合F中,即F={F1、F2、F3...Fn}。
大数据离群预测模型的建立步骤中,最后,对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型。
从而可以根据建立的大数据离群预测模型,将步骤S1中的当前待检测的交易行为信息进行初判,筛选出当前待检测交易中离群的行为特征属性,将其对应的交易行为初判为异常交易行为。
在一个实施例中,所述步骤S2中,
对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型,具体为:根据分集合归类各个行为特征属性后的数据集合A-F所包含的数据值,分别计算得到各个数据集合A-F的非离群取值区间,从而建立起用于判断各个行为特征属性是否离群的预测模型;
通过预先建立的大数据离群预测模型,筛选出当前待检测交易中离群的行为特征属性,具体为:针对当前待检测交易的交易行为信息,利用所述数据集合A-F的非离群取值区间分别计算各个对应的行为特征属性是否离群,甄选出当前待检测交易中离群的行为特征属性。
优选的,所述利用所述数据集合A-F的非离群取值区间分别计算各个对应的行为特征属性是否离群通过下述公式实现,若满足则为不离群,否则离群:
其中,a为确定用户的交易频率这一属性的非离群取值区间时所设的第一预设值,为数据集合A中交易频率的平均值;可由下式计算得:
b为确定用户的售前咨询比率这一属性的非离群取值区间时所设的第二预设值,为数据集合B中售前咨询比率的平均值;可由下式计算得:
c为确定用户的复购率这一属性的非离群取值区间时所设的第三预设值,为数据集合C中复购率的平均值;可由下式计算得:
d为确定用户的确认收货时间这一属性的非离群取值区间时所设的第四预设值,为数据集合D中确认收货时间的平均值;可由下式计算得:
e为确认用户的长评价比率这一属性的非离群取值区间时所设的第五预设值,为数据集合E中长评价比率的平均值;可由下式计算得:
f为确定用户的交易前网站页面浏览时长这一属性的非离群取值区间时所设的第六预设值,为数据集合F中交易前网站页面浏览时长的平均值,可由下式计算得知:
预设值a~f可以根据数据的分布确定,在获取对应数据的时候,可以统计得出大部分数据的数字区间,从而可以设定出偏远数据的判定阈值。
本实施例将对用户的交易行为信息中选定的每个属性进行逐个判定,若用户交易行为信息中存在任何一个或一个以上属性未落入上述非离群取值区间内,则该属性为离群的异常属性,提取该属性所对应的用户交易行为,并将该交易行为初判为异常交易行为。
在初判出异常交易行为后,接着执行步骤S3,针对所述异常交易行为的各个离群的行为特征属性,获取基于离群对应的行为特征属性构建的决策树进行验证,以判定所述异常交易行为是否为刷单行为。
若在甄选离群的异常交易行为时用户因某一个或者一个以上特征属性异常而被初判为异常交易行为,在进行决策树验证时则基于离群的异常特征属性对初判为异常交易的行为进行验证。
在一个实施例中,所述步骤S3包括:
S31:根据各个异常交易行为所存在的各个离群的行为特征属性,建立或者获取基于离群对应的行为特征属性的决策树;由于在行为特征属性数据均确定的情况下,这些决策树可以预先建立,而在确定离群的行为特征属性时,可以基于该离群的行为特征属性调取对应的决策树进行判定;
S32:将每个所述异常交易行为中存在的各个离群的行为特征属性分别通过对应的决策树来验证,若所述异常交易行为中的全部离群的行为特征属性均被验证为刷单行为,则该异常交易行为判定为刷单行为,否则该异常交易行为判定为非刷单行为。
若在筛选离群交易行为时某个用户因多个特征属性异常而被初判为异常交易行为,则分别用对应的决策树进行验证,若其中一个决策树判定为刷单,则必须进行下一个决策树的判定,必须要离群属性特征均为刷单才行,只要有其中一个判为非刷单,则该交易为非刷单,提高判为刷单的条件,以防止将正常交易误判为刷单。
优选的,参看图4,建立基于用户的交易频率这一特征属性的决策树包括以下步骤A1和A2:
A1:设定刷单行为的判定标准,将同时具有以下特征的IP或交易账号的交易行为判定为刷单行为:相同IP或交易账号的月购买商品频数大于一定单数,例如是10单;相同IP或交易账号购买商品的订单均为同一卖家的比例超过一定比例,例如是90%;相同IP或交易账号购买商品时收货地址一致;
A2:根据先验知识提取交易频率的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户同IP或交易账号的交易频率的决策树。
信息增益可以对属性特征进行一定的定量,可以通过信息学知识来计算信息增益,在此不再赘述。
采用基于用户同IP或交易账号的交易频率的决策树验证时,获取初判为异常交易行为的待检测用户的月购买商品频数、卖家信息、收货地址,通过基于用户同IP或交易账号的交易频率的决策树判断异常交易行为是否为刷单行为。
优选的,参看图2,建立基于用户的售前咨询比率这一特征属性的决策树包括以下步骤B1和B2:
B1:设定刷单行为的判定标准,将同时具有以下特征的用户售前咨询行为判定为刷单行为:超过一定比例的月订单均进行售前咨询,例如是90%以上;咨询时长均大于一定时长,例如是8min;
B2:根据先验知识提取售前咨询比率的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的售前咨询比率的决策树。
采用基于用户的售前咨询比率的决策树验证时,获取初判为异常交易行为的待检测用户购买商品订单信息、进行售前咨询信息,通过基于用户的售前咨询比率的决策树判断异常交易行为是否为刷单行为。
优选的,参看图6,建立基于用户的复购率这一特征属性的决策树包括以下步骤C1和C2:
C1:设定刷单行为的判定标准,将同时具有以下特征的用户重复购买行为判定为刷单行为:相同交易账号月购买同一商品的频数大于一定单数,例如是10单;相同交易账号月购买同一商品均属于同一卖家;相同交易账号月购买同一商品收货地址均一致;
C2:根据先验知识提取复购率的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的复购率的决策树。
采用基于用户的复购率的决策树验证时,获取初判为异常交易行为的交易账号信息、对应账号购买同一商品的数量信息、卖家信息、商品收货地址,通过基于用户的复购率的决策树判断异常交易行为是否为刷单行为。
优选的,参看图5,建立基于确认收货时间这一特征属性的决策树构包括以下步骤D1和D2:
D1:设定刷单交易的判定标准,将具有以下特征的确认收货行为判定为刷单行为:月购买一定比例(例如是90%)以上订单的确认收货时间与下单时间间隔不超过一定时长(例如2小时);
D2:根据先验知识提取确认收货时间的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的确认收货时间的决策树;
采用基于用户的确认收货时间的决策树验证时,获取初判为异常交易行为的商品订单信息、下单时间、确认收货时间,通过基于用户的确认收货时间的决策树判断异常交易行为是否为刷单行为。
优选的,参看图3,建立基于长评价比率这一特征属性的决策树构包括以下步骤E1和E2:
E1:设定刷单交易的判定标准,将同时具有以下特征的评价行为判定为刷单行为:月购买一定比例(例如是90%)以上订单均参与评价;参与评价的订单评价字数均超过一定字数(例如是200字);参与评价的订单评价性质均为好评;
E2:根据先验知识提取属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的长评价比率的决策树;
采用基于用户的长评价比率的决策树验证时,获取初判为异常交易行为的商品订单信息、评价字数、评价性质、所对应用户参与评价的订单数量,通过基于用户的长评价比率的决策树判断异常交易行为是否为刷单行为。
优选的,参看图7,基于交易前网站页面浏览时长这一特征属性的决策树构建步骤包括以下步骤F1和F2:
F1:设定刷单行为的判定标准,将具有以下特征的评价行为判定为刷单行为:月订单一定比例(例如是80%)以上交易前浏览其他同类商品页面时长未超过一定时长(2min);
F2:根据先验知识提取交易前网站页面浏览时长的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的交易前网站页面浏览时长的决策树;
采用基于用户的交易前网站页面浏览时长的决策树验证时,获取初判为异常交易行为的用户交易前浏览其他商品页面的时长信息,通过基于用户的交易前网站页面浏览时长的决策树判断异常交易行为是否为刷单行为。
下面结合一个具体实例对本发明进一步解释:
获取某网购平台上10万个用户某段时间内购买商品的交易行为信息,对数据进行预处理后计算得出用户同IP/付款账号的交易频率、售前咨询比率、复购率、确认收货时间、长评价比率、交易前网站页面浏览时长。下面仅以其中10个为例,具体信息如表(1)所示:
表(1)
获取用户行为交易信息后,对用户交易信息进行预处理,计算得出用户同IP/付款账号的交易频率、售前咨询比率、确认收货时间、复购率、长评价比率、交易前网站页面浏览时长、同一IP地址切换不同账号进行交易的交易频率这七个特征属性,将该实施例中用户同IP/付款账号的交易频率这一特征属性划分至数据集合A中,其中A={0.28、0.30......0.28};将该实施例中用户进行售前咨询=比率这一特征属性划分至数据集合B中,其中B={20.00%、0.00%......25.00%};将该实施例用户复购率这一特征属性划分至数据集合C中,其中C={1.00%、0.00%......5.00%};将该实施例中用户确认收货时间这一特征属性划分至数据集合D中,其中D={80h、120h......88h};将该实施例中用户长评价比率这一特征属性划分至数据集合E中,其中E={39.00%、36.00%......35.00%},将该实施例中用户交易前网站页面浏览时长这一特征属性划分至数据集合F中,其中F={5min、8min......9min}。
设用户交易行为信息中同IP/付款账号的交易频率的平均值为根据表(1)提供的数据,可由下式计算:
经计算得知,用户的交易行为信息中用户同IP/付款账号的交易频率的平均值为0.296,系统在确定用户同IP/付款账号交易频率这一属性的非离群取值区间时所设的预设值a=0.15,根据本发明实施例提供的计算公式来判断待检测交易行为是否属于离群的异常交易行为:
0.296-0.15≤Ai≤0.296+0.15
设用户进行售前咨询比率的平均值为根据表(1)提供的数据,可由下式计算:
经计算得知,用户的交易行为信息中用户进行售前咨询比率的平均值为0.236,系统在确定用户进行售前咨询比率这一属性的非离群取值区间时所设的预设值b=0.1,根据本发明实施例提供的计算公式来判断待检测交易行为是否属于离群的异常交易行为:
0.236-0.1≤Bi≤0.236+0.1
设用户复购率的平均值为根据表(1)提供的数据,可由下式计算:
经计算得知,用户的交易行为中用户复购率的平均值为0.068,系统在确定用户复购率这一属性的非离群取值区间时所设的预设值c=0.06,根据本发明实施例提供的计算公式来判断待检测交易行为是否属于离群的异常交易行为:
0.068-0.06≤Ci≤0.068+0.06
设用户确认收货时间的平均值为根据表(1)提供的数据,可由下式计算:
经计算得知,用户的交易行为中确定收货时间的平均值为78.5h,系统在确定用户确认收货时间这一属性的非离群取值区间时所设的预设值d=24h,根据本发明实施例提供的计算公式来判断待检测交易行为是否属于离群的异常交易行为:
78.5-24≤Di≤78.5+24
设用户长评价比率的平均值为根据表(1)提供的数据,可由下式计算:
经计算得知,用户的交易行为中长评价比率的平均值为0.402,系统在确定用户长评价比率这一属性的非离群取值区间时所设的预设值e=0.2,根据本发明实施例提供的计算公式来判断待检测交易行为是否属于离群的异常交易行为:
0.402-0.2≤Ei≤0.402+0.2
设用户交易前网站页面浏览时长的平均值为根据表(1)中提供的数据,可由下式计算:
经计算得知,用户的交易行为中用户交易前浏览网站页面时长的平均值为6.7min,系统在确定用户交易前浏览网站页面时长这一属性的非离群取值区间时所设的预设值f=4min,根据本发明实施例提供的计算公式来判断待检测交易行为是否属于离群的异常交易行为:
6.7-4≤Fi≤6.7+4
至此,大数据离群预测模型建立完成。
现当前有一笔交易信息如下:
通过大数据离群预测模型筛选出该交易的离群的属性特征为售前咨询比率、复购率、确认收货时间,因此将上述交易初判为异常交易行为,再通过决策树对其是否是刷单行为进行进一步的判定,具体步骤如下:
若在甄选离群的异常交易行为时用户因某一个或者一个以上特征属性异常而被初判为异常交易行为,在进行决策树判定时则基于离群的异常特征属性对初判为异常的交易行为进行交叉验证。
若在筛选离群交易行为时某个用户因多个特征属性异常而被初判为异常交易行为,则分别用对应的决策树进行验证,若其中一个决策树判定为刷单,则必须进行另一个决策树的判定,必须要离群属性特征均为刷单才行,只要有其中一个判为非刷单,则该交易为非刷单。
对于上述交易行为,在筛选离群交易行为时因售前咨询比率、复购率、确认收货时间这三个特征属性异常而被初判为异常交易行为,故在进行决策树验证时基于这三个特征属性对其构建或获取决策树,若这三个特征属性在决策树验证时均满足刷单交易的判定标准,则确定该用户的交易行为为刷单行为,具体步骤可以分别根据图2、图6和图5来实现。
基于该用户售前咨询比率这一特征属性构建决策树验证如图2所示,具体步骤如下:
获取该用户近一个月内购买商品的进行售前咨询的记录,如表(2)所示:
交易账号 交易时间 商品名称 是否进行售前咨询 咨询时长
marry@qq.com 2017.11.01 登山靴 0
marry@qq.com 2017.11.01 登山包 0
marry@qq.com 2017.11.02 棉衣 0
marry@qq.com 2017.11.06 棉衣 0
marry@qq.com 2017.11.15 羽绒服 0
marry@qq.com 2017.11.18 羽绒服 0
marry@qq.com 2017.11.18 钢笔 0
marry@qq.com 2017.11.20 钢笔 0
marry@qq.com 2017.11.29 钢笔 0
marry@qq.com 2017.11.30 钢笔 0
表(2)
由上表可知,该用户近一个月内购买商品时均未进行售前咨询,该用户进行售前咨询行为不符合刷单判定标准,故不需要再从复购率、确认收货时间这两个特征属性对其进行决策树,故该交易行为不属于刷单行为。
另当前有一笔交易信息如下:
对于该笔交易行为,在筛选离群交易行为时因长评价比率这一个特征属性异常而被初判为异常交易行为,故在进行决策树验证时基于这一个特征属性对其构建决策树,若这一个特征属性在决策树验证时均满足刷单交易的判定标准,则确定该用户的交易行为为刷单行为,具体步骤如下:
基于该用户长评价比率这一特征属性构建决策树验证如图3所示,具体步骤如下:
获取该用户近一个月内购买商品时参与评价的记录信息,如表(3)所示:
交易账号 交易时间 商品名称 是否参与评价 评价字数 评价性质
13862035028 2017.11.04 手机 220 好评
13862035028 2017.11.04 棉衣 218 好评
13862035028 2017.11.17 棉衣 209 好评
13862035028 2017.11.18 棉衣 200 好评
13862035028 2017.11.18 拖鞋 254 好评
13862035028 2017.11.18 羽绒服 204 好评
13862035028 2017.11.19 拖鞋 213 好评
13862035028 2017.11.25 拖鞋 222 好评
13862035028 2017.11.27 拖鞋 224 好评
13862035028 2017.11.29 围巾 235 好评
13862035028 2017.11.30 羽绒服 220 好评
13862035028 2017.11.30 卫衣 210 好评
13862035028 2017.11.30 棉衣 201 好评
表(3)
由上表可知,该用户近一个月内购买商品时90%以上订单均参与评价,且每笔订单评价字数均为200字以上,评价性质均为好评;该用户参与评价行为符合刷单标准,故该笔交易行为属于刷单行为。
本发明还提供一种基于用户行为数据特征的刷单检测系统,包括:
信息获取单元,执行获取当前待检测交易的交易行为信息,包括多维度的行为特征属性;
刷单行为初判单元,执行输入所述交易行为信息至预先建立的大数据离群预测模型,提取出当前待检测交易中离群的行为特征属性,而判定其对应的交易行为为异常交易行为;所述大数据离群预测模型的建立步骤如下:
获取一定时间段内一定量的用户购买商品所发生的交易行为信息;
针对各个用户的交易行为信息,统计用户的多维度的行为特征属性,并将各个用户的行为特征属性依据属性关键词进行自动分集合归类;
对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型;
刷单行为判定单元,执行针对所述异常交易行为的各个离群的行为特征属性,获取基于离群对应的行为特征属性构建的决策树进行验证,以判定所述异常交易行为是否为刷单行为。
关于本发明实施例的基于用户行为数据特征的刷单检测系统的具体内容可以参看前述实施例中关于基于用户行为数据特征的刷单检测方法部分的描述内容,在此不再赘述。
本发明虽然以较佳实施例公开如上,但其并不是用来限定权利要求,任何本领域技术人员在不脱离本发明的精神和范围内,都可以做出可能的变动和修改,因此本发明的保护范围应当以本发明权利要求所界定的范围为准。

Claims (12)

1.一种基于用户行为数据特征的刷单检测方法,其特征在于,包括以下步骤:
S1:获取当前待检测交易的交易行为信息,包括多维度的行为特征属性;
S2:输入所述交易行为信息至预先建立的大数据离群预测模型,提取出当前待检测交易中离群的行为特征属性,而判定其对应的交易行为为异常交易行为;所述大数据离群预测模型的建立步骤如下:
获取一定时间段内一定量的用户购买商品所发生的交易行为信息;
针对各个用户的交易行为信息,统计用户的多维度的行为特征属性,并将各个用户的行为特征属性依据属性关键词进行自动分集合归类;
对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型;
S3:针对所述异常交易行为的各个离群的行为特征属性,获取基于离群对应的行为特征属性构建的决策树进行验证,以判定所述异常交易行为是否为刷单行为。
2.如权利要求1所述的基于用户行为数据特征的刷单检测方法,其特征在于,所述多维度的行为特征属性包括:交易频率、售前咨询比率、复购率、确认收货时间、长评价比率、交易前网站页面浏览时长;
所述步骤S2中,将各个用户的行为特征属性依据属性关键词进行自动分集合归类后,对应得到包含有对应行为特征属性的数据集合A-F。
3.如权利要求2所述的基于用户行为数据特征的刷单检测方法,其特征在于,所述步骤S2中,
对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型,具体为:根据分集合归类各个行为特征属性后的数据集合A-F所包含的数据值,分别计算得到各个数据集合A-F的非离群取值区间,从而建立起用于判断各个行为特征属性是否离群的预测模型;
通过预先建立的大数据离群预测模型,筛选出当前待检测交易中离群的行为特征属性,具体为:针对当前待检测交易的交易行为信息,利用所述数据集合A-F的非离群取值区间分别计算各个对应的行为特征属性是否离群,甄选出当前待检测交易中离群的行为特征属性。
4.如权利要求3所述的基于用户行为数据特征的刷单检测方法,其特征在于,所述利用所述数据集合A-F的非离群取值区间分别计算各个对应的行为特征属性是否离群通过下述公式实现,若满足则为不离群,否则离群:
其中,a为确定用户的交易频率这一属性的非离群取值区间时所设的第一预设值,为数据集合A中交易频率的平均值;b为确定用户的售前咨询比率这一属性的非离群取值区间时所设的第二预设值,为数据集合B中售前咨询比率的平均值;c为确定用户的复购率这一属性的非离群取值区间时所设的第三预设值,为数据集合C中复购率的平均值;d为确定用户的确认收货时间这一属性的非离群取值区间时所设的第四预设值,为数据集合D中确认收货时间的平均值;e为确认用户的长评价比率这一属性的非离群取值区间时所设的第五预设值,为数据集合E中长评价比率的平均值;f为确定用户的交易前网站页面浏览时长这一属性的非离群取值区间时所设的第六预设值,为数据集合F中交易前网站页面浏览时长的平均值。
5.如权利要求2所述的基于用户行为数据特征的刷单检测方法,其特征在于,所述步骤S3包括:
S31:根据各个异常交易行为所存在的各个离群的行为特征属性,建立或者获取基于离群对应的行为特征属性的决策树;
S32:将每个所述异常交易行为中存在的各个离群的行为特征属性分别通过对应的决策树来验证,若所述异常交易行为中的全部离群的行为特征属性均被验证为刷单行为,则该异常交易行为判定为刷单行为,否则该异常交易行为判定为非刷单行为。
6.如权利要求5所述的基于用户行为数据特征的刷单检测方法,其特征在于,建立基于用户的交易频率这一特征属性的决策树包括以下步骤A1和A2:
A1:设定刷单行为的判定标准,将同时具有以下特征的IP或交易账号的交易行为判定为刷单行为:相同IP或交易账号的月购买商品频数大于一定单数;相同IP或交易账号购买商品的订单均为同一卖家的比例超过一定比例;相同IP或交易账号购买商品时收货地址一致;
A2:根据先验知识提取交易频率的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户同IP或交易账号的交易频率的决策树;
采用基于用户同IP或交易账号的交易频率的决策树验证时,获取初判为异常交易行为的待检测用户的月购买商品频数、卖家信息、收货地址,通过基于用户同IP或交易账号的交易频率的决策树判断异常交易行为是否为刷单行为。
7.如权利要求5所述的基于用户行为数据特征的刷单检测方法,其特征在于,建立基于用户的售前咨询比率这一特征属性的决策树包括以下步骤B1和B2:
B1:设定刷单行为的判定标准,将同时具有以下特征的用户售前咨询行为判定为刷单行为:超过一定比例的月订单均进行售前咨询;咨询时长均大于一定时长;
B2:根据先验知识提取售前咨询比率的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的售前咨询比率的决策树;
采用基于用户的售前咨询比率的决策树验证时,获取初判为异常交易行为的待检测用户购买商品订单信息、进行售前咨询信息,通过基于用户的售前咨询比率的决策树判断异常交易行为是否为刷单行为。
8.如权利要求5所述的基于用户行为数据特征的刷单检测方法,其特征在于,建立基于用户的复购率这一特征属性的决策树包括以下步骤C1和C2:
C1:设定刷单行为的判定标准,将同时具有以下特征的用户重复购买行为判定为刷单行为:相同交易账号月购买同一商品的频数大于一定单数;相同交易账号月购买同一商品均属于同一卖家;相同交易账号月购买同一商品收货地址均一致;
C2:根据先验知识提取复购率的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的复购率的决策树;
采用基于用户的复购率的决策树验证时,获取初判为异常交易行为的交易账号信息、对应账号购买同一商品的数量信息、卖家信息、商品收货地址,通过基于用户的复购率的决策树判断异常交易行为是否为刷单行为。
9.如权利要求5所述的基于用户行为数据特征的刷单检测方法,其特征在于,建立基于确认收货时间这一特征属性的决策树构包括以下步骤D1和D2:
D1:设定刷单交易的判定标准,将具有以下特征的确认收货行为判定为刷单行为:月购买一定比例以上订单的确认收货时间与下单时间间隔不超过一定时长;
D2:根据先验知识提取确认收货时间的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的确认收货时间的决策树;
采用基于用户的确认收货时间的决策树验证时,获取初判为异常交易行为的商品订单信息、下单时间、确认收货时间,通过基于用户的确认收货时间的决策树判断异常交易行为是否为刷单行为。
10.如权利要求5所述的基于用户行为数据特征的刷单检测方法,其特征在于,建立基于长评价比率这一特征属性的决策树构包括以下步骤E1和E2:
E1:设定刷单交易的判定标准,将同时具有以下特征的评价行为判定为刷单行为:月购买一定比例以上订单均参与评价;参与评价的订单评价字数均超过一定字数;参与评价的订单评价性质均为好评;
E2:根据先验知识提取属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的长评价比率的决策树;
采用基于用户的长评价比率的决策树验证时,获取初判为异常交易行为的商品订单信息、评价字数、评价性质、所对应用户参与评价的订单数量,通过基于用户的长评价比率的决策树判断异常交易行为是否为刷单行为。
11.如权利要求5所述的基于用户行为数据特征的刷单检测方法,其特征在于,基于交易前网站页面浏览时长这一特征属性的决策树构建步骤包括以下步骤F1和F2:
F1:设定刷单行为的判定标准,将具有以下特征的评价行为判定为刷单行为:月订单一定比例以上交易前浏览其他同类商品页面时长未超过一定时长;
F2:根据先验知识提取交易前网站页面浏览时长的属性特征并生成训练数据集,结合判定标准计算训练数据集中包含的每个属性特征的信息增益,根据信息增益选择分裂节点构造基于用户的交易前网站页面浏览时长的决策树;
采用基于用户的交易前网站页面浏览时长的决策树验证时,获取初判为异常交易行为的用户交易前浏览其他商品页面的时长信息,通过基于用户的交易前网站页面浏览时长的决策树判断异常交易行为是否为刷单行为。
12.一种基于用户行为数据特征的刷单检测系统,其特征在于,包括:
信息获取单元,执行获取当前待检测交易的交易行为信息,包括多维度的行为特征属性;
刷单行为初判单元,执行输入所述交易行为信息至预先建立的大数据离群预测模型,提取出当前待检测交易中离群的行为特征属性,而判定其对应的交易行为为异常交易行为;所述大数据离群预测模型的建立步骤如下:
获取一定时间段内一定量的用户购买商品所发生的交易行为信息;
针对各个用户的交易行为信息,统计用户的多维度的行为特征属性,并将各个用户的行为特征属性依据属性关键词进行自动分集合归类;
对分集合归类的各个行为特征属性进行离群分析,建立大数据离群预测模型;
刷单行为判定单元,执行针对所述异常交易行为的各个离群的行为特征属性,获取基于离群对应的行为特征属性构建的决策树进行验证,以判定所述异常交易行为是否为刷单行为。
CN201810288917.4A 2018-04-03 2018-04-03 基于用户行为数据特征的刷单检测方法及系统 Pending CN108550052A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810288917.4A CN108550052A (zh) 2018-04-03 2018-04-03 基于用户行为数据特征的刷单检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810288917.4A CN108550052A (zh) 2018-04-03 2018-04-03 基于用户行为数据特征的刷单检测方法及系统

Publications (1)

Publication Number Publication Date
CN108550052A true CN108550052A (zh) 2018-09-18

Family

ID=63513896

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810288917.4A Pending CN108550052A (zh) 2018-04-03 2018-04-03 基于用户行为数据特征的刷单检测方法及系统

Country Status (1)

Country Link
CN (1) CN108550052A (zh)

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255459A (zh) * 2018-09-26 2019-01-22 蜜小蜂智慧(北京)科技有限公司 一种识别订单信息的方法及设备
CN109377272A (zh) * 2018-09-30 2019-02-22 口碑(上海)信息技术有限公司 一种异常用餐环节的确定方法、装置及系统
CN109388548A (zh) * 2018-09-29 2019-02-26 北京京东金融科技控股有限公司 用于生成信息的方法和装置
CN109711955A (zh) * 2019-02-18 2019-05-03 杭州跨境邦信息技术有限公司 基于当前订单的差评预警方法、系统、黑名单库建立方法
CN109829733A (zh) * 2019-01-31 2019-05-31 重庆大学 一种基于购物行为序列数据的虚假评论检测系统和方法
CN109976934A (zh) * 2019-02-26 2019-07-05 上海拍拍贷金融信息服务有限公司 设备使用异常判定方法、装置以及计算机存储介质
CN110009519A (zh) * 2019-01-29 2019-07-12 上海七印信息科技有限公司 一种基于区块链社交平台的社群检测方法
CN110020938A (zh) * 2019-01-23 2019-07-16 阿里巴巴集团控股有限公司 交易信息处理方法、装置、设备及存储介质
CN110069686A (zh) * 2019-03-15 2019-07-30 平安科技(深圳)有限公司 用户行为分析方法、装置、计算机装置及存储介质
CN110111198A (zh) * 2019-04-23 2019-08-09 上海淇玥信息技术有限公司 用户金融风险预估方法、装置、电子设备及可读介质
CN110288362A (zh) * 2019-07-03 2019-09-27 北京工业大学 刷单的预测方法、装置及电子设备
CN110335084A (zh) * 2019-07-10 2019-10-15 湖北长久欣信息科技股份有限公司 一种基于b2c网上商城建设开发系统
CN110610365A (zh) * 2019-09-17 2019-12-24 中国建设银行股份有限公司 一种识别交易请求的方法和装置
CN110633994A (zh) * 2019-07-12 2019-12-31 中国农业银行股份有限公司 刷单行为的识别方法及装置
CN110659807A (zh) * 2019-08-29 2020-01-07 苏宁云计算有限公司 一种基于链路的风险用户识别方法及装置
CN110910204A (zh) * 2019-10-24 2020-03-24 东莞市盟大塑化科技有限公司 一种基于人工智能的用户监测系统
CN110990810A (zh) * 2019-11-28 2020-04-10 中国建设银行股份有限公司 一种用户操作数据处理方法、装置、设备及存储介质
CN111311408A (zh) * 2020-02-10 2020-06-19 支付宝(杭州)信息技术有限公司 电子交易属性识别方法及装置
CN111556055A (zh) * 2020-04-28 2020-08-18 中国联合网络通信集团有限公司 一种基于区块链的点评方法和装置
CN111553726A (zh) * 2020-04-22 2020-08-18 上海海事大学 一种基于hmm的刷单预测系统及方法
CN111985938A (zh) * 2020-08-18 2020-11-24 支付宝(杭州)信息技术有限公司 一种跨境交易的真实性验证方法、装置及设备
CN112308566A (zh) * 2020-09-27 2021-02-02 中智关爱通(上海)科技股份有限公司 一种企业欺诈识别方法
CN112396484A (zh) * 2019-08-16 2021-02-23 阿里巴巴集团控股有限公司 商品的验证方法及装置、存储介质和处理器
CN113076319A (zh) * 2021-04-13 2021-07-06 河北大学 基于离群值检测技术和位图索引的动态数据库填充方法
CN113222760A (zh) * 2021-05-19 2021-08-06 上海优方信息科技服务股份有限公司 用户数据处理方法以及相关装置
CN113506150A (zh) * 2021-06-24 2021-10-15 深圳市盈捷创想科技有限公司 网络行为的监测方法、装置和计算机可读存储介质
WO2021253253A1 (zh) * 2020-06-17 2021-12-23 深圳市欢太科技有限公司 业务数据处理方法、装置、电子设备以及存储介质
CN113837568A (zh) * 2021-09-08 2021-12-24 杭州海康威视系统技术有限公司 风险订单识别方法、装置、电子设备及机器可读存储介质
CN114301711A (zh) * 2021-12-31 2022-04-08 招商银行股份有限公司 防暴刷方法、装置、设备、存储介质及计算机程序产品
CN114338216A (zh) * 2021-12-31 2022-04-12 招商银行股份有限公司 多维暴刷攻击防治方法、装置、设备、介质及程序产品
CN117196640A (zh) * 2023-11-06 2023-12-08 青岛巨商汇网络科技有限公司 一种基于服务体验的全流程可视化管理系统及方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793484A (zh) * 2014-01-17 2014-05-14 五八同城信息技术有限公司 分类信息网站中的基于机器学习的欺诈行为识别系统
CN105740667A (zh) * 2014-12-10 2016-07-06 阿里巴巴集团控股有限公司 一种基于用户行为的信息识别方法及装置
CN106096974A (zh) * 2016-06-02 2016-11-09 中国联合网络通信集团有限公司 一种针对网络购物的反作弊方法及系统
CN106204157A (zh) * 2016-07-24 2016-12-07 广东聚联电子商务股份有限公司 一种基于大数据采集与分析的刷单评价行为处理方法
CN106708966A (zh) * 2016-11-29 2017-05-24 中国计量大学 基于相似度计算的垃圾评论检测方法
CN106991425A (zh) * 2016-01-21 2017-07-28 阿里巴巴集团控股有限公司 商品交易质量的检测方法和装置
CN107153977A (zh) * 2016-03-02 2017-09-12 阿里巴巴集团控股有限公司 网上交易平台中交易实体信用评估方法、装置及系统
CN107464169A (zh) * 2017-08-10 2017-12-12 北京小度信息科技有限公司 信息输出方法和装置
CN107515873A (zh) * 2016-06-16 2017-12-26 阿里巴巴集团控股有限公司 一种垃圾信息识别方法及设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793484A (zh) * 2014-01-17 2014-05-14 五八同城信息技术有限公司 分类信息网站中的基于机器学习的欺诈行为识别系统
CN105740667A (zh) * 2014-12-10 2016-07-06 阿里巴巴集团控股有限公司 一种基于用户行为的信息识别方法及装置
CN106991425A (zh) * 2016-01-21 2017-07-28 阿里巴巴集团控股有限公司 商品交易质量的检测方法和装置
CN107153977A (zh) * 2016-03-02 2017-09-12 阿里巴巴集团控股有限公司 网上交易平台中交易实体信用评估方法、装置及系统
CN106096974A (zh) * 2016-06-02 2016-11-09 中国联合网络通信集团有限公司 一种针对网络购物的反作弊方法及系统
CN107515873A (zh) * 2016-06-16 2017-12-26 阿里巴巴集团控股有限公司 一种垃圾信息识别方法及设备
CN106204157A (zh) * 2016-07-24 2016-12-07 广东聚联电子商务股份有限公司 一种基于大数据采集与分析的刷单评价行为处理方法
CN106708966A (zh) * 2016-11-29 2017-05-24 中国计量大学 基于相似度计算的垃圾评论检测方法
CN107464169A (zh) * 2017-08-10 2017-12-12 北京小度信息科技有限公司 信息输出方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
董晴晴: ""基于离群点挖掘的电商平台信用炒作检测研究"", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 *

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255459A (zh) * 2018-09-26 2019-01-22 蜜小蜂智慧(北京)科技有限公司 一种识别订单信息的方法及设备
CN109388548A (zh) * 2018-09-29 2019-02-26 北京京东金融科技控股有限公司 用于生成信息的方法和装置
CN109388548B (zh) * 2018-09-29 2020-12-22 京东数字科技控股有限公司 用于生成信息的方法和装置
CN109377272A (zh) * 2018-09-30 2019-02-22 口碑(上海)信息技术有限公司 一种异常用餐环节的确定方法、装置及系统
CN110020938A (zh) * 2019-01-23 2019-07-16 阿里巴巴集团控股有限公司 交易信息处理方法、装置、设备及存储介质
CN110020938B (zh) * 2019-01-23 2024-01-16 创新先进技术有限公司 交易信息处理方法、装置、设备及存储介质
CN110009519A (zh) * 2019-01-29 2019-07-12 上海七印信息科技有限公司 一种基于区块链社交平台的社群检测方法
CN109829733A (zh) * 2019-01-31 2019-05-31 重庆大学 一种基于购物行为序列数据的虚假评论检测系统和方法
CN109829733B (zh) * 2019-01-31 2023-02-03 重庆大学 一种基于购物行为序列数据的虚假评论检测系统和方法
CN109711955A (zh) * 2019-02-18 2019-05-03 杭州跨境邦信息技术有限公司 基于当前订单的差评预警方法、系统、黑名单库建立方法
CN109976934A (zh) * 2019-02-26 2019-07-05 上海拍拍贷金融信息服务有限公司 设备使用异常判定方法、装置以及计算机存储介质
CN109976934B (zh) * 2019-02-26 2024-03-08 上海拍分乐网络科技有限公司 设备使用异常判定方法、装置以及计算机存储介质
CN110069686A (zh) * 2019-03-15 2019-07-30 平安科技(深圳)有限公司 用户行为分析方法、装置、计算机装置及存储介质
CN110111198A (zh) * 2019-04-23 2019-08-09 上海淇玥信息技术有限公司 用户金融风险预估方法、装置、电子设备及可读介质
CN110288362A (zh) * 2019-07-03 2019-09-27 北京工业大学 刷单的预测方法、装置及电子设备
CN110335084A (zh) * 2019-07-10 2019-10-15 湖北长久欣信息科技股份有限公司 一种基于b2c网上商城建设开发系统
CN110633994A (zh) * 2019-07-12 2019-12-31 中国农业银行股份有限公司 刷单行为的识别方法及装置
CN112396484A (zh) * 2019-08-16 2021-02-23 阿里巴巴集团控股有限公司 商品的验证方法及装置、存储介质和处理器
CN110659807A (zh) * 2019-08-29 2020-01-07 苏宁云计算有限公司 一种基于链路的风险用户识别方法及装置
CN110659807B (zh) * 2019-08-29 2022-08-26 苏宁云计算有限公司 一种基于链路的风险用户识别方法及装置
CN110610365A (zh) * 2019-09-17 2019-12-24 中国建设银行股份有限公司 一种识别交易请求的方法和装置
CN110910204A (zh) * 2019-10-24 2020-03-24 东莞市盟大塑化科技有限公司 一种基于人工智能的用户监测系统
CN110990810A (zh) * 2019-11-28 2020-04-10 中国建设银行股份有限公司 一种用户操作数据处理方法、装置、设备及存储介质
CN111311408A (zh) * 2020-02-10 2020-06-19 支付宝(杭州)信息技术有限公司 电子交易属性识别方法及装置
CN111553726A (zh) * 2020-04-22 2020-08-18 上海海事大学 一种基于hmm的刷单预测系统及方法
CN111556055A (zh) * 2020-04-28 2020-08-18 中国联合网络通信集团有限公司 一种基于区块链的点评方法和装置
CN115039380A (zh) * 2020-06-17 2022-09-09 深圳市欢太科技有限公司 业务数据处理方法、装置、电子设备以及存储介质
WO2021253253A1 (zh) * 2020-06-17 2021-12-23 深圳市欢太科技有限公司 业务数据处理方法、装置、电子设备以及存储介质
CN111985938A (zh) * 2020-08-18 2020-11-24 支付宝(杭州)信息技术有限公司 一种跨境交易的真实性验证方法、装置及设备
CN112308566A (zh) * 2020-09-27 2021-02-02 中智关爱通(上海)科技股份有限公司 一种企业欺诈识别方法
CN113076319A (zh) * 2021-04-13 2021-07-06 河北大学 基于离群值检测技术和位图索引的动态数据库填充方法
CN113222760A (zh) * 2021-05-19 2021-08-06 上海优方信息科技服务股份有限公司 用户数据处理方法以及相关装置
CN113506150A (zh) * 2021-06-24 2021-10-15 深圳市盈捷创想科技有限公司 网络行为的监测方法、装置和计算机可读存储介质
CN113506150B (zh) * 2021-06-24 2023-12-05 深圳市盈捷创想科技有限公司 网络行为的监测方法、装置和计算机可读存储介质
CN113837568A (zh) * 2021-09-08 2021-12-24 杭州海康威视系统技术有限公司 风险订单识别方法、装置、电子设备及机器可读存储介质
CN113837568B (zh) * 2021-09-08 2024-03-01 杭州海康威视系统技术有限公司 风险订单识别方法、装置、电子设备及机器可读存储介质
CN114301711A (zh) * 2021-12-31 2022-04-08 招商银行股份有限公司 防暴刷方法、装置、设备、存储介质及计算机程序产品
CN114338216A (zh) * 2021-12-31 2022-04-12 招商银行股份有限公司 多维暴刷攻击防治方法、装置、设备、介质及程序产品
CN114338216B (zh) * 2021-12-31 2024-03-26 招商银行股份有限公司 多维暴刷攻击防治方法、装置、设备及介质
CN117196640A (zh) * 2023-11-06 2023-12-08 青岛巨商汇网络科技有限公司 一种基于服务体验的全流程可视化管理系统及方法
CN117196640B (zh) * 2023-11-06 2024-02-02 青岛巨商汇网络科技有限公司 一种基于服务体验的全流程可视化管理系统及方法

Similar Documents

Publication Publication Date Title
CN108550052A (zh) 基于用户行为数据特征的刷单检测方法及系统
CN110009372B (zh) 一种用户风险识别方法和装置
CN109711955B (zh) 基于当前订单的差评预警方法、系统、黑名单库建立方法
CN109559208A (zh) 一种信息推荐方法、服务器及计算机可读介质
CN103577988B (zh) 一种识别特定用户的方法和装置
CN106022800A (zh) 一种用户特征数据的处理方法和装置
CN105138690B (zh) 确定关键词的方法和装置
CN109615454A (zh) 确定用户金融违约风险的方法及装置
CN108205768A (zh) 数据库建立方法和数据推荐方法及装置、设备和存储介质
US20140188584A1 (en) Product pricing system on electronic commerce using the internet
CN109493113A (zh) 一种优惠信息的提供方法以及装置
CN106096974A (zh) 一种针对网络购物的反作弊方法及系统
CN106469392A (zh) 选择及推荐展示对象的方法及装置
CN108038696A (zh) 基于设备标识码和社交群组信息的刷单检测方法及系统
CN107305665A (zh) 一种鉴别虚假交易、防止刷单的方法及装置
CN108573432A (zh) 用于电子商务的交易监管系统和方法
CN103391302A (zh) 一种信息发送的方法及系统
Yoo et al. An analysis of popularity information effects: Field experiments in an online marketplace
CN108429776A (zh) 网络对象的推送方法、装置、客户端、交互设备以及系统
CN110659926A (zh) 一种数据价值评估系统以及方法
Chu et al. Satisfaction, trust and online purchase intention: A study of consumer perceptions
CN103309885B (zh) 一种在电子交易平台中识别特征用户的方法及装置和搜索方法及装置
Liu et al. Factors influencing consumers’ repurchase behavior on fresh food e-commerce platforms: An empirical study
Iswavigra Online Shop Recommendations: Decision Support System Based on Multi-Objective Optimization on the Basis of Ratio Analysis
CN111461846A (zh) 一种购物记录分析反馈系统及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180918

RJ01 Rejection of invention patent application after publication