CN102890803A - 电子商品异常交易过程的确定方法及其装置 - Google Patents

电子商品异常交易过程的确定方法及其装置 Download PDF

Info

Publication number
CN102890803A
CN102890803A CN2011102052115A CN201110205211A CN102890803A CN 102890803 A CN102890803 A CN 102890803A CN 2011102052115 A CN2011102052115 A CN 2011102052115A CN 201110205211 A CN201110205211 A CN 201110205211A CN 102890803 A CN102890803 A CN 102890803A
Authority
CN
China
Prior art keywords
commodity
transaction
data
historical trading
trading data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011102052115A
Other languages
English (en)
Other versions
CN102890803B (zh
Inventor
潘健民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110205211.5A priority Critical patent/CN102890803B/zh
Publication of CN102890803A publication Critical patent/CN102890803A/zh
Priority to HK13103566.3A priority patent/HK1176725A1/zh
Application granted granted Critical
Publication of CN102890803B publication Critical patent/CN102890803B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种电子商品异常交易过程确定方法,包括针对每一个电子商品,在商品交易数据库记录的历史交易数据中提取该商品在过去规定时长内的历史交易数据;根据预先规定需提取的各交易特征,在提取的该商品在过去规定时长内的历史交易数据中提取对应的交易特征值;根据提取的交易特征值同时满足的相应条件对应的数据分类原则,将针对该数据分类原则对应的一类历史交易数据预测的商品交易量,作为该商品在过去规定时长内的预测交易量;在商品交易数据库记录的历史交易数据中提取该商品在过去规定时长内的实际交易量;根据该商品在过去规定时长内的预测交易量和实际交易量,确定该商品在过去规定时长内是否存在异常交易。

Description

电子商品异常交易过程的确定方法及其装置
技术领域
本申请涉及基于互联网技术实现电子商品交易的技术领域,尤其是涉及一种预测电子商品交易量的方法及其装置,以及一种电子商品异常交易过程的确定方法及其装置。
背景技术
随着互联网技术的快速发展,基于互联网环境进行电子商品交易的处理技术越来越受到重视。其中,以电子商品的交易处理记录信息为核心的诚信评价体系是整个互联网电子商品对象良性交易的基础,相反地,炒作信用则会严重破坏整个基于互联网环境为平台的电子商务交易处理产业的健康良性发展。
具体地,诚信评价是指在基于互联网环境为平台的电子商务交易处理过程中,每一笔电子数据交易处理完成之后,购买方和卖方都有权使用电子投票信息或发帖等形式,对卖方出售的电子商品的具体情况做出自己认为的好、中、差等评价。即针对一个出售电子商品的卖家,其积累的好的信用评价越多,就代表该卖方的服务质量、商品质量等越好,这样这个卖方提供的电子商品信息就会越来越多地受到其他买方的欢迎,从而使其能够获得更多的收益。
具体地,炒作信用是指单纯采用以增加电子商品卖方的信用为目的的虚假交易方式,从形式上提高电子商品卖方的好的信用评价,从而基于这些虚假的信用评价去吸引更多的商品购买方的注意,进而达到获得更多收益的目的。例如电子商品的卖方通过一些虚假手段进行多次虚假电子交易处理,其具体可以为自己同时注册多个不同的买家账户,分别使用其注册的不同买家账号进行多次购买自己出售的电子商品信息,也可以与周边朋友间相互购买各自提供的电子商品信息,通过这些虚假的交易处理手段就可以从表面上提高自己的信用评价,以达到信用炒作的目的。
由于大量信用炒作的情况存在,因此对电子商品交易的良性发展造成了十分不良的影响,所以如何从大量的电子交易处理数据信息中去主动发现异常的电子商品交易处理过程,已经成为一个现在越来越受到关注的课题。
目前,通常采用如下方式从大量的电子交易处理数据信息中去主动发现异常的电子商品交易处理过程:
1、在互联网平台记录的大量电子交易处理数据信息中,收集大量经过人工判别的电子交易处理数据;
2、预先人为设计各种电子商品交易处理特征;
3、通过对收集到的大量经过人工判别的电子交易处理数据进行分析,得到预先设计的每种处理特征分别在正常交易处理过程中与异常交易处理过程中的分布情况;
4、根据得到的每种处理特征分别在正常交易处理过程中与异常交易处理过程中的分布情况,找出其中分布情况区分度比较大的特征;
5、根据找出的这些特征,建立相应规则,基于建立的相应规则去发现电子交易过程中的异常交易过程。
以一个例子来说明上述的发现异常电子商品交易处理的过程,首先通过人工的方法随机挑选1000个电子商品信息,然后人工审核这1000个电子商品信息,人工识别出里面有参与虚假交易(异常交易)的电子商品信息。并预先设计两种电子商品交易处理特征,具体包括:针对一个电子商品交易过程中从交易创建到交易完成的平均时长,电子商品交易的平均购买量。计算上述人工审核过的1000个电子商品的这两种处理特征的值,然后根据计算结果,分析这两个处理特征的值在电子商品的异常交易过程中和正常交易过程中各自的平均值。如果根据计算得到的平均值,发现大部分异常交易处理过程的平均交易处理时长比正常交易平均处理时长要短的多,通常异交易处理的平均交易处理时长在2小时以内,而正常交易处理的平均交易处理时长在2天以上,则证明平均交易处理时长这个处理特征值在电子商品的正常交易过程中和异常交易过程中的区分度比较大;而电子商品的平均购买量这个处理特征值在异常交易处理过程中和正常交易处理过程的区分度不明显。所以根据上面的发现,这里可以制定一条规则,具体为:如果针对某个电子商品的平均交易处理时长低于2小时,则可以判定该电子商品属于异常交易处理的电子商品。
从上述现有技术的介绍可以看出,现有的在电子商品交易过程中发现异常交易处理过程的方法,主要存在两个问题:第一,需要人工判别大量电子商品交易数据,因此需要消耗的人力资源比较多,从而影响了发现异常交易处理过程的效率;第二,在分析具体处理特征值在正常交易处理过程中和异常交易处理过程中的区分度时,通常是在单一维度下进行分析,即一般仅选择一个处理特征值,并根据该特征值在正常交易中和异常交易中的区分度设定相应的规则,并基于这个规则根据交易处理数据在该维特征值是否超过阈值来判定是否有异常交易处理。但是由于在现实的电子商品交易过程中,海量的交易处理数据信息有着极其复杂的表现形式,因此仅通过单一维度处理特征发现异常交易处理,其准确性还有待于提高,通常按照这种单一维度特征发现异常交易处理会漏掉很多实属异常的交易处理过程,不利于电子商品交易技术在互联网环境中的良性发展。
发明内容
本申请实施例提供一种电子商品异常交易过程的确定方法及其装置,用以提高发现电子商品交易过程中的异常交易行为的效率和准确性。
相应地,本申请实施例还提供了一种预测电子商品交易量的方法及其装置。
本申请实施例提出的技术方案具体如下:
一种预测电子商品交易量的方法,包括在商品交易数据库记录的历史交易数据中提取规定数目的历史交易数据,其中每一个历史交易数据对应一个商品在交易过程中的历史交易数据;根据提取的规定数目的历史交易数据,执行下述商品交易量预测处理:根据预先规定的需提取的各交易特征,针对提取的每一个历史交易数据,提取该历史交易数据中对应的交易特征值,构成对应该历史交易数据的交易特征值集合;根据针对每个历史交易数据分别提取构成的交易特征值集合,按照预先设定的不同数据分类原则,将提取的各个历史交易数据进行分类,其中各交易特征需同时满足相应条件时构成一个数据分类原则;针对分类得到的每一类历史交易数据,根据该类历史交易数据中的每一个历史交易数据中分别包含的商品交易量信息,预测对应该类历史交易数据的商品交易量。
一种电子商品异常交易过程确定方法,包括针对每一个电子商品,在商品交易数据库记录的历史交易数据中提取该商品在过去规定时长内的历史交易数据;根据预先规定需提取的各交易特征,在提取的该商品在过去规定时长内的历史交易数据中提取对应的交易特征值;根据提取的交易特征值同时满足的相应条件对应的数据分类原则,将针对该数据分类原则对应的一类历史交易数据预测的商品交易量,作为该商品在过去规定时长内的预测交易量;在商品交易数据库记录的历史交易数据中提取该商品在过去规定时长内的实际交易量;根据该商品在过去规定时长内的预测交易量和实际交易量,确定该商品在过去规定时长内是否存在异常交易。
一种预测电子商品交易量的装置,包括训练数据提取单元,用于在商品交易数据库记录的历史交易数据中提取规定数目的历史交易数据,其中每一个历史交易数据对应一个商品在交易过程中的历史交易数据;训练特征提取单元,用于根据训练数据提取单元提取的规定数目的历史交易数据,执行根据预先规定的需提取的各交易特征,针对提取的每一个历史交易数据,提取该历史交易数据中对应的交易特征值,构成对应该历史交易数据的交易特征值集合;数据分类单元,用于根据训练特征提取单元针对每个历史交易数据分别提取构成的交易特征值集合,按照预先设定的不同数据分类原则,将提取的各个历史交易数据进行分类,其中各交易特征需同时满足相应条件时构成一个数据分类原则;第一交易量预测单元,用于针对数据分类单元分类得到的每一类历史交易数据,根据该类历史交易数据中的每一个历史交易数据中分别包含的商品交易量信息,预测对应该类历史交易数据的商品交易量。
一种电子商品异常交易过程确定装置,包括交易数据提取单元,用于针对每一个电子商品,在商品交易数据库记录的历史交易数据中提取该商品在过去规定时长内的历史交易数据,并提取该商品在过去规定时长内的实际交易量;交易特征提取单元,用于根据预先规定需提取的各交易特征,在交易数据提取单元提取的该商品在过去规定时长内的历史交易数据中提取对应的交易特征值;商品交易量预测单元,用于根据交易特征提取单元提取的交易特征值同时满足的相应条件对应的数据分类原则,将针对该数据分类原则对应的一类历史交易数据预测的商品交易量,作为该商品在过去规定时长内的预测交易量;交易状态确定单元,用于根据该商品在过去规定时长内的预测交易量和实际交易量,确定该商品在过去规定时长内是否存在异常交易。
由于伴随着电子商务的迅速发展,异常交易即虚假交易作为伴随其中的灰色产业链,已经对整个电子商务的健康发展起到了很大的危害作用。有鉴于此,本申请实施例提出了一种在海量的历史交易数据里主动发现异常交易的方案,首先对每类商品交易数据建立交易量预测模型,基于建立的交易量预测模型,可以预测每个商品在过去一段时间内的期望交易量,然后将每个商品的预测交易量与实际交易量做比较,找出其中实际交易量明显高于预测交易量的商品,作为存在异常交易的商品。由于在建立交易量预测模型时是根据海量历史交易数据中的多个交易特征来建立交易预测模型的,因此相对现有技术中仅采用单一维度进行分析和定位异常交易的过程,可以更为准确定的定位异常交易;此外由于本申请方案是自动建立交易量预测模型,并基于这些模型自动发现异常商品交易过程的,因此相对于现有技术中要依赖于较多人为分析的过程,可以较好地提高定位异常交易过程的效率。
附图说明
为了更加详尽的论述本申请实施例的具体实现,下面将结合各个附图对本申请实施例进行详尽阐述,在各附图中:
图1为本申请实施例提出的预测电子商品交易量的方法的实现原理流程图;
图2为本申请实施例基于CART原理对多个商品的历史交易数据进行划分处理的一个示例示意图;
图3为本申请实施例提出的电子商品异常交易过程的确定方法的实施处理过程示意图;
图4为本申请实施例提供的预测电子商品交易量的装置的具体组成结构示意图;
图5为本申请实施例提供的电子商品异常交易过程的确定装置的具体组成结构示意图。
具体实施方式
首先介绍本申请技术方案的基本实现原理,具体如下:
1、在商品交易数据库中收集大量商品的历史交易数据,并提取每个商品的历史交易数据中的各类交易特征;
2、可以但不限于通过分类回归树(CART)方法与bagging方法,根据提取的每个商品的历史交易数据中的各类交易特征,分别为每类商品历史交易数据建立一个对应的交易量预测模型;
3、利用建立好的各种模型,预测每个商品在过去一段时间内的预测交易量;
4、比较每个商品的预测交易量与实际交易量,找出其中实际交易量远高于预测交易量的商品。
由此可见,本申请实施例首先自动通过对现有已经记录的历史交易数据进行收集以及提取相应的交易特征,并基于提取的交易特征建立交易量预测模型,不需要人工判定的过程,所以极大的节省了人力,并提高了发现异常交易过程的效率。其次,在交易量预测模型的建立过程中,是通过自动对提取的所有交易特征进行综合分析,来得到每类商品交易数据对应的预测模型的,所以在最后的异常数据分析中,只需要比较商品的预测交易量与实际交易量的差异即可定位异常交易处理,因此在提高定位效率的同时,也可以提高定位异常交易过程的准确性。
此外,本申请技术方案还可以在针对一定数量的商品分别判断其是否属于异常交易的商品后,统计分析异常交易的商品数量占该一定数量的商品总数的比值,并通过对该比值的分析,判断当前已经建立的各个商品交易量预测模型是否已经失效,如果失效,则需要根据当前记录的历史交易数据重新训练数据,并基于重新训练的数据重新建立新的交易量预测模型;如何没有失效,则直接输出被确定的属于异常交易的商品的信息。
如图1所示,为本申请实施例提出的预测电子商品交易量的方法的实现原理流程图,在介绍本申请实施例提出的预测电子商品交易量的实现过程之前,这里先介绍商品交易数据库的实现原理和功能,对于每个电子商品的交易过程,它的每笔交易从买家已经买下开始,到买家已付款,卖家发出商品,直至交易完成等各阶段中,其成交量,成交金额等各种交易特征信息都会记录到相应的商品交易数据库中,相关商品交易数据库会周期性的(比如每天)把记录的历史交易数据导入到计算平台(比如Hadoop)中。
基于上述已经介绍的商品交易数据库的实现原理和功能,下面接着介绍本申请实施例提出的预测电子商品交易量的实现过程,其具体实现过程如下:
步骤10,在商品交易数据库记录的历史交易数据中提取规定数目的历史交易数据,其中,每一个历史交易数据对应一个商品在交易过程中的历史交易数据。这个过程就是一个在商品交易数据库中选择商品交易训练数据的过程,即训练数据就是一组商品的历史交易数据,由于在现实情况中,绝大部分商品的销量可能为零或很少,所以如果随机在商品交易数据库中抽取训练数据,会导致高交易量的商品交易数据无法得到较好的预测效果。因此较佳地,本申请实施例中采用如下优选方式在商品交易数据库记录的历史交易数据中提取历史交易数据:
根据商品交易数据库记录的历史交易数据中分别包含的商品销量信息的高低,将商品交易数据库中记录的历史交易数据划分为不同组;分别在划分得到的每组历史交易数据中提取相应数目的历史交易数据,由从不同组历史交易数据中分别提取的相应数目的历史交易数据构成需要提取的历史交易数据。
这里即根据商品的交易量信息对所有商品的历史交易数据进行划分处理,合理分配低交易量商品的历史交易数据和高交易量商品的历史交易数据,使之达到一个适当的比例,然后从划分得到的不同的历史交易数据中分别抽取交易数据,从而使得处于每个交易量档次的商品交易数据都能得到较好的预测效果。例如:根据不同商品的交易量,可以将所有商品的历史交易数据划分为三档:商品交易量等于1的历史交易数据,商品交易量等于2的历史交易数据,商品交易量大于2的历史交易数据,在每一档商品的历史交易数据中随机选取1000件商品的历史交易数据,则这3000件商品的历史交易数据就组成了这里需要得到的训练数据。
步骤11,根据预先规定的需提取的各交易特征,针对上述提取的每一个历史交易数据,提取该历史交易数据中对应的交易特征值,构成对应该历史交易数据的交易特征值集合。即在上述抽取出训练数据后,需要分别将每一个商品对应的历史交易数据转化为交易特征值集合的形成,集合中的每一个元素值,对应某一维交易特征的值。
交易特征可以但不限于可以分为标称、序数、区间、比率这四种类型。其中,标称用于提供信息来区分商品对象,比如邮政编码,性别等等;序数用于提供商品对象的销售顺序信息,比如很差、较差、一般、较好、很好等;区间用于提供数据与数据之间差的操作,例如温度、日期等;比率用于提供数据与数据之间的差和比的操作,例如重量、长度等。
以上提到的四类交易特征类型都可以分别作为交易数据的某一维交易特征。例如,某个商品的卖家所在地是上海,这个卖家的服务质量是好卖家,这个商品的上架日期是2010年9月29日,这个商品的价格是100元,这个商品的点击量是80,这个商品的已有交易量是10。那么这里可以在该商品的历史交易数据中提取如下六个规定的交易特征值{卖家所在地,卖家的服务质量,商品上架时间与2010年9月30日相差的天数,商品的价格,商品的点击量,商品的交易量},则在这个商品的历史交易数据中就可以抽取一个对应的交易特征值集合{上海,好,1,100,80,10},如此类推,针对抽取的其他每个商品的历史交易数据都可以按照这种方法来提取对应的交易特征值集合。
步骤12,根据上述针对每个历史交易数据分别提取构成的交易特征值集合,按照预先设定的不同数据分类原则,将提取的各个历史交易数据进行分类,其中,各交易特征需同时满足相应条件时构成一个数据分类原则。
这里在介绍将提取的各个历史交易数据进行分类处理的详细实现过程之前,先简单介绍分类回归树(CART)方法的基本原理,分类回归树(CART)是一种决策树算法,可以用来做数据的分类和回归处理。它的特点是在计算过程中利用二叉树的特点,在一定的分割准则下将根节点分为两个子节点,然后在每个子节点上继续上面的分割过程,直到分割后最后一层子节点满足相应的停止准则为止。
这里简要介绍一下CART方法的大致实现步骤:
(1)首先设定初始值;
(2)按照下面的方式反复分裂节点,直到最后一层子节点满足停止条件为止:
(2.1)建立损失函数,计算每个节点的各种划分,并计算该划分的损失函数的值。
(2.2)找出损失函数最大的的划分,并按照该划分方法分裂节点,将样本划入子节点中。
(2.3)更新划分后每个子节点的估计值。
为了避免树在划分过程中生长的过于庞大,这样会导致树的过拟合,影响最终效果,所以需要对所生成的决策树做一些剪枝工作。CART算法在损失函数中加入了与节点数有关的惩罚因子,这样就可以生成一组节点数依次降低的树序列。有了所生成的树序列,就可以通过交叉验证的方法,即提取部分训练数据来评估树序列中,哪一棵树可以达到最优效果。这样就可以找出最优的决策树。
基于上述介绍的CART实现原理,接着介绍将提取的各个历史交易数据进行分类处理的详细实现过程,具体过程如下:
开始,将所有提取的历史交易数据都归属于树的根节点t,然后寻找第一个拆分规则,也就是建立根节点的第一个分支条件,方法是:对每个历史交易数据分别抽取的交易特征值集合中的每一维特征的每一种可能取值逐一扫描,如果该特征是连续变量,则选择一个变量a,这样提取的所有历史交易数据就将被分为两类,具体为R1和R2,其中R1表示所有该维特征值小于等于a的数据,R2表示所有该维特征值大于a的数据。如果该特征是离散变量,则选择一个该离散变量的一个子集I(例如服务质量这个特征,一共有好,中,差三个值,则可以选择其中一个作为子集),这样提取的所有历史交易数据也将被分为两类,具体为R1和R2,其中R1表示所有该维特征值属于子集I的数据,R2表示所有该维特征值不属于子集I的数据。这里可以定义如下函数:
f ( x ) = ( 1 | R 1 | Σ R 1 Y i ) I R 1 ( x ) + ( 1 | R 2 | Σ R 2 Y i ) I R 2 ( x )
其中Yi是指第i个商品的交易量信息;
Figure BDA0000077442170000102
表示指标函数。
该函数的意思就是对划分的两部分数据分别求平均,再对两个平均数求和。而指标函数
Figure BDA0000077442170000103
表示的是数据在两部分之间的分配情况。
则根据上述函数,基于CART原则,目标就是使得冗余平方和达到最小,具体如下式所示:
Σ i = 1 n ( Y i - f ( X ) ) 2 .
基于上述过程原理,穷举每一维特征的每一种情况,计算对应的冗余平方和,就能找出使得上述目标达到最小的一种分配方式,这时就得到了对于根节点的拆分规则。然后,分别对于拆分后的两部分数据子集,重复执行上面的方法过程,就能不断地将历史交易数据进行拆分。
拆分需要有一个停止规则,这里规定,如果拆分后最后一层子节点中每个子节点上的数据量占整个树中总体数据量的百分比低于百分之一时,则停止拆分。最终,就得到了一个树状的拆分规则,如果提取的某一个历史交易数据按照这个树状拆分规则,最终落入最后一层中的某一个叶子节点中,则该历史交易数据对应的预测交易量就可以用所有落入这个叶子节点中的历史交易数据中分别包含的交易量的平均值表示。
如图2所示,为本申请实施例基于CART原理对多个商品的历史交易数据进行划分处理的一个示例示意图,基于该图,这里假设如有10个商品对应的历史交易数据,从每个商品的历史交易数据中提取两个维度的交易特征,包括点击量和价格信息,且可以得知每个商品的已知交易量。则根据上面的方案,就能对应这10个商品自动生成一个规则树,树中每个叶子节点的值,就用该叶子节点里面包含的所有商品历史交易数据中的交易量的平均值表示。打算预测一个商品的交易量,如果从这个商品的历史交易数据中抽取出点击数交易特征的值是50,抽取出价格交易特征的值是30,那么按照图2所示的树结构,则这个商品的历史交易数据就会落到包含商品e和f的历史交易数据的叶子节点中,则这个商品的预测交易量就是商品e和f的交易量平均值。
如上述图2所示的树结构,需要预先设定抽取点击量交易特征和价格交易特征,这样针对从商品交易数据库中提取的每个商品的历史交易数据,需要分别提取每个历史交易数据中包含的点击量交易特征值和价格交易特征值,得到每一个历史交易数据分别对应的交易特征值集合,具体为:{点击量,价格}。按照图2所示的树结构,基于这两个交易特征需要同时满足的条件,就可以将所有提取的历史交易数据划分为四类,分别为:交易特征值集合同时满足{点击量<100,价格<20}的历史交易数据为第一类历史交易数据,具体地,历史交易数据a、c和d为第一类历史交易数据;交易特征值集合同时满足{点击量<100,价格>=20}的历史交易数据为第二类历史交易数据,具体地,历史交易数据e和f为第二类历史交易数据;交易特征值集合同时满足{点击量>=100,价格<50}的历史交易数据为第三类历史交易数据,具体地,历史交易数据b和q为第三类历史交易数据;交易特征值集合同时满足{点击量>=100,价格>=50}的历史交易数据为第四类历史交易数据,具体地,历史交易数据h,i和j为第四类历史交易数据。
其中,可以将历史交易数据a、c和d中分别包含的交易量的平均值作为第一类历史交易数据对应的商品预测交易量;并将历史交易数据e和f中分别包含的交易量的平均值作为第二类历史交易数据对应的商品预测交易量;并将历史交易数据b和q中分别包含的交易量的平均值作为第三类历史交易数据对应的商品预测交易量;并将历史交易数据h,i和j中分别包含的交易量的平均值作为第四类历史交易数据对应的商品预测交易量。
步骤13,针对步骤12中分类得到的每一类历史交易数据,根据该类历史交易数据中的每一个历史交易数据中分别包含的商品交易量信息,预测对应该类历史交易数据的商品交易量。根据上述描述可知,本申请实施例这里较佳地确定该类历史交易数据中的每一个历史交易数据中分别包含的商品交易量信息的平均值,作为预测得到的对应该类历史交易数据的商品交易量。从而就可以实现对应每一类商品的历史交易数据,给出一个预测该类商品的交易量的模型信息,后续在预测每一个商品的交易量时,就可以基于对应的预测模型预测交易量信息。
上述介绍的CART方法作为一种非参数的识别技术,其具有非常强大的数据分析处理能力,同时也能自动生成关于特征的规则,清晰明了。但是一次性使用所有从商品交易数据库中提取的历史交易数据作为训练数据,很容易造成过拟合现象,从而失去泛化能力。其中,过拟合现象是指,尽管建立的模型对训练数据预测的效果很好,但是对新的未知数据的预测效果不好。为了缓解这个问题,本申请实施例这里将结合bagging方法的实现原理,从在商品交易数据库中提取的历史交易数据中,每次独立地随机抽取一部分历史交易数据作为训练集,并且将这个独立地随机抽取过程独立地重复多次,这样就得到了多个小规模的训练集,然后对每个训练集基于上述方案单独得到多个规则树,那么多个训练集,就能得到多个规则树。则根据每个规则树,都可以得到对同一类商品历史交易数据的预测交易量,那么就可以将根据多个规则树分别预测得到的对应该类商品历史交易数据的预测交易量的平均值作为最终对该类历史交易数据的预测交易量结果。例如抽取得到n个训练集,针对每个训练集得到的对应一类历史交易数据X的预测交易量为Ti(X),则最终得到的对该类历史交易数据的预测交易量T(X)可以基于下述表示:
T ( X ) = Σ i = 1 n T i ( X ) n
例如,在上述步骤10中,假设在商品交易数据库中提取了1000件商品分别对应的历史交易数据,则在这1000个历史交易数据中,首先随机抽取900个历史交易数据构成第一个训练集,然后对该训练集执行上述步骤11、12和13的处理,假设通过第一训练集得到A类历史交易数据对应的预测交易量为T1(X);通过同样的方法,在这1000个历史交易数据中再随机抽取900个历史交易数据构成第二个训练集,然后对该训练集执行上述步骤11、12和13的处理,假设通过第二训练集得到A类历史交易数据对应的预测交易量为T2(X).....,将这个过程重复5遍,则一共可以得到5个不同的预测交易量T1(X)、T2(X)、T3(X)T4(X)和T5(X),最终将这5个预测交易量值的平均值作为A类历史交易数据对应的预测交易量值。从而实现对新的未知数据进行更好地预测交易量。
上述就是bagging方法的基本原理和功能,它的主要思想是将一组弱的分类回归树组合成一个强的分类回归树。举个很简单的例子,如果单个分类回归树的预测准确率是60%,如果这里假设分别构建的三个树中如果有两个树的预测值准确,那么这个组合就算是预测准确。那么从概率上讲,这个组合树预测结果准确的概率是0.6*0.6*0.6+3*0.6*0.6*0.4=0.648,从而可以看出这个组合树的预测准确率会高于任一单个分类回归树的预测准确率。
综上可见,通过上述步骤11、12和13的详细实现过程,就是对商品预测交易量模型的建立过程,即针对提取的每个商品的历史交易数据抽取相应的交易特征,构成对应的交易特征值集合,并以商品一段时期内的预测交易量为最终目标,通过将分类回归树(CART)方法与bagging方法相结合,对得到的各个交易特征值集合进行分析处理,从而建立每一类历史交易数据对应的预测交易量模型,用于后续对各个商品的交易量进行预测。
基于上面已经介绍的针对每类历史交易数据建立的交易量预测模型,下面介绍本申请实施例提出的发现异常交易商品的具体实现方案。
如图3所示,为本申请实施例提出的电子商品异常交易过程的确定方法的实施处理过程示意图,其具体实现过程如下:
步骤30,针对每一待检测的电子商品交易过程,在商品交易数据库中提取该商品在过去规定时间长度内的历史交易数据(即新未知商品数据),其中,规定时间长度可以根据实际情况设置,比如,可以设置成一天或一个月。
步骤31,根据预先规定需提取的各交易特征,在上述提取的该商品在过去规定时长内的历史交易数据中提取对应的交易特征值;其中,这里预先规定需要抽取的交易特征和上述建立交易量预测模型过程中在步骤11中规定要抽取的交易特征相同,其具体规定的要抽取的交易特征可以包含哪些类型以及具体如何抽取该些交易特征值,请参照上述步骤11中的具体描述。
步骤32,基于上述预先对应每类历史交易数据分别建立的交易量预测模型,根据上述提取的交易特征值同时满足的相应条件对应的数据分类原则,将针对该数据分类原则对应的一类历史交易数据预测的商品交易量,作为该商品在过去规定时长内的预测交易量。
同样基于上述图2所示的树结构实例,这里需要在提取的该商品在过去规定时长内的历史交易数据中抽取点击量交易特征值和价格交易特征值,假设抽取的点击量交易特征值为50,抽取的价格交易特征值为30,则可以看出针对该商品在过去规定时长内的历史交易数据抽取的两个交易特征值同时满足{点击量<100,价格>=20}这个条件,而上述已经得到满足这个条件的一类历史交易数据的预测交易量为历史交易数据e和f中分别包含的交易量的平均值,则可以直接将预测得到的这个平均值作为该商品在过去规定时长内的预测交易量值。
步骤33,在商品交易数据库记录的历史交易数据中提取该商品在过去规定时长内的实际交易量;
步骤34,根据该商品在过去规定时长内的预测交易量和实际交易量,判定该商品在过去规定时长内是否存在异常交易。较佳地,可以先计算该商品在过去规定时长内的实际交易量与预测交易量的比值,如果预测交易量的值为0,那么比值就将会变得无意义,所以一般会在作为分母的预测交易量的基础上加一个小数做平滑,这个小数可以是一个经验值,可以取(0.01-0.001)之间的值,从而使在特殊情况下的比值也是有意义的。这里还可以进而考虑该商品的实际交易量的绝对值,即综合考虑该商品在过去规定时长内的实际交易量与预测交易量的比值和该商品的实际交易量,来判定该商品在过去规定时长内是否为异常交易的商品。更为具体地,可以在确定出该商品在过去规定时长内的实际交易量大于第一规定阈值时,且该商品在过去规定时长内的实际交易量与预测交易量的比值大于第二规定阈值时,确定该商品为在过去规定时长的异常交易商品。
举个例子,如果某个商品在过去规定长的时长内实际交易量大于5笔,且该商品的实际交易量与预测交易量的比值大于5倍,则可以判定该商品在过去规定长的时长内属于异常交易的商品。
这样就可以实现针对每一待检测的电子商品交易过程,自动发现该商品的电子交易过程中是否存在异常行为的目的。
此外,由于电子商务的迅猛发展,基于同样的交易特征,一个商品在不同时期,理论上能够达到的交易量是不同的,所以预先建立的交易量预测模型不是一成不变的,需要随着时间的推移不断更新。但是由于在短时间内,预先建立的交易量预测模型又是具有相对稳定性的,并且频繁地重复建立交易量预测模型,也会对计算资源造成过度浪费。为了平衡这两个矛盾,本申请实施例进而提出了重建交易量预测模型的触发机制设计方案,原理是通过分析异常交易量占总体交易量的一个比例,基于该比值来判定预先建立的交易量预测模型是否已失效。这里假设的前提是,对整体交易数量而言,异常交易量占总体交易量的比例总是需要稳定在某一个阈值区域中波动,如果该比例大幅高于阈值区间的上限阈值,或者大幅低于阈值区间的下限阈值,都可以表明预先建立的交易量预测模型已经失效,需要重新训练数据,并基于重新训练的数据重新预测每类历史交易数据对应的商品交易量,即需要重新建立新的交易量预测模型。
则在重复执行上述步骤31至步骤34后,还可以执行:
步骤35,确定在规定数量的电子商品交易过程中,每一个电子商品在过去规定时长内是否存在异常交易的情况,判断存在异常交易的电子商品的数量与规定数量的比值是否在规定的阈值区间范围内,其中该阈值区间可以是一个经验值范围,例如可以取(0,0.3),即需要保证异常交易数量占总体交易数量的比值在30%以内;
步骤36,如果步骤35中的判断结果为是,则分别输出每个被确定为在过去规定时长的异常交易商品的商品信息,即针对每个被确定为在过去规定时长的异常交易商品,会输出该异常交易商品的商品数据,比如输出具体商品的标识id,具体输出形式可以为:异常交易商品的信息(商品a,商品b....),以供后续分析;
步骤37,如果步骤35中的判断结果为否,则重新执行在商品交易数据库记录的历史交易数据中提取规定数目的历史交易数据,并根据提取的规定数目的历史交易数据,执行商品交易量预测处理的过程,即需要重新执行上述图1所示的处理过程,重建新的交易量预测模型。
上述图3所示的处理过程,即示出了对每一个新的商品交易处理,需要根据该商品在一个规定长的时间内的历史交易数据,使用预先建立的交易量预测模型预测该商品在该规定长的时间内的预测交易量值。然后再从商品交易数据库中获取该商品在该规定长的时间内的实际交易量值,基于该商品的实际交易量值和预测交易量值,判断该商品在规定长的时间内是否存在异常交易。此外,由于电子商品的各种交易特征与其交易量的关系将随着季节、时间、买家的心理和电子商务整体的发展将发生较大变化,所以可以根据异常商品交易的数量在总体商品交易总量中的整体分布情况做一个稳定性分析,如果预先建立的交易量预测模型达到了稳定性要求,就可以直接输出异常交易商品的数据。如果没达到稳定性要求,就需要重新训练新的交易量预测模型。
相应的,本申请实施例还提供了一种预测电子商品交易量的装置,其具体组成结构如图4所示,包括训练数据提取单元40,用于在商品交易数据库记录的历史交易数据中提取规定数目的历史交易数据作为训练数据,其中每一个历史交易数据对应一个商品在交易过程中的历史交易数据;训练特征提取单元41,用于根据训练数据提取单元40提取的规定数目的历史交易数据,执行根据预先规定的需提取的各交易特征,针对提取的每一个历史交易数据,提取该历史交易数据中对应的交易特征值,构成对应该历史交易数据的交易特征值集合的操作;数据分类单元42,用于根据训练特征提取单元41针对每个历史交易数据分别提取构成的交易特征值集合,按照预先设定的不同数据分类原则,将提取的各个历史交易数据进行分类,其中各交易特征需同时满足相应条件时构成一个数据分类原则;第一交易量预测单元43,用于针对数据分类单元42分类得到的每一类历史交易数据,根据该类历史交易数据中的每一个历史交易数据中分别包含的商品交易量信息,预测对应该类历史交易数据的商品交易量,较佳地第一交易量预测单元43可以确定该类历史交易数据中的每一个历史交易数据中分别包含的商品交易量信息的平均值,作为预测得到的对应该类历史交易数据的商品交易量。
较佳地,训练数据提取单元40具体可以包括数据分组子单元401,用于根据商品交易数据库记录的历史交易数据中分别包含的商品销量信息的高低,将商品交易数据库中记录的历史交易数据划分为不同组;数据提取子单元402,用于分别在数据分组子单元401划分得到的每组历史交易数据中提取相应数目的历史交易数据,由从不同组历史交易数据中分别提取的相应数目的历史交易数据构成需要提取的规定数目的历史交易数据作为训练数据。
较佳地,训练特征提取单元41具体可以在训练数据提取单元40提取的规定数目的历史交易数据中,随机抽取至少两个历史交易数据子集;以及针对随机抽取的每个历史交易数据子集,通过分别与交易数据分类单元42和第一交易量预测单元43配合执行一次商品交易量预测处理;这样本申请这里提出的装置还进而可以包括第二交易量预测单元44,用于将第一交易量预测单元43针对随机抽取的每个历史交易数据子集分别预测得到的对应同一类历史交易数据的商品交易量的平均值,作为最终预测得到的对应该类历史交易数据的商品交易量。
基于本申请实施例上述提供的预测电子商品交易量的装置,本申请实施例还进而提出了一种电子商品异常交易过程的确定装置,其具体组成结构如图5所示,包括交易数据提取单元50,用于针对每一个待检测的电子商品交易过程,在商品交易数据库记录的历史交易数据中提取该商品在过去规定时长内的历史交易数据,并提取该商品在过去规定时长内的实际交易量;交易特征提取单元51,用于根据预先规定需提取的各交易特征,在交易数据提取单元50提取的该商品在过去规定时长内的历史交易数据中提取对应的交易特征值;商品交易量预测单元52,用于根据交易特征提取单元51提取的交易特征值同时满足的相应条件对应的数据分类原则,根据预先建立的交易量预测模型信息将针对该数据分类原则对应的一类历史交易数据预测的商品交易量,作为该商品在过去规定时长内的预测交易量;交易状态确定单元53,用于根据该商品在过去规定时长内的预测交易量和实际交易量,确定该商品在过去规定时长内是否存在异常交易。具体地交易状态确定单元53可以在确定出该商品在过去规定时长内的实际交易量大于第一规定阈值时,且该商品在过去规定时长内的实际交易量与预测交易量的比值大于第二规定阈值时,确定该商品为在过去规定时长的异常交易商品。
此外,本申请实施例提供的电子商品异常交易过程的确定装置,还可以进而包括异常交易数量比例确定单元54,用于根据交易状态确定单元53分别针对规定数量的电子商品中,确定的每一个电子商品在过去规定时长内是否存在异常交易的情况,判断存在异常交易的电子商品的数量与规定数量的比值是否在规定的阈值区间范围内;异常交易信息输出单元55,用于在异常交易数量比例确定单元54的判断结果为是时,分别输出每个被确定为在过去规定时长的异常交易商品的商品信息;交易量重新预测触发单元56,用于在异常交易数量比例确定单元54的判断结果为否时,重新触发所述预测电子商品交易量的装置重新执行商品交易量预测处理的过程。
本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (11)

1.一种预测电子商品交易量的方法,其特征在于,包括:
在商品交易数据库记录的历史交易数据中提取规定数目的历史交易数据,其中每一个历史交易数据对应一个商品在交易过程中的历史交易数据;
根据提取的规定数目的历史交易数据,执行下述商品交易量预测处理:
根据预先规定的需提取的各交易特征,针对提取的每一个历史交易数据,提取该历史交易数据中对应的交易特征值,构成对应该历史交易数据的交易特征值集合;
根据针对每个历史交易数据分别提取构成的交易特征值集合,按照预先设定的不同数据分类原则,将提取的各个历史交易数据进行分类,其中各交易特征需同时满足相应条件时构成一个数据分类原则;
针对分类得到的每一类历史交易数据,根据该类历史交易数据中的每一个历史交易数据中分别包含的商品交易量信息,预测对应该类历史交易数据的商品交易量。
2.根据权利要求1所述的方法,其特征在于,在商品交易数据库记录的历史交易数据中提取规定数目的历史交易数据,具体包括:
根据商品交易数据库记录的历史交易数据中分别包含的商品销量信息的高低,将商品交易数据库中记录的历史交易数据划分为不同组;
分别在划分得到的每组历史交易数据中提取相应数目的历史交易数据,由从不同组历史交易数据中分别提取的相应数目的历史交易数据构成需要提取的规定数目的历史交易数据。
3.根据权利要求1所述的方法,其特征在于,根据该类历史交易数据中的每一个历史交易数据中分别包含的商品交易量信息,预测对应该类历史交易数据的商品交易量,具体包括:
确定该类历史交易数据中的每一个历史交易数据中分别包含的商品交易量信息的平均值,作为预测得到的对应该类历史交易数据的商品交易量。
4.根据权利要求1所述的方法,其特征在于,根据提取的规定数目的历史交易数据,执行商品交易量预测处理,具体包括:
在提取的规定数目的历史交易数据中,随机抽取至少两个历史交易数据子集;以及
针对随机抽取的每个历史交易数据子集,分别执行一次商品交易量预测处理;
所述方法还包括:
将针对随机抽取的每个历史交易数据子集分别预测得到的对应同一类历史交易数据的商品交易量的平均值,作为最终预测得到的对应该类历史交易数据的商品交易量。
5.一种基于1~4任一权利要求所述的预测电子商品交易量的方法的电子商品异常交易过程确定方法,其特征在于,包括:
针对每一个电子商品,在商品交易数据库记录的历史交易数据中提取该商品在过去规定时长内的历史交易数据;
根据预先规定需提取的各交易特征,在提取的该商品在过去规定时长内的历史交易数据中提取对应的交易特征值;
根据提取的交易特征值同时满足的相应条件对应的数据分类原则,将针对该数据分类原则对应的一类历史交易数据预测的商品交易量,作为该商品在过去规定时长内的预测交易量;
在商品交易数据库记录的历史交易数据中提取该商品在过去规定时长内的实际交易量;
根据该商品在过去规定时长内的预测交易量和实际交易量,确定该商品在过去规定时长内是否存在异常交易。
6.根据权利要求5所述的方法,其特征在于,根据该商品在过去规定时长内的预测交易量和实际交易量,确定该商品在过去规定时长内是否存在异常交易,具体包括:
在确定出该商品在过去规定时长内的实际交易量大于第一规定阈值时,且该商品在过去规定时长内的实际交易量与预测交易量的比值大于第二规定阈值时,确定该商品为在过去规定时长的异常交易商品。
7.根据权利要求5所述的方法,其特征在于,还包括:
根据分别针对规定数量的电子商品中,确定的每一个电子商品在过去规定时长内是否存在异常交易的情况,判断存在异常交易的电子商品的数量与规定数量的比值是否在规定的阈值区间范围内;
如果是,则分别输出每个被确定为在过去规定时长的异常交易商品的商品信息;
如果否,则重新执行在商品交易数据库记录的历史交易数据中提取规定数目的历史交易数据,并根据提取的规定数目的历史交易数据,执行商品交易量预测处理的过程。
8.一种预测电子商品交易量的装置,其特征在于,包括:
训练数据提取单元,用于在商品交易数据库记录的历史交易数据中提取规定数目的历史交易数据,其中每一个历史交易数据对应一个商品在交易过程中的历史交易数据;
训练特征提取单元,用于根据训练数据提取单元提取的规定数目的历史交易数据,执行根据预先规定的需提取的各交易特征,针对提取的每一个历史交易数据,提取该历史交易数据中对应的交易特征值,构成对应该历史交易数据的交易特征值集合;
数据分类单元,用于根据训练特征提取单元针对每个历史交易数据分别提取构成的交易特征值集合,按照预先设定的不同数据分类原则,将提取的各个历史交易数据进行分类,其中各交易特征需同时满足相应条件时构成一个数据分类原则;
第一交易量预测单元,用于针对数据分类单元分类得到的每一类历史交易数据,根据该类历史交易数据中的每一个历史交易数据中分别包含的商品交易量信息,预测对应该类历史交易数据的商品交易量。
9.一种基于权利要求8所述的预测电子商品交易量的装置的电子商品异常交易过程确定装置,其特征在于,包括:
交易数据提取单元,用于针对每一个电子商品,在商品交易数据库记录的历史交易数据中提取该商品在过去规定时长内的历史交易数据,并提取该商品在过去规定时长内的实际交易量;
交易特征提取单元,用于根据预先规定需提取的各交易特征,在交易数据提取单元提取的该商品在过去规定时长内的历史交易数据中提取对应的交易特征值;
商品交易量预测单元,用于根据交易特征提取单元提取的交易特征值同时满足的相应条件对应的数据分类原则,将针对该数据分类原则对应的一类历史交易数据预测的商品交易量,作为该商品在过去规定时长内的预测交易量;
交易状态确定单元,用于根据该商品在过去规定时长内的预测交易量和实际交易量,确定该商品在过去规定时长内是否存在异常交易。
10.根据权利要求9所述的装置,其特征在于,所述交易状态确定单元,具体用于在确定出该商品在过去规定时长内的实际交易量大于第一规定阈值时,且该商品在过去规定时长内的实际交易量与预测交易量的比值大于第二规定阈值时,确定该商品为在过去规定时长的异常交易商品。
11.根据权利要求10所述的装置,其特征在于,还包括:
异常交易数量比例确定单元,用于根据交易状态确定单元分别针对规定数量的电子商品中,确定的每一个电子商品在过去规定时长内是否存在异常交易的情况,判断存在异常交易的电子商品的数量与规定数量的比值是否在规定的阈值区间范围内;
异常交易信息输出单元,用于在异常交易数量比例确定单元的判断结果为是时,分别输出每个被确定为在过去规定时长的异常交易商品的商品信息;
交易量重新预测触发单元,用于在异常交易数量比例确定单元的判断结果为否时,重新触发所述预测电子商品交易量的装置重新执行商品交易量预测处理的过程。
CN201110205211.5A 2011-07-21 2011-07-21 电子商品异常交易过程的确定方法及其装置 Active CN102890803B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110205211.5A CN102890803B (zh) 2011-07-21 2011-07-21 电子商品异常交易过程的确定方法及其装置
HK13103566.3A HK1176725A1 (zh) 2011-07-21 2013-03-22 電子商品異常交易過程的確定方法及其裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110205211.5A CN102890803B (zh) 2011-07-21 2011-07-21 电子商品异常交易过程的确定方法及其装置

Publications (2)

Publication Number Publication Date
CN102890803A true CN102890803A (zh) 2013-01-23
CN102890803B CN102890803B (zh) 2016-01-06

Family

ID=47534298

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110205211.5A Active CN102890803B (zh) 2011-07-21 2011-07-21 电子商品异常交易过程的确定方法及其装置

Country Status (2)

Country Link
CN (1) CN102890803B (zh)
HK (1) HK1176725A1 (zh)

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377454A (zh) * 2013-07-11 2013-10-30 西安交通大学 基于余弦相似度的异常报税数据检测方法
CN103886068A (zh) * 2014-03-20 2014-06-25 北京国双科技有限公司 用于互联网用户行为分析的数据处理方法和装置
CN104574093A (zh) * 2013-10-22 2015-04-29 北京思博途信息技术有限公司 一种基于电商样本数据信息计算销量的方法及装置
CN104679777A (zh) * 2013-12-02 2015-06-03 中国银联股份有限公司 一种用于检测欺诈交易的方法及系统
CN104951843A (zh) * 2014-03-27 2015-09-30 日立(中国)研究开发有限公司 销量预测系统及方法
CN105069626A (zh) * 2015-07-23 2015-11-18 北京京东尚科信息技术有限公司 一种购物异常检测方法及系统
CN105095238A (zh) * 2014-05-04 2015-11-25 中国银联股份有限公司 用于检测欺诈交易的决策树生成方法
CN105187242A (zh) * 2015-08-20 2015-12-23 中国人民解放军国防科学技术大学 一种基于变长序列模式挖掘的用户异常行为检测方法
CN105279691A (zh) * 2014-07-25 2016-01-27 中国银联股份有限公司 基于随机森林模型的金融交易检测方法和设备
CN106156027A (zh) * 2015-03-24 2016-11-23 阿里巴巴集团控股有限公司 一种异常交易的识别方法及装置
CN106156122A (zh) * 2015-04-07 2016-11-23 阿里巴巴集团控股有限公司 交易信息获取方法及装置
CN106204086A (zh) * 2015-05-06 2016-12-07 阿里巴巴集团控股有限公司 商品销量的预警方法和装置
CN106294529A (zh) * 2015-06-29 2017-01-04 阿里巴巴集团控股有限公司 一种识别用户异常操作方法和设备
CN106446021A (zh) * 2013-06-24 2017-02-22 北京奇虎科技有限公司 一种异常数据检测处理的方法和系统
CN106779843A (zh) * 2016-12-15 2017-05-31 中国银联股份有限公司 一种基于客户群体特征的商户竞合关系分析的方法和装置
CN106920109A (zh) * 2017-02-21 2017-07-04 福建师范大学福清分校 用于电子商务虚假交易的识别方法、系统及电子商务系统
CN106971344A (zh) * 2016-01-14 2017-07-21 平安科技(深圳)有限公司 保额控制方法和系统
CN106980998A (zh) * 2016-01-18 2017-07-25 阿里巴巴集团控股有限公司 商家交易异常的监控方法和装置
CN107305665A (zh) * 2016-04-19 2017-10-31 李辉 一种鉴别虚假交易、防止刷单的方法及装置
CN107633421A (zh) * 2017-08-24 2018-01-26 武汉科技大学 一种市场预测数据的处理方法及装置
WO2018166457A1 (zh) * 2017-03-15 2018-09-20 阿里巴巴集团控股有限公司 神经网络模型训练、交易行为风险识别方法及装置
CN108681964A (zh) * 2018-04-19 2018-10-19 腾讯科技(深圳)有限公司 一种交易结算系统及交易结算控制方法
CN108897834A (zh) * 2018-06-22 2018-11-27 招商信诺人寿保险有限公司 数据处理与挖掘方法
CN109461067A (zh) * 2018-09-12 2019-03-12 阿里巴巴集团控股有限公司 一种外汇报价异常数据的检测方法、装置及系统
CN109492135A (zh) * 2018-10-27 2019-03-19 平安科技(深圳)有限公司 一种基于数据处理的数据审核方法以及装置
CN109697669A (zh) * 2018-12-06 2019-04-30 泰康保险集团股份有限公司 基于区块链的欺诈行为确定方法及装置、介质和电子设备
CN109948669A (zh) * 2019-03-04 2019-06-28 腾讯科技(深圳)有限公司 一种异常数据检测方法及装置
CN110533297A (zh) * 2019-08-02 2019-12-03 中国银联股份有限公司 一种识别异常设备的方法及装置
WO2019232773A1 (en) * 2018-06-08 2019-12-12 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for abnormality detection in data storage
CN110569190A (zh) * 2019-08-27 2019-12-13 中国工商银行股份有限公司 交易压力测试方法和装置、以及电子设备和可读存储介质
WO2020024456A1 (zh) * 2018-08-01 2020-02-06 平安科技(深圳)有限公司 一种量化交易预测方法、装置及设备
CN110807466A (zh) * 2018-08-01 2020-02-18 北京京东金融科技控股有限公司 一种处理订单数据的方法和装置
CN117372129A (zh) * 2023-10-27 2024-01-09 北京赛博数智科技有限公司 一种基于大数据的电商运营预警管理方法、系统及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1513151A (zh) * 2001-05-31 2004-07-14 ��ʽ�����ͨTec 以3指标轴表示的客户价值为基准的销售预测方法
US20040230485A1 (en) * 1995-04-19 2004-11-18 Barnett Craig W. Method and system for electronic distribution of product redemption coupons
CN101937541A (zh) * 2009-06-30 2011-01-05 商文彬 一种用于评价客户信用度的方法及设备
CN102045682A (zh) * 2009-10-19 2011-05-04 中兴通讯股份有限公司 一种支付业务异常交易的处理方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040230485A1 (en) * 1995-04-19 2004-11-18 Barnett Craig W. Method and system for electronic distribution of product redemption coupons
CN1513151A (zh) * 2001-05-31 2004-07-14 ��ʽ�����ͨTec 以3指标轴表示的客户价值为基准的销售预测方法
CN101937541A (zh) * 2009-06-30 2011-01-05 商文彬 一种用于评价客户信用度的方法及设备
CN102045682A (zh) * 2009-10-19 2011-05-04 中兴通讯股份有限公司 一种支付业务异常交易的处理方法及系统

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446021B (zh) * 2013-06-24 2019-08-02 北京奇虎科技有限公司 一种异常数据检测处理的方法和系统
CN106446021A (zh) * 2013-06-24 2017-02-22 北京奇虎科技有限公司 一种异常数据检测处理的方法和系统
CN103377454A (zh) * 2013-07-11 2013-10-30 西安交通大学 基于余弦相似度的异常报税数据检测方法
CN103377454B (zh) * 2013-07-11 2015-11-11 西安交通大学 基于余弦相似度的异常报税数据检测方法
CN104574093A (zh) * 2013-10-22 2015-04-29 北京思博途信息技术有限公司 一种基于电商样本数据信息计算销量的方法及装置
CN104574093B (zh) * 2013-10-22 2018-03-23 秒针信息技术有限公司 一种基于电商样本数据信息计算销量的方法及装置
CN104679777A (zh) * 2013-12-02 2015-06-03 中国银联股份有限公司 一种用于检测欺诈交易的方法及系统
CN104679777B (zh) * 2013-12-02 2018-05-18 中国银联股份有限公司 一种用于检测欺诈交易的方法及系统
CN103886068B (zh) * 2014-03-20 2018-04-03 北京国双科技有限公司 用于互联网用户行为分析的数据处理方法和装置
CN103886068A (zh) * 2014-03-20 2014-06-25 北京国双科技有限公司 用于互联网用户行为分析的数据处理方法和装置
CN104951843B (zh) * 2014-03-27 2018-10-26 日立(中国)研究开发有限公司 销量预测系统及方法
CN104951843A (zh) * 2014-03-27 2015-09-30 日立(中国)研究开发有限公司 销量预测系统及方法
CN105095238A (zh) * 2014-05-04 2015-11-25 中国银联股份有限公司 用于检测欺诈交易的决策树生成方法
CN105279691A (zh) * 2014-07-25 2016-01-27 中国银联股份有限公司 基于随机森林模型的金融交易检测方法和设备
CN106156027A (zh) * 2015-03-24 2016-11-23 阿里巴巴集团控股有限公司 一种异常交易的识别方法及装置
CN106156122A (zh) * 2015-04-07 2016-11-23 阿里巴巴集团控股有限公司 交易信息获取方法及装置
CN106204086A (zh) * 2015-05-06 2016-12-07 阿里巴巴集团控股有限公司 商品销量的预警方法和装置
CN106294529A (zh) * 2015-06-29 2017-01-04 阿里巴巴集团控股有限公司 一种识别用户异常操作方法和设备
CN105069626B (zh) * 2015-07-23 2018-10-02 北京京东尚科信息技术有限公司 一种购物异常检测方法及系统
CN105069626A (zh) * 2015-07-23 2015-11-18 北京京东尚科信息技术有限公司 一种购物异常检测方法及系统
CN105187242A (zh) * 2015-08-20 2015-12-23 中国人民解放军国防科学技术大学 一种基于变长序列模式挖掘的用户异常行为检测方法
CN105187242B (zh) * 2015-08-20 2018-11-27 中国人民解放军国防科学技术大学 一种基于变长序列模式挖掘的用户异常行为检测方法
CN106971344A (zh) * 2016-01-14 2017-07-21 平安科技(深圳)有限公司 保额控制方法和系统
CN106980998A (zh) * 2016-01-18 2017-07-25 阿里巴巴集团控股有限公司 商家交易异常的监控方法和装置
CN107305665A (zh) * 2016-04-19 2017-10-31 李辉 一种鉴别虚假交易、防止刷单的方法及装置
CN106779843A (zh) * 2016-12-15 2017-05-31 中国银联股份有限公司 一种基于客户群体特征的商户竞合关系分析的方法和装置
CN106779843B (zh) * 2016-12-15 2020-08-11 中国银联股份有限公司 一种基于客户群体特征的商户竞合关系分析的方法和装置
CN106920109A (zh) * 2017-02-21 2017-07-04 福建师范大学福清分校 用于电子商务虚假交易的识别方法、系统及电子商务系统
WO2018166457A1 (zh) * 2017-03-15 2018-09-20 阿里巴巴集团控股有限公司 神经网络模型训练、交易行为风险识别方法及装置
CN107633421A (zh) * 2017-08-24 2018-01-26 武汉科技大学 一种市场预测数据的处理方法及装置
CN108681964A (zh) * 2018-04-19 2018-10-19 腾讯科技(深圳)有限公司 一种交易结算系统及交易结算控制方法
CN108681964B (zh) * 2018-04-19 2020-08-28 腾讯科技(深圳)有限公司 一种交易结算系统及交易结算控制方法
WO2019232773A1 (en) * 2018-06-08 2019-12-12 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for abnormality detection in data storage
CN108897834A (zh) * 2018-06-22 2018-11-27 招商信诺人寿保险有限公司 数据处理与挖掘方法
CN110807466A (zh) * 2018-08-01 2020-02-18 北京京东金融科技控股有限公司 一种处理订单数据的方法和装置
WO2020024456A1 (zh) * 2018-08-01 2020-02-06 平安科技(深圳)有限公司 一种量化交易预测方法、装置及设备
CN109461067A (zh) * 2018-09-12 2019-03-12 阿里巴巴集团控股有限公司 一种外汇报价异常数据的检测方法、装置及系统
CN109492135A (zh) * 2018-10-27 2019-03-19 平安科技(深圳)有限公司 一种基于数据处理的数据审核方法以及装置
CN109492135B (zh) * 2018-10-27 2024-03-19 平安科技(深圳)有限公司 一种基于数据处理的数据审核方法以及装置
CN109697669A (zh) * 2018-12-06 2019-04-30 泰康保险集团股份有限公司 基于区块链的欺诈行为确定方法及装置、介质和电子设备
CN109948669A (zh) * 2019-03-04 2019-06-28 腾讯科技(深圳)有限公司 一种异常数据检测方法及装置
CN110533297A (zh) * 2019-08-02 2019-12-03 中国银联股份有限公司 一种识别异常设备的方法及装置
CN110533297B (zh) * 2019-08-02 2023-04-14 中国银联股份有限公司 一种识别异常设备的方法及装置
CN110569190A (zh) * 2019-08-27 2019-12-13 中国工商银行股份有限公司 交易压力测试方法和装置、以及电子设备和可读存储介质
CN110569190B (zh) * 2019-08-27 2023-03-31 中国工商银行股份有限公司 交易压力测试方法和装置、以及电子设备和可读存储介质
CN117372129A (zh) * 2023-10-27 2024-01-09 北京赛博数智科技有限公司 一种基于大数据的电商运营预警管理方法、系统及存储介质

Also Published As

Publication number Publication date
HK1176725A1 (zh) 2013-08-02
CN102890803B (zh) 2016-01-06

Similar Documents

Publication Publication Date Title
CN102890803B (zh) 电子商品异常交易过程的确定方法及其装置
Tsang et al. Detecting online auction shilling frauds using supervised learning
CN108389073A (zh) 商品售价的自动计算方法及系统、电子设备及存储介质
JP2003529139A (ja) 最適なアンダーライトを行うためのポートフォリオの効率的サンプリング方法とシステム
JP2003535387A (ja) 金融商品等の資産ポートフォリオの高速評価
CN102156932A (zh) 一种客户再次购买意向预测方法及装置
JP2004500642A (ja) キャッシュフローのリカバリとリスクを評価する方法とシステム
Tsai et al. Genetic algorithms for the investment of the mutual fund with global trend indicator
CN107609771A (zh) 一种供应商价值评价方法
CN111882420A (zh) 响应率的生成方法、营销方法、模型训练方法及装置
CN113642923A (zh) 基于历史催收数据的不良资产包价值评估方法
Jain et al. NFT Appraisal Prediction: Utilizing Search Trends, Public Market Data, Linear Regression and Recurrent Neural Networks
CN115994271A (zh) 心理测评量表的推荐方法
CN116664173A (zh) 一种基于大数据模型的竞品分析方法、终端及存储介质
Yarushev et al. Review of studies on time series forecasting based on hybrid methods, neural networks and multiple regression
CN115423499A (zh) 模型训练方法、价格预测方法、终端设备以及存储介质
CN113886697A (zh) 基于聚类算法的活动推荐方法、装置、设备及存储介质
Domashova et al. Application of machine learning methods for risk analysis of unfavorable outcome of government procurement procedure in building and grounds maintenance domain
CN113420789A (zh) 一种预测风险账号的方法、装置、存储介质和计算机设备
KR102321515B1 (ko) 가상화폐 거래정보 산출시스템 및 이를 이용한 가상화폐 거래정보 산출방법, 그리고 프로그램의 기록매체
CN115841345B (zh) 跨境大数据智能化分析方法、系统以及存储介质
Yee et al. Using machine learning to forecast residential property prices in overcoming the property overhang issue
CN114298472A (zh) 数字工厂上下游企业画像评价方法以及系统
CN113706258A (zh) 基于组合模型的产品推荐方法、装置、设备及存储介质
Malara et al. Modelling the determinants of winning in public tendering procedures based on the activity of a selected company

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1176725

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1176725

Country of ref document: HK