CN107330741A - 分品类电子券使用预测方法、装置及电子设备 - Google Patents
分品类电子券使用预测方法、装置及电子设备 Download PDFInfo
- Publication number
- CN107330741A CN107330741A CN201710552119.3A CN201710552119A CN107330741A CN 107330741 A CN107330741 A CN 107330741A CN 201710552119 A CN201710552119 A CN 201710552119A CN 107330741 A CN107330741 A CN 107330741A
- Authority
- CN
- China
- Prior art keywords
- certificate
- feature
- user
- model
- graded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及分品类电子券使用预测方法、装置及电子设备,方法包括:根据用户领取分品类电子券的历史信息确定模型训练样本;获取所述模型训练样本中所述用户的特征和所述分品类电子券的特征作为所述模型训练样本的样本信息;基于设定分类模型对所述模型训练样本根据所述样本信息进行模型训练;基于训练后的所述设定分类模型预测给定用户对给定分品类电子券的使用概率。能预测指定用户对指定分品类电子券的使用概率,能对不同的用户进行不同种类的发券营销,从而进行精准营销,能提升复购效果,能降低复购营销成本。
Description
技术领域
本申请涉及数据建模技术领域,具体而言,涉及分品类电子券使用预测方法、装置及电子设备。
背景技术
电子商务网站中,电子券的使用较为频繁,随着电子商务的蓬勃发展,电子券的使用量也越来越多。但是目前的精准营销中,电子券的使用比例较低。如何更精准的提高电子券的使用率至关重要,其不仅可以为网站带来一定的新用户,而且能够有效地提升网站的GMV(Gross Merchandise Volume,商品交易总额),也能够唤醒沉睡的用户。
现有的技术方案是基于GBDT(Gradient Boosting Decision Tree,基于决策树实现的分类回归算法)分类模型进行全分品类电子券使用预测。通过用户的购物特征、浏览特征、搜索特征、加购特征和关注特征等,采用GBDT模型进行预测用户的全品类电子券使用概率,然后根据模型的准确率与召回率发放相应的电子券。
上述技术方案仅能针对全品类电子券进行预测,但是目前基于GBDT单模型的全品类电子券预AUC(Area Under roc Curve,一个度量分类模型好坏的一个标准度量分类模型好坏的标准)较低,而且全品类电子券的使用场景有限,更多的电子券均属于限品类的电子券,导致全品类电子券使用率更低,不能满足日益精细化的品类运营与营销。
发明内容
本申请公开分品类电子券使用预测方法,使得能预测指定用户对指定分品类电子券的使用概率。本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明的第一方面,提供一种分品类电子券使用预测方法,包括:根据用户领取分品类电子券的历史信息确定模型训练样本;获取所述模型训练样本中所述用户的特征和所述分品类电子券的特征作为所述模型训练样本的样本信息;基于设定分类模型(例如堆集分类模型)对所述模型训练样本根据所述样本信息进行模型训练;基于训练后的所述设定分类模型预测给定用户对给定分品类电子券的使用概率。
根据一些实施例,所述用户的特征包括所述用户在所述分品类电子券所对应品类下的购买特征、浏览特征、搜索特征、加购特征、以及关注特征中的至少一种。
根据一些实施例,所述购买特征包括购买SKU数、购买订单量、购买单价、使用电子券购买订单量、使用电子券购买金额、以及使用电子券购买单价中的至少一种。
根据一些实施例,所述浏览特征包括浏览总量、预设时长的浏览量中的至少一种;所述加购特征包括加购SKU量、预设时长的加购量中的至少一种;和/或所述关注特征包括关注SKU数、预设时长的关注量中的至少一种。
根据一些实施例,所述分品类电子券的特征包括所述分品类电子券的明细特征、所述分品类电子券与商品的关联特征。
根据一些实施例,所述分品类电子券的明细特征包括所述分品类电子券的限额、面额、折扣中的至少一种。
根据一些实施例,所述分品类电子券与商品的关联特征包括:所述商品的价格与所述分品类电子券的限额的比值、所述商品的价格与所述分品类电子券的面额的比值、以及所述商品的价格与所述商品的当前折扣相乘后减去所述分品类电子券的面额三者中的至少一种。
根据一些实施例,所述设定分类模型包括两层分类模型,所述设定分类模型采用GBDT分类器进行迭代。
根据一些实施例,在获取所述样本信息之后还包括:根据所述样本信息对所述模型训练样本进行清洗。
根据一些实施例,根据所述样本信息对所述模型训练样本进行清洗包括:根据所述样本信息从所述模型训练样本中剔除异常用户、将所述样本信息进行标准化处理、以及对所述样本信息中的异常值和缺失值进行处理至少一种操作;其中所述异常用户包括风险用户、企业用户、以及刷单用户中的至少一种。
根据一些实施例,在预测给定用户对给定分品类电子券的使用概率之后还包括:根据所述使用概率确定营销方案。
根据一些实施例,在基于训练后的所述设定分类模型预测给定用户对给定分品类电子券的使用概率之前还包括:对训练后的所述设定分类模型进行评价,根据评价结果对所述设定分类模型进行修正。
根据一些实施例,对训练后的所述设定分类模型进行评价包括:采用曲线下面积AUC对训练后的所述设定分类模型进行评价。
根据一些实施例,所述设定分类模型包括stacking堆集分类模型。
根据本发明的第二方面,提供一种分品类电子券使用预测装置,其包括:训练样本确定单元,用于根据用户领取分品类电子券的历史信息确定模型训练样本;样本信息获取单元,用于获取所述模型训练样本中所述用户的特征和所述分品类电子券的特征作为所述模型训练样本的样本信息;模型训练单元,用于基于设定分类模型对所述模型训练样本根据所述样本信息进行模型训练;概率预测单元,用于基于训练后的所述设定分类模型预测给定用户对给定分品类电子券的使用概率。
根据一些实施例,所述用户的特征包括所述用户在所述分品类电子券所对应品类下的购买特征、浏览特征、搜索特征、加购特征、以及关注特征中的至少一种。
根据一些实施例,所述购买特征包括购买SKU数、购买订单量、购买单价、使用电子券购买订单量、使用电子券购买金额、以及使用电子券购买单价中的至少一种。
根据一些实施例,所述浏览特征包括浏览总量、预设时长的浏览量中的至少一种;所述加购特征包括加购SKU量、预设时长的加购量中的至少一种;和/或所述关注特征包括关注SKU数、预设时长的关注量中的至少一种。
根据一些实施例,所述分品类电子券的特征包括所述分品类电子券的明细特征、所述分品类电子券与商品的关联特征。
根据一些实施例,所述分品类电子券的明细特征包括所述分品类电子券的限额、面额、折扣中的至少一种。
根据一些实施例,所述分品类电子券与商品的关联特征包括:所述商品的价格与所述分品类电子券的限额的比值、所述商品的价格与所述分品类电子券的面额的比值、以及所述商品的价格与所述商品的当前折扣相乘后减去所述分品类电子券的面额三者中的至少一种。
根据一些实施例,所述设定分类模型包括两层分类模型,所述设定分类模型采用GBDT分类器进行迭代。
根据一些实施例,所述装置还包括样本信息清洗单元,用于在获取所述样本信息之后,根据所述样本信息对所述模型训练样本进行清洗。
根据一些实施例,所述样本信息清洗单元用于:根据所述样本信息从所述模型训练样本中剔除异常用户、将所述样本信息进行标准化处理、以及对所述样本信息中的异常值和缺失值进行处理至少一种操作;其中所述异常用户包括风险用户、企业用户、以及刷单用户中的至少一种。
根据一些实施例,所述装置还包括营销方案确定单元,用于在预测给定用户对给定分品类电子券的使用概率之后,根据所述使用概率确定营销方案。
根据一些实施例,所述装置还包括模型评价与修正单元,用于在基于训练后的所述设定分类模型预测给定用户对给定分品类电子券的使用概率之前,对训练后的所述设定分类模型进行评价,根据评价结果对所述设定分类模型进行修正。
根据一些实施例,所述模型评价与修正单元用于:采用曲线下面积AUC对训练后的所述设定分类模型进行评价。
根据一些实施例,所述设定分类模型包括stacking堆集分类模型。
根据本发明的第三方面,提供一种电子设备,包括:处理器;存储器,存储用于处理器控制如第一方面任面项操作的指令。
根据本发明的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面任一项所述操作的步骤。
本申请的实施例提供的技术方案可以包括以下有益效果:
本申请的实施例提供的技术方案能预测指定用户对指定分品类电子券的使用概率,能对不同的用户进行不同种类的发券营销,从而进行精准营销,能提升复购效果,能降低复购营销成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明。
附图说明
通过参照附图详细描述其示例实施例,本发明的上述和其他特征及优点将变得更加明显。
图1示出了根据本发明一实施例的分品类电子券使用预测方法;
图2示出了根据本发明另一实施例的分品类电子券使用预测方法;
图3示出了根据本发明一实施例一示例所述的stacking模型的架构;
图4示出了根据本发明一实施例的分品类电子券使用预测装置的框图;
图5示出了根据本发明另一实施例的分品类电子券使用预测装置的框图;
图6示出了根据本发明一实施例的电子设备。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示出了根据本发明一实施例的分品类电子券使用预测方法,本实施例可适用于根据用户领取分品类电子券的历史信息进行模型训练,以通过训练后的模型预测给定用户对给定分品类电子券的使用概率的情况,如图1所示,本实施例所述的分品类电子券使用预测方法包括:
在步骤S110中,根据用户领取分品类电子券的历史信息确定模型训练样本。
需要说明的是,所述电子券包括但不限于优惠券、电子红包、代金券、电子礼金等。
在步骤S120中,获取所述模型训练样本中所述用户的特征和所述分品类电子券的特征作为所述模型训练样本的样本信息。
所述用户的特征主要用于分析用户对分品类电子券使用的倾向性,具体信息本实施例对此并不作限定,例如可以是用户在所述分品类电子券所对应品类下的购买特征、浏览特征、搜索特征、加购特征、以及关注特征等一种或一种以上。
例如,所述购买特征可以是购买SKU数、购买订单量、购买单价、使用电子券购买订单量、使用电子券购买金额、以及使用电子券购买单价中的一种或一种以上。
例如,所述浏览特征可以是浏览总量、预设时长的浏览量中的一种或一种以上。
例如,所述加购特征可以是加购SKU量、预设时长的加购量中的一种或一种以上。所述关注特征可以是关注SKU数、预设时长的关注量中的一种或一种以上。
例如,所述分品类电子券的特征可以是所述分品类电子券的明细特征、所述分品类电子券与商品的关联特征中的一种或一种以上。
例如,所述分品类电子券的明细特征可以是所述分品类电子券的限额、面额、折扣中的至少一种或一种以上。
例如,所述分品类电子券与商品的关联特征可以是:所述商品的价格与所述分品类电子券的限额的比值、所述商品的价格与所述分品类电子券的面额的比值、以及所述商品的价格与所述商品的当前折扣相乘后减去所述分品类电子券的面额中的一种或一种以上。
需要说明的是,本实施例中,选定了具体方面的用户特征之后,并非一成不变,随着对模型进行不断迭代训练或评估等操作,可能还会对选定的用户特征的具体方面进行调整和修正,例如增加、删除和/或替换特征,以进一步提高模型评估能力的准确性。
在步骤S130中,基于设定分类模型对所述模型训练样本根据所述样本信息进行模型训练。
所述设定分类模型可以是stacking堆集分类模型,例如,所述stacking分类模型可为两层分类模型,各分类模型可均采用GBDT分类器进行迭代。
在步骤S140中,基于训练后的所述设定分类模型预测给定用户对给定分品类电子券的使用概率。
至此,采用本实施例技术方案所述的方法可预测给定用户对给定分品类电子券的使用概率,其预测结果具有较高的准确性。
进一步地,在步骤S120和步骤S130之间,即获取所述样本信息之后,根据所述样本信息进行模型训练之前,还可根据所述样本信息对所述模型训练样本进行清洗,以提高训练样本的质量,从而提高预测的准确性。
例如根据所述样本信息从所述模型训练样本中剔除异常用户、将所述样本信息进行标准化处理、以及对所述样本信息中的异常值和缺失值进行处理等。其中剔除所述异常用户可包括剔除风险用户、企业用户、刷单用户等。
本实施例的技术方案能预测指定用户对指定分品类电子券的使用概率,能对不同的用户进行不同种类的发券营销,从而进行精准营销,能提升复购效果,能降低复购营销成本。
图2示出了根据本发明另一实施例的分品类电子券使用预测方法,如图2所示,本实施例所述的分品类电子券使用预测方法包括:
在步骤S210中,根据用户领取分品类电子券的历史信息确定模型训练样本。
例如,提取近1年领取过分品类电子券的用户作为模型训练的样本。其中已领取尚未使用的标签为0,已领取且已使用的标签为1。
在步骤S220中,获取所述模型训练样本中所述用户的特征和所述分品类电子券的特征作为所述模型训练样本的样本信息。
所述用户的特征可从如下几个方面获得,例如:
用户购买特征:计算用户在该品类下的购买明细,如:购买sku数,购买订单量,购买金额,购买客单价,使用电子券购买订单量,使用电子券购买金额,使用电子券购买客单价等,以及用户在全站的购买明细。
用户浏览特征:计算用户在该品类下的浏览明细,如:浏览总量,3天浏览量,7天浏览量,15天浏览量,30天浏览量等,以及用户在全站的浏览明细。
用户搜索特征:计算用户搜索目标品类的高相关词的次数,搜索电子券相关词(电子券、活动等)的次数,以及用户在全站的搜索次数。
用户加购特征:计算用户在该品类下的加购明细,如:加购sku数,3天加购量,7天加购量,15天加购量,30天加购量等,以及用户在全站的加购明细。
用户关注特征:计算用户在该品类下的关注明细,如:关注sku数,3天关注量,7天关注量,15天关注量,30天关注量等,以及用户在全站的关注明细。
电子券特征:计算分品类电子券的明细特征,如:限额,面额,折扣等。
商品——券特征:计算商品与电子券相关联的特征,例如获取商品价/限额,商品价/面额,商品价*折扣-面额等。
在步骤S230中,根据所述样本信息对所述模型训练样本进行清洗。
例如,首先根据具体的业务场景需求,需要排除刷单用户、风险用户和企业用户等异常用户,确保模型的适用性和健壮性。其次,需要排除某些异常值,补全缺失值等。最后,需要对数据进行标准化处理。
在步骤S240中,基于stacking分类模型对所述模型训练样本根据所述样本信息进行模型训练。
本实施例的步骤以stacking分类模型说明本实施例的技术方案,图3示出了根据本发明一实施例一示例所述的stacking模型的架构,310为训练集。如图3所示,本实施例示例的stacking分类模型可分为两层,例如第一层中训练多个不同的模型,然后再以第一层训练的各个模型的输出作为输入来训练第二层的模型,以得到一个最终的输出。例如该示例所述的模型的第一层有五个分类模型,第二层有一个分类模型。例如,在第一层中,对于不同的分类模型,分别将训练数据分为5份,接下来用GBDT分类器迭代5次。每次迭代时,将4份数据作为训练集对每个分类模型进行训练,然后剩下1份数据在训练好的分类模型上进行预测并且保留结果。当5次迭代都完成以后,就获得了一个完整的预测集。重复这个过程五次,每次都采用上述过程进行迭代训练,可以得到5个完整的预测集。然后将这些预测集作为特征输入到第二层的模型中进行训练,此时全部模型训练完毕。
每次迭代均可采用GBDT分类器,该算法由多棵决策树串行组成。传统的Boost算法在初始化时,为每一个样本赋一个相等的权重。在每一棵树训练后,增加错误分类点的权重,减少正确分类点的权重,这样可使错误分类的点被赋上一个很高的权重,在进行了N次迭代后,将会得到N个简单的决策树,将其组合起来得到一个最终的分类模型。而GBDT分类器与传统的Boost的区别是,每一次的计算是为了减少上一次的残差,其在残差减少的梯度方向上建立了一个新的模型。每个新的模型能使得之前模型的残差往梯度方向减少。
需要说明的是,每次迭代所采用的分类器本实施例对此并不作限定。由于GBDT模型效果较好,所以第一层和第二层中均可使用GBDT模型。
在步骤S250中,对训练后的所述stacking分类模型进行评价。
例如可采用曲线下面积AUC对训练后的所述stacking分类模型进行评价。例如可将AUC(Area under the Curve of ROC)是ROC(receiver operating characteristiccurve)曲线下方的面积,来作为判断二分类预测模型优劣的标准。ROC曲线的横坐标是伪阳性率(也叫假正类率,False Positive Rate),纵坐标是真阳性率(真正类率,TruePositive Rate)。
AUC的计算可采用如下步骤执行:
(1)对预测的概率值从大到小进行排序;
(2)令最大概率值对应的样本的rank为N,第二大概率值对应样本的rank为N-1,以此类推;
(3)把所有的正类样本的rank相加,再减去M-1种两个正样本组合的情况。得到的就是所有的样本中有多少对正类样本的概率值大于负类样本的概率值。然后再除以M×N。
具体计算公式如下:
其中,M+表示正例样本的数量。需要说明的是,使用AUC可以避免把预测概率转换成类别。
在步骤S260中,判断评价结果是否满足要求,若是则执行步骤S280,否则执行步骤S270。
在步骤S270中,根据评价结果对所述stacking分类模型进行修正,执行步骤S280。
在步骤S280中,基于训练后的所述stacking分类模型预测给定用户对给定分品类电子券的使用概率。
在步骤S290中,根据所述使用概率确定营销方案。
利用上述基于stacking分类模型的分品类电子券使用预测方法,可输出每个用户在相应三级品类下各电子券折扣率的使用概率值,这些概率值即用户在具体品类下的电子券促销敏感度,例如在复购促销场景中,业务方在筛选完潜在客户后,利用该模型计算出各用户对不同电子券的具体敏感度分值,之后可针对不同分值的用户进行不同种类的发券营销,从而进行精准营销,提升复购效果,降低复购营销成本。
本实施例所述技术方案解决了分品类电子券促销敏感度的预测问题,有效地提高了电子券促销敏感度预测的准确率。
图4示出了根据本发明一实施例的分品类电子券使用预测装置的框图,如图4所示,本实施例所述的分品类电子券使用预测装置包括训练样本确定单元410、样本信息获取单元420、模型训练单元430、以及概率预测单元440。
该训练样本确定单元410被配置为,用于根据用户领取分品类电子券的历史信息确定模型训练样本;
该样本信息获取单元420被配置为,用于获取所述模型训练样本中所述用户的特征和所述分品类电子券的特征作为所述模型训练样本的样本信息;
该模型训练单元430被配置为,用于基于stacking分类模型对所述模型训练样本根据所述样本信息进行模型训练;
该概率预测单元440被配置为,用于基于训练后的所述stacking分类模型预测给定用户对给定分品类电子券的使用概率。
根据本发明的一些实施例,所述用户的特征包括所述用户在所述分品类电子券所对应品类下的购买特征、浏览特征、搜索特征、加购特征、以及关注特征中的至少一种。
根据本发明的一些实施例,所述购买特征包括购买SKU数、购买订单量、购买单价、使用电子券购买订单量、使用电子券购买金额、以及使用电子券购买单价中的至少一种。
根据本发明的一些实施例:所述浏览特征包括浏览总量、预设时长的浏览量中的至少一种;所述加购特征包括加购SKU量、预设时长的加购量中的至少一种;和/或所述关注特征包括关注SKU数、预设时长的关注量中的至少一种。
根据本发明的一些实施例,所述分品类电子券的特征包括所述分品类电子券的明细特征、所述分品类电子券与商品的关联特征。
根据本发明的一些实施例,所述分品类电子券的明细特征包括所述分品类电子券的限额、面额、折扣中的至少一种。
根据本发明的一些实施例,所述分品类电子券与商品的关联特征包括:所述商品的价格与所述分品类电子券的限额的比值、所述商品的价格与所述分品类电子券的面额的比值、以及所述商品的价格与所述商品的当前折扣相乘后减去所述分品类电子券的面额三者中的至少一种。
根据本发明的一些实施例,所述设定分类模型包括两层分类模型,所述设定分类模型采用GBDT分类器进行迭代。
关于上述实施例中的装置,其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本实施例提供的分品类电子券使用预测装置可执行本发明方法实施例所提供的分品类电子券使用预测方法,具备执行方法相应的功能模块和有益效果。
图5示出了根据本发明另一实施例的分品类电子券使用预测装置的框图,如图5所示,本实施例所述的分品类电子券使用预测装置包括:训练样本确定单元510、样本信息获取单元520、样本信息清洗单元530、模型训练单元540、模型评价与修正单元550、概率预测单元560、以及概率预测单元570。
该训练样本确定单元510被配置为,用于根据用户领取分品类电子券的历史信息确定模型训练样本;
该样本信息获取单元520被配置为,用于获取所述模型训练样本中所述用户的特征和所述分品类电子券的特征作为所述模型训练样本的样本信息;
该样本信息清洗单元530被配置为,用于根据所述样本信息对所述模型训练样本进行清洗。
该模型训练单元540被配置为,用于基于设定分类模型对所述模型训练样本根据所述样本信息进行模型训练;
该模型评价与修正单元550被配置为,用于在基于训练后的所述设定分类模型预测给定用户对给定分品类电子券的使用概率之前,对训练后的所述设定分类模型进行评价,根据评价结果对所述设定分类模型进行修正。
该概率预测单元560被配置为,用于基于训练后的所述设定分类模型预测给定用户对给定分品类电子券的使用概率。
该营销方案确定单元570被配置为,用于在预测给定用户对给定分品类电子券的使用概率之后,根据所述使用概率确定营销方案。
根据本发明的一些实施例,所述用户的特征包括所述用户在所述分品类电子券所对应品类下的购买特征、浏览特征、搜索特征、加购特征、以及关注特征中的至少一种。
根据本发明的一些实施例,所述购买特征包括购买SKU数、购买订单量、购买单价、使用电子券购买订单量、使用电子券购买金额、以及使用电子券购买单价中的至少一种。
根据本发明的一些实施例,所述浏览特征包括浏览总量、预设时长的浏览量中的至少一种;所述加购特征包括加购SKU量、预设时长的加购量中的至少一种;和/或所述关注特征包括关注SKU数、预设时长的关注量中的至少一种。
根据本发明的一些实施例,所述分品类电子券的特征包括所述分品类电子券的明细特征、所述分品类电子券与商品的关联特征。
根据本发明的一些实施例,所述分品类电子券的明细特征包括所述分品类电子券的限额、面额、折扣中的至少一种。
根据本发明的一些实施例,所述分品类电子券与商品的关联特征包括:所述商品的价格与所述分品类电子券的限额的比值、所述商品的价格与所述分品类电子券的面额的比值、以及所述商品的价格与所述商品的当前折扣相乘后减去所述分品类电子券的面额三者中的至少一种。
根据本发明的一些实施例,所述设定分类模型包括两层分类模型,所述设定分类模型采用GBDT分类器进行迭代。
根据本发明的一些实施例,所述样本信息清洗单元530用于:根据所述样本信息从所述模型训练样本中剔除异常用户、将所述样本信息进行标准化处理、以及对所述样本信息中的异常值和缺失值进行处理至少一种操作;其中所述异常用户包括风险用户、企业用户、以及刷单用户中的至少一种。
根据本发明的一些实施例,所述模型评价与修正单元550用于:采用曲线下面积AUC对训练后的所述设定分类模型进行评价。根据本发明的一些实施例,所述设定分类模型包括stacking堆集分类模型。
本实施例提供的分品类电子券使用预测装置可执行本发明方法实施例所提供的分品类电子券使用预测方法,具备执行方法相应的功能模块和有益效果。
图6示出了根据本发明一实施例的电子设备,如图6所示,电子设备600可包括处理器610、存储器620、发射器630及接收器640。
存储器620可存储用于处理器610控制操作处理的指令。存储器620可包括易失性或非易失性存储器,如静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)等,本发明对此没有限制。
处理器610可调用存储器620中存储的指令控制相关操作。根据一实施例,存储器620存储用于处理器610控制以下操作的指令:根据用户领取分品类电子券的历史信息确定模型训练样本;获取所述模型训练样本中所述用户的特征和所述分品类电子券的特征作为所述模型训练样本的样本信息;基于设定分类模型对所述模型训练样本根据所述样本信息进行模型训练;基于训练后的所述设定分类模型预测给定用户对给定分品类电子券的使用概率。
易于理解,存储器620还可存储用于处理器610控制根据本发明实施例的其他操作的指令,这里不再赘述。
处理器610还可控制发射器630和接收器640进行信号收发等。
通过以上的详细描述,本领域的技术人员易于理解,根据本发明实施例的系统和方法具有以下优点中的一个或多个。
根据本发明的实施例,所述用户的特征包括所述用户在所述分品类电子券所对应品类下的购买特征、浏览特征、搜索特征、加购特征、以及关注特征中的至少一种。
根据本发明的一些实施例,在获取所述样本信息之后还包括:根据所述样本信息对所述模型训练样本进行清洗。
例如根据所述样本信息从所述模型训练样本中剔除异常用户、将所述样本信息进行标准化处理、以及对所述样本信息中的异常值和缺失值进行处理至少一种操作。其中所述异常用户包括风险用户、企业用户、以及刷单用户中的至少一种。
根据一些实施例,本发明还提供一种非临时性计算机可读存储介质,例如包括指令的存储器,上述指令可由装置的处理器执行以完成上述方法。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。当存储介质中的指令由终端的处理器执行时,使得终端能够执行下述方法:根据用户领取分品类电子券的历史信息确定模型训练样本;获取所述模型训练样本中所述用户的特征和所述分品类电子券的特征作为所述模型训练样本的样本信息;基于设定分类模型对所述模型训练样本根据所述样本信息进行模型训练;基于训练后的所述设定分类模型预测给定用户对给定分品类电子券的使用概率。
本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的,因此不能用于限制本发明的保护范围。
本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
以上具体地示出和描述了本发明的示例性实施例。应该理解,本发明不限于所公开的实施例,相反,本发明意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效布置。
Claims (17)
1.一种分品类电子券使用预测方法,其特征在于,包括:
根据用户领取分品类电子券的历史信息确定模型训练样本;
获取所述模型训练样本中所述用户的特征和所述分品类电子券的特征作为所述模型训练样本的样本信息;
基于设定分类模型对所述模型训练样本根据所述样本信息进行模型训练;
基于训练后的所述设定分类模型预测给定用户对给定分品类电子券的使用概率。
2.如权利要求1所述的方法,其特征在于,所述用户的特征包括所述用户在所述分品类电子券所对应品类下的购买特征、浏览特征、搜索特征、加购特征、以及关注特征中的至少一种。
3.如权利要求2所述的方法,其特征在于,所述购买特征包括购买SKU数、购买订单量、购买单价、使用电子券购买订单量、使用电子券购买金额、以及使用电子券购买单价中的至少一种。
4.如权利要求2所述的方法,其特征在于:
所述浏览特征包括浏览总量、预设时长的浏览量中的至少一种;
所述加购特征包括加购SKU量、预设时长的加购量中的至少一种;和/或
所述关注特征包括关注SKU数、预设时长的关注量中的至少一种。
5.如权利要求1所述的方法,其特征在于,所述分品类电子券的特征包括所述分品类电子券的明细特征、所述分品类电子券与商品的关联特征。
6.如权利要求5所述的方法,其特征在于,所述分品类电子券的明细特征包括所述分品类电子券的限额、面额、折扣中的至少一种。
7.如权利要求5所述的方法,其特征在于,所述分品类电子券与商品的关联特征包括:所述商品的价格与所述分品类电子券的限额的比值、所述商品的价格与所述分品类电子券的面额的比值、以及所述商品的价格与所述商品的当前折扣相乘后减去所述分品类电子券的面额三者中的至少一种。
8.如权利要求1所述的方法,其特征在于,所述设定分类模型包括两层分类模型,所述设定分类模型采用GBDT分类器进行迭代。
9.如权利要求1所述的方法,其特征在于,在获取所述样本信息之后还包括:根据所述样本信息对所述模型训练样本进行清洗。
10.如权利要求9所述的方法,其特征在于,根据所述样本信息对所述模型训练样本进行清洗包括:根据所述样本信息从所述模型训练样本中剔除异常用户、将所述样本信息进行标准化处理、以及对所述样本信息中的异常值和缺失值进行处理至少一种操作;
其中所述异常用户包括风险用户、企业用户、以及刷单用户中的至少一种。
11.如权利要求1所述的方法,其特征在于,在预测给定用户对给定分品类电子券的使用概率之后还包括:根据所述使用概率确定营销方案。
12.如权利要求1所述的方法,其特征在于,在基于训练后的所述设定分类模型预测给定用户对给定分品类电子券的使用概率之前还包括:
对训练后的所述设定分类模型进行评价,根据评价结果对所述设定分类模型进行修正。
13.如权利要求12所述的方法,其特征在于,对训练后的所述设定分类模型进行评价包括:采用曲线下面积AUC对训练后的所述设定分类模型进行评价。
14.如权利要求1所述的方法,其特征在于,所述设定分类模型包括stacking堆集分类模型。
15.一种分品类电子券使用预测装置,其特征在于,包括:
训练样本确定单元,用于根据用户领取分品类电子券的历史信息确定模型训练样本;
样本信息获取单元,用于获取所述模型训练样本中所述用户的特征和所述分品类电子券的特征作为所述模型训练样本的样本信息;
模型训练单元,用于基于设定分类模型对所述模型训练样本根据所述样本信息进行模型训练;
概率预测单元,用于基于训练后的所述设定分类模型预测给定用户对给定分品类电子券的使用概率。
16.一种电子设备,其特征在于,包括:处理器;存储器,存储用于所述处理器控制如权利要求1-14任一项所述操作的指令。
17.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-14任一项所述操作的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710552119.3A CN107330741A (zh) | 2017-07-07 | 2017-07-07 | 分品类电子券使用预测方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710552119.3A CN107330741A (zh) | 2017-07-07 | 2017-07-07 | 分品类电子券使用预测方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107330741A true CN107330741A (zh) | 2017-11-07 |
Family
ID=60196562
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710552119.3A Pending CN107330741A (zh) | 2017-07-07 | 2017-07-07 | 分品类电子券使用预测方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107330741A (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107844862A (zh) * | 2017-11-14 | 2018-03-27 | 泰康保险集团股份有限公司 | 订单失效预测方法、装置、介质及电子设备 |
CN107944976A (zh) * | 2017-12-15 | 2018-04-20 | 康成投资(中国)有限公司 | 在线订单审核方法 |
CN108647811A (zh) * | 2018-04-26 | 2018-10-12 | 中国联合网络通信集团有限公司 | 预测用户购买权益商品的方法、装置、设备及存储介质 |
CN108876436A (zh) * | 2018-05-25 | 2018-11-23 | 广东工业大学 | 一种基于集成模型的电商优惠券使用概率预测方法 |
CN109102324A (zh) * | 2018-07-12 | 2018-12-28 | 阿里巴巴集团控股有限公司 | 模型训练方法、基于模型的红包物料铺设预测方法及装置 |
CN109816134A (zh) * | 2017-11-22 | 2019-05-28 | 北京京东尚科信息技术有限公司 | 收货地址预测方法、装置以及存储介质 |
CN110443304A (zh) * | 2019-08-06 | 2019-11-12 | 民生科技有限责任公司 | 一种基于机器学习模型的企业风险评估方法 |
WO2019223379A1 (zh) * | 2018-05-22 | 2019-11-28 | 阿里巴巴集团控股有限公司 | 一种产品推荐方法和装置 |
CN110866625A (zh) * | 2018-08-28 | 2020-03-06 | 北京京东尚科信息技术有限公司 | 促销指标信息生成方法和装置 |
CN111105284A (zh) * | 2018-10-29 | 2020-05-05 | 北京嘀嘀无限科技发展有限公司 | 订单处理方法、装置、m层订单处理模型、电子设备及储存介质 |
CN111199239A (zh) * | 2018-11-16 | 2020-05-26 | 北京嘀嘀无限科技发展有限公司 | 通过打车订单识别醉酒乘客的人工智能系统和方法 |
CN111310913A (zh) * | 2020-01-19 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、资产分配方法、模型、装置及设备 |
CN111768139A (zh) * | 2019-06-27 | 2020-10-13 | 北京沃东天骏信息技术有限公司 | 备货处理方法、装置、设备及存储介质 |
CN112734470A (zh) * | 2021-01-05 | 2021-04-30 | 中国工商银行股份有限公司 | 基于客户偏好的电子劵推送方法及装置 |
CN112990954A (zh) * | 2019-12-17 | 2021-06-18 | 北京沃东天骏信息技术有限公司 | 优惠券分发的方法和装置 |
WO2021128866A1 (zh) * | 2019-12-28 | 2021-07-01 | 南方电网科学研究院有限责任公司 | 一种专利交易预测方法及系统、专利交易平台 |
CN113760521A (zh) * | 2020-09-22 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 一种虚拟资源的分配方法和装置 |
CN113807876A (zh) * | 2020-06-15 | 2021-12-17 | 阿里巴巴集团控股有限公司 | 训练样本生成方法及装置、模型训练方法及装置 |
CN113822722A (zh) * | 2021-09-28 | 2021-12-21 | 北京沃东天骏信息技术有限公司 | 虚拟资源发放控制方法、装置及服务器 |
CN114169906A (zh) * | 2020-09-11 | 2022-03-11 | 腾讯科技(深圳)有限公司 | 电子券推送方法、装置 |
-
2017
- 2017-07-07 CN CN201710552119.3A patent/CN107330741A/zh active Pending
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107844862A (zh) * | 2017-11-14 | 2018-03-27 | 泰康保险集团股份有限公司 | 订单失效预测方法、装置、介质及电子设备 |
CN109816134A (zh) * | 2017-11-22 | 2019-05-28 | 北京京东尚科信息技术有限公司 | 收货地址预测方法、装置以及存储介质 |
CN109816134B (zh) * | 2017-11-22 | 2021-07-20 | 北京京东尚科信息技术有限公司 | 收货地址预测方法、装置以及存储介质 |
CN107944976A (zh) * | 2017-12-15 | 2018-04-20 | 康成投资(中国)有限公司 | 在线订单审核方法 |
CN108647811A (zh) * | 2018-04-26 | 2018-10-12 | 中国联合网络通信集团有限公司 | 预测用户购买权益商品的方法、装置、设备及存储介质 |
WO2019223379A1 (zh) * | 2018-05-22 | 2019-11-28 | 阿里巴巴集团控股有限公司 | 一种产品推荐方法和装置 |
CN108876436A (zh) * | 2018-05-25 | 2018-11-23 | 广东工业大学 | 一种基于集成模型的电商优惠券使用概率预测方法 |
CN109102324B (zh) * | 2018-07-12 | 2021-08-20 | 创新先进技术有限公司 | 模型训练方法、基于模型的红包物料铺设预测方法及装置 |
CN109102324A (zh) * | 2018-07-12 | 2018-12-28 | 阿里巴巴集团控股有限公司 | 模型训练方法、基于模型的红包物料铺设预测方法及装置 |
CN110866625A (zh) * | 2018-08-28 | 2020-03-06 | 北京京东尚科信息技术有限公司 | 促销指标信息生成方法和装置 |
CN111105284B (zh) * | 2018-10-29 | 2024-04-19 | 北京嘀嘀无限科技发展有限公司 | 订单处理方法、装置、m层订单处理模型、电子设备及储存介质 |
CN111105284A (zh) * | 2018-10-29 | 2020-05-05 | 北京嘀嘀无限科技发展有限公司 | 订单处理方法、装置、m层订单处理模型、电子设备及储存介质 |
CN111199239A (zh) * | 2018-11-16 | 2020-05-26 | 北京嘀嘀无限科技发展有限公司 | 通过打车订单识别醉酒乘客的人工智能系统和方法 |
CN111199239B (zh) * | 2018-11-16 | 2023-09-01 | 北京嘀嘀无限科技发展有限公司 | 通过打车订单识别醉酒乘客的人工智能系统和方法 |
CN111768139A (zh) * | 2019-06-27 | 2020-10-13 | 北京沃东天骏信息技术有限公司 | 备货处理方法、装置、设备及存储介质 |
CN111768139B (zh) * | 2019-06-27 | 2023-04-07 | 北京沃东天骏信息技术有限公司 | 备货处理方法、装置、设备及存储介质 |
CN110443304A (zh) * | 2019-08-06 | 2019-11-12 | 民生科技有限责任公司 | 一种基于机器学习模型的企业风险评估方法 |
CN112990954A (zh) * | 2019-12-17 | 2021-06-18 | 北京沃东天骏信息技术有限公司 | 优惠券分发的方法和装置 |
WO2021128866A1 (zh) * | 2019-12-28 | 2021-07-01 | 南方电网科学研究院有限责任公司 | 一种专利交易预测方法及系统、专利交易平台 |
CN111310913A (zh) * | 2020-01-19 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、资产分配方法、模型、装置及设备 |
CN113807876A (zh) * | 2020-06-15 | 2021-12-17 | 阿里巴巴集团控股有限公司 | 训练样本生成方法及装置、模型训练方法及装置 |
CN114169906A (zh) * | 2020-09-11 | 2022-03-11 | 腾讯科技(深圳)有限公司 | 电子券推送方法、装置 |
CN114169906B (zh) * | 2020-09-11 | 2024-03-22 | 腾讯科技(深圳)有限公司 | 电子券推送方法、装置 |
CN113760521A (zh) * | 2020-09-22 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 一种虚拟资源的分配方法和装置 |
CN112734470A (zh) * | 2021-01-05 | 2021-04-30 | 中国工商银行股份有限公司 | 基于客户偏好的电子劵推送方法及装置 |
CN113822722A (zh) * | 2021-09-28 | 2021-12-21 | 北京沃东天骏信息技术有限公司 | 虚拟资源发放控制方法、装置及服务器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107330741A (zh) | 分品类电子券使用预测方法、装置及电子设备 | |
US11734747B2 (en) | Contextual set selection | |
CN108256691A (zh) | 还款概率预测模型构建方法及装置 | |
CN111695719A (zh) | 一种用户价值预测方法及系统 | |
CN107590688A (zh) | 目标客户的识别方法及终端设备 | |
CN108182634A (zh) | 一种借贷预测模型的训练方法、借贷预测方法和装置 | |
CN111582538B (zh) | 一种基于图神经网络的社群价值预测方法及系统 | |
CN111160968A (zh) | Sku级别商品销量预测方法及装置 | |
CN112163963B (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
CN110111090A (zh) | 一种电子红包的发放方法及装置 | |
US20220172258A1 (en) | Artificial intelligence-based product design | |
CN107844862A (zh) | 订单失效预测方法、装置、介质及电子设备 | |
CN110852785A (zh) | 用户分级方法、装置及计算机可读存储介质 | |
CN112613997A (zh) | 货币基金的组合投资预测方法和预测装置 | |
CN115659055A (zh) | 基于事件序列的商品推荐方法、系统、设备及存储介质 | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
CN111768243A (zh) | 销量预测方法、预测模型构建方法、装置、设备及介质 | |
CN113850654A (zh) | 物品推荐模型的训练方法、物品筛选方法、装置和设备 | |
CN109063120A (zh) | 一种基于聚类的协同过滤推荐方法和装置 | |
CN116228280A (zh) | 基于大数据的用户需求预测方法 | |
CN110782338A (zh) | 借贷业务风险预测方法、装置、计算机设备和存储介质 | |
CN110348947A (zh) | 对象推荐方法及装置 | |
CN113935529A (zh) | 客户生命周期价值的确定方法、装置、设备及介质 | |
Sahoo et al. | Faulty diagnostics model in e-commerce using AI | |
US20210027317A1 (en) | Inventory and structure finder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171107 |
|
RJ01 | Rejection of invention patent application after publication |