CN109284864A - 行为序列获取方法及装置、用户转化率预测方法及装置 - Google Patents
行为序列获取方法及装置、用户转化率预测方法及装置 Download PDFInfo
- Publication number
- CN109284864A CN109284864A CN201811027413.3A CN201811027413A CN109284864A CN 109284864 A CN109284864 A CN 109284864A CN 201811027413 A CN201811027413 A CN 201811027413A CN 109284864 A CN109284864 A CN 109284864A
- Authority
- CN
- China
- Prior art keywords
- vector
- event
- behavior
- user
- history
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 78
- 238000000034 method Methods 0.000 title claims abstract description 68
- 239000013598 vector Substances 0.000 claims description 259
- 230000006399 behavior Effects 0.000 claims description 161
- 238000003860 storage Methods 0.000 claims description 34
- 238000004590 computer program Methods 0.000 claims description 25
- 230000004044 response Effects 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 abstract 1
- 230000006872 improvement Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005206 flow analysis Methods 0.000 description 1
- 238000003475 lamination Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Analysis (AREA)
- Accounting & Taxation (AREA)
- Computational Mathematics (AREA)
- Marketing (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Algebra (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
Abstract
本发明公开了一种行为序列获取方法及装置、用户转化率预测方法及装置,其中,行为序列获取方法包括步骤:响应于对任一用户的行为序列获取的指令,获取所述用户的行为序列,并从所述行为序列中筛选出预设类别的所有行为事件;其中,所述预设类别的所有行为事件的数量为b,b≥1;以预设类别中的每一行为事件作为节点,根据所述行为事件出现的时刻向前或向后截取a‑1个的行为事件,从而生成b个长度为a的第一行为序列;a≥2。能有效获取用户的第一行为序列,提高预测模型的准确度。
Description
技术领域
本发明涉及机器学习领域,尤其涉及一种行为序列获取方法及装置、用户转化率预测方法及装置。
背景技术
用户的APP行为记录了用户基本信息,也记录了在APP上的关键行为动作,这些行为动作表征的是用户潜意识的行为模式或者个人偏好。对APP进行数据分析挖掘的评价指标有常规数据指标监控(如新用户量)、渠道分析或流量分析、APP页面的广告点击率(CTR:Click-Through-Rate)、用户的核心转化率(一般在有付费相关的功能中也称为付费率、购买率,如游戏或电商或知识付费,有的APP也将用户从非注册用户到注册等用户作为转化率)、用户使用时长、用户流失率等。指标中的CTR是目前研究较为火热、应用较多的一个领域,而对于直接产生费用流量的APP而言,付费率或购买率是运营团队关注的核心,如何准确预测转化率对于运营思路及APP功能和UI更新都有重要意义。
对于用户转化率预测及提升的一种实现方法是,将用户转化率预测看成一个用户分群或分层问题,将所有用户根据Recency、Frequency、Monetary等常用用户价值模型进行分层,将用户划分到不同的群体,然后以“高价值的群体转化率较高”作为预测结果。对于用户转化率预测及提升的另一种实现方法是,将用户转化率预测看成一个推荐系统,根据用户的历史购买行为,计算与购买过此种商品的用户相似的其他用户,并以相似度对其他用户进行排序,选取top作为正样本,预测其会购买。在第一种方案中,用户分层或分群是以用户的基本属性或充值行为作为依据的,如在付费或充值的场景下,Recency、Frequency、Monetary的三个指标分别指的是用户最近一次充值距今时长、用户的付费频率、用户的付费金额;在第二种方案中作为推荐系统预测用户转化率一般是针对用户购买过的物品种类,或者购买过相同物品的相似用户类型进行的。以上两种方案均没有充分利用用户在APP内的行为序列,这些行为序列实际表征了用户的潜在行为模式和使用习惯;也没有同时考虑用户在APP中的注册时长及用户的活跃度,这两个特征可以用于表征用户对APP的熟悉程度。这两种用户转化率预测及提升方法不能有效提高转化率模型的预测精度。
发明内容
本发明实施例提供一种行为序列获取方法及装置、用户转化率预测方法及装置以及计算机可读存储介质,能有效解决现有行为序列获取方法存在单一化的问题,能有效提高转化率模型的预测精度。
本发明一实施例提供一种行为序列获取方法,包括步骤:
响应于对任一用户的行为序列获取的指令,获取所述用户的行为序列,并从所述行为序列中筛选出预设类别的所有行为事件;其中,所述预设类别的所有行为事件的数量为b,b≥1;
以预设类别中的每一行为事件作为节点,根据所述行为事件出现的时刻向前或向后截取a-1个的行为事件,从而生成b个长度为a的第一行为序列;a≥2。
与现有技术相比,本发明实施例提供了一种行为序列获取方法,其以预设类别中的每一行为事件作为节点,根据所述行为事件出现的时刻向前或向后截取a-1个的行为事件,从而生成b个长度为a的第一行为序列;a≥2;能有效获取对转化率预测影响较大的行为序列,能提高预测模型的准确度。
作为上述方案的改进,以预设类别中的每一行为事件作为节点,根据所述行为事件出现的时刻向前或向后截取a-1个的行为事件,从而生成b个长度为a的第一行为序列;a≥2,具体为:
以每一成功购买事件为节点,成功购买事件发生的次数为m,根据所述每一成功购买事件出现的时刻向前截取M-1个的行为事件,从而生成m个长度为M的历史偏好事件向量;m≥1;M≥2;
以每一成功登录事件为节点,成功登录事件发生的次数为n,根据所述每一成功登录事件出现的时刻向后截取N-1个的行为事件,从而生成n个长度为N的历史活跃事件向量;n≥1;N≥2。
作为上述方案的改进,所述行为序列获取方法还包括步骤:
根据历史偏好事件的计算策略从所述历史偏好事件向量计算出历史偏好事件的权重向量和物品类别向量;
根据历史活跃事件的计算策略从所述历史活跃事件向量计算出历史活跃事件的非共现向量;其中,所述非共现向量为n个所述历史活跃事件向量中相同位置的事件类别数构成的向量;n≥1。
作为上述方案的改进,根据历史偏好事件的计算策略从所述历史偏好事件向量计算出历史偏好事件的权重向量和物品类别向量具体为:
根据所述历史偏好事件向量中的事件权重计算出历史偏好事件的权重向量;其中,购买事件的权重通过以下公式计算:
W_buy=2*IE*Nor(Cost)+IE
其中,W_buy为购买事件的权重;IE为与物品相关的行为类别数;Nor(Cost)为购买事件的商品金额的归一化值;
根据所述历史偏好事件向量中每一购买事件对应的商品类别,生成物品类别向量;其中,所述物品类别向量长度与每一用户成功购买商品数等长。
本发明另一实施例对应提供了一种用户转化率预测方法,包括步骤:
根据以上实施例所述的行为序列获取方法获取任一用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量;
响应于对所述用户的转化率的预测指令,将上述获取到的用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量作为一预设的预测模型的输入,根据所述预测模型的输出结果对所述用户的转化率进行预测。
作为上述方案的改进,所述方法还包括步骤:响应于对预测模型的训练指令,通过上述获取到的用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量对所述预测模型进行训练。
作为上述方案的改进,所述用户为一应用程序的长期用户,所述长期用户为注册时长大于人均注册时长且对所述应用程序的功能事件的点击发生率在c%以内的用户;其中,30≤c≤100。
作为上述方案的改进,所述将上述获取到的用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量作为一预设的预测模型的输入,根据所述预测模型的输出结果对所述用户的转化率进行预测具体为:
将所述物品类别向量和所述权重向量进行左对齐,根据最短向量的长度截取其他向量与最短向量等长的部分,生成左物品类别向量和左权重向量,根据所述历史偏好事件向量中每一位置的行为事件在所述历史偏好事件向量中出现的次数生成新的历史偏好事件向量,将所述新的历史偏好事件向量与所述左权重向量对应位置权重相乘生成左偏好向量;
将所述物品类别向量和所述权重向量进行右对齐,根据最短向量的长度截取其他向量与最短向量等长的部分,生成右物品类别向量和右权重向量,根据所述历史偏好事件向量中每一位置的行为事件在所述历史偏好事件向量中出现的次数生成新的历史偏好事件向量,将所述新的历史偏好事件向量与所述右权重向量对应位置权重相乘生成右偏好向量;
将所述非共现向量进行左对齐,根据最短向量的长度截取其他向量与最短向量等长的部分,生成左活跃向量;将所述非共现向量进行右对齐,根据最短向量的长度截取其他向量与最短向量等长的部分,生成右活跃向量;
将所述左物品类别向量、所述右物品类别向量、所述左偏好向量、所述右偏好向量、所述左活跃向量和所述右活跃向量输入所述预测模型中进行预测。
本发明另一实施例提供了一种行为序列获取装置,包括:
获取指令响应模块,用于响应于对任一用户的行为序列获取的指令,获取所述用户的行为序列,并从所述行为序列中筛选出预设类别的所有行为事件;其中,所述预设类别的所有行为事件的数量为b,b≥1;
行为序列处理模块,用于以预设类别中的每一行为事件作为节点,根据所述行为事件出现的时刻向前或向后截取a-1个的行为事件,从而生成b个长度为a的第一行为序列;a≥2。
作为上述方案的改进,所述行为序列获取装置还包括:
行为序列向量计算模块,用于根据历史偏好事件的计算策略从所述历史偏好事件向量计算出历史偏好事件的权重向量和物品类别向量;根据历史活跃事件的计算策略从所述历史活跃事件向量计算出历史活跃事件的非共现向量;其中,所述非共现向量为n个所述历史活跃事件向量中相同位置的事件类别数构成的向量;n≥1。
本发明另一实施例提供了一种用户转化率预测装置,包括:
行为序列获取模块,用于根据以上实施例所述的行为序列获取方法获取任一用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量;
转化率预测模块,用于响应于对所述用户的转化率的预测指令,将上述获取到的用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量作为一预设的预测模型的输入,根据所述预测模型的输出结果对所述用户的转化率进行预测。
本发明另一实施例提供了一种行为序列获取装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现以上任意一项所述的行为序列获取方法。
本发明另一实施例提供了一种用户转化率预测装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现以上任意一项所述的用户转化率预测方法。
本发明另一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行以上任意一项所述的行为序列获取方法。
本发明另一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行以上任意一项所述的用户转化率预测方法。
附图说明
图1是本发明一实施例提供的一种行为序列获取方法的流程示意图。
图2是本发明一实施例提供的一种用户转化率预测方法的流程示意图。
图3是本发明一实施例提供的短期用户的转化率预测的过程示意图。
图4是本发明一实施例提供的一种行为序列获取装置的结构示意图。
图5是本发明一实施例提供的一种用户转化率预测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明一实施例提供的一种行为序列获取方法的流程示意图,包括步骤:
S1、响应于对任一用户的行为序列获取的指令,获取所述用户的行为序列,并从所述行为序列中筛选出预设类别的所有行为事件;其中,所述预设类别的所有行为事件的数量为b,b≥1;
用户行为序列,也可以叫做“基于时间序列的用户行为”,是某一时间段内,按照时间先后顺序记录的人从事某种活动的每一步行为。例如,在网站的一段时间内,一个用户从进入网站到离开网站过程中的每一步行为的记录,被我们记做一条用户行为序列。
S2、以预设类别中的每一行为事件作为节点,根据所述行为事件出现的时刻向前或向后截取a-1个的行为事件,从而生成b个长度为a的第一行为序列;a≥2。
在本实施例中,以预设类别中的每一行为事件作为节点,根据所述行为事件出现的时刻向前或向后截取a-1个的行为事件,从而生成b个长度为a的第一行为序列;a≥2,能有效获取对转化率预测影响较大的行为序列,能提高预测模型的准确度。
优选地,本实施例的行为序列获取方法适用于长期用户,所述长期用户为注册时长大于人均注册时长且对所述应用程序的功能事件的点击发生率在c%以内的用户;其中,30≤c≤100。例如,定义长期用户为进入到APP平台、注册至今的时长(按天)大于APP的人均注册时长,并且对APP上的功能事件(根据埋点数可以计算)有过的点击事件在c%以内的用户;其中,30≤c≤100,这样的用户与新注册用户和短期用户不一样,这种类型的用户对APP的功能以及运营模式很熟悉,在数据上会体现这种类型的用户的“转化”过程,“转化”指的是“注册用户->初级用户->中级用户->高级用户->核心用户”的转化,也是用户使用APP以来历史的付费偏好的转化,比如刚注册APP,用户A只是观望用户,某个内容或事件引起他的兴趣后,可能会付费购买相关物品,要旅游时可能会选择旅游的物品。这种类型的用户具有一定数量的行为记录,可根据一系列的行为记录对长期用户的转化率进行预测。
具体地,步骤S2中以预设类别中的每一行为事件作为节点,根据所述行为事件出现的时刻向前或向后截取a-1个的行为事件,从而生成b个长度为a的第一行为序列;a≥2,具体为:
以每一成功购买事件为节点,成功购买事件发生的次数为m,根据所述每一成功购买事件出现的时刻向前截取M-1个的行为事件,从而生成m个长度为M的历史偏好事件向量;m≥1;M≥2;
以每一成功登录事件为节点,成功登录事件发生的次数为n,根据所述每一成功登录事件出现的时刻向后截取N-1个的行为事件,从而生成n个长度为N的历史活跃事件向量;n≥1;N≥2。
在另一优选实施例中,本发明一实施例提供的一种行为序列获取方法,还包括步骤:
根据历史偏好事件的计算策略从所述历史偏好事件向量计算出历史偏好事件的权重向量和物品类别向量;
根据历史活跃事件的计算策略从所述历史活跃事件向量计算出历史活跃事件的非共现向量;其中,所述非共现向量为n个所述历史活跃事件向量中相同位置的事件类别数构成的向量;n≥1。
具体地,根据历史偏好事件的计算策略从所述历史偏好事件向量计算出历史偏好事件的权重向量和物品类别向量具体为:
根据所述历史偏好事件向量中的事件权重计算出历史偏好事件的权重向量;其中,购买事件的权重通过以下公式计算:
W_buy=2*IE*Nor(Cost)+IE
其中,W_buy为购买事件的权重;IE为与物品相关的行为类别数;Nor(Cost)为购买事件的商品金额的归一化值;
根据所述历史偏好事件向量中每一购买事件对应的商品类别,生成物品类别向量;其中,所述物品类别向量长度与每一用户成功购买商品数等长。
优选地,如N=5,n=3的一历史活跃事件向量为{(a,b,c,d,e),(a,c,c,c,c),(a,b,c,e,d)},计算出所述历史活跃事件的非共现向量为(0,2,1,3,3)。
优选地,如与物品相关的事件类别数IE=3,分别预设点击浏览、收藏、加购物车的事件权重为1、2、3,其他与物品无关的事件权重预设为0。
参见图2,是本发明一实施例提供的一种用户转化率预测方法的流程示意图,包括步骤:
S21、根据以上实施例所述的行为序列获取方法获取任一用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量;
S22、响应于对所述用户的转化率的预测指令,将上述获取到的用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量作为一预设的预测模型的输入,根据所述预测模型的输出结果对所述用户的转化率进行预测。
通过上述获取到的用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量作为特征输入所述预测模型中,能有效表征用户的历史偏好情况和历史活跃情况,能提高预测模型的准确度。
优选地,本实施例的行为序列获取方法适用于长期用户,所述长期用户为注册时长大于人均注册时长且对所述应用程序的功能事件的点击发生率在c%以内的用户;其中,30≤c≤100。例如,定义长期用户为进入到APP平台、注册至今的时长(按天)大于APP的人均注册时长,并且对APP上的功能事件(根据埋点数可以计算)有过的点击事件在c%以内的用户;其中,30≤c≤100。这样的用户与新注册用户和短期用户不一样,这种类型的用户对APP的功能以及运营模式很熟悉,在数据上会体现这种类型的用户的“转化”过程,“转化”指的是“注册用户->初级用户->中级用户->高级用户->核心用户”的转化,也是用户使用APP以来历史的付费偏好的转化,比如刚注册APP,用户A只是观望用户,某个内容或事件引起他的兴趣后,可能会付费购买相关物品,要旅游时可能会选择旅游的物品。这种类型的用户具有一定数量的行为记录,可根据一系列的行为记录对长期用户的转化率进行预测。
在上述实施例的基础上,所述用户转化率预测方法还包括步骤:响应于对预测模型的训练指令,通过上述获取到的用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量对所述预测模型进行训练。
优选地,所述上述获取到的用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量作为一预设的预测模型的输入,根据所述预测模型的输出结果对所述用户的转化率进行预测具体为:
将所述物品类别向量和所述权重向量进行左对齐,根据最短向量的长度截取其他向量与最短向量等长的部分,生成左物品类别向量和左权重向量,根据所述历史偏好事件向量中每一位置的行为事件在所述历史偏好事件向量中出现的次数生成新的历史偏好事件向量,将所述新的历史偏好事件向量与所述左权重向量对应位置权重相乘生成左偏好向量;
将所述物品类别向量和所述权重向量进行右对齐,根据最短向量的长度截取其他向量与最短向量等长的部分,生成右物品类别向量和右权重向量,根据所述历史偏好事件向量中每一位置的行为事件在所述历史偏好事件向量中出现的次数生成新的历史偏好事件向量,将所述新的历史偏好事件向量与所述右权重向量对应位置权重相乘生成右偏好向量;
将所述非共现向量进行左对齐,根据最短向量的长度截取其他向量与最短向量等长的部分,生成左活跃向量;将所述非共现向量进行右对齐,根据最短向量的长度截取其他向量与最短向量等长的部分,生成右活跃向量;
将所述左物品类别向量、所述右物品类别向量、所述左偏好向量、所述右偏好向量、所述左活跃向量和所述右活跃向量输入所述预测模型中进行预测。
优选地,如一历史偏好事件向量为(a,b,c,a,b,c,c,d,e),其中a事件出现次数为2,b事件出现次数为2,c事件出现次数为3,d事件出现次数为1,e事件出现次数为1,根据所述历史偏好事件向量中每一位置的行为事件在所述历史偏好事件向量中出现的次数生成新的历史偏好事件向量为(2,2,3,2,2,3,3,1,1),将所述新的历史偏好事件向量(2,2,3,2,2,3,3,1,1)与左权重向量对应位置权重相乘,则所述左权重向量第一个位置的权重值*2,第二个位置的权重值*2,第三个位置的权重值*3,第四个位置的权重值*2,第五个位置的权重值*2,第六个位置的权重值*3,第七个位置的权重值*3,第八个位置的权重值*1,第九个位置的权重值*1,从而生成左偏好向量。
需要说明的是,对于本发明的左对齐算法,可捕获大部分用户的初、中期的历史信息;而本发明的右对齐算法,可捕获大部分用户中、后期的历史信息。在本方案中,通过对构建的历史偏好向量和历史活跃向量加入左右对齐算法策略,以捕获用户在偏好以及活跃上的初、中期的行为信息和中、后期的行为信息,从历史行为上全面的表征用户,能有效提高转化率预测的准确度。
将上述过程应用于长期用户的转化率预测过程如图3所示,可结合行为序列获取、历史偏好和历史活跃的模型切割以及左右对齐算法对转化率进行预测,有效提高长期用户的转化率预测准确度。
参见图4,为本发明实施例提供的一种行为序列获取装置的结构示意图,包括:
获取指令响应模块101,用于响应于对任一用户的行为序列获取的指令,获取所述用户的行为序列,并从所述行为序列中筛选出预设类别的所有行为事件;其中,所述预设类别的所有行为事件的数量为b,b≥1;
行为序列处理模块102,用于以预设类别中的每一行为事件作为节点,根据所述行为事件出现的时刻向前或向后截取a-1个的行为事件,从而生成b个长度为a的第一行为序列;a≥2。
在另一优选实施例中,本发明一实施例提供的一种行为序列获取装置的结构示意图,还包括:
行为序列向量计算模块,用于根据历史偏好事件的计算策略从所述历史偏好事件向量计算出历史偏好事件的权重向量和物品类别向量;根据历史活跃事件的计算策略从所述历史活跃事件向量计算出历史活跃事件的非共现向量;其中,所述非共现向量为n个所述历史活跃事件向量中相同位置的事件类别数构成的向量;n≥1。
本实施例的行为序列获取装置的工作原理和过程可参考上述对行为序列获取方法的描述,在此不再赘述。
参见图5,为本发明实施例提供的一种用户转化率预测装置的结构示意图,包括:
行为序列获取模块201,用于根据以上实施例所述的行为序列获取方法获取任一用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量;
转化率预测模块202,用于响应于对所述用户的转化率的预测指令,将上述获取到的用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量作为一预设的预测模型的输入,根据所述预测模型的输出结果对所述用户的转化率进行预测。
本实施例的用户转化率预测装置的工作原理和过程可参考上述对用户转化率预测方法的描述,在此不再赘述。
本发明另一实施例提供了一种行为序列获取装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现以上任意一项所述的行为序列获取方法。
本发明另一实施例提供了一种用户转化率预测装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现以上任意一项所述的用户转化率预测方法。
本发明另一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行以上任意一项所述的行为序列获取方法。
本发明另一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行以上任意一项所述的用户转化率预测方法。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述行为序列获取装置/用户转化率预测装置的控制中心,利用各种接口和线路连接整个行为序列获取装置/用户转化率预测装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述行为序列获取装置/用户转化率预测装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述行为序列获取装置/用户转化率预测装置集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (15)
1.一种行为序列获取方法,其特征在于,包括步骤:
响应于对任一用户的行为序列获取的指令,获取所述用户的行为序列,并从所述行为序列中筛选出预设类别的所有行为事件;其中,所述预设类别的所有行为事件的数量为b,b≥1;
以预设类别中的每一行为事件作为节点,根据所述行为事件出现的时刻向前或向后截取a-1个的行为事件,从而生成b个长度为a的第一行为序列;a≥2。
2.如权利要求1所述的行为序列获取方法,其特征在于,所述以预设类别中的每一行为事件作为节点,根据所述行为事件出现的时刻向前或向后截取a-1个的行为事件,从而生成b个长度为a的第一行为序列;a≥2,具体为:
以每一成功购买事件为节点,成功购买事件发生的次数为m,根据所述每一成功购买事件出现的时刻向前截取M-1个的行为事件,从而生成m个长度为M的历史偏好事件向量;m≥1;M≥2;
以每一成功登录事件为节点,成功登录事件发生的次数为n,根据所述每一成功登录事件出现的时刻向后截取N-1个的行为事件,从而生成n个长度为N的历史活跃事件向量;n≥1;N≥2。
3.如权利要求2所述的行为序列获取方法,其特征在于,还包括步骤:
根据历史偏好事件的计算策略从所述历史偏好事件向量计算出历史偏好事件的权重向量和物品类别向量;
根据历史活跃事件的计算策略从所述历史活跃事件向量计算出历史活跃事件的非共现向量;其中,所述非共现向量为n个所述历史活跃事件向量中相同位置的事件类别数构成的向量;n≥1。
4.如权利要求3所述的行为序列获取方法,其特征在于,所述根据历史偏好事件的计算策略从所述历史偏好事件向量计算出历史偏好事件的权重向量和物品类别向量具体为:
根据所述历史偏好事件向量中的事件权重计算出历史偏好事件的权重向量;其中,购买事件的权重通过以下公式计算:
W_buy=2*IE*Nor(Cost)+IE
其中,W_buy为购买事件的权重;IE为与物品相关的行为类别数;Nor(Cost)为购买事件的商品金额的归一化值;
根据所述历史偏好事件向量中每一购买事件对应的商品类别,生成物品类别向量;其中,所述物品类别向量长度与每一用户成功购买商品数等长。
5.一种用户转化率预测方法,其特征在于,包括步骤:
根据权利要求1-4所述的行为序列获取方法获取任一用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量;
响应于对所述用户的转化率的预测指令,将上述获取到的用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量作为一预设的预测模型的输入,根据所述预测模型的输出结果对所述用户的转化率进行预测。
6.如权利要求5所述的用户转化率预测方法,其特征在于,所述方法还包括步骤:响应于对预测模型的训练指令,通过上述获取到的用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量对所述预测模型进行训练。
7.如权利要求5所述的用户转化率预测方法,其特征在于,所述用户为一应用程序的长期用户,所述长期用户为注册时长大于人均注册时长且对所述应用程序的功能事件的点击发生率在c%以内的用户;其中,30≤c≤100。
8.如权利要求5所述的用户转化率预测方法,其特征在于,所述将上述获取到的用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量作为一预设的预测模型的输入,根据所述预测模型的输出结果对所述用户的转化率进行预测具体为:
将所述物品类别向量和所述权重向量进行左对齐,根据最短向量的长度截取其他向量与最短向量等长的部分,生成左物品类别向量和左权重向量,根据所述历史偏好事件向量中每一位置的行为事件在所述历史偏好事件向量中出现的次数生成新的历史偏好事件向量,将所述新的历史偏好事件向量与所述左权重向量对应位置权重相乘生成左偏好向量;
将所述物品类别向量和所述权重向量进行右对齐,根据最短向量的长度截取其他向量与最短向量等长的部分,生成右物品类别向量和右权重向量,根据所述历史偏好事件向量中每一位置的行为事件在所述历史偏好事件向量中出现的次数生成新的历史偏好事件向量,将所述新的历史偏好事件向量与所述右权重向量对应位置权重相乘生成右偏好向量;
将所述非共现向量进行左对齐,根据最短向量的长度截取其他向量与最短向量等长的部分,生成左活跃向量;将所述非共现向量进行右对齐,根据最短向量的长度截取其他向量与最短向量等长的部分,生成右活跃向量;
将所述左物品类别向量、所述右物品类别向量、所述左偏好向量、所述右偏好向量、所述左活跃向量和所述右活跃向量输入所述预测模型中进行预测。
9.一种行为序列获取装置,其特征在于,包括:
获取指令响应模块,用于响应于对任一用户的行为序列获取的指令,获取所述用户的行为序列,并从所述行为序列中筛选出预设类别的所有行为事件;其中,所述预设类别的所有行为事件的数量为b,b≥1;
行为序列处理模块,用于以预设类别中的每一行为事件作为节点,根据所述行为事件出现的时刻向前或向后截取a-1个的行为事件,从而生成b个长度为a的第一行为序列;a≥2。
10.如权利要求9所述的行为序列获取装置,其特征在于,还包括:
行为序列向量计算模块,用于根据历史偏好事件的计算策略从所述历史偏好事件向量计算出历史偏好事件的权重向量和物品类别向量;根据历史活跃事件的计算策略从所述历史活跃事件向量计算出历史活跃事件的非共现向量;其中,所述非共现向量为n个所述历史活跃事件向量中相同位置的事件类别数构成的向量;n≥1。
11.一种用户转化率预测装置,其特征在于,包括:
行为序列获取模块,用于根据权利要求1-4所述的行为序列获取方法获取任一用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量;
转化率预测模块,用于响应于对所述用户的转化率的预测指令,将上述获取到的用户的历史偏好事件向量、历史偏好事件的权重向量、物品类别向量和非共现向量作为一预设的预测模型的输入,根据所述预测模型的输出结果对所述用户的转化率进行预测。
12.一种行为序列获取装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-4中任意一项所述的行为序列获取方法。
13.一种用户转化率预测装置,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求5-8中任意一项所述的用户转化率预测方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1-4中任意一项所述的行为序列获取方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求5-8中任意一项所述的用户转化率预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811027413.3A CN109284864B (zh) | 2018-09-04 | 2018-09-04 | 行为序列获取方法及装置、用户转化率预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811027413.3A CN109284864B (zh) | 2018-09-04 | 2018-09-04 | 行为序列获取方法及装置、用户转化率预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109284864A true CN109284864A (zh) | 2019-01-29 |
CN109284864B CN109284864B (zh) | 2021-08-24 |
Family
ID=65183916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811027413.3A Active CN109284864B (zh) | 2018-09-04 | 2018-09-04 | 行为序列获取方法及装置、用户转化率预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109284864B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109597844A (zh) * | 2019-01-31 | 2019-04-09 | 中科人工智能创新技术研究院(青岛)有限公司 | 基于深度神经网络与图网络的核心用户挖掘方法及系统 |
CN111258469A (zh) * | 2020-01-09 | 2020-06-09 | 支付宝(杭州)信息技术有限公司 | 处理交互序列数据的方法及装置 |
CN111475720A (zh) * | 2020-03-31 | 2020-07-31 | 北京三快在线科技有限公司 | 推荐方法、装置、服务器及存储介质 |
CN112257933A (zh) * | 2020-10-26 | 2021-01-22 | 西安工程大学 | 一种用于网络环境的用户行为预测系统及其方法 |
WO2021139524A1 (zh) * | 2020-01-09 | 2021-07-15 | 支付宝(杭州)信息技术有限公司 | 利用lstm神经网络模型处理交互数据的方法及装置 |
CN113822689A (zh) * | 2020-07-01 | 2021-12-21 | 北京沃东天骏信息技术有限公司 | 广告转化率预估方法及装置、存储介质、电子设备 |
CN114792173A (zh) * | 2022-06-20 | 2022-07-26 | 支付宝(杭州)信息技术有限公司 | 预测模型训练方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180047036A1 (en) * | 2016-08-11 | 2018-02-15 | Ricoh Company, Ltd. | User behavior analysis method and device as well as non-transitory computer-readable medium |
CN108133390A (zh) * | 2017-12-22 | 2018-06-08 | 北京三快在线科技有限公司 | 用于预测用户行为的方法和装置以及计算设备 |
CN108305094A (zh) * | 2017-12-18 | 2018-07-20 | 北京三快在线科技有限公司 | 一种用户行为预测方法及装置,电子设备 |
-
2018
- 2018-09-04 CN CN201811027413.3A patent/CN109284864B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180047036A1 (en) * | 2016-08-11 | 2018-02-15 | Ricoh Company, Ltd. | User behavior analysis method and device as well as non-transitory computer-readable medium |
CN108305094A (zh) * | 2017-12-18 | 2018-07-20 | 北京三快在线科技有限公司 | 一种用户行为预测方法及装置,电子设备 |
CN108133390A (zh) * | 2017-12-22 | 2018-06-08 | 北京三快在线科技有限公司 | 用于预测用户行为的方法和装置以及计算设备 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109597844A (zh) * | 2019-01-31 | 2019-04-09 | 中科人工智能创新技术研究院(青岛)有限公司 | 基于深度神经网络与图网络的核心用户挖掘方法及系统 |
CN109597844B (zh) * | 2019-01-31 | 2020-12-22 | 中科人工智能创新技术研究院(青岛)有限公司 | 基于深度神经网络与图网络的核心用户挖掘方法及系统 |
CN111258469A (zh) * | 2020-01-09 | 2020-06-09 | 支付宝(杭州)信息技术有限公司 | 处理交互序列数据的方法及装置 |
CN111258469B (zh) * | 2020-01-09 | 2021-05-14 | 支付宝(杭州)信息技术有限公司 | 处理交互序列数据的方法及装置 |
WO2021139524A1 (zh) * | 2020-01-09 | 2021-07-15 | 支付宝(杭州)信息技术有限公司 | 利用lstm神经网络模型处理交互数据的方法及装置 |
CN111475720A (zh) * | 2020-03-31 | 2020-07-31 | 北京三快在线科技有限公司 | 推荐方法、装置、服务器及存储介质 |
CN113822689A (zh) * | 2020-07-01 | 2021-12-21 | 北京沃东天骏信息技术有限公司 | 广告转化率预估方法及装置、存储介质、电子设备 |
CN112257933A (zh) * | 2020-10-26 | 2021-01-22 | 西安工程大学 | 一种用于网络环境的用户行为预测系统及其方法 |
CN112257933B (zh) * | 2020-10-26 | 2023-07-07 | 西安工程大学 | 一种用于网络环境的用户行为预测系统及其方法 |
CN114792173A (zh) * | 2022-06-20 | 2022-07-26 | 支付宝(杭州)信息技术有限公司 | 预测模型训练方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109284864B (zh) | 2021-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109284864A (zh) | 行为序列获取方法及装置、用户转化率预测方法及装置 | |
Pinna et al. | A petri nets model for blockchain analysis | |
CN109034903A (zh) | 用户转化率预测方法及装置、计算机可读存储介质 | |
CN110827138B (zh) | 一种推送信息确定方法及装置 | |
CN108305094A (zh) | 一种用户行为预测方法及装置,电子设备 | |
CN107066476A (zh) | 一种基于物品相似度的实时推荐方法 | |
CN106604051A (zh) | 直播频道推荐方法及装置 | |
CN108230140A (zh) | 推送信息的方法和装置、确定输入默认值的方法和装置 | |
CN109064283B (zh) | 商品推荐方法及装置、计算机可读存储介质 | |
CN107025565A (zh) | 一种提高电子商务网站转化率的方法和系统 | |
CN107436914A (zh) | 推荐方法及装置 | |
CN105335873A (zh) | 一种获取广告位质量的方法、装置及电子设备 | |
CN110363652A (zh) | 一种基于价格敏感模型的金融产品定价方法、装置和电子设备 | |
CN104063429A (zh) | 电子商务中用户行为的预测方法 | |
CN107592296A (zh) | 垃圾账户的识别方法和装置 | |
CN106485536A (zh) | 决定下次购买时间区间的方法以及系统 | |
CN109727028A (zh) | 支付通道稳定性控制方法、装置、计算机设备及存储介质 | |
CN112579876A (zh) | 基于用户兴趣的信息推送方法、装置、系统及存储介质 | |
CN107316200A (zh) | 一种分析用户行为周期的方法和装置 | |
CN109034880A (zh) | 收入预测方法及装置 | |
CN106779926A (zh) | 关联规则生成方法、装置及终端 | |
AU2010336035A1 (en) | Method, system and controller for providing goods and /or services to consumers | |
JP5186959B2 (ja) | 社会ネットワーク構造モデルを導出する電子計算機及びプログラム | |
CN110348928A (zh) | 信息推送方法、装置及计算机可读存储介质 | |
CN109523246A (zh) | 用户缴费渠道规划方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |