CN106909372B - 一种移动端用户购买路径计算方法及系统 - Google Patents

一种移动端用户购买路径计算方法及系统 Download PDF

Info

Publication number
CN106909372B
CN106909372B CN201710050987.1A CN201710050987A CN106909372B CN 106909372 B CN106909372 B CN 106909372B CN 201710050987 A CN201710050987 A CN 201710050987A CN 106909372 B CN106909372 B CN 106909372B
Authority
CN
China
Prior art keywords
page
user
level
page level
access path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710050987.1A
Other languages
English (en)
Other versions
CN106909372A (zh
Inventor
欧阳烈
刘春江
柴楹
黄承松
夏里峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Qimi Network Technology Co ltd
Original Assignee
Wuhan Qimi Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Qimi Network Technology Co ltd filed Critical Wuhan Qimi Network Technology Co ltd
Priority to CN201710050987.1A priority Critical patent/CN106909372B/zh
Publication of CN106909372A publication Critical patent/CN106909372A/zh
Application granted granted Critical
Publication of CN106909372B publication Critical patent/CN106909372B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/20Software design
    • G06F8/22Procedural
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种移动端用户购买路径计算方法及系统,对APP的页面进行划分,划分成不同的页面层级,在APP里进行数据埋点,埋点记录用户在APP上的所有点击行为和浏览行为,以及记录用户行为的时间戳、页面层级ID、设备ID,通过消息中间控件将埋点记录的所有数据写入大数据集群hdfs;对大数据集群hdfs中埋点记录的所有数据进行map reduce排序,遍历埋点的每一条记录,计算用户访问路径。有益效果:通过划分APP的页面层级,在APP里进行数据埋点,埋点记录用户在APP上的所有点击行为和浏览行为,对埋点记录的所有数据进行map reduce排序,遍历埋点的每一条记录,可准确计算用户的购买路径。

Description

一种移动端用户购买路径计算方法及系统
技术领域
本发明涉及计算机技术领域,尤其是涉及一种移动端用户购买路径计算方法及系统。
背景技术
移动电子商务业务中,经常需要分析计算用户的购买路径来优化用户购买体验、对比多个活动模块的优劣、精准化定义用户标签,从而提升整体购买转化率,提高用户满意度等。
现有的计算用户购买路径的方式通常是借鉴传统PC端经验,通过用户在首页、CMS页、商详页、购物袋页、支付页、成单页的访问量,以及埋点可以计算上一级页面的特性,笼统的计算各个页面间的转化率。
但是这种计算方式只有二级的转化可以确定是准确的,超过二级的转化都会存在大量的误差,例如在多个CMS页同时包含同一个商品时,用户通过多个CMS页面进入商详页,然后再点击加入购物车这个行为,在数据上我们无法知道用户是从哪个CMS页面进入商详后,才会点击加入购物车。
本技术方案利用用户在移动APP上的浏览具有线性、单页面的属性(PC端用户可以开启多个标签页同时进行浏览),通过数据埋点的发生时间进行排序后,准确计算用户购买路径。
MapReduce:一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组。
发明内容
本发明的目的在于克服上述技术不足,提出一种移动端用户购买路径计算方法及系统,解决现有技术中计算购买路径存在大量误差的技术问题。
为达到上述技术目的,本发明的技术方案提供一种移动端用户购买路径计算方法,包括:
S1、对APP的页面进行划分,划分成不同的页面层级,第一个页面层级定义为级数最高的页面层级,页面层级划分完成后,在每一个页面层级都只能转向下一个页面层级,或者返回上一个页面层级;
S2、在APP里进行数据埋点,埋点记录用户在APP上的所有点击行为和浏览行为,以及记录用户行为的时间戳、页面层级ID、设备ID,通过消息中间控件将埋点记录的所有数据写入大数据集群hdfs;
S3、对大数据集群hdfs中埋点记录的所有数据进行map reduce排序;
S4、遍历埋点的每一条记录,计算用户访问路径,以用户访问路径字段保存用户访问路径,用户访问路径字段以页面层级ID的有序组合表示。
本发明还提供一种移动端用户购买路径计算系统,包括:
层级划分模块:对APP的页面进行划分,划分成不同的页面层级,第一个页面层级定义为级数最高的页面层级,页面层级划分完成后,在每一个页面层级都只能转向下一个页面层级,或者返回上一个页面层级;
埋点记录模块:在APP里进行数据埋点,埋点记录用户在APP上的所有点击行为和浏览行为,以及记录用户行为的时间戳、页面层级ID、设备ID,通过消息中间控件将埋点记录的所有数据写入大数据集群hdfs;
分析排序模块:对大数据集群hdfs中埋点记录的所有数据进行map reduce排序;
获取路径模块:遍历埋点的每一条记录,计算用户访问路径,以用户访问路径字段保存用户访问路径,用户访问路径字段以页面层级ID的有序组合表示。
与现有技术相比,本发明的有益效果包括:通过划分APP的页面层级,在APP里进行数据埋点,埋点记录用户在APP上的所有点击行为和浏览行为,对埋点记录的所有数据进行map reduce排序,遍历埋点的每一条记录,可准确计算用户的购买路径。
附图说明
图1是本发明提供的一种移动端用户购买路径计算方法流程图;
图2是本发明提供的一种移动端用户购买路径计算系统结构框图。
附图中:1、移动端用户购买路径计算系统,11、层级划分模块,12、埋点记录模块,13、分析排序模块,14、获取路径模块。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供了一种移动端用户购买路径计算方法,其中,包括:
S1、对APP的页面进行划分,划分成不同的页面层级,第一个页面层级定义为级数最高的页面层级,页面层级划分完成后,在每一个页面层级都只能转向下一个页面层级,或者返回上一个页面层级;
S2、在APP里进行数据埋点,埋点记录用户在APP上的所有点击行为和浏览行为,以及记录用户行为的时间戳、页面层级ID、设备ID,通过消息中间kafka控件将埋点记录的所有数据写入大数据集群hdfs;
S3、根据设备ID、浏览时间戳对大数据集群hdfs中埋点记录的所有数据进行mapreduce排序,减少遍历埋点记录进行计算访问路径的计算量。
S4、遍历埋点的每一条记录,计算用户访问路径,以用户访问路径字段保存用户访问路径,用户访问路径字段以页面层级ID的有序组合表示。
本发明所述的移动端用户购买路径计算方法,步骤S1中:
根据对APP进行准确细致的分析,将所有页面划分成入口、导航、前站、商详、购物车、支付6个层级(页面层级ID分别为ID1、ID2、ID3、ID4、ID5、ID6)。
本发明所述的移动端用户购买路径计算方法,步骤S2中:
由于在APP上用户访问是单线性,不会同时访问多个页面,所以在用户浏览商品、下单的过程中,存在着互斥步骤,例如,用户在访问了活动页A时,想要访问和活动页A同层级的活动页B,则必须先退回到入口页(例如首页),然后才能再次选择进入活动页B,这种需要重新选择入口页才能进入同级页面的关系,定义为互斥页面,在用户浏览过程中,存在互斥关系的页面,埋点仅记录互斥页面中的用户浏览时间轴上最后一个浏览页面。
本发明所述的移动端用户购买路径计算方法,步骤S4中计算访问路径的方法:
比较当前页面的页面层级ID与上一条记录的页面层级ID,若上一条记录的页面层级ID高于当前页面的页面层级ID,则继承上一条记录的访问路径,在用户访问路径字段中添加上一条记录的页面层级ID,若上一条记录的页面层级ID低于当前页面的页面层级ID,则将上一条记录的访问路径置空,在用户访问路径字段中添加本页面层级的ID,若没有上一条记录,当前页面为用户第一个访问页面,则在用户访问路径字段中添加第一个访问页面的层级ID;
例如,上一条记录的页面层级ID为ID2导航页,本条记录的页面层级ID为ID3前站页,上一条记录页面层级ID高于本条记录页面层级ID,上一条记录访问路径为:ID1-ID2,继承上一条记录的访问路径后,本条记录的访问路径为:ID1-ID2-ID3;
上一条记录的页面层级ID为ID3前站页,本条记录的页面层级ID为ID2导航页,上一条记录页面层级ID低于本条记录页面层级ID,将上一条记录的访问路径ID1-ID2-ID3置空后,本条记录的访问路径为:ID2;
若是第一条记录,没有上一条记录,例如访问首页,那么,第一条记录的访问路径为ID1。
根据设备I D、浏览时间戳对大数据集群hdfs中埋点记录的所有数据进行mapreduce排序,减少遍历埋点记录进行计算访问路径的计算量,如果不对埋点记录的数据进行map reduce排序,那么需要将当前记录的页面层级ID与之前的所有的记录的页面层级ID进行比较,以计算访问路径,这样计算量巨大,而依据设备ID、浏览时间戳对埋点记录的用户行为数据进行map reduce排序后,只需要将当前记录的页面层级ID与排序中上一条记录的页面层级ID进行比较就可以了,大大减少了计算量。
遍历所有埋点记录,所有记录的用户访问路径计算完成后,可以进行全站的流量路径转化分析,甚至是销售路径转化分析。
本发明还提供移动端用户购买路径计算系统1,其中,包括:
层级划分模块11:对APP的页面进行划分,划分成不同的页面层级,第一个页面层级定义为级数最高的页面层级,页面层级划分完成后,在每一个页面层级都只能转向下一个页面层级,或者返回上一个页面层级;
埋点记录模块12:在APP里进行数据埋点,埋点记录用户在APP上的所有点击行为和浏览行为,以及记录用户行为的时间戳、页面层级ID、设备ID,通过消息中间控件将埋点记录的所有数据写入大数据集群hdfs;
分析排序模块13:对大数据集群hdfs中埋点记录的所有数据进行map reduce排序;
获取路径模块14:遍历埋点的每一条记录,计算用户访问路径,以用户访问路径字段保存用户访问路径,用户访问路径字段以页面层级ID的有序组合表示。
本发明所述的移动端用户购买路径计算系统1,埋点记录模块12中:
消息中间件为kafka。
本发明所述的移动端用户购买路径计算系统1,分析排序模块13中:
根据设备ID、浏览时间戳将埋点记录的用户行为数据进行map reduce排序,减少遍历埋点记录进行计算访问路径的计算量。
本发明所述的移动端用户购买路径计算系统1,获取路径模块14中计算访问路径:
比较当前页面的页面层级ID与上一条记录的页面层级ID,若上一条记录的页面层级ID高于当前页面的页面层级ID,则继承上一条记录的访问路径,在用户访问路径字段中添加上一条记录的页面层级ID,若上一条记录的页面层级ID低于当前页面的页面层级ID,则将上一条记录的访问路径置空,在用户访问路径字段中添加本页面层级的ID,若没有上一条记录,当前页面为用户第一个访问页面,则在用户访问路径字段中添加第一个访问页面的层级ID。
与现有技术相比,本发明的有益效果包括:通过划分APP的页面层级,在APP里进行数据埋点,埋点记录用户在APP上的所有点击行为和浏览行为,对埋点记录的所有数据进行map reduce排序,遍历埋点的每一条记录,可准确计算用户的购买路径。
以上所述本发明的具体实施方式,并不构成对本发明保护范围的限定。任何根据本发明的技术构思所做出的各种其他相应的改变与变形,均应包含在本发明权利要求的保护范围内。

Claims (6)

1.一种移动端用户购买路径计算方法,其特征在于,包括:
S1、对APP的页面进行划分,划分成不同的页面层级,第一个页面层级定义为级数最高的页面层级,页面层级划分完成后,在每一个页面层级都只能转向下一个页面层级,或者返回上一个页面层级;
S2、在APP里进行数据埋点,埋点记录用户在APP上的所有点击行为和浏览行为,以及记录用户行为的时间戳、页面层级ID、设备ID,通过消息中间控件将埋点记录的所有数据写入大数据集群hdfs;
S3、对大数据集群hdfs中埋点记录的所有数据进行map reduce排序;
S4、遍历埋点的每一条记录,计算用户访问路径,以用户访问路径字段保存用户访问路径,用户访问路径字段以页面层级ID的有序组合表示;
步骤S4中计算访问路径的方法:
比较当前页面的页面层级ID与上一条记录的页面层级ID,若上一条记录的页面层级ID高于当前页面的页面层级ID,则继承上一条记录的访问路径,在用户访问路径字段中添加上一条记录的页面层级ID,若上一条记录的页面层级ID低于当前页面的页面层级ID,则将上一条记录的访问路径置空,在用户访问路径字段中添加本页面层级的ID,若没有上一条记录,当前页面为用户第一个访问页面,则在用户访问路径字段中添加第一个访问页面的层级ID。
2.如权利要求1所述的移动端用户购买路径计算方法,其特征在于,步骤S2中:
消息中间件为kafka。
3.如权利要求1所述的移动端用户购买路径计算方法,其特征在于,步骤S3中:
根据设备ID、浏览时间戳将埋点记录的用户行为数据进行map reduce排序,减少遍历埋点记录进行计算访问路径的计算量。
4.一种移动端用户购买路径计算系统,其特征在于,包括:
层级划分模块:对APP的页面进行划分,划分成不同的页面层级,第一个页面层级定义为级数最高的页面层级,页面层级划分完成后,在每一个页面层级都只能转向下一个页面层级,或者返回上一个页面层级;
埋点记录模块:在APP里进行数据埋点,埋点记录用户在APP上的所有点击行为和浏览行为,以及记录用户行为的时间戳、页面层级ID、设备ID,通过消息中间控件将埋点记录的所有数据写入大数据集群hdfs;
分析排序模块:对大数据集群hdfs中埋点记录的所有数据进行map reduce排序;
获取路径模块:遍历埋点的每一条记录,计算用户访问路径,以用户访问路径字段保存用户访问路径,用户访问路径字段以页面层级ID的有序组合表示;
获取路径模块中计算访问路径:
比较当前页面的页面层级ID与上一条记录的页面层级ID,若上一条记录的页面层级ID高于当前页面的页面层级ID,则继承上一条记录的访问路径,在用户访问路径字段中添加上一条记录的页面层级ID,若上一条记录的页面层级ID低于当前页面的页面层级ID,则将上一条记录的访问路径置空,在用户访问路径字段中添加本页面层级的ID,若没有上一条记录,当前页面为用户第一个访问页面,则在用户访问路径字段中添加第一个访问页面的层级ID。
5.如权利要求4所述的移动端用户购买路径计算系统,其特征在于,埋点记录模块中:
消息中间件为kafka。
6.如权利要求4所述的移动端用户购买路径计算系统,其特征在于,分析排序模块中:
根据设备ID、浏览时间戳将埋点记录的用户行为数据进行map reduce排序,减少遍历埋点记录进行计算访问路径的计算量。
CN201710050987.1A 2017-01-23 2017-01-23 一种移动端用户购买路径计算方法及系统 Active CN106909372B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710050987.1A CN106909372B (zh) 2017-01-23 2017-01-23 一种移动端用户购买路径计算方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710050987.1A CN106909372B (zh) 2017-01-23 2017-01-23 一种移动端用户购买路径计算方法及系统

Publications (2)

Publication Number Publication Date
CN106909372A CN106909372A (zh) 2017-06-30
CN106909372B true CN106909372B (zh) 2020-08-18

Family

ID=59206643

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710050987.1A Active CN106909372B (zh) 2017-01-23 2017-01-23 一种移动端用户购买路径计算方法及系统

Country Status (1)

Country Link
CN (1) CN106909372B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729552A (zh) * 2017-11-03 2018-02-23 广州优视网络科技有限公司 用户行为追踪方法、装置、用户终端及服务器
CN108255993A (zh) * 2017-12-29 2018-07-06 北京三快在线科技有限公司 提取业务字段的方法、装置、电子设备及存储介质
CN108833459B (zh) * 2018-04-09 2022-05-13 平安普惠企业管理有限公司 数据上报方法及终端设备
CN109242164B (zh) * 2018-08-22 2022-04-26 中国平安人寿保险股份有限公司 优化产品路径的方法及装置、计算机存储介质、电子设备
CN110263070B (zh) * 2019-05-30 2021-10-08 北京创鑫旅程网络技术有限公司 事件上报方法及装置
CN110298007A (zh) * 2019-07-04 2019-10-01 北京百佑科技有限公司 用户行为统计方法、装置、电子设备及计算机可读存储介质
CN110781061B (zh) * 2019-09-20 2022-11-25 平安科技(深圳)有限公司 一种记录用户行为链路的方法及装置
CN113127336A (zh) * 2020-01-16 2021-07-16 北京沃东天骏信息技术有限公司 数据收集方法和装置
CN111526065A (zh) * 2020-04-13 2020-08-11 苏宁云计算有限公司 一种网站页面流量分析方法及系统
CN112435047A (zh) * 2020-10-30 2021-03-02 四川新网银行股份有限公司 一种基于埋点数据的营销外呼数据推荐方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010157151A (ja) * 2008-12-29 2010-07-15 Kan:Kk アクセス解析システム及びアクセス解析方法
CN103631828A (zh) * 2012-08-28 2014-03-12 阿里巴巴集团控股有限公司 确定访问路径的方法和装置、确定页面流失率的方法和系统
CN103823883A (zh) * 2014-03-06 2014-05-28 焦点科技股份有限公司 一种网站用户访问路径的分析方法及系统
CN103940438A (zh) * 2013-01-23 2014-07-23 清华大学 一种基于条码的购物中心定位和群智购物导航方法
CN105095987A (zh) * 2015-06-30 2015-11-25 北京奇虎科技有限公司 一种购物导航方法及用于购物导航的服务器、客户端
CN106250404A (zh) * 2016-07-21 2016-12-21 柳州龙辉科技有限公司 一种用户操作分析的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010157151A (ja) * 2008-12-29 2010-07-15 Kan:Kk アクセス解析システム及びアクセス解析方法
CN103631828A (zh) * 2012-08-28 2014-03-12 阿里巴巴集团控股有限公司 确定访问路径的方法和装置、确定页面流失率的方法和系统
CN103940438A (zh) * 2013-01-23 2014-07-23 清华大学 一种基于条码的购物中心定位和群智购物导航方法
CN103823883A (zh) * 2014-03-06 2014-05-28 焦点科技股份有限公司 一种网站用户访问路径的分析方法及系统
CN105095987A (zh) * 2015-06-30 2015-11-25 北京奇虎科技有限公司 一种购物导航方法及用于购物导航的服务器、客户端
CN106250404A (zh) * 2016-07-21 2016-12-21 柳州龙辉科技有限公司 一种用户操作分析的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于Web日志挖掘用户偏爱浏览路径算法";苏兰 等;《电脑知识与技术》;20160412;第12卷(第5期);第221-223页 *

Also Published As

Publication number Publication date
CN106909372A (zh) 2017-06-30

Similar Documents

Publication Publication Date Title
CN106909372B (zh) 一种移动端用户购买路径计算方法及系统
CN107358247B (zh) 一种确定流失用户的方法及装置
CN108363657A (zh) 监控app客户端埋点数据采集完整性的方法、设备以及介质
US20150186808A1 (en) Contextual data analysis using domain information
CN105096152A (zh) 一种基于商品热度的操作执行方法及装置
CN112613938B (zh) 模型训练方法、装置及计算机设备
CN113220657B (zh) 数据处理方法、装置及计算机设备
CN107066519A (zh) 一种任务检测方法及装置
US11182436B2 (en) Predicting locations based on transaction records
US20140344328A1 (en) Data collection and distribution management
CN111291936B (zh) 产品生命周期预估模型生成方法、装置及电子设备
US11443237B1 (en) Centralized platform for enhanced automated machine learning using disparate datasets
CN104391947A (zh) 海量gis数据实时处理方法及系统
CN110175180A (zh) 一种表单管理方法、装置、设备及存储介质
US20090319403A1 (en) Dimension-based financial reporting using multiple combinations of dimensions
CN115659045A (zh) 用户操作的识别方法、装置、存储介质以及电子设备
CN104679880A (zh) 动态输入项及其业务数据的动态存储与展现的装置以及方法
CN115269254A (zh) 订单异常确定方法、装置、设备及介质
CN111933228B (zh) 用于临床研究中的项目分发与管理系统的实现方法和装置
CN114925919A (zh) 业务资源处理方法、装置、计算机设备和存储介质
CN114595473A (zh) 访问数据处理方法和装置、电子设备、计算机可读介质
CN114564501A (zh) 一种数据库数据存储、查询方法、装置、设备及介质
CN111143546A (zh) 一种获得推荐语的方法、装置及电子设备
CN112579880A (zh) 数据分析方法、装置、存储介质及电子设备
CN112288509A (zh) 订单跟踪方法及装置、计算机可读存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant