CN113127742B - 用户行为路径提取方法、装置、设备及存储介质 - Google Patents

用户行为路径提取方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113127742B
CN113127742B CN202110484017.9A CN202110484017A CN113127742B CN 113127742 B CN113127742 B CN 113127742B CN 202110484017 A CN202110484017 A CN 202110484017A CN 113127742 B CN113127742 B CN 113127742B
Authority
CN
China
Prior art keywords
access
user
product
preset
entrance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110484017.9A
Other languages
English (en)
Other versions
CN113127742A (zh
Inventor
谢杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kangjian Information Technology Shenzhen Co Ltd
Original Assignee
Kangjian Information Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kangjian Information Technology Shenzhen Co Ltd filed Critical Kangjian Information Technology Shenzhen Co Ltd
Priority to CN202110484017.9A priority Critical patent/CN113127742B/zh
Publication of CN113127742A publication Critical patent/CN113127742A/zh
Application granted granted Critical
Publication of CN113127742B publication Critical patent/CN113127742B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据处理领域,公开了一种用户行为路径提取方法、装置、设备及存储介质,该方法包括:获取用户访问时的中间访问步骤及其对应的发生时间,按照时间的先后顺序进行排序,生成产品访问序列,并根据用户进入访问入口和到达访问终点的时间点计算时间差值,匹配用户的实际访问入口,从而再将实际访问入口、产品访问序列和访问终点按照发生时间的先后顺序进行排序,生成用户行为路径。通过本发明的技术方案生成的用户行为路径清楚且准确,并且还可以根据生成的用户行为路径能够对产品和运营进行优化,提高用户满意度。其中,本发明还涉及区块链技术,用户行为路径中的各访问数据可存储于区块链中。

Description

用户行为路径提取方法、装置、设备及存储介质
技术领域
本发明涉及数据处理领域,尤其涉及一种用户行为路径提取方法、装置、设备及存储介质。
背景技术
用户行为路径是互联网行业常用的一种数据分析方法,为企业实现理想的数据驱动与布局调整提供科学指导。为让观众沿着最优访问路径前进,需要策展者结合需求进行布局调整。这种分析方法对产品涉及的优化与改进有很大的帮助,可以用于监测和优化各模块的转化率,也可以发现某些冷僻的功能点。
现有技术获取用户的行为路径主要是采用局部转化漏斗方法,但该方法只适用固定化局部功能,且路径较短,则无法追踪具体入口;另外,还可以在业务入口配置参数,对用户访问页面时产生的参数进行接收,但因用户的行为是混乱的,很可能会出现跨业务页面传参的情况,导致参数丢失,最后统计用户业务转化无法归属行为入口。因此,现有技术存在获取到的用户的行为路径无法直观清楚地展示用户真正的路径,以及受冗余数据的影响导致得到的用户行为路径不准确,同时计算时长较长的技术问题。
发明内容
本发明的主要目的在于解决现有技术中获取到的用户的行为路径无法直观清楚地展示用户真正的路径且准确度低的技术问题。
本发明第一方面提供了一种用户行为路径提取方法,所述用户行为路径提取方法包括:获取用户访问待访问产品时的中间访问步骤及其对应的发生时间,其中,所述中间访问步骤为进入任意预设访问入口后至到达预设访问终点前的所有访问步骤;提取所述中间访问步骤中的各访问步骤,按照各所述访问步骤对应的发生时间的先后顺序进行排序,形成产品访问序列;计算用户进入所述访问入口和到达所述访问终点的时间差值,并根据所述时间差值,从用户进入的所有所述访问入口中匹配实际访问入口;将所述产品访问序列中各访问步骤、实际访问入口和预设访问终点,按照各步骤的发生时间的先后顺序进行行为排序,生成用户行为路径。
可选的,在本发明的第一方面的第一种实现方式中,所述获取用户访问待访问产品时的中间访问步骤及其对应的发生时间包括:获取待访问产品,其中,所述待访问产品至少为一个;提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问所述待访问产品的所有访问步骤,得到中间访问步骤;记录所述中间访问步骤中各访问步骤的发生时间。
可选的,在本发明的第一方面的第二种实现方式中,所述获取待访问产品包括:基于预设的各产品的重要性权重,对所有产品的重要性权重与预设重要性阈值进行比较;基于比较的结果,对所有产品进行重要性筛选,得到待访问产品。
可选的,在本发明的第一方面的第三种实现方式中,所述提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问所述待访问产品的所有访问步骤,得到中间访问步骤包括:提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问待访问产品的各访问步骤;基于预设的访问步骤的重要性权重,对各所述访问步骤的重要性权重和预设重要性阈值进行比较;基于比较的结果,对各所述访问步骤进行重要性筛选,得到中间访问步骤。
可选的,在本发明第一方面的第四种实现方式中,所述提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问所述待访问产品的所有访问步骤,得到中间访问步骤包括:提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问待访问产品的各访问步骤,形成用户访问记录;提取所述用户访问记录中各所述待访问产品的访问频次;基于各所述待访问产品的访问频次,将所述用户访问记录转换为访问矩阵数组;基于各所述待访问产品的重要性权重,将所述访问矩阵数组转换为访问矩阵;基于所述访问矩阵,对所述用户访问记录中的各访问步骤进行分析,得到中间访问步骤。
可选的,在本发明第一方面的第五种实现方式中,所述计算用户进入所述访问入口和到达所述访问终点的时间差值,并根据所述时间差值,从用户进入的所有所述访问入口中匹配实际访问入口包括:记录用户进入任意所述预设访问入口的时刻,得到至少一个第一时刻;记录用户到达所述业务终点的时刻,得到第二时刻;分别计算至少一个所述第一时刻与所述第二时刻的时间差,得到至少一个时间差值;对至少一个所述时间差值与预设时间差阈值进行比较;基于比较的结果,确定用户访问所述待访问产品时进入的实际访问入口。
可选的,在本发明第一方面的第六种实现方式中,在所述将所述产品访问序列中各访问步骤、实际访问入口和预设访问终点,按照各步骤的发生时间的先后顺序进行行为排序,生成用户行为路径之后,还包括:对各所述待访问产品的访问频次进行监控;检测所述待访问产品的访问频次是否超过预设产品访问阈值;若是,则增加对应的待访问产品的访问入口;和/或,对各所述访问入口的访问频次进行监控;检测所述访问入口的访问频次是否小于预设入口访问阈值;若是,则剔除相应的访问入口。
本发明第二方面提出一种用户行为路径提取装置,所述用户行为路径提取装置包括:获取模块,用于获取用户访问待访问产品时的中间访问步骤及其对应的发生时间;排序模块,用于提取所述中间访问步骤中的各访问步骤,按照各所述访问步骤对应的发生时间的先后顺序进行排序,形成产品访问序列;计算模块,用于计算用户进入所述访问入口和到达所述访问终点的时间差值,并根据所述时间差值,从用户进入的所有所述访问入口中匹配实际访问入口;生成模块,用于将所述产品访问序列中各访问步骤、实际访问入口和预设访问终点,按照各步骤的发生时间的先后顺序进行行为排序,生成用户行为路径。
可选的,在本发明第二方面的第一种实现方式中,所述获取模块包括:产品获取单元,用于获取待访问产品;步骤提取单元,用于提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问所述待访问产品的所有访问步骤,得到中间访问步骤;记录单元,用于记录所述中间访问步骤中各访问步骤的发生时间。
可选的,在本发明第二方面的第二种实现方式中,所述产品获取单元具体用于:基于预设的各产品的重要性权重,对所有产品的重要性权重与预设重要性阈值进行比较;基于比较的结果,对所有产品进行重要性筛选,得到待访问产品。
可选的,在本发明第二方面的第三种实现方式中,所述步骤提取单元具体用于:提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问待访问产品的各访问步骤;基于预设的访问步骤的重要性权重,对各所述访问步骤的重要性权重和预设重要性阈值进行比较;基于比较的结果,对各所述访问步骤进行重要性筛选,得到中间访问步骤。
可选的,在本发明第二方面的第四种实现方式中,所述步骤提取单元具体用于:提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问待访问产品的各访问步骤,形成用户访问记录;提取所述用户访问记录中各所述待访问产品的访问频次;基于各所述待访问产品的访问频次,将所述用户访问记录转换为访问矩阵数组;基于各所述待访问产品的重要性权重,将所述访问矩阵数组转换为访问矩阵;基于所述访问矩阵,对所述用户访问记录中的各访问步骤进行分析,得到中间访问步骤。
可选的,在本发明第二方面的第五种实现方式中,所述计算模块具体用于:记录用户进入任意所述预设访问入口的时刻,得到至少一个第一时刻;记录用户到达所述业务终点的时刻,得到第二时刻;分别计算至少一个所述第一时刻与所述第二时刻的时间差,得到至少一个时间差值;对至少一个所述时间差值与预设时间差阈值进行比较;基于比较的结果,确定用户访问所述待访问产品时进入的实际访问入口。
可选的,在本发明第二方面的第六种实现方式中,所述用户行为路径提取装置还包括监控模块,所述监控模块具体用于:对各所述待访问产品的访问频次进行监控;检测所述待访问产品的访问频次是否超过预设产品访问阈值;若是,则增加对应的待访问产品的访问入口;和/或,对各所述访问入口的访问频次进行监控;检测所述访问入口的访问频次是否小于预设入口访问阈值;若是,则剔除相应的访问入口。
本发明第三方面提供了一种用户行为路径提取设备,所述用户行为路径提取设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述用户行为路径提取设备执行上述的用户行为路径提取方法的步骤。
本发明第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,当其在计算机上运行时,使得计算机执行上述的用户行为路径提取方法的步骤。
在本发明提供的技术方案中,通过获取用户访问待访问产品时的中间访问步骤及其对应的发生时间,并提取所述中间访问步骤中的各访问步骤,按照各所述访问步骤对应的发生时间的先后顺序进行排序,形成产品访问序列;再计算用户进入所述访问入口和到达所述访问终点的时间差值,并根据所述时间差值,从用户进入的所有所述访问入口中匹配实际访问入口;将所述产品访问序列中各访问步骤、实际访问入口和预设访问终点,按照各步骤的发生时间的先后顺序进行行为排序,生成用户行为路径。本发明的技术方案使得生成的用户行为路径清楚且准确,同时筛选去除冗余数据,匹配实际访问入口,可以对产品和业务转化进行优化,从而提高运营效率和能力。
附图说明
图1为本发明实施例中用户行为路径提取方法的第一个实施例示意图;
图2为本发明实施例中用户行为路径提取方法的第二个实施例示意图;
图3为本发明实施例中用户行为路径提取方法的第三个实施例示意图;
图4为本发明实施例中用户行为路径提取方法的第四个实施例示意图;
图5为本发明实施例中用户行为路径提取装置的一个实施例示意图;
图6为本发明实施例中用户行为路径提取装置的另一个实施例示意图;
图7为本发明实施例中用户行为路径提取设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种用户行为路径提取方法、装置、设备及存储介质,通过获取用户访问待访问产品时的中间访问步骤及其对应的发生时间,并提取所述中间访问步骤中的各访问步骤,按照各所述访问步骤对应的发生时间的先后顺序进行排序,形成产品访问序列;再计算用户进入所述访问入口和到达所述访问终点的时间差值,并根据所述时间差值,从用户进入的所有所述访问入口中匹配实际访问入口;将所述产品访问序列中各访问步骤、实际访问入口和预设访问终点,按照各步骤的发生时间的先后顺序进行行为排序,生成用户行为路径。本实施例的技术方案使得生成的用户行为路径清楚且准确,同时筛选去除冗余数据,匹配实际访问入口,可以对产品和业务转化进行优化,从而提高运营效率和能力。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体内容进行描述,请参阅图1,本发明实施例中用户行为路径提取方法的第一个实施例包括:
101,获取用户访问待访问产品时的中间访问步骤及其对应的发生时间;
在本实施例中,用户可以从网络页面的任意一个访问入口进入,访问浏览该网络页面和该网络页面内的各产品,且在此过程中可能会发生各种各样的用户行为,当用户到达该网络页面设置的访问终点时,自动结束该访问业务,即当用户从访问入口进入,对产品进行访问,最后到达访问终点的整个过程视为一个访问业务的执行过程。对该用户的整个用户行为路径进行分析,有助于对产品和页面设计进行改善,提高监测和优化各模块的转化率。在本实施例中,对产品进行访问也可以理解为是在网络页面中发生某些行为事件,即用户的行为数据的获取并不仅仅只是对产品进行访问而产生的,在本实施例中,引入产品概念,将用户行为与产品访问进行结合是为了方便对实施例进行说明,但本实施例并不对用户行为的发生过程进行限定。
具体的,假设该网络页面是购物网站的页面,当用户在浏览购物网站时,从购物网站中设置的任意一个访问入口进入,可以对该购物网站上的任意产品进行浏览,当到达该购物网站设置的访问终点时,结束访问。其中,可以设置访问入口为该购物网站的产品推荐页面或产品搜索页面,当用户从产品推荐页面点击某一产品跳转到产品详情页面时,就相当于是已经从访问入口进入,实现执行访问待访问产品的步骤。当访问入口为产品搜索页面时,亦同理,当用户从产品搜索页面搜索产品之后,点击搜索结果跳转到产品详情面时,就已经是从访问入口进入,可以访问待访问产品。当用户到达预设的访问终点时,就完成了访问任务,其中,访问终点在此不做限定,可以根据实际业务情况进行设定,例如,可以设定购物网站的访问终点为购买,即当用户发生购买行为时,该访问业务执行完毕。
在整个访问业务的执行过程中,获取用户访问产品的行为数据,该行为数据是指用户进入任意访问入口后至到达预设访问终点之间所有的访问步骤,并将其作为中间访问步骤,即中间访问步骤为用户在进入访问入口后到达访问终点之间所有的行为步骤。另外,不仅需要获得用户的中间访问步骤,还需要获得用户发生中间访问步骤时各访问步骤的行为发生的时间点,且该时间点需要精确到毫秒级别,例如,某用户在1月1日14:00:03发生查看产品详情行为,在1月1日14:20:45发生添加购物车行为。
102,提取中间访问步骤中的各访问步骤,按照各访问步骤对应的发生时间的先后顺序进行排序,形成产品访问序列;
在获取到用户访问待访问产品时的所有中间访问步骤和及其对应的发生时间之后,提取中间访问步骤中的各访问步骤,然后按照各步骤对应的发生时间的先后顺序,对中间访问步骤中的各个访问步骤进行行为排序,形成以发生时间为节点的各访问步骤的访问序列,作为产品访问序列。
例如,对某用户的中间访问步骤中各访问步骤进行排序后,生成的产品访问序列为:选择产品关键词-点击待选产品-添加产品到购物车。每个用户在进入预设访问入口对待访问产品进行访问时的各访问步骤不同,且各访问步骤发生的时间不同,所以每个用户的中间访问步骤在经过排序之后都会生成每个用户对应的产品访问序列。
103,计算用户进入访问入口和到达访问终点的时间差值,并根据时间差值,从用户进入的所有访问入口中匹配实际访问入口;
在用户进入任意访问入口时,记录用户进入该访问入口的发生时间,当用户到达预设的访问终点时,记录用户到达该访问终点的时间,其中,预设的访问入口有多个,而预设访问终点只有一个。在整个访问业务的执行过程中,用户可以从任意一个访问入口进入,且用户可以多次进入不同的访问入口,即用户进入同一访问入口的次数可以为多次,且访问入口并不限定为只能选择其中一个访问入口,则在整个访问业务的执行过程中,用户可以选择至少一个访问入口进入,无论从哪个访问入口进入,当到达访问终点时,表明该访问业务执行完毕。所以记录用户进入预设访问入口时,可以得到记录进入访问入口时的至少一个时间点。当用户到达该访问终点时,记录该行为发生的时间点,由此,将进入访问入口的时间和到达访问终点的时间进行时间差运算,即计算每一个进入访问入口的发生时间和到达访问终点的发生时间的时间差值,并根据该时间差值,从用户进入的多个访问入口中匹配出实际访问入口,即从多个用户进入的访问入口中筛选出用户完成整个访问业务的实际访问入口。
具体的,匹配实际访问入口的过程为首先按访问业务执行过程和入口路径估计需限制的时间范围内,用户的到达访问终点的时间(每次完成访问业务的执行时间)和各个访问入口的访问时间进行时间差运算,取时间差值最小的访问入口作为实际访问入口。
104,将产品访问序列中各访问步骤、实际访问入口和预设访问终点,按照各步骤的发生时间的先后顺序进行行为排序,生成用户行为路径。
当在用户进入的所有的访问入口中,匹配到用户进入的实际访问入口后,将用户在整个访问业务执行过程中的各行为进行排序,即将所得到的产品访问序列中各访问步骤、实际访问入口和访问终点按照各行为发生的发生时间的先后顺序进行排序,形成用户行为路径。并且,由于每个用户进入的实际访问入口不同,产品访问序列中各访问步骤不同,所以对各访问步骤按照时间先后顺序进行行为排序时,都会对应生成各用户的用户行为路径。
本发明实施例在实际应用中,有三点需特别注意,一是预设访问入口的统计完整性,若有较多遗漏,则用户完成访问业务之后,在匹配实际访问入口时,实际访问入口归属不到具体的预设访问入口,而且有可能出现归属同一访问入口较多的问题(比如有的访问入口有标志性提示,用户会访问,但不一定在该访问入口转化业务,即从该访问入口进入并完成产品访问业务),这样对访问入口的业务转化率计算偏差较大;二是用户到达访问终点和进入访问入口的时间差的估计,若时间差太小,较多访问入口归属不了;若时间差太大,则会把一些业务转化率强行归属到一些已有的访问入口,而实际可能是访问入口缺失的问题导致;三是中间步骤的筛选并持续优化。
同时,在实际应用中还可以对此用户行为路径提取方法进行优化,结合部分访问入口带参数进行部分数据校正,以更优的进行访问入口归属。不同人群路径有些差异,针对这种差异对中间步骤分别进行筛选。
在本实施例中,还可以通过获取到用户行为路径对产品进行优化,并统计业务转化情况。本实施例的用户行为路径提取方法对于访问入口设置来说,不仅仅局限于某一主要入口漏斗和单一运营人员的产出情况,可放宽到整个客户端上各产品位置,以此获取用户对业务的感知情况;另外,对于业务功能优化,可较全的评估此业务投放访问入口的运行情况,按此转化对访问入口进行分级,对运营及产品进行持续性的优化;当获取到用户的行为路径之后,对不同人群的访问路径进行分类比较进而达到针对不同人群产品路径优化的效果。
在本发明实施例中,获取用户访问的各步骤,并记录各步骤对应的发生时间,并计算用户进入访问入口和到达访问终点的时间差值,以此匹配实际访问入口,并根据实际访问入口、用户访问各步骤和访问终点按照其对应的发生时间进行行为排序,得到用户行为路径。本发明实施例能够生成清楚且准确的用户行为路径,并提高了用户行为路径的生成效率,节约了时间成本。
请参阅图2,本发明实施例中用户行为路径提取方法的第二个实施例包括:
201,基于预设的各产品的重要性权重,对所有产品的重要性权重与预设重要性阈值进行比较;
在网络页面设置待访问产品之前,先对所有产品进行了重要性权重的设定,即对所有的产品都对应设置了不同的权重值。并且预设了重要性阈值,将所有产品对应的权重值与重要性阈值进行比较,确定各产品的重要性,即对所有产品的权重值与重要性阈值进行数值比较,根据比较的结果判断该产品的重要性高低。
202,基于比较的结果,对所有产品进行重要性筛选,得到待访问产品;
当比较的结果为,该产品对应的权重值不小于重要性阈值时,则认为该产品的重要性较高,因此可以将它作为待访问产品,当该产品对应的权重值小于预设的重要性阈值时,将该产品作为不重要的产品,由此可以根据权重值与重要性阈值的数值比较结果,对所有产品进行重要性筛选,得到待访问产品。在本实施例中,对所有产品进行重要性筛选不是说将筛选出的重要性较高的产品进行展示和访问,所有的产品都可以被展示和被访问,但是重要性较高的产品被用户访问时,该行为数据会被记录,即对产品进行重要性的筛选其实是对用户的行为数据的记录进行限定,有效减少数据冗余,筛选去掉不重要的数据,方便后续对用户行为路径提取。
203,提取用户在进入任意预设访问入口后至到达预设访问终点之前,用户访问待访问产品的各访问步骤;
用户从进入访问入口开始直至到达访问终点,用户访问待访问产品的所有访问步骤都会被客户端进行记录,即客户端后台记录有用户开始执行访问业务至结束该业务的所有的行为数据,提取在用户进入任意预设访问入口后至到达预设访问终点前的各步骤,即提取用户访问待访问产品的各步骤。
204,基于预设的访问步骤的重要性权重,对各访问步骤的重要性权重和预设重要性阈值进行比较;
在对用户的各访问步骤进行记录之前,先对所有的访问步骤进行了重要性权重的设定,即对所有的访问步骤都对应设置了不同的权重值。并且预设了重要性阈值,将所有访问步骤对应的权重值与重要性阈值进行比较,确定各访问步骤的重要性,即在提取了用户的所有的访问步骤之后,对所有访问步骤的权重值与重要性阈值进行数值比较,根据比较的结果判断该访问步骤的重要性高低。
205,基于比较的结果,对各访问步骤进行重要性筛选,得到中间访问步骤;
当比较的结果为,该访问步骤对应的权重值不小于重要性阈值时,则认为该访问步骤的重要性较高,因此可以将它作为中间访问步骤,当该访问步骤对应的权重值小于预设的重要性阈值时,将该访问步骤作为不重要的访问步骤,由此可以根据权重值与重要性阈值的数值比较结果,对所有访问步骤进行重要性筛选,得到中间访问步骤。在本实施例中,对所有的访问步骤进行重要性筛选,主要是因为当记录的是所有访问步骤的数据时,数据过于冗余,造成获取的用户行为路径杂乱(无法直观的展示用户的行为路径)且不够准确。通过对访问步骤进行重要性筛选能够减小中间访问步骤的数据冗余,即去掉不重要的访问步骤,将重要性较高的访问步骤作为中间访问步骤进行留存,方便后续对用户行为路径提取。
具体的,用户可以从预设访问入口中的任意一个访问入口进入,并开始执行访问业务,直至用户到达预设访问终点,结束该访问业务。在此过程中,从进入访问入口开始直至到达访问终点,用户访问待访问产品的所有访问步骤都会被客户端进行记录,即客户端后台记录有用户开始执行访问业务至结束该业务的所有的行为数据。在该行为数据中提取出进入访问入口后,至到达访问终点前的各步骤作为中间访问步骤。
进一步的,获取用户行为数据的过程为,在网络页面中的每个页面对应的源代码中注入一段或者几段脚本(比如javascript脚本),这些脚本用于获取用户操作页面的操作事件对应的用户行为数据。可以理解的是,脚本注入位置为用于执行用户对页面的操作事件的源代码之后;比如,执行打开页面这一操作事件的源代码后,可插入脚本,用于获取用户打开页面这一操作事件的用户行为数据;又比如,执行用户点击页面中的按钮的点击事件的这一操作事件的源代码后,可插入脚本,用于获取用户点击事件对应的用户行为数据。
206,记录中间访问步骤中各访问步骤的发生时间;
在获取用户行为数据的过程中,客户端还会记录用户在发生行为数据对应的行为时的发生时间点,该时间点精确到毫秒级别。因此,当获取到用户进入任意预设访问入口后,到达访问终点前的中间访问步骤的同时,客户端后台也记录了中间访问步骤中各访问步骤的发生时间。
207,提取中间访问步骤中的各访问步骤,按照各访问步骤对应的发生时间的先后顺序进行排序,形成产品访问序列;
在获取到用户访问待访问产品时的所有中间访问步骤和及其对应的发生时间之后,提取中间访问步骤中的各访问步骤,然后按照各步骤对应的发生时间的先后顺序,对中间访问步骤中的各个访问步骤进行行为排序,形成以发生时间为节点的各访问步骤的访问序列,作为产品访问序列。
例如,对某用户的中间访问步骤中各访问步骤进行排序后,生成的产品访问序列为:选择产品关键词-点击待选产品-添加产品到购物车。每个用户在进入预设访问入口对待访问产品进行访问时的各访问步骤不同,且各访问步骤发生的时间不同,所以每个用户的中间访问步骤在经过排序之后都会生成每个用户对应的产品访问序列。
208,记录用户进入任意访问入口的时刻,得到至少一个第一时刻;
当用户进行任意一个预设访问入口时,对进入该访问入口的时间点进行记录,得到第一时刻,由于,预设访问入口不止一个,且用户可以任意进入不同的访问入口,所以记录用户进入访问入口的第一时刻不止一个。
209,记录用户到达访问终点的时刻,得到第二时刻;
对用户到达预设访问终点的时间点进行记录,得到第二时刻,其中,预设的访问终点只有一个,因此,当用户到达访问终点时,用户的访问业务自动结束,则第二时刻只有一个。
210,分别计算至少一个第一时刻与第二时刻的时间差,得到至少一个时间差值;
从至少一个第一时刻中选择一个第一时刻,与第二时刻进行时间差计算,即计算第一时刻与第二时刻的时间差值,当对所有的第一时刻和第二时刻的时间差计算完毕时,可以得到至少一个时间差值。
211,对至少一个时间差值与预设时间差阈值进行比较;
对得到的至少一个时间差值与预设的时间差阈值进行比较,即比较时间差值与时间差阈值的数值大小。当对所有的时间差值与时间差阈值进行比较之后,可以得到至少一个比较的结果。
212,基于比较的结果,确定用户访问待访问产品时进入的实际访问入口;
根据比较的结果,判断用户访问待访问产品时进入的实际访问入口。在本实施例中,当时间差值不大于时间差阈值时,表明对应的访问入口为实际访问入口,即用户在进入该访问入口后,对待访问产品进行了访问,并且到达了访问终点,完成了访问业务,实现了业务转化。当时间差值大于时间差阈值时,表明对应的访问入口不是实际访问入口。对所有比较的结果进行分析,从而可以确定用户访问待访问产品时进入的实际访问入口。
213,将产品访问序列中各访问步骤、实际访问入口和预设访问终点,按照各步骤的发生时间的先后顺序进行行为排序,生成用户行为路径。
当在用户进入的所有的访问入口中,匹配到用户进入的实际访问入口后,将用户在整个访问业务执行过程中的各行为进行排序,即将所得到的产品访问序列中各访问步骤、实际访问入口和访问终点按照各行为发生的发生时间的先后顺序进行排序,形成用户行为路径。并且,由于每个用户进入的实际访问入口不同,产品访问序列中各访问步骤不同,所以对各访问步骤按照时间先后顺序进行行为排序时,都会对应生成各用户的用户行为路径。
在本发明实施例中,通过对待访问产品和各访问步骤进行重要性筛选,去除了冗余且不重要的数据,从而提高了用户行为路径的生成效率,节约了时间成本。
请参阅图3,本发明实施例中用户行为路径提取方法的第三个实施例包括:
301,基于预设的各产品的重要性权重,对所有产品的重要性权重与预设重要性阈值进行比较;
在网络页面设置待访问产品之前,先对所有产品进行了重要性权重的设定,即对所有的产品都对应设置了不同的权重值。并且预设了重要性阈值,将所有产品对应的权重值与重要性阈值进行比较,确定各产品的重要性,即对所有产品的权重值与重要性阈值进行数值比较,根据比较的结果判断该产品的重要性高低。
302,基于比较的结果,对所有产品进行重要性筛选,得到待访问产品;
当比较的结果为,该产品对应的权重值不小于重要性阈值时,则认为该产品的重要性较高,因此可以将它作为待访问产品,当该产品对应的权重值小于预设的重要性阈值时,将该产品作为不重要的产品,由此可以根据权重值与重要性阈值的数值比较结果,对所有产品进行重要性筛选,得到待访问产品。在本实施例中,对所有产品进行重要性筛选不是说将筛选出的重要性较高的产品进行展示和访问,所有的产品都可以被展示和被访问,但是重要性较高的产品被用户访问时,该行为数据会被记录,即对产品进行重要性的筛选其实是对用户的行为数据的记录进行限定,有效减少数据冗余,筛选去掉不重要的数据,方便后续对用户行为路径提取。
303,提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问待访问产品的各访问步骤,形成用户访问记录;
用户从进入访问入口开始直至到达访问终点,用户访问所述待访问产品的所有访问步骤都会被客户端进行记录,即客户端后台记录有用户开始执行访问业务至结束该业务的所有的行为数据。当访问用户为多个用户时,提取在用户进入任意预设访问入口后至到达预设访问终点前的各步骤,即提取用户访问待访问产品的各步骤,然后对各步骤的具体行为数据进行记录,形成多个用户访问记录。
304,提取用户访问记录中各待访问产品的访问频次;
用户访问记录包含有用户访问待访问产品时的各步骤和与其对应的行为数据,该行为数据包含有对待访问产品的访问频次,即用户访问该产品时具体的访问次数,从多个用户访问记录中提取各待访问产品对应的访问频次。
305,基于各待访问产品的访问频次,将用户访问记录转换为访问矩阵数组;
当得到各待访问产品对应的访问频次之后,将多个用户访问记录转换为访问矩阵数组。具体的,将待访问产品与访问频次进行对应,然后对待访问产品进行编号,将各待访问产品对应的访问频次按照产品对应的编号顺序进行排序,形成一个一维数组,即频次数组。
306,基于各待访问产品的重要性权重,将访问矩阵数组转换为访问矩阵;
在对各待访问产品进行访问前,预先对所有的产品都进行了重要性权重的设置。提取各待访问产品的重要性权重值,根据各待访问产品的编号进行排序,形成一维数组,即权重值数组,然后再根据由待访问产品对应的访问频次生成的频次数组,根据预设的矩阵转换规则,将这两个数组合并进行矩阵转换,由两个一维数组转换为一个矩阵,得到访问矩阵。
307,基于访问矩阵,对用户访问记录中的各访问步骤进行分析,得到中间访问步骤;
当得到访问矩阵之后,根据矩阵数据分析法,对该访问矩阵中的各数据进行数据分析,然后再结合矩阵中各数据对应的用户访问记录中各访问步骤对各访问步骤进行重要性筛选,将访问频次较高、重要性权重值较大的访问步骤作为用户访问的中间访问步骤,对所有的访问步骤都进行分析,从而筛选出每个用户的中间访问步骤,其中,中间访问步骤中至少包含一个访问步骤。
308,记录中间访问步骤中各访问步骤的发生时间;
309,提取中间访问步骤中的各访问步骤,按照各访问步骤对应的发生时间的先后顺序进行排序,形成产品访问序列;
310,记录用户进入任意访问入口的时刻,得到至少一个第一时刻;
311,记录用户到达访问终点的时刻,得到第二时刻;
312,分别计算至少一个第一时刻与第二时刻的时间差,得到至少一个时间差值;
313,对至少一个时间差值与预设时间差阈值进行比较;
314,基于比较的结果,确定用户访问待访问产品时进入的实际访问入口;
315,将产品访问序列中各访问步骤、实际访问入口和预设访问终点,按照各步骤的发生时间的先后顺序进行行为排序,生成用户行为路径。
在本发明实施例中,步骤308-315与上述的用户行为路径提取方法的第二个实施例中的步骤206-213一致,在此不做赘述。
在本发明实施例中,通过将待访问产品的访问频次转换为访问矩阵对中间访问步骤进行分析确定,并对用户进入任意访问入口的时间与用户到达访问终点的时间进行时间差计算,从而匹配实际访问入口,使得生成的用户行为路径更加准确。
请参阅图4,本发明实施例中用户行为路径提取方法的第四个实施例包括:
401,获取用户访问待访问产品时的中间访问步骤及其对应的发生时间;
在本实施例中,用户可以从网络页面的任意一个访问入口进入,访问浏览该网络页面和该网络页面内的各产品,且在此过程中可能会发生各种各样的用户行为,当用户到达该网络页面设置的访问终点时,自动结束该访问业务,即当用户从访问入口进入,对产品进行访问,最后到达访问终点的整个过程视为一个访问业务的执行过程。对该用户的整个用户行为路径进行分析,有助于对产品和页面设计进行改善,提高监测和优化各模块的转化率。在本实施例中,对产品进行访问也可以理解为是在网络页面中发生某些行为事件,即用户的行为数据的获取并不仅仅只是对产品进行访问而产生的,在本实施例中,引入产品概念,将用户行为与产品访问进行结合是为了方便对实施例进行说明,但本实施例并不对用户行为的发生过程进行限定。
具体的,假设该网络页面是购物网站的页面,当用户在浏览购物网站时,从购物网站中设置的任意一个访问入口进入,可以对该购物网站上的任意产品进行浏览,当到达该购物网站设置的访问终点时,结束访问。其中,可以设置访问入口为该购物网站的产品推荐页面或产品搜索页面,当用户从产品推荐页面点击某一产品跳转到产品详情页面时,就相当于是已经从访问入口进入,实现执行访问待访问产品的步骤。当访问入口为产品搜索页面时,亦同理,当用户从产品搜索页面搜索产品之后,点击搜索结果跳转到产品详情面时,就已经是从访问入口进入,可以访问待访问产品。当用户到达预设的访问终点时,就完成了访问任务,其中,访问终点在此不做限定,可以根据实际业务情况进行设定,例如,可以设定购物网站的访问终点为购买,即当用户发生购买行为时,该访问业务执行完毕。
402,提取中间访问步骤中的各访问步骤,按照各访问步骤对应的发生时间的先后顺序进行排序,形成产品访问序列;
在获取到用户访问待访问产品时的所有中间访问步骤和及其对应的发生时间之后,提取中间访问步骤中的各访问步骤,然后按照各步骤对应的发生时间的先后顺序,对中间访问步骤中的各个访问步骤进行行为排序,形成以发生时间为节点的各访问步骤的访问序列,作为产品访问序列。
例如,对某用户的中间访问步骤中各访问步骤进行排序后,生成的产品访问序列为:选择产品关键词-点击待选产品-添加产品到购物车。每个用户在进入预设访问入口对待访问产品进行访问时的各访问步骤不同,且各访问步骤发生的时间不同,所以每个用户的中间访问步骤在经过排序之后都会生成每个用户对应的产品访问序列。
403,计算用户进入访问入口和到达访问终点的时间差值,并根据时间差值,从用户进入的所有访问入口中匹配实际访问入口;
在用户进入任意访问入口时,记录用户进入该访问入口的发生时间,当用户到达预设的访问终点时,记录用户到达该访问终点的时间,其中,预设的访问入口有多个,而预设访问终点只有一个。在整个访问业务的执行过程中,用户可以从任意一个访问入口进入,且用户可以多次进入不同的访问入口,即用户进入同一访问入口的次数可以为多次,且访问入口并不限定为只能选择其中一个访问入口,则在整个访问业务的执行过程中,用户可以选择至少一个访问入口进入,无论从哪个访问入口进入,当到达访问终点时,表明该访问业务执行完毕。所以记录用户进入预设访问入口时,可以得到记录进入访问入口时的至少一个时间点。当用户到达该访问终点时,记录该行为发生的时间点,由此,将进入访问入口的时间和到达访问终点的时间进行时间差运算,即计算每一个进入访问入口的发生时间和到达访问终点的发生时间的时间差值,并根据该时间差值,从用户进入的多个访问入口中匹配出实际访问入口,即从多个用户进入的访问入口中筛选出用户完成整个访问业务的实际访问入口。
404,将产品访问序列中各访问步骤、实际访问入口和预设访问终点,按照各步骤的发生时间的先后顺序进行行为排序,生成用户行为路径。
当在用户进入的所有的访问入口中,匹配到用户进入的实际访问入口后,将用户在整个访问业务执行过程中的各行为进行排序,即将所得到的产品访问序列中各访问步骤、实际访问入口和访问终点按照各行为发生的发生时间的先后顺序进行排序,形成用户行为路径。并且,由于每个用户进入的实际访问入口不同,产品访问序列中各访问步骤不同,所以对各访问步骤按照时间先后顺序进行行为排序时,都会对应生成各用户的用户行为路径。
405,对各待访问产品的访问频次进行监控;
406,检测待访问产品的访问频次是否大于预设产品访问频次阈值;
407,若待访问产品的访问频次大于预设产品访问频次阈值,则增加对应的待访问产品的访问入口;
当用户对待访问产品进行访问时,对各待访问产品的访问频次进行记录并监控,该访问频次不区分具体用户,即该访问频次既包含同一用户访问该待访问产品的访问频次,也包含不同用户访问待访问产品的访问频次。并对该待访问产品的访问频次与预设的产品访问频次阈值进行比较,检测待访问产品的访问频次是否有超过预设的产品访问频次阈值。若待访问产品对应的访问频次大于预设的产品访问频次阈值时,说明该待访问产品的访问量超过预期,因此可以增加对应的访问入口,方便用户对该待访问产品进行访问。
408,和/或,对各访问入口的访问频次进行监控;
409,检测访问入口的访问频次是否小于预设入口访问频次阈值;
410,若访问入口的访问频次小于预设入口访问频次阈值,则剔除相应的访问入口。
当用户进入任意一个预设访问入口对待访问产品进行访问时,对访问入口的访问频次进行记录并监控,该访问频次不区分具体用户,即该访问频次既包含同一用户进入该访问入口的访问频次,也包含不同用户进入该访问入口的访问频次。并对该访问入口的访问频次与预设的入口访问频次阈值进行比较,检测访问入口的访问频次是否小于预设的入口访问频次阈值。若访问入口对应的访问频次小于预设的入口访问频次阈值时,说明该访问入口的访问量没有达到预期标准,因此可以剔除对应的访问入口,对运营进行优化。
在本发明实施例中,通过对产品的访问频次和访问入口的访问频次进行监控,并将各访问频次与预设的访问频次阈值进行比较,根据比较的结果做出相应的处理,能够对运营进行优化,减少数据冗余,从而进一步提高用户行为路径生成的准确度。
上面对本发明实施例中的用户行为路径提取方法进行了描述,下面对本发明实施例中的用户行为路径提取装置进行描述,请参照图5,本发明实施例中的用户行为路径提取装置的一个实施例包括:
获取模块501,用于获取用户访问待访问产品时的中间访问步骤及其对应的发生时间;
排序模块502,用于提取所述中间访问步骤中的各访问步骤,按照各所述访问步骤对应的发生时间的先后顺序进行排序,形成产品访问序列;
计算模块503,用于计算用户进入所述访问入口和到达所述访问终点的时间差值,并根据所述时间差值,从用户进入的所有所述访问入口中匹配实际访问入口;
生成模块504,用于将所述产品访问序列中各访问步骤、实际访问入口和预设访问终点,按照各步骤的发生时间的先后顺序进行行为排序,生成用户行为路径。
本发明实施例,通过上述装置运行用户行为路径提取方法的步骤,能够清楚且准确地生成用户行为路径,提高了用户行为路径的生成效率和精准度,节约了时间成本。
请参阅图6,本发明实施例中的用户行为路径提取装置的另一个实施例包括:
获取模块501,用于获取用户访问待访问产品时的中间访问步骤及其对应的发生时间;
排序模块502,用于提取所述中间访问步骤中的各访问步骤,按照各所述访问步骤对应的发生时间的先后顺序进行排序,形成产品访问序列;
计算模块503,用于计算用户进入所述访问入口和到达所述访问终点的时间差值,并根据所述时间差值,从用户进入的所有所述访问入口中匹配实际访问入口;
生成模块504,用于将所述产品访问序列中各访问步骤、实际访问入口和预设访问终点,按照各步骤的发生时间的先后顺序进行行为排序,生成用户行为路径。
可选的,所述获取模块501包括:
产品获取单元5011,用于获取待访问产品;
步骤提取单元5012,用于提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问所述待访问产品的所有访问步骤,得到中间访问步骤;
记录单元5013,用于记录所述中间访问步骤中各访问步骤的发生时间。
可选的,所述产品获取单元5011具体用于:
基于预设的各产品的重要性权重,对所有产品的重要性权重与预设重要性阈值进行比较;
基于比较的结果,对所有产品进行重要性筛选,得到待访问产品。
可选的,所述步骤提取单元5012具体用于:
提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问待访问产品的各访问步骤;
基于预设的访问步骤的重要性权重,对各所述访问步骤的重要性权重和预设重要性阈值进行比较;
基于比较的结果,对各所述访问步骤进行重要性筛选,得到中间访问步骤。
可选的,所述步骤提取单元5012具体用于:
提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问待访问产品的各访问步骤,形成用户访问记录;
提取所述用户访问记录中各所述待访问产品的访问频次;
基于各所述待访问产品的访问频次,将所述用户访问记录转换为访问矩阵数组;
基于各所述待访问产品的重要性权重,将所述访问矩阵数组转换为访问矩阵;
基于所述访问矩阵,对所述用户访问记录中的各访问步骤进行分析,得到中间访问步骤。
可选的,所述计算模块503具体用于:
记录用户进入任意所述预设访问入口的时刻,得到至少一个第一时刻;
记录用户到达所述业务终点的时刻,得到第二时刻;
分别计算至少一个所述第一时刻与所述第二时刻的时间差,得到至少一个时间差值;
对至少一个所述时间差值与预设时间差阈值进行比较;
基于比较的结果,确定用户访问所述待访问产品时进入的实际访问入口。
可选的,所述用户行为路径提取装置还包括监控模块505,所述监控模块505具体用于:
对各所述待访问产品的访问频次进行监控;检测所述待访问产品的访问频次是否超过预设产品访问阈值;若是,则增加对应的待访问产品的访问入口;
和/或,
对各所述访问入口的访问频次进行监控;检测所述访问入口的访问频次是否小于预设入口访问阈值;若是,则剔除相应的访问入口。
在本发明实施例中,运行该装置对产品和访问步骤进行重要性筛选,去除不重要的数据,提高用户行为路径的生成效率,并对各待访问产品和访问入口的访问频次进行监控,优化运营,从而提高了用户行为路径生成的准确度。
请参阅图7,下面从硬件处理的角度对本发明实施例中的用户行为路径提取设备的一个实施例进行详细描述。
图7是本发明实施例提供的一种用户行为路径提取设备的结构示意图,该用户行为路径提取设备700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)710(例如,一个或一个以上处理器)和存储器720,一个或一个以上存储应用程序733或数据732的存储介质730(例如一个或一个以上海量存储设备)。其中,存储器720和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对用户行为路径提取设备700中的一系列指令操作。更进一步地,处理器710可以设置为与存储介质730通信,在用户行为路径提取设备700上执行存储介质730中的一系列指令操作。
用户行为路径提取设备700还可以包括一个或一个以上电源740,一个或一个以上有线或无线网络接口750,一个或一个以上输入输出接口760,和/或,一个或一个以上操作系统731,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图7示出的用户行为路径提取设备结构并不构成对用户行为路径提取设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述用户行为路径提取方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种用户行为路径提取方法,其特征在于,所述用户行为路径提取方法包括:
获取用户访问待访问产品时的中间访问步骤及其对应的发生时间,其中,所述中间访问步骤为进入任意预设访问入口后至到达预设访问终点前的所有访问步骤;
提取所述中间访问步骤中的各访问步骤,按照各所述访问步骤对应的发生时间的先后顺序进行排序,形成产品访问序列;
计算用户进入所述访问入口和到达所述访问终点的时间差值,并根据所述时间差值,从用户进入的所有所述访问入口中匹配实际访问入口,所述预设访问入口有多个,所述预设访问终点只有一个,所述匹配实际访问入口的过程包括:根据访问业务执行过程和入口路径估计需限制的时间范围内,用户的到达访问终点的时间和各个访问入口的访问时间进行时间差运算,取时间差值最小的访问入口作为实际访问入口;
将所述产品访问序列中各访问步骤、实际访问入口和预设访问终点,按照各步骤的发生时间的先后顺序进行行为排序,生成用户行为路径。
2.根据权利要求1所述的用户行为路径提取方法,其特征在于,所述获取用户访问待访问产品时的中间访问步骤及其对应的发生时间包括:
获取待访问产品,其中,所述待访问产品至少为一个;
提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问所述待访问产品的所有访问步骤,得到中间访问步骤;
记录所述中间访问步骤中各访问步骤的发生时间。
3.根据权利要求2所述的用户行为路径提取方法,其特征在于,所述获取待访问产品包括:
基于预设的各产品的重要性权重,对所有产品的重要性权重与预设重要性阈值进行比较;
基于比较的结果,对所有产品进行重要性筛选,得到待访问产品。
4.根据权利要求3所述的用户行为路径提取方法,其特征在于,所述提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问所述待访问产品的所有访问步骤,得到中间访问步骤包括:
提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问待访问产品的各访问步骤;
基于预设的访问步骤的重要性权重,对各所述访问步骤的重要性权重和预设重要性阈值进行比较;
基于比较的结果,对各所述访问步骤进行重要性筛选,得到中间访问步骤。
5.根据权利要求3所述的用户行为路径提取方法,其特征在于,所述提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问所述待访问产品的所有访问步骤,得到中间访问步骤包括:
提取用户在进入任意预设访问入口后至到达预设访问终点之间,用户访问待访问产品的各访问步骤,形成用户访问记录;
提取所述用户访问记录中各所述待访问产品的访问频次;
基于各所述待访问产品的访问频次,将所述用户访问记录转换为访问矩阵数组;
基于各所述待访问产品的重要性权重,将所述访问矩阵数组转换为访问矩阵;
基于所述访问矩阵,对所述用户访问记录中的各访问步骤进行分析,得到中间访问步骤。
6.根据权利要求1-5中任一项所述的用户行为路径提取方法,其特征在于,所述计算用户进入所述访问入口和到达所述访问终点的时间差值,并根据所述时间差值,从用户进入的所有所述访问入口中匹配实际访问入口包括:
记录用户进入任意所述预设访问入口的时刻,得到至少一个第一时刻;
记录用户到达所述访问终点的时刻,得到第二时刻;
分别计算至少一个所述第一时刻与所述第二时刻的时间差,得到至少一个时间差值;
对至少一个所述时间差值与预设时间差阈值进行比较;
基于比较的结果,确定用户访问所述待访问产品时进入的实际访问入口。
7.根据权利要求6所述的用户行为路径提取方法,其特征在于,在所述将所述产品访问序列中各访问步骤、实际访问入口和预设访问终点,按照各步骤的发生时间的先后顺序进行行为排序,生成用户行为路径之后,还包括:
对各所述待访问产品的访问频次进行监控;检测所述待访问产品的访问频次是否超过预设产品访问阈值;若是,则增加对应的待访问产品的访问入口;
和/或,
对各所述访问入口的访问频次进行监控;检测所述访问入口的访问频次是否小于预设入口访问阈值;若是,则剔除相应的访问入口。
8.一种用户行为路径提取装置,其特征在于,所述用户行为路径提取装置包括:
获取模块,用于获取用户访问待访问产品时的中间访问步骤及其对应的发生时间,其中,所述中间访问步骤为进入任意预设访问入口后至到达预设访问终点前的所有访问步骤;
排序模块,用于提取所述中间访问步骤中的各访问步骤,按照各所述访问步骤对应的发生时间的先后顺序进行排序,形成产品访问序列;
计算模块,用于计算用户进入所述访问入口和到达所述访问终点的时间差值,并根据所述时间差值,从用户进入的所有所述访问入口中匹配实际访问入口,所述预设访问入口有多个,所述预设访问终点只有一个,所述匹配实际访问入口的过程包括:根据访问业务执行过程和入口路径估计需限制的时间范围内,用户的到达访问终点的时间和各个访问入口的访问时间进行时间差运算,取时间差值最小的访问入口作为实际访问入口;
生成模块,用于将所述产品访问序列中各访问步骤、实际访问入口和预设访问终点,按照各步骤的发生时间的先后顺序进行行为排序,生成用户行为路径。
9.一种用户行为路径提取设备,其特征在于,所述用户行为路径提取设备包括:
存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述用户行为路径提取设备执行如权利要求1-7中任一项所述的用户行为路径提取方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-7中任一项所述的用户行为路径提取方法的步骤。
CN202110484017.9A 2021-04-30 2021-04-30 用户行为路径提取方法、装置、设备及存储介质 Active CN113127742B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110484017.9A CN113127742B (zh) 2021-04-30 2021-04-30 用户行为路径提取方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110484017.9A CN113127742B (zh) 2021-04-30 2021-04-30 用户行为路径提取方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113127742A CN113127742A (zh) 2021-07-16
CN113127742B true CN113127742B (zh) 2023-10-20

Family

ID=76780776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110484017.9A Active CN113127742B (zh) 2021-04-30 2021-04-30 用户行为路径提取方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113127742B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101373485A (zh) * 2008-09-25 2009-02-25 北京搜狗科技发展有限公司 提供网页访问入口的方法及装置
CN104252459A (zh) * 2013-06-25 2014-12-31 腾讯科技(深圳)有限公司 推荐常用站点的方法和装置
CN108874909A (zh) * 2018-05-28 2018-11-23 深圳壹账通智能科技有限公司 用户访问路径获取方法、服务器及计算机存储介质
CN109446038A (zh) * 2018-09-03 2019-03-08 平安普惠企业管理有限公司 页面访问时长的统计方法及终端设备
CN110020074A (zh) * 2017-10-13 2019-07-16 北京国双科技有限公司 确定网页流失率的方法及装置
CN112632446A (zh) * 2020-12-30 2021-04-09 江苏苏宁云计算有限公司 页面访问路径的构建方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101373485A (zh) * 2008-09-25 2009-02-25 北京搜狗科技发展有限公司 提供网页访问入口的方法及装置
CN104252459A (zh) * 2013-06-25 2014-12-31 腾讯科技(深圳)有限公司 推荐常用站点的方法和装置
CN110020074A (zh) * 2017-10-13 2019-07-16 北京国双科技有限公司 确定网页流失率的方法及装置
CN108874909A (zh) * 2018-05-28 2018-11-23 深圳壹账通智能科技有限公司 用户访问路径获取方法、服务器及计算机存储介质
CN109446038A (zh) * 2018-09-03 2019-03-08 平安普惠企业管理有限公司 页面访问时长的统计方法及终端设备
CN112632446A (zh) * 2020-12-30 2021-04-09 江苏苏宁云计算有限公司 页面访问路径的构建方法及系统

Also Published As

Publication number Publication date
CN113127742A (zh) 2021-07-16

Similar Documents

Publication Publication Date Title
US11710054B2 (en) Information recommendation method, apparatus, and server based on user data in an online forum
US10789311B2 (en) Method and device for selecting data content to be pushed to terminal, and non-transitory computer storage medium
EP3239855A1 (en) Analysis and collection system for user interest data and method therefor
US9135351B2 (en) Data processing method and distributed processing system
US20160364488A1 (en) Microblog-based event context acquiring method and system
US10229160B2 (en) Search results based on a search history
US20090063461A1 (en) User query mining for advertising matching
US20220027389A1 (en) Identifier Association Method and Apparatus, and Electronic Device
CN108156141B (zh) 一种实时数据识别方法、装置及电子设备
US8639559B2 (en) Brand analysis using interactions with search result items
CN108600172A (zh) 撞库攻击检测方法、装置、设备及计算机可读存储介质
CN114817746A (zh) 保险产品推荐方法、装置、设备及存储介质
JP2014006757A (ja) コンテンツ配信装置
US20160055520A1 (en) Method and a system for analysing traffic on a website by means of path analysis
US20150242267A1 (en) Detection and restoration of erroneous data
KR20180075234A (ko) 컨텐츠에 대한 유입검색어 및 연관검색어 기반의 컨텐츠 추천방법 및 추천장치
US20200380376A1 (en) Artificial Intelligence Based System And Method For Predicting And Preventing Illicit Behavior
CN106557483B (zh) 一种数据处理、数据查询方法及设备
CN113127742B (zh) 用户行为路径提取方法、装置、设备及存储介质
CN103605746A (zh) 获取访客质量的方法、装置及系统
KR101879829B1 (ko) 클릭 로그 데이터를 이용하여 이상 사용자를 검출하는 방법 및 장치
CN107085544B (zh) 一种系统错误定位方法及装置
US11290384B2 (en) Access origin classification apparatus, access origin classification method and program
CN111858285A (zh) 视频操作行为的异常识别方法、装置、服务器及存储介质
CN111124846B (zh) 在线定位时长的统计方法及装置、定位服务系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant