CN111913921A - 用户行为分析方法及装置、设备及存储介质 - Google Patents
用户行为分析方法及装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111913921A CN111913921A CN201910381203.2A CN201910381203A CN111913921A CN 111913921 A CN111913921 A CN 111913921A CN 201910381203 A CN201910381203 A CN 201910381203A CN 111913921 A CN111913921 A CN 111913921A
- Authority
- CN
- China
- Prior art keywords
- service
- data
- user
- analyzed
- behavior analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 128
- 238000003860 storage Methods 0.000 title claims abstract description 27
- 238000000034 method Methods 0.000 claims abstract description 56
- 230000006399 behavior Effects 0.000 claims description 118
- 239000013598 vector Substances 0.000 claims description 106
- 238000012549 training Methods 0.000 claims description 54
- 230000015654 memory Effects 0.000 claims description 27
- 238000000605 extraction Methods 0.000 claims description 18
- 230000004927 fusion Effects 0.000 claims description 5
- 238000002372 labelling Methods 0.000 claims description 2
- 230000003068 static effect Effects 0.000 description 28
- 230000008569 process Effects 0.000 description 23
- 230000001960 triggered effect Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 238000004590 computer program Methods 0.000 description 9
- 230000006872 improvement Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004141 dimensional analysis Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/1805—Append-only file systems, e.g. using logs or journals to store data
- G06F16/1815—Journaling file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Entrepreneurship & Innovation (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供了一种用户行为分析方法及装置、设备和存储介质。其中方法包括:获取待分析用户当前操作的界面操作数据和后台日志数据;将当前操作的界面操作数据和后台日志数据进行融合,以得到待处理服务操作数据;根据待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定待分析用户下一步操作的意向服务。本申请实施例能够准确、有效且真实的确定待分析用户下一步操作的意向服务,同时也提高了确定待分析用户下一步操作的意向服务的效率。
Description
技术领域
本说明书涉及计算机技术领域,尤其涉及一种用户行为分析方法及装置、设备和存储介质。
背景技术
随着互联网技术的大力发展,用户与各种业务系统的交互也越来越频繁,因此,提升用户使用业务系统的用户体验已经成为业务系统优化过程中考量的主要因素之一。
目前,由于在用户与业务系统的交互过程中会产生日志数据,因此,可以根据用户与业务系统交互过程中产生的日志数据并结合遍历统计、关联分析等方式分析用户的行为,以优化业务系统,进而提升用户体验。
然而,由于上述方式中存在用于分析用户行为的日志数据质量较低的问题,因此很难准确且有效的分析用户行为。
发明内容
本说明书一个或多个实施例的目的是提供一种用户行为分析方法及装置、设备和存储介质,用以解决现有技术中很难准确且有效的分析用户行为的问题。
为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
一方面,本说明书一个或多个实施例提供一种用户行为分析方法,包括:
获取待分析用户当前操作的界面操作数据和后台日志数据;
将所述当前操作的界面操作数据和后台日志数据进行融合,以得到待处理服务操作数据;
根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
可选的,所述方法还包括:
获取所述待分析用户在预设时间段内的界面操作轨迹数据和后台日志数据;
将所述界面操作轨迹数据和后台日志数据进行融合,以得到服务操作链数据;
将所述服务操作链数据中的每个服务操作数据分别用与其相邻且位于其后的服务操作数据中的服务名称进行标记,以得到训练样本数据;
根据所述训练样本数据对所述时间序列模型进行训练,以得到所述行为分析模型。
可选的,所述将所述服务操作链数据中的每个服务操作数据分别用与其相邻且位于其后的服务操作数据中的服务名称进行标记,以得到训练样本数据包括:
对所述服务操作链数据中的每个服务操作数据进行特征提取,以得到每个所述服务操作数据的服务特征向量;
根据每个所述服务操作数据在所述服务操作链数据中的先后顺序,确定对应的每个所述服务特征向量的先后顺序;
将每个所述服务特征向量用与其相邻且在其后的所述服务特征向量中的服务名称进行标记,以得到训练样本数据。
可选的,所述根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务包括:
对所述待处理服务操作数据进行特征提取,以得到待处理服务特征向量;
根据所述待处理服务特征向量并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
可选的,所述根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务包括:
将所述待处理服务操作数据输入一由时间序列模型构建的行为分析模型,以输出所述待分析用户下一步操作针对每个服务的意向概率;
根据所述待分析用户下一步操作针对每个服务的意向概率,确定所述待分析用户下一步操作的意向服务。
可选的,所述根据所述待分析用户下一步操作针对每个服务的意向概率,确定所述待分析用户下一步操作的意向服务包括:
根据所述待分析用户下一步操作针对每个服务的意向概率,将所述意向概率最大的服务确定为第一服务,以及将所述意向概率仅小于所述第一服务的意向概率的服务确定为第二服务;
判断所述第一服务的意向概率是否大于一预设概率且所述第一服务与所述第二服务的意向概率差是否大于一预设概率差;
若是,则将所述第一服务确定为所述待分析用户下一步操作的意向服务。
可选的,所述方法还包括:
加载与所述意向服务相关的数据。
另一方面,本说明书一个或多个实施例提供一种用户行为分析装置,包括:
第一获取模块,用于获取待分析用户当前操作的界面操作数据和后台日志数据;
第一融合模块,用于将所述当前操作的界面操作数据和后台日志数据进行融合,以得到待处理服务操作数据;
分析模块,用于根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
可选的,所述装置还包括:
第二获取模块,用于获取所述待分析用户在预设时间段内的界面操作轨迹数据和后台日志数据;
第二融合模块,用于将所述界面操作轨迹数据和后台日志数据进行融合,以得到服务操作链数据;
标记模块,用于将所述服务操作链数据中的每个服务操作数据分别用与其相邻且位于其后的服务操作数据中的服务名称进行标记,以得到训练样本数据;
训练模块,用于根据所述训练样本数据对所述时间序列模型进行训练,以得到所述行为分析模型。
可选的,所述标记模块包括:
第一提取单元,用于对所述服务操作链数据中的每个服务操作数据进行特征提取,以得到每个所述服务操作数据的服务特征向量;
第一确定单元,用于根据每个所述服务操作数据在所述服务操作链数据中的先后顺序,确定对应的每个所述服务特征向量的先后顺序;
标记单元,用于将每个所述服务特征向量用与其相邻且在其后的所述服务特征向量中的服务名称进行标记,以得到训练样本数据。
可选的,所述分析模块包括:
第二提取单元,用于对所述待处理服务操作数据进行特征提取,以得到待处理服务特征向量;
分析单元,用于根据所述待处理服务特征向量并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
可选的,所述分析模块包括:
输入单元,用于将所述待处理服务操作数据输入一由时间序列模型构建的行为分析模型,以输出所述待分析用户下一步操作针对每个服务的意向概率;
第二确定单元,用于根据所述待分析用户下一步操作针对每个服务的意向概率,确定所述待分析用户下一步操作的意向服务。
可选的,所述第二确定单元包括:
第一确定子单元,用于根据所述待分析用户下一步操作针对每个服务的意向概率,将所述意向概率最大的服务确定为第一服务,以及将所述意向概率仅小于所述第一服务的意向概率的服务确定为第二服务;
判断子单元,用于判断所述第一服务的意向概率是否大于一预设概率且所述第一服务与所述第二服务的意向概率差是否大于一预设概率差;
第二确定子单元,用于若是,则将所述第一服务确定为所述待分析用户下一步操作的意向服务。
可选的,所述装置还包括:
加载模块,用于加载与所述意向服务相关的数据。
再一方面,本说明书一个或多个实施例提供一种用户行为分析设备,其特征在于,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:
获取待分析用户当前操作的界面操作数据和后台日志数据;
将所述当前操作的界面操作数据和后台日志数据进行融合,以得到待处理服务操作数据;
根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
再一方面,本说明书一个或多个实施例提供一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被执行时实现以下流程:
获取待分析用户当前操作的界面操作数据和后台日志数据;
将所述当前操作的界面操作数据和后台日志数据进行融合,以得到待处理服务操作数据;
根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
采用本说明书一个或多个实施例的技术方案,通过将待分析用户当前操作的界面操作数据和后台日志数据进行融合,以得到待处理服务操作数据,以及根据待处理服务操作数据并基于由时间序列模型构建的行为分析模型,确定待分析用户下一步操作的意向服务。一方面,由于确定待分析用户下一步操作的意向服务的待处理服务操作数据由待分析用户当前操作的界面操作数据和后台日志数据融合得到,使得用于分析待分析用户下一步操作的意向服务的数据更加全面和广泛,提高了用于分析待分析用户下一步操作的意向服务的数据质量,从而能够准确、有效且真实的确定待分析用户下一步操作的意向服务(即用户行为);另一方面,由于仅通过对当前操作的界面操作数据和后台日志数据进行融合并结合分析模型即可确定待分析用户下一步操作的意向服务,步骤简单且易于执行,提高了确定待分析用户下一步操作的意向服务的效率。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的用户行为分析方法的流程示意图;
图2为本申请实施例提供的构建行为分析模型的流程示意图;
图3为本申请实施例提供的另一种构建行为分析模型的流程示意图;
图4为本申请实施例提供的用户行为分析装置的组成示意图;
图5为本申请实施例提供的用户行为分析设备的结构示意图。
具体实施方式
本说明书一个或多个实施例提供一种用户行为分析方法及装置、设备和存储介质,用以解决现有技术中很难准确且有效的分析用户行为的问题。
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书一个或多个实施例保护的范围。
本申请实施例提供了一种用户行为分析方法,图1为本申请实施例提供的用户行为分析方法的流程示意图,该用户行为分析方法的执行主体例如可以为终端设备或者服务器,其中,终端设备例如可以包括个人计算机等,服务器例如可以为独立的一个服务器,也可以为由多个服务器组成的服务器集群,本示例性实施例对此不做特殊限定。如图1所示,该方法可以包括以下步骤:
步骤S110、获取待分析用户当前操作的界面操作数据和后台日志数据。
在本申请实施例中,若待分析用户在业务系统的界面上操作时,获取待分析用户当前操作的界面操作数据。具体的,获取待分析用户当前操作的界面操作数据的过程可以包括:提前采用无痕埋点技术在界面中通过统一规则自动布点,在待分析用户在界面上操作时,通过提前部署的点获取待分析用户当前操作的界面操作数据。
当前操作的界面操作数据例如可以包括:操作时间、操作流水号、待分析用户触发的界面静态元素的功能代码、待分析用户触发的界面静态元素的信息(例如,界面静态元素的名称、在界面中的坐标、输入属性等)、待分析用户的标识信息(例如,待分析用户的手机号、待分析用户的身份证号等)、待分析用户触发的界面打点信息(例如,打点位置对应的界面静态元素的名称、打点位置的坐标、触发事件、调用的服务名称等)、交易流水标识等,本示例性实施例对此不做特殊限定。
待分析用户当前操作的后台日志数据的获取过程可以包括:在待分析用户在界面中进行操作时,后台服务器会生成与当前操作相关的日志数据,因此,可以根据待分析用户在界面中的操作时间以及待分析用户的标识信息以及触发的界面静态元素的信息等,在后台服务器中获取生成的与待分析用户当前操作对应的后台日志数据。
后台日志数据例如可以包括:服务时间(即后台服务的运行时间)、客户端信息(即待分析用户当前操作的客户端的信息)、服务操作信息、操作状态信息(即用于表征是否操作成功)、待分析用户的标识信息(例如,待分析用户的手机号、待分析用户的身份证号等)等,本示例性实施例对此不做特殊限定。
步骤S120、将所述当前操作的界面操作数据和后台日志数据进行融合,以得到待处理服务操作数据。在本申请实施例中,将当前操作的界面操作数据和后台日志数据进行集合,并进行去重操作,以得到待处理服务操作数据。
步骤S130、根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
在本申请实施例中,首先对构建行为分析模型的过程进行说明,图2为本申请实施例提供的构建行为分析模型的流程示意图,如图2所示,可以包括以下步骤:
步骤S210、获取所述待分析用户在预设时间段内的界面操作轨迹数据和后台日志数据。
在本申请实施例中,由于待分析用户在界面上操作时,会将待分析用户在界面中的每一次操作的界面操作数据保存在离线缓存中,因此,可以在离线缓存中获取待分析用户在预设时间段内的每一次操作的界面操作数据,并按照每一次操作在操作时间上的先后顺序将对应的界面操作数据进行排序,即可得到待分析用户的界面操作轨迹数据;或者可以在离线缓存中获取待分析用户在预设时间段内的每一次操作的界面操作数据,然后,根据每一次操作的界面操作数据中的待分析用户触发的界面静态元素的功能代码、待分析用户触发的界面静态元素的信息,进行二维分析建模,生成基于二维网格的界面快照地图,其中该基于二维网格的界面快照地图中标识有待分析用户每一次操作触发的界面静态元素,以及根据界面快照地图以及待分析用户触发的界面静态元素的坐标,生成基于二维网格的映射表格,根据每一次操作的界面操作数据中的静态界面元素的坐标,将每一次操作的界面操作数据与基于二维网格的映射表格中的对应的界面静态元素进行关联,以及根据每一次操作在操作时间上的先后顺序,将基于二维网格的映射表格中的界面静态元素进行连接,以得到待分析用户的界面操作轨迹数据。
需要说明的是,待分析用户在预设时间段内的每一次操作的界面操作数据的定义均与上文步骤S110中待分析用户当前操作的界面操作数据的定义相同,因此此处不在对待分析用户在预设时间段内的每一次操作的界面操作数据进行赘述。
待分析用户在预设时间段内的后台日志数据的获取过程可以包括:在后台服务器中根据预设时间段以及待分析用户的标识信息获取待分析用户在预设时间段内的后台日志数据。
待分析用户在预设时间段内的后台日志数据可以包括待分析用户在预设时间段内的每一次操作的后台日志数据。由于每一次操作的后台日志数据的定义均与步骤S110中的待分析用户当前操作的后台日志数据的定义相同,因此此处不在赘述。
预设时间段可以根据需求自行设定,例如,预设时间段可以为最近一年、还可以为最近一个月,也可以为待分析用户当前操作之间的一段时间等,本示例性实施例对此不做特殊限定。
步骤S220、将所述界面操作轨迹数据和后台日志数据进行融合,以得到服务操作链数据。
在本申请实施例中,可以将界面操作轨迹数据和后台日志数据中属于同一次操作的界面操作数据和后台日志数据进行融合,以得到每一次操作的服务操作数据,按照每一次操作在操作时间上的先后顺序,将对应的服务操作数据进行排序,即可得到服务操作链数据。
步骤S230、将所述服务操作链数据中的每个服务操作数据分别用与其相邻且位于其后的服务操作数据中的服务名称进行标记,以得到训练样本数据。
在本申请实施例中,例如,若服务操作链数据中的服务操作数据的数量为1000个,且按照排列的先后顺序分别为第一服务操作数据至第一千服务操作数据,则用第二服务操作数据中的服务名称标记第一服务操作数据,同理,用第三服务操作数据中的服务名称标记第二服务操作数据,用第四服务操作数据中的服务名称标记第三服务操作数据,依次类推,分别对剩余的每个服务操作数据进行标记,将上述标记后的服务操作数据进行集合,即可得到训练样本数据。需要说明的是,服务名称的表示形式可以为服务名称的索引号,还可以为服务名称本身等,本示例性实施例对此不做特殊限定。
步骤S240、根据所述训练样本数据对所述时间序列模型进行训练,以得到所述行为分析模型。
在本申请实施例中,将训练样本数据中的每个标记后的服务操作数据分别输入至时间序列模型中,对时间序列模型进行训练,以得到时间序列模型中的各参数的数值,以及根据时间序列模型中的各参数的数值确定行为分析模型。
为了进一步提高构建的行为分析模型的精准度,可以将训练样本数据中的一部分服务操作数据(例如80%的服务操作数据)用于训练时间序列模型,即通过该部分服务操作数据对时间序列模型进行训练,以得到时间序列模型中的各参数的数值,并根据各参数的数值确定行为分析模型,将训练样本数据中剩余的服务操作数据(例如20%的服务操作数据)用于验证上述构建的行为分析模型,即将剩余的服务操作数据输入至行为分析模型中,以根据行为分析模型输出的结果判断该行为分析模型的准确度,并在准确度未达到要求时,通过训练对行为分析模型中的参数进行调整,以提高行为分析模型的准确度。
时间序列模型例如可以为LSTM(长短期记忆网络模型)、CRF(条件随机场模型)、BILSTM(双向长短期记忆网络模型)等,本示例性实施例对此不做特殊限定。时间序列模型的具体结构以及训练参数的数值根据具体需求进行设置,本示例性实施例对此不做特殊限定。例如,若时间序列模型为LSTM,该LSTM可以包括输入层、隐藏层、输出层,其中,输入层的节点的数量可以根据训练样本数据中的每组标记后的服务操作数据中的数据的数量进行确定。隐藏层的节点数为100,输出层的节点的数量为训练样本数据中标记服务操作数据的服务名称的数量,即一个用于标记服务操作数据的服务名称对应输出层中的一个节点,该LSTM模型的激活函数为relu,此外,在LSTM模型的输出层后面再接一个SoftMax层做归一化,LSTM模型的学习率(learnling rate)可以为le-3、LSTM模型的miniBatch可以为32、LSTM模型的dropout可以为0.5。
需要说明的是,为了便于训练时间序列模型,在训练时间序列模型之前,可以按照一个固定的排列顺序将服务操作链数据中的每个服务操作数据中的数据进行排列,即使每个服务操作数据均为同一个格式。例如,若每个服务操作数据包括的数据均为:待分析用户触发的界面静态元素的名称、待分析用户触发的界面静态元素的坐标、输入属性、操作时间、服务时间、操作流水号、服务名称、操作状态信息、待分析用户的标识信息,则每个服务操作数据中的数据排列后的格式可以为:操作流水号、操作时间、待分析用户触发的界面静态元素的名称、待分析用户触发的界面静态元素的坐标、输入属性、服务名称、操作状态信息、服务时间、待分析用户的标识信息。
在分析模型构建完成后,确定待分析用户下一步操作的意向服务包括:首先,将所述待处理服务操作数据输入一由时间序列模型构建的行为分析模型,以输出所述待分析用户下一步操作针对每个服务的意向概率,然后,根据所述待分析用户下一步操作针对每个服务的意向概率,确定所述待分析用户下一步操作的意向服务。
在本申请实施例中,将待分析用户的待处理服务操作数据输入行为分析模型中,行为分析模型根据待处理服务操作数据输出待分析用户下一步操作针对每一个服务的意向概率,即行为分析模型输出待分析用户下一步操作针对其输出层中的每个节点对应的服务的意向概率;然后,根据待分析用户下一步操作针对每个服务的意向概率确定待分析用户下一步操作的意向服务的方式可以包括以下三种:
第一种:根据意向概率由高到底的顺序对各服务进行排序,以及将排在第一位的服务确定为待分析用户下一步操作的意向服务;
第二种,根据意向概率由高到底的顺序对各服务进行排序,将排在前N的服务均确定为待分析用户下一步操作的意向服务。需要说明的是,N的具体取值可以自行设置,本示例性实施例对此不做特殊限定,例如,N为2或者3等。
第三种,首先,根据所述待分析用户下一步操作针对每个服务的意向概率,将所述意向概率最大的服务确定为第一服务,以及将所述意向概率仅小于所述第一服务的意向概率的服务确定为第二服务,即根据意向概率由大到小的顺序对各服务进行排序,将排在第一的服务确定为第一服务,将排在第二的服务确定为第二服务;然后,判断所述第一服务的意向概率是否大于一预设概率且所述第一服务与所述第二服务的意向概率差是否大于一预设概率差,上述预设概率和预设概率差的取值可以自行设置,本示例性实施例对此不做特殊限定,例如,预设概率可以为0.5,预设概率差可以为0.2;最后,若是,则将所述第一服务确定为所述待分析用户下一步操作的意向服务,即若第一服务的意向概率大于预设概率且第一服务和第二服务的意向概率差大于预设概率差,则将第一服务确定为待分析用户下一步操作的意向服务,若第一服务的意向概率小于预设概率和/或第一服务和第二服务的意向概率差小于预设概率差,则可以返回空,即无法确定待分析用户下一步操作的意向服务。
由上可知,相比于第一种和第二种方式,由于第三种方式在确定第一服务的意向概率足够大,且第一服务的意向概率与第二服务的意向概率的差值足够大时,将第一服务确定为待分析用户下一步操作的意向服务,即对概率最大的服务进行了验证,提高了确定待分析用户下一步操作的意向服务的准确率。
需要说明的是,上述三种方式仅为示例性的,并不用于限定本发明。
进一步的,为了更进一步的提高行为分析模型的精准度,从而进一步的提高确定待分析用户下一步操作的意向服务的准确率。本申请实施例还提供了另一种构建行为分析模型的方式,图3为本申请实施例提供的另一种构建行为分析模型的流程示意图,如图3所示,构建行为分析模型的过程可以包括以下步骤:
步骤S310、获取所述待分析用户在预设时间段内的界面操作轨迹数据和后台日志数据。由于该步骤已经在上文中进行了说明,因此此处不在赘述。
步骤S320、将所述界面操作轨迹数据和后台日志数据进行融合,以得到服务操作链数据。由于该步骤已经在上文中进行了说明,因此此处不在赘述。
步骤S330、对所述服务操作链数据中的每个服务操作数据进行特征提取,以得到每个所述服务操作数据的服务特征向量。
在本申请实施例中,对服务操作链数据中的一个服务操作数据进行特征提取,以得到该服务操作数据的服务特征向量的过程可以包括:对该服务操作数据中的每个类型的数据分别进行特征提取,以得到该服务操作数据中的每个类型的数据的特征分向量,将该服务操作数据中的每个类型的数据的特征分向量按照预设顺序首尾相连,以得到该服务操作数据的服务特征向量。此外,还可以用待分析用户的标识信息对服务特征向量进行标记,以对服务特征向量所属的用户进行区分。
需要说明的是,由于对服务操作链数据中的每个服务操作数据进行特征提取的原理相同,因此,此处不在对服务操作链数据中的其他各服务操作数据进行特征提取的过程进行赘述。
下面,举例对一个服务操作数据进行特征提取,以得到该服务操作数据的服务特征向量的过程进行说明。若该服务操作数据包括操作流水号、操作时间、待分析用户触发的界面静态元素的名称、待分析用户触发的界面静态元素的坐标、输入属性、服务名称、操作状态信息、服务时间、待分析用户的标识信息,则对该服务操作数据中的每种类型的数据进行特征提取,以得到该服务特征数据中的每种类型的数据的特征分向量的具体过程如下:
针对操作流水号:由于操作流水号只作为传输标识,因此不进行编码,可以通过清洗的方式将操作流水号转化为固定长度的流水号,并该将固定长度的流水号确定为该操作流水号的特征分向量。
针对操作时间:操作时间包括时间周期特征和时间间隔特征,其中,将时间周期特征用5位数值表示,其中5位数值分别表示月份、日、小时、分钟、秒,并对该5位数值进行归一化处理,以得到时间周期特征对应的特征分向量;时间间隔特征用三位向量表示,该三位向量的分量值可以根据当前操作的前三步操作与当前操作的间隔时间进行确定,具体的,可以根据表1进行确定。
间隔时间(S) | 分量值 |
t≤5 | 1 |
5<t≤10 | 0.8 |
10<t≤20 | 0.6 |
20<t≤30 | 0.4 |
30<t≤60 | 0.2 |
t>60 | 0 |
表1
由上表1可知,间隔时间越长,分量值越小。
下面举例对确定时间间隔特征的三位向量的过程进行说明,若当前操作的前三步操作与当前操作的间隔时间分别为:10S、15S、25S,则由上述表1可知,三位向量中的每一位向量的分量值分别为:0.8、0.6、0.4,则该三位向量为:0.8、0.6、0.4。将用于表征间隔时间特征的三位向量和用于表征时间周期特征的5位数值确定为操作时间的特征分向量。
针对待分析用户触发的界面静态元素的名称:可以采用独热编码的方式对每个界面静态元素名称进行编码,以得到每个界面静态元素名称的特征分向量,例如,若界面静态元素名称的数量为5个,分别为第一界面静态元素名称至第五界面静态元素名称,则通过独热编码方式得到的第一界面静态元素名称至第五界面静态元素名称的特征分向量依次为:00001、00010、00100、01000、10000;最后,通过匹配的方式在界面静态元素名称的特征分向量中匹配出待分析用户触发的界面静态元素的名称的特征分向量。
针对待分析用户触发的界面静态元素的坐标,将待分析用户触发的界面静态元素的坐标进行归一化处理,即可得到待分析用户触发的界面静态元素的坐标的特征分向量。
针对输入属性:输入属性采用一维特征来表示其意义,如有输入,则该输入属性的特征分向量为1,若无输入,则该输入属性的特征分向量为0。
针对服务名称:可以采用独热编码的方式对服务名称进行编码,以得到服务名称的特征分向量。
针对操作状态信息:操作状态信息采用一维特征进行编码,如操作成功,则操作状态信息的特征分向量为1、若操作失败,则操作状态信息的特征分向量为0。
针对服务时间:服务时间表示后台服务器的运行时间,用一维向量标识,对服务时间做归一化,以得到服务时间的特征分向量。
针对待分析用户的标识信息:由于用于标记待分析用户,因此可以将待分析用户的标识信息本身作为该待分析用户的特征分向量。
将该服务操作数据中的每个类型的数据的特征分向量按照该预设顺序(操作时间、元素名称、坐标、输入属性、服务名称、操作状态、服务时间)首尾相连,以得到该服务操作数据的服务特征向量。最后可以用待分析用户的标识信息对该服务特征向量进行标记。
步骤S340、根据每个所述服务操作数据在所述服务操作链数据中的先后顺序,确定对应的每个所述服务特征向量的先后顺序。在本申请实施例中,将服务操作数据在服务操作链数据的顺序确定为服务操作数据的服务特征向量的顺序。
步骤S350、将每个所述服务特征向量用与其相邻且在其后的所述服务特征向量中的服务名称进行标记,以得到训练样本数据。
在本申请实施例中,例如,按照先后顺序服务特征向量依次为第一服务特征向量至第N服务特征向量,则用第二服务特征向量中的服务名称对第一服务特征向量进行标记,用第三服务特征向量中的服务名称对第二服务特征向量进行标记,依次类推,完成对其他各服务特征向量的标记,将标记后的服务特征向量进行集合,即可得到训练样本数据。需要说明的是,服务名称的表示形式可以为服务名称的索引号,还可以为服务名称本身等,本示例性实施例对此不做特殊限定。
步骤S360、根据所述训练样本数据对所述时间序列模型进行训练,以得到所述行为分析模型。
在本申请实施例中,将训练样本中的每个标记后的服务特征向量输入时间序列模型中,对时间序列模型进行训练,以得到时间序列模型中的各参数的数值,以及根据时间序列模型中的各参数的数值确定行为分析模型。
为了进一步提高分析模型的精准度,可以将训练样本数据中的一部分服务特征向量(例如80%的服务特征向量)用于训练时间序列模型,即通过该部分服务特征向量对时间序列模型进行训练,以得到时间序列模型中的各参数的数值,并根据各参数的数值确定行为分析模型,将训练样本数据中剩余的服务特征向量(例如20%的服务特征向量)用于验证上述构建的行为分析模型,即将剩余的服务特征向量输入至行为分析模型中,以根据行为分析模型输出的结果判断该行为分析模型的准确度,并在准确度未达到要求时,通过训练对行为分析模型中的参数进行调整,以提高行为分析模型的准确度。
需要说明的是,由于时间序列模型已经在上文中进行了说明,因此此处不在赘述。
由上可知,由于在上述行为分析模型的构建过程中,对服务操作链数据中的每个服务操作数据进行特征提取,以得到每个服务操作数据的服务特征向量,即将服务操作链数据中的每个服务操作数据抽象为格式相同的服务特征向量,又由于服务特征向量可以更为准确简洁的表征服务操作数据,有助于数据的计算,因此,基于服务特征向量训练时间序列模型得到的行为分析模型的准确度更高,同时也减少了时间序列模型的训练时间,进而提高了行为分析模型构建的效率。
基于此,所述根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务可以包括:首先,对所述待处理服务操作数据进行特征提取,以得到待处理服务特征向量;然后,根据所述待处理服务特征向量并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
在本申请实施例中,由于对待处理服务操作数据进行特征提取,以得到待处理服务特征向量的原理与上文中对服务操作数据进行特征提取以得到服务特征向量的原理相同,因此此处不再赘述。在得到待处理服务特征向量后,将待处理服务特征向量输入行为分析模型,该行为分析模型将输出待分析用户下一步操作针对每个服务的意向概率,以及根据待分析用户下一步操作针对每个服务的意向概率确定待分析用户下一步操作的意向服务。需要说明的是,由于根据待分析用户下一步操作针对每个服务的意向概率确定待分析用户下一步操作的意向服务的原理已经在上文中进行了说明,因此此处不在赘述。
进一步的,为了提升用户体验,在确定待分析用户下一步操作的意向服务后,可以获取与意向服务相关的数据(例如,意向服务的页面数据等),并加载与意向服务相关的数据,以在待分析用户在操作意向服务后,提高响应时间,进而提升用户体验。
综上所述,由于确定待分析用户下一步操作的意向服务的待处理服务操作数据由待分析用户当前操作的界面操作数据和后台日志数据融合得到,使得用于分析待分析用户下一步操作的意向服务的数据更加全面和广泛,提高了用于分析待分析用户下一步操作的意向服务的数据质量,从而能够准确、有效且真实的确定待分析用户下一步操作的意向服务(即用户行为);此外,由于仅通过对当前操作的界面操作数据和后台日志数据进行融合并结合分析模型即可确定待分析用户下一步操作的意向服务,步骤简单且易于执行,提高了确定待分析用户下一步操作的意向服务的效率。
对应上述用户行为分析方法,基于相同的技术构思,本申请实施例还提供了一种用户行为分析装置,图4为本申请实施例提供的用户行为分析装置的组成示意图,该装置用于执行上述用户行为分析方法,如图4所示,该装置400可以包括:第一获取模块401、第一融合模块402、分析模块403,其中:
第一获取模块401,可以用于获取待分析用户当前操作的界面操作数据和后台日志数据;
第一融合模块402,可以用于将所述当前操作的界面操作数据和后台日志数据进行融合,以得到待处理服务操作数据;
分析模块403,可以用于根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
可选的,所述装置400还可以包括:
第二获取模块,用于获取所述待分析用户在预设时间段内的界面操作轨迹数据和后台日志数据;
第二融合模块,用于将所述界面操作轨迹数据和后台日志数据进行融合,以得到服务操作链数据;
标记模块,用于将所述服务操作链数据中的每个服务操作数据分别用与其相邻且位于其后的服务操作数据中的服务名称进行标记,以得到训练样本数据;
训练模块,用于根据所述训练样本数据对所述时间序列模型进行训练,以得到所述行为分析模型。
可选的,所述标记模块可以包括:
第一提取单元,可以用于对所述服务操作链数据中的每个服务操作数据进行特征提取,以得到每个所述服务操作数据的服务特征向量;
第一确定单元,可以用于根据每个所述服务操作数据在所述服务操作链数据中的先后顺序,确定对应的每个所述服务特征向量的先后顺序;
标记单元,可以用于将每个所述服务特征向量用与其相邻且在其后的所述服务特征向量中的服务名称进行标记,以得到训练样本数据。
可选的,所述分析模块403可以包括:
第二提取单元,可以用于对所述待处理服务操作数据进行特征提取,以得到待处理服务特征向量;
分析单元,可以用于根据所述待处理服务特征向量并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
可选的,所述分析模块403可以包括:
输入单元,用于将所述待处理服务操作数据输入一由时间序列模型构建的行为分析模型,以输出所述待分析用户下一步操作针对每个服务的意向概率;
第二确定单元,用于根据所述待分析用户下一步操作针对每个服务的意向概率,确定所述待分析用户下一步操作的意向服务。
可选的,所述第二确定单元包括:
第一确定子单元,用于根据所述待分析用户下一步操作针对每个服务的意向概率,将所述意向概率最大的服务确定为第一服务,以及将所述意向概率仅小于所述第一服务的意向概率的服务确定为第二服务;
判断子单元,用于判断所述第一服务的意向概率是否大于一预设概率且所述第一服务与所述第二服务的意向概率差是否大于一预设概率差;
第二确定子单元,用于若是,则将所述第一服务确定为所述待分析用户下一步操作的意向服务。
可选的,所述装置400还可以包括:
加载模块,用于加载与所述意向服务相关的数据。
本申请实施例中的用户行为分析装置,由于确定待分析用户下一步操作的意向服务的待处理服务操作数据由待分析用户当前操作的界面操作数据和后台日志数据融合得到,使得用于分析待分析用户下一步操作的意向服务的数据更加全面和广泛,提高了用于分析待分析用户下一步操作的意向服务的数据质量,从而能够准确、有效且真实的确定待分析用户下一步操作的意向服务;此外,由于仅通过对当前操作的界面操作数据和后台日志数据进行融合并结合分析模型即可确定待分析用户下一步操作的意向服务,步骤简单且易于执行,提高了确定待分析用户下一步操作的意向服务的效率。
对应上述用户行为分析方法,基于相同的技术构思,本申请实施例还提供了一种用户行为分析设备,图5为本申请实施例提供的用户行为分析设备的结构示意图,该设备用于执行上述的用户行为分析方法。
如图5所示,用户行为分析设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器501和存储器502,存储器502中可以存储有一个或一个以上存储应用程序或数据。其中,存储器502可以是短暂存储或持久存储。存储在存储器502的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对用户行为分析设备中的一系列计算机可执行指令。更进一步地,处理器501可以设置为与存储器502通信,在用户行为分析设备上执行存储器502中的一系列计算机可执行指令。用户行为分析设备还可以包括一个或一个以上电源503,一个或一个以上有线或无线网络接口504,一个或一个以上输入输出接口505,一个或一个以上键盘506等。
在一个具体的实施例中,用户行为分析设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对用户行为分析设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取待分析用户当前操作的界面操作数据和后台日志数据;
将所述当前操作的界面操作数据和后台日志数据进行融合,以得到待处理服务操作数据;
根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
可选的,计算机可执行指令在被执行时还包括:
获取所述待分析用户在预设时间段内的界面操作轨迹数据和后台日志数据;
将所述界面操作轨迹数据和后台日志数据进行融合,以得到服务操作链数据;
将所述服务操作链数据中的每个服务操作数据分别用与其相邻且位于其后的服务操作数据中的服务名称进行标记,以得到训练样本数据;
根据所述训练样本数据对所述时间序列模型进行训练,以得到所述行为分析模型。
可选的,计算机可执行指令在被执行时,所述将所述服务操作链数据中的每个服务操作数据分别用与其相邻且位于其后的服务操作数据中的服务名称进行标记,以得到训练样本数据包括:
对所述服务操作链数据中的每个服务操作数据进行特征提取,以得到每个所述服务操作数据的服务特征向量;
根据每个所述服务操作数据在所述服务操作链数据中的先后顺序,确定对应的每个所述服务特征向量的先后顺序;
将每个所述服务特征向量用与其相邻且在其后的所述服务特征向量中的服务名称进行标记,以得到训练样本数据。
可选的,计算机可执行指令在被执行时,所述根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务包括:
对所述待处理服务操作数据进行特征提取,以得到待处理服务特征向量;
根据所述待处理服务特征向量并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
可选的,计算机可执行指令在被执行时,所述根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务包括:
将所述待处理服务操作数据输入一由时间序列模型构建的行为分析模型,以输出所述待分析用户下一步操作针对每个服务的意向概率;
根据所述待分析用户下一步操作针对每个服务的意向概率,确定所述待分析用户下一步操作的意向服务。
可选的,计算机可执行指令在被执行时,所述根据所述待分析用户下一步操作针对每个服务的意向概率,确定所述待分析用户下一步操作的意向服务包括:
根据所述待分析用户下一步操作针对每个服务的意向概率,将所述意向概率最大的服务确定为第一服务,以及将所述意向概率仅小于所述第一服务的意向概率的服务确定为第二服务;
判断所述第一服务的意向概率是否大于一预设概率且所述第一服务与所述第二服务的意向概率差是否大于一预设概率差;
若是,则将所述第一服务确定为所述待分析用户下一步操作的意向服务。
可选的,计算机可执行指令在被执行时还包括:
加载与所述意向服务相关的数据。
本申请实施例中的用户行为分析设备,由于确定待分析用户下一步操作的意向服务的待处理服务操作数据由待分析用户当前操作的界面操作数据和后台日志数据融合得到,使得用于分析待分析用户下一步操作的意向服务的数据更加全面和广泛,提高了用于分析待分析用户下一步操作的意向服务的数据质量,从而能够准确、有效且真实的确定待分析用户下一步操作的意向服务;此外,由于仅通过对当前操作的界面操作数据和后台日志数据进行融合并结合分析模型即可确定待分析用户下一步操作的意向服务,步骤简单且易于执行,提高了确定待分析用户下一步操作的意向服务的效率。
对应上述用户行为方法,基于相同的技术构思,本申请实施例还提供了一种存储介质,用于存储计算机可执行指令,在一个具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令在被处理器执行时,能实现以下流程:
获取待分析用户当前操作的界面操作数据和后台日志数据;
将所述当前操作的界面操作数据和后台日志数据进行融合,以得到待处理服务操作数据;
根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
可选的,该存储介质存储的计算机可执行指令在被处理器执行时,还包括:
获取所述待分析用户在预设时间段内的界面操作轨迹数据和后台日志数据;
将所述界面操作轨迹数据和后台日志数据进行融合,以得到服务操作链数据;
将所述服务操作链数据中的每个服务操作数据分别用与其相邻且位于其后的服务操作数据中的服务名称进行标记,以得到训练样本数据;
根据所述训练样本数据对所述时间序列模型进行训练,以得到所述行为分析模型。
可选的,该存储介质存储的计算机可执行指令在被处理器执行时,所述将所述服务操作链数据中的每个服务操作数据分别用与其相邻且位于其后的服务操作数据中的服务名称进行标记,以得到训练样本数据包括:
对所述服务操作链数据中的每个服务操作数据进行特征提取,以得到每个所述服务操作数据的服务特征向量;
根据每个所述服务操作数据在所述服务操作链数据中的先后顺序,确定对应的每个所述服务特征向量的先后顺序;
将每个所述服务特征向量用与其相邻且在其后的所述服务特征向量中的服务名称进行标记,以得到训练样本数据。
可选的,该存储介质存储的计算机可执行指令在被处理器执行时,所述根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务包括:
对所述待处理服务操作数据进行特征提取,以得到待处理服务特征向量;
根据所述待处理服务特征向量并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
可选的,该存储介质存储的计算机可执行指令在被处理器执行时,所述根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务包括:
将所述待处理服务操作数据输入一由时间序列模型构建的行为分析模型,以输出所述待分析用户下一步操作针对每个服务的意向概率;
根据所述待分析用户下一步操作针对每个服务的意向概率,确定所述待分析用户下一步操作的意向服务。
可选的,该存储介质存储的计算机可执行指令在被处理器执行时,所述根据所述待分析用户下一步操作针对每个服务的意向概率,确定所述待分析用户下一步操作的意向服务包括:
根据所述待分析用户下一步操作针对每个服务的意向概率,将所述意向概率最大的服务确定为第一服务,以及将所述意向概率仅小于所述第一服务的意向概率的服务确定为第二服务;
判断所述第一服务的意向概率是否大于一预设概率且所述第一服务与所述第二服务的意向概率差是否大于一预设概率差;
若是,则将所述第一服务确定为所述待分析用户下一步操作的意向服务。
可选的,该存储介质存储的计算机可执行指令在被处理器执行时,所述方法还包括:
加载与所述意向服务相关的数据。
本申请实施例中的存储介质存储的计算机可执行指令在被处理器执行时,由于确定待分析用户下一步操作的意向服务的待处理服务操作数据由待分析用户当前操作的界面操作数据和后台日志数据融合得到,使得用于分析待分析用户下一步操作的意向服务的数据更加全面和广泛,提高了用于分析待分析用户下一步操作的意向服务的数据质量,从而能够准确、有效且真实的确定待分析用户下一步操作的意向服务;此外,由于仅通过对当前操作的界面操作数据和后台日志数据进行融合并结合分析模型即可确定待分析用户下一步操作的意向服务,步骤简单且易于执行,提高了确定待分析用户下一步操作的意向服务的效率。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种用户行为分析方法,其特征在于,包括:
获取待分析用户当前操作的界面操作数据和后台日志数据;
将所述当前操作的界面操作数据和后台日志数据进行融合,以得到待处理服务操作数据;
根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
2.根据权利要求1所述的用户行为分析方法,其特征在于,所述方法还包括:
获取所述待分析用户在预设时间段内的界面操作轨迹数据和后台日志数据;
将所述界面操作轨迹数据和后台日志数据进行融合,以得到服务操作链数据;
将所述服务操作链数据中的每个服务操作数据分别用与其相邻且位于其后的服务操作数据中的服务名称进行标记,以得到训练样本数据;
根据所述训练样本数据对所述时间序列模型进行训练,以得到所述行为分析模型。
3.根据权利要求2所述的用户行为分析方法,其特征在于,所述将所述服务操作链数据中的每个服务操作数据分别用与其相邻且位于其后的服务操作数据中的服务名称进行标记,以得到训练样本数据包括:
对所述服务操作链数据中的每个服务操作数据进行特征提取,以得到每个所述服务操作数据的服务特征向量;
根据每个所述服务操作数据在所述服务操作链数据中的先后顺序,确定对应的每个所述服务特征向量的先后顺序;
将每个所述服务特征向量用与其相邻且在其后的所述服务特征向量中的服务名称进行标记,以得到训练样本数据。
4.根据权利要求3所述的用户行为分析方法,其特征在于,所述根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务包括:
对所述待处理服务操作数据进行特征提取,以得到待处理服务特征向量;
根据所述待处理服务特征向量并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
5.根据权利要求1所述的用户行为分析方法,其特征在于,所述根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务包括:
将所述待处理服务操作数据输入一由时间序列模型构建的行为分析模型,以输出所述待分析用户下一步操作针对每个服务的意向概率;
根据所述待分析用户下一步操作针对每个服务的意向概率,确定所述待分析用户下一步操作的意向服务。
6.根据权利要求5所述的用户行为分析方法,其特征在于,所述根据所述待分析用户下一步操作针对每个服务的意向概率,确定所述待分析用户下一步操作的意向服务包括:
根据所述待分析用户下一步操作针对每个服务的意向概率,将所述意向概率最大的服务确定为第一服务,以及将所述意向概率仅小于所述第一服务的意向概率的服务确定为第二服务;
判断所述第一服务的意向概率是否大于一预设概率且所述第一服务与所述第二服务的意向概率差是否大于一预设概率差;
若是,则将所述第一服务确定为所述待分析用户下一步操作的意向服务。
7.根据权利要求1所述的用户行为分析方法,其特征在于,所述方法还包括:
加载与所述意向服务相关的数据。
8.一种用户行为分析装置,其特征在于,包括:
第一获取模块,用于获取待分析用户当前操作的界面操作数据和后台日志数据;
第一融合模块,用于将所述当前操作的界面操作数据和后台日志数据进行融合,以得到待处理服务操作数据;
分析模块,用于根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
9.一种用户行为分析设备,其特征在于,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:
获取待分析用户当前操作的界面操作数据和后台日志数据;
将所述当前操作的界面操作数据和后台日志数据进行融合,以得到待处理服务操作数据;
根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
10.一种存储介质,用于存储计算机可执行指令,其特征在于,所述计算机可执行指令在被执行时实现以下流程:
获取待分析用户当前操作的界面操作数据和后台日志数据;
将所述当前操作的界面操作数据和后台日志数据进行融合,以得到待处理服务操作数据;
根据所述待处理服务操作数据并基于一由时间序列模型构建的行为分析模型,确定所述待分析用户下一步操作的意向服务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910381203.2A CN111913921A (zh) | 2019-05-08 | 2019-05-08 | 用户行为分析方法及装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910381203.2A CN111913921A (zh) | 2019-05-08 | 2019-05-08 | 用户行为分析方法及装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111913921A true CN111913921A (zh) | 2020-11-10 |
Family
ID=73242551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910381203.2A Pending CN111913921A (zh) | 2019-05-08 | 2019-05-08 | 用户行为分析方法及装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111913921A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103294727A (zh) * | 2012-03-05 | 2013-09-11 | 阿里巴巴集团控股有限公司 | 一种被推荐对象的过滤方法及系统 |
US20170091629A1 (en) * | 2015-09-30 | 2017-03-30 | Linkedin Corporation | Intent platform |
CN106651016A (zh) * | 2016-12-13 | 2017-05-10 | 重庆邮电大学 | 一种热点话题下动态预测用户行为的系统及方法 |
CN107171848A (zh) * | 2017-05-27 | 2017-09-15 | 华为技术有限公司 | 一种流量预测方法和装置 |
CN107241215A (zh) * | 2017-05-10 | 2017-10-10 | 百度在线网络技术(北京)有限公司 | 用户行为预测方法和装置 |
CN107577739A (zh) * | 2017-08-28 | 2018-01-12 | 深圳市空谷幽兰人工智能科技有限公司 | 一种半监督的领域词挖掘与分类的方法和设备 |
CN107665230A (zh) * | 2017-06-21 | 2018-02-06 | 海信集团有限公司 | 用于智能家居控制的用户行为预测模型的训练方法及装置 |
CN107943825A (zh) * | 2017-10-19 | 2018-04-20 | 阿里巴巴集团控股有限公司 | 页面访问的数据处理方法、装置及电子设备 |
CN108874823A (zh) * | 2017-05-12 | 2018-11-23 | 阿里巴巴集团控股有限公司 | 智能客服的实现方法和装置 |
CN109284163A (zh) * | 2018-09-20 | 2019-01-29 | 中国银行股份有限公司 | 用于业务终端的界面推送方法、装置 |
CN109522542A (zh) * | 2018-09-17 | 2019-03-26 | 深圳市元征科技股份有限公司 | 一种识别汽车故障语句的方法及装置 |
-
2019
- 2019-05-08 CN CN201910381203.2A patent/CN111913921A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103294727A (zh) * | 2012-03-05 | 2013-09-11 | 阿里巴巴集团控股有限公司 | 一种被推荐对象的过滤方法及系统 |
US20170091629A1 (en) * | 2015-09-30 | 2017-03-30 | Linkedin Corporation | Intent platform |
CN106651016A (zh) * | 2016-12-13 | 2017-05-10 | 重庆邮电大学 | 一种热点话题下动态预测用户行为的系统及方法 |
CN107241215A (zh) * | 2017-05-10 | 2017-10-10 | 百度在线网络技术(北京)有限公司 | 用户行为预测方法和装置 |
CN108874823A (zh) * | 2017-05-12 | 2018-11-23 | 阿里巴巴集团控股有限公司 | 智能客服的实现方法和装置 |
CN107171848A (zh) * | 2017-05-27 | 2017-09-15 | 华为技术有限公司 | 一种流量预测方法和装置 |
CN107665230A (zh) * | 2017-06-21 | 2018-02-06 | 海信集团有限公司 | 用于智能家居控制的用户行为预测模型的训练方法及装置 |
CN107577739A (zh) * | 2017-08-28 | 2018-01-12 | 深圳市空谷幽兰人工智能科技有限公司 | 一种半监督的领域词挖掘与分类的方法和设备 |
CN107943825A (zh) * | 2017-10-19 | 2018-04-20 | 阿里巴巴集团控股有限公司 | 页面访问的数据处理方法、装置及电子设备 |
CN109522542A (zh) * | 2018-09-17 | 2019-03-26 | 深圳市元征科技股份有限公司 | 一种识别汽车故障语句的方法及装置 |
CN109284163A (zh) * | 2018-09-20 | 2019-01-29 | 中国银行股份有限公司 | 用于业务终端的界面推送方法、装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107957989B (zh) | 基于集群的词向量处理方法、装置以及设备 | |
CN110674408B (zh) | 业务平台、训练样本的实时生成方法及装置 | |
CN110705214A (zh) | 一种自动编码方法及装置 | |
CN110968601A (zh) | 一种数据查询处理方法及装置 | |
CN109241026B (zh) | 数据管理的方法、装置及系统 | |
KR20210038467A (ko) | 이벤트 테마 생성 방법, 장치, 기기 및 저장 매체 | |
CN107622080B (zh) | 一种数据处理方法及设备 | |
CN111143178B (zh) | 用户行为分析方法、装置及设备 | |
CN107608951B (zh) | 报表生成方法和系统 | |
CN110569428A (zh) | 一种推荐模型的构建方法、装置及设备 | |
CN108846069B (zh) | 一种基于标记语言的文档执行方法及装置 | |
CN106406913B (zh) | 一种从项目中提取代码的方法及系统 | |
CN116702723A (zh) | 一种合同段落标注模型的训练方法、装置及设备 | |
CN110888756A (zh) | 一种诊断日志生成方法及装置 | |
CN110635962A (zh) | 用于分布式系统的异常分析方法及装置 | |
CN115774552A (zh) | 配置化的算法设计方法、装置、电子设备及可读存储介质 | |
CN115455166A (zh) | 一种智能对话系统异常检测的方法、装置、介质及设备 | |
CN111339311A (zh) | 基于生成式网络抽取结构化事件的方法、装置与处理器 | |
CN112231517A (zh) | 一种数据查询方法及装置 | |
CN111026916B (zh) | 文本描述的转换方法、装置、电子设备及存储介质 | |
CN113157941A (zh) | 业务特征数据处理、文本生成方法、装置及电子设备 | |
CN108595395B (zh) | 一种昵称的生成方法、装置及设备 | |
CN107943923B (zh) | 电报码数据库的构建方法、电报码识别方法及装置 | |
CN111913921A (zh) | 用户行为分析方法及装置、设备及存储介质 | |
CN110704742B (zh) | 一种特征提取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |