CN116186119A - 用户行为分析方法、装置、设备及存储介质 - Google Patents

用户行为分析方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116186119A
CN116186119A CN202310226966.6A CN202310226966A CN116186119A CN 116186119 A CN116186119 A CN 116186119A CN 202310226966 A CN202310226966 A CN 202310226966A CN 116186119 A CN116186119 A CN 116186119A
Authority
CN
China
Prior art keywords
user behavior
node
data
user
link data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310226966.6A
Other languages
English (en)
Inventor
徐昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lazas Network Technology Shanghai Co Ltd
Original Assignee
Lazas Network Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lazas Network Technology Shanghai Co Ltd filed Critical Lazas Network Technology Shanghai Co Ltd
Priority to CN202310226966.6A priority Critical patent/CN116186119A/zh
Publication of CN116186119A publication Critical patent/CN116186119A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书一个或多个实施例提供一种用户行为分析方法、装置、电子设备及存储介质。所述方法包括:获取若干用户端采集的用户行为数据,所述用户行为数据包括若干节点,任一节点用于指示在所述用户端中产生的用户行为;获取预先指定的待分析节点;所述待分析节点至少包括起始节点和终止节点;从所述用户行为数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据;根据所述用户行为链路数据进行数据挖掘和/或行为诊断,获得用户行为分析结果。实现聚焦运营人员感兴趣的核心链路。

Description

用户行为分析方法、装置、设备及存储介质
技术领域
本说明书一个或多个实施例涉及计算机软件技术领域,尤其涉及一种用户行为分析方法、装置、电子设备及存储介质。
背景技术
用户在设备中进行人机交互过程产生的数据,可以称之为用户行为数据。用户行为包括但不限于访问、浏览以及操作等至少一种行为。对用户行为数据进行分析是每个应用程序分析用户的重要途径,通过分析用户在应用程序中的用户行为链路,可以挖掘出更多有价值的信息;比如可以获取用户对应用程序的内容的客观评价,从而可以对应用程序的功能进行迭代调整,也可以验证某块业务对用户的粘性;又比如可以侦测是否为恶意用户等。但是,相关技术中的用户行为链路过分发散,难以从中分析并定位出问题。
发明内容
有鉴于此,本说明书一个或多个实施例提供一种用户行为分析方法、装置、电子设备及存储介质。
为实现上述目的,本说明书一个或多个实施例提供技术方案如下:
根据本说明书一个或多个实施例的第一方面,提出了一种用户行为分析方法,包括:
获取若干用户端采集的用户行为数据,所述用户行为数据包括若干节点,任一节点用于指示在所述用户端中产生的用户行为;
获取预先指定的待分析节点;所述待分析节点至少包括起始节点和终止节点;
从所述用户行为数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据;
根据所述用户行为链路数据进行数据挖掘和/或行为诊断,获得用户行为分析结果。
可选的,任一节点携带有时间戳,该时间戳表示用户行为的产生时间;
所述从所述用户行为数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据,包括:
对于任一用户端采集的用户行为数据,根据相邻节点的时间戳之差与预设时间阈值的比较结果进行会话切分,获取多条候选链路数据;任一候选链路数据指示在一个会话内在所述用户端中产生的用户行为的集合;同一会话中的相邻节点的时间戳之差不超过所述预设时间阈值;
从若干用户端的所有候选链路数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据。
可选的,所述从若干用户端的所有候选链路数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据,包括:
对于任一条候选链路数据,根据所述候选链路数据中的节点的时间戳对节点进行顺序打标,得到所述候选链路数据中的节点的第一标记;
从所述候选链路数据中筛选出起始节点和终止节点,并对所述起始节点和终止节点分别进行打标,得到起始节点的第二标记和终止节点的第二标记;其中,所述起始节点的第二标记和终止节点的第二标记满足预设顺序关系;根据所述预设顺序关系确定匹配的目标起始节点和目标终止节点;
根据所述候选链路数据中的节点的第一标记,从候选链路数据中提取在所述目标起始节点的第一标记和所述目标终止节点的第一标记之间的其他节点。
可选的,所述从所述用户行为数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据,包括:
从所述用户行为数据中筛选出满足筛选条件的用户行为数据;其中,所述筛选条件包括以下至少一种:用户行为数据的发生时间范围、用户行为数据所属的用户或者所属的用户类型;
从所述满足筛选条件的用户行为数据中识别到从起始节点到终止节点的用户行为链路数据。
可选的,所述根据所述用户行为链路数据进行数据挖掘,获得用户行为分析结果,包括:
根据所述用户行为链路数据进行统计处理,获得所述用户行为链路数据的统计指标。
可选的,所述统计指标包括以下至少一种:用户行为链路数据中的链路种类的数量、每种链路的耗时信息、每种链路的数量、用户行为链路数据中的所有链路的总数量、每种链路的数量在所述总数量中的占比、用户行为链路数据中相同节点的数量、用户行为链路数据中任一节点到其子节点的耗时信息;其中,所述用户行为链路数据中相同节点的数量指示同一用户行为的发生次数。
可选的,所述根据所述用户行为链路数据进行行为诊断,获得用户行为分析结果,包括:
利用参考链路数据对所述用户行为链路数据进行用户操作判定,确定所述用户行为链路数据中的异常链路数据;
对所述异常链路数据进行统计处理,获得用户行为分析结果。
可选的,所述参考链路数据包括参考行为模式;
所述利用参考链路数据对所述用户行为链路数据进行用户操作判定,确定所述用户行为链路数据中的异常链路数据,包括:
将所述用户行为链路数据转化成由行为模式组成的事件流,所述行为模式用于指示所述用户行为链路数据中的节点之间的衔接关系;
将所述事件流中的行为模式与所述参考行为模式进行匹配,以基于匹配的结果确定所述用户行为链路数据中的异常链路数据。
可选的,所述参考链路数据包括参考链路图;
所述利用参考链路数据对所述用户行为链路数据进行用户操作判定,确定所述用户行为链路数据中的异常链路数据,包括:
基于所述用户行为链路数据构建用户行为链路图;
将所述用户行为链路图与所述参考链路图进行匹配,以基于匹配的结果确定所述用户行为链路数据中的异常链路数据。
可选的,所述根据所述用户行为链路数据进行行为诊断,获得用户行为分析结果,包括:
根据所述用户行为链路数据进行统计处理,获得所述用户行为链路数据对应的统计指标;
将所述统计指标与参考指标进行比对,确定所述统计指标中的异常指标。
可选的,所述待分析节点还包括在起始节点和终止节点之间的至少一个中间节点;和/或
所述待分析节点是从多个候选节点中选定的;所述多个候选节点是通过录制方式或者搜索模式获取的;其中,所述录制方式指示对用户在目标设备中的用户行为进行录制,以获得多个候选节点;所述搜索模式指示搜索指定页面,以获得所述指定页面中的多个候选节点。
可选的,在所述从所述用户行为数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据之后,还包括:
确定所述用户行为链路数据中的相似节点,并对所述用户行为链路数据中的相似节点进行合并;其中,所述相似节点指示至少两个节点的语义信息满足相似度阈值和/或至少两个节点处于链路中的同一层级且在链路中的位置相近;和/或
在所述用户行为链路数据包括至少两种链路的情况下,确定所述用户行为链路数据中的相似路径,并对所述用户行为链路数据中的相似路径进行合并;其中,所述相似链路指示至少两条链路的节点数量之差小于预设差值、且所述至少两条链路包含的相同节点超过预设数量。
可选的,还包括:
根据所述用户行为链路数据、和所述用户行为链路数据的统计指标,构建用户行为链路图;其中,所述统计指标为对所述用户行为数据进行统计得到;在显示界面中显示所述用户行为链路图;其中,所述用户行为链路图包括至少两条链路、且统计指标满足预设条件的链路的边短于和/或直于其他链路的边。
可选的,所述用户行为链路图中的各个节点对应一热度标记,任一节点的热度标记的透明度与该节点指示的行为的发生次数呈负相关关系;和/或
所述用户行为链路图中的边对应一耗时信息,所述耗时信息根据该边连接的两个节点的时间戳确定。
可选的,所述用户行为链路数据包括若干节点及节点的父子关系;
所述根据所述用户行为链路数据、和所述用户行为链路数据的统计指标,构建用户行为链路图,包括:
根据所述用户行为链路数据中的若干节点及其父子关系,构建初始用户行为链路图;其中,所述若干节点中的相同节点被合并为一个节点;
利用所述用户行为链路数据的统计指标,调整所述初始用户行为链路图中的节点的显示位置,使得调整得到的所述用户行为链路图中统计指标满足预设条件的链路的边短于和/或直于其他链路的边。
可选的,在所述初始用户行为链路图中,所述若干节点被划分为不同的层级;
所述利用所述用户行为链路数据的统计指标,调整所述初始用户行为链路图中的节点的显示位置,包括:
确定统计指标满足预设条件的链路中的目标节点所在的层级;
对于所述目标节点所在的各个层级,以该目标节点与其他层级的节点的边更短和/或更直为优化目标,调整该层级中的节点的显示位置。
根据本说明书一个或多个实施例的第二方面,提出了一种用户行为分析装置,包括:
获取模块,用于获取若干用户端采集的用户行为数据,所述用户行为数据包括若干节点,任一节点用于指示用户在所述用户端中产生的用户行为;
所述获取模块,还用于获取预先指定的待分析节点;所述待分析节点至少包括起始节点和终止节点;
链路识别模块,用于从所述用户行为数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据;
用户行为分析模块,用于根据所述用户行为链路数据进行数据挖掘和/或行为诊断,获得用户行为分析结果。
根据本说明书一个或多个实施例的第三方面,提出了一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如第一方面中任一项所述的方法。
根据本说明书一个或多个实施例的第四方面,提出了一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如第一方面中任一项所述方法的步骤。
本说明书一个或多个实施例提供一种用户行为分析方法,可以预先指定一个任务流程的待分析节点,所述待分析节点至少包括起始节点和终止节点;进而在实际的用户行为分析过程中,可以从若干用户端采集的用户行为数据中识别出所述起始节点到所述终止节点之间的用户行为链路数据,根据该用户行为链路数据进行数据挖掘和/或行为诊断,获得用户行为分析结果,实现聚焦运营人员感兴趣的核心链路,得到的用户行为分析结果可以在该任务流程优化时提供决策依据或者可以进行准确的异常侦测。
附图说明
图1是一示例性实施例提供的一种用户行为分析系统的结构示意图。
图2是一示例性实施例提供的一种用户行为分析方法的流程示意图。
图3是一示例性实施例提供的确定待分析节点的多种方式的示意图。
图4A是一示例性实施例提供的录制模式下的操作示意图。
图4B是一示例性实施例提供的录制模式下的另一操作示意图。
图4C是一示例性实施例提供的基于录制模式获得多个候选节点的示意图。
图5是一示例性实施例提供的基于搜索模式获得多个候选节点的示意图。
图6是一示例性实施例提供的确定待分析节点的示意图。
图7是一示例性实施例提供的设置筛选条件的示意图。
图8是一示例性实施例提供的合并节点的示意图。
图9是一示例性实施例提供的用户行为链路图和统计指标的示意图。
图10是一示例性实施例提供的统计指标的不同统计维度的示意图。
图11是一示例性实施例提供的初始用户行为链路图和用户行为链路图的示意图。
图12是一示例性实施例提供的3种参考行为模式的示意图。
图13是一示例性实施例提供的一种设备的结构示意图。
图14是一示例性实施例提供的一种用户行为分析装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
相关技术中通常会将用户在应用程序中的所有用户行为都提取出来,导致识别到的用户行为链路过分发散,难以从中分析并定位出问题。
针对于相关技术中的问题,本实施例可以预先指定一个任务流程的待分析节点,所述待分析节点至少包括起始节点和终止节点;进而在实际的用户行为分析过程中,可以从若干用户端采集的用户行为数据中识别出所述起始节点到所述终止节点之间的用户行为链路数据,根据该用户行为链路数据进行数据挖掘和/或行为诊断,获得用户行为分析结果,实现聚焦运营人员感兴趣的核心链路,得到的用户行为分析结果可以在该任务流程优化时提供决策依据或者可以进行准确的异常侦测。
请参阅图1,图1为本说明书实施例提供的一种用户行为分析系统,所述用户行为分析系统包括服务端100、用户端200和运营端300,示例性地,用户端200与服务端100通信连接,用户端200可以通过网络访问服务端100以使用服务端100提供的服务,包括但不限于商品配送服务、商品购买服务、阅读服务、音视频播放服务、或者搜索服务等等。示例性的,运营端300与服务端100通信连接,运营端300由应用程序的运营人员使用,运营端300可以对服务端100提供的服务进行维护和优化。
服务端100可以是安装在后台设备中为用户提供服务的程序。示例性的,如图1所示,该后台设备可以是服务器,该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content DeliveryNetwork,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
用户端200可以是安装在用户设备中为用户提供服务的程序,用户端200包括但不限于应用程序APP、Web网页、小程序、插件或组件等。如图1所示,用户设备包括但不限于智能手机、个人数字助理、平板电脑、个人计算机、笔记本电脑、虚拟现实终端设备、增强现实终端设备等。用户可以在用户端上进行交互,从而产生用户行为数据;用户行为数据包括但不限于访问数据(如页面访问、页面离开等数据)、浏览数据(如页面滚动、页面曝光等数据)以及操作数据(如点击、输入、长按等数据)等。示例性的,可以通过在用户端上埋点的方式来采集用户行为数据,并将采集到的用户行为数据发送给服务端100。
运营端300可以是安装在运营人员的设备中的程序,运营端300包括但不限于应用程序APP、Web网页、小程序、插件或组件等。如图1所示,运营人员的设备包括但不限于智能手机、个人数字助理、平板电脑、个人计算机、笔记本电脑、虚拟现实终端设备、增强现实终端设备等。
其中,本说明书实施例提供的用户行为分析方法可以由服务端100、用户端200以及运营端300中的任一种来执行;或者,用户行为分析方法也可以由服务端100、用户端200以及运营端300中的两个或两个以上设备上执行,各个设备执行其中一部分。本实施例对此不做任何限制。
在一个例子中,比如可以由服务端100来独立执行本说明书实施例提供的用户行为分析方法,获取用户行为分析结果。
在另一个例子中,可以由服务端100在获取若干用户端采集的用户行为数据和预先指定的待分析节点之后,从所述用户行为数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据,然后将用户行为链路数据发送给运营端300,运营端300根据所述用户行为链路数据进行数据挖掘和/或行为诊断,获得用户行为分析结果。
在又一个例子中,可以由各个用户端在采集用户行为数据之后,根据预先指定的待分析节点从用户行为数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据,然后将用户行为链路数据发送给服务端100,服务端接收若干用户端反馈的用户行为链路数据,根据所述用户行为链路数据进行数据挖掘和/或行为诊断,获得用户行为分析结果并反馈给运营端300,以便在运营端300中展示。
接下来对本说明书实施例提供的用户行为分析方法进行示例性说明:请参阅图2,图2为一种用户行为分析方法的流程示意图,所述方法可由电子设备来执行,所述方法包括:
在S101中,获取若干用户端采集的用户行为数据,所述用户行为数据包括若干节点,任一节点用于指示在所述用户端中产生的用户行为。
在S102中,获取预先指定的待分析节点;所述待分析节点至少包括起始节点和终止节点。
在S103中,从所述用户行为数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据。
在S104中,根据所述用户行为链路数据进行数据挖掘和/或行为诊断,获得用户行为分析结果。
本实施例中,可以预先指定一个任务流程的待分析节点,包括起始节点和终止节点;进而在实际的用户行为分析过程中,可以从若干用户端采集的用户行为数据中识别出所述起始节点到所述终止节点之间的用户行为链路数据,根据该用户行为链路数据进行数据挖掘和/或行为诊断,实现聚焦运营人员感兴趣的核心链路,得到的用户行为分析结果可以在该任务流程优化时提供决策依据或者用于其他用途,诸如验证该业务流程对用户的粘性、识别非法用户、以及为用户进行数据推荐等等。在一些实施例中,用户行为分析过程可以是单次分析过程,也可以是趋势分析过程。单次分析过程指的是上述S101~S104的用户行为分析过程只进行一次。趋势分析过程指的是上述S101~S104的用户行为分析过程可以周期性进行,从而可以进行一步分析多次得到的用户行为分析结果的变化趋势。
在一些实施例中,可以通过在用户端中埋点的方式采集用户在用户端中的用户行为数据,用户行为数据包括但不限于访问数据(如页面访问、页面离开等数据)、浏览数据(如页面滚动、页面曝光等数据)以及操作数据(如点击、输入、长按等数据)等。
在一些实施例中,运营人员可以根据实际需要指定待分析节点,所述待分析节点至少包括待分析的任务流程中的起始节点和终止节点。在另一些场景中,除了指定起始节点和终止节点,用户还可以根据实际需要指定任务流程中的中间节点。
示例性的,电子设备可以通过录制模式或者搜索模式获取多个候选节点并展示在显示界面中,则用户可以根据实际需要从多个候选节点中选择待分析节点。在一个例子中,待分析节点包括起始节点和终止节点。在另一个例子中,待分支节点包括起始节点、至少一个中间节点和终止节点。
所述录制模式指示对用户在目标设备中的用户行为进行录制,以获得多个候选节点。所述搜索模式指示搜索指定页面,以获得所述指定页面中的多个候选节点。当然,除了上述两种方式之外,用户也可以根据实际需要手动新增待分析节点,本实施例对此不做任何限制。
在一示例性的实施例中,请参阅图3,电子设备可以根据用户选择不同的模式来获取多个候选节点,如图3中示出的录制模式、搜索模式或者手动添加模式。
在录制模式中,请参阅图4A,用户可以在当前设备中输入访问链路起始页的网址,点击“打开页面”,进而在打开的页面中进行相关用户行为,如浏览行为、点击行为、页面滚动行为、输入行为等;以及请参阅图4B,用户可以在移动端输入所述当前设备的唯一标识,然后点击开始录制,则移动端可以录制用户在当前设备中产生的相关用户行为数据;请参阅图4C,在录制完成之后,可以在电子设备中展示录制的多个候选节点,用户可以根据实际需要从中选择待分析节点。
在搜索模式中,请参阅图5,用户可以根据实际需要选择页面,在确认无误的情况下点击查询,则电子设备可以搜索用户选择的页面,从而获得用户选择的页面中的多个候选节点。当然,除了选择页面之后,还可以指定用户访问该页面的时间,以及其他的数据筛选项(如图6中的选择数据领域),本实施例对此不做任何限制。
基于录制模式或搜索模式获取的多个候选节点会展示在电子设备的显示界面中,请参阅图6,用户可以根据实际需要选择待分析节点,如图6中的待分析节点包括起始节点(图6中的起点)、终止节点(图6中的终点)和一个中间节点(图6中的序号2)。
在手动添加模式中,用户可以根据实际需要指定某个页面中的某个节点为待分析节点。
在一些实施例中,用户还可以根据实际需要预先设置筛选条件,所述筛选条件包括但不限于用户行为数据的发生时间范围、用户行为数据所属的用户或者所属的用户类型、以及用户行为数据的采集位置范围等等。
在一个例子中,请参阅图7,比如用户可以根据实际需要在图7所示的页面中设置时间范围和至少一个任务数据筛选项,所述任务数据筛选项的具体内容可依据实际应用场景进行具体设置,本实施例对此不做任何限制。比如在商品配送领域,可以指定只看一个用户的用户行为数据,即任务数据筛选项指示用户行为数据所属的用户;也可以将商户身份作为一个业务维度,可以查看品牌商户的用户行为数据,也可以查看普通商户的用户行为数据,即任务数据筛选项指示用户行为数据所属的用户类型。当然,还可以从其他维度设置任务数据筛选项。
在一些实施例中,在获取若干用户端采集的用户行为数据之后,电子设备可以从所述用户行为数据中识别出从包括待分析节点的用户行为链路数据。示例性的,所述待分析节点包括起始节点和终止节点,电子设备可以从所述用户行为数据中识别出所述起始节点到所述终止节点之间的用户行为链路数据。示例性的,所述待分析节点包括起始节点、终止节点和中间节点,电子设备可以从所述用户行为数据中识别出所述起始节点到中间节点,再从该中间节点到所述终止节点之间的用户行为链路数据。
示例性的,以所述待分析节点包括起始节点和终止节点为例,对于任一用户端采集的用户行为数据,电子设备可以根据相邻节点的时间戳之差与预设时间阈值的比较结果进行会话切分,获取多条候选链路数据;任一候选链路数据指示用户在一个会话内在所述用户端中产生的行为的集合;同一会话中的相邻节点的时间戳之差不超过所述预设时间阈值;进而电子设备可以从若干用户端的所有候选链路数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据。本实施例中,以会话为单位对用户行为数据进行切分,实现对指定时间范围内的用户行为链路进行分析,从而保证后续分析结果的准确性。
进而对于任一条候选链路数据,电子设备根据所述候选链路数据中的节点的时间戳对节点进行顺序打标,得到所述候选链路数据中的节点的第一标记;然后从所述候选链路数据中筛选出起始节点和终止节点,并对所述起始节点和终止节点分别进行顺序打标,得到起始节点的第二标记和终止节点的第二标记;其中,所述起始节点的第二标记和终止节点的第二标记满足预设顺序关系;接着根据所述预设顺序关系确定匹配的目标起始节点和目标终止节点;最后根据所述候选链路数据中的节点的第一标记,从候选链路数据中提取在所述目标起始节点的第一标记和所述目标终止节点的第一标记之间的其他节点。
在一个例子中,以1条候选链路数据示例,假设该候选链路数据为A→X1→X2→X3→B→C→A→……,起始节点为A,终止节点为B。电子设备根据所述候选链路数据中的节点的时间戳对节点进行顺序打标,如表1示出了候选链路数据中的节点的第一标记。
表1
节点 第一标记
A 1
X1 2
X2 3
X3 4
B 5
C 6
A 7
…… ……
然后从所述候选链路数据中筛选出起始节点A和终止节点B,如表2所示,设置所述起始节点A的第二标记为1,终止节点B的第二标记为2,则可以看出,起始节点的第二标记和终止节点的第二标记之间满足的预设顺序关系为:起始节点A的第二标记加1等于终止节点B的第二标记。
表2
Figure BDA0004118827040000101
Figure BDA0004118827040000111
电子设备判断表2中每一行的第二标记加1后是否等于下一行的第二标记,若是,则可以确定出匹配的目标起始节点和目标终止节点,如表3所示,可以用逗号标记对目标终止节点进行标注。
表3
节点 第一标记 第二标记
A 1 1
B, 5, 2,
A 7 1
接着通过多行转一行的方式,将表3转化为表4中的样式,并且相邻节点之间用逗号标记链接,则链路完成的数据会有两个逗号标记;请参阅表5,再通过一行转多行的方式,将候选链路数据中的完成链路(指从A到B之间的链路)和未完成链路进行切分,进而根据完成链路中的目标起始节点的第一标记和目标终止节点的第一标记可以确定其他节点,比如表5第一行中起始节点A的第一标记为1,终止节点B的第一标记为5,按照第一标记的顺序,则可以提取表1中的第一标记为2、3和4的3个节点,从而得到{A→X1→X2→X3→B}的用户行为链路数据。
表4
节点 第一标记 第二标记
A,B,,A 1,5,,7 1,2,,2
表5
节点 第一标记 第二标记
A,B 1,5 1,2
A 7 2
在一些实施例中,在预置有筛选条件的情况下,电子设备可以从所述用户行为数据中选择满足筛选条件的用户行为数据,再从所述满足筛选条件的用户行为数据中识别到从起始节点到终止节点的用户行为链路数据。具体的识别过程可参见上述描述,此处不再赘述。
可以理解的是,在用户端有多个和/或每个用户端的候选链路数据有多条的情况下,电子设备识别到的从起始节点到终止节点的用户行为链路数据也有可能不止一条。在一些实施例中,在获取用户行为数据之后,考虑到用户行为的复杂性,导致识别出的链路过于分散,无法挖掘有有效数据或者诊断结果不明显。因此,在获取从所述起始节点到所述终止节点之间的用户行为链路数据之后,可以基于链路相似进行节点或者链路的合并,使得合并后的用户链路更加收敛。
在一种可能的实现方式中,可以确定所述用户行为链路数据中的相似节点,并对所述用户行为链路数据中的相似节点进行合并;其中,所述相似节点指示至少两个节点的语义信息满足相似度阈值和/或至少两个节点处于链路中的同一层级且在链路中的位置相近。在一个例子中,比如存在两个节点,一个节点指示的用户行为是将“汉堡”加入购物车,另一个节点指示的用户行为是:将“薯条”加入购物车,而汉堡和薯条的语义信息都是菜品,可以将这两个节点合并。示例性的,比如从节点A到节点B,可以经过节点X1,也可以经过节点X2,即有A→X1→B、A→X2→B,则节点X1和节点X2处于链路中的同一层级且在链路中的位置相近,则可以将节点X1和节点X2合并为一个节点。
在另一个例子中,请参阅图8中的左图中可以看出,用户在同一页面中存在多种操作可能性,导致识别出的链路比较分散,因此可以确定链路中的相似节点,比如页面中“选择活动人群”下的3个节点的语义信息可以归类为活动人群,因为可以将这3个节点合并;又比如“选择优惠类型”下的2个节点处于链路中的同一层级且在链路中的位置相近,可以将这2个节点合并为同一个节点;在对所有的相似节点进行合并之后,可以得到如图8的右图中的用户链路;通过对比可知看出,将具有个性化语义的节点合并、和/或将处于相同层级、且位置相近的节点合并,使得合并后的用户链路更加收敛,便于从中定位问题。在另一种可能的实现方式中,在所述用户行为链路数据包括至少两种链路的情况下,电子设备可以确定所述用户行为链路数据中的相似路径,并对所述用户行为链路数据中的相似路径进行合并;其中,所述相似链路指示至少两条链路的节点数量之差小于预设差值、且所述至少两条链路包含的相同节点超过预设数量。可以理解的是,预设差值和预设数量的具体取值可依据实际应用场景进行具体设置,本实施例对此不做任何限制。在一个例子中,比如存在一条用户行为链路为:A→X1→X2→X3→B;另一条用户行为链路为:A→X1→X3→X2→B;这两条用户行为链路包含的节点数量相同且包含相同的节点,可以将这两条用户行为链路合并。
在一些实施例中,在识别到用户行为链路数据之后,电子设备可以根据所述用户行为链路数据进行数据挖掘和/或行为诊断,获得用户行为分析结果。
在一示例性的实施例中,在数据挖掘方面,电子设备可以根据所述用户行为链路数据进行统计处理,获得所述用户行为链路数据对应的统计指标。示例性的,所述统计指标包括以下至少一种:用户行为链路数据中的链路种类的数量、每种链路的耗时信息、每种链路的数量、用户行为链路数据中的所有链路的总数量、每种链路的数量在所述总数量中的占比、用户行为链路数据中相同节点的数量、用户行为链路数据中任一节点到其子节点的耗时信息;其中,所述用户行为链路数据中相同节点的数量指示同一用户行为的发生次数。其中,任一条用户行为链路数据中的节点可以携带有时间戳,该时间戳表征该节点指示的用户行为的发生时间;该条用户行为链路数据中的任一节点到其子节点的耗时为该节点的时间戳与其子节点的时间戳之差;假设一节点为A,节点为A的子节点为B,在有多条用户行为链路数据均包括节点A及其子节点B的情况下,则节点A到其子节点B的耗时信息可以是多条用户行为链路数据中节点A到子节点B的耗时的统计值,该统计值包括但不限于平均值、中位数、最大值或者最小值等等。
其中,对于用户行为链路数据中相同节点的数量,假设多条用户行为链路数据中均包括节点A,则可以统计出用户行为链路数据中节点A的数量,换句话说,该节点A的数量指示同一用户行为的发生次数。
在获得用户行为链路数据之后,可以把获得的数据展示给用户,即进行用户行为链路数据的可视化。在一个例子中,请参阅图9,图9示出了基于用户行为链路数据构建的用户行为链路图,以及对用户行为链路数据进行统计处理得到的统计指标。其中,图9中的总链路完成次数指的是用户行为链路数据中的所有链路的总数量;链路总数指的是用户行为链路数据中的链路种类的数量;链路完成次数指的是每种链路的数量,如图9中的列表指示#1的链路有118条,#2的链路有87条;链路完成次数/占比指的是每种链路的数量在用户行为链路数据中的所有链路的总数量中的占比;链路时长指的是该种链路中的所有边的耗时之和;在用户行为链路图中每个节点中的次数指的是该节点指示的用户行为的发生次数。
其中,请参阅图10,除了从最大完成链路数量(指的是按照数量从大到小的顺序对不同种类的链路进行排序)维度进行统计之外,还可以从其他维度进行统计,如最小完成链路数量(指的是按照数量从小到大的顺序对不同种类的链路进行排序)、最大完成链路时间(指的是按照链路时长从大到小的顺序对不同种类的链路进行排序)、最小完成链路时间(指的是按照链路时长从小到大的顺序对不同种类的链路进行排序),但不限于此。
示例性的,请参阅图9,可以基于用户的链路筛选操作,仅显示用户选中的链路,比如图9中展示了用户选中的链路完成次数排名前3的三条链路,使得用户可以对热点链路进行针对性分析。
示例性的,请参阅图9,所述用户行为链路图中的各个节点对应一热度标记,任一节点的热度标记的透明度与该节点指示的用户行为的发生次数呈负相关关系,即发生次数越多,节点的热度标记的透明度越小;反之亦然。从而可以让用户直观了解到节点热度情况。其中,任一节点指示的用户行为的发生次数可以通过统计用户行为链路数据中该节点的数量得到。
示例性的,请参阅图9,所述用户行为链路图中的边对应一耗时信息,所述耗时信息根据该边连接的两个节点的时间戳确定;在任一条连接的两个节点在用户行为链路数据中出现多次的情况下,任一条边的耗时信息可以根据该边连接的两个节点的时间戳之差的统计值(比如平均值、或中位数等等)确定。从而可以让用户直观了解到从其中一个节点到另一个节点之间的操作时长。
在一些实施例中,在将用户行为链路数据展示给用户时,为了达到更好的显示效果,所述电子设备根据所述用户行为链路数据和所述用户行为链路数据对应的统计指标,构建用户行为链路图,并在显示界面中显示所述用户行为链路图。其中,所述用户行为链路图中统计指标满足预设条件的链路的边短于和/或直于其他链路的边,使得用户可以重点关注统计指标满足预设条件的链路,方便用户从用户行为链路图直观且快速地获取关键信息。
示例性的,以所述统计指标包括用户行为链路数据中相同节点的数量为例,则所述预设条件包括链路中的节点的所述数量需满足的数量条件。例如,所述数量条件可以是链路中的节点的数量大于预设次数、或者链路中存在数量最多的节点、又或者链路中所有节点的数量之和最大,但不限于此,可依据实际应用场景进行具体设置。
示例性的,以所述统计指标包括从任一节点到其子节点的耗时信息为例,在所述预设条件包括链路的耗时需满足的耗时条件。例如所述耗时条件可以是链路中所有边的总耗时最小、或者链路中所有边的总耗时小于预设阈值、又或者链路中包括耗时最小的边、还或者链路中包括耗时小于预设时长的边,但不限于此,可依据实际应用场景进行具体设置。
示例性的,以所述统计指标包括所述用户行为链路数据中的每种链路的数量为例,则所述预设条件包括链路的数量需满足的第二数量条件。例如,所述第二数量条件可以是链路的数量大于预设值、或者链路的数量最多、又或者某种链路的数量在用户行为链路数据中的所有链路的总数量的占比最大,但不限于此,可依据实际应用场景进行具体设置。
在一些可能的实施方式中,所述用户行为链路数据包括若干节点及节点的父子关系。电子设备可以根据所述用户行为链路数据中的若干节点及其父子关系,构建初始用户行为链路图;然后利用所述用户行为链路数据的统计指标,调整所述初始用户行为链路图中的节点的显示位置,使得调整得到的所述用户行为链路图中统计指标满足预设条件的链路的边短于和/或直于其他链路的边。
在一个例子中,以所述统计指标包括从任一节点到其子节点的耗时信息为例,预设条件为链路中的所有边的总耗时最小;请参阅图11,假设在得到如图11所示的初始用户行为链路图(图11中的左图)之后,基于所述用户行为链路数据的统计指标可以确定“2-5-6-7”链路的总耗时最小,则可以调整节点6和节点7的坐标,使得“2-5-6-7”链路的边短于和/或直于其他链路的边,得到图11中的右图的显示效果。
在一示例性的实施例中,构建初始用户行为链路图的过程涉及节点分层、层内节点排序和坐标优化。首先电子设备根据用户行为链路数据中的若干节点及其父子关系,确定各个节点的层级,其中,用户行为链路数据的若干节点中的相同节点被合并为一个节点;接着,对于各个层级中的节点,以减少初始用户行为链路图中的交叉边为目标,对该层级中的节点进行排序,确定该层级中的各个节点的显示位置;在确定各个层级中的节点的显示位置之后,根据各个节点的父子关系调整节点之间的显示间距,得到平衡美观的初始用户行为链路图。
在一示例性的实施例中,在获取初始行为链路图之后,所述电子设备可以根据所述用户行为链路数据的统计指标对初始行为链路图进行调整。在所述初始用户行为链路图中,所述若干节点被划分为不同的层级;则电子设备可以确定统计指标满足预设条件的链路中的目标节点所在的层级;对于所述目标节点所在的各个层级,以该目标节点与其他层级的节点的边更短和/或更直为优化目标,调整该层级中的节点的显示位置。本实施例中,通过调整统计指标满足预设条件的链路中的目标节点所在层级中的节点的显示位置,使得统计指标满足预设条件的链路的边短于和/或直于其他链路的边,从而可以让用户可以重点关注统计指标满足预设条件的链路,方便用户从用户行为链路图直观且快速地获取关键信息。
在另一示例性的实施例中,在行为诊断方面,电子设备可以利用参考链路数据对所述用户行为链路数据进行用户操作判定,确定所述用户行为链路数据中的异常链路数据;进而对所述异常链路数据进行统计处理,获得用户行为分析结果。
在一种可能的实现方式中,可以通过事件流方式来做匹配,确定所述用户行为链路数据中的异常链路数据。为了匹配用户的操作,可以定义多个原子模式来描述行为。所述参考链路数据包括参考行为模式;可以按照预先定义的用于描述行为的原子模式,将所述用户行为链路数据转化成由行为模式组成的事件流,所述行为模式用于指示所述用户行为链路数据中的节点之间的衔接关系;然后将所述事件流中的行为模式与所述参考行为模式进行匹配,以基于匹配的结果确定所述用户行为链路数据中的异常链路数据。
在一个例子中,假设定义了5个原子模式来描述行为:(1)next:next(A,B)表示A节点后必须紧跟着B节点,中间不能有其他事件;(2)followedBy:followedBy(A,B)表示A节点之后可以有C、D等其他节点,然后再来B节点,也能匹配规则;(3)followedByAny:followedByAny(A,B)表示A节点之后可以有C、D等其他节点,然后再来B节点,也能匹配规则,继续来B节点,还能继续匹配;(4)notNext:notNext(A,B)表示A节点之后紧接着来B节点,则当前匹配的时间序列作废;(5)notFollowedBy:notFollowedBy(A,B)表示A节点之后,如果来了B节点,则当前匹配的时间序列作废。
作为例子,列举用户迂回操作场景下的几种参考行为模式:如图12所示,如果是单节点循环,比如连续性点了两次提交按钮,则参考行为模式为Pattern.begin(A).next(A);如果是双节点循环,比如点击提交按钮之后重新输入,紧接着又点击了提交按钮,则参考行为模式为Pattern.begin(A).next(B).next(A);如果是双节(间隔)点循环,比如点击提交按钮之后,进行一些操作重新触发了B,然后又回到提交按钮,则参考行为模式为Pattern.begin(A).followedBy(B).followedBy(A)。其他场景的参考行为模式依次类推,可以对操作支路场景和操作受阻场景设置相应的参考行为模式。在设置了参考行为模式之后,可以将所述事件流中的行为模式与所述参考行为模式进行匹配,以基于匹配的结果确定所述用户行为链路数据中的异常链路数据。
在另一种可能的实现方式中,可以通过图模式来做匹配,确定所述用户行为链路数据中的异常链路数据。所述参考链路数据包括参考链路图。电子设备可以基于所述用户行为链路数据构建用户行为链路图;然后将所述用户行为链路图与所述参考链路图进行匹配,以基于匹配的结果确定所述用户行为链路数据中的异常链路数据。
示例性的,所述用户行为链路数据中的异常链路数据包括以下至少一种:迂回链路数据、操作支路数据以及操作受阻链路数据;其中,操作受阻链路指的是用户本该进行某个节点指示的用户行为,但该用户节点并未发生,也就没有产生该节点;比如在支付环节,用户最后应该点击支付控件,但最后并没有点击。则电子设备可以基于迂回链路数据进行统计处理,获得迂回链路的迂回度;基于操作支路数据进行统计处理,获得操作支路数据的分散度;以及基于操作受阻链路数据进行统计处理,获得操作受阻链路数据的受阻距离。
示例性的,在行为诊断方面,电子设备也可以根据所述用户行为链路数据进行统计处理,获得所述用户行为链路数据对应的统计指标。所述统计指标的具体内容可参见上述描述。然后电子设备将所述统计指标与参考指标进行比对,确定所述统计指标中的异常指标。比如在趋势分析过程中,参考指标可以是上一次用户行为分析过程获得的统计指标。又比如在单次分析过程中,参考指标可以是运营人员根据实际应用场景预先设置的数据。
在一示例性的应用场景中,比如用户行为分析结果可以用于对用户端中的交互流程进行改进,比如利用已有的用户行为链路数据通过聚类算法找到关联业务场景的因子来定义行为场景,这样才能更细地横线业务场景下的体验。
又比如用户行为分析结果可以用于推荐场景,在已知用户行为的条件下,进一步探究用户操作的动机是什么,从而能够动态地为用户推荐期望的数据。
还比如用户行为分析结果可以用于识别恶意用户,可以基于已有的用户行为链路数据通过聚类算法将不同于正常用户的行为侦测出来,从而进一步判定是否为恶意用户。
以上实施方式中的各种技术特征可以任意进行组合,只要特征之间的组合不存在冲突或矛盾,但是限于篇幅,未进行一一描述,因此上述实施方式中的各种技术特征的任意进行组合也属于本说明书公开的范围。
图13是一示例性实施例提供的一种设备的示意结构图。请参考图13,在硬件层面,该设备包括处理器202、内部总线204、网络接口206、内存208以及非易失性存储器210,当然还可能包括其他业务所需要的硬件。本说明书一个或多个实施例可以基于软件方式来实现,比如由处理器202从非易失性存储器210中读取对应的计算机程序到内存208中然后运行。当然,除了软件实现方式之外,本说明书一个或多个实施例并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
请参考图14,用户行为分析装置可以应用于如图13所示的设备中,以实现本说明书的技术方案。其中,该用户行为分析装置可以包括:
获取模块301,用于获取若干用户端采集的用户行为数据,所述用户行为数据包括若干节点,任一节点用于指示用户在所述用户端中产生的用户行为;
所述获取模块301,还用于获取预先指定的待分析节点;所述待分析节点至少包括起始节点和终止节点;
链路识别模块302,用于从所述用户行为数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据;
用户行为分析模块303,用于根据所述用户行为链路数据进行数据挖掘和/或行为诊断,获得用户行为分析结果。
在一些实施例中,任一节点携带有时间戳,该时间戳表示用户行为的产生时间。所述链路识别模块302具体用于:对于任一用户端采集的用户行为数据,根据相邻节点的时间戳之差与预设时间阈值的比较结果进行会话切分,获取多条候选链路数据;任一候选链路数据指示在一个会话内在所述用户端中产生的用户行为的集合;同一会话中的相邻节点的时间戳之差不超过所述预设时间阈值;从若干用户端的所有候选链路数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据。
在一些实施例中,所述链路识别模块302具体用于:对于任一条候选链路数据,根据所述候选链路数据中的节点的时间戳对节点进行顺序打标,得到所述候选链路数据中的节点的第一标记;从所述候选链路数据中筛选出起始节点和终止节点,并对所述起始节点和终止节点分别进行打标,得到起始节点的第二标记和终止节点的第二标记;其中,所述起始节点的第二标记和终止节点的第二标记满足预设顺序关系;根据所述预设顺序关系确定匹配的目标起始节点和目标终止节点;根据所述候选链路数据中的节点的第一标记,从候选链路数据中提取在所述目标起始节点的第一标记和所述目标终止节点的第一标记之间的其他节点。
在一些实施例中,所述链路识别模块302具体用于:从所述用户行为数据中筛选出满足筛选条件的用户行为数据;其中,所述筛选条件包括以下至少一种:用户行为数据的发生时间范围、用户行为数据所属的用户或者所属的用户类型;从所述满足筛选条件的用户行为数据中识别到从起始节点到终止节点的用户行为链路数据。
在一些实施例中,所述用户行为分析模块303具体用于:根据所述用户行为链路数据进行统计处理,获得所述用户行为链路数据的统计指标。
在一些实施例中,所述统计指标包括以下至少一种:用户行为链路数据中的链路种类的数量、每种链路的耗时信息、每种链路的数量、用户行为链路数据中的所有链路的总数量、每种链路的数量在所述总数量中的占比、用户行为链路数据中相同节点的数量、用户行为链路数据中任一节点到其子节点的耗时信息;其中,所述用户行为链路数据中相同节点的数量指示同一用户行为的发生次数。
在一些实施例中,所述用户行为分析模块303具体用于:利用参考链路数据对所述用户行为链路数据进行用户操作判定,确定所述用户行为链路数据中的异常链路数据;对所述异常链路数据进行统计处理,获得用户行为分析结果。
在一些实施例中,所述参考链路数据包括参考行为模式。所述用户行为分析模块303具体用于:将所述用户行为链路数据转化成由行为模式组成的事件流,所述行为模式用于指示所述用户行为链路数据中的节点之间的衔接关系;将所述事件流中的行为模式与所述参考行为模式进行匹配,以基于匹配的结果确定所述用户行为链路数据中的异常链路数据。
在一些实施例中,所述参考链路数据包括参考链路图。所述用户行为分析模块303具体用于:基于所述用户行为链路数据构建用户行为链路图;将所述用户行为链路图与所述参考链路图进行匹配,以基于匹配的结果确定所述用户行为链路数据中的异常链路数据。
在一些实施例中,所述用户行为分析模块303具体用于:根据所述用户行为链路数据进行统计处理,获得所述用户行为链路数据对应的统计指标;将所述统计指标与参考指标进行比对,确定所述统计指标中的异常指标。
在一些实施例中,所述待分析节点还包括在起始节点和终止节点之间的至少一个中间节点;和/或所述待分析节点是从多个候选节点中选定的;所述多个候选节点是通过录制方式或者搜索模式获取的;其中,所述录制方式指示对用户在目标设备中的用户行为进行录制,以获得多个候选节点;所述搜索模式指示搜索指定页面,以获得所述指定页面中的多个候选节点。
在一些实施例中,还包括链路合并模块,用于确定所述用户行为链路数据中的相似节点,并对所述用户行为链路数据中的相似节点进行合并;其中,所述相似节点指示至少两个节点的语义信息满足相似度阈值和/或至少两个节点处于链路中的同一层级且在链路中的位置相近;和/或在所述用户行为链路数据包括至少两种链路的情况下,确定所述用户行为链路数据中的相似路径,并对所述用户行为链路数据中的相似路径进行合并;其中,所述相似链路指示至少两条链路的节点数量之差小于预设差值、且所述至少两条链路包含的相同节点超过预设数量。
在一些实施例中,还包括:链路图构建模块,用于根据所述用户行为链路数据、和所述用户行为链路数据的统计指标,构建用户行为链路图;其中,所述统计指标为对所述用户行为数据进行统计得到。以及,还包括:链路图显示模块,用于在显示界面中显示所述用户行为链路图;其中,所述用户行为链路图包括至少两条链路、且统计指标满足预设条件的链路的边短于和/或直于其他链路的边。
在一些实施例中,所述用户行为链路图中的各个节点对应一热度标记,任一节点的热度标记的透明度与该节点指示的行为的发生次数呈负相关关系;和/或所述用户行为链路图中的边对应一耗时信息,所述耗时信息根据该边连接的两个节点的时间戳确定。
在一些实施例中,所述用户行为链路数据包括若干节点及节点的父子关系。
所述链路图构建模块具体用于根据所述用户行为链路数据中的若干节点及其父子关系,构建初始用户行为链路图;其中,所述若干节点中的相同节点被合并为一个节点;利用所述用户行为链路数据的统计指标,调整所述初始用户行为链路图中的节点的显示位置,使得调整得到的所述用户行为链路图中统计指标满足预设条件的链路的边短于和/或直于其他链路的边。
在一些实施例中,在所述初始用户行为链路图中,所述若干节点被划分为不同的层级。所述链路图构建模块具体用于确定统计指标满足预设条件的链路中的目标节点所在的层级;对于所述目标节点所在的各个层级,以该目标节点与其他层级的节点的边更短和/或更直为优化目标,调整该层级中的节点的显示位置。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
相应的,本说明书实施例还提供了一种电子设备,包括处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现上述中任一项所述的方法。
相应的,本公开还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。
需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
在一个典型的配置中,计算机包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在本说明书一个或多个实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
以上所述仅为本说明书一个或多个实施例的较佳实施例而已,并不用以限制本说明书一个或多个实施例,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例保护的范围之内。

Claims (10)

1.一种用户行为分析方法,包括:
获取若干用户端采集的用户行为数据,所述用户行为数据包括若干节点,任一节点用于指示在所述用户端中产生的用户行为;
获取预先指定的待分析节点;所述待分析节点至少包括起始节点和终止节点;
从所述用户行为数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据;
根据所述用户行为链路数据进行数据挖掘和/或行为诊断,获得用户行为分析结果。
2.根据权利要求1所述的方法,任一节点携带有时间戳,该时间戳表示用户行为的产生时间;
所述从所述用户行为数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据,包括:
对于任一用户端采集的用户行为数据,根据相邻节点的时间戳之差与预设时间阈值的比较结果进行会话切分,获取多条候选链路数据;任一候选链路数据指示在一个会话内在所述用户端中产生的用户行为的集合;同一会话中的相邻节点的时间戳之差不超过所述预设时间阈值;
从若干用户端的所有候选链路数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据。
3.根据权利要求2所述的方法,所述从若干用户端的所有候选链路数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据,包括:
对于任一条候选链路数据,根据所述候选链路数据中的节点的时间戳对节点进行顺序打标,得到所述候选链路数据中的节点的第一标记;
从所述候选链路数据中筛选出起始节点和终止节点,并对所述起始节点和终止节点分别进行打标,得到起始节点的第二标记和终止节点的第二标记;其中,所述起始节点的第二标记和终止节点的第二标记满足预设顺序关系;根据所述预设顺序关系确定匹配的目标起始节点和目标终止节点;
根据所述候选链路数据中的节点的第一标记,从候选链路数据中提取在所述目标起始节点的第一标记和所述目标终止节点的第一标记之间的其他节点。
4.根据权利要求1所述的方法,所述从所述用户行为数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据,包括:
从所述用户行为数据中筛选出满足筛选条件的用户行为数据;其中,所述筛选条件包括以下至少一种:用户行为数据的发生时间范围、用户行为数据所属的用户或者所属的用户类型;
从所述满足筛选条件的用户行为数据中识别到从起始节点到终止节点的用户行为链路数据。
5.根据权利要求1所述的方法,在所述从所述用户行为数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据之后,还包括:
确定所述用户行为链路数据中的相似节点,并对所述用户行为链路数据中的相似节点进行合并;其中,所述相似节点指示至少两个节点的语义信息满足相似度阈值和/或至少两个节点处于链路中的同一层级且在链路中的位置相近;和/或
在所述用户行为链路数据包括至少两种链路的情况下,确定所述用户行为链路数据中的相似路径,并对所述用户行为链路数据中的相似路径进行合并;其中,所述相似链路指示至少两条链路的节点数量之差小于预设差值、且所述至少两条链路包含的相同节点超过预设数量。
6.根据权利要求1所述的方法,所述根据所述用户行为链路数据进行数据挖掘,获得用户行为分析结果,包括:
根据所述用户行为链路数据进行统计处理,获得所述用户行为链路数据的统计指标。
7.根据权利要求6所述的方法,所述统计指标包括以下至少一种:用户行为链路数据中的链路种类的数量、每种链路的耗时信息、每种链路的数量、用户行为链路数据中的所有链路的总数量、每种链路的数量在所述总数量中的占比、用户行为链路数据中相同节点的数量、用户行为链路数据中任一节点到其子节点的耗时信息;其中,所述用户行为链路数据中相同节点的数量指示同一用户行为的发生次数。
8.一种用户行为分析装置,包括:
获取模块,用于获取若干用户端采集的用户行为数据,所述用户行为数据包括若干节点,任一节点用于指示用户在所述用户端中产生的用户行为;
所述获取模块,还用于获取预先指定的待分析节点;所述待分析节点至少包括起始节点和终止节点;
链路识别模块,用于从所述用户行为数据中识别出从所述起始节点到所述终止节点之间的用户行为链路数据;
用户行为分析模块,用于根据所述用户行为链路数据进行数据挖掘和/或行为诊断,获得用户行为分析结果。
9.一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。
CN202310226966.6A 2023-03-09 2023-03-09 用户行为分析方法、装置、设备及存储介质 Pending CN116186119A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310226966.6A CN116186119A (zh) 2023-03-09 2023-03-09 用户行为分析方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310226966.6A CN116186119A (zh) 2023-03-09 2023-03-09 用户行为分析方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116186119A true CN116186119A (zh) 2023-05-30

Family

ID=86432760

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310226966.6A Pending CN116186119A (zh) 2023-03-09 2023-03-09 用户行为分析方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116186119A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117319286A (zh) * 2023-09-21 2023-12-29 鸿图百奥科技(广州)有限公司 一种通信数据的传输方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117319286A (zh) * 2023-09-21 2023-12-29 鸿图百奥科技(广州)有限公司 一种通信数据的传输方法及系统

Similar Documents

Publication Publication Date Title
Zhao et al. Discovering different kinds of smartphone users through their application usage behaviors
CN108510311B (zh) 一种确定营销方案的方法、装置及电子设备
CN103377250B (zh) 基于邻域的top‑k推荐方法
CN108885624B (zh) 信息推荐系统及方法
US20190156395A1 (en) System and Method for Analyzing and Searching for Features Associated with Objects
CN107689008A (zh) 一种用户投保行为预测的方法及装置
CN109511015B (zh) 多媒体资源推荐方法、装置、存储介质及设备
US9344507B2 (en) Method of processing web access information and server implementing same
KR101725510B1 (ko) 사용자 성향을 고려한 소셜 이벤트 추천 방법 및 장치
CN112269805A (zh) 数据处理方法、装置、设备及介质
US20170357987A1 (en) Online platform for predicting consumer interest level
CN106570031A (zh) 一种业务对象的推荐方法和装置
US20150278907A1 (en) User Inactivity Aware Recommendation System
CN116186119A (zh) 用户行为分析方法、装置、设备及存储介质
Ding et al. Establishing smartphone user behavior model based on energy consumption data
CN105389714B (zh) 一种从行为数据识别用户特性的方法
CN109558528A (zh) 文章推送方法、装置、计算机可读存储介质和服务器
CN113225580A (zh) 直播数据处理方法、装置、电子设备及介质
Zhang et al. The approaches to contextual transaction trust computation in e‐Commerce environments
CN116842106A (zh) 资源线索的生成方法和装置
CN110750238A (zh) 确定产品需求的方法及装置和电子设备
CN116228402A (zh) 一种金融征信特征仓库技术支持系统
US20140325378A1 (en) Method and apparatus for generating a personalized page
CN105653645B (zh) 网络信息关注度评估方法及装置
CN110163482B (zh) 确定活动方案的安全方案数据的方法、终端设备及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination