CN113468432A - 基于移动互联网的用户行为大数据分析方法及系统 - Google Patents

基于移动互联网的用户行为大数据分析方法及系统 Download PDF

Info

Publication number
CN113468432A
CN113468432A CN202110877958.9A CN202110877958A CN113468432A CN 113468432 A CN113468432 A CN 113468432A CN 202110877958 A CN202110877958 A CN 202110877958A CN 113468432 A CN113468432 A CN 113468432A
Authority
CN
China
Prior art keywords
operation behavior
behavior
user
user operation
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110877958.9A
Other languages
English (en)
Inventor
赵天硕
黄义宝
田巧玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan Huixuehuiwan Education Technology Co ltd
Original Assignee
Dongguan Huixuehuiwan Education Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan Huixuehuiwan Education Technology Co ltd filed Critical Dongguan Huixuehuiwan Education Technology Co ltd
Priority to CN202110877958.9A priority Critical patent/CN113468432A/zh
Publication of CN113468432A publication Critical patent/CN113468432A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供一种基于移动互联网的用户行为大数据分析方法及系统,通过获取目标用户在移动互联网场景下的预设时间段内产生的用户操作行为分段,并依次将所述用户操作行为分段中的各用户操作行为作为需进行用户行为意图分析的目标用户操作行为,然后根据预先生成的包括多个用户操作行为序列的用户操作行为序列库对目标用户操作行为进行行为意图分析,最后根据各个用户操作行为分别对应的用户行为意图分析得到目标用户的当前行为画像,并根据当前行为画像向目标用户推送对应的移动互联网信息。如此,可以较为精准的分析得到目标用户基于用户操作行为分段的用户操作行为意图,用于后续的移动互联网信息推送等应用时,可以得到较佳的应用效果。

Description

基于移动互联网的用户行为大数据分析方法及系统
技术领域
本发明涉及移动互联网及大数据分析技术领域,具体而言,涉及一种基于移动互联网的用户行为大数据分析方法及系统。
背景技术
随着移动互联网技术的快速发展,人们可通过移动终端随时随地的使用移动互联网服务,例如可以通过智能手机随时浏览网页新闻、进行在线购物、下载网络数据、使用网络云服务等。进一步地,随着5G通信技术等新一代通信技术的普及,网络速度也得到了极大的提升,移动互联网给用户带来的便利性愈发明显的体现了出来。
用户在使用移动互联网的相关服务的同时,针对提供服务的各平台商家而言,针对用户流量的分析以改善服务质量以及用户体验是极为重要的研究方向之一。例如,可以针对用户的操作行为进行行为大数据分析,分析用户行为意图进行用户画像,来实现相应的流量变现等应用。
然而,经发明人研究发现,现有的基于用户行为的大数据分析方法大多都仅仅局限于用户操作行为本身的特征分析,分析过程的考虑因素较为单一、片面,最终导致分析的准确性尚有待提升,进而导致后段的应用效果也不够理想。
发明内容
基于以上问题,本发明实施例的目的在于提供一种基于移动互联网的用户行为大数据分析方法,所述方法包括:
获取目标用户在移动互联网场景下的预设时间段内产生的用户操作行为分段,并依次将所述用户操作行为分段中的各用户操作行为作为需进行用户行为意图分析的目标用户操作行为;
根据预先生成的包括多个用户操作行为序列的用户操作行为序列库对所述目标用户操作行为进行行为意图分析,得到所述目标用户操作行为的用户行为意图;
根据所述用户操作行为分段中的各个用户操作行为分别对应的用户行为意图分析得到所述目标用户的当前行为画像,并根据所述当前行为画像向所述目标用户推送对应的移动互联网信息。
优选地,一种可替代的实现方式中,所述根据预先生成的包括多个用户操作行为序列的用户操作行为序列库对所述目标用户操作行为进行行为意图分析,得到所述目标用户操作行为的用户行为意图,包括:
从所述用户操作行为序列库中获取与所述用户操作行为分段匹配的目标用户操作行为序列,所述用户操作行为序列库包括多个用户操作行为序列和各所述用户操作行为序列对应的序列统计信息,所述序列统计信息包括用户行为日志数据库中所述用户操作行为序列的序列数量;
基于所述目标用户操作行为序列的序列统计信息,确定所述用户操作行为分段中对照用户操作行为对应的序列统计信息,所述对照用户操作行为为所述用户操作行为分段中除所述目标用户操作行为以外的其它用户操作行为;
通过所述对照用户操作行为的操作行为描述和序列统计信息对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述;
根据所述目标操作行为描述和所述用户操作行为分段的关键行为描述,对所述目标用户操作行为进行用户行为意图分析,得到所述目标用户操作行为在所述用户操作行为分段中的用户行为意图。
优选地,一种可替代的实现方式中,所述从所述用户操作行为序列库中获取与所述用户操作行为分段匹配的目标用户操作行为序列,包括:
对所述用户操作行为分段进行行为划分处理,得到所述用户操作行为分段的至少一个用户操作行为;
基于所述用户操作行为在所述用户操作行为分段中的操作行为分布,对所述用户操作行为进行行为整合,得到所述用户操作行为分段对应的操作行为序列;
从预先生成的用户操作行为序列库中获取符合预设匹配关系的操作行为序列作为与所述用户操作行为分段匹配的目标用户操作行为序列。
优选地,一种可替代的实现方式中,所述用户操作行为序列包括高频操作行为组合;所述用户操作行为序列库通过以下方式获得:
获取用户行为日志数据库,并对所述用户行为日志数据库中每个参考用户操作行为分段进行行为划分处理,得到所述用户行为日志数据库中每个参考用户操作行为分段的至少一个参考用户操作行为;
针对每个参考用户操作行为,计算包含所述参考用户操作行为的参考用户操作行为分段的分段个数;
将所述分段个数达到预设阈值的参考用户操作行为作为所述用户行为日志数据库的初始高频操作行为;
基于所述初始高频操作行为,生成所述用户行为日志数据库对应的高频操作行为组合和所述高频操作行为组合对应的序列统计信息,得到预先生成的用户操作行为序列库;
其中,所述基于所述初始高频操作行为,生成所述用户行为日志数据库对应的高频操作行为组合和所述高频操作行为组合对应的序列统计信息,包括:
基于所述初始高频操作行为,对所述参考用户操作行为分段进行行为去噪处理,得到行为去噪处理后的参考用户操作行为分段;
将所述初始高频操作行为作为在先操作行为,并确定在所述行为去噪处理后的参考用户操作行为分段中所述在先操作行为对应的在后操作行为;
当所述在后操作行为具有所述初始高频操作行为时,基于所述在后操作行为生成所述用户行为日志数据库对应的高频操作行为组合;
计算包含所述高频操作行为组合的参考用户操作行为分段的数量,得到所述高频操作行为组合对应的序列统计信息;
其中,所述基于所述在后操作行为生成所述用户行为日志数据库对应的高频操作行为组合,包括:
当所述在后操作行为具有所述初始高频操作行为时,将所述在后操作行为中的初始高频操作行为与所述在后操作行为对应的在先操作行为进行组合,得到操作行为组合,并确定在所述行为去噪处理后的参考用户操作行为分段中所述操作行为组合对应的当前在后操作行为;
针对获取到的各个在先操作行为,计算包含所述在先操作行为的参考用户操作行为分段的数量;
基于包含所述在先操作行为的参考用户操作行为分段的数量,从各个在先操作行为中确定所述用户行为日志数据库对应的高频操作行为组合。
优选地,一种可替代的实现方式中,所述用户操作行为序列还包括高频操作行为类别序列;所述用户操作行为序列库通过以下方式得到:
获取用户行为日志数据库,所述用户行为日志数据库包括至少一个参考用户操作行为分段;
对所述参考用户操作行为分段中的每个用户操作行为进行操作行为类别分析,得到所述参考用户操作行为分段对应的操作行为类别序列,所述操作行为类别序列包括所述参考用户操作行为分段中每个用户操作行为对应的操作行为类别;
针对各操作行为类别,计算包含所述操作行为类别的参考用户操作行为分段的分段个数;
将所述分段个数达到预设阈值的操作行为类别作为所述用户行为日志数据库的初始高频操作行为类别;
基于所述初始高频操作行为类别,生成所述用户行为日志数据库对应的高频操作行为类别序列和所述高频操作行为类别序列对应的序列统计信息,得到预先生成的用户操作行为序列库。
优选地,一种可替代的实现方式中,所述用户操作行为序列还包括高频关联行为组合;所述用户操作行为序列库通过以下方式得到:
获取用户行为日志数据库,所述用户行为日志数据库包括至少一个参考用户操作行为分段;
对所述参考用户操作行为分段中的每个用户操作行为进行关联行为分析,得到所述参考用户操作行为分段对应的关联行为组合,所述关联行为组合包括所述参考用户操作行为分段中每个用户操作行为对应的关联行为信息;
针对各关联行为信息,计算包含所述关联行为信息的参考用户操作行为分段的分段个数;
将所述分段个数达到预设阈值的关联行为信息作为所述用户行为日志数据库的初始高频关联行为;
基于所述初始高频关联行为,生成所述用户行为日志数据库对应的高频关联行为组合和所述高频关联行为组合对应的序列统计信息,得到预先生成的用户操作行为序列库。
优选地,一种可替代的实现方式中,所述基于所述目标用户操作行为序列的序列统计信息,确定所述用户操作行为分段中对照用户操作行为对应的序列统计信息,包括:
确定所述用户操作行为分段中与所述目标用户操作行为序列匹配的目标操作行为序列;
对于所述目标操作行为序列中的对照用户操作行为,将所述目标用户操作行为序列的序列统计信息作为所述对照用户操作行为的序列统计信息;
对于所述用户操作行为分段中未涵盖于所述目标操作行为序列的对照用户操作行为,将预设序列统计信息作为所述对照用户操作行为的序列统计信息;
所述通过所述对照用户操作行为的操作行为描述和序列统计信息对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述,包括:
根据所述对照用户操作行为的操作行为描述和序列统计信息,得到所述用户操作行为分段的关联操作行为描述;
根据所述关联操作行为描述对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述。
优选地,一种可替代的实现方式中,所述通过所述对照用户操作行为的操作行为描述和序列统计信息对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述,包括:
通过预先训练得到的用户行为意图解析网络,通过所述对照用户操作行为的操作行为描述和序列统计信息对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述;
所述用户行为意图解析网络通过以下方式进行训练得到:
获取网络训练参考数据集,所述网络训练参考数据集包括参考用户操作行为分段中需进行用户行为意图分析的目标参考用户操作行为的标定操作行为描述,以及对照参考用户操作行为的操作行为描述和序列统计信息,所述对照参考用户操作行为为所述参考用户操作行为分段中除所述目标参考用户操作行为以外的其它用户操作行为;
通过用户行为意图解析网络,根据所述对照参考用户操作行为的操作行为描述和序列统计信息,得到所述参考用户操作行为分段的关联操作行为描述;
根据所述关联操作行为描述对所述目标参考用户操作行为进行行为描述分析,得到所述目标参考用户操作行为的预测操作行为描述;
基于所述目标参考用户操作行为的标定操作行为描述和预测操作行为描述计算得到行为描述代价指标,并根据计算得到的行为描述代价指标对所述用户行为意图解析网络的网络参数进行迭代优化,直到所述行为描述代价指标达到预设训练终止条件,得到训练后的用户行为意图解析网络。
优选地,一种可替代的实现方式中,所述根据所述目标操作行为描述和所述用户操作行为分段的关键行为描述,对所述目标用户操作行为进行用户行为意图分析,得到所述目标用户操作行为在所述用户操作行为分段中的用户行为意图,包括:
确定所述目标用户操作行为的至少一种待定用户行为意图;
基于所述目标操作行为描述,从所述目标用户操作行为的至少一种待定用户行为意图中挑选第一推定用户行为意图;
基于所述用户操作行为分段的关键行为描述,从所述目标用户操作行为的至少一种待定用户行为意图中挑选第二推定用户行为意图;
根据所述第一推定用户行为意图和所述第二推定用户行为意图,确定所述目标用户操作行为在所述用户操作行为分段中的用户行为意图;
对所述用户操作行为分段的关键行为描述和所述用户操作行为分段中目标用户操作行为的目标操作行为描述进行类别划分处理,得到所述用户操作行为分段中所述目标用户操作行为的用户行为意图的意图类型。
进一步地,本发明实施例的目的还在于提供一种基于移动互联网的用户行为大数据分析系统,包括处理器和存储器,所述存储器和所述处理器连接,所述存储器用于存储程序、指令或代码,所述处理器用于执行所述存储器中的程序、指令或代码,以实现上述的方法。
综上所述,本发明实施例提供的基于移动互联网的用户行为大数据分析方法及系统,通过获取目标用户在移动互联网场景下的预设时间段内产生的用户操作行为分段,并依次将所述用户操作行为分段中的各用户操作行为作为需进行用户行为意图分析的目标用户操作行为,然后根据预先生成的包括多个用户操作行为序列的用户操作行为序列库对所述目标用户操作行为进行行为意图分析,得到所述目标用户操作行为的用户行为意图,最后根据所述用户操作行为分段中的各个用户操作行为分别对应的用户行为意图分析得到所述目标用户的当前行为画像,并根据所述当前行为画像向所述目标用户推送对应的移动互联网信息。如此,通过包含多个用户操作行为的用户操作行为分段结合预先得到的用户操作行为序列库进行用户行为意图的深度融合分析,可以较为精准的分析得到所述目标用户基于所述用户操作行为分段的用户操作行为意图。如此,用于后续的移动互联网信息推送等应用时,可以得到较佳的应用效果。
此外,本实施例中,通过从所述用户操作行为序列库中获取与所述用户操作行为分段匹配的目标用户操作行为序列,基于所述目标用户操作行为序列的序列统计信息,确定所述用户操作行为分段中对照用户操作行为对应的序列统计信息,并通过所述对照用户操作行为的操作行为描述和序列统计信息对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述;最后,根据所述目标操作行为描述和所述用户操作行为分段的关键行为描述,对所述目标用户操作行为进行用户行为意图分析,得到所述目标用户操作行为在所述用户操作行为分段中的用户行为意图。如此,可以基于与用户操作行为分段匹配的用户操作行为序列和关键行为描述进行用户操作行为的行为意图分析,可进一步针对用户操作行为的行为意图分析的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍。
图1是本发明实施例提供的用于执行基于移动互联网的用户行为大数据分析方法的流程示意图。
图2是本发明实施例提供的用户实现上述方法的用户行为大数据分析系统的系统架构示意图。
图3是图1中步骤200的详细实现过程示意图。
图4是图2中的用户行为大数据分析系统所包括的功能模块示意图。
具体实施方式
请参阅图1,图1是本发明实施例提供的基于移动互联网的用户行为大数据分析方法的流程示意图。本实施例中,所述方法可由一种基于移动互联网的用户行为大数据分析系统执行,下面进行详细介绍。
例如图2所示,是本发明实施例提供的用于执行基于移动互联网的用户行为大数据分析方法的用户行为大数据分析系统20的架构示意图。举例来说,所述用户行为大数据分析系统20可以是,但不限于,具有大数据分析能力的电子设备或计算机设备。例如,所述用户行为大数据分析系统20可以是独立的服务器或者由至少两个服务器形成的服务器集群或云服务平台。此外,所述用户行为大数据分析系统20也可以是用于提供移动互联网有关的网络云服务、网络云数据库、网络云计算、网络云存储等服务的云服务器或云服务中心。
优选地,如图2所示,所述用户行为大数据分析系统20可以包括存储器21、处理器22、以及大数据分析单元23。本实施例中,所述存储器21、处理器22彼此之间可以直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条通信总线实现电性连接。所述存储器21可以是各种可能的存储介质,例如,本实施例优选为一种非易失性的机器可读存储介质。所述存储器21用于存储各种类型的程序、指令或可执行代码,例如所述大数据分析单元23所包括的各种软件功能模块对应的软件程序部分。其中,所述大数据分析单元23可以包括至少一个以软件形式储存于所述存储器21中的程序功能模块、软件功能模块或逻辑模块,所述处理器22通过运行存储在存储器21内的软件程序以及模块,例如本申请实施例中的大数据分析单元23中的软件程序以及模块,从而实现所述用户行为大数据分析系统20的各种功能应用以及数据处理,例如实现本申请实施例提供的相关方法。
其中,所述存储器21可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。所述处理器22可能是一种具有数据处理能力的芯片,例如可以是,但不限于,通用处理器,包括中央处理器 (Central Processing Unit,CPU)、多核心处理器、网络处理器 (NetworkProcessor,NP)等,用于执行本申请实施例中的方法所包括的步骤、方法及逻辑程序等。
在上述内容的基础上,下面对图1所示的基于移动互联网的用户行为大数据分析方法进行详细说明。如图1所示,所述方法可以包括下述的步骤100-300的内容。
步骤100,获取目标用户在移动互联网场景下的预设时间段内产生的用户操作行为分段,并依次将所述用户操作行为分段中的各用户操作行为作为需进行用户行为意图分析的目标用户操作行为。
本实施例中,所述用户操作行为分段可以是指所述目标用户在所述移动互联网场景下在所述预设时间段内产生的多个用户操作行为的组合,其可以包括两个或两个以上的用户操作行为。所述移动互联网场景可以是目标用户使用移动互联网终端而使用的任何相关的移动互联网场景,例如,针对移动互联网浏览器的网页浏览、网页收藏、内容分享、内容订阅、线上购物、网络评论等任何相关的用户操作行为,本实施例对此不进行具体的限制。
进一步地,所述用户操作行为分段也可以被理解为一种包括多个用户操作行为或者由多个用户操作行为所形成的一个行为序列或者行为组合。在实际实施时,可以根据预先设定的用户操作行为采集周期对所述目标用户在所述移动互联网场景下产生的用户操作行为进行行为采集而得到。例如,所述预先设定的用户操作行为采集周期可以是所述目标用户在所述移动互联网场景下的一串连续的操作所形成的时间段也可以是预先设定的一个固定的时间周期(如从检测到目标用户的操作行为开始的24小时内或者一周内),具体可以视实际需求而进行设定。同时,也可以是设置一个约束条件,例如,在预先设定的用户操作行为采集周期内所采集到的用户操作行为的数量低于预先设定的数量(如5次)则可以放弃本次的采集操作,而不形成所述用户操作行为分段,或者通过操作行为填充(使用预设的行为数据)的方式得到具有一定用户操作行为数量的用户操作行为分段。
所述用户操作行为可以是所述目标用户通过用户终端访问移动互联网场景下的相关网络服务而产生。具体地,用户终端可以是智能手机、平板电脑、笔记本电脑、个人计算机、智能穿戴式设备等。具体地,可以在所述用户终端上下载并安装所述移动互联网场景下提供的相关应用程序或客户端,如APP、浏览器等。
步骤200,根据预先生成的包括多个用户操作行为序列的用户操作行为序列库对所述目标用户操作行为进行行为意图分析,得到所述目标用户操作行为的用户行为意图。
本申请实施例提供的基于移动互联网的用户行为大数据分析方法可以基于与用户操作行为分段匹配的用户操作行为序列和关键行为描述进行用户操作行为的关联分析,根据用户操作行为分段得到目标用户的多个用户操作行为分别对应的用户行为意图,再进一步基于用户操作行为意图进行目标用户的行为画像分析,可以有效提升用户操作行为意图分析的可靠性和精准性,可以提升基于用户行为大数据分析的后期应用的效果,例如提升信息推送的精准性和推送效果。
进一步地,本实施例中,针对步骤200,可以通过图3所示的步骤2001-2004实现,下面进行介绍。
步骤2001,从所述用户操作行为序列库中获取与所述用户操作行为分段匹配的目标用户操作行为序列。
其中,所述预先生成的用户操作行为序列库包括用户操作行为序列和所述用户操作行为序列对应的序列统计信息,所述序列统计信息包括用户行为日志数据库中所述用户操作行为序列的序列数量。在其他实施例中,所述序列统计信息例如还可以包括表征所述用户操作行为序列在所述用户行为日志数据库中的序列出现频次的序列支持度。
其中,用户操作行为序列具体可以指用户行为日志数据库中,序列统计信息达到相应条件的序列,例如可以包括操作行为序列、也可以是操作行为类别序列或关联行为组合等。用户操作行为序列可以包括高频操作行为组合、高频操作行为类别序列和高频关联行为组合等等,本实施例对此不作限制。序列统计信息可以包括用户行为日志数据库中所述用户操作行为序列的序列数量,也可以是用户行为日志数据库中包含所述用户操作行为序列的参考用户操作行为分段的数量。其中,预先生成的用户操作行为序列库可以包括用户操作行为序列及其对应的序列统计信息。本实施例中,所述参考用户操作行为分段可以理解为历史产生的包含所述用户操作行为序列的任意一种用户操作行为分段,用于本实施例分析所述目标用户在预设时间段内产生的用户操作行为分段的用户行为意图作为参考。
本发明实施例中,上述的相应条件可以包括所述序列统计信息中包括的所述用户行为日志数据库中所述用户操作行为序列的序列数量达到了设定的数量阈值。
优选地,一个用户操作行为可以是具有一个最小行为单元的行为序列。基于此,针对每个所述用户操作行为,可以将用户行为日志数据库中,包含这个用户操作行为的参考用户操作行为分段的数量,包含于对应的用户操作行为的序列统计信息中。
其中,可替代地,步骤2001中,从预先生成的用户操作行为序列库中获取与所述用户操作行为分段匹配的目标用户操作行为序列,的具体实现方式可以包括以下步骤:
首先,对所述用户操作行为分段进行行为划分处理,得到所述用户操作行为分段的至少一个用户操作行为;
其次,基于所述用户操作行为在所述用户操作行为分段中的操作行为分布,对所述用户操作行为进行行为整合,得到所述用户操作行为分段的操作行为序列;
然后,从预先生成的用户操作行为序列库中获取符合预设匹配关系的操作行为序列作为与所述用户操作行为分段匹配的目标用户操作行为序列。
一般来说,用户操作行为分段是由多个用户操作行为组成,对用户操作行为分段进行行为划分处理即可得到多个用户操作行为,需进行用户行为意图分析的目标用户操作行为可以是该多个用户操作行为中的其中任意一个。通过对行为划分得到的用户操作行为进行行为整合,可以得到用户操作行为分段所包括的至少一个操作行为序列。
其中,用户操作行为分段包含各个操作行为序列的每一个序列单元(例如,所述用户操作行为),并且这些序列单元在用户操作行为分段中的操作行为分布和在操作行为序列中的操作行为分布相同。例如,以用户操作行为分段(Operation1、Operation2、Operation3、Operation4、Operation5)为例,则该用户操作行为分段的一个操作行为序列可以是(Operation1、Operation2、Operation3),而(Operation1、Operation3、Operation2)则不是用户操作行为分段的一个操作行为序列,因为用户操作行为分段(Operation1、Operation2、Operation3、Operation4、Operation5)中是先出现用户操作行为“Operation2”,之后再产生的用户操作行为“Operation3”。通常理解,操作行为序列在用户操作行为分段中可以是连续的也可以是离散的,具体不进行限定。
其中,预设匹配关系可以视实际需求而定,示例性地,可以将包含于所述预先生成的用户操作行为序列库中、且符合预设匹配关系的操作行为序列确定为与所述用户操作行为分段匹配的目标用户操作行为序列。例如,可以将存在于所述预先生成的用户操作行为序列库中的操作行为序列确定为待定操作行为序列,再将与所述用户操作行为分段的匹配度最高的待定操作行为序列确定为与所述用户操作行为分段匹配的目标用户操作行为序列。其中,多个序列单元通过操作行为分布后形成一个序列,序列单元的数量可以被看做对应的序列长度。
本实施例中,目标用户操作行为序列可以包含需进行用户行为意图分析的目标用户操作行为,例如,可以从第一个用户操作行为开始,依次遍历每个用户操作行为,将当前遍历的用户操作行为作为所述目标用户操作行为。
其中,预先生成的用户操作行为序列库可以通过预先获得的用户操作行为采集模型进行用户操作行为采集并对用户操作行为进行大数据分析和整理后生成。
其中,可替代地,所述用户操作行为序列可以包括高频操作行为组合,在此基础之上 ,本发明实施例还可以通过以下方法获得所述用户操作行为序列库。
首先,获取用户行为日志数据库,并对所述用户行为日志数据库中每个参考用户操作行为分段进行行为划分处理,得到所述用户行为日志数据库中每个参考用户操作行为分段的至少一个参考用户操作行为;
其次,针对每个参考用户操作行为,计算包含所述参考用户操作行为的参考用户操作行为分段的分段个数;
然后,将所述分段个数达到预设阈值的参考用户操作行为作为所述用户行为日志数据库的初始高频操作行为;
最后,基于所述初始高频操作行为,生成所述用户行为日志数据库对应的高频操作行为组合和所述高频操作行为组合对应的序列统计信息,得到预先生成的用户操作行为序列库。
其中,所述用户行为日志数据库可以是基于所述移动互联网环境下对历史产生的用户操作行为进行行为统计和分析而得到的数据库,以用于后续的其他用户行为的参考分析。所述预设阈值可以预先根据需求而设定,例如,如可以设定为预设的序列统计数量阈值,假设用户行为日志数据库中包含16个参考用户操作行为分段,而序列统计数量阈值为5,那么参考用户操作行为需要至少在5个参考用户操作行为分段中出现才能作为该用户行为日志数据库的初始高频操作行为。通过计算包含参考用户操作行为的参考用户操作行为分段的分段个数,可以通过行为去噪删除未达到预设序列统计数量阈值的参考用户操作行为。其中,本实施例中,是基于参考用户操作行为分段对应的操作行为序列,获得用户行为日志数据库中达到序列统计数量阈值的高频操作行为组合。
其中,可替代地,所述基于所述初始高频操作行为,生成所述用户行为日志数据库对应的高频操作行为组合和所述高频操作行为组合对应的序列统计信息,可以通过以下方式实现:
首先,基于所述初始高频操作行为,对所述参考用户操作行为分段进行行为去噪处理,得到行为去噪处理后的参考用户操作行为分段;
然后,将所述初始高频操作行为作为在先操作行为,并确定在所述行为去噪处理后的参考用户操作行为分段中所述在先操作行为对应的在后操作行为;例如,可以将所述参考用户操作行为分段中未涵盖于初始高频操作行为的用户操作行为进行删除,得到行为去噪处理后的参考用户操作行为分段;
其次,当所述在后操作行为具有所述初始高频操作行为时,基于所述在后操作行为生成所述用户行为日志数据库对应的高频操作行为组合;
最后,计算包含所述高频操作行为组合的参考用户操作行为分段的数量,得到所述高频操作行为组合对应的序列统计信息。
具体地,针对任意一个在先操作行为,在对应的序列里所述在先操作行为之后的用户操作行为则被作为在后操作行为,在后操作行为也可以被叫做后继操作行为,在先操作行为也可被叫做前序操作行为。例如,行为去噪处理后的参考用户操作行为分段为(Operation1、Operation2、Operation3、Operation4、Operation5),初始高频操作行为为“Operation2”,则行为去噪处理后的参考用户操作行为分段中,在先操作行为“Operation2”对应的在后操作行为包括Operation3、Operation4、以及Operation5。
其中,一个参考用户操作行为分段包含高频操作行为组合,该高频操作行为组合在参考用户操作行为分段中可以不是连续的,也可以是连续的,但高频操作行为组合中各用户操作行为在参考用户操作行为分段中的操作行为分布对应的位置信息和在高频操作行为组合中的操作行为分布对应的位置信息一致。
其中,可替代地,当所述在后操作行为具有所述初始高频操作行为时,可以将所述在后操作行为中的初始高频操作行为与所述在后操作行为对应的在先操作行为进行组合,得到操作行为组合,并确定在所述行为去噪处理后的参考用户操作行为分段中所述操作行为组合对应的当前在后操作行为,然后针对获取到的各个在先操作行为,计算包含所述在先操作行为的参考用户操作行为分段的数量;最后,基于包含所述在先操作行为的参考用户操作行为分段的数量,从各个在先操作行为中确定所述用户行为日志数据库对应的高频操作行为组合。其中,所述的高频操作行为组合可以是包括出现频次达到预设频次的操作行为组合得到。所谓“高频”是一个相对含义的术语,例如,达到预设频次及可被认为是“高频”的定义,本实施例对此不进行限定。
其中,对于包含在先操作行为的参考用户操作行为分段,在先操作行为在参考用户操作行为分段中可以是连续也可以是离散的,具体不进行限定。但是,在先操作行为中各用户操作行为在参考用户操作行为分段中的操作行为分布位置顺序和在在先操作行为中的操作行为分布位置顺序是对应的。
进一步地,上述的基于包含所述在先操作行为的参考用户操作行为分段的数量,从各个在先操作行为中确定所述用户行为日志数据库对应的高频操作行为组合,具体可以将所述数量达到预设阈值的在先操作行为确定为所述用户行为日志数据库对应的高频操作行为组合。
进一步地,在上述内容中,当所述在后操作行为具有所述初始高频操作行为时,可以将所述在后操作行为中的初始高频操作行为与所述在后操作行为对应的在先操作行为进行组合,得到操作行为组合;然后确定在所述行为去噪处理后的参考用户操作行为分段中所述操作行为组合对应的当前在后操作行为,迭代执行上述步骤,直到某个在先操作行为之后不存在在后操作行为为止。上述组合的方式可以是将所述在后操作行为中的初始高频操作行为融合在所述在后操作行为对应的在先操作行为之后,融合后的操作行为作为所述操作行为组合。
此外,本实施例中,通过对包括多个参考用户操作行为分段的用户行为日志数据库进行用户操作行为序列进行操作行为的频次采集或解析,可以得到高频操作行为组合。其中,每一个参考用户操作行为分段可以包括至少一个提前确定的用户操作行为,高频操作行为组合可以是指包含所述提前确定的用户操作行为、且序列统计信息达到预设条件的序列,所述高频操作行为组合可以包括至少一个用户操作行为。
其中,可替代地,本实施例中,所述用户操作行为序列还包括高频操作行为类别序列,基于此,本实施例中,还可以包括以下步骤:
获取用户行为日志数据库,所述用户行为日志数据库包括至少一个参考用户操作行为分段;
对所述参考用户操作行为分段中的每个用户操作行为进行操作行为类别分析,得到所述参考用户操作行为分段对应的操作行为类别序列,所述操作行为类别序列包括所述参考用户操作行为分段中每个用户操作行为对应的操作行为类别;
针对各操作行为类别,计算包含所述操作行为类别的参考用户操作行为分段的分段个数;
将所述分段个数达到预设阈值的操作行为类别作为所述用户行为日志数据库的初始高频操作行为类别;
基于所述初始高频操作行为类别,生成所述用户行为日志数据库对应的高频操作行为类别序列和所述高频操作行为类别序列对应的序列统计信息,得到预先生成的用户操作行为序列库。
其中,对参考用户操作行为分段中每个用户操作行为的操作行为类别分析,具体可以是为参考用户操作行为分段中每个用户操作行为进行操作行为进行类别标定,例如对用户行为日志数据库中的每一参考用户操作行为分段中的用户操作行为配置操作行为类别标识,以明确用户操作行为的操作行为类别。
示例性地,可以通过用户操作行为序列分类模型对操作行为类别标定序列的操作行为类别进行分类,得到对应的高频操作行为类别序列,该用户操作行为序列分类模型例如可以是基于K-means聚类算法的分类模型,具体不进行限定。具体地,高频操作行为类别序列可以包括多个操作行为类别,该高频操作行为类别序列为在用户行为日志数据库中的出现频次达到预设阈值的操作行为类别序列,该预设阈值为判定操作行为类别序列是否为高频操作行为类别序列的设定值,例如用户行为日志数据库包含50个参考用户操作行为分段,该预设阈值为10,则包含对应操作行为类别序列的数量达到10个时,将该操作行为类别判定为高频操作行为类别序列,该高频操作行为类别序列对于用户操作行为意图的分析具有一定的重要性程度。
在上述内容的基础上,所述基于所述初始高频操作行为类别,生成所述用户行为日志数据库对应的高频操作行为类别序列和所述高频操作行为类别序列对应的序列统计信息,得到预先生成的用户操作行为序列库的实现方式可以是:
基于所述初始高频操作行为类别,对所述参考用户操作行为分段的操作行为类别序列进行行为去噪处理,得到所述参考用户操作行为分段对应的处理后操作行为类别序列;
将所述初始高频操作行为类别作为在先操作行为,并确定在所述处理后操作行为类别序列中所述在先操作行为对应的在后操作行为;
当所述在后操作行为具有所述初始高频操作行为类别时,基于所述在后操作行为生成所述用户行为日志数据库对应的高频操作行为类别序列;
计算包含所述高频操作行为类别序列的参考用户操作行为分段的数量,得到所述高频操作行为类别序列对应的序列统计信息。
进一步地,当所述在后操作行为具有所述初始高频操作行为类别时,基于所述在后操作行为生成所述用户行为日志数据库对应的高频操作行为类别序列,可以包括:
当所述在后操作行为具有所述初始高频操作行为类别时,将所述在后操作行为中的初始高频操作行为类别与所述在后操作行为对应的在先操作行为进行组合,得到操作行为组合,并确定在所述处理后操作行为类别序列中所述操作行为组合对应的当前在后操作行为;
针对获取到的各个在先操作行为,计算包含所述在先操作行为的参考用户操作行为分段的数量;
基于包含所述在先操作行为的参考用户操作行为分段的数量,从各个在先操作行为中确定所述用户行为日志数据库对应的高频操作行为类别序列。
其中,可替代地,所述用户操作行为序列还包括高频关联行为组合,基于此,本实施例中,所述用户操作行为序列库可以通过以下方式得到。
(1)、获取用户行为日志数据库,所述用户行为日志数据库包括至少一个参考用户操作行为分段。
(2)、对所述参考用户操作行为分段中的每个用户操作行为进行关联行为分析,得到所述参考用户操作行为分段对应的关联行为组合,所述关联行为组合包括所述参考用户操作行为分段中每个用户操作行为对应的关联行为信息。
(3)、针对各关联行为信息,计算包含所述关联行为信息的参考用户操作行为分段的分段个数。
(4)将所述分段个数达到预设阈值的关联行为信息作为所述用户行为日志数据库的初始高频关联行为。
(5)基于所述初始高频关联行为,生成所述用户行为日志数据库对应的高频关联行为组合和所述高频关联行为组合对应的序列统计信息,得到预先生成的用户操作行为序列库。
例如,可首先基于所述初始高频关联行为,对所述参考用户操作行为分段的关联行为组合进行行为去噪处理,得到所述参考用户操作行为分段对应的处理后关联行为组合;然后,将所述初始高频关联行为作为在先操作行为,并确定在所述处理后关联行为组合中所述在先操作行为对应的在后操作行为;其次,当所述在后操作行为具有所述初始高频关联行为时,基于所述在后操作行为生成所述用户行为日志数据库对应的高频关联行为组合;最后,计算包含所述高频关联行为组合的参考用户操作行为分段的数量,得到所述高频关联行为组合对应的序列统计信息,以用于生成所述用户操作行为序列库。
其中,当所述在后操作行为具有所述初始高频关联行为时,可以将所述在后操作行为中的初始高频关联行为与所述在后操作行为对应的在先操作行为进行组合,得到操作行为组合,并确定在所述处理后关联行为组合中所述操作行为组合对应的当前在后操作行为;针对获取到的各个在先操作行为,计算包含所述在先操作行为的参考用户操作行为分段的数量;基于包含所述在先操作行为的参考用户操作行为分段的数量,从各个在先操作行为中确定所述用户行为日志数据库对应的高频关联行为组合。
步骤2002、基于所述目标用户操作行为序列的序列统计信息,确定所述用户操作行为分段中对照用户操作行为对应的序列统计信息。
其中,本实施例中,所述对照用户操作行为为所述用户操作行为分段中除所述目标用户操作行为以外的其它用户操作行为。
本实施例中,在一种可能的实现方式中,基于步骤2002,可以先确定所述用户操作行为分段中与所述目标用户操作行为序列匹配的目标操作行为序列;然后,对于所述目标操作行为序列中的对照用户操作行为,将所述目标用户操作行为序列的序列统计信息作为所述对照用户操作行为的序列统计信息;对于所述用户操作行为分段中未涵盖于所述目标操作行为序列的对照用户操作行为,可以将预设序列统计信息作为所述对照用户操作行为的序列统计信息。
具体地,目标操作行为序列中的每个用户操作行为与目标用户操作行为序列中的每个用户操作行为具有对应关系,且用户操作行为的操作行为分布对应的位置信息保持一致。其中,对照用户操作行为的序列统计信息可以用于确定对照用户操作行为的行为意图影响权重的主要依据之一。
步骤2003、通过所述对照用户操作行为的操作行为描述和序列统计信息对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述。
其中,对照用户操作行为的操作行为描述具体可以是对照用户操作行为的操作行为特征向量。本发明实施例中,可以基于对照用户操作行为的操作行为特征向量进行行为描述分析。
基于此,针对步骤2003,可以通过下述的方式具体实现:
首先,根据所述对照用户操作行为的操作行为描述和序列统计信息,得到所述用户操作行为分段的关联操作行为描述;
然后,根据所述关联操作行为描述对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述。
其中,针对各个对照用户操作行为,可以将对照用户操作行为的操作行为描述和其对应的序列统计信息进行关联分析,得到用户操作行为分段的关联操作行为描述。
其中,目标用户操作行为可能具有多种用户行为意图,也即目标用户操作行为可以对应有多个操作行为特征向量,每一个所述操作行为特征向量可以与一种用户行为意图相对应;在不同的实际应用场景中,目标用户操作行为的行为倾向或目的可能不同,因此,根据目标用户操作行为的关联的操作行为描述,可以准确的确定目标用户操作行为在用户操作行为分段中的用户行为意图。
步骤2004、根据所述目标操作行为描述和所述用户操作行为分段的关键行为描述,对所述目标用户操作行为进行用户行为意图分析,得到所述目标用户操作行为在所述用户操作行为分段中的用户行为意图。
其中,本发明实施例中,可以将目标操作行为描述和关键行为描述进行特征融合分析,然后根据特征融合分析结果得到所述目标用户操作行为在用户操作行为分段中的用户行为意图。
例如,在一种可能的实施方式中,可以先确定所述目标用户操作行为的至少一种待定用户行为意图;然后,基于所述目标操作行为描述,从所述目标用户操作行为的至少一种待定用户行为意图中挑选第一推定用户行为意图;其次,基于所述用户操作行为分段的关键行为描述,从所述目标用户操作行为的至少一种待定用户行为意图中挑选第二推定用户行为意图;最后根据所述第一推定用户行为意图和所述第二推定用户行为意图,确定所述目标用户操作行为在所述用户操作行为分段中的用户行为意图。
又例如,可以将所述第一推定用户行为意图和所述第二推定用户行为意图进行组合作为所述用户操作行为分段中的用户行为意图。所述挑选的第一推定该用户行为意图可以是与所述目标操作行为描述的意图匹配度最高的其中一个,挑选的第二推定用户行为意图可以是与所述关键行为描述匹配度最高的其中一个。所述关键行为描述可以是根据所述用户操作行为分段中各个不同的用户操作行为进行关键行为分析而得到,例如可以根据各个用户操作行为具体的行为持续时长、操作行为出现频次(支持度)等进行分析而得到。所述关键行为描述可以用于表征所述用户操作行为分段中的关键操作行为的相关描述信息,例如可以包括。某个关键操作行为的操作行为特征向量。
进一步地,本实施例中,可以提前分析得到目标用户操作行为的一个或多个待定用户行为意图,例如可以将目标用户操作行为的所有用户行为意图均作为待定用户行为意图,再根据目标操作行为描述和用户操作行为分段的关键行为描述,从这些待定用户行为意图中挑选一个用户行为意图作为目标用户操作行为在用户操作行为分段中的用户行为意图。
在一种可能的实时方式中,基于所述目标操作行为描述,从所述目标用户操作行为的至少一种待定用户行为意图中挑选第一推定用户行为意图时,可以首先计算所述目标操作行为描述和所述目标用户操作行为的至少一种待定用户行为意图之间的第一意图关联度;根据所述第一意图关联度,从所述目标用户操作行为的至少一种待定用户行为意图中挑选第一推定用户行为意图。例如,可以将第一意图关联度达到预设关联度阈值指标的待定用户行为意图挑选为所述第一推定用户行为意图。又例如,还可以将最大的第一意图关联度对应的待定用户行为意图作为第一推定用户行为意图。
在一种可能的实时方式中,基于所述用户操作行为分段的关键行为描述,从所述目标用户操作行为的至少一种待定用户行为意图中挑选第二推定用户行为意图时,也可以计算所述用户操作行为分段的关键行为描述和所述目标用户操作行为的至少一种待定用户行为意图之间的第二意图关联度,然后根据所述第二意图关联度,从所述目标用户操作行为的至少一种待定用户行为意图中挑选第二推定用户行为意图。相应地,也可以将第二意图关联度达到预设关联度阈值指标的待定用户行为意图挑选为所述第二推定用户行为意图。又例如,还可以将最大的第二意图关联度对应的待定用户行为意图作为第二推定用户行为意图。
本实施例中,目标操作行为描述具体可以包括通过目标高频操作行为组合的序列统计信息得到的目标操作行为描述、通过目标高频操作行为类别序列的序列统计信息得到的目标操作行为描述,通过目标高频关联行为组合的序列统计信息得到的目标操作行为描述等,具体不进行限定。
其中,用户操作行为分段可以包括多个,每个用户操作行为分段中包含需进行用户行为意图分析的目标用户操作行为,目标用户操作行为为需要确定用户行为意图的意图类型的用户操作行为。如此,本实施例可以通过上述方法获取多个用户操作行为分段的关键行为描述、以及对应用户操作行为分段中的目标用户操作行为的目标操作行为描述等。在上述内容的基础上,本实施例中,还可以对所述用户操作行为分段的关键行为描述和所述用户操作行为分段中目标用户操作行为的目标操作行为描述进行类别划分处理,得到所述用户操作行为分段中所述目标用户操作行为的用户行为意图的意图类型。例如,可以对各个用户操作行为分段的关键行为描述进行类别划分处理,得到第一类别划分结果;然后对各个用户操作行为分段中目标用户操作行为的目标操作行为描述进行类别划分处理,得到第二类别划分结果;最后,根据第一类别划分结果和第二类别划分结果,确定所述用户操作行为分段中所述目标用户操作行为的用户行为意图的意图类型。
进一步地,在实施例中,针对步骤200,还可以通过人工智能网络模型通过所述对照用户操作行为的操作行为描述和序列统计信息对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述。例如,可以通过预先训练得到的用户行为意图解析网络,通过所述对照用户操作行为的操作行为描述和序列统计信息对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述。
本实施例中,所述用户行为意图解析网络可以由多个携带数据标签或者不携带数据标签的网络训练参考数据集进行模型训练而得到。本实施例中,优选地,可以通过携带数据标签的网络训练参考数据集通过有监督的模型训练方式进行训练得到。示例性地,所述网络训练参考数据集包括多个参考用户操作行为分段中对照参考用户操作行为的操作行为描述和序列统计信息,对应的数据标签可以包括参考用户操作行为分段中需进行用户行为意图分析的目标参考用户操作行为的标定操作行为描述。
作为一种示例,所述用户行为意图解析网络的训练过程示例性说明如下。
(1)获取网络训练参考数据集,所述网络训练参考数据集包括参考用户操作行为分段中需进行用户行为意图分析的目标参考用户操作行为的标定操作行为描述,以及对照参考用户操作行为的操作行为描述和序列统计信息,所述对照参考用户操作行为为所述参考用户操作行为分段中除所述目标参考用户操作行为以外的其它用户操作行为。
(2)通过用户行为意图解析网络,根据所述对照参考用户操作行为的操作行为描述和序列统计信息,得到所述参考用户操作行为分段的关联操作行为描述。
(3)根据所述关联操作行为描述对所述目标参考用户操作行为进行行为描述分析,得到所述目标参考用户操作行为的预测操作行为描述。
(4)基于所述目标参考用户操作行为的标定操作行为描述和预测操作行为描述计算得到行为描述代价指标,并根据计算得到的行为描述代价指标对所述用户行为意图解析网络的网络参数进行迭代优化,直到所述行为描述代价指标达到预设训练终止条件,得到训练后的用户行为意图解析网络。
其中,上述过程可以是先推测得到目标参考用户操作行为的预测操作行为描述,然后对用户行为意图解析网络的网络参数进行迭代优化。例如,基于目标参考用户操作行为的标定操作行为描述和预测操作行为描述,优化用户行为意图解析网络的网络参数,使目标参考用户操作行为的预测操作行为描述与标定操作行为描述达到设定匹配度,得到训练后的用户行为意图解析网络。举例而言,可以目标参考用户操作行为的预测操作行为描述与标定操作行为描述之间的匹配度计算目标参考用户操作行为的预测操作行为描述和标定操作行为描述之间的行为描述代价指标,在所述行为描述代价指标收敛(如小于设定指标值)时,即可完成训练过程。
步骤S300,根据所述用户操作行为分段中的各个用户操作行为分别对应的用户行为意图分析得到所述目标用户的当前行为画像,并根据所述当前行为画像向所述目标用户推送对应的移动互联网信息。
例如,在一种可能的实施方式中,可以根据各个所述用户操作行为分别对应的用户行为意图的支持度,将支持度较高的至少一个用户行为意图作为目标行为意图,根据该目标行为意图分析得到所述目标用户的兴趣特征,并基于该兴趣特征分析得到所述当前行为画像。然后,可以根据所述目标用户的当前行为画像,从预先建立的推送信息数据库中获取与所述当前行为画像匹配的移动互联网信息作为推送信息向所述目标用户进行信息推送。
如图4所示,是图2中的用户行为大数据分析系统20所包括的功能模块示意图。在本实施例中,用户行为大数据分析系统20可以包括操作行为获取模块201,行为意图分析模块202,以及行为画像分析模块203。
上述的这些模块可以是集成在所述大数据分析单元23中的软件功能模块,也可以是直接存储在存储器21中的软件功能模块,下面对这些模块的功能进行详细介绍。
操作行为获取模块201,用于获取目标用户在移动互联网场景下的预设时间段内产生的用户操作行为分段,并依次将所述用户操作行为分段中的各用户操作行为作为需进行用户行为意图分析的目标用户操作行为。
行为意图分析模块202,根据预先生成的包括多个用户操作行为序列的用户操作行为序列库对所述目标用户操作行为进行行为意图分析,得到所述目标用户操作行为的用户行为意图;
行为画像分析模块203,用于根据所述用户操作行为分段中的各个用户操作行为分别对应的用户行为意图分析得到所述目标用户的当前行为画像,并根据所述当前行为画像向所述目标用户推送对应的移动互联网信息。
行为意图分析模块202通过以下步骤,根据预先生成的包括多个用户操作行为序列的用户操作行为序列库对所述目标用户操作行为进行行为意图分析,得到所述目标用户操作行为的用户行为意图:
从所述用户操作行为序列库中获取与所述用户操作行为分段匹配的目标用户操作行为序列,所述用户操作行为序列库包括多个用户操作行为序列和各所述用户操作行为序列对应的序列统计信息,所述序列统计信息包括用户行为日志数据库中所述用户操作行为序列的序列数量;
基于所述目标用户操作行为序列的序列统计信息,确定所述用户操作行为分段中对照用户操作行为对应的序列统计信息,所述对照用户操作行为为所述用户操作行为分段中除所述目标用户操作行为以外的其它用户操作行为;
通过所述对照用户操作行为的操作行为描述和序列统计信息对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述;
根据所述目标操作行为描述和所述用户操作行为分段的关键行为描述,对所述目标用户操作行为进行用户行为意图分析,得到所述目标用户操作行为在所述用户操作行为分段中的用户行为意图。
其中,上述的操作行为获取模块201,行为意图分析模块202,以及行为画像分析模块203可以分别对应执行图1所示的步骤100-步骤300,关于这些模块的细节内容可以参照对应的方法步骤的解释,这里不一一赘述。
综上所述,本发明实施例中,通过获取目标用户在移动互联网场景下的预设时间段内产生的用户操作行为分段,并依次将所述用户操作行为分段中的各用户操作行为作为需进行用户行为意图分析的目标用户操作行为,然后根据预先生成的包括多个用户操作行为序列的用户操作行为序列库对所述目标用户操作行为进行行为意图分析,得到所述目标用户操作行为的用户行为意图,最后根据所述用户操作行为分段中的各个用户操作行为分别对应的用户行为意图分析得到所述目标用户的当前行为画像,并根据所述当前行为画像向所述目标用户推送对应的移动互联网信息。如此,通过包含多个用户操作行为的用户操作行为分段结合预先得到的用户操作行为序列库进行用户行为意图的深度融合分析,可以较为精准的分析得到所述目标用户基于所述用户操作行为分段的用户操作行为意图。如此,用于后续的移动互联网信息推送等应用时,可以得到较佳的应用效果。
此外,本实施例中,通过从所述用户操作行为序列库中获取与所述用户操作行为分段匹配的目标用户操作行为序列,基于所述目标用户操作行为序列的序列统计信息,确定所述用户操作行为分段中对照用户操作行为对应的序列统计信息,并通过所述对照用户操作行为的操作行为描述和序列统计信息对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述;最后,根据所述目标操作行为描述和所述用户操作行为分段的关键行为描述,对所述目标用户操作行为进行用户行为意图分析,得到所述目标用户操作行为在所述用户操作行为分段中的用户行为意图。如此,可以基于与用户操作行为分段匹配的用户操作行为序列和关键行为描述进行用户操作行为的行为意图分析,可进一步针对用户操作行为的行为意图分析的准确性。
以上所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。因此,本说明书内容不应理解为对本申请的限制通常在附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。此外,在附图中提供的本发明的实施例的详细描述并非旨在限制本发明的保护范围,而仅仅是表示本发明的选定实施例。因此,本发明的保护范围应以权利要求的保护范围为准。此外,基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下可获得的所有其它实施例,都应属于本发明保护的范围。

Claims (10)

1.一种基于移动互联网的用户行为大数据分析方法,其特征在于,所述方法包括:
获取目标用户在移动互联网场景下的预设时间段内产生的用户操作行为分段,并依次将所述用户操作行为分段中的各用户操作行为作为需进行用户行为意图分析的目标用户操作行为;
根据预先生成的包括多个用户操作行为序列的用户操作行为序列库对所述目标用户操作行为进行行为意图分析,得到所述目标用户操作行为的用户行为意图;
根据所述用户操作行为分段中的各个用户操作行为分别对应的用户行为意图分析得到所述目标用户的当前行为画像,并根据所述当前行为画像向所述目标用户推送对应的移动互联网信息。
2.根据权利要求1所述的方法,其特征在于,所述根据预先生成的包括多个用户操作行为序列的用户操作行为序列库对所述目标用户操作行为进行行为意图分析,得到所述目标用户操作行为的用户行为意图,包括:
从所述用户操作行为序列库中获取与所述用户操作行为分段匹配的目标用户操作行为序列,所述用户操作行为序列库包括多个用户操作行为序列和各所述用户操作行为序列对应的序列统计信息,所述序列统计信息包括用户行为日志数据库中所述用户操作行为序列的序列数量;
基于所述目标用户操作行为序列的序列统计信息,确定所述用户操作行为分段中对照用户操作行为对应的序列统计信息,所述对照用户操作行为为所述用户操作行为分段中除所述目标用户操作行为以外的其它用户操作行为;
通过所述对照用户操作行为的操作行为描述和序列统计信息对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述;
根据所述目标操作行为描述和所述用户操作行为分段的关键行为描述,对所述目标用户操作行为进行用户行为意图分析,得到所述目标用户操作行为在所述用户操作行为分段中的用户行为意图。
3.根据权利要求2所述的方法,其特征在于,所述从所述用户操作行为序列库中获取与所述用户操作行为分段匹配的目标用户操作行为序列,包括:
对所述用户操作行为分段进行行为划分处理,得到所述用户操作行为分段的至少一个用户操作行为;
基于所述用户操作行为在所述用户操作行为分段中的操作行为分布,对所述用户操作行为进行行为整合,得到所述用户操作行为分段对应的操作行为序列;
从预先生成的用户操作行为序列库中获取符合预设匹配关系的操作行为序列作为与所述用户操作行为分段匹配的目标用户操作行为序列。
4.根据权利要求2所述的方法,其特征在于,所述用户操作行为序列包括高频操作行为组合;所述用户操作行为序列库通过以下方式获得:
获取用户行为日志数据库,并对所述用户行为日志数据库中每个参考用户操作行为分段进行行为划分处理,得到所述用户行为日志数据库中每个参考用户操作行为分段的至少一个参考用户操作行为;
针对每个参考用户操作行为,计算包含所述参考用户操作行为的参考用户操作行为分段的分段个数;
将所述分段个数达到预设阈值的参考用户操作行为作为所述用户行为日志数据库的初始高频操作行为;
基于所述初始高频操作行为,生成所述用户行为日志数据库对应的高频操作行为组合和所述高频操作行为组合对应的序列统计信息,得到预先生成的用户操作行为序列库;
其中,所述基于所述初始高频操作行为,生成所述用户行为日志数据库对应的高频操作行为组合和所述高频操作行为组合对应的序列统计信息,包括:
基于所述初始高频操作行为,对所述参考用户操作行为分段进行行为去噪处理,得到行为去噪处理后的参考用户操作行为分段;
将所述初始高频操作行为作为在先操作行为,并确定在所述行为去噪处理后的参考用户操作行为分段中所述在先操作行为对应的在后操作行为;
当所述在后操作行为具有所述初始高频操作行为时,基于所述在后操作行为生成所述用户行为日志数据库对应的高频操作行为组合;
计算包含所述高频操作行为组合的参考用户操作行为分段的数量,得到所述高频操作行为组合对应的序列统计信息;
其中,所述基于所述在后操作行为生成所述用户行为日志数据库对应的高频操作行为组合,包括:
当所述在后操作行为具有所述初始高频操作行为时,将所述在后操作行为中的初始高频操作行为与所述在后操作行为对应的在先操作行为进行组合,得到操作行为组合,并确定在所述行为去噪处理后的参考用户操作行为分段中所述操作行为组合对应的当前在后操作行为;
针对获取到的各个在先操作行为,计算包含所述在先操作行为的参考用户操作行为分段的数量;
基于包含所述在先操作行为的参考用户操作行为分段的数量,从各个在先操作行为中确定所述用户行为日志数据库对应的高频操作行为组合。
5.根据权利要求2所述的方法,其特征在于,所述用户操作行为序列还包括高频操作行为类别序列;所述用户操作行为序列库通过以下方式得到:
获取用户行为日志数据库,所述用户行为日志数据库包括至少一个参考用户操作行为分段;
对所述参考用户操作行为分段中的每个用户操作行为进行操作行为类别分析,得到所述参考用户操作行为分段对应的操作行为类别序列,所述操作行为类别序列包括所述参考用户操作行为分段中每个用户操作行为对应的操作行为类别;
针对各操作行为类别,计算包含所述操作行为类别的参考用户操作行为分段的分段个数;
将所述分段个数达到预设阈值的操作行为类别作为所述用户行为日志数据库的初始高频操作行为类别;
基于所述初始高频操作行为类别,生成所述用户行为日志数据库对应的高频操作行为类别序列和所述高频操作行为类别序列对应的序列统计信息,得到预先生成的用户操作行为序列库。
6.根据权利要求2所述的方法,其特征在于,所述用户操作行为序列还包括高频关联行为组合;所述用户操作行为序列库通过以下方式得到:
获取用户行为日志数据库,所述用户行为日志数据库包括至少一个参考用户操作行为分段;
对所述参考用户操作行为分段中的每个用户操作行为进行关联行为分析,得到所述参考用户操作行为分段对应的关联行为组合,所述关联行为组合包括所述参考用户操作行为分段中每个用户操作行为对应的关联行为信息;
针对各关联行为信息,计算包含所述关联行为信息的参考用户操作行为分段的分段个数;
将所述分段个数达到预设阈值的关联行为信息作为所述用户行为日志数据库的初始高频关联行为;
基于所述初始高频关联行为,生成所述用户行为日志数据库对应的高频关联行为组合和所述高频关联行为组合对应的序列统计信息,得到预先生成的用户操作行为序列库。
7.根据权利要求2所述的方法,其特征在于,所述基于所述目标用户操作行为序列的序列统计信息,确定所述用户操作行为分段中对照用户操作行为对应的序列统计信息,包括:
确定所述用户操作行为分段中与所述目标用户操作行为序列匹配的目标操作行为序列;
对于所述目标操作行为序列中的对照用户操作行为,将所述目标用户操作行为序列的序列统计信息作为所述对照用户操作行为的序列统计信息;
对于所述用户操作行为分段中未涵盖于所述目标操作行为序列的对照用户操作行为,将预设序列统计信息作为所述对照用户操作行为的序列统计信息;
所述通过所述对照用户操作行为的操作行为描述和序列统计信息对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述,包括:
根据所述对照用户操作行为的操作行为描述和序列统计信息,得到所述用户操作行为分段的关联操作行为描述;
根据所述关联操作行为描述对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述。
8.根据权利要求2所述的方法,其特征在于,所述通过所述对照用户操作行为的操作行为描述和序列统计信息对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述,包括:
通过预先训练得到的用户行为意图解析网络,通过所述对照用户操作行为的操作行为描述和序列统计信息对所述目标用户操作行为进行行为描述分析,得到所述目标用户操作行为的目标操作行为描述;
所述用户行为意图解析网络通过以下方式进行训练得到:
获取网络训练参考数据集,所述网络训练参考数据集包括参考用户操作行为分段中需进行用户行为意图分析的目标参考用户操作行为的标定操作行为描述,以及对照参考用户操作行为的操作行为描述和序列统计信息,所述对照参考用户操作行为为所述参考用户操作行为分段中除所述目标参考用户操作行为以外的其它用户操作行为;
通过用户行为意图解析网络,根据所述对照参考用户操作行为的操作行为描述和序列统计信息,得到所述参考用户操作行为分段的关联操作行为描述;
根据所述关联操作行为描述对所述目标参考用户操作行为进行行为描述分析,得到所述目标参考用户操作行为的预测操作行为描述;
基于所述目标参考用户操作行为的标定操作行为描述和预测操作行为描述计算得到行为描述代价指标,并根据计算得到的行为描述代价指标对所述用户行为意图解析网络的网络参数进行迭代优化,直到所述行为描述代价指标达到预设训练终止条件,得到训练后的用户行为意图解析网络。
9.根据权利要求2所述的方法,其特征在于,所述根据所述目标操作行为描述和所述用户操作行为分段的关键行为描述,对所述目标用户操作行为进行用户行为意图分析,得到所述目标用户操作行为在所述用户操作行为分段中的用户行为意图,包括:
确定所述目标用户操作行为的至少一种待定用户行为意图;
基于所述目标操作行为描述,从所述目标用户操作行为的至少一种待定用户行为意图中挑选第一推定用户行为意图;
基于所述用户操作行为分段的关键行为描述,从所述目标用户操作行为的至少一种待定用户行为意图中挑选第二推定用户行为意图;
根据所述第一推定用户行为意图和所述第二推定用户行为意图,确定所述目标用户操作行为在所述用户操作行为分段中的用户行为意图;
对所述用户操作行为分段的关键行为描述和所述用户操作行为分段中目标用户操作行为的目标操作行为描述进行类别划分处理,得到所述用户操作行为分段中所述目标用户操作行为的用户行为意图的意图类型。
10.一种基于移动互联网的用户行为大数据分析系统,其特征在于,包括处理器和存储器,所述存储器和所述处理器连接,所述存储器用于存储程序、指令或代码,所述处理器用于执行所述存储器中的程序、指令或代码,以实现权利要求1-9任意一项所述的方法。
CN202110877958.9A 2021-08-02 2021-08-02 基于移动互联网的用户行为大数据分析方法及系统 Withdrawn CN113468432A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110877958.9A CN113468432A (zh) 2021-08-02 2021-08-02 基于移动互联网的用户行为大数据分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110877958.9A CN113468432A (zh) 2021-08-02 2021-08-02 基于移动互联网的用户行为大数据分析方法及系统

Publications (1)

Publication Number Publication Date
CN113468432A true CN113468432A (zh) 2021-10-01

Family

ID=77883541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110877958.9A Withdrawn CN113468432A (zh) 2021-08-02 2021-08-02 基于移动互联网的用户行为大数据分析方法及系统

Country Status (1)

Country Link
CN (1) CN113468432A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836370A (zh) * 2021-11-25 2021-12-24 上海观安信息技术股份有限公司 用户群体的分类方法、装置、存储介质及计算机设备
CN115423565A (zh) * 2022-09-15 2022-12-02 卢施施 应用于云端互联网交互流程的大数据分析方法及ai系统
CN115828011A (zh) * 2022-10-13 2023-03-21 徐州海清信息科技有限公司 基于大数据的数据分析方法和平台

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836370A (zh) * 2021-11-25 2021-12-24 上海观安信息技术股份有限公司 用户群体的分类方法、装置、存储介质及计算机设备
CN113836370B (zh) * 2021-11-25 2022-03-01 上海观安信息技术股份有限公司 用户群体的分类方法、装置、存储介质及计算机设备
CN115423565A (zh) * 2022-09-15 2022-12-02 卢施施 应用于云端互联网交互流程的大数据分析方法及ai系统
CN115828011A (zh) * 2022-10-13 2023-03-21 徐州海清信息科技有限公司 基于大数据的数据分析方法和平台
CN115828011B (zh) * 2022-10-13 2023-11-10 四川宏智科信数字科技有限公司 基于大数据的数据分析方法和平台

Similar Documents

Publication Publication Date Title
CN108874992B (zh) 舆情分析方法、系统、计算机设备和存储介质
JP7127120B2 (ja) ビデオ分類の方法、情報処理の方法及びサーバー、並びにコンピュータ可読記憶媒体及びコンピュータプログラム
CN111144937B (zh) 广告素材确定方法、装置、设备及存储介质
CN113468432A (zh) 基于移动互联网的用户行为大数据分析方法及系统
CN110909182B (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
CN112395500B (zh) 内容数据推荐方法、装置、计算机设备及存储介质
CN113255370B (zh) 基于语义相似度的行业类型推荐方法、装置、设备及介质
CN110737818B (zh) 网络发布数据处理方法、装置、计算机设备和存储介质
US11562179B2 (en) Artificial intelligence system for inspecting image reliability
CN114840486A (zh) 用户行为数据采集方法、系统及云平台
CN113792212B (zh) 多媒体资源推荐方法、装置、设备以及存储介质
CN112784168B (zh) 信息推送模型训练方法以及装置、信息推送方法以及装置
US20200175281A1 (en) Relation attention module for temporal action localization
CN112104505B (zh) 应用推荐方法、装置、服务器和计算机可读存储介质
CN111737577A (zh) 一种基于业务平台的数据查询方法、装置、设备和介质
CN113890902A (zh) 特征识别库的构建方法及装置、流量识别方法
CN116720119A (zh) 应用于多端业务交互的大数据识别方法及系统
CN116956183A (zh) 多媒体资源推荐方法、模型训练方法、装置及存储介质
CN112905987B (zh) 账号识别方法、装置、服务器及存储介质
CN114625961A (zh) 应用于大数据的智能化在线服务推送方法及大数据服务器
CN114048392B (zh) 多媒体资源推送方法、装置、电子设备及存储介质
CN113792163B (zh) 多媒体推荐方法、装置、电子设备及存储介质
CN113742576B (zh) 基于跨平台的内容推荐方法、装置、设备及存储介质
CN111506510B (zh) 一种软件质量确定方法和相关装置
CN115658675B (zh) 应用于数据处理的噪声优化方法及ai系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20211001

WW01 Invention patent application withdrawn after publication