CN114117240A - 基于大数据需求分析的互联网内容推送方法及ai系统 - Google Patents

基于大数据需求分析的互联网内容推送方法及ai系统 Download PDF

Info

Publication number
CN114117240A
CN114117240A CN202111502278.5A CN202111502278A CN114117240A CN 114117240 A CN114117240 A CN 114117240A CN 202111502278 A CN202111502278 A CN 202111502278A CN 114117240 A CN114117240 A CN 114117240A
Authority
CN
China
Prior art keywords
user
interaction
log
behavior
operation behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111502278.5A
Other languages
English (en)
Other versions
CN114117240B (zh
Inventor
陈文科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Guoxinda Data Technology Co ltd
Original Assignee
Zhuji Blackstone Big Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuji Blackstone Big Data Technology Co ltd filed Critical Zhuji Blackstone Big Data Technology Co ltd
Priority to CN202111502278.5A priority Critical patent/CN114117240B/zh
Publication of CN114117240A publication Critical patent/CN114117240A/zh
Application granted granted Critical
Publication of CN114117240B publication Critical patent/CN114117240B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供一种基于大数据需求分析的互联网内容推送方法及AI系统,通过将未涵盖目标用户在预设的多个用户社群互动活动中的一个或者多个用户社群互动活动对应的用户画像特征的第一用户画像特征分布发送给各内容推送服务,由各内容推送服务依据第一用户画像特征分布执行针对目标用户的初始互动跟踪,并生成初始互动跟踪日志后基于初始互动跟踪日志进行进一步分析,从而准确获得目标用户的第二用户画像特征分布,及时补充与社群互动有关的用户画像特征。如此,基于第二用户画像特征分布可以向所述目标内容推送服务传递内容推送配置规则,以请求所述目标内容推送服务对所述目标用户进行对应的互联网内容推送,提高互联网内容推送的可靠性。

Description

基于大数据需求分析的互联网内容推送方法及AI系统
技术领域
本申请涉及人工智能与大数据技术领域,具体而言,涉及一种基于大数据需求分析的互联网内容推送方法及AI系统。
背景技术
随着互联网网络信息技术的发展,各种互联网线上业务也随着互联网线上平台应运而生。各个互联网线上平台为了提高业务产品的使用率,需要针对不同用户投放各种互联网内容,以期达到更高的转换率。
目前,互联网线上平台大部分的互联网内容推送逻辑在于用户需求分析,基于用户需求分析预测结果进行针对性推送,以针对不同的用户提供个性化的内容推送体验。然而,相关技术中在确定出预测用户需求的基础上,缺乏针对相关的目标用户在社群互动活动维度的跟踪和进一步分析,导致在后续进行互联网内容推送过程中仅针对目标用户个体维度的内容推送,而不涉及针对社群活动活动维度的内容推送,进而影响互联网内容推送的可靠性。
发明内容
为了至少克服现有技术中的上述不足,本申请的目的在于提供一种基于大数据需求分析的互联网内容推送方法及AI系统。
第一方面,本申请提供一种基于大数据需求分析的互联网内容推送方法,应用于AI系统,所述方法包括:
获取针对响应传递的用户操作行为日志的预测用户需求序列;
依据所述预测用户需求序列确定对应的目标用户的第一用户画像特征分布,基于所述第一用户画像特征分布向预设用户社群服务内的各内容推送服务传递用户互动跟踪请求,以请求各内容推送服务在对应用户群体内进行目标用户的初始互动跟踪,所述第一用户画像特征分布包括第一用户画像特征,所述第一用户画像特征未涵盖所述目标用户在预设的多个用户社群互动活动中的一个或者多个用户社群互动活动对应的用户画像特征;
获得各内容推送服务在初始互动跟踪流程中生成的初始互动跟踪日志,并基于所述初始互动跟踪日志获得所述目标用户的第二用户画像特征分布,所述初始互动跟踪日志包括与所述第一用户画像特征分布的知识点关联度大于第一目标知识点关联度的一个或者多个用户社群互动日志;
基于所述第二用户画像特征分布,确定所述预设用户社群服务内的一个或者多个内容推送服务确定为目标内容推送服务;
基于所述第二用户画像特征分布向所述目标内容推送服务传递内容推送配置规则,以请求所述目标内容推送服务对所述目标用户进行对应的互联网内容推送。
第二方面,本申请实施例还提供一种基于大数据需求分析的互联网内容推送系统,所述基于大数据需求分析的互联网内容推送系统包括AI系统以及与该AI系统通信连接的多个智慧医疗注册平台;
所述AI系统,用于:
获取针对响应传递的用户操作行为日志的预测用户需求序列;
依据所述预测用户需求序列确定对应的目标用户的第一用户画像特征分布,基于所述第一用户画像特征分布向预设用户社群服务内的各内容推送服务传递用户互动跟踪请求,以请求各内容推送服务在对应用户群体内进行目标用户的初始互动跟踪,所述第一用户画像特征分布包括第一用户画像特征,所述第一用户画像特征未涵盖所述目标用户在预设的多个用户社群互动活动中的一个或者多个用户社群互动活动对应的用户画像特征;
获得各内容推送服务在初始互动跟踪流程中生成的初始互动跟踪日志,并基于所述初始互动跟踪日志获得所述目标用户的第二用户画像特征分布,所述初始互动跟踪日志包括与所述第一用户画像特征分布的知识点关联度大于第一目标知识点关联度的一个或者多个用户社群互动日志;
基于所述第二用户画像特征分布,确定所述预设用户社群服务内的一个或者多个内容推送服务确定为目标内容推送服务;
基于所述第二用户画像特征分布向所述目标内容推送服务传递内容推送配置规则,以请求所述目标内容推送服务对所述目标用户进行对应的互联网内容推送。
依据以上方面,通过将未涵盖目标用户在预设的多个用户社群互动活动中的一个或者多个用户社群互动活动对应的用户画像特征的第一用户画像特征分布发送给各内容推送服务,由各内容推送服务依据第一用户画像特征分布执行针对目标用户的初始互动跟踪,并生成初始互动跟踪日志后基于初始互动跟踪日志进行进一步分析,从而准确获得目标用户的第二用户画像特征分布,及时补充与社群互动有关的用户画像特征。如此,基于第二用户画像特征分布可以向所述目标内容推送服务传递内容推送配置规则,以请求所述目标内容推送服务对所述目标用户进行对应的互联网内容推送,提高互联网内容推送的可靠性。
附图说明
图1为本申请实施例提供的基于大数据需求分析的互联网内容推送系统的架构示意图;
图2为本申请实施例提供的基于大数据需求分析的互联网内容推送方法的流程示意图;
图3为本申请实施例提供的用于实现上述的基于大数据需求分析的互联网内容推送方法的AI系统的结构示意框图。
具体实施方式
图1是本申请一种实施例提供的基于大数据需求分析的互联网内容推送系统10的架构示意图。基于大数据需求分析的互联网内容推送系统10可以包括AI系统100以及与AI系统100通信连接的智慧医疗注册平台200。图1所示的基于大数据需求分析的互联网内容推送系统10仅为一种可行的示例,在其它可行的实施例中,该基于大数据需求分析的互联网内容推送系统10也可以仅包括图1所示组成部分的其中的至少部分或者还可以包括其它的组成部分。
一种依据独立构思的实施例中,请参阅图2,基于大数据需求分析的互联网内容推送系统10中的AI系统100和智慧医疗注册平台200可以通过配合执行以下方法实施例所描述的基于大数据需求分析的互联网内容推送方法,具体AI系统100和智慧医疗注册平台200的执行步骤部分可以参照以下方法实施例的详细描述。
步骤S100,获取针对响应传递的用户操作行为日志的预测用户需求序列,依据所述预测用户需求序列确定对应的目标用户的第一用户画像特征分布,基于所述第一用户画像特征分布向预设用户社群服务内的各内容推送服务传递用户互动跟踪请求,以请求各内容推送服务在对应用户群体内进行目标用户的初始互动跟踪。
一种示例性的设计思路中,所述第一用户画像特征分布包括第一用户画像特征,所述第一用户画像特征未涵盖所述目标用户在预设的多个用户社群互动活动中的一个或者多个用户社群互动活动对应的用户画像特征。例如,所述多个用户社群互动活动可以包括,但不限于购买行为互动活动、视频直播行为互动活动等多个互动活动,这些互动活动可以形成一个用于描述目标用户的社群特征的整体社群互动标签集。
步骤S200,获得各内容推送服务在初始互动跟踪流程中生成的初始互动跟踪日志,并基于所述初始互动跟踪日志获得所述目标用户的第二用户画像特征分布。
一种示例性的设计思路中,所述初始互动跟踪日志包括与所述第一用户画像特征分布的知识点关联度大于第一目标知识点关联度的一个或者多个用户社群互动日志;
步骤S300,基于所述第二用户画像特征分布,确定所述预设用户社群服务内的一个或者多个内容推送服务确定为目标内容推送服务。例如,可以确定用于获得所述第二用户画像特征分布所涉及到的一个或者多个目标用户社群互动日志对应的内容推送服务确定为所述目标内容推送服务。
步骤S400,基于所述第二用户画像特征分布向所述目标内容推送服务传递内容推送配置规则,以请求所述目标内容推送服务对所述目标用户进行对应的互联网内容推送。
基于以上步骤,通过将未涵盖目标用户在预设的多个用户社群互动活动中的一个或者多个用户社群互动活动对应的用户画像特征的第一用户画像特征分布发送给各内容推送服务,由各内容推送服务依据第一用户画像特征分布执行针对目标用户的初始互动跟踪,并生成初始互动跟踪日志后基于初始互动跟踪日志进行进一步分析,从而准确获得目标用户的第二用户画像特征分布,及时补充与社群互动有关的用户画像特征。如此,基于第二用户画像特征分布可以向所述目标内容推送服务传递内容推送配置规则,以请求所述目标内容推送服务对所述目标用户进行对应的互联网内容推送,提高互联网内容推送的可靠性。
一种示例性的设计思路中,针对步骤S200,基于所述初始互动跟踪日志获得所述目标用户的第二用户画像特征分布可以通过以下步骤实现。
步骤S2001,从各所述内容推送服务生成的所述初始互动跟踪日志中获取各所述内容推送服务生成的与所述第一用户画像特征分布的知识点关联度大于第一目标知识点关联度的用户社群互动日志。
步骤S2002,针对每个所述用户社群互动日志,依据用户画像特征挖掘网络,依据所述用户画像特征挖掘网络包括的与多个社群互动标签分别对应的互动意图挖掘结构从所述用户社群互动日志中挖掘各所述社群互动标签下的互动意图向量集。
步骤S2003,依据所述用户画像特征挖掘网络包括的用户画像映射结构将每个所述社群互动标签下的互动意图向量集进行用户画像映射,获得每个所述社群互动标签下的互动意图向量集对应的用户画像特征。
步骤S2004,依据所述用户画像特征挖掘网络包括的知识点关联分析结构基于所述社群互动标签下的互动意图向量集对应的用户画像特征与所述第一用户画像特征分布对应的第一用户画像特征计算所述用户社群互动日志与所述第一用户画像特征分布的知识点关联度,若所述知识点关联度大于第二目标知识点关联度,则将所述用户社群互动日志确定为关键社群互动日志。其中所述第二目标知识点关联度大于所述第一目标知识点关联度。
一种示例性的设计思路中第二目标知识点关联度需大于第一目标知识点关联度,以对实现精确挖掘分析。
步骤S2005,获取预设的整体社群互动标签集,所述整体社群互动标签集包括针对所述目标用户的多个所述用户社群互动活动。
步骤S2006,基于所述整体社群互动标签集以及所述第一用户画像特征分布的第一用户画像特征确定针对所述目标用户的补充社群互动标签。
一种示例性的设计思路中,所述补充社群互动标签可以依据将所述第一用户画像特征分布中的第一用户画像特征中的各用户画像特征与所述整体社群互动标签集中的各用户社群互动活动进行匹配或比对,判断所述第一用户画像特征中未涵盖哪个用户社群互动活动对应的用户画像特征,那么将该对应的用户社群互动活动确定为所述补充社群互动标签。如此,可利于后续将该补充社群互动标签进行补充,以对所述第一用户画像特征分布进行补充更新而得到第二用户画像特征分布。
步骤S2007,从所述关键社群互动日志中获取所述补充社群互动标签下的用户补充行为特征数据,基于所述用户补充行为特征数据对所述第一用户画像特征分布进行补充更新,获得所述第二用户画像特征分布。
一种示例性的设计思路中,内容推送服务在确定所述补充社群互动标签后,可以依据所述关键社群互动日志提取所述补充社群互动标签对应的用户补充行为特征数据。例如,可以将所述用户补充行为特征数据转换成对应的用户画像特征,将所述用户画像特征添加到所述第一用户画像特征分布得到优化后的所述第二用户画像特征分布。
依据上述内容,在上述步骤S300中,所述基于所述第二用户画像特征分布,确定所述预设用户社群服务内的一个或者多个内容推送服务确定为目标内容推送服务,可以包括:
基于所述第二用户画像特征分布中的用户补充行为特征数据所对应的一个或者多个关联社群互动日志,确定生成所述一个或者多个关联社群互动日志的一个或者多个内容推送服务确定为所述目标内容推送服务。例如,依据所述关联社群互动日志携带的内容推送服务ID,基于所述内容推送服务ID确定所述目标内容推送服务。
一种可基于独立构思的实施例中,本申请实施例还提供一种基于人工智能的用户画像特征挖掘方法,包括以下步骤。
(1)获取参考训练数据集合,一种示例性的设计思路中,所述参考训练数据集合包括多个具有参考用户画像特征的参考社群互动日志。所述参考用户画像特征可以是指预先基于所述参考社群互动日志中的用户信息,确的与用户信息对应的用户画像特征,例如可以可以包括多个用户社群互动活动对应的用户用户画像特征。
(2)获取初始化AI训练网络,所述初始化AI训练网络包括互动意图挖掘结构、用户画像映射结构、以及知识点关联分析结构。
一种示例性的设计思路中,初始化AI训练网络可以是卷积神经网络、循环卷积神经网络、残差神经网络等等,具体不进行限定。
(3)针对每个所述参考社群互动日志,依据所述互动意图挖掘结构获取所述参考社群互动日志在多个用户社群互动活动下的互动意图向量集。
一种示例性的设计思路中,可以依据所述互动意图挖掘结构针对所述参考社群互动日志依次提取每个用户社群互动活动下的互动意图向量集。一种示例性的设计思路中,所述互动意图挖掘结构可以包括多个卷积核,每一个卷积核用于对应提取一个或者多个用户社群互动活动下的互动意图向量集。
(4)依据所述用户画像映射结构将每个所述用户社群互动活动下的互动意图向量集进行用户画像映射,获得每个所述用户社群互动活动下的互动意图向量集对应的用户画像特征。
一种示例性的设计思路中,一种示例性的设计思路中,可以将所述互动意图向量集按照预设的用户画像映射方式进行用户画像映射。
(5)依据所述知识点关联分析结构基于所述用户社群互动活动下的互动意图向量集对应的用户画像特征得到一预测用户画像特征。
(6)基于所述预测用户画像特征与所述参考用户画像特征进行确定第一学习收敛评估指标。
一种示例性的设计思路中,例如,可以基于所述预测用户画像特征中各用户社群互动活动对应的用户画像特征与所述参考用户画像特征中各用户社群互动活动对应的参考用户画像特征之间的知识点关联度,进行确定所述第一学习收敛评估指标。例如,一种示例性的设计思路中,所述学习收敛评估指标可以用于表征所述预测用户画像特征中各用户社群互动活动对应的用户画像特征与所述参考用户画像特征中各用户社群互动活动对应的参考用户画像特征之间的知识点关联度。
(7)基于所述第一学习收敛评估指标对所述初始化AI训练网络的网络权重信息进行循环更新,直至所述第一学习收敛评估指标匹配第一训练终止要求,获得匹配网络部署要求的初始化AI训练网络作为所述用户画像特征挖掘网络。
一种示例性的设计思路中,所述第一学习收敛评估指标由各所述预测用户画像特征中的各用户画像特征与所述参考用户画像特征中对应的各用户画像特征的第一知识点关联度进行确定,所述第一训练终止要求包括所述第一学习收敛评估指标表征的第一知识点关联度大于第一目标关联度阈值。
一种示例性的设计思路中,本申请实施例还提供一种基于人工智能的AI网络配置方法,详细介绍如下。
(11)获取参考训练数据集合,所述参考训练数据集合包括多个具有参考用户画像特征的参考社群互动日志。一种示例性的设计思路中,所述参考训练数据集合可以与用于训练所述用户画像特征挖掘网络的参考库相同。
(12)获取初始化AI训练网络,并对所述初始化AI训练网络进行依据公开网络权重信息的网络初始优化,获得优化后的初始化AI训练网络。
(13)针对每个所述参考社群互动日志,依据所述初始化AI训练网络获取所述参考社群互动日志在多个用户社群互动活动下的互动意图向量集,并基于所述用户社群互动活动下的互动意图向量集以及所述参考用户画像特征包括的用户画像特征进行确定第二学习收敛评估指标。
一种示例性的设计思路中,例如,可以基于所述预测用户画像特征中各用户社群互动活动对应的用户画像特征与所述参考用户画像特征中各用户社群互动活动对应的参考用户画像特征之间的知识点关联度,进行确定所述第二学习收敛评估指标。换句话说,一种示例性的设计思路中,所述第二学习收敛评估指标可以用于表征所述预测用户画像特征中各用户社群互动活动对应的用户画像特征与所述参考用户画像特征中各用户社群互动活动对应的参考用户画像特征之间的知识点关联度。
(14)基于所述第二学习收敛评估指标对所述优化后的初始化AI训练网络的网络权重信息进行循环更新,直至所述第二学习收敛评估指标匹配第二训练终止要求,获得匹配网络部署要求的初始化AI训练网络作为目标AI网络。
一种示例性的设计思路中,所述第二学习收敛评估指标由各所述用户社群互动活动下的互动意图向量集与所述参考用户画像特征中对应的各用户画像特征的第二知识点关联度进行确定,所述第二训练终止要求包括所述第二学习收敛评估指标表征的第二知识点关联度大于第二目标关联度阈值,所述第二目标关联度阈值小于所述第一目标关联度阈值。
(15)将所述目标AI网络配置到各所述内容推送服务,以请求所述内容推送服务基于所述目标AI网络对所述预设用户社群服务内的用户进行互动跟踪识别,以向所述内容推送服务生成所述初始互动跟踪日志。
一种示例性的设计思路中,关于上述参考训练数据集合的获取方式,可以通过以下步骤实现。
(111)依据多个内容推送服务获取目标应用业务环境下的社群互动日志,获得多个社群互动日志。
(112)将各所述社群互动日志作为参考社群互动日志添加到预设的参考互动日志数据集中。
(113)提取所述参考互动日志数据集中的各所述参考社群互动日志在多个用户社群互动活动下的互动意图向量集,获得每个参考社群互动日志对应的互动意图向量分布。其中,所述互动意图向量分布可以包括所述参考社群互动日志中的用户的一个或者多个互动意图向量集。
(114)基于每个所述参考社群互动日志对应的互动意图向量分布,对所述参考互动日志数据集中的参考社群互动日志进行数据清洗,获得清洗后的参考互动日志数据集。一种示例性的设计思路中,为了避免参考社群互动日志中的用户遗漏特征数据过多而影响网络性能,需要基于所述互动意图向量分布对所述参考互动日志数据集中的参考社群互动日志进行数据清洗,以清洗不符合条件的参考社群互动日志。
一种示例性的设计思路中,在(114)中,基于每个所述参考社群互动日志对应的互动意图向量分布,对所述参考互动日志数据集中的参考社群互动日志进行数据清洗,得的清洗后的参考互动日志数据集,可以包括:
针对每个所述参考社群互动日志,确定所述参考社群互动日志对应的所述互动意图向量分布中是否存在遗漏特征数据;
若存在遗漏特征数据,则将所述参考社群互动日志从所述参考训练数据集合中删除;
其中,所述遗漏特征数据包括所述参考社群互动日志对应的互动意图向量分布中未涵盖在先设定的用户社群互动活动下的互动意图向量集或者未涵盖预设数量个用户社群互动活动下的互动意图向量集。
(115)基于清洗后的参考互动日志数据集中各参考社群互动日志对应的互动意图向量分布得到所述参考社群互动日志对应的参考用户画像特征,并将所述用户画像特征与所述参考社群互动日志在所述参考互动日志数据集中进行相关配置,获得所述参考训练数据集合。
所述获取参考训练数据集合的步骤,还可以包括以下步骤。
首先,复制所述参考训练数据集合中一部分参考社群互动日志作为候选社群互动日志。
其次,将所述候选社群互动日志对应的用户画像特征中的一个或者多个用户社群互动活动对应的用户画像特征进行特征衍生,所述特征衍生包括将对应的用户画像特征使用联系画像特征衍生或者添加对应关联的用户画像特征。
然后,将特征衍生后的候选社群互动日志作为衍生训练数据对象添加到所述参考训练数据集合,并对添加到所述衍生训练数据对象后的参考训练数据集合进行随机置乱调整,获得扩展数量后的参考训练数据集合。
一种示例性的设计思路中,以所述多个用户社群互动活动的数量为N为例,所述将所述候选社群互动日志对应的用户画像特征中的一个或者多个社群互动标签对应的用户画像特征进行特征衍生,可以依据以下方式实现:
第一,将所述候选社群互动日志添加到在先配置的参考数据集中,获得候选社群互动日志集;
第二,确定每个用户社群互动活动所需进行特征衍生的量化值;
第三,基于第M个用户社群互动活动所需进行特征衍生的量化值,从所述候选社群互动日志集中获取对应数量的候选社群互动日志,并对所述候选社群互动日志对应的第M个用户社群互动活动对应的用户画像特征进行特征衍生,获得第M个衍生参考数据集;其中,M为大于等于1小于等于N的自然数。
基于以上步骤,所述将特征衍生后的候选社群互动日志作为衍生训练数据对象添加到所述参考训练数据集合,并对添加到所述衍生训练数据对象后的参考训练数据集合进行随机置乱调整,获得扩展数量后的参考训练数据集合,包括:
依序将所述得到的第M个衍生参考数据集添加到所述参考训练数据集合,并在第N个衍生参考数据集添加到所述参考训练数据集合之后,对所述参考训练数据集合进行随机置乱调整。
又或者,一种示例性的设计思路中,可以同时对至少两个用户社群互动活动的用户画像特征进行特征衍生。依据此,所述将所述候选社群互动日志对应的用户画像特征中的一个或者多个用户社群互动活动对应的用户画像特征进行特征衍生获取参考训练数据集合,还可以包括以下内容:
(1)确定预设的进行特征衍生对应的由至少两个用户社群互动活动进行组合得到的一个或者多个社群互动活动簇;
(2)针对每个所述社群互动活动簇,从所述候选社群互动日志中获取一个或者多个对应的候选社群互动日志,并将获取的候选社群互动日志中与所述社群互动活动簇中包括的用户社群互动活动对应的用户画像特征进行多特征衍生。
进一步地,在上述步骤S200中,还可以基于第一用户画像特征分布以及各内容推送服务生成的初始互动跟踪日志分别对应的行为兴趣节点及行为兴趣内容清洗目标用户当前几乎不可能涉及的内容推送服务的内容分区内产生的社群互动日志。
依据上述发明构思,一种示例性的设计思路中,所述第一用户画像特征分布还包括针对所述目标用户的第一行为兴趣特征,所述初始互动跟踪日志还包括各所述内容推送服务生成的用户社群互动日志对应的第二行为兴趣特征。其中,所述第一行为兴趣特征可以包括所述目标用户或者所述第一用户画像特征分布对应的第一行为兴趣节点(如第一用户画像特征分布的产生行为兴趣节点)以及第一行为兴趣内容(如目标用户的当前位置)。所述第二行为兴趣特征相应可以是内容推送服务生成的用户社群互动日志对应的第二行为兴趣节点(用户社群互动日志的生成兴趣节点)以及对应的第二行为兴趣内容(用户社群互动日志的生成内容)。
依据此,步骤S200中,所述获得各内容推送服务在初始互动跟踪流程中生成的初始互动跟踪日志,并基于所述初始互动跟踪日志获得所述目标用户的第二用户画像特征分布,可以包括以下步骤。
步骤S2011,基于所述第一行为兴趣特征和所述第二行为兴趣特征对各所述内容推送服务进行支撑值输出,获得各所述内容推送服务分别与所述目标用户之间的服务支撑值。
例如,可首先基于所述第一行为兴趣特征获取所述目标用户对应的第一行为兴趣节点和第一行为兴趣内容;
然后,基于所述第二行为兴趣特征获取各所述内容推送服务生成的用户社群互动日志对应的第二行为兴趣节点和第二行为兴趣内容;
其次,依据所述预设用户社群服务对应的社群主题知识图谱,基于所述社群主题知识图谱确定所述目标用户从所述第一行为兴趣内容对应的第一内容区域跳转到所述第二行为兴趣内容对应的第二内容区域的内容跳转路线和对应的跳转代价;
最后,基于所述跳转代价以及所述第一行为兴趣节点和第二行为兴趣节点的行为兴趣关联值确定所述目标用户与各所述内容推送服务对应的服务支撑值。
步骤S2012,将对应的服务支撑值小于目标支撑值的内容推送服务生成的用户社群互动日志清洗,获得候选输出社群互动日志集。
步骤S2013,基于所述候选输出社群互动日志集中的每个用户社群互动日志,获得所述目标用户的第二用户画像特征分布。
例如,在步骤S2013中,可以依据以下步骤来得到所述第二用户画像特征分布:
针对所述候选输出社群互动日志集中的每个所述用户社群互动日志,依据用户画像特征挖掘网络,依据所述用户画像特征挖掘网络包括的与多个社群互动标签分别对应的互动意图挖掘结构从所述用户社群互动日志中挖掘各所述社群互动标签下的互动意图向量集;
依据所述用户画像特征挖掘网络包括的用户画像映射结构将每个所述社群互动标签下的互动意图向量集进行用户画像映射,获得每个所述社群互动标签下的互动意图向量集对应的用户画像特征;
依据所述用户画像特征挖掘网络包括的知识点关联分析结构基于所述社群互动标签下的互动意图向量集对应的用户画像特征与所述第一用户画像特征分布对应的第一用户画像特征计算所述用户社群互动日志与所述第一用户画像特征分布的知识点关联度,若所述知识点关联度大于第二目标知识点关联度,则将所述用户社群互动日志确定为关键社群互动日志,其中所述第二目标知识点关联度大于所述第一目标知识点关联度;
获取预设的整体社群互动标签集,所述整体社群互动标签集包括针对所述目标用户的多个所述用户社群互动活动;
基于所述整体社群互动标签集以及所述第一用户画像特征分布的第一用户画像特征确定针对所述目标用户的补充社群互动标签;
从所述关键社群互动日志中获取所述补充社群互动标签下的用户补充行为特征数据,基于所述用户补充行为特征数据对所述第一用户画像特征分布进行补充更新,获得所述第二用户画像特征分布。
一种示例性的设计思路中,步骤S110中获取针对响应传递的用户操作行为日志的预测用户需求序列可以通过以下示例性的步骤实现。
步骤W110,响应用户需求预测请求,用户需求预测请求对应关联了用户操作行为日志,并对用户操作行为日志进行行为倾向性向量挖掘,获得用户操作行为特征。
其中,用户操作行为日志可以是用于表达相关用户的用户需求的操作行为活动,操作行为活动是指通过各种线上业务平台系统进行用户操作行为记录的片段,例如每一次用户操作行为记录可以记录为一个操作行为活动。用户操作行为特征可以以多模态特征进行表达。
例如,AI系统可以响应用户需求预测请求,该用户需求预测请求对应关联了用户操作行为日志。AI系统也可以在接收到用户需求预测请求后,从相关的日志数据库中搜索到对应的用户操作行为日志。然后AI系统对用户操作行为日志使用操作行为倾向决策网络进行行为倾向性向量挖掘,获得用户操作行为特征。该操作行为倾向决策网络可以是通过AI网络结构建立的模型。
步骤W120,将用户操作行为特征进行注意力向量挖掘,获得用户操作行为日志相关的注意力行为向量。
其中,注意力行为向量是将用户操作行为特征进行持续关注向量挖掘得到的。例如,AI系统需要将用户操作行为特征进行持续关注向量挖掘,获得用户操作行为日志相关的注意力行为向量。
步骤W130,获取每个参考用户需求的参考操作行为日志、相关的参考操作行为特征和相关的参考注意力行为向量,并依据用户操作行为特征和每个参考用户需求的参考操作行为日志相关的参考操作行为特征从每个参考用户需求的参考操作行为日志中进行联系行为日志调取,获得用户操作行为日志相关的候选联系行为日志序列。
其中,参考操作行为日志是指已经生成有用户需求的操作行为活动。参考操作行为特征是指对参考操作行为日志进行行为倾向性向量挖掘得到的操作行为特征。参考注意力行为向量是指对参考操作行为特征进行注意力向量挖掘后得到的注意力行为向量。候选联系行为日志序列是指通过联系行为日志调取返回的参考操作行为日志的序列,该候选联系行为日志序列是需要进一步进行筛选的。联系行为日志调取可以是通过K-MEANS算法在每个参考用户需求的参考操作行为日志中进行调取并返回。
例如,AI系统可以获取每个参考用户需求的参考操作行为日志、每个参考操作行为日志相关的参考操作行为特征和每个参考操作行为日志相关的参考注意力行为向量。AI系统使用用户操作行为特征和每个参考操作行为日志相关的参考操作行为特征进行关联偏离度量确定,根据得到的每个参考操作行为特征相关的关联偏离度度量从每个参考用户需求的参考操作行为日志中返回大于预先设置好的偏离度度量的参考操作行为日志,获得用户操作行为日志相关的候选联系行为日志序列。
步骤W140,依据注意力行为向量与候选联系行为日志序列相关的参考注意力行为向量从候选联系行为日志序列中进行关联行为向量挖掘,获得用户操作行为日志相关的第一挖掘行为日志序列,并依据用户操作行为特征与第一挖掘行为日志序列相关的参考操作行为特征从第一挖掘行为日志序列中进行关联行为特征挖掘,获得用户操作行为日志相关的第二挖掘行为日志序列。
其中,关联行为向量挖掘是指从候选联系行为日志序列使用注意力行为向量进行筛选。第一挖掘行为日志序列是指通过注意力行为向量对候选联系行为日志序列中的参考操作行为日志进行筛选后得到的参考操作行为日志序列。关联行为特征挖掘是指使用用户操作行为特征从第一挖掘行为日志序列中进行筛选后得到的参考操作行为日志序列。第二挖掘行为日志序列是指筛选得到的与用户操作行为日志最关联的参考操作行为日志。
例如,AI系统可以确定注意力行为向量与候选联系行为日志序列中每个参考操作行为日志相关的参考注意力行为向量之间的关联偏离度,根据每个参考操作行为日志相关的关联偏离度从候选联系行为日志序列中进行筛选,可以将大于预先设置好的注意力行为向量之间的关联偏离度阈值的参考操作行为日志作为用户操作行为日志相关的第一挖掘行为日志序列。AI系统也可以根据每个参考操作行为日志相关的关联偏离度将每个参考操作行为日志进行排序,选取排序前列的参考操作行为日志得到用户操作行为日志相关的第一挖掘行为日志序列。进一步,AI系统使用关联度算法确定用户操作行为特征与第一挖掘行为日志序列中参考操作行为日志相关的参考操作行为特征之间的关联偏离度,然后根据每个关联偏离度从第一挖掘行为日志序列中进行筛选,获得用户操作行为日志相关的第二挖掘行为日志序列,可以选取大于预设关联度阈值的每个参考操作行为日志,也可以根据每个关联偏离度将第一挖掘行为日志序列中每个参考操作行为日志进行排序,然后选取排序最前列的参考操作行为日志,获得第二挖掘行为日志序列。其中,AI系统也可以从第一挖掘行为日志序列中进行关联行为特征挖掘,获得用户操作行为日志相关的多个第二挖掘行为日志序列。
步骤W150,获取第二挖掘行为日志序列相关的参考用户需求分布,将参考用户需求分布确定为用户操作行为日志相关的预测用户需求。
其中,参考用户需求分布是指第二挖掘行为日志序列相关的预测用户需求,该用户需求是已经生成的。
例如,AI系统获取到第二挖掘行为日志序列相关的参考用户需求分布,然后直接将参考用户需求分布确定为用户操作行为日志相关的预测用户需求。即将关联的操作行为活动使生成的预测用户需求相同,从而避免为每个相同或者关联的操作行为活动都生成相关的预测用户需求,提高了用户需求预测处理性能。
基于以上步骤,通过对用户操作行为日志进行行为倾向性向量挖掘,获得用户操作行为特征,将用户操作行为特征进行注意力向量挖掘,获得用户操作行为日志相关的注意力行为向量,然后依据用户操作行为特征和每个参考用户需求的参考操作行为日志相关的参考操作行为特征从每个参考用户需求的参考操作行为日志中进行联系行为日志调取,获得用户操作行为日志相关的候选联系行为日志序列,从候选联系行为日志序列中进行关联行为向量挖掘,获得用户操作行为日志相关的第一挖掘行为日志序列,从第一挖掘行为日志序列中进行关联行为特征挖掘,获得用户操作行为日志相关的第二挖掘行为日志序列,最后获取第二挖掘行为日志序列相关的参考用户需求分布,将参考用户需求分布确定为用户操作行为日志相关的预测用户需求,即通过使用用户操作行为特征进行联系行为日志调取,获得用户操作行为日志相关的候选联系行为日志序列,提高解析出候选联系行为日志序列的处理性能,然后再进行关联行为向量挖掘,提高解析出第一挖掘行为日志序列的处理性能,然后进行关联行为特征挖掘,保证了筛选得到的第二挖掘行为日志序列的精度,最后获取到第二挖掘行为日志序列相关的参考用户需求分布,将参考用户需求分布确定为用户操作行为日志相关的预测用户需求,从而在保证参考用户需求分布精度的基础上提高了用户需求预测的处理性能。
一种示例性的独立设计思路中,用户需求预测请求对应关联了多个用户操作行为日志,该方法还包括:
步骤W202,分别对多个用户操作行为日志进行行为倾向性向量挖掘,获得多个用户操作行为特征。
步骤W204,将多个用户操作行为特征进行注意力向量挖掘,获得多个用户操作行为日志相关的注意力行为向量。
例如,AI系统也可以同时对一轮的操作行为活动进行需求预测,此时,AI系统要获取到该轮的操作行为活动,可以解析得到用户需求预测请求中携带的多个用户操作行为日志,也可以从数据库中直接获取到多个用户操作行为日志。还可以从互联网获取到多个用户操作行为日志等等。然后使用操作行为倾向决策网络分别对多个用户操作行为日志进行行为倾向性向量挖掘,获得每个用户操作行为日志相关的用户操作行为特征,然后对每个用户操作行为特征进行持续关注向量挖掘,获得每个用户操作行为特征相关的注意力行为向量。
步骤W206,依据多个用户操作行为特征对多个用户操作行为日志进行分簇,获得多个用户操作行为日志簇,并从多个用户操作行为日志簇中进行显著操作行为活动选取,获得多个用户操作行为日志簇相关的显著操作行为活动。
其中,用户操作行为日志簇是指同簇的用户操作行为日志的序列。不同簇的用户操作行为日志簇属于不同的用户操作行为日志簇。显著操作行为活动是指用户操作行为日志簇中最具有显著的用户操作行为日志,该显著操作行为活动与用户操作行为日志簇中其它用户操作行为日志之间的全局偏离度最小。
例如,AI系统可以使用分簇算法通过多个用户操作行为特征对多个用户操作行为日志进行分簇。分簇完成后,获得不同的类别,每个类别都有相关的用户操作行为日志,即得到多个用户操作行为日志簇。然后从每个用户操作行为日志簇中进行显著操作行为活动选取,获得每个用户操作行为日志簇相关的显著操作行为活动。
步骤W208,依据显著操作行为活动相关的用户操作行为特征和每个参考用户需求的参考操作行为日志相关的参考操作行为特征从每个参考用户需求的参考操作行为日志中进行联系行为日志调取,获得显著操作行为活动相关的目标候选联系行为日志序列。
其中,目标候选联系行为日志序列是指使用显著操作行为活动相关的用户操作行为特征筛选得到的候选联系行为日志序列。每个显著操作行为活动都会得到相关的目标候选联系行为日志序列。
例如,AI系统在得到每个用户操作行为日志簇相关的显著操作行为活动之后,然后对所有的显著操作行为活动进行并行处理,即使用显著操作行为活动相关的用户操作行为特征和每个参考用户需求的参考操作行为日志相关的参考操作行为特征进行关联偏离度确定,根据关联偏离度从每个参考用户需求的参考操作行为日志中进行联系行为日志调取,获得显著操作行为活动相关的目标候选联系行为日志序列。即从每个参考用户需求的参考操作行为日志选取大于关联偏离度阈值的参考操作行为日志,获得该显著操作行为活动相关的目标候选联系行为日志序列。
步骤W210,依据显著操作行为活动相关的注意力行为向量与目标候选联系行为日志序列相关的参考注意力行为向量从目标候选联系行为日志序列中进行关联行为向量挖掘,获得显著操作行为活动相关的目标第一挖掘行为日志序列,并依据显著操作行为活动相关的用户操作行为特征与目标第一挖掘行为日志序列相关的参考操作行为特征从目标第一挖掘行为日志序列中进行关联行为特征挖掘,获得显著操作行为活动相关的显著挖掘操作行为活动。
其中,目标第一挖掘行为日志序列是指使用显著操作行为活动相关的注意力行为向量进行关联行为向量挖掘得到的第一挖掘行为日志序列。显著挖掘操作行为活动是指与显著操作行为活动最关联的参考操作行为日志。
例如,AI系统继续进行关联行为向量挖掘和关联行为特征挖掘,即使用显著操作行为活动相关的注意力行为向量与目标候选联系行为日志序列中每个参考操作行为日志相关的参考注意力行为向量进行注意力向量挖掘关联偏离度确定,然后根据每个编辑关联偏离度将目标候选联系行为日志序列中的每个参考操作行为日志进行排序,然后选取排序前列的参考操作行为日志就得到了显著操作行为活动相关的目标第一挖掘行为日志序列。然后再使用显著操作行为活动相关的用户操作行为特征与目标第一挖掘行为日志序列中参考操作行为日志相关的参考操作行为特征进行关联偏离度确定,然后根据每个关联偏离度将目标第一挖掘行为日志序列每个参考操作行为日志进行排序,然后选取排序最前列的参考操作行为日志就得到了显著操作行为活动相关的显著挖掘操作行为活动。
步骤W212,获取显著挖掘操作行为活动相关的显著用户需求,将显著用户需求确定为显著操作行为活动相关的用户操作行为日志簇中用户操作行为日志相关的预测用户需求。
其中,显著用户需求是指显著挖掘操作行为活动已经生成的预测用户需求。
例如,AI系统从数据库获取到显著挖掘操作行为活动相关的显著用户需求,然后将显著用户需求确定为显著操作行为活动相关的用户操作行为日志簇中每个用户操作行为日志相关的预测用户需求。即用户操作行为日志簇中每个用户操作行为日志的预测用户需求都为显著用户需求。
基于以上设计,在获取到多个用户操作行为日志时,通过将用户操作行为日志进行分簇,并选取显著操作行为活动,然后筛选得到显著操作行为活动相关的显著挖掘操作行为活动,从而得到该显著操作行为活动相关的用户操作行为日志簇中每个用户操作行为日志相关的预测用户需求,可以快速得到用户操作行为日志簇中每个用户操作行为日志相关的预测用户需求,提高了用户需求的生成处理性能。
一种示例性的独立设计思路中,步骤W206,依据多个用户操作行为特征对多个用户操作行为日志进行分簇,获得多个用户操作行为日志簇,包括:
步骤W302,获取分簇标签向量区间和目标分簇数量。
步骤W304,从多个用户操作行为特征中任意提取获得标的操作行为特征,确定标的操作行为特征和多个用户操作行为特征的偏离度,并确定偏离度在分簇标签向量区间内的用户操作行为特征数量。
其中,分簇标签向量区间是指分簇时进行同簇用户操作行为日志确实时使用的关联标签向量区间。即需要将分簇标签向量区间内的用户操作行为日志作为同簇用户操作行为日志。目标分簇数量是指分簇后每个类别中用户操作行为日志的最少配置参数。标的操作行为特征是指当前需要进行分簇确定的用户操作行为特征。
例如,AI系统可以直接基于数据服务器获取分簇标签向量区间和目标分簇数量。AI系统也可以获得相关开发人员上传的分簇标签向量区间和目标分簇数量。然后AI系统游走每个用户操作行为特征,即先从多个用户操作行为特征中任意提取获得标的操作行为特征,然后使用偏离度关联度算法确定标的操作行为特征与多个用户操作行为特征中除标的操作行为特征之外的用户操作行为特征之间的关联偏离度,并确定关联偏离度在分簇标签向量区间内的用户操作行为特征数量。
步骤W306,当用户操作行为特征数量大于目标分簇数量时,依据标的操作行为特征从多个用户操作行为特征中确定热力联系的用户操作行为特征。
例如,AI系统判断当用户操作行为特征数量大于目标分簇数量时,说明标的操作行为特征为关键操作片段。然后使用标的操作行为特征通过热力分布图从多个用户操作行为特征中确定热力联系的用户操作行为特征。AI系统判断当用户操作行为特征数量不大于目标分簇数量时,说明该标的操作行为特征为非关键操作片段,此时,从多个用户操作行为特征中选取任意一个除标的操作行为特征之外的用户操作行为特征确定为标的操作行为特征重新进行确定。
步骤W308,依据标的操作行为特征相关的用户操作行为日志和热力联系的用户操作行为特征相关的用户操作行为日志得到用户操作行为日志簇。
例如,AI系统根据标的操作行为特征相关的用户操作行为日志和所有热力联系的用户操作行为特征相关的用户操作行为日志就得到了用户操作行为日志簇。
步骤W310,依据用户操作行为日志簇从多个用户操作行为特征中确定每个待分簇片段特征,并从每个待分簇片段特征中任意选择目标待分簇片段特征。
其中,待分簇片段特征是指除已经分簇完成的用户操作行为特征之外的用户操作行为特征。
例如,AI系统将用户操作行为日志簇中每个用户操作行为日志相关的用户操作行为特征从多个用户操作行为特征中删除,获得余下的用户操作行为特征,即得到每个待分簇片段特征。并从每个待分簇片段特征中任意选择目标待分簇片段特征。
步骤W312,将目标待分簇片段特征确定为标的操作行为特征,并返回确定标的操作行为特征和多个用户操作行为特征的偏离度的步骤执行,直至多个用户操作行为日志全部分簇完成时,获得多个用户操作行为日志簇。
例如,AI系统将目标待分簇片段特征确定为标的操作行为特征,并返回确定标的操作行为特征和多个用户操作行为特征的偏离度的步骤进行循环迭代执行,直至将所有的用户操作行为日志全部分簇完成时,获得多个用户操作行为日志簇。
基于以上设计,通过获取分簇标签向量区间和目标分簇数量,然后使用分簇标签向量区间和目标分簇数量进行分簇确定,直至将所有的用户操作行为日志全部分簇完成时,获得多个用户操作行为日志簇,从而可以避免对关联的操作行为活动生成不同的预测用户需求从而出现需求冲突的情况,提高了基于大数据需求分析的互联网内容推送的精度。
一种示例性的独立设计思路中,步骤W206,即从多个用户操作行为日志簇中进行显著操作行为活动选取,获得多个用户操作行为日志簇相关的显著操作行为活动,包括:
步骤W402,从用户操作行为日志簇中确定当前用户操作行为日志和除当前用户操作行为日志之外的用户操作行为日志,获得每个余下用户操作行为日志。
步骤W404,依据当前用户操作行为日志相关的用户操作行为特征和每个余下用户操作行为日志相关的用户操作行为特征确定当前用户操作行为日志与每个余下用户操作行为日志的全局偏离度,获得当前目标偏离度。
其中,当前用户操作行为日志是指当前需要确实是否为显著操作行为活动的用户操作行为日志。余下用户操作行为日志是指用户操作行为日志簇中与当前用户操作行为日志不同的用户操作行为日志。当前目标偏离度是指当前用户操作行为日志相关的目标偏离度,该目标偏离度是与用户操作行为日志簇中其它用户操作行为日志之间的偏离度之和。
步骤W406,游走用户操作行为日志簇中每个用户操作行为日志,获得每个用户操作行为日志相关的当前目标偏离度。
例如,AI系统可以并行确定用户操作行为日志簇中每个用户操作行为日志相关的当前目标偏离度。
步骤W408,比较每个用户操作行为日志相关的当前目标偏离度,并将最小当前目标偏离度相关的用户操作行为日志作为用户操作行为日志簇相关的显著操作行为活动。
例如,AI系统可以比较每个用户操作行为日志相关的当前目标偏离度,从当前目标偏离度中确定最小的当前目标偏离度,然后将最小当前目标偏离度相关的用户操作行为日志作为用户操作行为日志簇相关的显著操作行为活动。
基于以上设计,通过确定用户操作行为日志簇中每个用户操作行为日志相关的当前目标偏离度,然后选取最小当前目标偏离度相关的用户操作行为日志作为用户操作行为日志簇相关的显著操作行为活动,从而使选取的显著操作行为活动更加准确。
一种示例性的独立设计思路中,步骤W110,即对用户操作行为日志进行行为倾向性向量挖掘,获得用户操作行为特征,包括步骤:
将用户操作行为日志传递至操作行为倾向决策网络中进行行为倾向性向量挖掘,获得用户操作行为特征,操作行为倾向决策网络是依据AI网络模型使用参考操作行为活动进行模型收敛优化获得的。
例如,AI系统预先使用参考操作行为活动通过AI网络模型进行训练,获得操作行为倾向决策网络,然后将操作行为倾向决策网络进行部署并使用。当需要使用时,AI系统将用户操作行为日志传递至操作行为倾向决策网络中,操作行为倾向决策网络进行行为倾向性向量挖掘,获得输入的用户操作行为特征。
一种示例性的独立设计思路中,步骤W120,即将用户操作行为特征进行注意力向量挖掘,获得用户操作行为日志相关的注意力行为向量,包括步骤:
对用户操作行为特征进行特征扩展,获得扩展用户操作行为特征;依据扩展用户操作行为特征确定行为关注挖掘空间下相关的关键行为向量,获得用户操作行为日志相关的注意力行为向量。
例如,AI系统可以使用对用户操作行为特征进行注意力向量挖掘,即先使用特征扩展算法对用户操作行为特征进行特征扩展,获得扩展用户操作行为特征。然后使用扩展用户操作行为特征确定行为关注挖掘空间下相关的关键行为向量,获得用户操作行为日志相关的注意力行为向量。通过对用户操作行为特征进行特征扩展,获得扩展用户操作行为特征,依据扩展用户操作行为特征确定行为关注挖掘空间下相关的关键行为向量,获得用户操作行为日志相关的注意力行为向量,使得到的注意力行为向量更加的准确。
一种示例性的独立设计思路中,本申请实施例所提供的基于大数据需求分析的互联网内容推送方法,还包括:
步骤W502,在没有搜索到每个参考用户需求的参考操作行为日志时,获取模糊预测用户需求,模糊预测用户需求用于表征当前基于模糊算法分析获得的倾向用户需求。
例如,AI系统在没有搜索到每个参考用户需求的参考操作行为日志时,说明此时,刚开始进行用户需求的生成,所有的操作行为活动都未有相关的预测用户需求。此时,AI系统获取到保存的模糊预测用户需求,模糊预测用户需求用于表征当前基于模糊算法分析获得的倾向用户需求。
步骤W504,依据模糊预测用户需求进行需求衍生,获得第一目标模糊预测用户需求。
例如,AI系统将模糊预测用户需求相关的需求向量进行需求衍生操作,例如,可以进行相关联的其它需求的映射操作,获得需求衍生后的模糊预测用户需求,即第一目标模糊预测用户需求。
步骤W506,将第一目标模糊预测用户需求确定为用户操作行为日志相关的预测用户需求。
例如,AI系统将第一目标模糊预测用户需求保存并将第一目标模糊预测用户需求确定为用户操作行为日志相关的预测用户需求。
一种示例性的独立设计思路中,当操作行为活动进行关联查询时,未查询到候选联系行为日志序列时,说明参考操作行为日志中未存在关联的参考操作行为日志,此时AI系统获取到模糊预测用户需求,并依据模糊预测用户需求进行需求衍生,获得目标模糊预测用户需求,将目标模糊预测用户需求确定为该操作行为活动相关的预测用户需求。
基于以上设计,AI系统使用模糊预测用户需求来生成操作行为活动相关的预测用户需求,使生成的预测用户需求具有更多的参考价值。
一种示例性的独立设计思路中,步骤W130,依据用户操作行为特征和每个参考用户需求的参考操作行为日志相关的参考操作行为特征从每个参考用户需求的参考操作行为日志中进行联系行为日志调取,获得用户操作行为日志相关的候选联系行为日志序列,包括:
步骤W602,将用户操作行为特征进行特征扩展,获得目标扩展用户操作行为特征。
步骤W604,从每个参考用户需求的参考操作行为日志相关的参考操作行为特征中确定每个分簇集中向量,并确定目标扩展用户操作行为特征与每个分簇集中向量的集中关联偏离度,依据集中关联偏离度从每个分簇集中向量中确定候选分簇集中向量。
其中,分簇集中向量是指每个参考操作行为特征所属标签的中心相关的向量。候选分簇集中向量是指与目标扩展用户操作行为特征最关联的类别相关的分簇集中向量。集中关联偏离度是指使用偏离度关联度算法确定得到的偏离度。
例如,AI系统进行粗糙的返回,即AI系统使用特征扩展算法将用户操作行为特征进行特征扩展,获得目标扩展用户操作行为特征。然后预先使用每个参考用户需求的参考操作行为日志相关的参考操作行为特征进行分簇确定,获得分簇结果,然后在确定出每个分簇集中向量。当需要使用时,AI系统获取到每个分簇集中向量,并确定目标扩展用户操作行为特征与每个分簇集中向量的集中关联偏离度,然后从每个集中关联偏离度选取最小集中关联偏离度,将最小集中关联偏离度相关的分簇集中向量确定为候选分簇集中向量。
步骤W606,获取候选分簇集中向量相关的每个同簇参考操作行为特征,确定目标扩展用户操作行为特征与每个同簇参考操作行为特征的关联偏离度。
其中,同簇参考操作行为特征是指与候选分簇集中向量是同簇的参考操作行为特征。关联偏离度是指目标扩展用户操作行为特征与参考操作行为特征之间的偏离度,偏离度越小,联系度越高,偏离度越大,联系度越小。
例如,AI系统再从数据库中获取到候选分簇集中向量相关的每个同簇参考操作行为特征,然后再使用偏离度关联度算法确定目标扩展用户操作行为特征与每个同簇参考操作行为特征之间的关联偏离度。
步骤W608,依据关联偏离度从每个同簇参考操作行为特征中选取不大于目标偏离度的同簇参考操作行为特征,将不大于目标偏离度的同簇参考操作行为特征相关的参考操作行为日志作为用户操作行为日志相关的候选联系行为日志序列。
例如,AI系统将每个关联偏离度与目标偏离度进行比较,目标偏离度是预先设置好在搜索时关联偏离度的最大值。然后选取关联偏离度不大于目标偏离度的同簇参考操作行为特征相关的参考操作行为日志作为用户操作行为日志相关的候选联系行为日志序列。
基于以上设计,通过先从每个分簇集中向量中确定候选分簇集中向量,然后再从每个同簇参考操作行为特征中确定不大于目标偏离度的同簇参考操作行为特征相关的参考操作行为日志作为用户操作行为日志相关的候选联系行为日志序列,提高了搜索得到候选联系行为日志序列的处理性能。
一种示例性的独立设计思路中,步骤W140,即依据注意力行为向量与候选联系行为日志序列相关的参考注意力行为向量从候选联系行为日志序列中进行关联行为向量挖掘,获得用户操作行为日志相关的第一挖掘行为日志序列,包括步骤:
确定注意力行为向量分别与候选联系行为日志序列中每个待挖掘操作行为活动相关的参考注意力行为向量的关联偏离度,获得每个待挖掘操作行为活动相关的编辑关联偏离度;依据每个待挖掘操作行为活动相关的编辑关联偏离度和设定目标偏离度对每个待挖掘操作行为活动进行筛选,获得用户操作行为日志相关的第一挖掘行为日志序列。
其中,编辑关联偏离度是指使用注意力行为向量确定得到的偏离度,用于表征注意力行为向量之间的联系度,偏离度越小,联系度越高,偏离度越大,联系度越小。设定目标偏离度是指预先设置好的进行注意力向量挖掘特征筛选时的最小偏离度。
例如,AI系统使用汉明偏离度算法确定注意力行为向量分别与候选联系行为日志序列中每个待挖掘操作行为活动相关的参考注意力行为向量的关联偏离度,获得每个待挖掘操作行为活动相关的编辑关联偏离度,然后将每个编辑关联偏离度与设定目标偏离度进行比较,将编辑关联偏离度小于预设编辑关联偏离度的待挖掘操作行为活动作为第一挖掘行为日志序列中的参考操作行为日志。一种示例性的独立设计思路中,AI系统也可以将每个编辑关联偏离度从小到大依次进行排序,然后选取排序前列的编辑关联偏离度相关的待挖掘操作行为活动作为第一挖掘行为日志序列中的参考操作行为日志。
一种示例性的独立设计思路中,步骤W140,即依据用户操作行为特征与第一挖掘行为日志序列相关的参考操作行为特征从第一挖掘行为日志序列中进行关联行为特征挖掘,获得用户操作行为日志相关的第二挖掘行为日志序列,包括步骤:
确定用户操作行为特征分别与第一挖掘行为日志序列中每个第一挖掘操作行为活动相关的参考操作行为特征的关联偏离度,获得每个第一挖掘操作行为活动相关的关联偏离度;从每个第一挖掘操作行为活动相关的关联偏离度中确定最小关联偏离度,将最小关联偏离度相关的第一挖掘操作行为活动作为用户操作行为日志相关的第二挖掘行为日志序列。
其中,关联偏离度是指使用操作行为特征确定得到的偏离度,用于表征操作行为特征之间的联系度,偏离度越小,联系度越高,偏离度越大,联系度越小。
例如,AI系统可以使用欧式偏离度算法确定用户操作行为特征分别与第一挖掘行为日志序列中每个第一挖掘操作行为活动相关的参考操作行为特征的关联偏离度,获得每个第一挖掘操作行为活动相关的关联偏离度。然后将每个关联偏离度依次进行升序,并选取最小关联偏离度相关的第一挖掘操作行为活动作为用户操作行为日志相关的第二挖掘行为日志序列。
基于以上设计,通过确定编辑关联偏离度,然后使用偏离度对每个待挖掘操作行为活动进行筛选,获得第一挖掘行为日志序列。然后在通过时间关联偏离度,使用关联偏离度从第一挖掘行为日志序列中确定第二挖掘行为日志序列,提高了得到第二挖掘行为日志序列的处理性能。
一种示例性的独立设计思路中,本申请实施例所提供的基于大数据需求分析的互联网内容推送方法,还包括步骤:
当最小关联偏离度大于预设关联偏离度阈值时,获取模糊预测用户需求;依据模糊预测用户需求进行需求衍生,获得第二目标模糊预测用户需求并进行配置;将第二目标模糊预测用户需求确定为用户操作行为日志相关的预测用户需求。
其中,预设关联偏离度阈值是指预先设置好的最小关联偏离度,用于表征参考操作行为日志和用户操作行为日志关联时的最小偏离度,大于预设关联偏离度阈值,说明参考操作行为日志和用户操作行为日志不关联,当不大于预设关联偏离度阈值,说明参考操作行为日志和用户操作行为日志关联。
例如,当最小关联偏离度大于预设关联偏离度阈值时,说明该最小关联偏离度相关的参考操作行为日志未与用户操作行为日志关联,此时,AI系统获取保存的模糊预测用户需求,该模糊预测用户需求是上一次进行需求衍生后保存的。此时使用该模糊预测用户需求进行需求衍生,获得第二目标模糊预测用户需求并进行配置,将第二目标模糊预测用户需求确定为用户操作行为日志相关的预测用户需求。
基于以上设计,当第二挖掘行为日志序列的关联偏离度大于预设关联偏离度阈值时,获取模糊预测用户需求;依据模糊预测用户需求进行需求衍生,获得第二目标模糊预测用户需求,将第二目标模糊预测用户需求确定为用户操作行为日志相关的预测用户需求。提高了基于大数据需求分析的互联网内容推送的精度。
一种示例性的独立设计思路中,从每个第一挖掘操作行为活动相关的关联偏离度中确定最小关联偏离度,将最小关联偏离度相关的第一挖掘操作行为活动作为用户操作行为日志相关的第二挖掘行为日志序列,包括:
步骤W702,将每个第一挖掘操作行为活动相关的关联偏离度进行升序,获得关联偏离度排列集。
步骤W704,依次从关联偏离度排列集中选取多个关联偏离度,并得到多个关联偏离度相关的目标第一挖掘操作行为活动。
例如,AI系统也可以根据每个第一挖掘操作行为活动相关的关联偏离度按照从小到大的顺序将每个第一挖掘操作行为活动进行排序,获得第一挖掘操作行为活动的排序结果,然后从第一挖掘操作行为活动的排序结果中选取排序前列的第一挖掘操作行为活动,获得多个目标第一挖掘操作行为活动。
步骤W706,获取每个目标第一挖掘操作行为活动分别相关的参考用户需求,统计每个目标第一挖掘操作行为活动分别相关的参考用户需求中相同参考用户需求相关的目标第一挖掘操作行为活动数量。
例如,AI系统获取到每个目标第一挖掘操作行为活动相关的参考用户需求,然后将每个目标第一挖掘操作行为活动相关的参考用户需求进行匹配,获得匹配一致的目标第一挖掘操作行为活动,然后统计相同参考用户需求的目标第一挖掘操作行为活动的数量,获得所有相同参考用户需求相关的目标第一挖掘操作行为活动数量。
步骤W708,比较相同参考用户需求相关的目标第一挖掘操作行为活动数量,并将最大第二挖掘行为日志序列数量相关的第一挖掘操作行为活动作为用户操作行为日志相关的第二挖掘行为日志序列。
例如,AI系统选取最大目标第一挖掘操作行为活动数量相关的第一挖掘操作行为活动作为用户操作行为日志相关的第二挖掘行为日志序列。例如,选取了5个目标第一挖掘操作行为活动,其中,具有相同参考用户需求的目标第一挖掘操作行为活动有三个,余下的两个第一挖掘操作行为活动为相同参考用户需求,此时,将有三个的相同参考用户需求的第一挖掘操作行为活动作为用户操作行为日志相关的第二挖掘行为日志序列。即通过投票的方式选取第二挖掘行为日志序列,进而将相同参考用户需求确定为用户操作行为日志的预测用户需求,提高了基于大数据需求分析的互联网内容推送的精度。
一种示例性的独立设计思路中,在步骤W150之后,即在获取第二挖掘行为日志序列相关的参考用户需求分布,将参考用户需求分布确定为用户操作行为日志相关的预测用户需求之后,还包括:
将用户操作行为日志、用户操作行为日志相关的用户操作行为特征、用户操作行为日志相关的注意力行为向量和用户操作行为日志相关的预测用户需求进行关联配置。
例如,AI系统将用户操作行为日志、用户操作行为日志相关的用户操作行为特征、用户操作行为日志相关的注意力行为向量和用户操作行为日志相关的预测用户需求进行关联配,将用户操作行为日志作为参考操作行为日志进行进行后续部署处理。
一种示例性的独立设计思路中,本申请实施例还提供一种基于人工智能的操作行为活动推送方法,包括以下步骤:
步骤W802,获取候选操作行为活动和过往信任操作行为活动的用户需求集.
其中,候选操作行为活动是待确定是否需要进行推送的操作行为活动。过往信任操作行为活动是指已经确认推送过的操作行为活动。过往信任操作行为活动的用户需求集中包括多个过往信任操作行为活动的用户需求,过往信任操作行为活动的用户需求是指过往信任操作行为活动相关的预测用户需求。
例如,AI系统可以直接基于数据服务器获取候选操作行为活动和过往信任操作行为活动的用户需求集,也可以获取上传的候选操作行为活动,然后从数据库中获取到过往信任操作行为活动的用户需求集。AI系统还可以从业务AI系统获取到候选操作行为活动和过往信任操作行为活动的用户需求集。
步骤W804,获取候选操作行为活动相关的预测用户需求,其中,通过对候选操作行为活动进行行为倾向性向量挖掘,获得候选操作行为特征,将候选操作行为特征进行注意力向量挖掘,获得候选操作行为活动相关的注意力行为向量,获取每个参考用户需求的参考操作行为日志、相关的参考操作行为特征和相关的参考注意力行为向量,并依据候选操作行为特征和每个参考用户需求的参考操作行为日志相关的参考操作行为特征从每个参考用户需求的参考操作行为日志中进行联系行为日志调取,获得候选操作行为活动相关的候选联系行为日志序列,依据注意力行为向量与候选联系行为日志序列相关的参考注意力行为向量从候选联系行为日志序列中进行关联行为向量挖掘,获得候选操作行为活动相关的第一挖掘行为日志序列,并依据候选操作行为特征与第一挖掘行为日志序列相关的参考操作行为特征从第一挖掘行为日志序列中进行关联行为特征挖掘,获得候选操作行为活动相关的第二挖掘行为日志序列,获取第二挖掘行为日志序列相关的参考用户需求分布,将参考用户需求分布确定为候选操作行为活动相关的预测用户需求。
例如,AI系统获取到候选操作行为活动相关的预测用户需求,可以是从数据库中获取到保存的预测用户需求,该用户需求是预先生成好的。AI系统也可以在获取到候选操作行为活动,生成候选操作行为活动相关的预测用户需求,即可以使用上述基于大数据需求分析的互联网内容推送方法中任意一实施例预测的用户需求。例如,AI系统可以通过对候选操作行为活动进行行为倾向性向量挖掘,获得候选操作行为特征,将候选操作行为特征进行注意力向量挖掘,获得候选操作行为活动相关的注意力行为向量,获取每个参考用户需求的参考操作行为日志、相关的参考操作行为特征和相关的参考注意力行为向量,并依据候选操作行为特征和每个参考用户需求的参考操作行为日志相关的参考操作行为特征从每个参考用户需求的参考操作行为日志中进行联系行为日志调取,获得候选操作行为活动相关的候选联系行为日志序列,依据注意力行为向量与候选联系行为日志序列相关的参考注意力行为向量从候选联系行为日志序列中进行关联行为向量挖掘,获得候选操作行为活动相关的第一挖掘行为日志序列,并依据候选操作行为特征与第一挖掘行为日志序列相关的参考操作行为特征从第一挖掘行为日志序列中进行关联行为特征挖掘,获得候选操作行为活动相关的第二挖掘行为日志序列,获取第二挖掘行为日志序列相关的参考用户需求分布,将参考用户需求分布确定为候选操作行为活动相关的预测用户需求。
步骤W806,确定候选操作行为活动相关的预测用户需求与过往信任操作行为活动的用户需求集中过往信任操作行为活动的用户需求的联系度。
例如,AI系统使用关联偏离度算法确定候选操作行为活动相关的预测用户需求与推送操作行为活动的用户需求集中每个过往信任操作行为活动的用户需求的联系度,获得每个用户需求联系度。过往信任操作行为活动的用户需求集是已经获得的操作行为活动相关的预测用户需求形成的序列。
步骤W808,当联系度均不大于目标联系度时,将候选操作行为活动向相关的用户需求处理服务进行推送。
例如,目标联系度是指预设的用于表征候选操作行为活动与过往信任操作行为活动关联的阈值。如果候选操作行为活动与过往信任操作行为活动关联时,是没必要候选操作行为活动进行推送的。即当所有的联系度中任意一个联系度大于目标联系度时,AI系统就不将候选操作行为活动进行推送,避免将已经推送过的操作行为活动再次推送给用户。只有当所有的联系度均不大于目标联系度,说明该候选操作行为活动是未推送过的操作行为活动,此时,将AI系统可以将候选操作行为活动向相关的用户需求处理服务进行推送。
如此设计,通过获取候选操作行为活动和过往信任操作行为活动的用户需求集,然后获取候选操作行为活动相关的预测用户需求,再确定候选操作行为活动相关的预测用户需求与过往信任操作行为活动的用户需求集中过往信任操作行为活动的用户需求的联系度;当联系度均不大于目标联系度时,将候选操作行为活动向相关的用户需求处理服务进行推送,由于提高了生成用户需求的处理性能,进而能够快速获取到候选操作行为活动相关的预测用户需求,然后确定联系度,当联系度均不大于目标联系度时,将候选操作行为活动向相关的用户需求处理服务进行推送,从而可以避免推送重复的操作行为活动并且提高了操作行为活动的推送处理性能。
一种示例性的独立设计思路中,提供一种基于人工智能的操作行为活动异常分析方法,可以包括以下步骤:
获取待分析操作行为活动和异常操作行为活动的异常用户需求集,并生成待分析操作行为活动的待分析用户需求,其中,通过对待分析操作行为活动进行行为倾向性向量挖掘,获得待分析操作行为特征,将用户需求操作行为特征进行注意力向量挖掘,获得用户需求操作行为活动相关的注意力行为向量,获取每个参考用户需求的参考操作行为日志、相关的参考操作行为特征和相关的参考注意力行为向量,并依据用户需求操作行为特征和每个参考用户需求的参考操作行为日志相关的参考操作行为特征从每个参考用户需求的参考操作行为日志中进行联系行为日志调取,获得用户需求操作行为活动相关的候选联系行为日志序列,依据注意力行为向量与候选联系行为日志序列相关的参考注意力行为向量从候选联系行为日志序列中进行关联行为向量挖掘,获得用户需求操作行为活动相关的第一挖掘行为日志序列,并依据用户需求操作行为特征与第一挖掘行为日志序列相关的参考操作行为特征从第一挖掘行为日志序列中进行关联行为特征挖掘,获得用户需求操作行为活动相关的第二挖掘行为日志序列,获取第二挖掘行为日志序列相关的参考用户需求分布,将参考用户需求分布确定为待分析操作行为活动相关的待分析用户需求;
确定待分析用户需求和异常用户需求集的汉明偏离度,获得异常联系度,当存在异常联系度大于预设异常阈值时,确定待分析操作行为活动为异常操作行为活动。
异常用户需求是指预先生成的异常操作行为活动的预测用户需求。异常用户需求集中包括有每个异常用户需求。异常联系度用于表征待分析操作行为活动与异常操作行为活动的联系度,联系度越高,说明待分析操作行为活动为异常操作行为活动的可能性就越大。
例如,AI系统在对待分析操作行为活动进行分析时,可以获取待分析操作行为活动和异常操作行为活动的异常用户需求集,并生成待分析操作行为活动的待分析用户需求,然后确定待分析用户需求和异常用户需求集的汉明偏离度,获得异常联系度,当存在异常联系度大于预设异常阈值时,确定待分析操作行为活动为异常操作行为活动。当所有的异常联系度均不大于预设异常阈值时,确定该待分析操作行为活动为正常操作行为活动。在进行异常联系度确定时,可以快速确定出与异常用户需求集中所有异常用户需求的异常联系度,从而能够提高异常操作行为活动分析的处理性能。
一种示例性的独立设计思路中,提供一种基于大数据需求分析的互联网内容推送方法,具体包括以下步骤:
步骤W902,获取多个用户操作行为日志,并行将多个用户操作行为日志传递至操作行为倾向决策网络中进行行为倾向性向量挖掘,获得多个用户操作行为特征。
步骤W904,将多个用户操作行为特征进行特征扩展,获得扩展用户操作行为特征,依据扩展用户操作行为特征确定行为关注挖掘空间下相关的关键行为向量,获得多个用户操作行为日志相关的注意力行为向量。
步骤W906,依据多个用户操作行为特征对多个用户操作行为日志进行分簇,获得多个用户操作行为日志簇,并从多个用户操作行为日志簇中进行显著操作行为活动选取,获得多个用户操作行为日志簇相关的显著操作行为活动。
步骤W908,依据显著操作行为活动相关的用户操作行为特征和每个参考用户需求的参考操作行为日志相关的参考操作行为特征从每个参考用户需求的参考操作行为日志中进行联系行为日志调取,获得显著操作行为活动相关的目标候选联系行为日志序列。
步骤W910,依据显著操作行为活动相关的注意力行为向量与目标候选联系行为日志序列相关的参考注意力行为向量从目标候选联系行为日志序列中进行关联行为向量挖掘,获得显著操作行为活动相关的目标第一挖掘行为日志序列,并依据显著操作行为活动相关的用户操作行为特征与目标第一挖掘行为日志序列相关的参考操作行为特征从目标第一挖掘行为日志序列中进行关联行为特征挖掘,获得显著操作行为活动相关的显著挖掘操作行为活动。
步骤W912,获取显著挖掘操作行为活动相关的显著用户需求,将显著用户需求确定为显著操作行为活动相关的用户操作行为日志簇中用户操作行为日志相关的预测用户需求。
其中,并行执行步骤W908到步骤W912,获得每个显著操作行为活动相关的用户操作行为日志簇中用户操作行为日志相关的预测用户需求,进一步提高了基于大数据需求分析的互联网内容推送处理性能。
一种可依据独立构思的实施例中,参见图3所示,该AI系统100可以包括:处理器101和机器可读存储介质102。其中,所述机器可读存储介质102用于存储支持该AI系统100执行上述前述任意一种实施例中提供的基于大数据需求分析的互联网内容推送方法的程序,所述处理器101被配置为用于执行所述机器可读存储介质102中存储的程序。
所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器101执行时能够实现前述任意一种实施例中的全部或部分步骤。
其中,所述AI系统100的架构中还可以包括通信单元103,用于该AI系统100与其它设备或通信网络通信(例如智慧医疗注册平台200)。
另外,本申请实施例提供了一种计算机存储介质,用于储存上述AI系统100所用的计算机软件指令,其包含用于执行上述前述任意一种方法实施例中基于大数据需求分析的互联网内容推送方法所涉及的程序。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种基于大数据需求分析的互联网内容推送方法,其特征在于,应用于所述AI系统,所述方法包括:
获取针对响应传递的用户操作行为日志的预测用户需求序列;
依据所述预测用户需求序列确定对应的目标用户的第一用户画像特征分布,基于所述第一用户画像特征分布向预设用户社群服务内的各内容推送服务传递用户互动跟踪请求,以请求各内容推送服务在对应用户群体内进行目标用户的初始互动跟踪,所述第一用户画像特征分布包括第一用户画像特征,所述第一用户画像特征未涵盖所述目标用户在预设的多个用户社群互动活动中的一个或者多个用户社群互动活动对应的用户画像特征;
获得各内容推送服务在初始互动跟踪流程中生成的初始互动跟踪日志,并基于所述初始互动跟踪日志获得所述目标用户的第二用户画像特征分布,所述初始互动跟踪日志包括与所述第一用户画像特征分布的知识点关联度大于第一目标知识点关联度的一个或者多个用户社群互动日志;
基于所述第二用户画像特征分布,确定所述预设用户社群服务内的一个或者多个内容推送服务确定为目标内容推送服务;
基于所述第二用户画像特征分布向所述目标内容推送服务传递内容推送配置规则,以请求所述目标内容推送服务对所述目标用户进行对应的互联网内容推送。
2.根据权利要求1所述的基于大数据需求分析的互联网内容推送方法,其特征在于,所述基于所述初始互动跟踪日志获得所述目标用户的第二用户画像特征分布,包括:
从各所述内容推送服务生成的所述初始互动跟踪日志中获取各所述内容推送服务生成的与所述第一用户画像特征分布的知识点关联度大于第一目标知识点关联度的用户社群互动日志;
针对每个所述用户社群互动日志,基于用户画像特征挖掘网络,基于所述用户画像特征挖掘网络包括的与多个社群互动标签分别对应的互动意图挖掘结构从所述用户社群互动日志中挖掘各所述社群互动标签下的互动意图向量集;
基于所述用户画像特征挖掘网络包括的用户画像映射结构将每个所述社群互动标签下的互动意图向量集进行用户画像映射,获得每个所述社群互动标签下的互动意图向量集对应的用户画像特征;
基于所述用户画像特征挖掘网络包括的知识点关联分析结构基于所述社群互动标签下的互动意图向量集对应的用户画像特征与所述第一用户画像特征分布对应的第一用户画像特征计算所述用户社群互动日志与所述第一用户画像特征分布的知识点关联度,若所述知识点关联度大于第二目标知识点关联度,则将所述用户社群互动日志确定为关键社群互动日志,其中所述第二目标知识点关联度大于所述第一目标知识点关联度;
获取预设的整体社群互动标签集,所述整体社群互动标签集包括针对所述目标用户的多个所述用户社群互动活动;
基于所述整体社群互动标签集以及所述第一用户画像特征分布的第一用户画像特征确定针对所述目标用户的补充社群互动标签;
从所述关键社群互动日志中获取所述补充社群互动标签下的用户补充行为特征数据,基于所述用户补充行为特征数据对所述第一用户画像特征分布进行补充更新,获得所述第二用户画像特征分布;
所述基于所述第二用户画像特征分布,确定所述预设用户社群服务内的一个或者多个内容推送服务确定为目标内容推送服务,包括:
基于所述第二用户画像特征分布中的用户补充行为特征数据所对应的一个或者多个关联社群互动日志,确定生成所述一个或者多个关联社群互动日志的一个或者多个内容推送服务确定为所述目标内容推送服务。
3.根据权利要求2所述的基于大数据需求分析的互联网内容推送方法,其特征在于,所述方法还包括:
获取参考训练数据集合,所述参考训练数据集合包括多个具有参考用户画像特征的参考社群互动日志;
获取初始化AI训练网络,所述初始化AI训练网络包括互动意图挖掘结构、用户画像映射结构、以及知识点关联分析结构;
针对每个所述参考社群互动日志,基于所述互动意图挖掘结构获取所述参考社群互动日志在多个用户社群互动活动下的互动意图向量集;
基于所述用户画像映射结构将每个所述用户社群互动活动下的互动意图向量集进行用户画像映射,获得每个所述用户社群互动活动下的互动意图向量集对应的用户画像特征;
基于所述知识点关联分析结构基于所述用户社群互动活动下的互动意图向量集对应的用户画像特征得到一预测用户画像特征;
基于所述预测用户画像特征与所述参考用户画像特征进行确定第一学习收敛评估指标;
基于所述第一学习收敛评估指标对所述初始化AI训练网络的网络权重信息进行循环更新,直至所述第一学习收敛评估指标匹配第一训练终止要求,获得匹配网络部署要求的初始化AI训练网络作为所述用户画像特征挖掘网络;
其中,所述第一学习收敛评估指标由各所述预测用户画像特征中的各用户画像特征与所述参考用户画像特征中对应的各用户画像特征的第一知识点关联度进行确定,所述第一训练终止要求包括所述第一学习收敛评估指标表征的第一知识点关联度大于第一目标关联度阈值。
4.根据权利要求3所述的基于大数据需求分析的互联网内容推送方法,其特征在于,所述方法还包括:
获取参考训练数据集合,所述参考训练数据集合包括多个具有参考用户画像特征的参考社群互动日志;
获取初始化AI训练网络,并对所述初始化AI训练网络进行基于公开网络权重信息的网络初始优化,获得优化后的初始化AI训练网络;
针对每个所述参考社群互动日志,基于所述初始化AI训练网络获取所述参考社群互动日志在多个用户社群互动活动下的互动意图向量集,并基于所述用户社群互动活动下的互动意图向量集以及所述参考用户画像特征包括的用户画像特征进行确定第二学习收敛评估指标;
基于所述第二学习收敛评估指标对所述优化后的初始化AI训练网络的网络权重信息进行循环更新,直至所述第二学习收敛评估指标匹配第二训练终止要求,获得匹配网络部署要求的初始化AI训练网络作为目标AI网络;
其中,所述第二学习收敛评估指标由各所述用户社群互动活动下的互动意图向量集与所述参考用户画像特征中对应的各用户画像特征的第二知识点关联度进行确定,所述第二训练终止要求包括所述第二学习收敛评估指标表征的第二知识点关联度大于第二目标关联度阈值,所述第二目标关联度阈值小于所述第一目标关联度阈值;
将所述目标AI网络配置到各所述内容推送服务,以请求所述内容推送服务基于所述目标AI网络对所述预设用户社群服务内的用户进行互动跟踪识别,以向所述内容推送服务生成所述初始互动跟踪日志。
5.根据权利要求3或4所述的基于大数据需求分析的互联网内容推送方法,其特征在于,所述获取参考训练数据集合,包括:
基于多个内容推送服务获取目标应用业务环境下的社群互动日志,获得多个社群互动日志;
将各所述社群互动日志作为参考社群互动日志添加到预设的参考互动日志数据集中;
提取所述参考互动日志数据集中的各所述参考社群互动日志在多个用户社群互动活动下的互动意图向量集,获得每个参考社群互动日志对应的互动意图向量分布;
基于每个所述参考社群互动日志对应的互动意图向量分布,对所述参考互动日志数据集中的参考社群互动日志进行数据清洗,获得清洗后的参考互动日志数据集;
基于清洗后的参考互动日志数据集中各参考社群互动日志对应的互动意图向量分布得到所述参考社群互动日志对应的参考用户画像特征,并将所述用户画像特征与所述参考社群互动日志在所述参考互动日志数据集中进行相关配置,获得所述参考训练数据集合;
其中,基于每个所述参考社群互动日志对应的互动意图向量分布,对所述参考互动日志数据集中的参考社群互动日志进行数据清洗,得的清洗后的参考互动日志数据集,包括:
针对每个所述参考社群互动日志,确定所述参考社群互动日志对应的所述互动意图向量分布中是否存在遗漏特征数据;
若存在遗漏特征数据,则将所述参考社群互动日志从所述参考训练数据集合中删除;
其中,所述遗漏特征数据包括所述参考社群互动日志对应的互动意图向量分布中未涵盖在先设定的用户社群互动活动下的互动意图向量集或者未涵盖预设数量个用户社群互动活动下的互动意图向量集。
6.根据权利要求5所述的基于大数据需求分析的互联网内容推送方法,其特征在于,所述获取参考训练数据集合,还包括:
复制所述参考训练数据集合中一部分参考社群互动日志作为候选社群互动日志;
将所述候选社群互动日志对应的用户画像特征中的一个或者多个用户社群互动活动对应的用户画像特征进行特征衍生,所述特征衍生包括将对应的用户画像特征使用联系画像特征衍生或者添加对应关联的用户画像特征;
将特征衍生后的候选社群互动日志作为衍生训练数据对象添加到所述参考训练数据集合,并对添加到所述衍生训练数据对象后的参考训练数据集合进行随机置乱调整,获得扩展数量后的参考训练数据集合;
其中,所述多个用户社群互动活动的数量为N,所述将所述候选社群互动日志对应的用户画像特征中的一个或者多个社群互动标签对应的用户画像特征进行特征衍生,包括:
将所述候选社群互动日志添加到在先配置的参考数据集中,获得候选社群互动日志集;
确定每个用户社群互动活动所需进行特征衍生的量化值;
基于第M个用户社群互动活动所需进行特征衍生的量化值,从所述候选社群互动日志集中获取对应数量的候选社群互动日志,并对所述候选社群互动日志对应的第M个用户社群互动活动对应的用户画像特征进行特征衍生,获得第M个衍生参考数据集;其中,M为大于等于1小于等于N的自然数;
所述将特征衍生后的候选社群互动日志作为衍生训练数据对象添加到所述参考训练数据集合,并对添加到所述衍生训练数据对象后的参考训练数据集合进行随机置乱调整,获得扩展数量后的参考训练数据集合,包括:
依序将得到的第M个衍生参考数据集添加到所述参考训练数据集合,并在第N个衍生参考数据集添加到所述参考训练数据集合之后,对所述参考训练数据集合进行随机置乱调整。
7.根据权利要求6所述的基于大数据需求分析的互联网内容推送方法,其特征在于,所述将所述候选社群互动日志对应的用户画像特征中的一个或者多个用户社群互动活动对应的用户画像特征进行特征衍生获取参考训练数据集合,还包括:
确定预设的进行特征衍生对应的由至少两个用户社群互动活动进行组合得到的一个或者多个社群互动活动簇;
针对每个所述社群互动活动簇,从所述候选社群互动日志中获取一个或者多个对应的候选社群互动日志,并将获取的候选社群互动日志中与所述社群互动活动簇中包括的用户社群互动活动对应的用户画像特征进行多特征衍生。
8.根据权利要求1所述的基于大数据需求分析的互联网内容推送方法,其特征在于,所述第一用户画像特征分布还包括针对所述目标用户的第一行为兴趣特征,所述初始互动跟踪日志还包括各所述内容推送服务生成的用户社群互动日志对应的第二行为兴趣特征;所述获得各内容推送服务在初始互动跟踪流程中生成的初始互动跟踪日志,并基于所述初始互动跟踪日志获得所述目标用户的第二用户画像特征分布,包括:
基于所述第一行为兴趣特征和所述第二行为兴趣特征对各所述内容推送服务进行支撑值输出,获得各所述内容推送服务分别与所述目标用户之间的服务支撑值;
将对应的服务支撑值小于目标支撑值的内容推送服务生成的用户社群互动日志清洗,获得候选输出社群互动日志集;
基于所述候选输出社群互动日志集中的每个用户社群互动日志,获得所述目标用户的第二用户画像特征分布;
其中,所述基于所述第一行为兴趣特征和所述第二行为兴趣特征对各所述内容推送服务进行支撑值输出,包括:
基于所述第一行为兴趣特征获取所述目标用户对应的第一行为兴趣节点和第一行为兴趣内容;
基于所述第二行为兴趣特征获取各所述内容推送服务生成的用户社群互动日志对应的第二行为兴趣节点和第二行为兴趣内容;
基于所述预设用户社群服务对应的社群主题知识图谱,基于所述社群主题知识图谱确定所述目标用户从所述第一行为兴趣内容对应的第一内容区域跳转到所述第二行为兴趣内容对应的第二内容区域的内容跳转路线和对应的跳转代价;
基于所述跳转代价以及所述第一行为兴趣节点和第二行为兴趣节点的行为兴趣关联值确定所述目标用户与各所述内容推送服务对应的服务支撑值。
9.根据权利要求1所述的基于大数据需求分析的互联网内容推送方法,其特征在于,所述获取针对响应传递的用户操作行为日志的预测用户需求序列的步骤,包括:
响应用户需求预测请求,所述用户需求预测请求对应关联了用户操作行为日志,并对所述用户操作行为日志进行行为倾向性向量挖掘,获得用户操作行为特征;
将所述用户操作行为特征进行注意力向量挖掘,获得所述用户操作行为日志相关的注意力行为向量;
获取每个参考用户需求的参考操作行为日志、相关的参考操作行为特征和相关的参考注意力行为向量,并依据所述用户操作行为特征和所述每个参考用户需求的参考操作行为日志相关的参考操作行为特征从所述每个参考用户需求的参考操作行为日志中进行联系行为日志调取,获得所述用户操作行为日志相关的候选联系行为日志序列;
依据所述注意力行为向量与所述候选联系行为日志序列相关的参考注意力行为向量从所述候选联系行为日志序列中进行关联行为向量挖掘,获得所述用户操作行为日志相关的第一挖掘行为日志序列,并依据所述用户操作行为特征与所述第一挖掘行为日志序列相关的参考操作行为特征从所述第一挖掘行为日志序列中进行关联行为特征挖掘,获得所述用户操作行为日志相关的第二挖掘行为日志序列;
获取所述第二挖掘行为日志序列相关的参考用户需求分布,将所述参考用户需求分布确定为所述用户操作行为日志相关的预测用户需求。
10.一种AI系统,其特征在于,所述AI系统包括处理器和机器可读存储介质,所述机器可读存储介质中存储有计算机程序,所述计算机程序依据该处理器加载并执行以实现权利要求1-9中任意一项的基于大数据需求分析的互联网内容推送方法。
CN202111502278.5A 2021-12-09 2021-12-09 基于大数据需求分析的互联网内容推送方法及ai系统 Active CN114117240B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111502278.5A CN114117240B (zh) 2021-12-09 2021-12-09 基于大数据需求分析的互联网内容推送方法及ai系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111502278.5A CN114117240B (zh) 2021-12-09 2021-12-09 基于大数据需求分析的互联网内容推送方法及ai系统

Publications (2)

Publication Number Publication Date
CN114117240A true CN114117240A (zh) 2022-03-01
CN114117240B CN114117240B (zh) 2022-07-08

Family

ID=80364885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111502278.5A Active CN114117240B (zh) 2021-12-09 2021-12-09 基于大数据需求分析的互联网内容推送方法及ai系统

Country Status (1)

Country Link
CN (1) CN114117240B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114691630A (zh) * 2022-06-01 2022-07-01 前海容安供应链管理(深圳)有限公司 一种智慧供应链大数据共享方法及系统
CN115423565A (zh) * 2022-09-15 2022-12-02 卢施施 应用于云端互联网交互流程的大数据分析方法及ai系统
CN115455300A (zh) * 2022-09-29 2022-12-09 吴敬晗 基于人工智能的数据推送方法、系统及云平台
CN115484266A (zh) * 2022-11-14 2022-12-16 深圳市乙辰科技股份有限公司 一种基于负载均衡的数据分发处理方法、系统及云平台

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229708A (zh) * 2017-05-27 2017-10-03 科技谷(厦门)信息技术有限公司 一种个性化出行服务大数据应用系统及方法
CN109597940A (zh) * 2018-12-06 2019-04-09 上海哔哩哔哩科技有限公司 基于商业兴趣的目标人群确定及信息推送方法和系统
US20190332946A1 (en) * 2018-04-30 2019-10-31 Facebook, Inc. Combining machine-learning and social data to generate personalized recommendations
CN112667899A (zh) * 2020-12-30 2021-04-16 杭州智聪网络科技有限公司 基于用户兴趣迁移的冷启动推荐方法、装置及存储设备
CN113361794A (zh) * 2021-06-21 2021-09-07 深圳市鸿业电线有限公司 基于互联网电商大数据的信息推送方法及ai推送系统
CN113468434A (zh) * 2021-09-06 2021-10-01 北京搜狐新动力信息技术有限公司 资源推荐方法、装置、可读介质以及设备
CN113569135A (zh) * 2021-06-30 2021-10-29 深圳市东信时代信息技术有限公司 基于用户画像的推荐方法、装置、计算机设备及存储介质
CN113628005A (zh) * 2021-07-31 2021-11-09 李德财 基于电商会话大数据的推送更新方法及大数据ai系统
CN113742575A (zh) * 2021-10-19 2021-12-03 广州启生信息技术有限公司 一种用户画像的注意力标签生成方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229708A (zh) * 2017-05-27 2017-10-03 科技谷(厦门)信息技术有限公司 一种个性化出行服务大数据应用系统及方法
US20190332946A1 (en) * 2018-04-30 2019-10-31 Facebook, Inc. Combining machine-learning and social data to generate personalized recommendations
CN109597940A (zh) * 2018-12-06 2019-04-09 上海哔哩哔哩科技有限公司 基于商业兴趣的目标人群确定及信息推送方法和系统
CN112667899A (zh) * 2020-12-30 2021-04-16 杭州智聪网络科技有限公司 基于用户兴趣迁移的冷启动推荐方法、装置及存储设备
CN113361794A (zh) * 2021-06-21 2021-09-07 深圳市鸿业电线有限公司 基于互联网电商大数据的信息推送方法及ai推送系统
CN113569135A (zh) * 2021-06-30 2021-10-29 深圳市东信时代信息技术有限公司 基于用户画像的推荐方法、装置、计算机设备及存储介质
CN113628005A (zh) * 2021-07-31 2021-11-09 李德财 基于电商会话大数据的推送更新方法及大数据ai系统
CN113468434A (zh) * 2021-09-06 2021-10-01 北京搜狐新动力信息技术有限公司 资源推荐方法、装置、可读介质以及设备
CN113742575A (zh) * 2021-10-19 2021-12-03 广州启生信息技术有限公司 一种用户画像的注意力标签生成方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HONGZHI YIN ET AL.: "Adapting to User Interest Drift for POI Recommendation", 《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》 *
张雨: "融合用户聚类和协同过滤的新闻推荐系统设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
赵俊逸 等: "协同过滤推荐系统综述", 《信息安全学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114691630A (zh) * 2022-06-01 2022-07-01 前海容安供应链管理(深圳)有限公司 一种智慧供应链大数据共享方法及系统
CN115423565A (zh) * 2022-09-15 2022-12-02 卢施施 应用于云端互联网交互流程的大数据分析方法及ai系统
CN115455300A (zh) * 2022-09-29 2022-12-09 吴敬晗 基于人工智能的数据推送方法、系统及云平台
CN115484266A (zh) * 2022-11-14 2022-12-16 深圳市乙辰科技股份有限公司 一种基于负载均衡的数据分发处理方法、系统及云平台

Also Published As

Publication number Publication date
CN114117240B (zh) 2022-07-08

Similar Documents

Publication Publication Date Title
CN114117240B (zh) 基于大数据需求分析的互联网内容推送方法及ai系统
CN114090663B (zh) 应用人工智能的用户需求预测方法及大数据优化系统
Liu et al. Automated feature selection: A reinforcement learning perspective
CN110909182B (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
US10909442B1 (en) Neural network-based artificial intelligence system for content-based recommendations using multi-perspective learned descriptors
CN113536097B (zh) 基于自动特征分组的推荐方法及装置
CN110955831B (zh) 物品推荐方法、装置、计算机设备及存储介质
KR20130062442A (ko) 협업 필터링 추천 방식을 이용한 추천 방법 및 추천 시스템
CN113011471A (zh) 一种社交群体的划分方法、划分系统及相关装置
US20220374474A1 (en) Recommending content to subscribers
WO2021009618A1 (en) Group specific decision tree
CN115048370A (zh) 用于大数据清洗的人工智能处理方法及大数据清洗系统
CN117391258A (zh) 一种负碳排放的预测方法、装置、设备及存储介质
AU2024202957A1 (en) System and method for analyzing media for talent discovery cross-reference to related applications
CN115618949A (zh) 基于沉浸式元宇宙服务的用户兴趣分析方法及系统
CN112989179A (zh) 模型训练、多媒体内容推荐方法和装置
CN114647790A (zh) 应用于行为意图分析的大数据挖掘方法及云端ai服务系统
CN114371946A (zh) 基于云计算和大数据的信息推送方法及信息推送服务器
CN113032676A (zh) 基于微反馈的推荐方法和系统
CN117011751A (zh) 使用变换器网络分割视频图像序列
CN114625967A (zh) 基于大数据业务优化的用户信息挖掘方法及人工智能系统
CN114678114A (zh) 应用于智慧医疗的大数据挖掘评估方法及大数据挖掘系统
Bogojeska et al. Transfer learning for server behavior classification in small IT environments
Jia et al. ERASE: Benchmarking Feature Selection Methods for Deep Recommender Systems
CN115423565B (zh) 应用于云端互联网交互流程的大数据分析方法及ai系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220323

Address after: 266000 household 602, unit 1, building 2, No. 4, Chenghai Road, Shinan District, Qingdao, Shandong Province

Applicant after: Qingdao Yijia Shiyun Computer Co.,Ltd.

Address before: 311899 Zhuji science and Technology Innovation Park, Wangjiayan natural village, Puyang new village, Jiyang street, Zhuji City, Shaoxing City, Zhejiang Province

Applicant before: Zhuji Blackstone Big Data Technology Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220426

Address after: 461500 group 2, babaozhuang village, zengfumei Township, Changge City, Xuchang City, Henan Province

Applicant after: Jia Xiaoqi

Address before: 266000 household 602, unit 1, building 2, No. 4, Chenghai Road, Shinan District, Qingdao, Shandong Province

Applicant before: Qingdao Yijia Shiyun Computer Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220623

Address after: 100000 No. 5-2001, No. 2, andingmenwai street, Dongcheng District, Beijing

Applicant after: BEIJING GUOXINDA DATA TECHNOLOGY Co.,Ltd.

Address before: 461500 group 2, babaozhuang village, zengfumei Township, Changge City, Xuchang City, Henan Province

Applicant before: Jia Xiaoqi

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant