CN114625967A - 基于大数据业务优化的用户信息挖掘方法及人工智能系统 - Google Patents

基于大数据业务优化的用户信息挖掘方法及人工智能系统 Download PDF

Info

Publication number
CN114625967A
CN114625967A CN202210264884.6A CN202210264884A CN114625967A CN 114625967 A CN114625967 A CN 114625967A CN 202210264884 A CN202210264884 A CN 202210264884A CN 114625967 A CN114625967 A CN 114625967A
Authority
CN
China
Prior art keywords
browsing interaction
vector
browsing
cluster
interest tendency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210264884.6A
Other languages
English (en)
Inventor
刘水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202210264884.6A priority Critical patent/CN114625967A/zh
Publication of CN114625967A publication Critical patent/CN114625967A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供一种基于大数据业务优化的用户信息挖掘方法及人工智能系统,通过对浏览互动大数据进行根据操作节点的分团以及浏览互动向量挖掘,得到第一浏览互动向量簇,再进行不同灵活形式的置乱聚合,得到第二浏览互动向量簇与第三浏览互动向量簇,进而可基于不同置乱聚合形式下的浏览互动向量簇对兴趣倾向预测网络进行初步网络训练优化,无需借助已携带兴趣倾向标签的浏览互动大数据进行初步网络训练优化,降低对已携带兴趣倾向标签的浏览互动大数据的收集量,且在初步网络训练优化的通过已携带兴趣倾向标签的浏览互动大数据对初步网络训练优化的兴趣倾向预测网络进行补充训练优化,有助于提高目标浏览互动数据预测的可靠性。

Description

基于大数据业务优化的用户信息挖掘方法及人工智能系统
技术领域
本申请涉及大数据技术领域,具体而言,涉及一种基于大数据业务优化的用户信息挖掘方法及人工智能系统。
背景技术
在大数据快速发展的时代,大数据分析和大数据挖掘在互联网服务商的业务运行过程中发挥着自己独有的影响和效率。互联网时代的蓬勃发展让大数据的商业价值一直在持续扩大、增长,如何能够更快更准确更全面地掌握大数据的商业价值,那么就可以利用这大数据的商业价值去为互联网服务商创造更大的经济效益。
也就是说,在大数据时代,数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。其主要基于人工智能等实现。通过对大数据高度自动化地分析,做出归纳性的推理,从中挖掘出用户的兴趣倾向,以便于后续业务优化。然而,相关技术中,难以在短时间内搜集到大量已携带兴趣倾向标签的浏览互动数据,进而影响后续基于AI模型来针对浏览互动数据预测的可靠性。
发明内容
为了至少克服现有技术中的上述不足,本申请的目的在于提供一种基于大数据业务优化的用户信息挖掘方法及人工智能系统。
第一方面,本申请提供一种基于大数据业务优化的用户信息挖掘方法,应用于人工智能系统,所述方法包括:
对第一浏览互动大数据进行根据操作节点的分团,并对分团得到的各个浏览互动节点数据进行浏览互动向量挖掘,得到第一浏览互动向量簇,所述第一浏览互动向量簇中涵盖各个浏览互动节点数据对应的第一浏览互动向量,所述第一浏览互动大数据是不携带兴趣倾向标签的浏览互动大数据;
对所述第一浏览互动向量簇中的所述第一浏览互动向量进行置乱聚合,得到第二浏览互动向量簇和第三浏览互动向量簇,所述第二浏览互动向量簇中的第二浏览互动向量与所述第三浏览互动向量簇中的第三浏览互动向量对应不同置乱聚合形式;
根据所述第二浏览互动向量簇和所述第三浏览互动向量簇对兴趣倾向预测网络进行初步网络训练优化,所述兴趣倾向预测网络用于对目标浏览互动数据中的浏览互动流程进行兴趣倾向预测;
根据第二浏览互动大数据对初步网络训练优化的所述兴趣倾向预测网络进行补充训练优化,以通过所述补充训练优化的兴趣倾向预测网络对目标浏览互动数据中的浏览互动流程进行兴趣倾向预测,获得用户挖掘信息后作为业务优化的参考依据,所述第二浏览互动大数据是携带兴趣倾向标签的浏览互动大数据。
一种可能的独立设计思路中,所述方法还包括:
根据所述兴趣倾向预测网络对目标用户业务终端所对应的目标浏览互动数据中的浏览互动流程进行兴趣倾向预测,获得所述目标浏览互动数据对应的兴趣倾向标签;
根据所述目标浏览互动数据对应的兴趣倾向标签所对应的各个兴趣倾向标签向量获取与当前的内容推荐服务所对应的热点主题请求信息;
根据所述内容推荐服务的内容推荐请求信息,向各内容热点服务传递热点主题请求信息,所述热点主题请求信息包括待请求的热点主题以及与所述热点主题相关的请求内容信息;
获取各所述内容热点服务根据所述热点主题请求信息响应的热点内容分布;
获取通过预置的主题知识图谱针对各所述内容热点服务响应的热点内容分布的热点内容情绪极性分布,得到情绪极性标签集,所述情绪极性标签集包括多个情绪极性标签;
获得所述情绪极性标签集中的各情绪极性标签与各所述热点内容分布对应的情绪关联性向量;
根据所述各情绪极性标签对应的情绪关联性向量,以及所述各情绪极性标签的情绪极性标签度量值,对所述各情绪极性标签进行次序整理,得到相应的情绪极性标签清单;
基于所述情绪极性标签清单生成所述热点内容分布对应的内容热点服务簇,所述内容热点服务簇包括多个内容热点服务;
从所述多个内容热点服务中确定所述目标内容热点服务,
基于所述多个目标内容热点服务进行所述热点主题的热点内容页面生成,并在热点内容页面生成过程中对所述目标内容热点服务的热点内容信息进行内容管理。
一种可能的独立设计思路中,所述根据所述各情绪极性标签对应的情绪关联性向量,以及所述各情绪极性标签的情绪极性标签度量值,对所述各情绪极性标签进行次序整理,得到相应的情绪极性标签清单,具体包括:
根据所述各情绪极性标签对应的情绪关联性向量,以及所述各情绪极性标签的情绪极性标签度量值,对所述各情绪极性标签进行分团,得到多个情绪极性标签团;
根据各情绪极性标签团中的各情绪极性标签的情绪极性标签度量值对各个情绪极性标签团进行次序整理,并分别对所述各个情绪极性标签团中的各情绪极性标签进行次序整理,得到所述情绪极性标签清单;
其中,所述目标内容热点服务根据所述情绪极性标签清单中各内容热点服务对应的情绪极性标签的次序节点确定。
譬如,一种可能的独立设计思路中,所述获得所述情绪极性标签集中的各情绪极性标签与所述热点内容分布对应的情绪关联性向量,包括:
分别将所述各情绪极性标签输入在先生成的情绪关联性决策模型中,基于所述在先生成的情绪关联性决策模型中的情绪关联性学习的情绪关联性挖掘结构对所述各情绪极性标签进行情绪关联性向量挖掘,获得所述情绪关联性挖掘结构生成的所述各情绪极性标签对应的情绪关联性向量;
所述根据所述各情绪极性标签对应的情绪关联性向量,以及所述各情绪极性标签的情绪极性标签度量值,对所述各情绪极性标签进行次序整理,得到相应的情绪极性标签清单,包括:
分别将所述各情绪极性标签,以及所述各情绪极性标签对应的情绪关联性向量输入所述在先生成的情绪关联性决策模型中的情绪极性标签度量结构,基于所述情绪极性标签度量结构对所述各情绪极性标签进行决策和次序整理,获得所述情绪极性标签度量结构生成的情绪关联性学习信息的第一预测向量序列,所述第一预测向量序列中的各个情绪极性标签特征构成所述情绪极性标签清单;
所述基于所述情绪极性标签清单生成所述热点内容分布对应的内容热点服务簇,包括:将所述预测向量序列输入所述在先生成的情绪关联性决策模型中的关注特征挖掘结构,基于所述关注特征挖掘结构进行关注特征挖掘,获得所述关注特征挖掘结构生成的所述内容热点服务簇;
其中,所述在先生成的情绪关联性决策模型是根据包括多个基础参考数据的参考数据簇进行模型收敛配置的,所述参考数据簇中的参考数据包括具有情绪关联性向量的参考情绪极性标签,所述情绪关联性向量表示所述参考情绪极性标签与参考热点主题之间的情绪关联性信息。
譬如,一种可能的独立设计思路中,所述情绪关联性决策模型通过以下步骤进行模型收敛配置的:
获取针对多个参考热点主题的所述参考数据簇;
根据所述参考数据簇中的参考数据,对候选情绪关联性决策模型执行遍历模型更新,以获得所述在先生成的情绪关联性决策模型;其中,每一次遍历模型更新过程通过以下步骤实现:
从所述参考数据簇中选取针对同一参考热点主题的一组参考数据,分别将选取的各个参考数据包含的参考情绪极性标签输入所述候选情绪关联性决策模型中的情绪关联性学习的情绪关联性挖掘结构,获得所述情绪关联性挖掘结构生成的各参考情绪极性标签对应的情绪关联性向量;
基于所述各参考情绪极性标签对应的情绪关联性向量与对应的情绪关联性向量之间的训练学习误差,构建第一风险学习误差;以及
分别将选取的各个参考数据中的参考情绪极性标签,以及所述各参考情绪极性标签对应的情绪关联性向量输入所述候选情绪关联性决策模型中的情绪极性标签度量结构,基于所述情绪极性标签度量结构对所述各参考情绪极性标签进行分团,获得多个情绪极性标签团;
基于所述情绪极性标签度量结构对各个情绪极性标签团进行次序整理,获得所述情绪极性标签度量结构生成的情绪关联性学习信息的第二预测向量序列;
将所述第二预测向量序列输入所述候选情绪关联性决策模型中的关注特征挖掘结构,基于所述关注特征挖掘结构进行关注特征挖掘,获得所述关注特征挖掘结构生成的关注特征序列,所述关注特征序列包括多个关注学习特征;
基于所述关注特征序列中的关注学习特征与参考关注特征序列中的参考关注特征的特征学习误差,构建第二风险学习误差;以及
基于各个情绪极性标签团中情绪极性标签向量的关注向量值,构建第三风险学习误差;根据所述第一风险学习误差,所述第二风险学习误差和所述第三风险学习误差,对所述候选情绪关联性决策模型进行模型收敛配置。
譬如,一种可能的独立设计思路中,所述基于所述关注特征序列中的关注学习特征与参考关注特征序列中的参考关注特征的特征学习误差,构建第二风险学习误差,包括:
对于任意一个关注学习特征,基于所述关注学习特征在预设的关注学习特征向量集合中的历史频次,以及所述关注学习特征在所述情绪极性标签集中的历史频次,确定所述关注特征序列中的关注学习特征与参考关注特征序列中的参考关注特征的特征学习误差,并基于确定的特征学习误差构建所述第二风险学习误差。
譬如,一种可能的独立设计思路中,所述基于所述多个目标内容热点服务进行所述热点主题的热点内容页面生成,包括:
根据预先订阅的关注主题特征模板获取等待配置的目标可互动热点主题对应的热点主题意图信息;
基于所述热点主题意图信息,在首次可互动热点主题中创建热点主题挖掘应用,其中,所述热点主题挖掘应用包括至少一种挖掘模型,所述挖掘模型用于挖掘所述首次可互动热点主题;
配置等待添加至所述热点主题挖掘应用中的热点主题关键词序列,其中,所述热点主题关键词序列包括多个热点主题关键词;
将所述热点主题关键词与所述热点主题挖掘应用中的挖掘模型进行挖掘节点配对,得到添加至所述挖掘模型的参考热点主题关键词;
根据所述参考热点主题关键词与所述挖掘模型之间的挖掘状态向量,从所述参考热点主题关键词中挑选出目标热点主题关键词;
将所述目标热点主题关键词添加至所述挖掘模型,以将所述目标热点主题关键词添加至所述热点主题挖掘应用中,创建目标可互动热点主题;
将所述目标可互动热点主题添加至所述目标内容热点服务,使所述目标内容热点服务基于所述可互动热点主题进行热点内容页面生成。
譬如,一种可能的独立设计思路中,所述基于所述热点主题意图信息,在首次可互动热点主题中创建热点主题挖掘应用,包括:
基于所述热点主题意图信息,在所述首次可互动热点主题中创建参考挖掘应用,其中,所述参考挖掘应用包括多种等待更新的挖掘模型;
基于所述挖掘模型在所述参考挖掘应用中的模型交叉信息,对所述挖掘模型进行更新,得到更新后的挖掘模型;
根据所述更新后的挖掘模型,确定所述首次可互动热点主题中的热点主题挖掘应用,其中,所述热点主题挖掘应用包括至少一种更新后的挖掘模型,所述挖掘模型用于挖掘所述首次可互动热点主题。
譬如,一种可能的独立设计思路中,基于所述热点主题意图信息,在所述首次可互动热点主题中创建参考挖掘应用,包括:
确定创建参考挖掘应用对应的整体挖掘配置信息;
对所述热点主题意图信息进行线性映射,得到所述热点主题意图信息对应的线性映射特征;
在所述首次可互动热点主题中创建匹配所述整体挖掘配置信息的参考挖掘应用,其中,所述参考挖掘应用包括至少一种待更新的挖掘模型;
基于所述线性映射特征,对所述参考挖掘应用中的挖掘模型进行更新,得到更新后的挖掘模型;
根据所述更新后的挖掘模型,确定所述首次可互动热点主题中的参考挖掘应用。
第二方面,本申请实施例还提供一种基于大数据业务优化的用户信息挖掘系统,所述基于大数据业务优化的用户信息挖掘系统包括人工智能系统以及与所述人工智能系统通信连接的至少一个云端业务运行系统;
所述人工智能系统,用于:
对第一浏览互动大数据进行根据操作节点的分团,并对分团得到的各个浏览互动节点数据进行浏览互动向量挖掘,得到第一浏览互动向量簇,所述第一浏览互动向量簇中涵盖各个浏览互动节点数据对应的第一浏览互动向量,所述第一浏览互动大数据是不携带兴趣倾向标签的浏览互动大数据;
对所述第一浏览互动向量簇中的所述第一浏览互动向量进行置乱聚合,得到第二浏览互动向量簇和第三浏览互动向量簇,所述第二浏览互动向量簇中的第二浏览互动向量与所述第三浏览互动向量簇中的第三浏览互动向量对应不同置乱聚合形式;
根据所述第二浏览互动向量簇和所述第三浏览互动向量簇对兴趣倾向预测网络进行初步网络训练优化,所述兴趣倾向预测网络用于对目标浏览互动数据中的浏览互动流程进行兴趣倾向预测;
根据第二浏览互动大数据对初步网络训练优化的所述兴趣倾向预测网络进行补充训练优化,以通过所述补充训练优化的兴趣倾向预测网络对目标浏览互动数据中的浏览互动流程进行兴趣倾向预测,获得用户挖掘信息后作为业务优化的参考依据,所述第二浏览互动大数据是携带兴趣倾向标签的浏览互动大数据。
根据以上方面,通过对浏览互动大数据进行根据操作节点的分团以及浏览互动向量挖掘,得到第一浏览互动向量簇,再对第一浏览互动向量簇中的第一浏览互动向量进行不同灵活形式的置乱聚合,得到第二浏览互动向量簇与第三浏览互动向量簇,进而可基于不同置乱聚合形式下的浏览互动向量簇对兴趣倾向预测网络进行初步网络训练优化,无需借助已携带兴趣倾向标签的浏览互动大数据进行初步网络训练优化,降低对已携带兴趣倾向标签的浏览互动大数据的收集量,且在初步网络训练优化的通过已携带兴趣倾向标签的浏览互动大数据对初步网络训练优化的兴趣倾向预测网络进行补充训练优化,确保最终得到的兴趣倾向预测网络的预测精度,有助于提高目标浏览互动数据预测的可靠性。
附图说明
图1为本申请实施例提供的基于大数据业务优化的用户信息挖掘系统的架构示意图;
图2为本申请实施例提供的基于大数据业务优化的用户信息挖掘方法的流程示意图;
图3为本申请实施例提供的用于实现上述的基于大数据业务优化的用户信息挖掘方法的人工智能系统的结构示意框图。
具体实施方式
图1是本申请一种实施例提供的基于大数据业务优化的用户信息挖掘系统10的架构示意图。基于大数据业务优化的用户信息挖掘系统10可以包括人工智能系统100以及与人工智能系统100通信连接的云端业务运行系统200。图1所示的基于大数据业务优化的用户信息挖掘系统10仅为一种可行的示例,在其它可行的实施例中,该基于大数据业务优化的用户信息挖掘系统10也可以仅包括图1所示组成部分的其中的至少部分或者还可以包括其它的组成部分。
一种基于独立构思的实施例中,基于大数据业务优化的用户信息挖掘系统10中的人工智能系统100和云端业务运行系统200可以通过配合执行以下方法实施例所描述的基于大数据业务优化的用户信息挖掘方法,具体人工智能系统100和云端业务运行系统200的执行步骤部分可以参照以下方法实施例的详细描述。
本实施例提供的基于大数据业务优化的用户信息挖掘方法可以由图1中所示的人工智能系统100执行,下面对该基于大数据业务优化的用户信息挖掘方法进行详细介绍。
步骤S101,对第一浏览互动大数据进行根据操作节点的分团,并对分团得到的各个浏览互动节点数据进行浏览互动向量挖掘,得到第一浏览互动向量簇,第一浏览互动向量簇中涵盖各个浏览互动节点数据对应的第一浏览互动向量,第一浏览互动大数据是不携带兴趣倾向标签的浏览互动大数据。
一种设计思路中,兴趣倾向预测网络可以适用于任意预测目标浏览互动数据内容所对应的兴趣倾向标签的应用场景,因此,第一浏览互动大数据可为任意数据类别的目标浏览互动数据,如基于智慧医疗的目标浏览互动数据、基于电子商务的目标浏览互动数据、基于数字化在先学习的目标浏览互动数据等,但不限制于此。且第一浏览互动大数据是不携带兴趣倾向标签的浏览互动大数据的目标浏览互动数据序列。
一种设计思路中,在获取第一浏览互动大数据后,首先对该目标浏览互动数据进行根据操作节点的分团。一种设计思路中,可将第一浏览互动大数据分团为相同数据范围的浏览互动节点数据,且不同浏览互动节点数据中携带不同的目标浏览互动数据信息。
分团完成后,对分团得到的各个浏览互动节点数据进行浏览互动向量挖掘,一种设计思路中,对各个浏览互动节点数据进行关系转换,得到各个浏览互动节点数据对应的第一浏览互动向量,聚合第一浏览互动向量簇。
步骤S102,对第一浏览互动向量簇中的第一浏览互动向量进行置乱聚合,得到第二浏览互动向量簇和第三浏览互动向量簇,第二浏览互动向量簇中的第二浏览互动向量与第三浏览互动向量簇中的第三浏览互动向量对应不同置乱聚合形式。
一种设计思路中,得到第一浏览互动向量簇后,对第一浏览互动向量簇中的各个第一浏览互动向量进行不同置乱聚合,得到第二浏览互动向量簇以及第三浏览互动向量簇。
一种设计思路中,第二浏览互动向量簇中所涵盖的各个第二浏览互动向量与第三浏览互动向量簇中所涵盖的各个第三浏览互动向量中各个浏览互动向量指示的目标浏览互动数据信息不同,即通过不同置乱聚合形式,得到关于第一浏览互动大数据中浏览互动向量的不同聚合形式。
且置乱聚合后,得到的第二浏览互动向量的数量与第一浏览互动向量簇中的第一浏览互动向量的数量相同,相应的,第三浏览互动向量的数量与第一浏览互动向量的数量相同。
步骤S103,根据第二浏览互动向量簇和第三浏览互动向量簇对兴趣倾向预测网络进行初步网络训练优化,兴趣倾向预测网络用于对目标浏览互动数据中的浏览互动流程进行兴趣倾向预测。
初步网络训练优化是指一种通过使用参考数据基础数据序列对兴趣倾向预测网络进行训练,使兴趣倾向预测网络学习到参考数据基础数据序列中的通用向量表达的过程。初步网络训练优化的目的是为后续兴趣倾向预测网络在参考数据数据上训练提供较高价值的网络权重信息。
由于第二浏览互动向量簇中的第二浏览互动向量与第三浏览互动向量簇中的第三浏览互动向量是不同时空域节点的浏览互动向量,因此,将各个第二浏览互动向量以及各个第三浏览互动向量分别配置到兴趣倾向预测网络后,根据得到兴趣倾向预测信息可实现对兴趣倾向预测网络的无监督训练优化,进而无需使用携带兴趣倾向标签的浏览互动大数据进行初步训练,可以降低训练标注工作量。
兴趣倾向预测网络用于对目标浏览互动数据中浏览互动流程进行兴趣倾向预测,一种设计思路中,兴趣倾向预测网络可识别单个目标浏览互动数据的兴趣倾向分布,也可对目标浏览互动数据序列中各个目标浏览互动数据进行兴趣倾向分布预测,完成目标浏览互动数据序列的兴趣倾向预测。
步骤S104,根据第二浏览互动大数据对初步网络训练优化的兴趣倾向预测网络进行补充训练优化,以通过所述补充训练优化的兴趣倾向预测网络对目标浏览互动数据中的浏览互动流程进行兴趣倾向预测,获得用户挖掘信息后作为业务优化的参考依据,第二浏览互动大数据是携带兴趣倾向标签的浏览互动大数据。
补充训练优化是通过少量携带兴趣倾向标签的参考数据数据集对兴趣倾向预测网络进行训练优化的过程,且训练优化阶段采用有监督式的深度学习形式,因此,采用携带兴趣倾向标签的第二浏览互动大数据对初步网络训练优化的兴趣倾向预测网络进行补充训练优化。
且用于补充训练优化的参考数据数据量小于用于初步网络训练优化的参考数据数据量,因此,第二浏览互动大数据的数量少于第一浏览互动大数据的数量,可降低对携带兴趣倾向标签的浏览互动大数据的数据处理量。
如此设计,通过对浏览互动大数据进行根据操作节点的分团以及浏览互动向量挖掘,得到第一浏览互动向量簇,再对第一浏览互动向量簇中的第一浏览互动向量进行不同灵活形式的置乱聚合,得到第二浏览互动向量簇与第三浏览互动向量簇,进而可基于不同置乱聚合形式下的浏览互动向量簇对兴趣倾向预测网络进行初步网络训练优化,无需借助已携带兴趣倾向标签的浏览互动大数据进行初步网络训练优化,降低对已携带兴趣倾向标签的浏览互动大数据的收集量,且在初步网络训练优化的通过已携带兴趣倾向标签的浏览互动大数据对初步网络训练优化的兴趣倾向预测网络进行补充训练优化,确保最终得到的兴趣倾向预测网络的预测精度,即有助于提高目标浏览互动数据预测的可靠性。
为实现无携带兴趣倾向标签的初步网络训练优化过程,一种设计思路中,采用实时训练预测结构以及目标训练预测结构分别对不同置乱聚合得到的浏览互动向量簇进行目标浏览互动数据的兴趣倾向预测,进而根据两个分支的兴趣倾向预测信息实现对兴趣倾向预测网络的初步网络训练优化过程,下面进行示例性说明。
下面介绍本申请另一个独立实施例提供的基于大数据业务优化的用户信息挖掘方法,该方法包括如下步骤。
步骤S201,对第一浏览互动大数据进行根据操作节点的分团,并对分团得到的各个浏览互动节点数据进行浏览互动向量挖掘,得到第一浏览互动向量簇,第一浏览互动向量簇中涵盖各个浏览互动节点数据对应的第一浏览互动向量,第一浏览互动大数据是不携带兴趣倾向标签的浏览互动大数据。
一种设计思路中,兴趣倾向预测网络可为循环神经网络(RecurrenF NeuralNeFworks)、递归神经网络(Recursive Neural NeFworks)、卷积网络(ConvoluFionalNeural NeFworks)、玻尔兹曼机(BolFzmann Machines)和受限玻尔兹曼机(ResFricFedBolFzmann Machines)等,但不限制于此。
采用兴趣倾向预测网络对第一浏览互动大数据进行兴趣倾向预测时,首先将第一浏览互动大数据分团为固定数据范围的浏览互动节点数据,再通过关系转换将各个浏览互动节点数据变换为第一浏览互动向量。
步骤S202,随机变换第一浏览互动向量簇中第一浏览互动向量的时空域节点,得到第一目标浏览互动向量簇和第二目标浏览互动向量簇,第一目标浏览互动向量簇和第二目标浏览互动向量簇中第一浏览互动向量的时空域节点不同。
在对第一浏览互动向量进行置乱聚合时,首先随机变换第一浏览互动向量的顺序,即置乱各个第一浏览互动向量的时空域节点信息。一种设计思路中,随机置乱时可随机变换每个第一浏览互动向量的时空域节点,将其随机变换至与初始时空域节点不同,也可提取部分第一浏览互动向量,仅随机变换部分第一浏览互动向量的时空域节点。
一种设计思路中,由于第二浏览互动向量簇与第三浏览互动向量簇是通过对第一浏览互动向量进行不同置乱聚合形式得到的浏览互动向量簇,因此,在对第一浏览互动向量进行随机置乱时,采用不同置乱方式,得到第一目标浏览互动向量簇与第二目标浏览互动向量簇,使其中的第一浏览互动向量的时空域节点不同。
例如,第一浏览互动向量簇T∈{F1,…,F9}中包含25个第一浏览互动向量,即25个向量,其带有对应的时空域节点,首先将各个向量进行随机置乱,得到第一目标浏览互动向量簇Tp1={F3,F5,F8,F1,F6,F2,F9,F4,F7}。
且对各个向量采用另一种随机置乱方式,得到第二目标浏览互动向量簇,如Tp2={F2,F7,F3,F1,F4,F9,F8,F5,F6}。
步骤S203,根据第一目标浏览互动向量簇进行置乱得到第一置乱向量分布,并根据第二目标浏览互动向量簇进行置乱得到第二置乱向量分布。
在对第一浏览互动向量进行置乱后,可基于置乱后的第一浏览互动向量簇进行置乱。一种设计思路中,可首先构建关于置乱后第一浏览互动向量簇的置乱向量分布,包括构建第一目标浏览互动向量簇的第一置乱向量分布以及第二目标浏览互动向量簇的第二置乱向量分布。其中,构建第一置乱向量分布与第二置乱向量分布可包括如下步骤。
步骤S203a、根据第一浏览互动大数据的根据操作节点的分团形式,确定分团量化参数。
一种设计思路中,构建置乱向量分布时,可基于第一浏览互动大数据的根据操作节点的分团形式确定构建置乱向量分布的范围大小,避免构建置乱向量分布的范围与分团得到的浏览互动节点数据数量不匹配。如若对第一浏览互动大数据分团得到25个浏览互动节点数据,则可构建5×5置乱向量分布;若对第一浏览互动大数据分团得到16个浏览互动节点数据,则可构建4×4置乱向量分布或2×8置乱向量分布。
例如,在对第一浏览互动大数据分团后,得到25个浏览互动节点数据,因此,在进行置乱向量分布配置时,可确定分团量化参数为5×5大小,与分团得到的浏览互动节点数据数量相匹配。
步骤S203b、根据分团量化参数,对第一目标浏览互动向量簇中的第一浏览互动向量进行置乱,得到第一置乱向量分布。
确定分团量化参数后,根据分团量化参数大小构建第一置乱向量分布,即将第一目标浏览互动向量簇中的第一浏览互动向量进行置乱。
一种设计思路中,可基于第一目标浏览互动向量中第一浏览互动向量的时空域节点依次选择,并进行排列从而完成第一置乱向量分布的构建。
例如,假设分团量化参数为5×5大小,则将第一目标浏览互动向量簇Tp1={F3,F5,F8,F1,F6,F2,F9,F4,F7},依次选择按行排列,构建为5×5置乱向量分布,即从F3开始依次选择3个向量作为置乱向量分布第一行,顺序选择完成置乱向量分布配置。
步骤S203c、根据分团量化参数,对第二目标浏览互动向量簇中的第一浏览互动向量进行置乱,得到第二置乱向量分布。
这样设计,同样可以根据分团量化参数构建第二置乱向量分布,即将第二目标浏览互动向量簇中的第一浏览互动向量进行置乱。一种设计思路中,构建第二置乱向量分布的方式可与第一置乱向量分布形式相同,也可不同。
例如,将第二目标浏览互动向量簇Tp2={F2,F7,F3,F1,F4,F9,F8,F5,F6}按列构建5×5置乱向量分布,得到第二置乱向量分布如下:
步骤S204,对第一置乱向量分布中的第一浏览互动向量进行向量聚合,并根据向量聚合结果生成第二浏览互动向量簇。
置乱完成后,即对第一置乱向量分布中的第一浏览互动向量进行向量聚合,并根据聚合结果生成第二浏览互动向量簇,其中,第二浏览互动向量簇中各个第二浏览互动向量所对应的浏览互动节点数据中目标浏览互动数据信息出现变化,即与各个第一浏览互动向量对应浏览互动节点数据中的目标浏览互动数据信息不同。
一种设计思路中,向量聚合并根据聚合结果生成第二浏览互动向量簇可包括如下步骤。
步骤S204a、通过向量连接队列提取第一置乱向量分布中所对应的i个第一浏览互动向量。
步骤S204b、对i个第一浏览互动向量进行向量聚合,得到第一聚合浏览互动向量。
一种设计思路中,向量聚合形式可包括向量拼接或者融合等。
步骤S204c、对j组第一聚合浏览互动向量进行关系转换,得到第二浏览互动向量簇,j组第一聚合浏览互动向量通过移动滑窗得到。
一种设计思路中,通过向量连接队列游走第一置乱向量分布,即可得到j组第一聚合浏览互动向量。
得到j组第一聚合浏览互动向量后,即对j组第一聚合浏览互动向量进行关系转换,得到第二浏览互动向量簇。一种设计思路中,可将j组第一聚合浏览互动向量进行关系转换,得到第二浏览互动向量簇,关系转换得到的第二浏览互动向量簇中第二浏览互动向量数目与第一浏览互动向量数目相同。
例如,可以通过向量连接队列得到4组第一浏览互动向量的聚合,每组中包含4个第一浏览互动向量,并分别对每组中包含的4个第一浏览互动向量进行向量聚合,得到4组第一聚合浏览互动向量即TL={F1',F2',F3',F4'},其中F1'即为F3,F5,F1,F6融合得到的第一聚合浏览互动向量,F2'即为F5,F8,F6,F2融合得到的第一聚合浏览互动向量,F3'即为F1,F6,F9,F4融合得到的第一聚合浏览互动向量,F4'即为F6,F2,F4,F7融合得到的第一聚合浏览互动向量。将TL={F1',F2',F3',F4'}进行关系转换,得到第二浏览互动向量簇。
步骤S205,对第二置乱向量分布中的第一浏览互动向量进行向量聚合,并根据向量聚合结果生成第三浏览互动向量簇。
置乱完成后,对第二置乱向量分布中的第一浏览互动向量进行向量聚合,并根据聚合结果生成第三浏览互动向量簇,其中,第三浏览互动向量簇中各个第三浏览互动向量所对应的浏览互动节点数据中目标浏览互动数据信息出现变化,即与各个第一浏览互动向量对应浏览互动节点数据中的目标浏览互动数据信息不同。且与第二浏览互动向量所对应的浏览互动节点数据的目标浏览互动数据信息不同。
一种设计思路中,向量聚合并根据聚合结果生成第三浏览互动向量簇可包括如下步骤。
步骤S205a、通过向量连接队列提取第二置乱向量分布中所对应的i个第一浏览互动向量。
一种设计思路中,构建第二置乱向量分布时,同样通过向量连接队列采样的方式,提取i个第一浏览互动向量进行向量聚合。
步骤S205b、对i个第一浏览互动向量进行向量聚合,得到第二聚合浏览互动向量。
步骤S205c、对j组第二聚合浏览互动向量进行关系转换,得到第三浏览互动向量簇,j组第二聚合浏览互动向量通过移动滑窗得到。
得到j组第二聚合浏览互动向量后,即对j组第二聚合浏览互动向量进行关系转换,得到第三浏览互动向量簇。一种设计思路中,可将j组第二聚合浏览互动向量进行关系转换,得到第三浏览互动向量簇。关系转换得到的第三浏览互动向量簇中第三浏览互动向量数目与第一浏览互动向量数目相同。
步骤S206,将第二浏览互动向量簇配置到兴趣倾向预测网络的实时训练预测结构,得到第一兴趣倾向预测信息。
一种设计思路中,得到第二浏览互动向量簇以及第三浏览互动向量簇后,即可利用第二浏览互动向量簇以及第三浏览互动向量簇对兴趣倾向预测网络进行初步网络训练优化。
一种设计思路中,兴趣倾向预测网络包括实时训练预测结构以及目标训练预测结构,其中,实时训练预测结构与目标训练预测结构中的兴趣倾向预测网络的网络架构相同,但其对应的网络权重信息的优化方式不同。
一种设计思路中,将第二浏览互动向量簇配置到至兴趣倾向预测网络的实时训练预测结构中,实时训练预测结构用于根据第二浏览互动向量簇所指示的浏览互动向量预测第一浏览互动大数据的目标兴趣倾向标签,即得到第一兴趣倾向预测信息。
步骤S207,将第三浏览互动向量簇配置到兴趣倾向预测网络的目标训练预测结构,得到第二兴趣倾向预测信息。
一种设计思路中,将第三浏览互动向量簇配置到至目标训练预测结构中,目标训练预测结构用于根据第三浏览互动向量簇所指示的浏览互动向量预测第二浏览互动大数据的目标兴趣倾向标签,即得到第二兴趣倾向预测信息。与得到第一兴趣倾向预测信息的方式相同,将第三浏览互动向量簇配置到至向量提取单元中,对第三浏览互动向量簇进行浏览互动向量的提取,将提取向量同样配置到至分类器中进行目标浏览互动数据的兴趣倾向预测,得到第二兴趣倾向预测信息。
步骤S208,根据第一兴趣倾向预测信息与第二兴趣倾向预测信息训练实时训练预测结构。
由于第二浏览互动向量簇中的第二浏览互动向量与第三浏览互动向量簇中的第三浏览互动向量各不相同,因此,为使兴趣倾向预测网络可对相同第一浏览互动大数据特征在不同聚合形式下进行准确的目标浏览互动数据的兴趣倾向预测,一种示例性设计方式中,根据第一兴趣倾向预测信息与第二兴趣倾向预测信息首先训练实时训练预测结构。该方式可包括如下步骤。
步骤S208a、确定第一兴趣倾向预测信息与第二兴趣倾向预测信息的兴趣倾向预测收敛指标。
为使兴趣倾向预测网络能对不同聚合向量形式下的浏览互动向量预测一致,将确定第一兴趣倾向预测信息与第二兴趣倾向预测信息间的兴趣倾向预测收敛指标,进而根据该兴趣倾向预测收敛指标训练兴趣倾向预测网络,使其能根据不同聚合向量形式下的浏览互动向量得到相同兴趣倾向预测信息,进而提高兴趣倾向预测网络进行目标浏览互动数据预测的可靠性。即无需使用已携带兴趣倾向标签的浏览互动大数据也可实现对兴趣倾向预测网络的网络权重信息的更新,实现兴趣倾向预测网络无监督学习。
一种设计思路中,兴趣倾向预测收敛指标即表示第一兴趣倾向预测信息与第二兴趣倾向预测信息间的相似性度量值,可采用任意的损失函数,确定第一兴趣倾向预测信息与第二兴趣倾向预测信息间的兴趣倾向预测收敛指标。
步骤S208b、根据兴趣倾向预测收敛指标,通过反向传播更新实时训练预测结构的网络权重信息。
一种示例性设计方式中,实时训练预测结构中网络权重信息的优化调整流程与目标训练预测结构中网络权重信息的优化调整流程不同,其中,实时训练预测结构采用反向传播方式更新,而目标训练预测结构中网络权重信息根据实时训练预测结构中网络权重信息更新,进而通过迭代训练,优化实时训练预测结构以及目标训练预测结构中的兴趣倾向预测网络的网络权重信息,即优化兴趣倾向预测网络的网络权重信息。
一种设计思路中,确定兴趣倾向预测收敛指标后,可基于兴趣倾向预测收敛指标反向传播更新实时训练预测结构的网络权重信息,直至网络权重信息达到训练要求为止,即兴趣倾向预测收敛指标收敛。
步骤S209,根据更新的实时训练预测结构的网络权重信息,更新目标训练预测结构的网络权重信息。
一种设计思路中,每次优化调整实时训练预测结构的网络权重信息后,将随之优化调整目标训练预测结构的网络权重信息。最终,当实时训练预测结构中的网络权重信息达到训练要求后,将再次优化调整目标训练预测结构的网络权重信息,此时,实时训练预测结构以及目标训练预测结构均停止网络权重信息的优化调整。
一种设计思路中,可基于更新的实时训练预测结构的网络权重信息,对目标训练预测结构的网络权重信息进行度量值滑动平均(Exponential Moving Average,EMA)更新。
步骤S210,根据第二浏览互动大数据对兴趣倾向预测网络中目标训练预测结构的网络权重信息进行补充训练优化。
为进一步提高兴趣倾向预测网络识别目标兴趣倾向标签的准确性,在根据未携带兴趣倾向标签的浏览互动大数据对兴趣倾向预测网络初步网络训练优化的,将采用少量携带兴趣倾向标签的第二浏览互动大数据对兴趣倾向预测网络的网络权重信息进行补充训练优化。
一种设计思路中,可对目标训练预测结构的网络权重信息进行补充训练优化,补充训练优化过程可包括如下步骤。
步骤S210a、将第二浏览互动大数据配置到兴趣倾向预测网络的目标训练预测结构,得到参考兴趣倾向预测信息。
将各个携带兴趣倾向标签的第二浏览互动大数据配置到目标训练预测结构的兴趣倾向预测网络中,得到各个第二浏览互动大数据对应的参考兴趣倾向预测信息。
步骤S210b、根据参考兴趣倾向预测信息以及第二浏览互动大数据对应的携带兴趣倾向标签,通过反向传播补充训练优化目标训练预测结构的网络权重信息。
确定参考兴趣倾向预测信息后,可基于参考兴趣倾向预测信息与预先已携带兴趣倾向标签的携带兴趣倾向标签,通过反向传播方式补充训练优化网络权重信息,得到最终兴趣倾向预测网络。如,可基于参考兴趣倾向预测信息与已携带兴趣倾向标签的携带兴趣倾向标签确定兴趣倾向预测收敛指标,根据兴趣倾向预测收敛指标反向补充训练优化网络权重信息,得到优化调整网络权重信息。
最后,根据使用优化调整网络权重信息的兴趣倾向预测网络进行目标浏览互动数据的兴趣倾向预测。
通过对不同置乱聚合形式下的第二浏览互动向量簇以及第三浏览互动向量簇进行目标浏览互动数据的兴趣倾向预测,根据得到的第一兴趣倾向预测信息与第二兴趣倾向预测信息对兴趣倾向预测网络进行初步网络训练优化,可提高兴趣倾向预测网络对同一浏览互动大数据特征的不同聚合形式进行兴趣倾向预测时,输出兴趣倾向预测信息的精度。
一种可基于独立构思的实施例中,若需进一步提升兴趣倾向预测网络的可靠性,可通过多次置乱聚合提升置乱聚合后得到的浏览互动向量簇中浏览互动向量的特征多样性,进而通过特征多样的浏览互动向量簇对兴趣倾向预测网络进行初步网络训练优化,例如本申请实施例还提供了一种基于大数据业务优化的用户信息挖掘方法,该方法可以包括如下步骤。
步骤S301,对第一浏览互动大数据进行根据操作节点的分团,并对分团得到的各个浏览互动节点数据进行浏览互动向量挖掘,得到第一浏览互动向量簇。
步骤S302,对第一浏览互动向量簇中的第一浏览互动向量进行置乱聚合,得到第二浏览互动向量簇和第三浏览互动向量簇。
步骤S301至步骤S302的实施方式可参考上述步骤S201至步骤S205,此处不再赘述。
步骤S303,根据第二浏览互动向量簇,循环执行多次置乱聚合,得到第三浏览互动向量簇。
一种设计思路中,为进一步提升兴趣倾向预测网络的预测性能,在得到第二浏览互动向量簇后,继续对第二浏览互动向量簇中的第二浏览互动向量进行置乱聚合,得到新的浏览互动向量簇,并继续对新的浏览互动向量簇中的浏览互动向量进行置乱聚合,即循环执行多次置乱聚合,迭代置乱聚合后,得到第三浏览互动向量簇。
一种设计思路中,遍历循环数可基于对兴趣倾向预测网络的预测精度需求设置,遍历循环数与兴趣倾向预测网络的预测精度呈直接关联关系。
其中,循环执行置乱聚合的方式可参考上述对第一浏览互动向量簇中第一浏览互动向量进行置乱聚合的方式,即,包括对第二浏览互动向量的置乱、聚合以及最终进行关系转换的过程。且循环执行置乱聚合过程中,可采用相同的置乱聚合形式,也可采用不同的置乱聚合形式,本实施例对此不做限定。
步骤S304,根据第三浏览互动向量簇,循环执行多次置乱聚合,得到第四浏览互动向量簇。
对第二浏览互动向量簇循环执行多次置乱聚合时,也可对第三浏览互动向量簇循环执行多次置乱聚合,得到第四浏览互动向量簇。同样的,置乱聚合形式包括对第三浏览互动向量的置乱、聚合以及最终进行关系转换的过程,且同样可采用相同或不同的置乱聚合形式。
一种设计思路中,对第三浏览互动向量簇进行迭代置乱聚合的遍历循环数与可对第二浏览互动向量簇进行迭代置乱聚合的遍历循环数相同,也可不同。且在另一种示例性设计方式中,也可仅根据第二浏览互动向量簇循环执行多次置乱聚合或者仅根据第三浏览互动向量簇循环执行多次置乱聚合。
步骤S305,根据第三浏览互动向量簇和第四浏览互动向量簇对兴趣倾向预测网络进行初步网络训练优化。
一种设计思路中,根据第三浏览互动向量簇和第四浏览互动向量簇对兴趣倾向预测网络进行初步网络训练优化的步骤可参考前述实施例中根据第二浏览互动向量簇和第三浏览互动向量簇对兴趣倾向预测网络进行初步网络训练优化的步骤,此处不再赘述。
步骤S306,根据第二浏览互动大数据对初步网络训练优化的兴趣倾向预测网络进行补充训练优化,第二浏览互动大数据是携带兴趣倾向标签的浏览互动大数据。
本步骤实施方式可参考上述步骤S210,此处不再赘述。
一种示例性设计方式中,在对第一浏览互动向量进行置乱聚合得到第二浏览互动向量簇以及第三浏览互动向量簇后,继续根据第二浏览互动向量簇与第三浏览互动向量簇循环执行置乱聚合,提升最终得到的第三浏览互动向量簇中第三浏览互动向量以及第四浏览互动向量簇中第四浏览互动向量的特征多样性,进而根据第三浏览互动向量簇与第四浏览互动向量簇对兴趣倾向预测网络进行初步网络训练优化,提高兴趣倾向预测网络的鲁棒性。
前述实施例中,通过对第二浏览互动向量簇以及第三浏览互动向量簇迭代置乱聚合,进而提升兴趣倾向预测网络的鲁棒性。在另一种示例性设计方式中,可继续添加兴趣倾向预测网络的训练预测结构,从而根据多分支的兴趣倾向预测信息对兴趣倾向预测网络进行初步网络训练优化。一种设计思路中,可基于两两兴趣倾向预测信息间的兴趣倾向预测收敛指标反向传播更新实时训练预测结构的网络权重信息。
例如,分别将第一浏览互动大数据A01配置到至第一置乱聚合模块A02、第二置乱聚合模块A03以及第三置乱聚合模块A04中,得到不同置乱聚合形式下的浏览互动向量簇,并分别将浏览互动向量簇配置到至兴趣倾向预测网络中,进行目标浏览互动数据的兴趣倾向预测,得到第一兴趣倾向预测信息Z,第二兴趣倾向预测信息Z'以及第三兴趣倾向预测信息Z'',进而可基于第一兴趣倾向预测信息Z以及第二兴趣倾向预测信息Z'确定第一兴趣倾向预测收敛指标L1,根据第一兴趣倾向预测信息Z以及第三兴趣倾向预测信息Z''确定第二兴趣倾向预测收敛指标L2,以及根据第二兴趣倾向预测信息Z'以及第三兴趣倾向预测信息Z''确定第三兴趣倾向预测收敛指标L3,进而根据第一兴趣倾向预测收敛指标L1、第二兴趣倾向预测收敛指标L2以及第三兴趣倾向预测收敛指标L3确定总损失,反向传播更新兴趣倾向预测网络A05的网络权重信息,而兴趣倾向预测网络A06以及兴趣倾向预测网络A07的网络权重信息根据兴趣倾向预测网络A05的网络权重信息更新。
如此,通过对多种置乱聚合形式下得到的浏览互动向量簇分别进行目标浏览互动数据的兴趣倾向预测,并根据多个兴趣倾向预测信息训练兴趣倾向预测网络,有助于提高兴趣倾向预测网络的鲁棒性。
一种可基于独立构思的实施例中,本申请实施例还提供一种基于人工智能倾向预测的热点生成方法,包括以下步骤。
步骤R110,根据所述兴趣倾向预测网络对目标用户业务终端所对应的目标浏览互动数据中的浏览互动流程进行兴趣倾向预测,获得所述目标浏览互动数据对应的兴趣倾向标签;
步骤R120,根据所述目标浏览互动数据对应的兴趣倾向标签所对应的各个兴趣倾向标签向量获取与当前的内容推荐服务所对应的热点主题请求信息。
步骤R130,根据内容推荐服务的内容推荐请求信息,向各所述内容热点服务传递热点主题请求信息,所述热点主题请求信息包括待请求的热点主题以及与所述热点主题相关的请求内容信息。
步骤R160,获取各所述内容热点服务根据所述热点主题请求信息响应的热点内容分布。
步骤R150,将获取的各所述内容热点服务响应的所述热点内容分布通过预置的与所述热点主题所对应的主题知识图谱进行分析,基于分析信息从多个所述内容热点服务中确定多个目标内容热点服务。
步骤R160,基于所述多个目标内容热点服务进行所述热点主题的热点内容页面生成,并在热点内容页面生成过程中对所述目标内容热点服务的热点内容信息进行内容管理。
一种可基于独立构思的实施例中,所述步骤R150可以通过以下A1-A5的步骤实现,示例性描述如下。
A1、获取通过所述主题知识图谱针对各所述内容热点服务响应的热点内容分布的热点内容情绪极性分布,得到情绪极性标签集,所述情绪极性标签集包括多个情绪极性标签。其中,所述主题知识图谱可以是预先进行大数据统计和分析而确定的与所述热点主题有关的知识图谱,用于对响应的热点内容分布进行分析。
A2、获得所述情绪极性标签集中的各情绪极性标签与各所述热点内容分布对应的情绪关联性向量。所述情绪关联性向量可以用于表示根据所述主题知识图谱得到的相应热点内容分布被用户进行情绪反馈的量化指标。
A3、根据所述各情绪极性标签对应的情绪关联性向量,以及所述各情绪极性标签的情绪极性标签度量值,对所述各情绪极性标签进行次序整理,得到相应的情绪极性标签清单。例如,首先可以根据所述各情绪极性标签对应的情绪关联性向量,以及所述各情绪极性标签的情绪极性标签度量值,对所述各情绪极性标签进行分团,得到多个情绪极性标签团;然后,根据各情绪极性标签团中的各情绪极性标签的情绪极性标签度量值对各个情绪极性标签团进行次序整理,并分别对所述各个情绪极性标签团中的各情绪极性标签进行次序整理,得到所述情绪极性标签清单。其中,所述目标内容热点服务可以根据所述情绪极性标签清单中各内容热点服务对应的情绪极性标签的次序节点确定,例如可以将排序靠前的预设数量个内容热点服务确定为所述目标内容热点服务。
例如,可以根据情绪关联性向量,按照预置的情绪关联性向量分区,情绪关联性向量可以分为不同的关联性强度,根据情绪关联性向量的结果将相应的情绪极性标签分团到对应的聚类团中,形成相应的情绪极性标签团。然后可以根据各情绪极性标签团对应的情绪极性标签度量值(例如情绪极性标签度量值均值)进行整体排序。所述情绪极性标签度量值可以是预置的用于评价各热点内容分布对热点主题的情绪极性的量化指标。
譬如,还可以分别根据所述各情绪极性标签对应的情绪关联性向量,对所述各情绪极性标签的情绪极性标签度量值进行更新,得到所述各情绪极性标签的最终参考情绪极性标签度量值;然后再根据所述各情绪极性标签的最终参考情绪极性标签度量值对所述各情绪极性标签进行分团,得到多个情绪极性标签团。更新的方式可以是通过预设权重对各情绪极性标签度量值进行权重融合,得到权重融合之后的情绪极性标签度量值。
A4、基于所述情绪极性标签清单生成所述热点内容分布对应的内容热点服务簇,所述内容热点服务簇包括多个内容热点服务。
A5、从所述多个内容热点服务中确定所述目标内容热点服务。
步骤A3中,首先,根据各个情绪极性标签团所包含的情绪极性标签的数量,对所述各个情绪极性标签团进行次序整理;然后,针对所述各个情绪极性标签团,分别执行以下操作:接着,根据所述情绪极性标签团中各情绪极性标签的情绪极性标签度量值与所述情绪极性标签团的训练学习误差,对所述情绪极性标签团中的各情绪极性标签进行次序整理;最后,基于所述各个情绪极性标签团之间的次序整理信息,以及所述各个情绪极性标签团中各情绪极性标签的次序整理信息,生成所述情绪极性标签清单。所述训练学习误差可以是各情绪极性标签度量值与组合中的平均情绪极性标签度量值之间的损失,然后可根据损失值的排序顺序进行次序整理。
例如,情绪关联性向量可以通过以下方式获得:分别将所述各情绪极性标签输入在先生成的情绪关联性决策模型中,基于所述在先生成的情绪关联性决策模型中的情绪关联性学习的情绪关联性挖掘结构对所述各情绪极性标签进行情绪关联性向量挖掘,获得所述情绪关联性挖掘结构生成的所述各情绪极性标签对应的情绪关联性向量。
一种可基于独立构思的实施例中,所述情绪极性标签清单可以通过以下方式得到:
分别将所述各情绪极性标签,以及所述各情绪极性标签对应的情绪关联性向量输入所述在先生成的情绪关联性决策模型中的情绪极性标签度量结构,基于所述情绪极性标签度量结构对所述各情绪极性标签进行决策和次序整理,获得所述情绪极性标签度量结构生成的情绪关联性学习信息的第一预测向量序列,所述第一预测向量序列中的各个情绪极性标签特征构成所述情绪极性标签清单。基于此,步骤A4中,基于所述情绪极性标签清单生成所述热点内容分布对应的内容热点服务簇,可以包括:将所述预测向量序列输入所述在先生成的情绪关联性决策模型中的关注特征挖掘结构,基于所述关注特征挖掘结构进行关注特征挖掘,获得所述关注特征挖掘结构生成的所述内容热点服务簇。
其中,所述在先生成的情绪关联性决策模型是根据包括多个基础参考数据的参考数据簇进行模型收敛配置的,所述参考数据簇中的参考数据包括具有情绪关联性向量的参考情绪极性标签,所述情绪关联性向量表示所述参考情绪极性标签与参考热点主题之间的情绪关联性信息。
示例性地,所述情绪关联性决策模型可以通过获取针对多个参考热点主题的参考数据簇,然后根据所述参考数据簇中的参考数据,对候选情绪关联性决策模型执行遍历模型更新,以获得所述在先生成的情绪关联性决策模型。
其中,每一次遍历模型更新过程通过以下步骤实现:
1、从所述参考数据簇中选取针对同一参考热点主题的一组参考数据,分别将选取的各个参考数据包含的参考情绪极性标签输入所述候选情绪关联性决策模型中的情绪关联性学习的情绪关联性挖掘结构,获得所述情绪关联性挖掘结构生成的各参考情绪极性标签对应的情绪关联性向量。
2、基于所述各参考情绪极性标签对应的情绪关联性向量与对应的情绪关联性向量之间的训练学习误差,构建第一风险学习误差。
3、分别将选取的各个参考数据中的参考情绪极性标签,以及所述各参考情绪极性标签对应的情绪关联性向量输入所述候选情绪关联性决策模型中的情绪极性标签度量结构,基于所述情绪极性标签度量结构对所述各参考情绪极性标签进行分团,获得多个情绪极性标签团。
4、基于所述情绪极性标签度量结构对各个情绪极性标签团进行次序整理,获得所述情绪极性标签度量结构生成的情绪关联性学习信息的第二预测向量序列。
5、将所述第二预测向量序列输入所述候选情绪关联性决策模型中的关注特征挖掘结构,基于所述关注特征挖掘结构进行关注特征挖掘,获得所述关注特征挖掘结构生成的关注特征序列,所述关注特征序列包括多个关注学习特征;基于所述关注特征序列中的关注学习特征与参考关注特征序列中的参考关注特征的特征学习误差,构建第二风险学习误差。
6、基于各个情绪极性标签团中情绪极性标签向量的关注向量值,构建第三风险学习误差;根据所述第一风险学习误差,所述第二风险学习误差和所述第三风险学习误差,对所述候选情绪关联性决策模型进行模型收敛配置。
其中,步骤5中,所述基于所述关注特征序列中的关注学习特征与参考关注特征序列中的参考关注特征的特征学习误差,构建第二风险学习误差,可以通过如下步骤实现。
首先,对于任意一个关注学习特征,基于所述关注学习特征在预设的关注学习特征向量集合中的历史频次,以及所述关注学习特征在所述情绪极性标签集中的历史频次,确定所述关注特征序列中的关注学习特征与参考关注特征序列中的参考关注特征的特征学习误差,并基于确定的特征学习误差构建所述第二风险学习误差。
一种示例性设计方式中,所述步骤R160可以包括以下步骤。
步骤R1601,根据预先订阅的关注主题特征模板获取等待配置的目标可互动热点主题对应的热点主题意图信息。
步骤R1602,基于所述热点主题意图信息,在首次可互动热点主题中创建热点主题挖掘应用。其中,所述热点主题挖掘应用包括至少一种挖掘模型,所述挖掘模型用于挖掘所述首次可互动热点主题。
所述挖掘模型可以根据具体的热点主题通过用户预置的挖掘配置参数进行挖掘模型的更新,使更新后的挖掘模型可用于当前进行的热点主题中的热点主题信息进行挖掘。
例如,可以首先基于所述热点主题意图信息,在所述首次可互动热点主题中创建参考挖掘应用,其中,所述参考挖掘应用包括至少一种等待更新的挖掘模型;
然后,基于所述挖掘模型在所述参考挖掘应用中的模型交叉信息,对所述挖掘模型进行更新,得到更新后的挖掘模型;例如可以根据预设的模型更新的决策要求,对所述模型交叉信息进行匹配分析,以确定等待更新的目标挖掘模型;再按照所述模型更新的决策要求对所述目标挖掘模型进行更新,得到更新后的挖掘模型;
最后,根据所述更新后的挖掘模型,确定所述首次可互动热点主题中的热点主题挖掘应用,其中,所述热点主题挖掘应用包括至少一种更新后的挖掘模型,所述挖掘模型用于挖掘所述首次可互动热点主题。
其中,所述模型交叉信息可以理解为存在交叉的配置信息,通过对存在交叉的配置信息进行分析,可以更好地对冗余信息进行优化。
所述参考挖掘应用的配置流程可以包括:
确定创建参考挖掘应用对应的整体挖掘配置信息;
对所述热点主题意图信息进行线性映射,得到所述热点主题意图信息对应的线性映射特征;以及基于所述整体挖掘配置信息与所述线性映射特征,在所述首次可互动热点主题中创建参考挖掘应用。例如,首先,在所述首次可互动热点主题中创建匹配所述整体挖掘配置信息的参考挖掘应用,其中,所述参考挖掘应用包括至少一种待更新的挖掘模型;然后基于所述线性映射特征,对所述参考挖掘应用中的挖掘模型进行更新,得到更新后的挖掘模型;最后,根据所述更新后的挖掘模型,确定所述首次可互动热点主题中的参考挖掘应用。
步骤R1603,配置等待添加至所述热点主题挖掘应用中的热点主题关键词序列,其中,所述热点主题关键词序列包括多个热点主题关键词。所述热点主题关键词序列包括的热点主题关键词可以为包括所述多个目标内容热点服务的热点主题关键词的组合。
步骤R1604,将所述热点主题关键词与所述热点主题挖掘应用中的挖掘模型进行挖掘节点配对,得到添加至所述挖掘模型的参考热点主题关键词。其中,参考热点主题关键词可以是所述目标内容热点服务的一部分或者全部。
步骤R1605,根据所述参考热点主题关键词与所述挖掘模型之间的挖掘状态向量,从所述参考热点主题关键词中挑选出目标热点主题关键词。
步骤R1606,将所述目标热点主题关键词添加至所述挖掘模型,以将所述目标热点主题关键词添加至所述热点主题挖掘应用中,创建目标可互动热点主题。
步骤R1607,将所述目标可互动热点主题添加至所述目标内容热点服务,使所述目标内容热点服务基于所述可互动热点主题进行热点内容页面生成。
一种可基于独立构思的实施例中,参见图3所示,该人工智能系统100可以包括:处理器101和机器可读存储介质102。其中,所述机器可读存储介质102用于存储支持该人工智能系统100执行上述前述任意一种实施例中提供的基于大数据业务优化的用户信息挖掘方法的程序,所述处理器101被配置为用于执行所述机器可读存储介质102中存储的程序。
所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器101执行时能够实现前述任意一种实施例中的全部或部分步骤。
其中,所述人工智能系统100的架构中还可以包括通信单元103,用于该人工智能系统100与其它设备或通信网络通信(比如云端业务运行系统200)。
另外,本申请实施例提供了一种计算机存储介质,用于储存上述人工智能系统100所用的计算机软件指令,其包含用于执行上述前述任意一种方法实施例中基于大数据业务优化的用户信息挖掘方法所涉及的程序。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种基于大数据业务优化的用户信息挖掘方法,其特征在于,应用于人工智能系统,所述方法包括:
对第一浏览互动大数据进行根据操作节点的分团,并对分团得到的各个浏览互动节点数据进行浏览互动向量挖掘,得到第一浏览互动向量簇,所述第一浏览互动向量簇中涵盖各个浏览互动节点数据对应的第一浏览互动向量,所述第一浏览互动大数据是不携带兴趣倾向标签的浏览互动大数据;
对所述第一浏览互动向量簇中的所述第一浏览互动向量进行置乱聚合,得到第二浏览互动向量簇和第三浏览互动向量簇,所述第二浏览互动向量簇中的第二浏览互动向量与所述第三浏览互动向量簇中的第三浏览互动向量对应不同置乱聚合形式;
根据所述第二浏览互动向量簇和所述第三浏览互动向量簇对兴趣倾向预测网络进行初步网络训练优化,所述兴趣倾向预测网络用于对目标浏览互动数据中的浏览互动流程进行兴趣倾向预测;
根据第二浏览互动大数据对初步网络训练优化的所述兴趣倾向预测网络进行补充训练优化,以通过所述补充训练优化的兴趣倾向预测网络对目标浏览互动数据中的浏览互动流程进行兴趣倾向预测,获得用户挖掘信息后作为业务优化的参考依据,所述第二浏览互动大数据是携带兴趣倾向标签的浏览互动大数据。
2.根据权利要求1所述的基于大数据业务优化的用户信息挖掘方法,其特征在于,所述对所述第一浏览互动向量簇中的所述第一浏览互动向量进行置乱聚合,得到第二浏览互动向量簇和第三浏览互动向量簇,包括:
随机变换所述第一浏览互动向量簇中所述第一浏览互动向量的时空域节点,得到第一目标浏览互动向量簇和第二目标浏览互动向量簇,所述第一目标浏览互动向量簇和所述第二目标浏览互动向量簇中所述第一浏览互动向量的时空域节点不同;
根据所述第一目标浏览互动向量簇进行置乱得到第一置乱向量分布,并根据所述第二目标浏览互动向量簇进行置乱得到第二置乱向量分布;
对所述第一置乱向量分布中的所述第一浏览互动向量进行向量聚合,并根据向量聚合结果生成所述第二浏览互动向量簇;
对所述第二置乱向量分布中的所述第一浏览互动向量进行向量聚合,并根据向量聚合结果生成所述第三浏览互动向量簇。
3.根据权利要求2所述的基于大数据业务优化的用户信息挖掘方法,其特征在于,所述对所述第一置乱向量分布中的所述第一浏览互动向量进行向量聚合,并根据向量聚合结果生成所述第二浏览互动向量簇,包括:
通过向量连接队列提取所述第一置乱向量分布中所对应的i个第一浏览互动向量;
对所述i个第一浏览互动向量进行向量聚合,得到第一聚合浏览互动向量;
对j组所述第一聚合浏览互动向量进行关系转换,得到所述第二浏览互动向量簇,j组所述第一聚合浏览互动向量通过向量连接队列中进行提取获得;
所述对所述第二置乱向量分布中的所述第一浏览互动向量进行向量聚合,并根据向量聚合结果生成所述第三浏览互动向量簇,包括:
通过向量连接队列提取所述第二置乱向量分布中所对应的i个第一浏览互动向量;
对所述i个第一浏览互动向量进行向量聚合,得到第二聚合浏览互动向量;
对j组所述第二聚合浏览互动向量进行关系转换,得到所述第三浏览互动向量簇,j组所述第二聚合浏览互动向量通过向量连接队列中进行提取获得。
4.根据权利要求2所述的基于大数据业务优化的用户信息挖掘方法,其特征在于,所述根据所述第一目标浏览互动向量簇进行置乱得到第一置乱向量分布,并根据所述第二目标浏览互动向量簇进行置乱得到第二置乱向量分布,包括:
根据所述第一浏览互动大数据的根据操作节点的分团形式,确定分团量化参数;
根据所述分团量化参数,对所述第一目标浏览互动向量簇中的第一浏览互动向量进行置乱,得到所述第一置乱向量分布;
根据所述分团量化参数,对所述第二目标浏览互动向量簇中的第一浏览互动向量进行置乱,得到所述第二置乱向量分布。
5.根据权利要求1所述的基于大数据业务优化的用户信息挖掘方法,其特征在于,所述对所述第一浏览互动向量簇中的所述第一浏览互动向量进行置乱聚合,得到第二浏览互动向量簇和第三浏览互动向量簇之后,所述方法包括:
根据所述第二浏览互动向量簇,循环执行多次置乱聚合,得到第三浏览互动向量簇;
根据所述第三浏览互动向量簇,循环执行多次置乱聚合,得到第四浏览互动向量簇;
根据所述第三浏览互动向量簇和所述第四浏览互动向量簇对兴趣倾向预测网络进行初步网络训练优化。
6.根据权利要求1所述的基于大数据业务优化的用户信息挖掘方法,其特征在于,所述根据所述第二浏览互动向量簇和所述第三浏览互动向量簇对兴趣倾向预测网络进行初步网络训练优化,包括:
将所述第二浏览互动向量簇配置到所述兴趣倾向预测网络的实时训练预测结构,得到第一兴趣倾向预测信息;
将所述第三浏览互动向量簇配置到所述兴趣倾向预测网络的目标训练预测结构,得到第二兴趣倾向预测信息;
确定所述第一兴趣倾向预测信息与所述第二兴趣倾向预测信息的兴趣倾向预测收敛指标;
根据所述兴趣倾向预测收敛指标,通过反向传播更新所述实时训练预测结构的网络权重信息;
根据更新的所述实时训练预测结构的网络权重信息,更新所述目标训练预测结构的网络权重信息。
7.根据权利要求6所述的基于大数据业务优化的用户信息挖掘方法,其特征在于,所述根据第二浏览互动大数据对初步网络训练优化的所述兴趣倾向预测网络进行补充训练优化,包括:
将所述第二浏览互动大数据配置到所述兴趣倾向预测网络的所述目标训练预测结构,得到参考兴趣倾向预测信息;
根据所述参考兴趣倾向预测信息以及所述第二浏览互动大数据对应的携带兴趣倾向标签,通过反向传播补充训练优化所述目标训练预测结构的网络权重信息。
8.根据权利要求1-7中任意一项所述的基于大数据业务优化的用户信息挖掘方法,其特征在于,所述方法还包括:
根据所述兴趣倾向预测网络对目标用户业务终端所对应的目标浏览互动数据中的浏览互动流程进行兴趣倾向预测,获得所述目标浏览互动数据对应的兴趣倾向标签;
根据所述目标浏览互动数据对应的兴趣倾向标签所对应的各个兴趣倾向标签向量获取与当前的内容推荐服务所对应的热点主题请求信息;
根据所述内容推荐服务的内容推荐请求信息,向各内容热点服务传递热点主题请求信息,所述热点主题请求信息包括待请求的热点主题以及与所述热点主题相关的请求内容信息;
获取各所述内容热点服务根据所述热点主题请求信息响应的热点内容分布;
获取通过预置的主题知识图谱针对各所述内容热点服务响应的热点内容分布的热点内容情绪极性分布,得到情绪极性标签集,所述情绪极性标签集包括多个情绪极性标签;
获得所述情绪极性标签集中的各情绪极性标签与各所述热点内容分布对应的情绪关联性向量;
根据所述各情绪极性标签对应的情绪关联性向量,以及所述各情绪极性标签的情绪极性标签度量值,对所述各情绪极性标签进行次序整理,得到相应的情绪极性标签清单;
基于所述情绪极性标签清单生成所述热点内容分布对应的内容热点服务簇,所述内容热点服务簇包括多个内容热点服务;
从所述多个内容热点服务中确定目标内容热点服务,基于多个目标内容热点服务进行所述热点主题的热点内容页面生成,并在热点内容页面生成过程中对所述目标内容热点服务的热点内容信息进行内容管理。
9.根据权利要求1所述的基于大数据业务优化的用户信息挖掘方法,其特征在于,所述根据所述各情绪极性标签对应的情绪关联性向量,以及所述各情绪极性标签的情绪极性标签度量值,对所述各情绪极性标签进行次序整理,得到相应的情绪极性标签清单,具体包括:
根据所述各情绪极性标签对应的情绪关联性向量,以及所述各情绪极性标签的情绪极性标签度量值,对所述各情绪极性标签进行分团,得到多个情绪极性标签团;
根据各情绪极性标签团中的各情绪极性标签的情绪极性标签度量值对各个情绪极性标签团进行次序整理,并分别对所述各个情绪极性标签团中的各情绪极性标签进行次序整理,得到所述情绪极性标签清单;
其中,所述目标内容热点服务根据所述情绪极性标签清单中各内容热点服务对应的情绪极性标签的次序节点确定。
10.一种人工智能系统,其特征在于,所述人工智能系统包括处理器和机器可读存储介质,所述机器可读存储介质中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现权利要求1-8中任意一项的基于大数据业务优化的用户信息挖掘方法。
CN202210264884.6A 2022-03-17 2022-03-17 基于大数据业务优化的用户信息挖掘方法及人工智能系统 Withdrawn CN114625967A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210264884.6A CN114625967A (zh) 2022-03-17 2022-03-17 基于大数据业务优化的用户信息挖掘方法及人工智能系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210264884.6A CN114625967A (zh) 2022-03-17 2022-03-17 基于大数据业务优化的用户信息挖掘方法及人工智能系统

Publications (1)

Publication Number Publication Date
CN114625967A true CN114625967A (zh) 2022-06-14

Family

ID=81901526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210264884.6A Withdrawn CN114625967A (zh) 2022-03-17 2022-03-17 基于大数据业务优化的用户信息挖掘方法及人工智能系统

Country Status (1)

Country Link
CN (1) CN114625967A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116956030A (zh) * 2023-07-21 2023-10-27 广州一号家政科技有限公司 基于人工智能的家政业务处理方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116956030A (zh) * 2023-07-21 2023-10-27 广州一号家政科技有限公司 基于人工智能的家政业务处理方法及系统
CN116956030B (zh) * 2023-07-21 2024-02-02 广州一号家政科技有限公司 基于人工智能的家政业务处理方法及系统

Similar Documents

Publication Publication Date Title
Zheng et al. Automl for deep recommender systems: A survey
CN110324170B (zh) 数据分析设备、多模型共决策系统及方法
US8315960B2 (en) Experience transfer for the configuration tuning of large scale computing systems
CN112765477B (zh) 信息处理、信息推荐的方法和装置、电子设备和存储介质
CN112000822B (zh) 多媒体资源排序方法、装置、电子设备及存储介质
CN111881358B (zh) 一种对象推荐系统、方法、装置、电子设备和存储介质
CN112015898B (zh) 基于标签树的模型训练、文本标签确定方法及装置
CN111291618B (zh) 标注方法、装置、服务器和存储介质
CN114117240B (zh) 基于大数据需求分析的互联网内容推送方法及ai系统
EP4339843A1 (en) Neural network optimization method and apparatus
CN114492601A (zh) 资源分类模型的训练方法、装置、电子设备及存储介质
CN112883265A (zh) 信息推荐方法、装置、服务器及计算机可读存储介质
CN113642730A (zh) 卷积网络剪枝方法和装置、电子设备
Li et al. Symbolic expression transformer: A computer vision approach for symbolic regression
CN114625967A (zh) 基于大数据业务优化的用户信息挖掘方法及人工智能系统
CN117011751A (zh) 使用变换器网络分割视频图像序列
CN116361546A (zh) 搜索请求的处理方法、装置、电子设备和存储介质
CN115470927A (zh) 一种替代模型自动提取方法、终端及存储介质
CN112948251B (zh) 软件自动测试方法及装置
CN115147020A (zh) 装修数据处理方法、装置、设备及存储介质
CN114625966A (zh) 基于人工智能倾向预测的热点生成方法及大数据ai系统
CN111241826A (zh) 实体名称识别方法、装置、设备及存储介质
Wang et al. Accelerate model parallel training by using efficient graph traversal order in device placement
CN116679981B (zh) 一种基于迁移学习的软件系统配置调优方法及装置
CN118349809B (zh) 基于物联网的信息处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20220614

WW01 Invention patent application withdrawn after publication