CN114547440A - 基于互联网大数据的用户画像挖掘方法及人工智能云系统 - Google Patents

基于互联网大数据的用户画像挖掘方法及人工智能云系统 Download PDF

Info

Publication number
CN114547440A
CN114547440A CN202210082687.2A CN202210082687A CN114547440A CN 114547440 A CN114547440 A CN 114547440A CN 202210082687 A CN202210082687 A CN 202210082687A CN 114547440 A CN114547440 A CN 114547440A
Authority
CN
China
Prior art keywords
behavior
data
target
user portrait
dialogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210082687.2A
Other languages
English (en)
Inventor
王金山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202210082687.2A priority Critical patent/CN114547440A/zh
Publication of CN114547440A publication Critical patent/CN114547440A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种基于互联网大数据的用户画像挖掘方法及人工智能云系统,通过用户倾向属性分类网络获得针对目标互联网行为大数据的用于描述其行为倾向属性的行为倾向描述分量,以及获取多个用户画像特征簇,用户画像特征簇用于描述对应用户画像下的用户画像源数据的行为倾向属性,而用户画像源数据的用户画像通过所述用户画像源数据的兴趣关注描述分量确定。最后基于所述行为倾向描述分量与各个用户画像特征簇,得到用于确定所述目标互联网行为大数据的用户画像分布的所述目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度。如此设计,使得在用户画像分析过程中,能够提高用户画像分析的准确性。

Description

基于互联网大数据的用户画像挖掘方法及人工智能云系统
技术领域
本申请涉及互联网信息技术领域,具体而言,涉及一种基于互联网大数据的用户画像挖掘方法及人工智能云系统。
背景技术
互联网服务提供商使用大数据技术采集有关用户的各类行为大数据,并通过大数据分析建立用户画像来抽象地描述一个用户的信息全貌,从而可以对用户进行个性化推荐、精准营销和广告投放等。例如当用户登录网站的瞬间,系统就能预测出该用户今天为何而来,然后从电子商务内容库中把合适的内容找出来,并推荐给他。大数据支持下的营销核心在于,让互联网服务提供商的业务在合适的时间,通过合适的载体,以合适的方式,推送给最需要此业务的用户。也就是说,相关技术中的个性化推荐系统通过分析用户的行为,例如包括反馈意见、购买记录和社交数据等,以分析和挖掘用户与电子商务内容之间的相关性,从而发现用户的个性化需求、兴趣等,然后将用户感兴趣的信息、产品推荐给用户。个性化推荐系统针对用户特点及兴趣爱好进行电子商务内容推荐,能有效地提高电子商务系统的服务能力,从而保留用户量。
基于此,在相关技术中,如何精准挖掘用户画像是一个亟待解决的技术问题。然而常规的方案对用户的行为数据的挖掘程度不够。
发明内容
为了至少克服现有技术中的上述不足,本申请的目的在于提供一种基于互联网大数据的用户画像挖掘方法及人工智能云系统。
第一方面,本申请提供一种基于互联网大数据的用户画像挖掘方法,应用于人工智能云系统,所述人工智能云系统与多个智慧业务注册终端通信连接,所述方法包括:
获取待进行用户画像挖掘的目标互联网行为大数据;
通过用户倾向属性分类网络获得针对所述目标互联网行为大数据的行为倾向描述分量,所述行为倾向描述分量用于描述所述目标互联网行为大数据的行为倾向属性;
获取多个用户画像特征簇,所述用户画像特征簇用于描述对应用户画像下的用户画像源数据的行为倾向属性,所述用户画像源数据的用户画像通过所述用户画像源数据的兴趣关注描述分量确定;
基于所述行为倾向描述分量与各个用户画像特征簇,确定所述目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度,所述用户画像相关度用于确定所述目标互联网行为大数据的用户画像分布。
第二方面,本申请实施例还提供一种基于互联网大数据的用户画像挖掘系统,所述基于互联网大数据的用户画像挖掘系统包括人工智能云系统以及与所述人工智能云系统通信连接的多个智慧业务注册终端;
所述人工智能云系统,用于:
获取待进行用户画像挖掘的目标互联网行为大数据;
通过用户倾向属性分类网络获得针对所述目标互联网行为大数据的行为倾向描述分量,所述行为倾向描述分量用于描述所述目标互联网行为大数据的行为倾向属性;
获取多个用户画像特征簇,所述用户画像特征簇用于描述对应用户画像下的用户画像源数据的行为倾向属性,所述用户画像源数据的用户画像通过所述用户画像源数据的兴趣关注描述分量确定;
基于所述行为倾向描述分量与各个用户画像特征簇,确定所述目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度,所述用户画像相关度用于确定所述目标互联网行为大数据的用户画像分布。
基于上述任意一个方面,本申请通过用户倾向属性分类网络获得针对目标互联网行为大数据的用于描述其行为倾向属性的行为倾向描述分量,以及获取多个用户画像特征簇,其中,用户画像特征簇用于描述对应用户画像下的用户画像源数据的行为倾向属性,而用户画像源数据的用户画像通过所述用户画像源数据的兴趣关注描述分量确定。最后,基于所述行为倾向描述分量与各个用户画像特征簇,得到用于确定所述目标互联网行为大数据的用户画像分布的所述目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度。由于用户画像源数据的用户画像通过其自身的兴趣关注描述分量确定,因此用户画像源数据的用户画像考虑了行为数据中的源数据特征的内容分布。并且由于行为倾向描述分量和用户画像特征簇均用于描述行为数据的行为倾向属性,因此行为倾向描述分量和用户画像特征簇考虑了行为数据中深度关注特征,使得在用户画像分析过程中,能够提高用户画像分析的准确性。
附图说明
图1为本申请实施例提供的基于互联网大数据的用户画像挖掘系统的应用场景示意图;
图2为本申请实施例提供的基于互联网大数据的用户画像挖掘方法的流程示意图;
图3为本申请实施例提供的用于实现上述的基于互联网大数据的用户画像挖掘方法的人工智能云系统的结构组件示意框图。
具体实施方式
下面结合说明书附图对本申请进行具体说明,方法实施例中的具体操作方法也可以应用于装置实施例或系统实施例中。
图1是本申请一种实施例提供的基于互联网大数据的用户画像挖掘系统10的交互示意图。基于互联网大数据的用户画像挖掘系统10可以包括人工智能云系统100以及与人工智能云系统100通信连接的智慧业务注册终端200。图1所示的基于互联网大数据的用户画像挖掘系统10仅为一种可行的示例,在其它可行的实施例中,该基于互联网大数据的用户画像挖掘系统10也可以仅包括图1所示组成部分的其中的至少部分或者还可以包括其它的组成部分。
一种可独立实施的实施例中,基于互联网大数据的用户画像挖掘系统10中的人工智能云系统100和智慧业务注册终端200可以通过配合执行以下方法实施例所描述的基于互联网大数据的用户画像挖掘方法,具体人工智能云系统100和智慧业务注册终端200的执行步骤部分可以参照以下方法实施例的详细描述。
为了解决前述背景技术中的技术问题,图2为本申请实施例提供的基于互联网大数据的用户画像挖掘方法的流程示意图,本实施例提供的基于互联网大数据的用户画像挖掘方法可以由图1中所示的人工智能云系统100执行,下面对该基于互联网大数据的用户画像挖掘方法进行详细介绍。
步骤S110,获取待进行用户画像挖掘的目标互联网行为大数据。
一种可独立实施的实施例中,本实施例可以应用于电子商务信息推送的业务环境,例如,所述目标互联网行为大数据可以是待进行用户画像挖掘的电子商务行为数据,例如,一段电子商务直播行为数据。
步骤S120,通过用户倾向属性分类网络获得针对所述目标互联网行为大数据的行为倾向描述分量,所述行为倾向描述分量用于描述所述目标互联网行为大数据的行为倾向属性。
一种可独立实施的实施例中,通过用户倾向属性分类网络获得针对所述目标互联网行为大数据的行为倾向描述分量,能表征所述目标互联网行为大数据的行为倾向属性。
步骤S130,获取多个用户画像特征簇,所述用户画像特征簇用于描述对应用户画像下的用户画像源数据的行为倾向属性,所述用户画像源数据的用户画像通过所述用户画像源数据的兴趣关注描述分量确定。
一种可独立实施的实施例中,所述用户画像特征簇的特征排列形式可以与所述目标互联网行为大数据的行为倾向描述分量的特征排列形式相同,即,用户画像特征簇的特征维度与行为倾向描述分量的特征维度相同。
一种可独立实施的实施例中,一个用户画像特征簇可以对应一个用户画像下的用户画像源数据。一种设计思路中,一个用户画像特征簇可以是对应一个用户画像下的一个用户画像源数据,也可以是对应一个用户画像下的多个用户画像源数据。其中,用户画像源数据的用户画像通过其自身的兴趣关注描述分量确定,即可以通过用户画像源数据中的源数据特征(即用户画像特征)的共现特征确定用户画像源数据自身的用户画像。
步骤S140,基于所述行为倾向描述分量与各个用户画像特征簇,确定所述目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度,所述用户画像相关度用于确定所述目标互联网行为大数据的用户画像分布。
基于以上步骤,由于行为倾向描述分量能够表征目标互联网行为大数据的行为倾向属性,用户画像特征簇能够表征用户画像源数据的行为倾向属性,所以,从行为倾向的维度确定目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度,可以使得在用户画像分析过程中,通过用户画像相关度确定的目标互联网行为大数据的用户画像分布能够解决行为数据中多行为倾向的问题,进而能够提高用户画像分析的准确性。
一种可独立实施的实施例中,在上述步骤S130中,获取多个用户画像特征簇,可以按照下述步骤执行。
一种可独立实施的实施例中,针对获取多个用户画像特征簇的具体实现方式,可以包括步骤S131至步骤S134:
步骤S131,获取候选互联网行为数据序列,所述候选互联网行为数据序列中包括待进行用户画像挖掘的候选互联网行为数据。
步骤S132,提取所述候选互联网行为数据序列中各个候选互联网行为数据的兴趣关注描述分量,所述兴趣关注描述分量用于描述候选互联网行为数据中兴趣关注频度的大小排列信息。
步骤S133,基于所述候选互联网行为数据序列中各个候选互联网行为数据的兴趣关注描述分量,在所述候选互联网行为数据序列中确定多个用户画像所对应的用户画像源数据。
步骤S134,通过用户倾向属性分类网络获得针对各个用户画像所对应的用户画像源数据的用户画像特征,得到多个用户画像特征簇。
在步骤S131中,候选互联网行为数据序列中包括有多个待进行用户画像挖掘的候选互联网行为数据。
例如,在电子商务信息推送的业务环境下,需要分析电子商务用户画像,基于此,可以获取电子商务行为数据序列,电子商务行为数据序列中可以包括多个待进行用户画像挖掘的电子商务行为数据。
一种设计思路中,每个电子商务行为数据可以具有类别属性信息(即用户画像类别信息),如果电子商务行为数据没有类别属性信息,可以通过常规的行为数据分类网络得到电子商务行为数据的用户画像类别信息。
在步骤S133中,基于所述候选互联网行为数据序列中各个候选互联网行为数据的兴趣关注描述分量,在所述候选互联网行为数据序列中确定多个用户画像所对应的用户画像源数据,可以按照下述步骤执行。
一种可独立实施的实施例中,示出了在所述候选互联网行为数据序列中确定多个用户画像所对应的用户画像源数据的具体实现方式,例如可以包括步骤S1331至步骤S1332:
步骤S1331,基于各个候选互联网行为数据的兴趣关注描述分量,通过兴趣用户画像网络确定各个候选互联网行为数据的用户画像的热力图。
步骤S1332,基于各个候选互联网行为数据的用户画像的热力图,在所述候选互联网行为数据序列中确定多个用户画像所对应的用户画像源数据。
在步骤S1331中,所述候选互联网行为数据可以包括用户画像类别信息,一种设计思路中,可以是基于各个候选互联网行为数据的兴趣关注描述分量,以及各个候选互联网行为数据的用户画像类别信息,通过有监督的兴趣用户画像网络确定各个候选互联网行为数据的用户画像的热力图。
一种可独立实施的实施例中,所述用户画像的热力图可以是指候选互联网行为数据分别为各种用户画像的热力值。例如,候选互联网行为数据为第一用户画像的热力值为80,候选互联网行为数据为第二用户画像的热力值为30,候选互联网行为数据为第三用户画像的热力值为20。
一种可独立实施的实施例中,在通过有监督的兴趣用户画像网络确定各个候选互联网行为数据的用户画像的热力图之前,需要预先训练兴趣用户画像网络。
在步骤S1332中,在所述候选互联网行为数据序列中确定多个用户画像所对应的用户画像源数据,可以按照下述示例性的步骤执行。
以下介绍在所述候选互联网行为数据序列中确定多个用户画像所对应的用户画像源数据的细节流程,例如可包括步骤S1333至步骤S1335:
步骤S1333,通过各个候选互联网行为数据的用户画像的热力图确定各个候选互联网行为数据的用户画像为目标用户画像的用户画像热力值,所述目标用户画像为所述多个用户画像中的任意一个用户画像。
步骤S1334,按照降序排序对各个候选互联网行为数据的用户画像为所述目标用户画像的用户画像热力值进行排序。
步骤S1335,选取用户画像热力值排序在第一预设数量区间内的候选互联网行为数据,确定为所述目标用户画像对应的用户画像源数据。
例如,可以通过兴趣用户画像网络得到每篇候选互联网行为数据的用户画像分布信息,通过排序同时可以得到每个用户画像下的热力值排序,选取在热力值排序前序的第一目标数量(例如100个)的候选互联网行为数据作为每个用户画像的用户画像源数据。
例如,对于2个候选互联网行为数据(候选互联网行为数据A、候选互联网行为数据B,以及候选互联网行为数据C)而言,候选互联网行为数据A在第一用户画像上的用户画像热力值为80、在第二用户画像上的用户画像热力值为30、在第三用户画像上的用户画像热力值为40;
候选互联网行为数据B在第一用户画像上的用户画像热力值为50、在第二用户画像上的用户画像热力值为50、在第三用户画像上的用户画像热力值为30;
候选互联网行为数据C在第一用户画像上的用户画像热力值为60、在第二用户画像上的用户画像热力值为30、在第三用户画像上的用户画像热力值为40;
若第一目标数量设为2,那么第一用户画像所对应的用户画像源数据应该为:候选互联网行为数据A和候选互联网行为数据C。
在上述步骤S134中,通过用户倾向属性分类网络获得针对各个用户画像所对应的用户画像源数据的用户画像特征,得到多个用户画像特征簇,可以按照以下步骤执行。
例如,下述步骤示出了根据本申请一个实施例的通过用户倾向属性分类网络获得针对各个用户画像所对应的用户画像源数据的用户画像特征,得到多个用户画像特征簇的细节流程,具体包括步骤S1341至步骤S1342:
在步骤S1341中,针对所述多个用户画像中的每一个目标用户画像,通过用户倾向属性分类网络获得所述目标用户画像所对应的第一目标数量的用户画像源数据的用户画像特征。
在步骤S1342中,对所述第一目标数量的用户画像源数据的用户画像特征进行融合,得到所述目标用户画像所对应的用户画像特征簇。
一种可独立实施的实施例中,由于一个用户画像可以对应多个用户画像源数据,基于此,可以对多个用户画像源数据的用户画像特征进行融合,得到用户画像所对应的用户画像特征簇。
由于用户画像特征簇是多个用户画像源数据对应用户画像特征的加权融合,因此用户画像特征簇较为精确地表征用户画像。
一种可独立实施的实施例中,在步骤S140中,基于所述行为倾向描述分量与各个用户画像特征簇,确定所述目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度,可以按照下述步骤执行。
例如,确定所述目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度的细节流程例如可以包括步骤 271至步骤S142:
在步骤S141中,计算所述行为倾向描述分量与各个用户画像特征簇之间的特征间隔值。
在步骤S142中,基于所述特征间隔值,确定所述目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度,所述用户画像相关度与所述特征间隔值负相关。
一种可独立实施的实施例中,目标互联网行为大数据可以通过行为倾向描述分量在特征分布空间内映射一个特征点,用户画像源数据可以通过用户画像特征簇在特征分布空间内映射一个特征点,因此,可以通过目标互联网行为大数据与用户画像源数据在特征分布空间内的相距距离(即特征间隔值)确定两者之间的用户画像相关度,即特征间隔值越小,二者相关度越大,特征间隔值越大,二者相关度越小。
一种可独立实施的实施例中,在步骤S140之后,还可以执行下述步骤。
在步骤S181中,在各个用户画像所对应的用户画像源数据中确定与所述目标互联网行为大数据的用户画像相关度最大的用户画像源数据。
在步骤S182中,将所述用户画像相关度最大的用户画像源数据所对应的用户画像确定为所述目标互联网行为大数据的用户画像。
例如,目标互联网行为大数据与第一用户画像、第二用户画像、第三用户画像、第四用户画像、第五用户画像所对应用户画像源数据的用户画像相关度分别为95、80、50、20、8。根据前述实施例,可以将第一用户画像确定为所述目标互联网行为大数据的用户画像。
一种可独立实施的实施例中,在步骤S140之后,还可以执行如下步骤:
基于所述目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度,确定所述目标互联网行为大数据的用户画像的热力图。
例如,一种可独立实施的实施例中,可以通过如下方式确定所述目标互联网行为大数据的用户画像的热力图:
首先,可以按照降序排序对所述目标互联网行为大数据与各个用户画像的用户画像源数据之间的用户画像相关度进行排序;
然后,选择所述用户画像相关度排序靠前的第二目标数量的用户画像源数据;
最后,基于所述第二目标数量的用户画像源数据所对应的用户画像,以及所述第二目标数量的用户画像源数据所对应的用户画像相关度,确定所述目标互联网行为大数据的用户画像的热力图。
例如,目标互联网行为大数据与第一用户画像、第二用户画像、第三用户画像、第四用户画像、第五用户画像所对应用户画像源数据的用户画像相关度分别为95、80、50、20、8。若第二目标数量设为3,则按照本实施例,所述目标互联网行为大数据的用户画像的热力图可以为:第一用户画像的热力值为(95)/(200%)、第二用户画像的热力值为 (80)/(200%)、第三用户画像的热力值为(50)/(200%)。
基于以上步骤,一方面,由于用户画像源数据的用户画像通过其本身的兴趣关注描述分量确定,因此用户画像源数据的用户画像考虑了行为数据中的源数据特征的内容分布。另一方面,由于行为倾向描述分量和用户画像特征簇均用于描述行为数据的行为倾向属性,所以,行为倾向描述分量和用户画像特征簇考虑了行为数据中的关键特征信息,使得在用户画像的分析中,能够解决多行为倾向的问题,又能对行为数据中关注特征部分进行区分,进而能够提高用户画像分析的准确性。
在以上描述的基础上,本申请实施例还可以包括以下步骤。
步骤S201,获取所述智慧业务注册终端的目标互联网行为大数据的历史用户画像以及每个所述历史用户画像对应的内容推荐反馈画像,对所述目标互联网行为大数据的用户画像进行扩展,获取扩展用户画像,基于所述扩展用户画像生成向所述智慧业务注册终端推送的电子商务推送页面,并获取所述智慧业务注册终端在每个所述电子商务推送页面中的目标对话行为数据。
步骤S202,将目标对话行为数据输入到第一对话意图分析网络中的对话行为分析结构,得到所述对话行为分析结构输出的所述目标对话行为数据的第一对话行为分量和第二对话行为分量。
一种可独立实施的实施例中,所述对话行为分析结构包括存在特征级联关系的多个深度卷积节点,所述第一对话行为分量是所述存在特征级联关系的多个深度卷积节点中的除最后一个深度卷积节点之外的深度卷积节点输出的对话行为分量,所述第二对话行为分量是所述存在特征级联关系的多个深度卷积节点中的最后一个的深度卷积节点输出的对话行为分量。
步骤S203,将所述第二对话行为分量输入到所述第一对话意图分析网络中的对话意图引用结构,得到所述对话意图引用结构输出的目标引用数据簇。
一种可独立实施的实施例中,所述目标引用数据簇为在所述目标对话行为数据中应用到的目标电商意图对象所在的引用数据簇。进一步地,目标电商意图对象包括但不限于各种可能产生电商意图的业务对象,如电商电子商务内容、电商页面单元、电商互动流程等。目标引用数据簇可以包括多组引用数据簇。
步骤S204,将所述第一对话行为分量、所述第二对话行为分量和第三对话行为分量以及所述目标引用数据簇输入到所述第一对话意图分析网络中的意图预测结构,得到所述意图预测结构输出的所述目标电商意图对象的电商意图类别属性以及所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的数据分区信息。
一种可独立实施的实施例中,所述第三对话行为分量是所述对话意图引用结构中的深度卷积节点根据扩展行为分量输出的对话行为分量,所述扩展行为分量是对所述第二对话行为分量进行扩展得到的行为分量。相应的,扩展行为分量可以理解为经过扩展的行为分量,比如可以对第二对话行为分量进行行为数据进行扩展。
进一步地,匹配对话数据段可以理解为目标电商意图对象的关键对话数据段,比如对目标电商意图对象而言具有明显区分意义的对话数据信息,而数据分区信息可以理解为匹配对话数据段在目标对话行为数据中的分区。
步骤S205,将所述意图预测结构输出的所述目标电商意图对象的电商意图类别属性以及所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的数据分区信息添加到业务优化数据集中进行业务优化。
基于以上设计,本实施例通过采用第一对话意图分析网络进行分析的方式,对目标对话行为数据进行对话行为分析后进行多轮电商意图对象分享,从而得到目标对话行为数据中的目标电商意图对象所在的引用数据簇,以及目标电商意图对象的电商意图类别属性以及目标电商意图对象的匹配对话数据段在目标对话行为数据中的数据分区信息,进一步的确定目标电商意图对象的候选意图指向兴趣点,从而能够准确定位电商意图对象信息,从而提升电商意图对象信息的解析速度,提高了电商意图对象信息的识别有效性。
可以理解的是,在确定出所述目标电商意图对象的电商意图类别属性以及所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的数据分区信息之后,可以根据上述的电商意图类别属性以及数据分区信息对目标对话行为数据的溯源轨迹进行分析,从而挖掘出目标电商意图对象的触发流程,从而更便于后续业务迭代更新和优化。
上述步骤S202从目标对话行为数据中获取目标对话行为数据的对话行为分量的方式有多种,一种可独立实施的实施例中,可以通过以下方案实现:将目标对话行为数据输入到对话行为分析结构中包括存在特征级联关系的起始深度卷积节点,得到起始深度卷积节点输出的起始对话行为分量;将起始对话行为分量输入到对话行为分析结构中包括存在特征级联关系的中转深度卷积节点,得到中转深度卷积节点输出的中转对话行为分量,其中,第一对话行为分量为中转对话行为分量;将中转对话行为分量输入到对话行为分析结构中包括存在特征级联关系的终末深度卷积节点,得到终末深度卷积节点输出的终末对话行为分量,其中,第二对话行为分量为终末对话行为分量。
一种可独立实施的实施例中,起始对话行为分量的行为分量维度小于中转对话行为分量的行为分量维度,起始对话行为分量的行为场景特征数量小于中转对话行为分量的行为场景特征数量,中转对话行为分量的行为分量维度等于终末对话行为分量的行为分量维度,中转对话行为分量的行为场景特征数量大于终末对话行为分量的行为场景特征数量。
换言之,为了的得到符合第一对话意图分析网络处理需求的对话行为分量,通过对话行为分析方式对目标对话行为数据的行为分量维度及行为场景特征数量进行调整,可以将获取到的目标对话行为数据中的电商意图对象的行为分量进行处理,得到信息内容不同的目标对话行为数据的对话行为分量,并选择符合第一对话意图分析网络处理需求的对话行为分量进一步处理。
一种可独立实施的实施例中,将第二对话行为分量输入到第一对话意图分析网络中的对话意图引用结构,得到对话意图引用结构输出的目标引用数据簇,包括:将第二对话行为分量输入到对话意图引用结构中的行为分量扩展节点,得到行为分量扩展节点输出的扩展行为分量;将扩展行为分量输入到对话意图引用结构中的深度卷积节点,得到对话意图引用结构中的深度卷积节点输出的第三对话行为分量;将第三对话行为分量输入到对话意图引用结构中的第一意图引用节点,得到第一意图引用节点输出的目标引用数据簇。
一种可独立实施的实施例中,将第三对话行为分量输入到对话意图引用结构中的第一意图引用节点,得到第一意图引用节点输出的目标引用数据簇包括:根据第三对话行为分量,确定目标电商意图对象所在的多个引用数据簇中每个引用数据簇的概率度量值;根据多个引用数据簇中每个引用数据簇的概率度量值,在多个引用数据簇中确定出目标引用数据簇。
一种可独立实施的实施例中,上述步骤S204的进一步实施方式为:将第一对话行为分量、第二对话行为分量和第三对话行为分量输入到意图预测结构中的行为分量描述节点,得到行为分量描述节点输出的描述行为分量,其中,行为分量描述节点用于将第一对话行为分量、第二对话行为分量和第三对话行为分量转换为第一目标行为分量维度和目标行为场景特征数量的对话行为分量,并将转换后的对话行为分量进行描述信息提取,得到描述行为分量;将描述行为分量输入到意图预测结构中的深度卷积节点,得到意图预测结构中的深度卷积节点输出的第四对话行为分量;将第四对话行为分量和目标引用数据簇输入到意图预测结构中的第一池化节点,得到第一池化节点输出的第一池化行为分量,其中,第一池化节点用于在第四对话行为分量中获取与目标引用数据簇对应的对话行为分量,并将获取到的对话行为分量转换成第二目标行为分量维度的行为分量,得到第一池化行为分量;将第一池化行为分量输入到意图预测结构中的第二意图引用节点,得到第二意图引用节点输出的目标电商意图对象的电商意图类别属性以及目标电商意图对象的匹配对话数据段在目标对话行为数据中的数据分区信息。
如此设计,可以尽可能准确地输出目标电商意图对象的电商意图类别属性以及目标电商意图对象的匹配对话数据段在目标对话行为数据中的数据分区信息。
一种可独立实施的实施例中,所述第一池化行为分量输入到所述意图预测结构中的第二意图引用节点,得到所述第二意图引用节点输出的所述目标电商意图对象的电商意图类别属性以及所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的数据分区信息,包括:根据所述第一池化行为分量,确定所述目标电商意图对象的多个电商意图对象标签中每个电商意图对象标签的概率度量值、以及所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的多个数据分区中的每个数据分区的概率度量值;根据所述多个电商意图对象标签中每个电商意图对象标签的概率度量值,在所述多个电商意图对象标签中确定出所电商意图类别属性,并根据所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的多个数据分区中的每个数据分区的概率度量值,在所述多个数据分区中确定所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的数据分区信息。
可以理解的是,通过对电商意图对象标签的概率度量值以及数据分区的概率度量值进行考虑,能够确保电商意图类别属性以及数据分区信息的可信程度。
为了更加准确对目标电商意图对象进行定位,还可以将多种对话行为分量通过意图预测结构中的行为分量描述节点进行描述行为分量处理,将不同维度、不同行为场景特征的多种对话行为分量转换为同一行为分量维度,并将多种对话行为分量的行为场景特征进行整合,使得整合后的行为分量维度中可存在细节的目标电商意图对象的行为分量,进一步通过意图预测结构中的深度卷积节点输出包含细节的目标电商意图对象的行为分量的第四对话行为分量,进而通过第一池化节点获取第四对话行为分量中获取与目标引用数据簇对应的对话行为分量,使用第二意图引用节点根据第一池化行为分量,确定目标电商意图对象的多个电商意图对象标签中每个电商意图对象标签的概率度量值、以及目标电商意图对象的匹配对话数据段在目标对话行为数据中的多个数据分区中的每个数据分区的概率度量值;根据多个电商意图对象标签中每个电商意图对象标签的概率度量值,在多个电商意图对象标签中确定出所电商意图类别属性,并根据目标电商意图对象的匹配对话数据段在目标对话行为数据中的多个数据分区中的每个数据分区的概率度量值,在多个数据分区中确定目标电商意图对象的匹配对话数据段在目标对话行为数据中的数据分区信息,通过概率度量值阈值进行筛分,输出细节的电商意图类别属性、目标电商意图对象的匹配对话数据段在目标对话行为数据中的数据分区信息、细节的目标引用数据簇。
一种可独立实施的实施例中,使用设定的第一参考对话行为数据序列对待训练的第一AI神经网络进行网络更新,得到所述第一对话意图分析网络。
一种可独立实施的实施例中,将目标电商意图对象的匹配对话数据段在目标对话行为数据中的数据分区信息和第四对话行为分量输入到第一对话意图分析网络中的意图指向分析节点,得到意图指向分析节点输出的目标电商意图对象的意图指向兴趣点,其中,第四对话行为分量是意图预测结构中的深度卷积节点根据第一对话行为分量、第二对话行为分量和第三对话行为分量输出的对话行为分量。
其中,意图指向分析节点可以是属性检测单元,用于对游戏漏洞进行要素和属性分析。
一种可独立实施的实施例中,目标电商意图对象的匹配对话数据段在目标对话行为数据中的数据分区信息和第四对话行为分量输入到第一对话意图分析网络中的意图指向分析节点,得到意图指向分析节点输出的目标电商意图对象的意图指向兴趣点,包括:将数据分区信息和第四对话行为分量输入到意图指向分析节点中的第二池化节点,得到第二池化节点输出的第二池化行为分量,其中,第二池化节点用于在第四对话行为分量中获取与数据分区信息对应的对话行为分量,并将获取到的对话行为分量转换成第三目标行为分量维度的行为分量,得到第二池化行为分量;将第二池化行为分量输入到意图指向分析节点中的第三意图引用节点,得到第三意图引用节点输出的目标电商意图对象的意图指向兴趣点。
如此设计,能够确保意图指向兴趣点与目标电商意图对象之间的高度适配。
一种可独立实施的实施例中,所述第二池化行为分量输入到所述意图指向分析节点中的第三意图引用节点,得到所述第三意图引用节点输出的所述目标电商意图对象的意图指向兴趣点,包括:根据所述第二池化行为分量,确定所述目标电商意图对象的多个候选意图指向兴趣点中每个候选意图指向兴趣点的概率度量值;根据所述多个候选意图指向兴趣点中每个候选意图指向兴趣点的概率度量值,在所述多个候选意图指向兴趣点中确定所述目标电商意图对象的意图指向兴趣点。
换言之,还可以通过目标电商意图对象的匹配对话数据段在目标对话行为数据中的数据分区信息以及第四对话行为分量实现目标电商意图对象的意图指向兴趣点的确定,利用第二池化节点从第四对话行为分量中获取与数据分区信息对应的对话行为分量,并将获取到的对话行为分量转换成第三目标行为分量维度的行为分量,通过第三意图引用节点确定出第三目标行为分量维度的行为分量中目标电商意图对象的多个候选意图指向兴趣点中每个候选意图指向兴趣点的概率度量值,根据设定的概率度量值阈值进行进行筛分,以确定目标电商意图对象的意图指向兴趣点。
如此,可以实现对存在干扰的意图指向兴趣点的过滤,从而确保目标电商意图对象的意图指向兴趣点的可信度。
一种可独立实施的实施例中,上述方法还包括:在所述目标对话行为数据包括预设业务投放阶段内W个业务投放关键位置上采集到的W个对话行为数据、且在所述W个对话行为数据中均解析到所述目标电商意图对象的前提下,获取所述意图预测结构中的所述第一池化节点输出的W个第一池化行为分量,其中,所述W个第一池化行为分量与所述W个对话行为数据具有单独映射关系,W为自然数;将所述W个第一池化行为分量分别输入到第二对话意图分析网络中的W个深度卷积节点中对应的深度卷积节点,得到所述W个深度卷积节点协同输出的W个第五对话行为分量;将所述W个第五对话行为分量分别输入到所述第二对话意图分析网络中的W个时空域特征提取节点中对应的时空域特征提取节点,得到所述W个时空域特征提取节点协同输出的W个电商意图时空域特征;根据所述W个电商意图时空域特征,确定所述目标电商意图对象在所述W个业务投放关键位置上的业务投放特征信息。
例如,时空域特征提取节点可以是长短期记忆子网络。
一种可独立实施的实施例中,所述根据所述W个电商意图时空域特征,确定所述目标电商意图对象在所述W个业务投放关键位置上的业务投放特征信息,包括:根据所述W个第五对话行为分量中的第1个第五对话行为分量,确定所述W个业务投放关键位置中的第1个业务投放关键位置上的业务投放特征信息;根据在所述W个业务投放关键位置中的第R-1个业务投放关键位置上的业务投放特征信息、所述W个第五对话行为分量中的第R-1个第五对话行为分量,确定所述W个业务投放关键位置中的第R个业务投放关键位置上的业务投放特征信息,其中,R大于1,小于等于W。
如此设计,可以确保得到的业务投放特征信息的时效性。
一种可独立实施的实施例中,上述方法还可以包括:根据所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的数据分区信息,生成所述目标电商意图对象的挖掘状态分布信息;将所述挖掘状态分布信息、所述意图指向兴趣点以及目标投放热点的投放热点特征输入到第三对话意图分析网络,得到所述第三对话意图分析网络输出的所述目标电商意图对象与所述目标投放热点之间的偏离信息,其中,所述目标投放热点为用于服务所述目标对话行为数据的投放行为信息。
如此设计,可以通过所述第三对话意图分析网络输出的所述目标电商意图对象与所述目标投放热点之间的偏离信息实现对第三对话意图分析网络以及目标投放热点的协同调整,从而确保后续在进行对话行为数据解析时的效率。
譬如,一种可独立实施的实施例中,针对步骤S205,下面提供本公开实施例提供的一种基于意图预测和业务优化的信息提示方法,可以通过以下示例性的步骤实现。
步骤B210,将所述意图预测结构输出的所述目标电商意图对象的电商意图类别属性以及所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的数据分区信息添加到业务优化数据集中,其中,所述业务优化数据集中包括多个目标电商意图对象的电商意图类别属性以及每个所述目标电商意图对象的匹配对话数据段;
步骤B220,根据所述电商意图类别属性所对应的业务优化策略提取相应的匹配对话数据段中的业务优化基础内容信息;
步骤B230,根据每个所述业务优化基础内容信息获取所述智慧业务注册终端的业务优化知识网络,所述业务优化知识网络包括多个业务优化项目的优化知识点信息和知识点投放进展信息,每个业务优化项目的优化知识点信息包括多个优化知识点的优化知识点类别属性和知识点数据源;
步骤B240,基于所述多个业务优化项目的优化知识点信息,确定所述多个业务优化项目中每个业务优化项目的至少一个优化知识点簇,以及构建至少一个业务优化项目分布空间,每个优化知识点簇包括所述多个优化知识点中的至少两种优化知识点的优化知识点类别属性;
步骤B250,基于所述多个业务优化项目的知识点投放进展信息和至少一个优化知识点簇、以及所述至少一个业务优化项目分布空间,确定所述多个业务优化项目中每个业务优化项目的业务优化指导信息;
步骤B260,根据所述多个业务优化项目中每个业务优化项目的业务优化指导信息,检测所述业务优化知识网络中的关键业务优化知识点,并基于所述业务优化知识网络中的关键业务优化知识点进行业务优化提示。
基于以上步骤,可以基于该多个业务优化项目的优化知识点信息,确定该多个业务优化项目中每个业务优化项目的至少一个优化知识点簇,以及构建至少一个业务优化项目分布空间。每个业务优化项目的至少一个优化知识点簇包括该每个业务优化项目的多个优化知识点的优化知识点类别属性和知识点数据源,即该每个业务优化项目的至少一个优化知识点簇可以表示该每个业务优化项目的不同优化知识点之间的优化逻辑关联关系,另外,该业务优化项目分布空间可以表示各个业务优化项目之间的优化逻辑关联关系。之后,基于该多个业务优化项目的知识点投放进展信息和至少一个优化知识点簇、以及至少一个业务优化项目分布空间,确定该多个业务优化项目中每个业务优化项目的业务优化指导信息,每个业务优化项目的业务优化指导信息可以表示项目之间的优化逻辑关联关系。如此,根据该多个业务优化项目中每个业务优化项目的业务优化指导信息,检测业务优化知识网络中的关键业务优化知识点,进一步挖掘了业务优化项目之间的相互关系,避免仅考虑业务优化项目的基本特征而导致的解析结果不准确的情况,进而提高了关键业务优化知识点的解析准确率。
譬如,一种可独立实施的实施例中,所述基于所述多个业务优化项目的优化知识点信息,确定所述多个业务优化项目中每个业务优化项目的至少一个优化知识点簇的步骤,包括:对于所述多个业务优化项目中的任一业务优化项目,根据所述任一业务优化项目的多个优化知识点的知识点数据源,按照优化知识点触发的顺序,对所述任一业务优化项目的多个优化知识点的优化知识点类别属性进行排序;按照依次顺序,将排序后的优化知识点类别属性中每相关联的预设数量个优化知识点类别属性作为一个优化知识点簇,得到所述任一业务优化项目的至少一个优化知识点簇,所述至少一个优化知识点簇中相关联的两个优化知识点簇存在一个共享的优化知识点类别属性。
一种可独立实施的实施例中,每个业务优化项目的优化知识点信息还包括所述多个优化知识点的知识点引用对象特征,所述知识点引用对象特征用于描述优化知识点的引用内容状态和具体优化知识点;基于所述多个业务优化项目的优化知识点信息,构建至少一个业务优化项目分布空间的步骤,包括:根据所述多个业务优化项目的知识点引用对象特征,对所述多个业务优化项目进行分团,得到至少一个分团的业务优化项目,每个分团的业务优化项目包括多个业务优化项目,且属于同一个分团的多个业务优化项目的引用内容状态相同;对于所述至少一个分团的业务优化项目中的任意一个分团的业务优化项目,根据所述任意一个分团的业务优化项目的知识点引用对象特征,将所述任意一个分团的业务优化项目中具有相同优化知识点的业务优化项目建立优化逻辑关联关系;以所述任意一个分团的业务优化项目中的多个业务优化项目为知识节点、所建立的优化逻辑关联关系为知识节点属性,构建所述任意一个分团的业务优化项目的业务优化项目分布空间,得到所述至少一个业务优化项目分布空间。
譬如,一种可独立实施的实施例中,当所述任意一个分团的业务优化项目的业务优化项目分布空间中的每个知识节点属性具有AI预测价值的知识更新维度时,所述以所述任意一个分团的业务优化项目中的多个业务优化项目为知识节点、所建立的优化逻辑关联关系为知识节点属性,构建所述任意一个分团的业务优化项目的业务优化项目分布空间的步骤,包括: 对于所述任意一个分团的业务优化项目的多个业务优化项目中的任意具有优化逻辑关联关系的第一业务优化项目和第二业务优化项目,当所述第一业务优化项目的知识点数据源先于所述第二业务优化项目的知识点数据源时,确定所述第一业务优化项目与所述第二业务优化项目之间知识节点属性的AI预测价值是由所述第一业务优化项目联动所述第二业务优化项目; 当所述第一业务优化项目的知识点数据源后于所述第二业务优化项目的知识点数据源时,确定所述第一业务优化项目与所述第二业务优化项目之间知识节点属性的AI预测价值是由所述第二业务优化项目联动所述第一业务优化项目;以所述任意一个分团的业务优化项目中的多个业务优化项目为知识节点,根据所确定的所述多个业务优化项目中具有优化逻辑关联关系的所有业务优化项目之间的更新维度知识节点属性,确定所述任意一个分团的业务优化项目的业务优化项目分布空间。
譬如,一种可独立实施的实施例中,所述基于所述多个业务优化项目的知识点投放进展信息和至少一个优化知识点簇、以及所述至少一个业务优化项目分布空间,确定所述多个业务优化项目中每个业务优化项目的业务优化指导信息,包括:对于所述至少一个业务优化项目分布空间中的任一业务优化项目分布空间,在所述任一业务优化项目分布空间上随机确定多个不同的随机游走流程,在确定过程中所述任一业务优化项目分布空间的每个业务优化项目都被随机游走到;随机游走每个随机游走流程中的业务优化项目,并按照先后随机游走顺序将每个随机游走流程中的业务优化项目组成随机游走成员序列,得到所述任一业务优化项目分布空间对应的多个随机游走成员序列;对于所有所述随机游走成员序列中的任一随机游走成员序列,随机游走所述任一随机游走成员序列中的每个业务优化项目,将每个业务优化项目分别与前、后相关联且位于基础业务优化流程的业务优化任务内的其它业务优化项目组成业务优化项目组合,得到所述任一随机游走成员序列对应的多个业务优化项目组合; 将所有所述随机游走成员序列对应的业务优化项目组合输入至预设AI训练单元中进行训练;当到达AI收敛条件时,停止训练,并将所述每个业务优化项目输入至到达AI收敛条件的预设AI训练单元中,输出所述每个业务优化项目的AI预测特征,每个业务优化项目的AI预测特征包括每个业务优化项目在所述至少一个业务优化项目分布空间上与其它业务优化项目相关联的度量值;基于所述多个业务优化项目的知识点投放进展信息、至少一个优化知识点簇以及所述至少一个业务优化项目分布空间,确定所述多个业务优化项目中每个业务优化项目的业务优化描述特征;将所述多个业务优化项目中每个业务优化项目的AI预测特征与业务优化描述特征进行融合,得到所述多个业务优化项目中每个业务优化项目的业务优化指导信息。
譬如,一种可独立实施的实施例中,当所述任意一个分团的业务优化项目的业务优化项目分布空间中的每个知识节点属性具有AI预测价值的知识更新维度时,所述基于所述多个业务优化项目的知识点投放进展信息、至少一个优化知识点簇以及所述至少一个业务优化项目分布空间,确定所述多个业务优化项目中每个业务优化项目的业务优化描述特征的步骤,包括: 从所述多个业务优化项目的知识点投放进展信息中,提取每个业务优化项目的知识点投放进展信息中的至少一个;基于所述多个业务优化项目中每个业务优化项目的至少一个优化知识点簇,统计每个业务优化项目的业务优化强度、业务优化范围和业务优化模板中的至少一个,所述业务优化强度是指业务优化项目的参考优化知识点在业务优化项目的至少一个优化知识点簇中出现的优化频度,所述业务优化模板表征业务优化项目的至少一个优化知识点簇中的参考优化知识点簇在所述多个业务优化项目的至少一个优化知识点簇中出现的业务优化范围;基于所述至少一个业务优化项目分布空间,提取每个业务优化项目分布空间中每个业务优化项目的关联优化对象数量、优化数据源和优化输出源中的至少一个;基于每个业务优化项目的知识点投放进展信息中的至少一个,业务优化强度、业务优化范围和业务优化模板中的至少一个,以及关联优化对象数量、优化数据源和优化输出源中的至少一个,确定每个业务优化项目的业务优化描述特征。
图3示出了本申请实施例提供的用于实现上述的基于互联网大数据的用户画像挖掘方法的人工智能云系统100的硬件结构示意图,如图3所示,人工智能云系统100可包括处理芯片110、机器可读存储介质120;其中,机器可读存储介质120上存储有可执行代码,当可执行代码被处理芯片110执行时,使处理芯片110执行以上基于互联网大数据的用户画像挖掘方法的实施例的步骤。
实际上,该人工智能云系统中还可以包括通信接口140,处理芯片110、机器可读存储介质120和通信接口140通过总线130连接,通信接口140用于与其它设备通信。
另外,本申请实施例提供了一种非暂时性机器可读存储介质,非暂时性机器可读存储介质上存储有可执行代码,当可执行代码被电子设备的处理器执行时,使处理器至少可以实现如前述基于互联网大数据的用户画像挖掘方法的实施例的步骤。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种基于互联网大数据的用户画像挖掘方法,其特征在于,应用于人工智能云系统,所述人工智能云系统与多个智慧业务注册终端通信连接,所述方法包括:
获取待进行用户画像挖掘的目标互联网行为大数据;
通过用户倾向属性分类网络获得针对所述目标互联网行为大数据的行为倾向描述分量,所述行为倾向描述分量用于描述所述目标互联网行为大数据的行为倾向属性;
获取多个用户画像特征簇,所述用户画像特征簇用于描述对应用户画像下的用户画像源数据的行为倾向属性,所述用户画像源数据的用户画像通过所述用户画像源数据的兴趣关注描述分量确定;
基于所述行为倾向描述分量与各个用户画像特征簇,确定所述目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度,所述用户画像相关度用于确定所述目标互联网行为大数据的用户画像分布。
2.根据权利要求1所述的基于互联网大数据的用户画像挖掘方法,其特征在于,所述获取多个用户画像特征簇,包括:
获取候选互联网行为数据序列,所述候选互联网行为数据序列中包括待进行用户画像挖掘的候选互联网行为数据;
提取所述候选互联网行为数据序列中各个候选互联网行为数据的兴趣关注描述分量,所述兴趣关注描述分量用于描述候选互联网行为数据中兴趣关注频度的大小排列信息;
基于所述候选互联网行为数据序列中各个候选互联网行为数据的兴趣关注描述分量,在所述候选互联网行为数据序列中确定多个用户画像所对应的用户画像源数据;
通过用户倾向属性分类网络获得针对各个用户画像所对应的用户画像源数据的用户画像特征,得到多个用户画像特征簇。
3.根据权利要求2所述的基于互联网大数据的用户画像挖掘方法,其特征在于,所述基于所述候选互联网行为数据序列中各个候选互联网行为数据的兴趣关注描述分量,在所述候选互联网行为数据序列中确定多个用户画像所对应的用户画像源数据,包括:
基于各个候选互联网行为数据的兴趣关注描述分量,通过兴趣用户画像网络确定各个候选互联网行为数据的用户画像的热力图;
基于各个候选互联网行为数据的用户画像的热力图,在所述候选互联网行为数据序列中确定多个用户画像所对应的用户画像源数据;
其中,所述候选互联网行为数据包括用户画像类别信息,所述基于各个候选互联网行为数据的兴趣关注描述分量,通过兴趣用户画像网络确定各个候选互联网行为数据的用户画像的热力图,包括:
基于各个候选互联网行为数据的兴趣关注描述分量,以及各个候选互联网行为数据的用户画像类别信息,通过有监督的兴趣用户画像网络确定各个候选互联网行为数据的用户画像的热力图;
其中,所述基于各个候选互联网行为数据的用户画像的热力图,在所述候选互联网行为数据序列中确定多个用户画像所对应的用户画像源数据,包括:
通过各个候选互联网行为数据的用户画像的热力图确定各个候选互联网行为数据的用户画像为目标用户画像的用户画像热力值,所述目标用户画像为所述多个用户画像中的任意一个用户画像;
按照降序排序对各个候选互联网行为数据的用户画像为所述目标用户画像的用户画像热力值进行排序;
选取用户画像热力值排序在第一预设数量区间内的候选互联网行为数据,确定为所述目标用户画像对应的用户画像源数据;
其中,所述通过用户倾向属性分类网络获得针对各个用户画像所对应的用户画像源数据的用户画像特征,得到多个用户画像特征簇,包括:
针对所述多个用户画像中的每一个目标用户画像,通过用户倾向属性分类网络获得所述目标用户画像所对应的第一目标数量的用户画像源数据的用户画像特征;
对所述第一目标数量的用户画像源数据的用户画像特征进行融合,得到所述目标用户画像所对应的用户画像特征簇。
4.根据权利要求1所述的基于互联网大数据的用户画像挖掘方法,其特征在于,所述基于所述行为倾向描述分量与各个用户画像特征簇,确定所述目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度,包括:
计算所述行为倾向描述分量与各个用户画像特征簇之间的特征间隔值;
基于所述特征间隔值,确定所述目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度,所述用户画像相关度与所述特征间隔值负相关。
5.根据权利要求1所述的基于互联网大数据的用户画像挖掘方法,其特征在于,在确定所述目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度之后,所述方法还包括:
在各个用户画像所对应的用户画像源数据中确定与所述目标互联网行为大数据的用户画像相关度最大的用户画像源数据;
将所述用户画像相关度最大的用户画像源数据所对应的用户画像确定为所述目标互联网行为大数据的用户画像。
6.根据权利要求1-5中任意一项所述的基于互联网大数据的用户画像挖掘方法,其特征在于,在确定所述目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度之后,所述方法还包括:
基于所述目标互联网行为大数据与各个用户画像所对应的用户画像源数据之间的用户画像相关度,确定所述目标互联网行为大数据的用户画像的热力图。
7.根据权利要求5所述的基于互联网大数据的用户画像挖掘方法,其特征在于,所述方法还包括:
根据所述目标互联网行为大数据的历史用户画像以及每个所述历史用户画像对应的内容推荐反馈画像,对所述目标互联网行为大数据的用户画像进行扩展,获取扩展用户画像,基于所述扩展用户画像生成向所述智慧业务注册终端推送的电子商务推送页面,并获取所述智慧业务注册终端在每个所述电子商务推送页面中的目标对话行为数据;
将目标对话行为数据输入到第一对话意图分析网络中的对话行为分析结构,得到所述对话行为分析结构输出的所述目标对话行为数据的第一对话行为分量和第二对话行为分量,其中,所述对话行为分析结构包括存在特征级联关系的多个深度卷积节点,所述第一对话行为分量是所述存在特征级联关系的多个深度卷积节点中的除最后一个深度卷积节点之外的深度卷积节点输出的对话行为分量,所述第二对话行为分量是所述存在特征级联关系的多个深度卷积节点中的最后一个的深度卷积节点输出的对话行为分量;
将所述第二对话行为分量输入到所述第一对话意图分析网络中的对话意图引用结构,得到所述对话意图引用结构输出的目标引用数据簇,其中,所述目标引用数据簇为在所述目标对话行为数据中定位到的目标电商意图对象所在的引用数据簇;
将所述第一对话行为分量、所述第二对话行为分量和第三对话行为分量以及所述目标引用数据簇输入到所述第一对话意图分析网络中的意图预测结构,得到所述意图预测结构输出的所述目标电商意图对象的电商意图类别属性以及所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的数据分区信息,其中,所述第三对话行为分量是所述对话意图引用结构中的深度卷积节点根据扩展行为分量输出的对话行为分量,所述扩展行为分量是对所述第二对话行为分量进行扩展得到的行为分量;
将所述意图预测结构输出的所述目标电商意图对象的电商意图类别属性以及所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的数据分区信息添加到业务优化数据集中进行业务优化。
8.根据权利要求7所述的基于互联网大数据的用户画像挖掘方法,其特征在于,所述将目标对话行为数据输入到第一对话意图分析网络中的对话行为分析结构,得到所述对话行为分析结构输出的所述目标对话行为数据的第一对话行为分量和第二对话行为分量,包括:
将所述目标对话行为数据输入到所述对话行为分析结构中包括存在特征级联关系的起始深度卷积节点,得到所述起始深度卷积节点输出的起始对话行为分量;
将所述起始对话行为分量输入到所述对话行为分析结构中包括存在特征级联关系的中转深度卷积节点,得到所述中转深度卷积节点输出的中转对话行为分量,其中,所述第一对话行为分量为所述中转对话行为分量;
将所述中转对话行为分量输入到所述对话行为分析结构中包括存在特征级联关系的终末深度卷积节点,得到所述终末深度卷积节点输出的终末对话行为分量,其中,所述第二对话行为分量为所述终末对话行为分量。
9.根据权利要求1所述的基于互联网大数据的用户画像挖掘方法,其特征在于,所述第二对话行为分量输入到所述第一对话意图分析网络中的对话意图引用结构,得到所述对话意图引用结构输出的目标引用数据簇,包括:
将所述第二对话行为分量输入到所述对话意图引用结构中的行为分量扩展节点,得到所述行为分量扩展节点输出的所述扩展行为分量;
将所述扩展行为分量输入到所述对话意图引用结构中的深度卷积节点,得到所述对话意图引用结构中的深度卷积节点输出的所述第三对话行为分量;
将所述第三对话行为分量输入到所述对话意图引用结构中的第一意图引用节点,得到所述第一意图引用节点输出的所述目标引用数据簇;
将所述第三对话行为分量输入到所述对话意图引用结构中的第一意图引用节点,得到所述第一意图引用节点输出的所述目标引用数据簇包括:
根据所述第三对话行为分量,确定所述目标电商意图对象所在的多个引用数据簇中每个引用数据簇的概率度量值;
根据所述多个引用数据簇中每个引用数据簇的概率度量值,在所述多个引用数据簇中确定出所述目标引用数据簇;
所述第一对话行为分量、所述第二对话行为分量和第三对话行为分量以及所述目标引用数据簇输入到所述第一对话意图分析网络中的意图预测结构,得到所述意图预测结构输出的所述目标电商意图对象的电商意图类别属性以及所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的数据分区信息,包括:
将所述第一对话行为分量、所述第二对话行为分量和所述第三对话行为分量输入到所述意图预测结构中的行为分量描述节点,得到所述行为分量描述节点输出的描述行为分量,其中,所述行为分量描述节点用于将所述第一对话行为分量、所述第二对话行为分量和所述第三对话行为分量转换为第一目标行为分量维度和目标行为场景特征数量的对话行为分量,并将转换后的对话行为分量进行描述信息提取,得到所述描述行为分量;
将所述描述行为分量输入到所述意图预测结构中的深度卷积节点,得到所述意图预测结构中的深度卷积节点输出的第四对话行为分量;
将所述第四对话行为分量和所述目标引用数据簇输入到所述意图预测结构中的第一池化节点,得到所述第一池化节点输出的第一池化行为分量,其中,所述第一池化节点用于在所述第四对话行为分量中获取与所述目标引用数据簇对应的对话行为分量,并将获取到的对话行为分量转换成第二目标行为分量维度的行为分量,得到所述第一池化行为分量;
将所述第一池化行为分量输入到所述意图预测结构中的第二意图引用节点,得到所述第二意图引用节点输出的所述目标电商意图对象的电商意图类别属性以及所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的数据分区信息;
相应的,所述第一池化行为分量输入到所述意图预测结构中的第二意图引用节点,得到所述第二意图引用节点输出的所述目标电商意图对象的电商意图类别属性以及所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的数据分区信息,包括:
根据所述第一池化行为分量,确定所述目标电商意图对象的多个电商意图对象标签中每个电商意图对象标签的概率度量值、以及所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的多个数据分区中的每个数据分区的概率度量值;
根据所述多个电商意图对象标签中每个电商意图对象标签的概率度量值,在所述多个电商意图对象标签中确定出所电商意图类别属性,并根据所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的多个数据分区中的每个数据分区的概率度量值,在所述多个数据分区中确定所述目标电商意图对象的匹配对话数据段在所述目标对话行为数据中的数据分区信息。
10.一种人工智能云系统,其特征在于,所述人工智能云系统包括机器可读存储介质、处理器;其中,所述机器可读存储介质上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行权利要求1-9中任意一项的基于互联网大数据的用户画像挖掘方法。
CN202210082687.2A 2022-01-25 2022-01-25 基于互联网大数据的用户画像挖掘方法及人工智能云系统 Withdrawn CN114547440A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210082687.2A CN114547440A (zh) 2022-01-25 2022-01-25 基于互联网大数据的用户画像挖掘方法及人工智能云系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210082687.2A CN114547440A (zh) 2022-01-25 2022-01-25 基于互联网大数据的用户画像挖掘方法及人工智能云系统

Publications (1)

Publication Number Publication Date
CN114547440A true CN114547440A (zh) 2022-05-27

Family

ID=81671183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210082687.2A Withdrawn CN114547440A (zh) 2022-01-25 2022-01-25 基于互联网大数据的用户画像挖掘方法及人工智能云系统

Country Status (1)

Country Link
CN (1) CN114547440A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115599873A (zh) * 2022-12-06 2023-01-13 滨州市玉炜网络科技有限公司(Cn) 基于人工智能物联网的数据采集方法、系统及云平台

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115599873A (zh) * 2022-12-06 2023-01-13 滨州市玉炜网络科技有限公司(Cn) 基于人工智能物联网的数据采集方法、系统及云平台
CN115599873B (zh) * 2022-12-06 2023-08-29 广州丰网互联科技有限公司 基于人工智能物联网的数据采集方法、系统及云平台

Similar Documents

Publication Publication Date Title
CN111782965B (zh) 意图推荐方法、装置、设备及存储介质
CN108021929B (zh) 基于大数据的移动端电商用户画像建立与分析方法及系统
CN110909182B (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
Qian et al. Social media based event summarization by user–text–image co-clustering
CN103118111B (zh) 一种基于多个数据交互中心的数据进行信息推送的方法
CN109255586B (zh) 一种面向电子政务办事的在线个性化推荐方法
KR20160057475A (ko) 소셜 데이터를 능동적으로 획득하기 위한 시스템 및 방법
CN111506820B (zh) 推荐模型、方法、装置、设备及存储介质
Moradi et al. A trust-aware recommender algorithm based on users overlapping community structure
CN112989169B (zh) 目标对象识别方法、信息推荐方法、装置、设备及介质
CN114048387B (zh) 基于大数据和ai预测的内容推荐方法及人工智能云系统
CN111382190A (zh) 一种基于智能的对象推荐方法、装置和存储介质
CN113628005A (zh) 基于电商会话大数据的推送更新方法及大数据ai系统
CN114547439A (zh) 基于大数据和人工智能的业务优化方法及电子商务ai系统
CN117216362A (zh) 内容推荐方法、装置、设备、介质和程序产品
CN108509545B (zh) 一种文章的评论处理方法及系统
CN114416998A (zh) 文本标签的识别方法、装置、电子设备及存储介质
CN110297967B (zh) 兴趣点确定方法、装置、设备及计算机可读存储介质
CN114003803B (zh) 一种社交平台上特定地域的媒体账号发现方法及系统
CN114581139A (zh) 基于大数据意图挖掘的内容更新方法及深度学习服务系统
CN114221991A (zh) 基于大数据的会话推荐反馈处理方法及深度学习服务系统
CN114428910A (zh) 资源推荐方法、装置、电子设备、产品及介质
CN114547440A (zh) 基于互联网大数据的用户画像挖掘方法及人工智能云系统
CN113592550A (zh) 基于大数据的在线电子商务推荐方法及大数据ai系统
WO2020135420A1 (zh) 对用户进行分类的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20220527

WW01 Invention patent application withdrawn after publication