CN115222051A - 基于数字互联网的大数据挖掘方法及系统 - Google Patents

基于数字互联网的大数据挖掘方法及系统 Download PDF

Info

Publication number
CN115222051A
CN115222051A CN202210888687.1A CN202210888687A CN115222051A CN 115222051 A CN115222051 A CN 115222051A CN 202210888687 A CN202210888687 A CN 202210888687A CN 115222051 A CN115222051 A CN 115222051A
Authority
CN
China
Prior art keywords
knowledge
big data
group
user activity
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210888687.1A
Other languages
English (en)
Inventor
张志强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202210888687.1A priority Critical patent/CN115222051A/zh
Publication of CN115222051A publication Critical patent/CN115222051A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了基于数字互联网的大数据挖掘方法及系统;首先可以对选定的数字互联网用户报告中的每组用户活动大数据的行为描述知识集进行知识提炼处理,获得可以反映行为描述知识集中存在用户需求的知识分布的业务需求描述字段,然后再将每组用户活动大数据的业务需求描述字段在持续的需求状态层面进行时序联动分析,获得能够对用户需求大数据的在状态和时间上的更新进行记载的用户需求联动知识,规避了在需求状态联动分析处理时对于大数据噪声的考虑,然后基于用户需求联动知识,对行为描述知识集进行知识优化处理,以将服务需求挖掘的侧重点转移到存在用户需求的知识分布,这样可以提高服务需求挖掘的精度和可信度。

Description

基于数字互联网的大数据挖掘方法及系统
技术领域
本申请涉及大数据技术领域,尤其涉及一种基于数字互联网的大数据挖掘方法及系统。
背景技术
数字化进程持续加快,各行各业纷纷实现数字化转型,形成数字+云+互联网的综合性信息体系。作为综合性信息体系的其中一环,数字互联网具有高效的供需资源聚合、流动的数据价值、创新驱动的技术赋能以及全价值链的深度运营赋能等优势,正因如此,现目前的各类工作、学习、娱乐等业务活动逐渐呈现云端化和数字化模式。而为了保障各类业务活动的服务质量,针对一系列的业务用户的需求分析挖掘至关重要。但是,传统的用户需求挖掘技术在应用时容易受到噪声干扰,难以保障挖掘的精度和可信度。
发明内容
本申请的一个目的是提供一种基于数字互联网的大数据挖掘方法及系统。
本申请的技术方案是通过如下至少部分实施例实现的。
一种基于数字互联网的大数据挖掘方法,应用于大数据挖掘系统,所述方法包括:
对选定的数字互联网用户报告中的每组用户活动大数据的行为描述知识集进行知识提炼处理,获得所述每组用户活动大数据的业务需求描述字段;
对所述每组用户活动大数据的所述业务需求描述字段进行需求状态联动分析,获得所述每组用户活动大数据的用户需求联动知识;
结合所述用户需求联动知识,对所述每组用户活动大数据的所述行为描述知识集进行知识优化处理,获得所述每组用户活动大数据的已优化行为描述知识集;
对所述数字互联网用户报告包括的用户活动大数据中的每组用户活动大数据的已优化行为描述知识集进行服务需求挖掘,获得所述数字互联网用户报告的服务需求挖掘清单。
在一种可独立实施的示例中,所述对选定的数字互联网用户报告中的每组用户活动大数据的行为描述知识集进行知识提炼处理,获得所述每组用户活动大数据的业务需求描述字段,包括:
在所述选定的数字互联网用户报告中的所述每组用户活动大数据的行为描述知识集中确定局部需求关联知识分布,获得所述每组用户活动大数据的相对知识分布关系网;
结合所述相对知识分布关系网,对所述每组用户活动大数据的所述行为描述知识集进行局部需求关联知识分布的拼接,获得所述每组用户活动大数据的业务需求描述字段。
在一种可独立实施的示例中,所述在所述选定的数字互联网用户报告中的所述每组用户活动大数据的行为描述知识集中确定局部需求关联知识分布,获得所述每组用户活动大数据的相对知识分布关系网,包括:
对所述选定的数字互联网用户报告中的每组用户活动大数据的行为描述知识集进行基于描述角度的知识处理,获得所述每组用户活动大数据的完成基于描述角度的知识处理的目标行为描述知识集;
对所述每组用户活动大数据的目标行为描述知识集与邻居用户活动大数据的知识集特征变量,进行专家知识挖掘,获得所述每组用户活动大数据的所述相对知识分布关系网。
在一种可独立实施的示例中,所述对所述每组用户活动大数据的目标行为描述知识集与邻居用户活动大数据的知识集特征变量,进行专家知识挖掘,获得所述每组用户活动大数据的所述相对知识分布关系网,包括:
对所述每组用户活动大数据的邻居用户活动大数据对应的目标行为描述知识集,与所述每组用户活动大数据对应的目标行为描述知识集的知识集特征变量,进行滑动滤波操作,获得行为变化描述知识集;
对所述每组用户活动大数据对应的目标行为描述知识集进行滑动滤波操作,获得需求项目描述知识集;
将所述行为变化描述知识集和所述需求项目描述知识集进行拼接,获得所述相对知识分布关系网。
在一种可独立实施的示例中,在所述对所述每组用户活动大数据对应的目标行为描述知识集进行滑动滤波操作,获得需求项目描述知识集之后,所述方法还包括:
将所述行为变化描述知识集和所述需求项目描述知识集进行拼接,获得联动行为描述知识集;
对所述联动行为描述知识集进行基于描述角度的知识处理,获得所述相对知识分布关系网。
在一种可独立实施的示例中,所述结合所述相对知识分布关系网,对所述每组用户活动大数据的所述行为描述知识集进行局部需求关联知识分布的拼接,获得所述每组用户活动大数据的业务需求描述字段,包括:
对所述相对知识分布关系网进行标准化操作;
将标准化操作后的相对知识分布关系网与所述行为描述知识集拼接,获得所述每组用户活动大数据的所述业务需求描述字段。
在一种可独立实施的示例中,所述对所述每组用户活动大数据的所述业务需求描述字段进行需求状态联动分析,获得所述每组用户活动大数据的用户需求联动知识,包括:
获取所述每组用户活动大数据的业务需求描述字段与邻居用户活动大数据的业务需求描述字段之间的特征关联系数,其中,所述邻居用户活动大数据包括:所述数字互联网用户报告中的全部组用户活动大数据或所述数字互联网用户报告中与所述每组用户活动大数据存在关联的设定数目组的用户活动大数据;
基于所述特征关联系数对所述邻居用户活动大数据的业务需求描述字段进行整合;
对完成整合的所述邻居用户活动大数据的主业务需求描述字段进行特征映射,获得所述每组用户活动大数据的所述用户需求联动知识。
在一种可独立实施的示例中,所述对所述每组用户活动大数据的所述业务需求描述字段进行需求状态联动分析,获得所述每组用户活动大数据的用户需求联动知识,包括:
获取与所述每组用户活动大数据存在关联的所述设定数目组的用户活动大数据的业务需求描述字段;
对所述每组用户活动大数据的业务需求描述字段进行线性滑动滤波操作,获得所述每组用户活动大数据的所述用户需求联动知识。
在一种可独立实施的示例中,所述结合所述用户需求联动知识,对所述每组用户活动大数据的所述行为描述知识集进行知识优化处理,获得所述每组用户活动大数据的已优化行为描述知识集,包括以下其中一项:
结合所述用户需求联动知识,对所述每组用户活动大数据的所述行为描述知识集进行知识优化处理,获得所述每组用户活动大数据的已优化行为描述知识集;
结合所述相对知识分布关系网和所述用户需求联动知识,对所述每组用户活动大数据的所述行为描述知识集进行知识优化处理,获得所述每组用户活动大数据的已优化行为描述知识集。
在一种可独立实施的示例中,所述结合所述用户需求联动知识,对所述每组用户活动大数据的所述行为描述知识集进行知识优化处理,获得所述每组用户活动大数据的已优化行为描述知识集,包括:
对所述用户需求联动知识进行多元回归分析,获得需求细节特征分布;
将所述每组用户活动大数据的所述行为描述知识集和所述需求细节特征分布进行拼接,获得所述每组用户活动大数据的已优化行为描述知识集。
在一种可独立实施的示例中,所述对所述用户需求联动知识进行多元回归分析,获得需求细节特征分布,包括:结合相对知识分布关系网,对所述用户需求联动知识进行多元回归分析,获得所述需求细节特征分布。
在一种可独立实施的示例中,所述结合相对知识分布关系网,对所述用户需求联动知识进行多元回归分析,获得所述需求细节特征分布,包括:
对所述相对知识分布关系网进行调整,获得已调整知识分布关系网;
基于所述用户需求联动知识与所述已调整知识分布关系网的第一向量运算结果,获得所述需求细节特征分布。
在一种可独立实施的示例中,所述结合相对知识分布关系网,对所述用户需求联动知识进行多元回归分析,获得所述需求细节特征分布,包括:
对所述相对知识分布关系网进行量纲统一,获得目标知识分布关系网;
基于所述用户需求联动知识与所述目标知识分布关系网的第二向量运算结果,获得所述需求细节特征分布。
一种大数据挖掘系统,包括:用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现上述方法的处理器。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行上述方法。
根据本申请的一个实施例,首先可以对选定的数字互联网用户报告中的每组用户活动大数据的行为描述知识集进行知识提炼处理,获得可以反映行为描述知识集中存在用户需求的知识分布的业务需求描述字段,然后再将每组用户活动大数据的业务需求描述字段在持续的需求状态层面进行时序联动分析,获得能够对用户需求大数据的在状态和时间上的更新进行记载的用户需求联动知识,规避了在需求状态联动分析处理时对于大数据噪声的考虑,然后基于用户需求联动知识,对行为描述知识集进行知识优化处理,以将服务需求挖掘的侧重点转移到存在用户需求的知识分布,这样可以提高服务需求挖掘的精度和可信度。
附图说明
图1是示出可以实现本申请的实施例的大数据挖掘系统的一种通信配置的示意图。
图2是示出可以实现本申请的实施例的一种基于数字互联网的大数据挖掘方法的流程示意图。
图3是示出可以实现本申请的实施例的一种基于数字互联网的大数据挖掘方法的应用环境的架构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
图1是示出可以实现本申请的实施例的大数据挖掘系统100的一种通信配置的框图,大数据挖掘系统100包括用于存储可执行计算机程序的存储器101,用于执行所述存储器101中存储的可执行计算机程序时实现本申请实施例中一种基于数字互联网的大数据挖掘方法的处理器102。
图2是示出可以实现本申请的实施例的一种基于数字互联网的大数据挖掘方法的流程示意图,一种基于数字互联网的大数据挖掘方法可以通过图1所示的大数据挖掘系统100实现,进一步可以包括以下相关步骤所描述的技术方案。
步骤101、对选定的数字互联网用户报告中的每组用户活动大数据的行为描述知识集进行知识提炼处理,获得每组用户活动大数据的业务需求描述字段。
其中,本申请实施例用于对数字互联网用户报告中的用户行为事件的业务需求进行挖掘。比如,对数字互联网用户报告中用户行为事件的电商业务需求的挖掘,对于数字互联网用户报告中的用户行为事件的个性化产品定制需求的挖掘等。大数据挖掘系统在获得初始数字互联网用户报告时,可以先对初始数字互联网用户报告进行一系列筛选操作,从而获得包含多组用户活动大数据的待挖掘数字互联网用户报告。然后,大数据挖掘系统对待挖掘数字互联网用户报告中的每组用户活动大数据进行特征挖掘,获得每组用户活动大数据的行为描述知识集(行为特征向量分布),再对每组用户活动大数据的行为描述知识集进行知识提炼处理(比如进一步的特征挖掘、卷积处理等),所获得的知识提炼结果可以是每组用户活动大数据所对应的业务需求描述字段。可以理解的是,业务需求描述字段为表示业务需求事件的描述数组(量化的特征向量),从而获得每组用户活动大数据的业务需求描述字段,从而确定每组用户活动大数据的业务需求事件。
对于一些可能的示例而言,大数据挖掘系统可以对初始数字互联网用户报告的全部数字互联网用户报告进行筛选,获得待挖掘数字互联网用户报告,这样,能够对初始数字互联网用户报告包含的全部信息进行充分使用。对于另一些可能的示例而言,大数据挖掘系统还能够按照设定筛选组数或者是设定筛选周期,从初始数字互联网用户报告中筛选出数字互联网用户报告,将筛选出的数字互联网用户报告组成待挖掘数字互联网用户报告,这样,能够减少服务需求挖掘时的处理资源开销,提高需求挖掘效率。
在一些示例下,大数据挖掘系统在按照设定筛选组数或者设定筛选周期筛选出数字互联网用户报告,获得选定的数字互联网用户报告之后,还可以从初始数字互联网用户报告没有被筛选的数字互联网用户报告中采样一些数字互联网用户报告添加到选定的数字互联网用户报告中。比如,当选定的数字互联网用户报告中包含用户行为事件的数字互联网用户报告较少时,可以从初始数字互联网用户报告中采样一些包含用户行为事件的数字互联网用户报告添加到待挖掘数字互联网用户报告中。在另一些示例下,大数据挖掘系统还可以根据待挖掘数字互联网用户报告中的数字互联网用户报告,从待挖掘数字互联网用户报告的集合中清洗一些数字互联网用户报告,比如,将用户行为数据占比较少的数字互联网用户报告从选定的数字互联网用户报告中清洗等。
其中,设定筛选组数可以灵活设置,比如10或5。设定筛选周期也可以灵活设置,比如5s或2s。
可以理解的是,大数据挖掘系统是在多个描述角度(描述层面、描述维度)上分别对每组用户活动大数据进行特征挖掘的(每个描述角度都会有对应的特征挖掘单元,该特征挖掘单元可以是卷积核),从而所获得的行为描述知识集本质是在多个描述角度上进行特征挖掘之后所获得的行为描述知识集的整体信息,比如每组用户活动大数据对应了不少于一个行为描述知识集。大数据挖掘系统可以通过特征金字塔模型中的特征挖掘层(比如卷积层)来对每组用户活动大数据进行特征挖掘,由一个特征挖掘单元对应于一个特征挖掘描述角度。
其中,大数据挖掘系统在对每组用户活动大数据的行为描述知识集进行知识提炼处理的先后,与每组用户活动大数据的时间先后联系不大,比如每组用户活动大数据的时间先后,并不会确定哪些组的行为描述知识集是进行知识提炼处理,哪些组的行为描述知识集是后进行知识提炼处理的。换言之,大数据挖掘系统可以随机,或者是同步对每组用户活动大数据的行为描述知识集进行知识提炼处理。
步骤102、对每组用户活动大数据的业务需求描述字段进行需求状态联动分析,获得每组用户活动大数据的用户需求联动知识。
其中,大数据挖掘系统在获得业务需求描述字段之后,可以将每组用户活动大数据的业务需求描述字段在持续的需求状态层面进行时序联动分析,从而分析出每组用户活动大数据的业务需求事件在状态和时间上的更新情况,获得每组用户活动大数据的用户需求联动知识。而需求状态联动分析可以理解为基于时序和状态的关联分析。
其中,大数据挖掘系统在将每组用户活动大数据的业务需求描述字段在持续的需求状态层面进行时序联动分析时,本质可以是将需求状态联动分析挖掘的侧重点偏向于了业务需求事件,比如将需求状态联动分析处理的侧重点转移到用户活动大数据中实际存在用户需求的知识分布,以减少大数据噪声所在需求状态联动分析处理时产生的影响,以此所获得的用户需求联动知识着重反映业务需求事件所对应的信息集的在状态和时间上的更新,实现对噪声信息的忽略,保障需求状态联动分析处理的精度和可信度。
举例而言,在针对每组用户活动大数据确定出业务需求事件,获得业务需求描述字段之后,大数据挖掘系统会在进行需求状态联动分析时,本质可以是将这些业务需求事件所对应的信息集在持续的需求状态层面进行时序联动分析,比如可以通过知识图谱或者有向连线进行视觉强化处理。
其中,大数据挖掘系统可以是依次对每组用户活动大数据的业务需求描述字段进行需求状态联动分析,也可以是基于随机先后对每组用户活动大数据的业务需求描述字段进行需求状态联动分析,还可以是同步对每组用户活动大数据的用户需求联动知识进行需求状态联动分析,且用户需求联动知识可以理解为融合了时序特征的需求状态变化特征,示例性可以通过现有的特征向量、描述数组进行记录。
换言之,对每组用户活动大数据的业务需求描述字段进行需求状态联动分析的处理先后,与每组用户活动大数据在时间先后层面上的先后联系不大。
步骤103、结合用户需求联动知识,对每组用户活动大数据的行为描述知识集进行知识优化处理,获得每组用户活动大数据的已优化行为描述知识集。
其中,大数据挖掘系统可以用户需求联动知识,来对每组用户活动大数据的行为描述知识集进行知识优化处理(比如可以理解为知识强化或者特征强化处理),使得每组用户活动大数据的行为描述知识集中的业务需求事件在进行服务需求挖掘时的权重相比于大数据噪声所对应的信息集进行服务需求挖掘时的权重更大,优化后的每组用户活动大数据的行为描述知识集,比如为已优化行为描述知识集。
进一步地,大数据挖掘系统可以是直接将用户需求联动知识与每组用户活动大数据的行为描述知识集进行组合,以实现知识优化处理,也可以是先对用户需求联动知识进行标准化等处理,将处理后用户需求联动知识,与每组用户活动大数据的行为描述知识集进行组合,以实现知识优化处理。
步骤104、对数字互联网用户报告包括的用户活动大数据中的每组用户活动大数据的已优化行为描述知识集进行服务需求挖掘,获得数字互联网用户报告的服务需求挖掘清单。
其中,大数据挖掘系统在获得已优化行为描述知识集之后,会对每组用户活动大数据的已优化行为描述知识集进行多元回归分析(比如分类处理),以确定业务需求事件的需求状态联动分析,从而确定出选定的数字互联网用户报告中所蕴藏的是哪类业务需求,获得服务需求挖掘清单。
可以理解的是,大数据挖掘系统可以调用AI神经网络来对每组用户活动大数据的已优化行为描述知识集进行处理,其中,AI神经网络是利用通过注释的包含不同业务需求的数字互联网用户报告样例调试好的神经网络,比如特征金字塔网络、残差网络、多层感知机等。
本申请实施例中,大数据挖掘系统首先可以对选定的数字互联网用户报告中的每组用户活动大数据的行为描述知识集进行知识提炼处理,获得可以反映行为描述知识集中存在用户需求的知识分布的业务需求描述字段,然后再将每组用户活动大数据的业务需求描述字段在持续的需求状态层面进行时序联动分析,获得能够对用户需求大数据的在状态和时间上的更新进行记载的用户需求联动知识,规避了在需求状态联动分析处理时对于大数据噪声的考虑,然后基于用户需求联动知识,对行为描述知识集进行知识优化处理,以将服务需求挖掘的侧重点转移到存在用户需求的知识分布,这样可以提高服务需求挖掘的精度和可信度。
对于一些可能的示例而言,对待挖掘数字互联网用户报告中的每组用户活动大数据的行为描述知识集进行知识提炼处理,获得每组用户活动大数据的业务需求描述字段,比如步骤101的示例性实现方式,可以包括步骤1011-步骤1012所描述的内容。
步骤1011、在选定的数字互联网用户报告中的每组用户活动大数据的行为描述知识集中确定局部需求关联知识分布,获得每组用户活动大数据的相对知识分布关系网。
在选定的数字互联网用户报告中,同时携带需求项目数据和需求状态变化数据。大数据挖掘系统可以通过对需求项目数据和需求状态变化数据进行特征挖掘,能够实现同时基于需求项目数据和需求状态变化数据来确定局部需求关联知识分布(需求信息对应的局部指示集),比如确定出业务需求事件所对应的信息集,获得相对知识分布关系网(比可以是业务需求事件的分布位置特征)。
可以理解的是,相对知识分布关系网的各个相对分布区域的知识特征,本质可以是每组用户活动大数据的各个相对分布区域存在业务需求的可能性,从而相对知识分布关系网对每组用户活动大数据的业务需求事件所对应的信息集进行了记载,这样,能够反映每组用户活动大数据中需要侧重处理、存在用户需求的知识分布,
步骤1012、结合相对知识分布关系网,对每组用户活动大数据的行为描述知识集进行局部需求关联知识分布的拼接,获得每组用户活动大数据的业务需求描述字段。
其中,大数据挖掘系统获得每组用户活动大数据所对应的相对知识分布关系网之后,从而确定每组用户活动大数据的用户需求大数据,进一步地,大数据挖掘系统会将相对知识分布关系网的各个相对分布区域,与每组用户活动大数据的行为描述知识集的每个相对分布区域进行关联,比如进行拼接,以从每组用户活动大数据的行为描述知识集中,筛选出可以反映业务需求事件的描述数组,该描述数组可以理解为业务需求描述字段。
可以理解的是,大数据挖掘系统可以结合相对知识分布关系网的各个相对分布区域的知识描述值(比如各个相对分布区域存在业务需求的可能性值),从每组用户活动大数据的行为描述知识集中,采样出存在业务需求可能性较大的相对分布区域,将行为描述知识集中这些相对分布区域的描述值,作为业务需求描述字段。大数据挖掘系统还可以结合相对知识分布关系网的各个相对分布区域的知识描述值在相对知识分布关系网全部相对分布区域的知识描述值之和的比例,从行为描述知识集中采样出用于确定描述值(特征值)的相对分布区域,将此相对分布区域的描述值作为业务需求描述字段。
举例而言,大数据挖掘系统先对用户活动大数据client data_i进行局部需求关联知识分布的确定,获得每组用户活动大数据client data_i所对应的相对知识分布关系网knowledge networks_i,然后再基于knowledge networks_i对client data_i进行局部需求关联知识分布的拼接,就获得了每组用户活动大数据对应的业务需求描述字段vector_i。
本申请实施例中,大数据挖掘系统能够先从每组用户活动大数据的行为描述知识集中定位出局部需求关联知识分布,获得相对知识分布关系网,然后将局部需求关联知识分布和行为描述知识集进行局部需求关联知识分布的拼接,获得每组用户活动大数据的业务需求描述字段,有助于之后确定用户需求联动知识。
对于一些可能的示例而言,在选定的数字互联网用户报告中的每组用户活动大数据的行为描述知识集中确定局部需求关联知识分布,获得与每组用户活动大数据的相对知识分布关系网,比如步骤1011的示例性实现方式,可以包括步骤1011a-步骤1011b所描述的内容。
步骤1011a、对选定的数字互联网用户报告中的每组用户活动大数据的行为描述知识集进行基于描述角度的知识处理,获得每组用户活动大数据的完成基于描述角度的知识处理的目标行为描述知识集。
鉴于大数据挖掘系统是在多个描述角度上对每组用户活动大数据进行特征挖掘的,从而每组用户活动大数据的需求项目数据所对应的知识散落在各个描述角度所对应的行为描述知识集中。由此,大数据挖掘系统会相对每组用户活动大数据的行为描述知识集进行基于描述角度的知识处理,通过基于描述角度的知识处理将各个描述角度的行为描述知识集拼接起来,比如进行描述角度精简,获得每组用户活动大数据所对应的目标行为描述知识集,以实现散落在各个描述角度的需求项目数据对应的知识的汇集处理。
其中,大数据挖掘系统可以利用DNN的特征挖掘层,来实现对行为描述知识集的基于描述角度的知识处理。此时,为了能够对行为描述知识集中的全部描述值(描述值可以理解为行为描述知识集的知识描述值)都能够记录,基于描述角度的知识处理时的特征挖掘层对应的特征挖掘单元的规模需要最小化,比如,将特征挖掘单元的大小设置为1*1;为了能够对各个描述角度的行为描述知识集进行拼接,基于描述角度的知识处理时特征挖掘层对应的描述角度数目(比如特征挖掘单元的数目)也应当少于每组用户活动大数据的行为描述知识集的描述角度数,比如,每组用户活动大数据的行为描述知识集的描述角度数为F时,可以将基于描述角度的知识处理时的特征挖掘层描述角度数设置为F/p(F/p大于1,p的数值灵活设置,比如为8),以实现各个描述角度的行为描述知识集的拼接。
在另一些示例下,大数据挖掘系统还可以直接将每组用户活动大数据的各个描述角度的行为描述知识集进行组合,以实现描述角度精简。
步骤1011b、对每组用户活动大数据的目标行为描述知识集与邻居用户活动大数据的知识集特征变量,进行专家知识挖掘,获得每组用户活动大数据的相对知识分布关系网。
专家知识挖掘(特征编码处理)包含了需求状态变化数据的特征提取和需求项目数据的特征提取。大数据挖掘系统对每组用户活动大数据对应的目标行为描述知识集和邻居用户活动大数据的目标行为描述知识集的知识集特征变量进行需求状态变化数据的特征提取和需求项目数据的特征提取,以将每组用户活动大数据的需求状态变化数据的特征知识和需求项目数据的特征知识,包含在每组用户活动大数据的相对知识分布关系网之中。
可以理解的是,大数据挖掘系统在对每组用户活动大数据对应的目标行为描述知识集进行需求状态变化数据的特征提取时,需要依附于每组用户活动大数据在时间先后层面上的邻居用户活动大数据所对应的目标行为描述知识集来实现;大数据挖掘系统在对每组用户活动大数据对应的目标行为描述知识集进行需求项目数据的特征提取时,仅需对每组用户活动大数据自身的目标行为描述知识集进行处理便可。
本申请实施例中,大数据挖掘系统能够先对每组用户活动大数据的行为描述知识集进行描述角度精简,然后对每组用户活动大数据的目标行为描述知识集与其的邻居用户活动大数据的目标行为描述知识集之间的特征插值进行专家知识挖掘,这样可以准确完整地确定出每组用户活动大数据的业务需求事件所对应的信息集,获得相对知识分布关系网。
对于一些可能的示例而言,对每组用户活动大数据的目标行为描述知识集与邻居用户活动大数据的知识集特征变量,进行专家知识挖掘,获得每组用户活动大数据的相对知识分布关系网,比如步骤1011b的示例性实现方式,可以包括:步骤201-步骤203所描述的内容。
步骤201、对每组用户活动大数据的邻居用户活动大数据对应的目标行为描述知识集,与每组用户活动大数据对应的目标行为描述知识集的知识集特征变量,进行滑动滤波操作,获得行为变化描述知识集。
步骤S201本质是对需求状态变化数据的特征提取。大数据挖掘系统先结合选定的数字互联网用户报告的时序,为每组用户活动大数据获取对应的邻居用户活动大数据,然后确定邻居用户活动大数据(相邻组的用户活动大数据)所对应的目标行为描述知识集和每组用户活动大数据对应的目标行为描述知识集的知识集特征变量,接着对知识集特征变量进行滑动滤波操作,滑动滤波操作结果可以理解为需求状态变化数据的知识提炼结果,从而获得了行为变化描述知识集。
可以理解的是,邻居用户活动大数据可以为每组用户活动大数据的下一组用户活动大数据,也可以为每组用户活动大数据的前一组用户活动大数据。大数据挖掘系统的特征挖掘单元的维度可以灵活设置为1*1或者2*2等。
步骤202、对每组用户活动大数据对应的目标行为描述知识集进行滑动滤波操作,获得需求项目描述知识集。
步骤202本质是对需求项目数据的特征提取。大数据挖掘系统对每组用户活动大数据对应的目标行为描述知识集进行分离式滑动滤波,将处理结果作为需求项目数据的知识提炼结果,就获得了需求项目描述知识集。
步骤203、将行为变化描述知识集和需求项目描述知识集进行拼接,获得相对知识分布关系网。
大数据挖掘系统将需求状态变化数据的知识提炼结果和需求项目数据的知识提炼结果进行拼接(融合),比如将行为变化描述知识集和需求项目描述知识集进行拼接,所获得的拼接结果可以是联动行为描述知识集。
可以理解的是,大数据挖掘系统可以通过加权和的思路实现拼接,也可以通过作乘的思路实现拼接,在此不作限定。
本申请实施例中,大数据挖掘系统可以对邻居用户活动大数据对应的目标行为描述知识集和每组用户活动大数据对应的目标行为描述知识集的知识集特征变量进行滑动滤波,并对每组用户活动大数据对应的目标行为描述知识集进行滑动滤波,将所获得的行为变化描述知识集和需求项目描述知识集拼接,获得相对知识分布关系网。
对于一些可能的示例而言,在对每组用户活动大数据对应的完成基于描述角度的知识处理的行为描述知识集进行滑动滤波操作,获得需求项目描述知识集之后,比如在步骤202之后,该方法还可以包括步骤204-步骤205所描述的内容。
步骤204、将行为变化描述知识集和需求项目描述知识集进行拼接,获得联动行为描述知识集。
步骤205、对联动行为描述知识集进行基于描述角度的知识处理,获得相对知识分布关系网。
本申请实施例中,大数据挖掘系统先将行为变化描述知识集和需求项目描述知识集拼接,将拼接所获得的行为描述知识集作为联动行为描述知识集,然后再通过基于描述角度的知识处理,再次对联动行为描述知识集的描述角度进行精简,以将不同描述角度的联动行为描述知识集,最终拼接到一个描述角度中,从而实现对不同描述角度的需求状态变化数据的特征和需求项目数据的特征的集中,获得每组用户活动大数据对应的相对知识分布关系网。
本申请实施例中的描述角度精简所使用的特征挖掘层的特征挖掘单元的规模可以灵活设置为1*1或者2*2等,也可以设置为3×3,特征挖掘层的描述角度数(特征挖掘单元的数目)则设置为1(比如将描述角度数从F/p变为1)。在另一些示例下,大数据挖掘系统还可以直接将各个描述角度的联动行为描述知识集组合在一起,以再次实现描述角度精简。
本申请实施例中,大数据挖掘系统先将需求项目描述知识集和行为变化描述知识集拼接为联动行为描述知识集,最后对联动行为描述知识集进行描述角度精简,以对不同描述角度的需求项目数据的特征和需求状态变化数据的特征拼接到一个描述角度中,获得相对知识分布关系网,以精准确定用户需求大数据。
对于一些可能的示例而言,结合相对知识分布关系网,对每组用户活动大数据的行为描述知识集进行局部需求关联知识分布的拼接,获得每组用户活动大数据的业务需求描述字段,比如步骤1012的示例性实现方式,可以包括步骤1012a-步骤1012b所描述的内容。
步骤1012a、对局部需求关联知识分布特征进行标准化操作。
步骤1021b、将标准化操作后的相对知识分布关系网与行为描述知识集拼接,获得每组用户活动大数据的业务需求描述字段。
大数据挖掘系统先利用相对知识分布关系网中每个相对分布区域的知识描述值,以及相对知识分布关系网的全部相对分布区域的知识描述值,来为每个相对分布区域确定出其为业务需求事件所对应的信息集的重要系数,这个确定过程可以理解为标准化的过程。然后,大数据挖掘系统将标准化操作后的相对知识分布关系网和行为描述知识集进行整合拼接,确定便可以获得每组用户活动大数据所对应的业务需求描述字段。
在一些示例下,大数据挖掘系统对相对知识分布关系网进行标准化时,可以是基于归一化计算思路实现,在此不作限定。
在另一些示例下,大数据挖掘系统还可以直接将相对知识分布关系网中的每个相对分布区域的知识描述值,与全部相对分布区域的知识描述值的和值相比,将所获得的占比作为每个相对分布区域对应的业务需求关联重要度。
本申请实施例中,大数据挖掘系统能够先对相对知识分布关系网进行标准化操作,然后再将标准化操作后的相对知识分布关系网与行为描述知识集的每个相对分布区域进行拼接,将拼接结果作为业务需求描述字段,有助于后续需求状态联动分析的准确性和可靠性。
对于一些可能的示例而言,对每组用户活动大数据的业务需求描述字段进行需求状态联动分析,获得每组用户活动大数据的用户需求联动知识,比如步骤102的示例性实现方式,可以包括步骤1021-步骤1023所描述的内容。
步骤1021、获取每组用户活动大数据的业务需求描述字段与邻居用户活动大数据的业务需求描述字段之间的特征关联系数。
大数据挖掘系统先对邻居用户活动大数据中的业务需求描述字段,与每组用户活动大数据的业务需求描述字段进行相关,获得邻居用户活动大数据中的业务需求描述字段与每组用户活动大数据的业务需求描述字段之间的特征关联系数(比如可以理解为相关度)。
可以理解的是,邻居用户活动大数据可以是每组用户活动大数据的前后的两组用户活动大数据,也可以是每组用户活动大数据的每组用户活动大数据的之前或之后的若干组用户活动大数据,比如每组用户活动大数据之前第3组用户活动大数据和每组用户活动大数据之后的第2组用户活动大数据,还可以是待挖掘数字互联网用户报告中的第1组用户活动大数据和最后1组用户活动大数据等。
在本申请中,邻居用户活动大数据包括:数字互联网用户报告中的全部组用户活动大数据或数字互联网用户报告中与每组用户活动大数据存在关联的设定数目组的用户活动大数据。
举例而言,大数据挖掘系统对每组用户活动大数据对应的业务需求描述字段vector_2在持续的需求状态层面进行时序联动分析时,比如,基于上述相关思路进行关联匹配,从而针对每组用户活动大数据可以获得用户需求联动知识mix vector_i。
步骤1022、基于特征关联系数对邻居用户活动大数据的业务需求描述字段进行整合。
大数据挖掘系统将特征关联系数作为影响系数,对邻居用户活动大数据的业务需求描述字段进行整合的第二向量运算结果,整合加权所获得的结果可以理解为主业务需求描述字段。
步骤1023、对完成整合的邻居用户活动大数据的主业务需求描述字段进行特征映射,获得每组用户活动大数据的用户需求联动知识。
进一步地,大数据挖掘系统再利用特征映射算法(通道映射算法),对所获得的主业务需求描述字段进行特征映射,将特征映射后的结果,作为每组用户活动大数据的用户需求联动知识。
本申请实施例中,大数据挖掘系统能够先对邻居用户活动大数据的业务需求描述字段和每组用户活动大数据的业务需求描述字段在时间先后层面上进行相关,然后在将特征关联系数作为影响系数,对邻居用户活动大数据的业务需求描述字段进行整合的第二向量运算结果,最后对整合加权所获得的主业务需求描述字段进行特征映射,从而确定业务需求事件所对应的信息集在状态和时间上的更新情况,获得用户需求联动知识。
对于一些可能的示例而言,所述邻居用户活动大数据包括:数字互联网用户报告中的全部组用户活动大数据或数字互联网用户报告中与每组用户活动大数据存在关联的设定数目组的用户活动大数据,基于此,对每组用户活动大数据的业务需求描述字段进行需求状态联动分析,获得每组用户活动大数据的所述用户需求联动知识,比如步骤102的示例性实现方式,可以包括步骤301-步骤303,或步骤304-步骤306所描述的内容。
步骤301、获取每组用户活动大数据的业务需求描述字段与全部组用户活动大数据的业务需求描述字段的特征关联系数。
步骤302、基于特征关联系数对全部组用户活动大数据的业务需求描述字段进行整合。
步骤303、对完成整合的全部组用户活动大数据的主业务需求描述字段进行特征映射,获得每组用户活动大数据的用户需求联动知识。
进一步地,当邻居用户活动大数据为选定的数字互联网用户报告中的全部用户活动大数据时,大数据挖掘系统会将待挖掘数字互联网用户报告中的全部用户活动大数据的业务需求描述字段,均与每组用户活动大数据的业务需求描述字段进行时间层面上的关联,然后再对时序关联特征进行描述角度变换,从而实现对每组用户活动大数据的业务需求描述字段的在整体上的需求状态联动分析。
大数据挖掘系统对每组用户活动大数据的业务需求描述字段进行时序关联处理,相当于对每组用户活动大数据的业务需求描述字段进行整体处理,以此大数据挖掘系统可以先对每组用户活动大数据的业务需求描述字段进行整体处理,然后再对整体处理所获得的结果进行描述角度变换,获得每组用户活动大数据的用户需求联动知识。
步骤304、获取每组用户活动大数据的业务需求描述字段与设定数目组的用户活动大数据的业务需求描述字段的特征关联系数。
步骤305、基于特征关联系数对设定数目组的用户活动大数据的业务需求描述字段进行整合。
步骤306、对完成整合的设定数目组的用户活动大数据的主业务需求描述字段进行特征映射,获得每组用户活动大数据的用户需求联动知识。
大数据挖掘系统还能够将与每组用户活动大数据存在关联的设定数目组的用户活动大数据的业务需求描述字段,以及每组用户活动大数据的业务需求描述字段相关,然后再与每组用户活动大数据存在关联的设定数目组的用户活动大数据的业务需求描述字段进行整合的第二向量运算结果,最后再对整合加权的结果进行特征映射,就完成了对业务需求描述字段在局部层面上的需求状态联动分析的过程,获得每组用户活动大数据的用户需求联动知识。
本申请实施例中,大数据挖掘系统可以结合邻居用户活动大数据的情况,从整体需求状态联动分析和阶段需求状态联动分析中,选择对每组用户活动大数据的业务需求描述字段进行需求状态联动分析的思路,从而能够综合确定每组用户活动大数据的用户需求联动知识。
对于一些可能的示例而言,对每组用户活动大数据的业务需求描述字段进行需求状态联动分析,获得每组用户活动大数据的用户需求联动知识,比如步骤102的示例性实现方式,可以包括步骤307-步骤308所描述的内容。
步骤307、获取每组用户活动大数据存在关联的设定数目组的用户活动大数据的业务需求描述字段。
步骤308、对每组用户活动大数据的业务需求描述字段进行线性滑动滤波操作,获得每组用户活动大数据的用户需求联动知识。
换言之,每组用户活动大数据的业务需求描述字段的需求状态联动分析的过程,可以利用一维滑动滤波来同步实现。大数据挖掘系统基于一个一维的特征挖掘单元来对由每组用户活动大数据的业务需求描述字段所组成的字段关系网进行滑动滤波,就可以代替需求状态联动分析过程中的特征关联系数计算、整合和特征映射的过程,获得每组用户活动大数据的用户需求联动知识,从而能够减少需求状态联动分析时的确定复杂性。
本申请实施例中,大数据挖掘系统可以将特征关联系数计算、整合和特征映射合并为一维滑动滤波过程,从而利用一维滑动滤波来获得每组用户活动大数据的用户需求联动知识,减少在确定用户需求联动知识时的确定复杂性。
对于一些可能的示例而言,结合用户需求联动知识,对每组用户活动大数据的行为描述知识集进行知识优化处理,获得每组用户活动大数据的已优化行为描述知识集,比如步骤103的示例性实现方式,可以包括步骤1031或步骤1032所描述的内容。
步骤1031、结合用户需求联动知识,对每组用户活动大数据的行为描述知识集进行知识优化处理,获得每组用户活动大数据的已优化行为描述知识集。
大数据挖掘系统会在获得每组用户活动大数据的用户需求联动知识时,将用户需求联动知识与每组用户活动大数据的行为描述知识集拼接在一起,获得已优化行为描述知识集,以使得每组用户活动大数据的行为描述知识集的业务需求事件所对应的信息集的时间特征变化、状态特征变化情况更加突出。
可以理解的是,大数据挖掘系统将用户需求联动知识与每组用户活动大数据的行为描述知识集拼接时,可以将用户需求联动知识变换为行为描述知识集,然后将变换获得的行为描述知识集与每组用户活动大数据的行为描述知识集进行组合;也可以是将用户需求联动知识直接与每组用户活动大数据的行为描述知识集进行的第一向量运算结果,从而实现拼接。
举例而言,大数据挖掘系统在对client data_i确定局部需求关联知识分布,然后结合相对知识分布关系网,对每组用户活动大数据的行为描述知识集进行局部需求关联知识分布的拼接,获得每组用户活动大数据对应的业务需求描述字段vector_i,并对业务需求描述字段vector_i在持续的需求状态层面进行时序联动分析,获得用户需求联动知识client mixdata_i之后,可以将client mixdata_i与client data_i通过作乘的思路进行拼接,从而获得已优化行为描述知识集。
步骤1032、结合相对知识分布关系网和用户需求联动知识,对每组用户活动大数据的行为描述知识集进行知识优化处理,获得每组用户活动大数据的已优化行为描述知识集。
在上述内容的基础上,大数据挖掘系统还可以同时利用相对知识分布关系网和用户需求联动知识,对每组用户活动大数据的行为描述知识集进行知识优化处理,从而获得对业务需求事件所对应的信息集和业务需求事件所对应的信息集在状态和时间上的更新情况皆可以反映的已优化行为描述知识集。
大数据挖掘系统可以先结合相对知识分布关系网,对用户需求联动知识恢复为行为描述知识集的模式,然后将恢复获得的行为描述知识集与每组用户活动大数据的行为描述知识集进行拼接,获得已优化行为描述知识集。大数据挖掘系统还可以直接将相对知识分布关系网与用户需求联动知识的第一向量运算结果,将所获得的乘积与每组用户活动大数据的行为描述知识集进行拼接,获得已优化行为描述知识集。
举例而言,大数据挖掘系统在对client data_i确定局部需求关联知识分布,然后结合相对知识分布关系网,对每组用户活动大数据的行为描述知识集进行局部需求关联知识分布的拼接,获得了每组用户活动大数据对应的业务需求描述字段vector_i,并对业务需求描述字段vector_i在持续的需求状态层面进行时序联动分析,获得用户需求联动知识client mixdata_i之后,可以对相对知识分布关系网knowledge networks_i进行标准化,利用标准化后的knowledge networks_i与用户需求联动知识client mixdata_i恢复为需求细节特征分布demand_i,再将其与client data_i拼接,获得已优化行为描述知识集。
本申请实施例中,大数据挖掘系统可以仅利用用户需求联动知识来对每组用户活动大数据的行为描述知识集进行特征强化,还可以同时利用相对知识分布关系网和业务需求描述字段,来对每组用户活动大数据的行为描述知识集进行特征强化,有助于后续利用特征强化后的已优化行为描述知识集来进行服务需求挖掘。
对于一些可能的示例而言,结合用户需求联动知识,对每组用户活动大数据的行为描述知识集进行知识优化处理,获得每组用户活动大数据的已优化行为描述知识集,比如步骤103的示例性实现方式,可以包括步骤1033-步骤1034所描述的内容。
步骤1033、对用户需求联动知识进行多元回归分析,获得需求细节特征分布。
为便于与每组用户活动大数据的行为描述知识集之间的确定,大数据挖掘系统对每组用户活动大数据的用户需求联动知识进行多元回归分析,以将用户需求联动知识恢复为行为描述知识集形式,所获得的行为描述知识集可以理解为需求细节特征分布。
步骤1034、将每组用户活动大数据的行为描述知识集和需求细节特征分布进行拼接,获得每组用户活动大数据的已优化行为描述知识集。
大数据挖掘系统可以将每组用户活动大数据的行为描述知识集和需求细节特征分布进行组合,并将组合之后的行为描述知识集,作为已优化行为描述知识集。或者大数据挖掘系统可以将每组用户活动大数据的行为描述知识集和需求细节特征分布进行的第一向量运算结果(相乘),将相乘所得的行为描述知识集,作为已优化行为描述知识集。
在一些示例下,对用户需求联动知识进行多元回归分析,获得需求细节特征分布,比如步骤1033的示例性实现方式,可以包括步骤1033a所描述的内容。
步骤1033a、结合相对知识分布关系网,对用户需求联动知识进行多元回归分析,获得需求细节特征分布。
本申请实施例中,大数据挖掘系统可以利用相对知识分布关系网,将用户需求联动知识恢复为需求细节特征分布,有助于后续需求细节特征分布与每组用户活动大数据的行为描述知识集进行拼接,获得进行知识优化处理之后的已优化行为描述知识集。
对于一些可能的示例而言,结合相对知识分布关系网,对用户需求联动知识进行多元回归分析,获得需求细节特征分布,比如步骤1033a的示例性实现方式,可以包括步骤401-步骤402所描述的内容。
步骤401、对相对知识分布关系网进行调整,获得的已调整知识分布关系网。
步骤402、基于用户需求联动知识与已调整知识分布关系网的第一向量运算结果,获得需求细节特征分布。
大数据挖掘系统可以先将相对知识分布关系网输入到RELU算法中,将RELU算法的输出作为已调整知识分布关系网,然后再将用户需求联动知识与已调整知识分布关系网的第一向量运算结果,所获得的乘积结果可以理解为需求细节特征分布。
对于一些可能的示例而言,结合相对知识分布关系网,对用户需求联动知识进行多元回归分析,获得需求细节特征分布,比如步骤1033a的示例性实现方式,可以包括步骤403-步骤404所描述的内容。
步骤403、对相对知识分布关系网进行量纲统一,获得目标知识分布关系网。
步骤404、基于用户需求联动知识与目标知识分布关系网的第二向量运算结果,从而获得需求细节特征分布。
大数据挖掘系统可以先对相对知识分布关系网输入进行标准化操作,然后将所获得的目标知识分布关系网,与用户需求联动知识相加,所获得的求和结果可以理解为需求细节特征分布。
本申请实施例中,大数据挖掘系统可以基于对相对知识分布关系网进行调整所获得的已调整知识分布关系网,实现对业务需求描述字段的多元回归分析,还可以基于对相对知识分布关系网进行量纲统一所获得的目标知识分布关系网,对业务需求描述字段的多元回归分析,从而丰富了对业务需求描述字段的多元回归分析的思路。
在一些示例中,大数据挖掘系统对初始数字互联网用户报告进行处理,获得选定的数字互联网用户报告,对选定的数字互联网用户报告中的每组用户活动大数据的行为描述知识集进行知识提炼处理,获得与每组用户活动大数据对应的业务需求描述字段。然后,大数据挖掘系统对每组用户活动大数据的业务需求描述字段进行需求状态联动分析,获得每组用户活动大数据的用户需求联动知识,再结合用户需求联动知识,对每组用户活动大数据的行为描述知识集进行知识优化处理,获得已优化行为描述知识集。最后,大数据挖掘系统对数字互联网用户报告包括的用户活动大数据中的每组用户活动大数据的已优化行为描述知识集进行服务需求挖掘,获得数字互联网用户报告的服务需求挖掘清单。
大数据挖掘系统通过对每组用户活动大数据的行为描述知识集进行级联的3层知识特征处理,使得大数据挖掘系统能够自适应确定出用户需求大数据,然后对用户需求大数据进行需求状态联动分析,从而提高需求状态联动分析处理的性能,提高升服务需求挖掘准确性和可靠性。
在一些可独立实施的设计思路下,在获得所述数字互联网用户报告的服务需求挖掘清单之后,该方法还可以包括如下内容:基于所述服务需求挖掘清单确定目标用户的大数据推荐方案;通过所述大数据推荐方案向所述目标用户的智慧业务设备进行大数据推荐。
举例而言,大数据推荐方案可以反映目标用户的推送时段偏好、推送方式偏好、推送内容偏好等,用于指导后续的大数据推荐,从而实现个性化且精准的数据推送处理,以准确迎合用户需求。
在一些可独立实施的设计思路下,基于所述服务需求挖掘清单确定目标用户的大数据推荐方案,可以包括如下内容:确定所述服务需求挖掘清单中目标需求主题对应的至少一个第一推送偏好向量;根据所述服务需求挖掘清单中的目标需求主题从参考推送记录中确定至少一个目标推送记录,其中所述目标推送记录具有第二推送偏好向量和对应的推送反馈分布,所述目标推送记录的第二推送偏好向量在所述推送反馈分布中具有对应的推送兴趣;根据所述至少一个第一推送偏好向量和所述目标推送记录的第二推送偏好向量,以及所述第二推送偏好向量在所述推送反馈分布中对应的推送兴趣,确定所述至少一个第一推送偏好向量在所述推送反馈分布中的目标推送兴趣;根据所述至少一个第一推送偏好向量在所述推送反馈分布中的目标推送兴趣确定所述服务需求挖掘清单对应的大数据推荐方案。如此设计,通过结合参考推送记录进行推送偏好和推送兴趣分析,能够得到至少一个第一推送偏好向量在所述推送反馈分布中的目标推送兴趣,从而可以准确、完整地定制个性化大数据推荐方案。
在一些可独立实施的设计思路下,所述方法还包括:确定至少一个参考推送记录,获取所述参考推送记录的至少一个第二推送偏好向量;对每个所述参考推送记录的第二推送偏好向量进行匹配,得到多个第二推送偏好向量组,每个所述第二推送偏好向量组中的至少一个所述第二推送偏好向量用于反映所述目标需求主题对应的相同区域;根据所述目标需求主题对应的多个所述第二推送偏好向量组确定所述参考推送记录对应的推送反馈分布,所述推送反馈分布中每一个推送兴趣点与一个所述第二推送偏好向量组中的至少一个所述第二推送偏好向量对应。
在一些可独立实施的设计思路下,所述根据所述服务需求挖掘清单中的目标需求主题从参考推送记录中确定至少一个目标推送记录,包括:确定每个所述参考推送记录对应的推荐指示;确定所述服务需求挖掘清单对应的原始推荐方案;根据所述服务需求挖掘清单的原始推荐方案和所述参考推送记录对应的推荐指示,从所述参考推送记录中确定所述至少一个目标推送记录。
在一些可独立实施的设计思路下,所述根据所述至少一个第一推送偏好向量和所述目标推送记录的第二推送偏好向量,以及所述第二推送偏好向量在所述推送反馈分布中对应的推送兴趣,确定所述至少一个第一推送偏好向量在所述推送反馈分布中的目标推送兴趣,包括:将所述服务需求挖掘清单与所述目标推送记录进行推送偏好向量匹配,得到每个所述第一推送偏好向量匹配的第二推送偏好向量;将每个所述第一推送偏好向量匹配的所述第二推送偏好向量在所述推送反馈分布中对应的推送兴趣确定为所述目标推送兴趣。
在一些可独立实施的设计思路下,所述根据所述至少一个第一推送偏好向量在所述推送反馈分布中的目标推送兴趣确定所述服务需求挖掘清单对应的大数据推荐方案,包括:根据所述至少一个第一推送偏好向量在所述推送反馈分布中的目标推送兴趣执行基于方案匹配的决策树分析,得到所述服务需求挖掘清单对应的大数据推荐方案。如此,可以借助决策树分析和方案匹配思路快速精准地确定大数据推荐方案。
图3是示出可以实现本申请的实施例的一种基于数字互联网的大数据挖掘方法的应用环境的架构示意图,一种基于数字互联网的大数据挖掘方法的应用环境中可以包括互相通信的大数据挖掘系统100和业务处理端200。基于此,大数据挖掘系统100和业务处理端200在运行时实现或者部分实现本申请实施例的一种基于数字互联网的大数据挖掘方法。
以上已经结合附图描述了本申请的实施例,至少具有如下有益效果:首先可以对选定的数字互联网用户报告中的每组用户活动大数据的行为描述知识集进行知识提炼处理,获得可以反映行为描述知识集中存在用户需求的知识分布的业务需求描述字段,然后再将每组用户活动大数据的业务需求描述字段在持续的需求状态层面进行时序联动分析,获得能够对用户需求大数据的在状态和时间上的更新进行记载的用户需求联动知识,规避了在需求状态联动分析处理时对于大数据噪声的考虑,然后基于用户需求联动知识,对行为描述知识集进行知识优化处理,以将服务需求挖掘的侧重点转移到存在用户需求的知识分布,这样可以提高服务需求挖掘的精度和可信度。
以上所述,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。

Claims (10)

1.一种基于数字互联网的大数据挖掘方法,其特征在于,应用于大数据挖掘系统,所述方法包括:
对选定的数字互联网用户报告中的每组用户活动大数据的行为描述知识集进行知识提炼处理,获得所述每组用户活动大数据的业务需求描述字段;
对所述每组用户活动大数据的所述业务需求描述字段进行需求状态联动分析,获得所述每组用户活动大数据的用户需求联动知识;
结合所述用户需求联动知识,对所述每组用户活动大数据的所述行为描述知识集进行知识优化处理,获得所述每组用户活动大数据的已优化行为描述知识集;
对所述数字互联网用户报告包括的用户活动大数据中的每组用户活动大数据的已优化行为描述知识集进行服务需求挖掘,获得所述数字互联网用户报告的服务需求挖掘清单。
2.根据权利要求1所述的方法,其特征在于,所述对选定的数字互联网用户报告中的每组用户活动大数据的行为描述知识集进行知识提炼处理,获得所述每组用户活动大数据的业务需求描述字段,包括:
在所述选定的数字互联网用户报告中的所述每组用户活动大数据的行为描述知识集中确定局部需求关联知识分布,获得所述每组用户活动大数据的相对知识分布关系网;
结合所述相对知识分布关系网,对所述每组用户活动大数据的所述行为描述知识集进行局部需求关联知识分布的拼接,获得所述每组用户活动大数据的业务需求描述字段;
其中,所述在所述选定的数字互联网用户报告中的所述每组用户活动大数据的行为描述知识集中确定局部需求关联知识分布,获得所述每组用户活动大数据的相对知识分布关系网,包括:
对所述选定的数字互联网用户报告中的每组用户活动大数据的行为描述知识集进行基于描述角度的知识处理,获得所述每组用户活动大数据的完成基于描述角度的知识处理的目标行为描述知识集;
对所述每组用户活动大数据的目标行为描述知识集与邻居用户活动大数据的知识集特征变量,进行专家知识挖掘,获得所述每组用户活动大数据的所述相对知识分布关系网;
其中,所述对所述每组用户活动大数据的目标行为描述知识集与邻居用户活动大数据的知识集特征变量,进行专家知识挖掘,获得所述每组用户活动大数据的所述相对知识分布关系网,包括:
对所述每组用户活动大数据的邻居用户活动大数据对应的目标行为描述知识集,与所述每组用户活动大数据对应的目标行为描述知识集的知识集特征变量,进行滑动滤波操作,获得行为变化描述知识集;
对所述每组用户活动大数据对应的目标行为描述知识集进行滑动滤波操作,获得需求项目描述知识集;
将所述行为变化描述知识集和所述需求项目描述知识集进行拼接,获得所述相对知识分布关系网;
其中,在所述对所述每组用户活动大数据对应的目标行为描述知识集进行滑动滤波操作,获得需求项目描述知识集之后,所述方法还包括:
将所述行为变化描述知识集和所述需求项目描述知识集进行拼接,获得联动行为描述知识集;
对所述联动行为描述知识集进行基于描述角度的知识处理,获得所述相对知识分布关系网。
3.根据权利要求2所述的方法,其特征在于,所述结合所述相对知识分布关系网,对所述每组用户活动大数据的所述行为描述知识集进行局部需求关联知识分布的拼接,获得所述每组用户活动大数据的业务需求描述字段,包括:
对所述相对知识分布关系网进行标准化操作;
将标准化操作后的相对知识分布关系网与所述行为描述知识集拼接,获得所述每组用户活动大数据的所述业务需求描述字段。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述对所述每组用户活动大数据的所述业务需求描述字段进行需求状态联动分析,获得所述每组用户活动大数据的用户需求联动知识,包括:
获取所述每组用户活动大数据的业务需求描述字段与邻居用户活动大数据的业务需求描述字段之间的特征关联系数,其中,所述邻居用户活动大数据包括:所述数字互联网用户报告中的全部组用户活动大数据或所述数字互联网用户报告中与所述每组用户活动大数据存在关联的设定数目组的用户活动大数据;
基于所述特征关联系数对所述邻居用户活动大数据的业务需求描述字段进行整合;
对完成整合的所述邻居用户活动大数据的主业务需求描述字段进行特征映射,获得所述每组用户活动大数据的所述用户需求联动知识。
5.根据权利要求4所述的方法,其特征在于,所述对所述每组用户活动大数据的所述业务需求描述字段进行需求状态联动分析,获得所述每组用户活动大数据的用户需求联动知识,包括:
获取与所述每组用户活动大数据存在关联的所述设定数目组的用户活动大数据的业务需求描述字段;
对所述每组用户活动大数据的业务需求描述字段进行线性滑动滤波操作,获得所述每组用户活动大数据的所述用户需求联动知识。
6.根据权利要求2至3任一项所述的方法,其特征在于,所述结合所述用户需求联动知识,对所述每组用户活动大数据的所述行为描述知识集进行知识优化处理,获得所述每组用户活动大数据的已优化行为描述知识集,包括以下其中一项:
结合所述用户需求联动知识,对所述每组用户活动大数据的所述行为描述知识集进行知识优化处理,获得所述每组用户活动大数据的已优化行为描述知识集;
结合所述相对知识分布关系网和所述用户需求联动知识,对所述每组用户活动大数据的所述行为描述知识集进行知识优化处理,获得所述每组用户活动大数据的已优化行为描述知识集。
7.根据权利要求1至3任一项所述的方法,其特征在于,所述结合所述用户需求联动知识,对所述每组用户活动大数据的所述行为描述知识集进行知识优化处理,获得所述每组用户活动大数据的已优化行为描述知识集,包括:
对所述用户需求联动知识进行多元回归分析,获得需求细节特征分布;
将所述每组用户活动大数据的所述行为描述知识集和所述需求细节特征分布进行拼接,获得所述每组用户活动大数据的已优化行为描述知识集;
其中,所述对所述用户需求联动知识进行多元回归分析,获得需求细节特征分布,包括:结合相对知识分布关系网,对所述用户需求联动知识进行多元回归分析,获得所述需求细节特征分布。
8.根据权利要求7所述的方法,其特征在于,所述结合相对知识分布关系网,对所述用户需求联动知识进行多元回归分析,获得所述需求细节特征分布,包括:
对所述相对知识分布关系网进行调整,获得已调整知识分布关系网;
基于所述用户需求联动知识与所述已调整知识分布关系网的第一向量运算结果,获得所述需求细节特征分布。
9.根据权利要求7所述的方法,其特征在于,所述结合相对知识分布关系网,对所述用户需求联动知识进行多元回归分析,获得所述需求细节特征分布,包括:
对所述相对知识分布关系网进行量纲统一,获得目标知识分布关系网;
基于所述用户需求联动知识与所述目标知识分布关系网的第二向量运算结果,获得所述需求细节特征分布。
10.一种大数据挖掘系统,其特征在于,包括:
用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现权利要求1-9中任一所述的方法的处理器。
CN202210888687.1A 2022-07-27 2022-07-27 基于数字互联网的大数据挖掘方法及系统 Withdrawn CN115222051A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210888687.1A CN115222051A (zh) 2022-07-27 2022-07-27 基于数字互联网的大数据挖掘方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210888687.1A CN115222051A (zh) 2022-07-27 2022-07-27 基于数字互联网的大数据挖掘方法及系统

Publications (1)

Publication Number Publication Date
CN115222051A true CN115222051A (zh) 2022-10-21

Family

ID=83613269

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210888687.1A Withdrawn CN115222051A (zh) 2022-07-27 2022-07-27 基于数字互联网的大数据挖掘方法及系统

Country Status (1)

Country Link
CN (1) CN115222051A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115982236A (zh) * 2022-12-23 2023-04-18 邓小东 一种应用于ai的大数据优化方法及服务器
CN117272398A (zh) * 2023-11-23 2023-12-22 聊城金恒智慧城市运营有限公司 基于人工智能的数据挖掘安全保护方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115982236A (zh) * 2022-12-23 2023-04-18 邓小东 一种应用于ai的大数据优化方法及服务器
CN115982236B (zh) * 2022-12-23 2023-08-22 海南益磊投资有限公司 一种应用于ai的大数据优化方法及服务器
CN117272398A (zh) * 2023-11-23 2023-12-22 聊城金恒智慧城市运营有限公司 基于人工智能的数据挖掘安全保护方法及系统
CN117272398B (zh) * 2023-11-23 2024-01-26 聊城金恒智慧城市运营有限公司 基于人工智能的数据挖掘安全保护方法及系统

Similar Documents

Publication Publication Date Title
CN111339433B (zh) 基于人工智能的信息推荐方法、装置、电子设备
CN115222051A (zh) 基于数字互联网的大数据挖掘方法及系统
CN109919685B (zh) 客户流失预测方法、装置、设备及计算机可读存储介质
CN111814977B (zh) 训练事件预测模型的方法及装置
CN111611488B (zh) 基于人工智能的信息推荐方法、装置、电子设备
CN112633962B (zh) 业务推荐方法、装置、计算机设备和存储介质
CN113536097B (zh) 基于自动特征分组的推荐方法及装置
CN111598238A (zh) 深度学习模型的压缩方法及装置
CN113743675B (zh) 一种云服务QoS深度学习预测模型的构建方法和系统
CN114880314B (zh) 应用人工智能策略的大数据清洗决策方法及ai处理系统
CN115310558B (zh) 针对云业务服务异常优化的大数据分析方法及ai分析系统
CN115470905A (zh) 一种大数据分析处理方法及系统
CN111652661B (zh) 一种手机客户端用户流失预警处理方法
US7251639B2 (en) System and method for feature selection in decision trees
CN110991601A (zh) 一种基于多用户行为的神经网络推荐方法
Yang et al. Hierarchical reinforcement learning for conversational recommendation with knowledge graph reasoning and heterogeneous questions
US9111213B2 (en) Method for constructing a tree of linear classifiers to predict a quantitative variable
CN112906883A (zh) 用于深度神经网络的混合精度量化策略确定方法和系统
CN116776006A (zh) 用于企业融资的客户画像构建方法及系统
CN117194219A (zh) 模糊测试用例生成与选择方法、装置、设备及介质
CN115759251A (zh) 一种决策树训练方法、装置、计算机设备以及存储介质
CN102117380B (zh) 简化基于矩阵的Boosting算法的系统及方法
CN110087230B (zh) 数据处理方法、装置、存储介质及电子设备
Zheng et al. Flow-by-flow traffic matrix prediction methods: Achieving accurate, adaptable, low cost results
CN114328169A (zh) 一种动态页面的测试方法及其系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20221021

WW01 Invention patent application withdrawn after publication