CN113392330A - 一种基于互联网行为的大数据处理方法及系统 - Google Patents
一种基于互联网行为的大数据处理方法及系统 Download PDFInfo
- Publication number
- CN113392330A CN113392330A CN202110944304.3A CN202110944304A CN113392330A CN 113392330 A CN113392330 A CN 113392330A CN 202110944304 A CN202110944304 A CN 202110944304A CN 113392330 A CN113392330 A CN 113392330A
- Authority
- CN
- China
- Prior art keywords
- mining
- data
- activity
- feedback
- strategy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006399 behavior Effects 0.000 title claims abstract description 117
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 238000005065 mining Methods 0.000 claims abstract description 269
- 230000000694 effects Effects 0.000 claims description 159
- 238000007418 data mining Methods 0.000 claims description 75
- 238000009826 distribution Methods 0.000 claims description 58
- 238000000034 method Methods 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 21
- 238000003860 storage Methods 0.000 claims description 20
- 230000001960 triggered effect Effects 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 2
- 230000015654 memory Effects 0.000 description 12
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种基于互联网行为的大数据处理方法及系统,通过对当前互联网行为大数据进行意图挖掘,获取所述当前互联网行为大数据的挖掘意图信息,根据所述当前互联网行为大数据的挖掘意图信息确定所述当前互联网行为大数据相关的互联网用户的意图知识图谱,根据所述互联网用户的意图知识图谱对所述互联网用户对应的终端设备进行互联网内容推送。如此,通过确定互联网用户的意图知识图谱以便于表达用户意图以及用户意图之间的关联关系,从而针对性地对所述互联网用户对应的终端设备进行互联网内容推送,可以提高推送的互联网内容的精确性和可靠性。
Description
技术领域
本发明涉及大数据技术领域,具体而言,涉及一种基于互联网行为的大数据处理方法及系统。
背景技术
信息应用是作为相关终端终端常规的应用,目前是用户量最大的互联网应用之一,当前互联网内容推送业务占据主导地位,主要包括通知类和营销类信息内容等。随着互联网的发展,结合富媒体消息、实时交互、一站式服务等提供消息的服务,将越来越多的互联网内容传播推送到用户。因此,如何保证推送的互联网内容的精确性和可靠性,是当前急需要解决的技术问题。
发明内容
为了至少克服现有技术中的上述不足,本发明的目的在于提供一种基于互联网行为的大数据处理方法及系统。
第一方面,本发明提供一种基于互联网行为的大数据处理方法,应用于互联网云端系统,所述方法包括:
对当前互联网行为大数据进行意图挖掘,获取所述当前互联网行为大数据的挖掘意图信息;
根据所述当前互联网行为大数据的挖掘意图信息确定所述当前互联网行为大数据相关的互联网用户的意图知识图谱;
根据所述互联网用户的意图知识图谱对所述互联网用户对应的终端设备进行互联网内容推送。
第二方面,本发明实施例还提供一种互联网云端系统,所述互联网云端系统包括处理器和机器可读存储介质,所述机器可读存储介质中存储有机器可执行指令,所述机器可执行指令由所述处理器加载并执行以实现前述的基于互联网行为的大数据处理方法。
根据上述任意一个方面,通过对当前互联网行为大数据进行意图挖掘,获取所述当前互联网行为大数据的挖掘意图信息,根据所述当前互联网行为大数据的挖掘意图信息确定所述当前互联网行为大数据相关的互联网用户的意图知识图谱,根据所述互联网用户的意图知识图谱对所述互联网用户对应的终端设备进行互联网内容推送。如此,通过确定互联网用户的意图知识图谱以便于表达用户意图以及用户意图之间的关联关系,从而针对性地对所述互联网用户对应的终端设备进行互联网内容推送,可以提高推送的互联网内容的精确性和可靠性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要启用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。
图1为本发明实施例提供的基于互联网行为的大数据处理方法的流程示意图;
图2为本发明实施例提供的用于实现上述的基于互联网行为的大数据处理方法的互联网云端系统的结构示意框图。
具体实施方式
以下描述是为了使本领域的普通技术人员能够实施和利用本发明,并且该描述是在特定的应用场景及其要求的环境下提供的。对于本领域的普通技术人员来讲,显然可以对所公开的实施例作出各种改变,并且在不偏离本发明的原则和范围的情况下,本发明中所定义的普遍原则可以适用于其它实施例和应用场景。因此,本发明并不限于所描述的实施例,而应该被给予与权利要求一致的最广泛的范围。
本发明中所使用的术语仅用于描述特定的示例性实施例,并不限制本发明的范围。如本发明使用的单数形式“一”、“一个”及“该”可以同样包括复数形式,除非上下文明确提示例外情形。还应当理解,如在本发明说明书中,术语“包括”、“包含”仅提示存在所述特征、整体、步骤、操作、组件和/或部件,但并不排除存在或添加一个或以上其它特征、整体、步骤、操作、组件、部件和/或其组合的情况。
根据以下对附图的描述,本发明的这些和其它的特征、特点以及相关结构元件的功能和操作方法,以及部件组合和制造经济性,可以变得更加显而易见,这些附图都构成本发明说明书的一部分。然而,应当理解的是,附图仅仅是为了说明和描述的目的,并不旨在限制本发明的范围。应当理解的是,附图并不是按比例绘制的。
本发明中使用了流程图用来说明根据本发明的一些实施例的系统所执行的操作。应当理解的是,流程图中的操作可以不按顺序执行。相反,可以按照倒序或同时处理各种步骤。此外,可以向流程图添加一个或以上其它操作。也可以从流程图中删除一个或以上操作。
下面结合说明书附图对本发明进行具体说明,方法实施例中的具体操作方法也可以应用于装置实施例或系统实施例中。
图1是本发明一种实施例提供的基于互联网行为的大数据处理方法的流程示意图,下面对该基于互联网行为的大数据处理方法进行详细介绍。
步骤S110,对当前互联网行为大数据进行意图挖掘,获取所述当前互联网行为大数据的挖掘意图信息;
步骤S120,根据所述当前互联网行为大数据的挖掘意图信息确定所述当前互联网行为大数据相关的互联网用户的意图知识图谱。
本实施例中,意图知识图谱可以用于表达多个不同的挖掘意图以及不同的挖掘意图之间的关联关系,例如不同挖掘意图之间的业务追随关系等。
步骤S130,根据所述互联网用户的意图知识图谱对所述互联网用户对应的终端设备进行互联网内容推送。
基于以上步骤,本实施例通过对当前互联网行为大数据进行意图挖掘,获取所述当前互联网行为大数据的挖掘意图信息,根据所述当前互联网行为大数据的挖掘意图信息确定所述当前互联网行为大数据相关的互联网用户的意图知识图谱,根据所述互联网用户的意图知识图谱对所述互联网用户对应的终端设备进行互联网内容推送。如此,通过确定互联网用户的意图知识图谱以便于表达用户意图以及用户意图之间的关联关系,从而针对性地对所述互联网用户对应的终端设备进行互联网内容推送,可以提高推送的互联网内容的精确性和可靠性。
一种可能的示例中,步骤S110可以通过以下示例性的步骤实现。
步骤S101,获取互联网内容推送服务触发的基础内容推送响应信息,从基础内容推送响应信息中获取基础数据挖掘活动,并从基础数据挖掘活动获取基础挖掘策略分布。
其中,基础内容推送响应信息用于响应挖掘基础数据挖掘活动。
步骤S102,搜寻基础挖掘策略分布中可进行挖掘策略共享的挖掘策略分布关联的挖掘策略中被用于执行挖掘所述目标活动类别属性的挖掘策略。
如果搜寻到可进行挖掘策略共享的挖掘策略分布关联的挖掘策略中存在挖掘策略被用于执行挖掘目标活动类别属性则进入步骤S103。
步骤S103,在基础数据挖掘活动中的基础挖掘策略分布上执行挖掘策略分布扩展,得到扩展数据挖掘活动。
扩展数据挖掘活动的活动类别属性为目标活动类别属性,基础数据挖掘活动和扩展数据挖掘活动的挖掘策略分布中的挖掘策略的业务节点不一致。
步骤S104,获取扩展数据挖掘活动和内容推送活动数据,并获取扩展数据挖掘活动中的扩展挖掘策略分布。
步骤S105,获取获取所述扩展数据挖掘活动中的挖掘策略分布中可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的实时冷门反馈度趋势值。
步骤S106,若存在目标挖掘策略的实时冷门反馈度趋势值小于目标趋势值,则在扩展数据挖掘活动中的挖掘策略分布上执行挖掘策略共享,得到共享数据挖掘活动,共享数据挖掘活动的活动类别属性为目标活动类别属性,所述共享数据挖掘活动中与目标挖掘策略对应的活动节点为启用态。
步骤S107,在当前触发的数据挖掘活动中的挖掘策略点与所述内容推送活动数据匹配条件下,将所述互联网内容推送服务触发的数据挖掘活动通过所述共享数据挖掘活动中挖掘策略分布中启用态的挖掘策略对当前互联网行为大数据进行挖掘,获得所述当前互联网行为大数据的挖掘意图信息。
基于以上步骤,可以在多个挖掘策略中获取适合的活动类别属性且实时冷门反馈度趋势值较低的挖掘策略对当前互联网行为大数据进行挖掘,确保互联网行为大数据挖掘的可靠性。
一种可能的示例中,步骤S102可以通过以下方式实现。
(1)获取触发的活动类别属性搜寻信息,其中,所述活动类别属性搜寻信息中包括有待搜寻挖掘策略的挖掘策略数据的活动类别属性序列。
(2)获取当前挖掘业务节点关联的挖掘范围内,与所述基础数据挖掘活动的活动类别属性序列匹配的信息对所述挖掘策略数据的活动类别属性序列的挖掘策略的影响参数,作为所述基础数据挖掘活动对所述挖掘策略数据的活动类别属性序列的影响系数。
(3)根据所述数据挖掘活动针对所述挖掘策略数据的活动类别属性序列的影响系数,确定所述基础数据挖掘活动的挖掘活动重要性参数。
(4)判断所述挖掘活动重要性参数是否小于目标重要性参数,若小于,判定所述基础数据挖掘活动符合活动类别属性搜寻要求,搜寻结论为可进行挖掘策略共享的挖掘策略分布关联的挖掘策略中存在挖掘策略被用于执行挖掘所述目标活动类别属性,否则,判定所述基础数据挖掘活动不符合活动类别属性搜寻要求,搜寻结论为可进行挖掘策略共享的挖掘策略分布关联的挖掘策略中不存在挖掘策略被用于执行挖掘所述目标活动类别属性。
根据所述数据挖掘活动针对所述挖掘策略数据的活动类别属性序列的影响系数,确定所述基础数据挖掘活动的挖掘活动重要性参数,包括:将所述基础数据挖掘活动针对挖掘策略数据的活动类别属性序列的影响系数与预设的数据挖掘活动影响系数之间的商,作为所述基础数据挖掘活动的挖掘活动重要性参数;
所述判断所述挖掘活动重要性参数是否小于目标重要性参数,包括:判断所述挖掘活动重要性参数是否小于目标重要性参数;其中,所述目标重要性参数为所述基础数据挖掘活动针对所述挖掘策略数据的活动类别属性序列的活动可影响系数与设定活动影响系数的商。
一种可能的示例中,所述基础挖掘策略分布中可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的挖掘策略数据的活动类别属性序列为至少一种,所述根据所述数据挖掘活动针对所述挖掘策略数据的活动类别属性序列的影响系数,确定所述基础数据挖掘活动的挖掘活动重要性参数,包括:
(1)计算所述基础数据挖掘活动针对所述挖掘策略数据的活动类别属性序列的挖掘策略的影响系数与目标挖掘权重的加权值;其中,所述目标挖掘权重为属于该挖掘策略数据的活动类别属性序列的挖掘策略的挖掘权重;
(2)根据加权值,确定所述基础数据挖掘活动在挖掘范围内的挖掘权重,作为所述基础数据挖掘活动的挖掘活动重要性参数。
所述判断所述挖掘活动重要性参数是否小于目标重要性参数,包括:判断所述基础数据挖掘活动的挖掘活动重要性参数是否小于挖掘策略的最大挖掘权重。
一种可能的示例中,步骤S105可以通过以下方式实现。
(1)获取可进行挖掘策略共享的挖掘策略分布关联的挖掘策略在多个历史推送过程获得的推送反馈数据,并获取所述可进行挖掘策略共享的挖掘策略分布关联的挖掘策略所推送的至少一个目标反馈行为数据的反馈行为数据信息和反馈行为数据标签。
(2)根据多个历史推送过程的推送反馈数据确定所述可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的反馈极性特征,其中,所述反馈极性特征代表所述可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的反馈极性变化。
(3)调用收敛的反馈意图分析网络对所述反馈极性特征进行处理,得到所述可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的反馈意图特征;其中,所述反馈意图特征为所述可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的反馈意图积极或者消极。
(4)若所述反馈意图特征为所述可进行挖掘策略共享的挖掘策略分布关联的反馈意图消极,则针对所述可进行挖掘策略共享的挖掘策略分布关联的挖掘策略所推送的每个目标反馈行为数据,根据所述目标反馈行为数据的反馈行为数据信息确定所述目标反馈行为数据是否为消极反馈行为数据;若是,则将所述消极反馈行为数据的反馈行为数据标签的趋势数量进行统计获得实时冷门反馈度趋势值。
一种可能的示例中,所述根据所述多个历史推送过程的推送反馈数据确定所述可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的反馈极性特征的步骤,可以包括:
(1)根据多个历史推送过程的推送反馈数据生成推送反馈热力单元;其中,所述推送反馈热力单元的热力统计成员为历史推送过程,所述推送反馈热力单元的热力单元数据为所述历史推送过程的推送反馈数据;
(2)对每个推送反馈热力单元进行反馈极性特征挖掘获得可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的反馈极性特征。
一种可能的示例中,所述根据所述目标反馈行为数据的反馈行为数据信息确定所述目标反馈行为数据是否为消极反馈行为数据,包括:
若所述反馈行为数据信息对应的互联网内容推送服务不在所述挖掘策略预设的反馈行为列表中,则确定所述目标反馈行为数据为消极反馈行为数据,若所述反馈行为数据信息在所述挖掘策略预设的反馈行为列表中,则确定所述目标反馈行为数据不为消极反馈行为数据;或者,若所述反馈行为数据信息在所述挖掘策略不预设的反馈行为列表中,则确定所述目标反馈行为数据为消极反馈行为数据,若所述反馈行为数据信息不在所述挖掘策略不预设的反馈行为列表中,则确定所述目标反馈行为数据不为消极反馈行为数据。
一种可能的示例中,对于步骤S120,例如可以获取所述当前互联网行为大数据的挖掘意图信息中每个挖掘意图以及不同挖掘意图之间的关联关系,根据每个挖掘意图以及不同挖掘意图之间的关联关系构建所述当前互联网行为大数据相关的互联网用户的意图知识图谱。
譬如在一种可能的示例中,对于步骤S130,在根据所述互联网用户的意图知识图谱对所述互联网用户对应的终端设备进行互联网内容推送的过程中,例如可以基于所述互联网用户对相关推广业务的意图知识图谱获取目标候选推送内容被配置到热搜页面下在热搜关系网络中所对应的热搜关系内容数据,得到第一热搜关系内容数据;根据相关推广业务从每一种推送数据源中识别到的热搜关系内容数据得到第二热搜关系内容数据;当通过所述相关推广业务解析到当前意图知识点后,根据所述第一热搜关系内容数据及所述第二热搜关系内容数据中的热搜关系内容数据,确定所述目标候选推送内容的推送内容热度信息是否存在预设范围之外的浮动;若所述目标候选推送内容的推送内容热度信息未存在预设范围之外的浮动,则通过所述相关推广业务的意图知识图谱配置推送任务;若所述目标候选推送内容的推送内容热度信息存在预设范围之外的浮动,则对所述热搜关系内容数据对应的推送数据源进行内容更新,得到目标推送数据源,并基于所述目标推送数据源和相关推广业务的意图知识图谱配置推送任务,基于所述推送任务对所述互联网用户对应的终端设备进行互联网内容推送。
图2示出了本发明实施例提供的用于实现上述的基于互联网行为的大数据处理方法的互联网云端系统100的硬件结构意图,如图2所示,互联网云端系统100可包括处理器110、机器可读存储介质120、总线130以及通信单元140。
在一些实施例中,互联网云端系统100可以是单个服务器,也可以是服务器组。所述服务器组可以是集中式的,也可以是分布式的(例如,互联网云端系统100可以是分布式的系统)。在一些实施例中,互联网云端系统100可以是本地的,也可以是远程的。例如,互联网云端系统100可以经由网络访问存储于机器可读存储介质120中的信息和/或数据。又例如,互联网云端系统100可以直接连接到机器可读存储介质120以访问存储的信息和/或数据。在一些实施例中,互联网云端系统100可以在云平台上实施。仅作为示例,该云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。
机器可读存储介质120可以储存数据和/或指令。在一些实施例中,机器可读存储介质120可以存储从外部终端获取的数据。在一些实施例中,机器可读存储介质120可以储存互联网云端系统100用来执行或使用来完成本发明中描述的示例性方法的数据及/或指令。在一些实施例中,机器可读存储介质120可包括大容量存储器、可移动存储器、易失性读写存储器、只读存储器(ROM)等或其任意组合。示例性的大容量存储器可以包括磁盘、光盘、固态磁盘等。示例性可移动存储器可以包括闪存驱动器、软盘、光盘、存储卡、压缩盘、磁带等。示例性易失性读写存储器可以包括随机存取内存(RAM)。示例性RAM可包括主动随机存取存储器(DRAM)、双倍数据速率同步主动随机存取存储器(DDR SDRAM)、被动随机存取存储器(SRAM)、晶闸管随机存取存储器(T-RAM)和零电容随机存取存储器(Z-RAM)等。示例性只读存储器可以包括掩模型只读存储器(MROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(PEROM)、电可擦除可编程只读存储器(EEPROM)、光盘只读存储器(CD-ROM)和数字多功能磁盘只读存储器等。在一些实施例中,机器可读存储介质120可以在云平台上实现。仅作为示例,云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云,多层云等,或其任意组合。
在具体实现过程中,至少一个处理器110执行机器可读存储介质120存储的计算机可执行指令,使得处理器110可以执行如上方法实施例的基于互联网行为的大数据处理方法,处理器110、机器可读存储介质120以及通信单元140通过总线130连接,处理器110可以用于控制通信单元140的收发动作。
处理器110的具体实现过程可参见上述互联网云端系统100执行的各个方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
此外,本发明实施例还提供一种可读存储介质,所述可读存储介质中预设有计算机可执行指令,当处理器执行所述计算机可执行指令时,实现如上基于互联网行为的大数据处理方法。
应当理解的是,以上描述仅出于说明的目的,并不旨在限制本发明的范围。对于本领域的普通技术人员来说,可以根据本发明的描述,做出多种修改和变化。然而,这些修改和变化不会背离本发明的范围。
上文已对基本概念做了描述,显然,对于阅读此申请后的本领域的普通技术人员来说,上述发明公开仅作为示例,并不构成对本发明的限制。虽然此处并没有明确说明,本领域技术人员可能会对本发明进行各种修改、改进和修正。该类修改、改进和修正在本发明中被建议,所以该类修改、改进、修正仍属于本发明示范实施例的精神和范围。
同时,本发明使用了特定词语来描述本发明的实施例。例如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本发明至少一个实施例相关的某一特征、结构或特性。因此,应当强调并注意的是,本说明书中在不同位置两次或以上提及的“一实施例”或“一个实施例”或“一替代性实施例”并不一定系指同一实施例。此外,本发明的一个或以上实施例中的某些特征、结构或特性可以进行适当的组合。
此外,本领域的普通技术人员可以理解,本发明的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的过程、机器、产品或物质的组合,或对其任何新的和有用的改良。相应地,本发明的各个方面可以完全由硬件执行、可以完全由软件(包括韧体、常驻软件、微代码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“单元”、“模块”或“系统”。此外,本发明公开的各方面可以采取体现在一个或以上计算机可读介质中的计算机程序产品的形式,其中计算机可读程序代码包含在其中。
计算机可读信号介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。此类传播信号可以有多种形式,包括电磁形式、光形式等或任何合适的组合形式。计算机可读信号介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机可读信号介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质等或其任意组合。
本发明各部分操作所需的计算机程序编码可以用任意一种或以上程序语言编写,包括面向持续活动编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,主动编程语言如Python、Ruby和Groovy,或其它编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本发明所述处理元素和序列的顺序、数字字母的使用、或其它名称的使用,并非用于限定本发明流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本发明实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本发明披露的表述,从而帮助对一个或以上发明实施例的理解,前文对本发明实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。同理,应当注意的是,为了简化本发明披露的表述,从而帮助对一个或以上发明实施例的理解,前文对本发明实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。
Claims (9)
1.一种基于互联网行为的大数据处理方法,其特征在于,应用于互联网云端系统,所述方法包括:
对当前互联网行为大数据进行意图挖掘,获取所述当前互联网行为大数据的挖掘意图信息;
获取所述当前互联网行为大数据的挖掘意图信息中每个挖掘意图以及不同挖掘意图之间的关联关系;
根据每个挖掘意图以及不同挖掘意图之间的关联关系构建所述当前互联网行为大数据相关的互联网用户的意图知识图谱;
根据所述互联网用户的意图知识图谱对所述互联网用户对应的终端设备进行互联网内容推送;
其中,所述根据所述互联网用户的意图知识图谱对所述互联网用户对应的终端设备进行互联网内容推送的步骤,包括:
基于所述互联网用户对相关推广业务的意图知识图谱获取目标候选推送内容被配置到热搜页面下在热搜关系网络中所对应的热搜关系内容数据,得到第一热搜关系内容数据;
根据相关推广业务从每一种推送数据源中识别到的热搜关系内容数据得到第二热搜关系内容数据;
当通过所述相关推广业务解析到当前意图知识点后,根据所述第一热搜关系内容数据及所述第二热搜关系内容数据中的热搜关系内容数据,确定所述目标候选推送内容的推送内容热度信息是否存在预设范围之外的浮动;
若所述目标候选推送内容的推送内容热度信息未存在预设范围之外的浮动,则通过所述相关推广业务的意图知识图谱配置推送任务;
若所述目标候选推送内容的推送内容热度信息存在预设范围之外的浮动,则对所述热搜关系内容数据对应的推送数据源进行内容更新,得到目标推送数据源,并基于所述目标推送数据源和相关推广业务的意图知识图谱配置推送任务,基于所述推送任务对所述互联网用户对应的终端设备进行互联网内容推送。
2.根据权利要求1所述的基于互联网行为的大数据处理方法,其特征在于,所述对当前互联网行为大数据进行意图挖掘,获取所述当前互联网行为大数据的挖掘意图信息的步骤,包括:
获取互联网内容推送服务触发的基础内容推送响应信息,从基础内容推送响应信息中获取基础数据挖掘活动,并从基础数据挖掘活动获取基础挖掘策略分布,所述基础内容推送响应信息用于响应挖掘基础数据挖掘活动,所述基础数据挖掘活动的活动类别属性为目标活动类别属性,所述基础挖掘策略分布包括可进行挖掘策略共享的挖掘策略分布;
搜寻所述基础挖掘策略分布中可进行挖掘策略共享的挖掘策略分布关联的挖掘策略中被用于执行挖掘所述目标活动类别属性的挖掘策略;
如果搜寻到可进行挖掘策略共享的挖掘策略分布关联的挖掘策略中存在挖掘策略被用于执行挖掘所述目标活动类别属性,在所述基础数据挖掘活动中的所述基础挖掘策略分布上执行挖掘策略分布扩展,得到扩展数据挖掘活动,所述扩展数据挖掘活动的活动类别属性为所述目标活动类别属性,所述基础数据挖掘活动和所述扩展数据挖掘活动的挖掘策略分布中的挖掘策略的业务节点不一致;
获取所述扩展数据挖掘活动和内容推送活动数据,所述扩展数据挖掘活动的挖掘策略分布中还涵盖用于表达内容推送活动数据的挖掘策略点;
获取所述扩展数据挖掘活动中的挖掘策略分布中可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的实时冷门反馈度趋势值;
若存在目标挖掘策略的实时冷门反馈度趋势值小于目标趋势值,则在所述扩展数据挖掘活动中的挖掘策略分布上执行所述挖掘策略共享,得到共享数据挖掘活动,其中,所述共享数据挖掘活动的活动类别属性为所述目标活动类别属性,所述共享数据挖掘活动中与目标挖掘策略对应的活动节点为启用态;
在当前触发的数据挖掘活动中的挖掘策略点与所述内容推送活动数据匹配条件下,将所述互联网内容推送服务触发的数据挖掘活动通过所述共享数据挖掘活动中挖掘策略分布中启用态的挖掘策略对当前互联网行为大数据进行挖掘,获得所述当前互联网行为大数据的挖掘意图信息。
3.根据权利要求2所述的基于互联网行为的大数据处理方法,其特征在于,所述搜寻所述基础挖掘策略分布中可进行挖掘策略共享的挖掘策略分布关联的挖掘策略中被用于执行挖掘所述目标活动类别属性的挖掘策略的步骤,包括:
获取触发的活动类别属性搜寻信息,其中,所述活动类别属性搜寻信息中包括有待搜寻挖掘策略的挖掘策略数据的活动类别属性序列;
获取当前挖掘业务节点关联的挖掘范围内,与所述基础数据挖掘活动的活动类别属性序列匹配的信息对所述挖掘策略数据的活动类别属性序列的挖掘策略的影响参数,作为所述基础数据挖掘活动对所述挖掘策略数据的活动类别属性序列的影响系数;
根据所述数据挖掘活动针对所述挖掘策略数据的活动类别属性序列的影响系数,确定所述基础数据挖掘活动的挖掘活动重要性参数;
判断所述挖掘活动重要性参数是否小于目标重要性参数,若小于,判定所述基础数据挖掘活动符合活动类别属性搜寻要求,搜寻结论为可进行挖掘策略共享的挖掘策略分布关联的挖掘策略中存在挖掘策略被用于执行挖掘所述目标活动类别属性,否则,判定所述基础数据挖掘活动不符合活动类别属性搜寻要求,搜寻结论为可进行挖掘策略共享的挖掘策略分布关联的挖掘策略中不存在挖掘策略被用于执行挖掘所述目标活动类别属性信息。
4.根据权利要求3所述的基于互联网行为的大数据处理方法,其特征在于,所述基础挖掘策略分布中可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的挖掘策略数据的活动类别属性序列为一种;
所述根据所述数据挖掘活动针对所述挖掘策略数据的活动类别属性序列的影响系数,确定所述基础数据挖掘活动的挖掘活动重要性参数,包括:
将所述基础数据挖掘活动针对挖掘策略数据的活动类别属性序列的影响系数与预设的数据挖掘活动影响系数之间的商,作为所述基础数据挖掘活动的挖掘活动重要性参数;
所述判断所述挖掘活动重要性参数是否小于目标重要性参数,包括:
判断所述挖掘活动重要性参数是否小于目标重要性参数;所述目标重要性参数为所述基础数据挖掘活动针对所述挖掘策略数据的活动类别属性序列的活动可影响系数与设定活动影响系数的商。
5.根据权利要求3所述的基于互联网行为的大数据处理方法,其特征在于,所述基础挖掘策略分布中可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的挖掘策略数据的活动类别属性序列为至少一种;
所述根据所述数据挖掘活动针对所述挖掘策略数据的活动类别属性序列的影响系数,确定所述基础数据挖掘活动的挖掘活动重要性参数,包括:
计算所述基础数据挖掘活动针对所述挖掘策略数据的活动类别属性序列的挖掘策略的影响系数与目标挖掘权重的加权值;其中,所述目标挖掘权重为属于该挖掘策略数据的活动类别属性序列的挖掘策略的挖掘权重;
根据加权值,确定所述基础数据挖掘活动在挖掘范围内的挖掘权重,作为所述基础数据挖掘活动的挖掘活动重要性参数;
所述判断所述挖掘活动重要性参数是否小于目标重要性参数,包括:
判断所述基础数据挖掘活动的挖掘活动重要性参数是否小于挖掘策略的最大挖掘权重。
6.根据权利要求2所述的基于互联网行为的大数据处理方法,其特征在于,所述获取所述扩展数据挖掘活动中的挖掘策略分布中可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的实时冷门反馈度趋势值的步骤,包括:
获取可进行挖掘策略共享的挖掘策略分布关联的挖掘策略在多个历史推送过程获得的推送反馈数据,并获取所述可进行挖掘策略共享的挖掘策略分布关联的挖掘策略所推送的至少一个目标反馈行为数据的反馈行为数据信息和反馈行为数据标签;
根据多个历史推送过程的推送反馈数据确定所述可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的反馈极性特征,其中,所述反馈极性特征代表所述可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的反馈极性变化;
调用收敛的反馈意图分析网络对所述反馈极性特征进行处理,得到所述可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的反馈意图特征;其中,所述反馈意图特征为所述可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的反馈意图积极或者消极;
若所述反馈意图特征为所述可进行挖掘策略共享的挖掘策略分布关联的反馈意图消极,则针对所述可进行挖掘策略共享的挖掘策略分布关联的挖掘策略所推送的每个目标反馈行为数据,根据所述目标反馈行为数据的反馈行为数据信息确定所述目标反馈行为数据是否为消极反馈行为数据;
若是,则将所述消极反馈行为数据的反馈行为数据标签的趋势数量进行统计获得实时冷门反馈度趋势值。
7.根据权利要求6所述的基于互联网行为的大数据处理方法,其特征在于,所述根据多个历史推送过程的推送反馈数据确定所述可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的反馈极性特征的步骤,包括:
根据多个历史推送过程的推送反馈数据生成推送反馈热力单元;其中,所述推送反馈热力单元的热力统计成员为历史推送过程,所述推送反馈热力单元的热力单元数据为所述历史推送过程的推送反馈数据;
对每个推送反馈热力单元进行反馈极性特征挖掘获得可进行挖掘策略共享的挖掘策略分布关联的挖掘策略的反馈极性特征。
8.根据权利要求6所述的基于互联网行为的大数据处理方法,其特征在于,所述根据所述目标反馈行为数据的反馈行为数据信息确定所述目标反馈行为数据是否为消极反馈行为数据,包括:
若所述反馈行为数据信息对应的互联网内容推送服务不在所述挖掘策略预设的反馈行为列表中,则确定所述目标反馈行为数据为消极反馈行为数据,若所述反馈行为数据信息在所述挖掘策略预设的反馈行为列表中,则确定所述目标反馈行为数据不为消极反馈行为数据;或者,若所述反馈行为数据信息在所述挖掘策略不预设的反馈行为列表中,则确定所述目标反馈行为数据为消极反馈行为数据,若所述反馈行为数据信息不在所述挖掘策略不预设的反馈行为列表中,则确定所述目标反馈行为数据不为消极反馈行为数据。
9.一种互联网云端系统,其特征在于,所述互联网云端系统包括处理器和机器可读存储介质,所述机器可读存储介质中存储有机器可执行指令,所述机器可执行指令由所述处理器加载并执行以实现权利要求1-8中任意一项的基于互联网行为的大数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110944304.3A CN113392330B (zh) | 2021-08-17 | 2021-08-17 | 一种基于互联网行为的大数据处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110944304.3A CN113392330B (zh) | 2021-08-17 | 2021-08-17 | 一种基于互联网行为的大数据处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113392330A true CN113392330A (zh) | 2021-09-14 |
CN113392330B CN113392330B (zh) | 2021-10-26 |
Family
ID=77622699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110944304.3A Expired - Fee Related CN113392330B (zh) | 2021-08-17 | 2021-08-17 | 一种基于互联网行为的大数据处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113392330B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114661994A (zh) * | 2022-03-28 | 2022-06-24 | 徐勇 | 基于人工智能的用户兴趣数据处理方法、系统及云平台 |
CN114817747A (zh) * | 2022-05-25 | 2022-07-29 | 铜仁市恒盛网络科技有限公司 | 基于互联网大数据的用户行为分析方法及云计算业务系统 |
CN114896502A (zh) * | 2022-05-23 | 2022-08-12 | 天津市邦泽科技有限公司 | 应用ai和大数据分析的用户需求决策方法及互联网系统 |
CN115270003A (zh) * | 2022-09-27 | 2022-11-01 | 创域智能(常熟)网联科技有限公司 | 一种基于物联网平台行为数据挖掘的信息推荐方法及系统 |
CN115718846A (zh) * | 2022-12-22 | 2023-02-28 | 云南炳暖蔡网络科技有限公司 | 用于智能化交互网络的大数据挖掘方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105243124A (zh) * | 2015-09-29 | 2016-01-13 | 百度在线网络技术(北京)有限公司 | 资源组合处理方法及装置 |
WO2017172654A1 (en) * | 2016-03-30 | 2017-10-05 | Microsoft Technology Licensing, Llc | Making a dialogue available to an autonomous software agent |
CN108345663A (zh) * | 2018-02-02 | 2018-07-31 | 新华智云科技有限公司 | 一种新闻推送方法及设备 |
CN108804633A (zh) * | 2018-06-01 | 2018-11-13 | 腾讯科技(深圳)有限公司 | 基于行为语义知识网络的内容推荐方法 |
CN111125524A (zh) * | 2019-12-20 | 2020-05-08 | 四川文轩教育科技有限公司 | 基于知识图谱的数据分析与数据推送方法 |
-
2021
- 2021-08-17 CN CN202110944304.3A patent/CN113392330B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105243124A (zh) * | 2015-09-29 | 2016-01-13 | 百度在线网络技术(北京)有限公司 | 资源组合处理方法及装置 |
WO2017172654A1 (en) * | 2016-03-30 | 2017-10-05 | Microsoft Technology Licensing, Llc | Making a dialogue available to an autonomous software agent |
CN108345663A (zh) * | 2018-02-02 | 2018-07-31 | 新华智云科技有限公司 | 一种新闻推送方法及设备 |
CN108804633A (zh) * | 2018-06-01 | 2018-11-13 | 腾讯科技(深圳)有限公司 | 基于行为语义知识网络的内容推荐方法 |
CN111125524A (zh) * | 2019-12-20 | 2020-05-08 | 四川文轩教育科技有限公司 | 基于知识图谱的数据分析与数据推送方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114661994A (zh) * | 2022-03-28 | 2022-06-24 | 徐勇 | 基于人工智能的用户兴趣数据处理方法、系统及云平台 |
CN114661994B (zh) * | 2022-03-28 | 2022-10-14 | 中软数智信息技术(武汉)有限公司 | 基于人工智能的用户兴趣数据处理方法、系统及云平台 |
CN114896502A (zh) * | 2022-05-23 | 2022-08-12 | 天津市邦泽科技有限公司 | 应用ai和大数据分析的用户需求决策方法及互联网系统 |
CN114817747A (zh) * | 2022-05-25 | 2022-07-29 | 铜仁市恒盛网络科技有限公司 | 基于互联网大数据的用户行为分析方法及云计算业务系统 |
CN114817747B (zh) * | 2022-05-25 | 2022-11-15 | 逑美科技(上海)有限公司 | 基于互联网大数据的用户行为分析方法及云计算业务系统 |
CN115270003A (zh) * | 2022-09-27 | 2022-11-01 | 创域智能(常熟)网联科技有限公司 | 一种基于物联网平台行为数据挖掘的信息推荐方法及系统 |
CN115718846A (zh) * | 2022-12-22 | 2023-02-28 | 云南炳暖蔡网络科技有限公司 | 用于智能化交互网络的大数据挖掘方法及系统 |
CN115718846B (zh) * | 2022-12-22 | 2023-10-27 | 北京国联视讯信息技术股份有限公司 | 用于智能化交互网络的大数据挖掘方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113392330B (zh) | 2021-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113392330B (zh) | 一种基于互联网行为的大数据处理方法及系统 | |
RU2611966C2 (ru) | Рекомендательная система для пополнения данных | |
US10712915B2 (en) | Information presentation using a client on a terminal | |
CN109492053B (zh) | 用于访问数据的方法和装置 | |
CN107103011B (zh) | 终端数据搜索的实现方法和装置 | |
CN113689292B (zh) | 基于图像背景识别的用户聚集识别方法及系统 | |
CN107480205B (zh) | 一种进行数据分区的方法和装置 | |
US9355270B2 (en) | Security configuration systems and methods for portal users in a multi-tenant database environment | |
US20200364211A1 (en) | Predictive database index modification | |
CN113285960B (zh) | 一种服务数据共享云平台的数据加密方法及系统 | |
CN111694639A (zh) | 进程容器地址的更新方法、装置和电子设备 | |
CN114626092A (zh) | 具有关联关系的多字段数据的脱敏方法、系统、装置及计算机存储介质 | |
CN113435948B (zh) | 一种电商平台数据监测方法及系统 | |
CN112579877B (zh) | 信源系统的控制方法、装置、存储介质和设备 | |
CN115174158B (zh) | 基于多云管理平台的云产品配置检查方法 | |
CN113868544A (zh) | 一种智能化业务档案处理方法及业务服务器 | |
CN106325925A (zh) | 一种浏览器业务信息更新方法及装置 | |
US20230412731A1 (en) | Automated interactive voice response interaction using voice prompt classification machine learning frameworks | |
US11645283B2 (en) | Predictive query processing | |
CN118034822A (zh) | 页面处理方法、装置、设备和存储介质 | |
CN116304079A (zh) | 基于时序的图谱数据管理方法、设备和可读存储介质 | |
CN114691630A (zh) | 一种智慧供应链大数据共享方法及系统 | |
CN115454781A (zh) | 基于企业架构系统的数据可视化展现方法及系统 | |
CN110555053B (zh) | 用于输出信息的方法和装置 | |
CN113722007A (zh) | Vpn分支设备的配置方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20211026 |
|
CF01 | Termination of patent right due to non-payment of annual fee |