CN112839102A - 应用于大数据画像推送的业务处理方法及机器学习服务器 - Google Patents

应用于大数据画像推送的业务处理方法及机器学习服务器 Download PDF

Info

Publication number
CN112839102A
CN112839102A CN202110157165.XA CN202110157165A CN112839102A CN 112839102 A CN112839102 A CN 112839102A CN 202110157165 A CN202110157165 A CN 202110157165A CN 112839102 A CN112839102 A CN 112839102A
Authority
CN
China
Prior art keywords
service
target
data
description information
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110157165.XA
Other languages
English (en)
Inventor
葛天齐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110157165.XA priority Critical patent/CN112839102A/zh
Publication of CN112839102A publication Critical patent/CN112839102A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开实施例提供一种应用于大数据画像推送的业务处理方法及机器学习服务器,由于使用了预设画像场景描述信息和表征目标业务项目数据的画像场景特征和/或画像扩展特征的第一描述信息,大大提高了在目标业务画像场景信息中提取目标数据挖掘类型的准确性,另一方面在对第一描述信息和第二描述信息进行映射处理时的业务处理速度较快,因此,也便于快速确定目标业务画像场景信息中的目标数据挖掘类型,提高后续数据挖掘效率。

Description

应用于大数据画像推送的业务处理方法及机器学习服务器
技术领域
本公开涉及大数据技术领域,示例性地,涉及一种应用于大数据画像推送的业务处理方法及机器学习服务器。
背景技术
随着5G网络通信技术的崛起,互联网的流量时代已经结束,互联网技术的发展已经过渡到了大数据算法时代,随之而来的基于大数据和算法的精准推送(内容或商品等),也在用户生活中的各个领域出现产品的快速更新和发展。
人工智能之所以能取得突飞猛进的进展,是大数据长足发展的结果。任何智能的发展,其实都需要一个学习的过程,都是训练某一领域“智能”的前提。关于数据来源,互联网及物联网是产生并承载大数据的基地,互联网服务商在搜索、社交、媒体、交易等各自核心业务领域,积累并持续产生海量数据,如何针对这些数据在目标业务画像场景信息中快速提取目标数据挖掘类型的可挖掘数据,以便于后续进行智能信息推荐,是本领域亟待解决的技术问题。
发明内容
为了至少克服现有技术中的上述不足,本公开的目的在于提供一种应用于大数据画像推送的业务处理方法及机器学习服务器。
第一方面,本公开提供一种应用于大数据画像推送的业务处理方法,应用于机器学习服务器,所述机器学习服务器与多个移动互联网终端通信连接,所述方法包括:
调取所述移动互联网终端的业务项目大数据中任一目标业务项目数据,提取所述目标业务项目数据在目标业务画像场景信息中的第一描述信息,所述第一描述信息表征所述目标业务项目数据的画像场景特征和/或画像扩展特征;
利用所述目标业务项目数据的预设画像场景描述信息对提取的所述第一描述信息进行处理,得到所述目标业务项目数据在所述目标业务画像场景信息中的第二描述信息,所述第二描述信息表征所述预设画像场景描述信息与所述第一描述信息的关联关系;
对所述目标业务项目数据的所述第一描述信息以及所述第二描述信息进行映射处理,根据所述第一描述信息和所述第二描述信息与目标描述信息的匹配度,确定所述目标业务项目数据是否为所述目标业务画像场景信息的目标数据挖掘类型,其中,所述目标数据挖掘类型用于指示与所述目标业务画像场景信息相关的挖掘业务对象,所述目标描述信息为指示所述目标业务项目数据是否为目标数据挖掘类型的描述信息。
在第一方面的一种可能的设计思路中,所述方法还包括:
当所述目标业务项目数据为所述目标业务画像场景信息的目标数据挖掘类型时,将所述目标业务项目数据添加到待挖掘业务数据集中;
依据所述待挖掘业务数据集中每个业务互动对象之间的互动模式,得到拓扑模式的待挖掘业务数据集的分布;
依据所述拓扑模式的待挖掘业务数据集的分布的分布特征,计算所述待挖掘业务数据集中的每个业务互动对象在所述拓扑模式的待挖掘业务数据集的分布中的业务挖掘节点,所述业务挖掘节点表示了待挖掘业务数据集中的业务互动对象在所述拓扑模式的待挖掘业务数据集的分布中的业务层级;
将所述待挖掘业务数据集中的每个业务互动对象对应的业务挖掘节点输入到预先配置的知识点分类网络中,利用所述知识点分类网络对所述待挖掘业务数据集中的每个业务互动对象进行知识点深度提取,得到所述待挖掘业务数据集中的每个业务互动对象各自对应的知识点深度特征;
利用所述知识点分类网络,依据所述待挖掘业务数据集中的每个业务互动对象对应的业务挖掘节点以及知识点深度特征,生成所述待挖掘业务数据集中的每个业务互动对象各自对应的初始知识点深度特征;
利用所述知识点分类网络对所述待挖掘业务数据集中的每个业务互动对象各自对应的初始知识点深度特征进行知识点溯源,得到所述待挖掘业务数据集中的每个业务互动对象各自对应的目标知识点对象;
利用所述知识点分类网络确定所述待挖掘业务数据集中的每个业务互动对象各自对应的目标知识点对象的层级顺序,并依据所述层级顺序对所述目标知识点对象进行融合,生成所述待挖掘业务数据集对应的目标推送知识点;
基于所述待挖掘业务数据集对应的目标推送知识点进行信息推送。
譬如,在第一方面的一种可能的设计思路中,所述依据所述拓扑模式的待挖掘业务数据集的分布的分布特征,计算所述待挖掘业务数据集中的每个业务互动对象在所述拓扑模式的待挖掘业务数据集的分布中的业务挖掘节点的步骤,包括:
将位于所述拓扑模式的待挖掘业务数据集的分布中交叉拓扑位置的业务互动对象作为关键业务互动对象;
将所述拓扑模式的待挖掘业务数据集的分布中任一业务互动对象各自距离所述关键业务互动对象的业务范围,作为所述拓扑模式的待挖掘业务数据集的分布中任一业务互动对象各自对应的目标业务范围;
将任一业务互动对象各自对应的目标业务范围映射为预设类别范围的业务挖掘节点,得到每个业务互动对象各自对应的业务挖掘节点;或者
按照预设的关键业务互动对象模板,从所述拓扑模式的待挖掘业务数据集的分布中确定关键业务互动对象;
在所述拓扑模式的待挖掘业务数据集的分布中的任一个业务互动对象与关键业务互动对象在同一条业务通道上的情况下,将任一业务互动对象的目标业务范围与关键业务互动对象的目标业务范围的区别业务范围作为该任一业务互动对象的区别业务节点标识;
依据待挖掘业务数据集中任一业务互动对象与关键业务互动对象的业务关系,确定任一业务互动对象的区别业务节点维度;
组合任一业务互动对象的区别业务节点标识与该任一业务互动对象的区别业务节点维度,得到该任一业务互动对象的区别业务节点;
将任一业务互动对象各自对应的区别业务节点映射为预设类别范围的向量,得到每个业务互动对象各自对应的相对业务挖掘节点;或者
按照预设的关键业务互动对象模板,从所述拓扑模式的待挖掘业务数据集的分布中确定关键业务互动对象;
在所述拓扑模式的待挖掘业务数据集的分布中的任一个业务互动对象与关键业务互动对象不在同一条业务通道上的情况下,将任一业务互动对象的目标业务范围与关键业务互动对象的目标业务范围的交集业务范围作为该任一业务互动对象的区别业务节点标识;
依据待挖掘业务数据集中任一业务互动对象与关键业务互动对象的业务关系,确定任一业务互动对象的区别业务节点维度;
组合任一业务互动对象的区别业务节点标识与该任一业务互动对象的区别业务节点维度,得到该任一业务互动对象的区别业务节点;
将任一业务互动对象各自对应的区别业务节点映射为预设类别范围的业务挖掘节点,得到每个业务互动对象各自对应的相对业务挖掘节点。
譬如,在第一方面的一种可能的设计思路中,依据所述待挖掘业务数据集中的每个业务互动对象对应的业务挖掘节点以及知识点深度特征,生成所述待挖掘业务数据集中的每个业务互动对象各自对应的初始知识点深度特征的步骤,包括:
利用所述知识点分类网络,对所述待挖掘业务数据集中的每个业务互动对象对应的绝对业务挖掘节点和知识点深度特征执行映射关联操作,将映射关联操作得到的结果作为所述待挖掘业务数据集中的每个业务互动对象对应的初始知识点深度特征。
譬如,在第一方面的一种可能的设计思路中,依据所述待挖掘业务数据集中的每个业务互动对象对应的业务挖掘节点以及知识点深度特征,生成所述待挖掘业务数据集中的每个业务互动对象各自对应的初始知识点深度特征的步骤,包括:
对所述待挖掘业务数据集中的每个业务互动对象对应的知识点深度特征执行决策树处理,将每个业务互动对象对应的知识点深度特征转换成决策结果特征清单以及决策标签特征清单;
利用所述每个业务互动对象对应的决策结果特征清单、决策标签特征清单中的决策标签特征清单以及相对业务挖掘节点,得到每个业务互动对象的决策结果特征清单与决策标签特征清单之间的相似度;
对每个业务互动对象的决策结果特征清单与决策标签特征清单之间的相似度执行归一化处理,得到每个业务互动对象的相似度对应的权重向量;
利用所述每个业务互动对象的权重向量、每个业务互动对象的决策标签特征清单中的值向量清单以及相对业务挖掘节点得到每个业务互动对象各自对应的初始知识点深度特征。
譬如,在第一方面的一种可能的设计思路中,所述知识点分类网络的训练过程包括:
获取标定集中的标定数据的标定挖掘业务数据序列、标定挖掘业务数据中每个业务互动对象对应的业务挖掘节点以及参考输出数据列表;
将所述标定集中的标定数据的标定挖掘业务数据序列以及标定挖掘业务数据中每个业务互动对象对应的业务挖掘节点输入到知识点分类网络中进行训练,得到预测输出数据列表;
利用所述参考输出数据列表以及所述预测输出数据列表得到所述知识点分类网络的损失参数值;
将所述损失参数值最大化时的模型参数作为所述知识点分类网络的模型参数,返回所述将所述标定集中的标定数据的标定挖掘业务数据序列以及标定挖掘业务数据中每个业务互动对象对应的业务挖掘节点输入到知识点分类网络中进行训练,得到预测输出数据列表的步骤继续训练,直至满足训练停止条件时停止训练。
第二方面,本公开实施例还提供一种应用于大数据画像推送的业务处理装置,应用于机器学习服务器,所述机器学习服务器与多个移动互联网终端通信连接,所述装置包括:
第一提取模块,用于调取所述移动互联网终端的业务项目大数据中任一目标业务项目数据,提取所述目标业务项目数据在目标业务画像场景信息中的第一描述信息,所述第一描述信息表征所述目标业务项目数据的画像场景特征和/或画像扩展特征;
第二提取模块,用于利用所述目标业务项目数据的预设画像场景描述信息对提取的所述第一描述信息进行处理,得到所述目标业务项目数据在所述目标业务画像场景信息中的第二描述信息,所述第二描述信息表征所述预设画像场景描述信息与所述第一描述信息的关联关系;
确定模块,用于对所述目标业务项目数据的所述第一描述信息以及所述第二描述信息进行映射处理,根据所述第一描述信息和所述第二描述信息与目标描述信息的匹配度,确定所述目标业务项目数据是否为所述目标业务画像场景信息的目标数据挖掘类型,其中,所述目标数据挖掘类型用于指示与所述目标业务画像场景信息相关的挖掘业务对象,所述目标描述信息为指示所述目标业务项目数据是否为目标数据挖掘类型的描述信息。
第三方面,本公开实施例还提供一种应用于大数据画像推送的业务处理系统,所述应用于大数据画像推送的业务处理系统包括机器学习服务器以及与所述机器学习服务器通信连接的多个移动互联网终端;
所述机器学习服务器,用于:
调取所述移动互联网终端的业务项目大数据中任一目标业务项目数据,提取所述目标业务项目数据在目标业务画像场景信息中的第一描述信息,所述第一描述信息表征所述目标业务项目数据的画像场景特征和/或画像扩展特征;
利用所述目标业务项目数据的预设画像场景描述信息对提取的所述第一描述信息进行处理,得到所述目标业务项目数据在所述目标业务画像场景信息中的第二描述信息,所述第二描述信息表征所述预设画像场景描述信息与所述第一描述信息的关联关系;
对所述目标业务项目数据的所述第一描述信息以及所述第二描述信息进行映射处理,根据所述第一描述信息和所述第二描述信息与目标描述信息的匹配度,确定所述目标业务项目数据是否为所述目标业务画像场景信息的目标数据挖掘类型,其中,所述目标数据挖掘类型用于指示与所述目标业务画像场景信息相关的挖掘业务对象,所述目标描述信息为指示所述目标业务项目数据是否为目标数据挖掘类型的描述信息。
第四方面,本公开实施例还提供一种机器学习服务器,所述机器学习服务器包括处理器、机器可读存储介质和单元接口,所述机器可读存储介质、所述单元接口以及所述处理器之间通过总线系统相关联,所述单元接口用于与至少一个移动互联网终端通信连接,所述机器可读存储介质用于存储程序、指令或代码,所述处理器用于执行所述机器可读存储介质中的程序、指令或代码,以执行第一方面或者第一方面中任意一个可能的设计示例中的应用于大数据画像推送的业务处理方法。
第五方面,本公开实施例提供一种计算机可读存储介质,计算机可读存储介质中配置有指令,当其被执行时,使得计算机执行上述第一方面或者第一方面中任意一个可能的设计示例中的应用于大数据画像推送的业务处理方法。
根据上述任意一个方面,本公开提供的实施方式中,提取目标业务画像场景信息中的目标业务项目数据的第一描述信息,并利用目标业务项目数据的预设画像场景描述信息对第一描述信息进行加工处理,生成目标业务项目数据的第二描述信息,对目标业务项目数据的第一描述信息和第二描述信息进行映射处理,当满足预设条件时确定目标业务项目数据是否为目标数据挖掘类型。一方面,由于使用了预设画像场景描述信息和表征目标业务项目数据的画像场景特征和/或画像扩展特征的第一描述信息,大大提高了在目标业务画像场景信息中提取目标数据挖掘类型的准确性,另一方面在对第一描述信息和第二描述信息进行映射处理时的业务处理速度较快,因此,也便于快速确定目标业务画像场景信息中的目标数据挖掘类型,提高后续数据挖掘效率。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要调用的附图作简单地介绍,应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。
图1为本公开实施例提供的应用于大数据画像推送的业务处理系统的应用场景示意图;
图2为本公开实施例提供的应用于大数据画像推送的业务处理方法的流程示意图;
图3为本公开实施例提供的应用于大数据画像推送的业务处理装置的功能模块示意图;
图4为本公开实施例提供的用于实现上述的应用于大数据画像推送的业务处理方法的机器学习服务器的结构组件示意框图。
具体实施方式
下面结合说明书附图对本公开进行具体说明,方法实施例中的具体操作方法也可以应用于装置实施例或系统实施例中。
图1是本公开一种实施例提供的应用于大数据画像推送的业务处理系统10的交互示意图。应用于大数据画像推送的业务处理系统10可以包括机器学习服务器100以及与机器学习服务器100通信连接的移动互联网终端200。图1所示的应用于大数据画像推送的业务处理系统10仅为一种可行的示例,在其它可行的实施例中,该应用于大数据画像推送的业务处理系统10也可以仅包括图1所示组成部分的其中的至少部分或者还可以包括其它的组成部分。
在一种可能的设计思路中,应用于大数据画像推送的业务处理系统10中的机器学习服务器100和移动互联网终端200可以通过配合执行以下方法实施例所描述的应用于大数据画像推送的业务处理方法,具体机器学习服务器100和移动互联网终端200的执行步骤部分可以参照以下方法实施例的详细描述。
为了解决前述背景技术中的技术问题,图2为本公开实施例提供的应用于大数据画像推送的业务处理方法的流程示意图,本实施例提供的应用于大数据画像推送的业务处理方法可以由图1中所示的机器学习服务器100执行,下面对该应用于大数据画像推送的业务处理方法进行详细介绍。
步骤S110,调取移动互联网终端的业务项目大数据中任一目标业务项目数据,提取目标业务项目数据在目标业务画像场景信息中的第一描述信息,第一描述信息表征目标业务项目数据的画像场景特征和/或画像扩展特征。
在一种可能的设计示例中,上述机器学习服务器100自身维护有业务项目大数据库,该移动互联网终端的业务项目大数据中存储有多个挖掘业务对象数据作为目标业务项目数据。该业务项目大数据库可以由机器学习服务器100或其它外部服务中心(如业务响应服务器等)定期或不定期地更新内容。
在一种可能的设计示例中,从移动互联网终端的业务项目大数据中选择目标业务项目数据,当目标业务画像场景信息中存在与目标业务项目数据相同的业务画像标签时,提取目标业务项目数据在目标业务画像场景信息中的第一描述信息。
步骤S120,利用目标业务项目数据的预设画像场景描述信息对提取的第一描述信息进行处理,得到第二描述信息,第二描述信息表征预设画像场景描述信息与第一描述信息的关联关系。
在一种可能的设计示例中,目标业务项目数据的画像场景特征至少包括该目标业务项目数据在目标业务画像场景信息中的匹配业务信息;画像扩展特征至少包括目标业务项目数据所在业务场景的业务场景特征;预设画像场景描述信息至少包括:目标业务项目数据的业务场景特征和目标业务项目数据对应的至少一个关键业务数据。
在一种可能的设计示例中,利用目标业务项目数据的预设画像场景描述信息对提取的第一描述信息进行处理,得到目标业务项目数据在目标业务画像场景信息中的第二描述信息,包括:根据目标业务项目数据在目标业务画像场景信息中的匹配业务信息,确定目标业务项目数据的关联业务项目数据中存在的目标业务项目数据对应的至少一个关键业务数据,以及每个关键业务数据与最关联的目标业务项目数据之间的匹配业务数量;计算目标业务项目数据的业务场景特征和目标业务项目数据所在业务场景的业务场景特征的匹配度;将每个关键业务数据与最关联的目标业务项目数据之间的匹配业务数量以及目标业务项目数据的业务场景特征和目标业务项目数据所在业务场景的业务场景特征的匹配度,作为第二描述信息。
步骤S130,对目标业务项目数据的第一描述信息以及第二描述信息进行映射处理。
在一种可能的设计示例中,将第一描述信息和第二描述信息输入至经预先配置得到目标描述信息的决策神经网络,计算出第一描述信息和第二描述信息与目标描述信息的匹配度。
在一种可能的设计示例中,在配置决策神经网络的过程中,首先获取用于配置决策神经网络的样本业务画像场景信息,并对获取的样本业务画像场景信息进行业务场景区分处理,样本业务画像场景信息中的目标业务项目数据具有至少一个指示目标业务项目数据是否为该样本业务画像场景信息的目标数据挖掘类型的标签;从样本业务画像场景信息中提取附带标签的目标业务项目数据以及该目标业务项目数据的第三描述信息;利用附带标签的目标业务项目数据的预设画像场景描述信息对该目标业务项目数据的第三描述信息进行处理,得到目标业务项目数据的第四描述信息;对附带标签的目标业务项目数据的第三描述信息和第四描述信息进行映射处理,分别记录标签表征确定标签的目标业务项目数据对应的第一映射处理结果,以及记录标签表征非确定标签的目标业务项目数据对应的第二映射处理结果,将第一映射处理结果和第二映射处理结果作为目标描述信息。
步骤S140,根据第一描述信息和第二描述信息与目标描述信息的匹配度,确定目标业务项目数据是否为目标业务画像场景信息的目标数据挖掘类型,其中,目标数据挖掘类型用于指示与目标业务画像场景信息相关的挖掘业务对象,目标描述信息为指示目标业务项目数据是否为目标数据挖掘类型的描述信息。
在一种可能的设计示例中,当第一描述信息和第二描述信息与第一映射处理结果的匹配度大于或等于第一描述信息和第二描述信息与第二映射处理结果的匹配度时,确定目标业务项目数据为目标业务画像场景信息的目标数据挖掘类型。
在一种可能的设计示例中,目标业务项目数据具有用于指示目标业务项目数据所属业务场景的业务场景标签;在对目标业务项目数据的第一描述信息以及第二描述信息进行映射处理之后,将目标业务项目数据的所属业务场景作为目标业务场景;对第一描述信息和第二描述信息与第一映射处理结果的匹配度大于或等于第一描述信息和第二描述信息与第二映射处理结果的匹配度目标业务项目数据,进行迁移数据识别处理,以消除迁移数据;对迁移数据识别处理后的目标业务项目数据进行聚类分析,将包括业务场景标签的目标业务项目数据所在的聚类分析结果作为目标数据挖掘类型所在的聚类分析结果,并从聚类分析结果中得到业务场景的目标数据挖掘类型。
在一种可能的设计示例中,在调取移动互联网终端的业务项目大数据中任一目标业务项目数据之后,获取预设业务互动微服务;对预设业务互动微服务进行业务场景特征分析,得到目标业务项目数据的业务场景特征;对预设业务互动微服务进行关键业务数据分析,得到目标业务项目数据对应的至少一个关键业务数据。
在一种可能的设计示例中,目标数据挖掘类型为挖掘业务对象数据。
本公开实例提供的目标数据挖掘类型的确定方法,通过提取目标业务画像场景信息中的目标业务项目数据的第一描述信息,并利用目标业务项目数据的预设画像场景描述信息对第一描述信息进行加工处理,生成目标业务项目数据的第二描述信息,对目标业务项目数据的第一描述信息和第二描述信息进行映射处理,当满足预设条件时确定目标业务项目数据是否为目标数据挖掘类型。一方面,由于使用了预设画像场景描述信息和表征目标业务项目数据的画像场景特征和/或画像扩展特征的第一描述信息,大大提高了在目标业务画像场景信息中提取目标数据挖掘类型的准确性,另一方面在对第一描述信息和第二描述信息进行映射处理时的业务处理速度较快,因此,也便于快速确定目标业务画像场景信息中的目标数据挖掘类型,提高后续数据挖掘效率。
下面详细介绍本公开实例提出的目标数据挖掘类型的确定方法,该方可以由前述机器学习服务器100执行。例如该方法包括以下步骤:
步骤S210,获取目标业务画像场景信息。
在一种可能的设计示例中,目标数据挖掘类型用于指示与目标业务画像场景信息相关的挖掘业务对象,具体而言,目标数据挖掘类型可以是挖掘业务对象的应用业务,例如基金推送业务等。用户自身并不清楚挖掘业务对象的确切应用业务,而只是知道自身的意图方向。因此,当用户根据自身需求在目标挖掘业务对象比如搜索栏中输入需要搜索的内容、寻找哪些业务画像场景信息中提到了与该需求匹配的相关应用业务时,目标挖掘业务对象对应的机器学习服务器100可以根据用户输入的内容,比如“如何进行基金投资”、“基金投资策略”等,检索出一些关于该内容的业务画像场景信息,这些检索出来的业务画像场景信息为上述目标业务画像场景信息,以供后续提取出符合用户需求的目标数据挖掘类型。
步骤S220,从移动互联网终端的业务项目大数据中调取移动互联网终端的业务项目大数据中任一目标业务项目数据。
步骤S230,获取目标业务项目数据的预设画像场景描述信息。
在一种可能的设计示例中,目标业务项目数据的预设画像场景描述信息包括:目标业务项目数据的业务场景特征和该目标业务项目数据对应的至少一个关键业务数据。
在一种可能的设计示例中,在获取目标业务项目数据的预设画像场景描述信息时,可以执行示例性的实施方式。
步骤S231,获取预设业务互动微服务。
例如,上述业务互动微服务可以预先设定,每个业务互动微服务可以包括多个分散的子业务互动微服务,比如可以包括基金选择服务中的数据、基金推荐进程中挖掘业务对象的描述信息以及人工筛选出的重点业务画像场景信息,等等,但不限于此。
步骤S232,对预设业务互动微服务进行业务场景特征分析,得到目标业务项目数据的业务场景特征。
在获取目标业务项目数据的业务场景特征时,机器学习服务器100可以通过第一预设算法,对上述各个子业务互动微服务进行业务场景特征分析,得到上述目标业务项目数据的一个多维的业务场景特征,得到的目标业务项目数据的业务场景特征可以代表目标业务项目数据在对应子业务互动微服务中的业务类别属性,其中,上述第一预设算法可以为现有技术中的特征向量提取算法,可以将子业务互动微服务的服务数据表示转换为业务类别属性空间中的向量。
这里,上述基金推荐进程中挖掘业务对象的描述信息可以为在基金推荐进程中发布或更新挖掘业务对象时,所提供的对该挖掘业务对象的描述信息,比如该挖掘业务对象的业务对象源、业务版本号、业务简介等等。
步骤S233,对预设业务互动微服务进行关键业务数据分析,得到目标业务项目数据对应的至少一个关键业务数据。
在一种可能的设计示例中,在获取上述目标业务项目数据对应的至少一个关键业务数据时,上述机器学习服务器100可以利用第二预设算法对上述各个子业务互动微服务进行分析,提取出一个或多个关键业务数据作为上述目标业务项目数据对应的至少一个关键业务数据。这里,上述目标业务项目数据对应的至少一个关键业务数据为与上述目标业务项目数据相关的业务项目数据,例如可以为描述上述目标业务项目数据所代表的挖掘业务对象的操作方法的业务项目数据,等等。
例如,在获取上述目标业务项目数据对应的至少一个关键业务数据时,上述机器学习服务器100可以对上述各个自业务互动微服务中的微服务数据按照完整的业务场景进行场景区分,对区分得到的每个业务场景进行业务场景类别分析以及场景标注处理,只保留指定业务场景类别的业务画像标签,来作为候选关键业务数据;以保留的候选关键业务数据为节点,以候选关键业务数据的共现关系作为边,构建候选关键业务数据图,迭代计算各个候选关键业务数据的权重,直至收敛,对各个候选关键业务数据的权重进行排序,从而得到最重要的X个候选关键业务数据,其中X≥1;查询挖掘业务对象数据库,对X个候选关键业务数据进行标记并过滤,得到N个关键业务数据,其中N≤X,并将N个关键业务数据作为上述目标业务项目数据对应的关键业务数据。
步骤S234,当目标业务画像场景信息中存在与目标业务项目数据相同的业务画像标签时,从目标业务画像场景信息中提取目标业务项目数据的第一描述信息,第一描述信息表征目标业务项目数据的画像场景特征和/或画像扩展特征。
在一种可能的设计示例中,上述目标业务项目数据的画像场景特征包括该目标业务项目数据在目标业务画像场景信息中的匹配业务信息;又例如,上述目标业务项目数据的画像场景特征还可以进一步包括上述目标业务项目数据的业务热度,其中,上述目标业务项目数据的业务热度,可以指示目标业务项目数据在目标业务画像场景信息中的出现次数。
在一种可能的设计示例中,上述目标业务项目数据的画像扩展特征包括上述目标业务项目数据所在业务场景的业务场景特征;又例如,上述目标业务项目数据的画像扩展特征还可以进一步包括上述目标业务项目数据的关联业务项目数据的业务场景类别,其中,上述关联业务项目数据为上述目标业务项目数据前后各Q个业务项目数据,即关联业务项目数据共包括2Q个业务项目数据。
例如,在提取上述目标业务项目数据的画像场景特征时,上述机器学习服务器100先确定上述目标业务项目数据在上述目标业务画像场景信息中的匹配业务信息,再统计出上述目标业务项目数据在上述目标业务画像场景信息中出现的次数,并将确定的上述目标业务项目数据的匹配业务信息以及出现次数作为上述目标业务项目数据的画像场景特征。又例如,上述机器学习服务器100还可以进一步确定出上述目标业务项目数据所代表的挖掘业务对象的业务需求方及其在目标业务画像场景信息中出现的场景位置信息,并将其作为上述目标业务项目数据的画像场景特征。
例如,在提取上述目标业务项目数据的画像扩展特征时,上述机器学习服务器100在确定上述目标业务项目数据在上述目标业务画像场景信息中的匹配业务信息后,获取上述目标业务项目数据出现时所在的各个业务场景,并提取上述目标业务项目数据所在的业务场景的业务场景特征,并将这些业务场景各自的业务场景特征作为上述目标业务项目数据的画像扩展特征。这里,可以使用上述第一预设算法来提取上述目标业务项目数据所在的业务场景的业务场景特征。又例如,上述机器学习服务器100在确定上述目标业务项目数据在上述目标业务画像场景信息中出现的业务层级后,还可以获取上述目标业务项目数据的关联业务项目数据的业务场景类别,并将获取的上述目标业务项目数据的关联业务项目数据的业务场景类别作为上述目标业务项目数据的画像扩展特征,也即还可以获取上述目标业务项目数据前后M个业务项目数据的业务场景类别,并将获取的上述目标业务项目数据前后M个业务项目数据的业务场景类别作为上述目标业务项目数据的画像扩展特征。
步骤S235,利用目标业务项目数据的预设画像场景描述信息对提取的第一描述信息进行处理,得到目标业务项目数据在目标业务画像场景信息中的第二描述信息,第二描述信息表征了目标业务项目数据的预设画像场景描述信息与第一描述信息的关联关系。
在一种可能的设计示例中,在上述机器学习服务器100对提取的上述第一描述信息进行处理时,可执行下述实施方式的操作:
步骤S2351,根据目标业务项目数据在目标业务画像场景信息中的匹配业务信息,确定每个出现位置处目标业务项目数据的关联业务项目数据中存在的目标业务项目数据对应的关键业务数据,以及每个关键业务数据与位置上最关联的目标业务项目数据之间的匹配业务数量。
例如,上述机器学习服务器100根据目标业务项目数据在目标业务画像场景信息中的匹配业务信息,确定上述目标业务项目数据的关联业务项目数据比如前后各100个业务项目数据中是否存在上述目标业务项目数据对应的关键业务数据,如果存在,则依次确定每个上述关键业务数据与其位置上最关联的上述目标业务项目数据之间的匹配业务数量,上述匹配业务数量也即上述关键业务数据和与其位置上最关联的上述目标业务项目数据之间间隔的字的个数。
步骤S2352,计算目标业务项目数据的业务场景特征和目标业务项目数据所在业务场景的业务场景特征的匹配度。
在一种可能的设计示例中,上述机器学习服务器100计算上述目标业务项目数据的业务场景特征和上述目标业务项目数据所在业务场景的业务场景特征的匹配业务数量,并将该匹配业务数量作为二者的匹配度。又例如,上述目标业务项目数据的业务场景特征是可以代表上述目标业务项目数据的本义,因此,如果得到的二者的匹配度大于相似阈值,也即上述目标业务项目数据在上述目标业务画像场景信息中所在的业务场景代表上述目标业务项目数据的本来业务服务,而不是挖掘业务对象的业务服务,也就说明上述目标业务项目数据所在业务场景的业务场景特征对应的目标业务项目数据不是目标数据挖掘类型。
例如,上述目标业务项目数据的业务场景特征为FA={fA1,fA2,…,fAS},上述目标业务项目数据所在业务场景的业务场景特征为FB={fB1,fB2,…,fBS},S为业务场景特征FA和业务场景特征FB的业务节点,则可以计算出上述业务场景特征FA和业务场景特征FB的匹配度。
步骤S2353,将每个关键业务数据与位置上最关联的目标业务项目数据之间的匹配业务数量以及目标业务项目数据的业务场景特征和目标业务项目数据所在业务场景的业务场景特征的匹配度,作为第二描述信息。
进一步地,步骤S236,将目标业务项目数据的第一描述信息以及第二描述信息输入至经预先配置得到目标描述信息的决策神经网络。
在一种可能的设计示例中,上述决策神经网络可以是基于神经网络的决策神经网络,该决策神经网络连接一个分类器,比如Random Forrest分类器。从用于配置的样本业务画像场景信息中提取出用于配置上述决策神经网络的目标业务项目数据的第一描述信息和第二描述信息,将用于配置上述决策神经网络的目标业务项目数据的第一描述信息和第二描述信息输入上述决策神经网络,进而使上述决策神经网络学习得到上述目标描述信息,以使其后续可以分类识别目标业务项目数据是否为目标数据挖掘类型。
其中,目标描述信息为指示目标业务项目数据是否为目标数据挖掘类型的描述信息,是配置后的决策神经网络记录的属性标签表征确定标签的目标业务项目数据对应的第一映射处理结果,以及记录属性标签表征非确定标签的目标业务项目数据对应的第二映射处理结果,也即上述目标描述信息是在对上述决策神经网络配置的过程中,决策神经网络学习到的上述目标业务项目数据是目标数据挖掘类型时的训练向量的描述信息和上述目标业务项目数据不是目标数据挖掘类型时的训练向量的描述信息。
关于配置上述决策神经网络的方法,下文中会详细描述,这里不再赘述。
步骤S237,当第一描述信息和第二描述信息与目标描述信息中的第一映射处理结果的匹配度大于或等于第一描述信息和第二描述信息与目标描述信息中的第二映射处理结果的匹配度时,对于第一描述信息和第二描述信息与第一映射处理结果的匹配度大于或等于第一描述信息和第二描述信息与第二映射处理结果的匹配度的目标业务项目数据,进行迁移数据识别处理,以消除迁移数据。例如,迁移数据可以是指存在业务迁移变化的数据,该部分数据需要预先进行消除。
在一种可能的设计示例中,在将第一描述信息和第二描述信息输入至经预先配置得到目标描述信息的决策神经网络之后,上述决策神经网络计算出第一描述信息和第二描述信息与目标描述信息的匹配度,当第一描述信息和第二描述信息与第一映射处理结果的匹配度大于或等于第一描述信息和第二描述信息与第二映射处理结果的匹配度时,确定目标业务项目数据为目标业务画像场景信息的目标数据挖掘类型。
步骤S238,对迁移数据识别处理后的目标业务项目数据的进行聚类分析,将包括业务场景标签的目标业务项目数据所在的聚类分析结果作为目标数据挖掘类型所在的聚类分析结果,并从聚类分析结果中得到业务场景的目标数据挖掘类型。
在一种可能的设计示例中,目标业务项目数据还可以进一步包括用于指示目标业务项目数据所属的业务场景的业务场景标签。例如,如前,上述机器学习服务器100自身维护一个业务项目大数据库,该移动互联网终端的业务项目大数据中存储有多个挖掘业务对象数据作为目标业务项目数据,在存储时,根据各个目标业务项目数据所代表的挖掘业务对象所属的业务场景,对这些目标业务项目数据进行业务场景划分,并分别为其生成业务场景标签。
在一种可能的设计示例中,上述机器学习服务器100将目标业务项目数据的所属业务场景作为目标业务场景;由于上述机器学习服务器100消除迁移数据的上述目标业务项目数据的候选集中的各个目标业务项目数据第一描述信息和第二描述信息与目标描述信息的匹配度大于或等于预设阈值,也即上述目标业务项目数据的候选集中的各个目标业务项目数据是目标数据挖掘类型的置信度大于或等于预设阈值,可以使用K-means聚类方法对上述目标业务项目数据的候选集中的各个目标业务项目数据进行聚类分析,得到K个类,每个类对应一个业务场景,将目标业务项目数据所在的聚类分析结果作为目标数据挖掘类型所在的聚类分析结果,并从聚类分析结果中得到目标业务场景的目标数据挖掘类型。
又例如,在从聚类分析结果中得到目标业务场景的目标数据挖掘类型之后,还可以对聚类方法的聚类阈值进一步调整,来扩大聚类的范围,进而召回一些第一描述信息和第二描述信息与目标描述信息的匹配度小于预设阈值的目标业务项目数据,也即将一些是目标数据挖掘类型的置信度大于或等于预设阈值的目标业务项目数据加入到上述目标数据挖掘类型所在的聚类结果中。这样可以提高识别一些冷门的挖掘业务对象数据作为的目标数据挖掘类型的准确性和召回率。
在一种可能的设计示例中,上述机器学习服务器100还可以使用其它聚类算法,比如层次聚类方法对消除迁移数据的上述目标业务项目数据的候选集中的各个目标业务项目数据进行聚类分析,得到目标业务场景的目标数据挖掘类型,本公开实例对此不进行具体限定。
由此,一方面,由于使用了预设画像场景描述信息和表征目标业务项目数据的画像场景特征和/或画像扩展特征的第一描述信息,大大提高了在目标业务画像场景信息中提取目标数据挖掘类型的准确性,另一方面在对第一描述信息和第二描述信息进行映射处理时的业务处理速度较快,因此,也便于快速确定目标业务画像场景信息中的目标数据挖掘类型,提高后续数据挖掘效率。
前述步骤S236中使用了预先配置的决策神经网络,来对第一描述信息与第二描述信息进行映射处理,以便得到与目标描述信息的匹配度。譬如接下来对配置决策神经网络的流程进行详细说明,例如可以包括以下步骤:
步骤A,获取样本业务画像场景信息,样本业务画像场景信息包括至少一个指示目标业务项目数据是否为目标数据挖掘类型的标签。
在一种可能的设计示例中,选取不同业务场景中预设数量的业务画像场景信息作为目标样本业务画像场景信息;利用标注模型对目标样本业务画像场景信息进行业务拆分处理,以标注出目标样本业务画像场景信息中有可能是挖掘业务对象数据的目标业务项目数据,并生成各个目标业务项目数据在目标样本业务画像场景信息中的标签,进而生成样本业务画像场景信息。
例如,从各个业务场景选取预设数量的业务画像场景信息,比如从电商直播业务场景选取2000个业务画像场景信息,从短视频业务场景选取2000篇业务画像场景信息,并将选取的这些业务画像场景信息作为目标样本业务画像场景信息;利用标注模型比如HNN模型(HopfieldNeural Network模型),对上述目标样本业务画像场景信息进行标注处理,标注出上述目标样本业务画像场景信息中出现的各个目标业务项目数据,并确定上述各个目标业务项目数据是否为目标数据挖掘类型,生成上述各个目标业务项目数据的标签,也即生成指示目标业务项目数据是否为目标数据挖掘类型的标签,这种从各个业务场景选取的、包含的目标业务项目数据附带有该目标业务项目数据是否为目标数据挖掘类型的标签的业务画像场景信息为样本业务画像场景信息。
又例如,为了保证目标样本业务画像场景信息中各个目标业务项目数据的标签的准确性,还可以对上述各个目标业务项目数据的标签进行人工校验。例如,根据目标业务项目数据在上述目标样本业务画像场景信息中的业务层级,对上述各个目标业务项目数据的标签进行人工校验,进而得到人工样本业务画像场景信息。
步骤B,从样本业务画像场景信息中提取附带标签的目标业务项目数据以及该目标业务项目数据的第三描述信息。
步骤C,利用附带标签的目标业务项目数据的预设画像场景描述信息对该目标业务项目数据的第三描述信息进行处理,得到目标业务项目数据的第四描述信息。
步骤D,对附带标签的目标业务项目数据的第三描述信息和第四描述信息进行映射处理。
在一种可能的设计示例中,将附带标签的目标业务项目数据的第三描述信息和第四描述信息输入至经预先配置得到目标描述信息的决策神经网络。由于上述样本业务画像场景信息中的每一个目标业务项目数据附带对应的标签,用于指示该目标业务项目数据是否为目标数据挖掘类型,因此,输入的该目标业务项目数据的第三描述信息和第四描述信息也间接的附带有上述目标业务项目数据的标签。
这里,上述标签可以为“1”或“0”,“1”用于表示确定标签,也即标识目标业务项目数据是目标数据挖掘类型,“0”用于表示非确定标签,也即表示目标业务项目数据不是目标数据挖掘类型。
例如,可以将附带标签的目标业务项目数据的上述第三描述信息和上述第四描述信息作为附带标签的目标业务项目数据的一个训练向量,输入值上述决策神经网络。
不失一般性的假设,输入的训练向量的格式可以如下:
目标业务项目数据1 标签1 训练向量1
目标业务项目数据2 标签2 训练向量2
……
在一种可能的设计示例中,当上述决策神经网络接收到输入的第三描述信息和第四描述信息组成的训练向量后,会学习具有表示确定标签的目标业务项目数据的训练向量的特征以及表示非确定标签的目标业务项目数据的训练向量的特征,并将学习的具有表示确定标签的目标业务项目数据的训练向量的描述信息作为第一分类结果,将学习的表示非确定标签的目标业务项目数据的训练向量的描述信息作为第二分类结果。
步骤E,分别记录标签表征确定标签的目标业务项目数据对应的第一映射处理结果,以及记录标签表征非确定标签的目标业务项目数据对应的第二映射处理结果,并将第一映射处理结果和第二映射处理结果作为目标描述信息。
在一种可能的设计示例中,目标描述信息为指示目标业务项目数据是否为目标数据挖掘类型的描述信息,通过对上述决策神经网络的配置,上述决策神经网络记录了目标业务项目数据是目标数据挖掘类型时对应的训练向量的描述信息和目标业务项目数据不是目标数据挖掘类型时对应的训练向量的描述信息,将其作为上述目标描述信息,也即上述目标描述信息是在对上述决策神经网络配置的过程中,决策神经网络学习到的上述目标业务项目数据是目标数据挖掘类型时的训练向量的描述信息和上述目标业务项目数据不是目标数据挖掘类型时的训练向量的描述信息。
在一种可能的设计示例中,在完成对上述决策神经网络的配置之后,当输入目标业务项目数据在目标业务画像场景信息中的第一描述信息和第二描述信息后,上述决策神经网络会计算出第一描述信息和第二描述信息与目标描述信息的匹配置信度,并将该匹配置信度作为第一描述信息和第二描述信息与目标描述信息上述匹配度。
在本公开实施例中,从目标业务画像场景信息中提取出具有标签的目标业务项目数据的预设画像场景描述信息和表征目标业务项目数据的画像场景特征和/或画像扩展特征的第一描述信息,对上述决策神经网络进行配置,该配置规模较低,并且收集业务互动微服务的成本较低,同时还可以达到准确高效,完全满足了快速识别目标业务画像场景信息中的目标数据挖掘类型的需求。
在一种可能的设计示例中,在以上实施例的基础上,在应用层面,还可以包括以下步骤。
步骤S140,当目标业务项目数据为目标业务画像场景信息的目标数据挖掘类型时,将目标业务项目数据添加到待挖掘业务数据集中,依据待挖掘业务数据集中每个业务互动对象之间的互动模式,得到拓扑模式的待挖掘业务数据集的分布。
在一种可能的设计思路中,在获取待挖掘业务数据集之后,可以对待挖掘业务数据集执行业务拆分处理,得到各个拆分业务组成的待挖掘业务数据集序列,再对待挖掘业务数据集序列进行处理,得到拓扑模式的待挖掘业务数据集的分布。
需要说明的是,对待挖掘业务数据集序列进行处理,得到拓扑模式的待挖掘业务数据集的分布的过程为:确定待挖掘业务数据集序列中的关键业务互动对象,依据待挖掘业务数据集中除了关键业务互动对象之外的其它每个业务互动对象各自分别与关键业务互动对象之间的互动模式,将待挖掘业务数据集序列中的各个业务互动对象按照拓扑形式排列,得到拓扑模式的待挖掘业务数据集的分布。
其中,待挖掘业务数据集序列中的关键业务互动对象可以为待挖掘业务数据集序列中存在多个(如两个以上)业务交叉的业务互动对象,待挖掘业务数据集中除了业务交叉的业务互动对象之外的其它每个业务互动对象都与业务交叉的业务互动对象存在直接或间接的互动模式,而业务互动对象之间的互动模式能够反映业务互动对象之间在互动场景上的搭配关系,这种搭配关系是和知识点相关联的,也就是说,本公开中的拓扑模式的待挖掘业务数据集的分布能够体现待挖掘业务数据集序列中业务互动对象之间的互动模式,从而体现待挖掘业务数据集序列中业务互动对象的知识点。
需要说明的是,本公开中的拓扑模式的待挖掘业务数据集的分布为将待挖掘业务数据集序列中的各个业务互动对象按照拓扑形式排列得到的序列,本公开中的拓扑模式的待挖掘业务数据集的分布具体可以为依存树。
步骤S150,依据拓扑模式的待挖掘业务数据集的分布的分布特征,计算待挖掘业务数据集中的每个业务互动对象在拓扑模式的待挖掘业务数据集的分布中的业务挖掘节点。
需要说明的是,业务挖掘节点表示了待挖掘业务数据集中的业务互动对象在拓扑模式的待挖掘业务数据集的分布中的业务层级,由于拓扑模式的待挖掘业务数据集的分布能够体现出待挖掘业务数据集的业务结构,因此,依据拓扑模式的待挖掘业务数据集的分布的分布特征,计算得到的待挖掘业务数据集中的每个业务互动对象的业务挖掘节点能够体现出待挖掘业务数据集的业务结构。
在一种可能的设计思路中,本公开中可以将业务互动对象在拓扑模式的待挖掘业务数据集的分布中的业务层级采用预设维度的向量来表示,从而得到业务互动对象在拓扑模式的待挖掘业务数据集的分布中的业务挖掘节点。其中,预设维度可以由本领域技术人员依据实际情况而设置,本公开并不做具体限定。
步骤S160,将待挖掘业务数据集中的每个业务互动对象对应的业务挖掘节点输入到预先配置的知识点分类网络中。
步骤S170,利用知识点分类网络对待挖掘业务数据集中的每个业务互动对象进行知识点深度提取,得到待挖掘业务数据集中的每个业务互动对象各自对应的知识点深度特征。
待挖掘业务数据集中的每个业务互动对象的知识点可以利用知识点深度特征来表示,知识点深度特征中每一维度的向量都表示了业务互动对象的知识点信息。
知识点深度特征的维度可以由本领域技术人员依据实际情况而设置,本公开并不做具体限定。并且,知识点深度特征的维度与业务挖掘节点的维度可以相同,也可以不同,本公开并不做具体限定。如果不相同,在后续进行向量运算之前,需要进行维度统一,例如:对低维度向量做升维处理,比如知识点深度特征维度为512,业务挖掘节点维度为312,那么可以让业务挖掘节点乘以一个312*512维度的矩阵,将业务挖掘节点变换为512维度的业务挖掘节点。本公开还可以采用对高维度向量做降维处理,具体的降维处理方式本公开实施例不再详细介绍。
每个业务互动对象各自对应的知识点深度特征的维度度可以相同,也可以不同,如果不相同,在后续进行向量运算之前,需要进行维度统一,例如:对低维度向量做升维处理,比如一个业务互动对象的知识点深度特征维度为512,另一个业务互动对象的知识点深度特征维度为312,那么可以让另一个业务互动对象的知识点深度特征乘以一个312*512维度的矩阵,将另一个业务互动对象的知识点深度特征变换为512维度的知识点深度特征。本公开还可以采用对高维度向量做降维处理,具体的降维处理方式本公开实施例不再详细介绍。
步骤S180,利用知识点分类网络,依据待挖掘业务数据集中的每个业务互动对象对应的业务挖掘节点以及知识点深度特征,生成待挖掘业务数据集中的每个业务互动对象各自对应的初始知识点深度特征。
本公开中可以利用知识点分类网络,对待挖掘业务数据集中的某一业务互动对象对应的业务挖掘节点以及知识点深度特征做向量运算处理,得到待挖掘业务数据集中的某一业务互动对象对应的初始知识点深度特征。
步骤S190,利用知识点分类网络对待挖掘业务数据集中的每个业务互动对象各自对应的初始知识点深度特征进行知识点溯源,得到待挖掘业务数据集中的每个业务互动对象各自对应的目标知识点对象。
需要说明的是,本公开实施例中,利用知识点分类网络对待挖掘业务数据集中的每个业务互动对象各自对应的初始知识点深度特征进行知识点溯源,可以得到待挖掘业务数据集中的每个业务互动对象各自对应的目标知识点对象。
对待挖掘业务数据集中的任一个业务互动对象对应的初始知识点深度特征进行知识点溯源的过程为:将待挖掘业务数据集中的任一个业务互动对象对应的初始知识点深度特征与数据库中存储的所有备选业务互动对象的知识点深度特征做相似性运算,得到相似性运算结果,将相似性运算结果符合预设相似性阈值的备选业务互动对象作为待挖掘业务数据集中该业务互动对象对应的目标知识点对象。
其中,本公开实施例可以将待挖掘业务数据集中的任一个业务互动对象对应的初始知识点深度特征与数据库中存储的所有备选业务互动对象的知识点深度特征做卷积,得到卷积结果,将对卷积结果作为相似性运算结果,并对卷积结果执行置信度运算,得到置信度运算结果,依据置信度运算结果,从中选择符合预设概率阈值的备选业务互动对象作为待挖掘业务数据集中该业务互动对象对应的目标知识点对象。
步骤S200,利用知识点分类网络确定待挖掘业务数据集中的每个业务互动对象各自对应的目标知识点对象的层级顺序,并依据层级顺序对目标知识点对象进行融合,生成待挖掘业务数据集对应的目标推送知识点,基于待挖掘业务数据集对应的目标推送知识点进行信息推送。
本公开中的知识点分类网络可以结合待挖掘业务数据集中的每个业务互动对象在拓扑模式的待挖掘业务数据集的分布中的业务挖掘节点以及预先配置得到的业务互动对象调序方式,得到待挖掘业务数据集中的每个业务互动对象各自对应的目标知识点对象的层级顺序,从而依据层级顺序对目标知识点对象进行融合,生成待挖掘业务数据集对应的目标推送知识点。
由于本公开实施例中依据待挖掘业务数据集中每个业务互动对象之间的互动模式,得到拓扑模式的待挖掘业务数据集的分布,而拓扑模式的待挖掘业务数据集的分布能够体现出待挖掘业务数据集的业务结构,因此,依据拓扑模式的待挖掘业务数据集的分布的分布特征,计算得到的待挖掘业务数据集中的每个业务互动对象的业务挖掘节点能够体现出待挖掘业务数据集的业务结构,进而知识点分类网络结合每个业务互动对象对应的业务层级信息向量,得到每个业务互动对象对应的初始知识点深度特征,从而在确定业务互动对象知识点的过程中考虑到了待挖掘业务数据集的业务结构对业务互动对象知识点的影响,提高知识点分类结果的准确性。
在一种可能的设计示例中,对于步骤S150,可以通过以下示例性实施方式实现。
示例性实施方式A:
将位于拓扑模式的待挖掘业务数据集的分布中交叉拓扑位置的业务互动对象作为关键业务互动对象,将拓扑模式的待挖掘业务数据集的分布中任一业务互动对象各自距离关键业务互动对象的业务范围,作为拓扑模式的待挖掘业务数据集的分布中任一业务互动对象各自对应的目标业务范围,将任一业务互动对象各自对应的目标业务范围映射为预设类别范围的业务挖掘节点,得到每个业务互动对象各自对应的业务挖掘节点。
示例性实施方式B:
按照预设的关键业务互动对象模板,从拓扑模式的待挖掘业务数据集的分布中确定关键业务互动对象,在拓扑模式的待挖掘业务数据集的分布中的任一个业务互动对象与关键业务互动对象在同一条业务通道上的情况下,将任一业务互动对象的目标业务范围与关键业务互动对象的目标业务范围的区别业务范围作为该任一业务互动对象的区别业务节点标识。依据待挖掘业务数据集中任一业务互动对象与关键业务互动对象的业务关系,确定任一业务互动对象的区别业务节点维度。组合任一业务互动对象的区别业务节点标识与该任一业务互动对象的区别业务节点维度,得到该任一业务互动对象的区别业务节点。将任一业务互动对象各自对应的区别业务节点映射为预设类别范围的向量,得到每个业务互动对象各自对应的相对业务挖掘节点
示例性实施方式C:
按照预设的关键业务互动对象模板,从拓扑模式的待挖掘业务数据集的分布中确定关键业务互动对象,在拓扑模式的待挖掘业务数据集的分布中的任一个业务互动对象与关键业务互动对象不在同一条业务通道上的情况下,将任一业务互动对象的目标业务范围与关键业务互动对象的目标业务范围的交集业务范围作为该任一业务互动对象的区别业务节点标识,依据待挖掘业务数据集中任一业务互动对象与关键业务互动对象的业务关系,确定任一业务互动对象的区别业务节点维度,组合任一业务互动对象的区别业务节点标识与该任一业务互动对象的区别业务节点维度,得到该任一业务互动对象的区别业务节点,将任一业务互动对象各自对应的区别业务节点映射为预设类别范围的业务挖掘节点,得到每个业务互动对象各自对应的相对业务挖掘节点。
在一种可能的设计思路中,对于步骤S180,可以利用知识点分类网络,对待挖掘业务数据集中的每个业务互动对象对应的绝对业务挖掘节点和知识点深度特征执行映射关联操作,将映射关联操作得到的结果作为待挖掘业务数据集中的每个业务互动对象对应的初始知识点深度特征。
在一种可能的设计思路中,对于步骤S180,可以对待挖掘业务数据集中的每个业务互动对象对应的知识点深度特征执行决策树处理,将每个业务互动对象对应的知识点深度特征转换成决策结果特征清单以及决策标签特征清单,利用每个业务互动对象对应的决策结果特征清单、决策标签特征清单中的决策标签特征清单以及相对业务挖掘节点,得到每个业务互动对象的决策结果特征清单与决策标签特征清单之间的相似度,对每个业务互动对象的决策结果特征清单与决策标签特征清单之间的相似度执行归一化处理,得到每个业务互动对象的相似度对应的权重向量,利用每个业务互动对象的权重向量、每个业务互动对象的决策标签特征清单中的值向量清单以及相对业务挖掘节点得到每个业务互动对象各自对应的初始知识点深度特征。
在一种可能的设计思路中,对于知识点分类网络的训练过程包括以下示例性的实施方式。
(1)获取标定集中的标定数据的标定挖掘业务数据序列、标定挖掘业务数据中每个业务互动对象对应的业务挖掘节点以及参考输出数据列表。
(2)将标定集中的标定数据的标定挖掘业务数据序列以及标定挖掘业务数据中每个业务互动对象对应的业务挖掘节点输入到知识点分类网络中进行训练,得到预测输出数据列表。
(3)利用参考输出数据列表以及预测输出数据列表得到知识点分类网络的损失参数值。
(4)将损失参数值最大化时的模型参数作为知识点分类网络的模型参数,返回将标定集中的标定数据的标定挖掘业务数据序列以及标定挖掘业务数据中每个业务互动对象对应的业务挖掘节点输入到知识点分类网络中进行训练,得到预测输出数据列表的步骤继续训练,直至满足训练停止条件时停止训练。
图3为本公开实施例提供的应用于大数据画像推送的业务处理装置300的功能模块示意图,下面分别对该应用于大数据画像推送的业务处理装置300的各个功能模块的功能进行详细阐述。
第一提取模块310,用于调取移动互联网终端的业务项目大数据中任一目标业务项目数据,提取目标业务项目数据在目标业务画像场景信息中的第一描述信息,第一描述信息表征目标业务项目数据的画像场景特征和/或画像扩展特征。
第二提取模块320,用于利用目标业务项目数据的预设画像场景描述信息对提取的第一描述信息进行处理,得到目标业务项目数据在目标业务画像场景信息中的第二描述信息,第二描述信息表征预设画像场景描述信息与第一描述信息的关联关系。
确定模块330,用于对目标业务项目数据的第一描述信息以及第二描述信息进行映射处理,根据第一描述信息和第二描述信息与目标描述信息的匹配度,确定目标业务项目数据是否为目标业务画像场景信息的目标数据挖掘类型,其中,目标数据挖掘类型用于指示与目标业务画像场景信息相关的挖掘业务对象,目标描述信息为指示目标业务项目数据是否为目标数据挖掘类型的描述信息。
图4示出了本公开实施例提供的用于实现上述的应用于大数据画像推送的业务处理方法的机器学习服务器100的硬件结构示意图,如图4所示,机器学习服务器100可包括处理器110、机器可读存储介质120、总线130以及收发器140。
在具体实现过程中,至少一个处理器110执行机器可读存储介质120存储的计算机执行指令,使得处理器110可以执行如上方法实施例的应用于大数据画像推送的业务处理方法,处理器110、机器可读存储介质120以及收发器140通过总线130连接,处理器110可以用于控制收发器140的收发动作,从而可以与前述的移动互联网终端200进行数据收发。
处理器110的具体实现过程可参见上述机器学习服务器100执行的各个方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
此外,本公开实施例还提供一种可读存储介质,所述可读存储介质中预设有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上应用于大数据画像推送的业务处理方法。
最后,应当理解的是,本说明书中实施例仅用以说明本说明书实施例的原则。其它的变形也可能属于本说明书范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

Claims (10)

1.一种应用于大数据画像推送的业务处理方法,其特征在于,应用于机器学习服务器,所述机器学习服务器与所述多个移动互联网终端通信连接,所述方法包括:
调取所述移动互联网终端的业务项目大数据中任一目标业务项目数据,提取所述目标业务项目数据在目标业务画像场景信息中的第一描述信息,所述第一描述信息表征所述目标业务项目数据的画像场景特征和/或画像扩展特征;
利用所述目标业务项目数据的预设画像场景描述信息对提取的所述第一描述信息进行处理,得到所述目标业务项目数据在所述目标业务画像场景信息中的第二描述信息,所述第二描述信息表征所述预设画像场景描述信息与所述第一描述信息的关联关系;
对所述目标业务项目数据的所述第一描述信息以及所述第二描述信息进行映射处理,根据所述第一描述信息和所述第二描述信息与目标描述信息的匹配度,确定所述目标业务项目数据是否为所述目标业务画像场景信息的目标数据挖掘类型,其中,所述目标数据挖掘类型用于指示与所述目标业务画像场景信息相关的挖掘业务对象,所述目标描述信息为指示所述目标业务项目数据是否为目标数据挖掘类型的描述信息。
2.根据权利要求1所述的应用于大数据画像推送的业务处理方法,其特征在于,所述调取所述移动互联网终端的业务项目大数据中任一目标业务项目数据的步骤,包括:
从所述移动互联网终端的业务项目大数据中选择所述目标业务项目数据,当目标业务画像场景信息中存在与所述目标业务项目数据相同的业务画像标签时,提取所述目标业务项目数据在所述目标业务画像场景信息中的第一描述信息。
3.根据权利要求1所述的应用于大数据画像推送的业务处理方法,其特征在于,所述目标业务项目数据的画像场景特征包括该目标业务项目数据在所述目标业务画像场景信息中的匹配业务信息;
所述画像扩展特征包括所述目标业务项目数据所在业务场景的业务场景特征;
所述预设画像场景描述信息包括所述目标业务项目数据的业务场景特征和所述目标业务项目数据对应的至少一个关键业务数据;
其中,所述利用所述目标业务项目数据的预设画像场景描述信息对提取的所述第一描述信息进行处理,得到所述目标业务项目数据在所述目标业务画像场景信息中的第二描述信息的步骤,包括:
根据所述目标业务项目数据在所述目标业务画像场景信息中的匹配业务信息,确定所述目标业务项目数据的关联业务项目数据中存在的所述目标业务项目数据对应的至少一个关键业务数据,以及每个所述关键业务数据与最关联的所述目标业务项目数据之间的匹配业务数量;
计算所述目标业务项目数据的业务场景特征和所述目标业务项目数据所在业务场景的业务场景特征的匹配度;
将每个所述关键业务数据与最关联的所述目标业务项目数据之间的匹配业务数量以及所述目标业务项目数据的业务场景特征和所述目标业务项目数据所在业务场景的业务场景特征的匹配度,作为所述第二描述信息。
4.根据权利要求1-3中任意一项所述的应用于大数据画像推送的业务处理方法,其特征在于,所述对所述目标业务项目数据的所述第一描述信息以及所述第二描述信息进行映射处理的步骤,包括:
将所述第一描述信息和第二描述信息输入至决策神经网络,计算出所述第一描述信息和第二描述信息与所述目标描述信息的所述匹配度。
5.根据权利要求4所述的应用于大数据画像推送的业务处理方法,其特征在于,所述方法还包括:
获取用于配置所述决策神经网络的样本业务画像场景信息,并对获取的所述样本业务画像场景信息进行业务场景区分处理,所述样本业务画像场景信息包括至少一个指示所述目标业务项目数据是否为目标数据挖掘类型的标签,其中,所述标签为指示所述目标业务项目数据在所述样本业务画像场景信息所属业务场景中是否为目标数据挖掘类型的标签;
从所述样本业务画像场景信息中提取附带所述标签的目标业务项目数据以及该目标业务项目数据的第三描述信息;
利用所述附带所述标签的目标业务项目数据的预设画像场景描述信息对该目标业务项目数据的第三描述信息进行处理,得到所述目标业务项目数据的第四描述信息;
对所述附带所述标签的目标业务项目数据的第三描述信息和第四描述信息进行映射处理,分别记录所述标签表征确定标签的目标业务项目数据对应的第一映射处理结果,以及记录所述标签表征非确定标签的目标业务项目数据对应的第二映射处理结果,将所述第一映射处理结果和所述第二映射处理结果作为所述目标描述信息。
6.根据权利要求5所述的应用于大数据画像推送的业务处理方法,其特征在于,所述根据所述第一描述信息和所述第二描述信息与目标描述信息的匹配度,确定所述目标业务项目数据是否为所述目标业务画像场景信息的目标数据挖掘类型的步骤,包括:
当所述第一描述信息和所述第二描述信息与所述第一映射处理结果的匹配度大于或等于所述第一描述信息和所述第二描述信息与所述第二映射处理结果的匹配度时,确定所述目标业务项目数据为所述目标业务画像场景信息的目标数据挖掘类型。
7.根据权利要求5所述的应用于大数据画像推送的业务处理方法,其特征在于,所述目标业务项目数据具有用于指示所述目标业务项目数据所属业务场景的业务场景标签;
其中,在所述对所述目标业务项目数据的所述第一描述信息以及所述第二描述信息进行映射处理的步骤之后,所述方法还包括:
将所述目标业务项目数据的所属业务场景作为目标业务场景;
对于所述第一描述信息和所述第二描述信息与所述第一映射处理结果的匹配度大于或等于所述第一描述信息和所述第二描述信息与所述第二映射处理结果的匹配度的目标业务项目数据,进行迁移数据识别处理,以消除迁移数据;
对迁移数据识别处理后的目标业务项目数据的进行聚类分析,将所述目标业务项目数据所在的聚类分析结果作为目标数据挖掘类型所在的聚类分析结果,并从所述聚类分析结果中得到所述目标业务场景的所述目标数据挖掘类型。
8.根据权利要求2所述的应用于大数据画像推送的业务处理方法,其特征在于,在调取所述移动互联网终端的业务项目大数据中任一目标业务项目数据的步骤之后,所述方法还包括:
获取预设业务互动微服务;
对所述预设业务互动微服务进行业务场景特征分析,得到所述目标业务项目数据的业务场景特征;
对所述预设业务互动微服务进行关键业务数据分析,得到所述目标业务项目数据对应的至少一个关键业务数据。
9.根据权利要求1-8中任意一项所述的应用于大数据画像推送的业务处理方法,其特征在于,所述方法还包括:
当所述目标业务项目数据为所述目标业务画像场景信息的目标数据挖掘类型时,将所述目标业务项目数据添加到待挖掘业务数据集中;
依据所述待挖掘业务数据集中每个业务互动对象之间的互动模式,得到拓扑模式的待挖掘业务数据集的分布;
依据所述拓扑模式的待挖掘业务数据集的分布的分布特征,计算所述待挖掘业务数据集中的每个业务互动对象在所述拓扑模式的待挖掘业务数据集的分布中的业务挖掘节点,所述业务挖掘节点表示了待挖掘业务数据集中的业务互动对象在所述拓扑模式的待挖掘业务数据集的分布中的业务层级;
将所述待挖掘业务数据集中的每个业务互动对象对应的业务挖掘节点输入到预先配置的知识点分类网络中,利用所述知识点分类网络对所述待挖掘业务数据集中的每个业务互动对象进行知识点深度提取,得到所述待挖掘业务数据集中的每个业务互动对象各自对应的知识点深度特征;
利用所述知识点分类网络,依据所述待挖掘业务数据集中的每个业务互动对象对应的业务挖掘节点以及知识点深度特征,生成所述待挖掘业务数据集中的每个业务互动对象各自对应的初始知识点深度特征;
利用所述知识点分类网络对所述待挖掘业务数据集中的每个业务互动对象各自对应的初始知识点深度特征进行知识点溯源,得到所述待挖掘业务数据集中的每个业务互动对象各自对应的目标知识点对象;
利用所述知识点分类网络确定所述待挖掘业务数据集中的每个业务互动对象各自对应的目标知识点对象的层级顺序,并依据所述层级顺序对所述目标知识点对象进行融合,生成所述待挖掘业务数据集对应的目标推送知识点;
基于所述待挖掘业务数据集对应的目标推送知识点进行信息推送。
10.一种机器学习服务器,其特征在于,所述机器学习服务器包括处理器、机器可读存储介质和单元接口,所述机器可读存储介质、所述单元接口以及所述处理器之间通过总线系统相关联,所述单元接口用于与至少一个移动互联网终端通信连接,所述机器可读存储介质用于存储程序、指令或代码,所述处理器用于执行所述机器可读存储介质中的程序、指令或代码,以执行权利要求1-9中任意一项的应用于大数据画像推送的业务处理方法。
CN202110157165.XA 2021-02-04 2021-02-04 应用于大数据画像推送的业务处理方法及机器学习服务器 Withdrawn CN112839102A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110157165.XA CN112839102A (zh) 2021-02-04 2021-02-04 应用于大数据画像推送的业务处理方法及机器学习服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110157165.XA CN112839102A (zh) 2021-02-04 2021-02-04 应用于大数据画像推送的业务处理方法及机器学习服务器

Publications (1)

Publication Number Publication Date
CN112839102A true CN112839102A (zh) 2021-05-25

Family

ID=75932243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110157165.XA Withdrawn CN112839102A (zh) 2021-02-04 2021-02-04 应用于大数据画像推送的业务处理方法及机器学习服务器

Country Status (1)

Country Link
CN (1) CN112839102A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836191A (zh) * 2021-08-12 2021-12-24 中投国信(北京)科技发展有限公司 基于大数据的智能化业务处理方法及系统
CN114757721A (zh) * 2022-05-25 2022-07-15 淄博至诚电子商务有限公司 用于联合大数据挖掘的业务预测分析方法及ai挖掘系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836191A (zh) * 2021-08-12 2021-12-24 中投国信(北京)科技发展有限公司 基于大数据的智能化业务处理方法及系统
CN114757721A (zh) * 2022-05-25 2022-07-15 淄博至诚电子商务有限公司 用于联合大数据挖掘的业务预测分析方法及ai挖掘系统

Similar Documents

Publication Publication Date Title
CN112000822B (zh) 多媒体资源排序方法、装置、电子设备及存储介质
CN116049397B (zh) 基于多模态融合的敏感信息发现并自动分类分级方法
CN111966914A (zh) 基于人工智能的内容推荐方法、装置和计算机设备
CN107992937B (zh) 基于深度学习的非结构化数据判决方法和装置
CN114861836B (zh) 一种基于人工智能平台的模型部署方法及相关设备
CN113254687B (zh) 图像检索、图像量化模型训练方法、装置和存储介质
CN112839102A (zh) 应用于大数据画像推送的业务处理方法及机器学习服务器
CN104008177B (zh) 面向图像语义标注的规则库结构优化与生成方法及系统
CN114492601A (zh) 资源分类模型的训练方法、装置、电子设备及存储介质
CN112839104A (zh) 应用于大数据推送服务的反馈处理方法及机器学习服务器
CN113255354A (zh) 搜索意图识别方法、装置、服务器及存储介质
CN112417996A (zh) 工业图纸的信息处理方法、装置、电子设备和存储介质
CN112668608A (zh) 一种图像识别方法、装置、电子设备及存储介质
CN112115996A (zh) 图像数据的处理方法、装置、设备及存储介质
CN117171413B (zh) 用于数字藏品管理的数据处理系统及其方法
CN112784008B (zh) 案件相似度确定方法及装置、存储介质、终端
Sarker et al. Transformer-based person re-identification: a comprehensive review
CN113407837A (zh) 基于人工智能的智慧医疗大数据处理方法及智慧医疗系统
CN113139751A (zh) 基于大数据的微服务用户业务类型确定方法
CN112115994A (zh) 图像识别模型的训练方法、装置、服务器及存储介质
CN117078007A (zh) 一种融合尺度标签的多尺度风控系统及其方法
CN115712855A (zh) 一种基于自学习的标签规则产生方法及装置
CN115599953A (zh) 视频文本检索模型的训练方法、检索方法及相关设备
CN112182413B (zh) 一种基于教学大数据的智能推荐方法及服务器
CN114449342A (zh) 视频推荐方法、装置、计算机可读存储介质和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20210525