CN116976353A - 一种数据处理方法、装置、设备以及可读存储介质 - Google Patents

一种数据处理方法、装置、设备以及可读存储介质 Download PDF

Info

Publication number
CN116976353A
CN116976353A CN202310328766.1A CN202310328766A CN116976353A CN 116976353 A CN116976353 A CN 116976353A CN 202310328766 A CN202310328766 A CN 202310328766A CN 116976353 A CN116976353 A CN 116976353A
Authority
CN
China
Prior art keywords
factor
feature
features
characterization
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310328766.1A
Other languages
English (en)
Inventor
邹红建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tenpay Payment Technology Co Ltd
Original Assignee
Tenpay Payment Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tenpay Payment Technology Co Ltd filed Critical Tenpay Payment Technology Co Ltd
Priority to CN202310328766.1A priority Critical patent/CN116976353A/zh
Publication of CN116976353A publication Critical patent/CN116976353A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements

Abstract

本申请公开了一种数据处理方法、装置、设备以及可读存储介质,方法包括:获取对象在业务中的业务表层活动特征,将业务表层活动特征输入至深层挖掘分析模型;深层挖掘分析模型具备基于业务的配置影响因素体系,为表层活动特征深层挖掘一个或多个因素语义表征特征的性能;在深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征;基于业务表层活动特征针对每个配置影响因素的因素语义表征特征,输出对象针对业务的业务策略,以及针对业务策略的策略解释信息。采用本申请可以在业务策略的确定任务中,提升所确定的业务策略的可信性。

Description

一种数据处理方法、装置、设备以及可读存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理方法、装置、设备以及可读存储介质。
背景技术
在人工智能(Artificial Intelligence,AI)领域中,机器学习技术(尤其是深度学习技术)是一个重要研究技术,机器学习技术在诸多业务场景(如金融业务场景、医疗业务场景、媒体数据推荐业务场景等等)中发挥着重要作用。具体的,通过机器学习模型可以输出业务场景中的预测结果,基于这些预测结果可以辅助相关对象(如某个用户)制定业务场景中的重要决策。
然而,在相关技术中,大部分的机器学习模型均为黑盒模型(如深度模型、复杂的非线性模型等等),黑盒模型的预测过程均为黑盒操作,模型的预测逻辑是不透明的,那么模型所输出的预测结果受哪些因素影响也是不公开的,那么对于黑盒模型而言,其很有可能基于错误的预测逻辑来进行预测,所输出的预测结果也是错误的不具备准确性的,也就是说,该模型的输出结果的可信度不够高,在模型的预测结果不具备可信性的情况下,基于该预测结果所确定的业务决策,也是不具备准确性的。
发明内容
本申请实施例提供一种数据处理方法、装置、设备以及可读存储介质,可以在业务策略的确定任务中,提升所确定的业务策略的可信性。
本申请实施例一方面提供了一种数据处理方法,包括:
获取对象在业务中的业务表层活动特征,将业务表层活动特征输入至深层挖掘分析模型;深层挖掘分析模型具备基于业务的配置影响因素体系,为表层活动特征深层挖掘一个或多个因素语义表征特征的性能;配置影响因素体系中包含一个或多个配置影响因素,每个配置影响因素是指会对表层活动特征产生影响的因素;
在深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征;
基于业务表层活动特征针对每个配置影响因素的因素语义表征特征,输出对象针对业务的业务策略,以及针对业务策略的策略解释信息。
本申请实施例一方面提供了另一种数据处理方法,包括:
获取样本对象在业务中的样本业务表层活动特征,将样本业务表层活动特征输入至样本深层挖掘分析模型;样本深层挖掘分析模型具备基于业务的配置影响因素体系,为表层活动特征深层挖掘一个或多个因素语义表征特征的性能;配置影响因素体系中包含一个或多个配置影响因素,每个配置影响因素是指会对表层活动特征产生影响的因素;
在样本深层挖掘分析模型中,基于配置影响因素体系对样本业务表层活动特征进行深层挖掘分析处理,得到样本业务表层活动特征针对每个配置影响因素的初始样本因素语义表征特征;
基于样本业务表层活动特征针对每个配置影响因素的初始样本因素语义表征特征,对样本深层挖掘分析模型进行训练优化,得到深层挖掘分析模型;深层挖掘分析模型用于基于配置影响因素体系,对对象在业务中的业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征。
本申请实施例一方面提供了一种数据处理装置,包括:
特征获取模块,用于获取对象在业务中的业务表层活动特征;
特征输入模块,用于将业务表层活动特征输入至深层挖掘分析模型;深层挖掘分析模型具备基于业务的配置影响因素体系,为表层活动特征深层挖掘一个或多个因素语义表征特征的性能;配置影响因素体系中包含一个或多个配置影响因素,每个配置影响因素是指会对表层活动特征产生影响的因素;
特征分析模块,用于在深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征;
策略输出模块,用于基于业务表层活动特征针对每个配置影响因素的因素语义表征特征,输出对象针对业务的业务策略,以及针对业务策略的策略解释信息。
在一个实施例中,业务为物品推荐业务;配置影响因素包含虚拟资源状态因素;
特征分析模块在深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征的具体方式,可以包括:
在业务表层活动特征中,获取对象与虚拟资源状态因素相关联的虚拟资源活动特征;虚拟资源活动特征包含对象所属的地域信息、对象针对高价值物品的兑换频率;高价值物品是指具备高价值属性的物品;
在地域信息所属的地域类型为优质地域类型,且兑换频率大于频率阈值时,将对象的虚拟资源状态确定为充足状态,生成用于反映充足状态的第一因素语义表征特征,将第一因素语义表征特征确定为业务表层活动特征针对虚拟资源状态因素的因素语义表征特征;
在地域信息所属的地域类型为普通地域类型,或兑换频率小于频率阈值时,将对象的虚拟资源状态确定为欠缺状态,生成用于反映欠缺状态的第二因素语义表征特征,将第二因素语义表征特征确定为业务表层活动特征针对虚拟资源状态因素的因素语义表征特征。
在一个实施例中,配置影响因素体系中包括配置影响因素Si,i为正整数;
特征分析模块在深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征的具体方式,可以包括:
在深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,输出业务表层活动特征针对每个配置影响因素的初始因素语义表征特征;
对业务表层活动特征针对配置影响因素Si的初始因素语义表征特征进行语义约束处理,得到业务表层活动特征针对配置影响因素Si的因素语义表征特征。
在一个实施例中,特征分析模块对业务表层活动特征针对配置影响因素Si的初始因素语义表征特征进行语义约束处理,得到业务表层活动特征针对配置影响因素Si的因素语义表征特征的具体方式,可以包括:
将业务表层活动特征针对配置影响因素Si的初始因素语义表征特征,确定为目标初始表征特征,将业务表层活动特征针对每个配置影响因素的初始因素语义表征特征中,除目标初始表征特征以外的每个初始深层语义表征特征,均确定为目标初始表征特征对应的待融合表征特征;目标初始表征特征对应的待融合表征特征包含待融合表征特征Sj,j为正整数;
将目标初始表征特征与待融合表征特征Sj进行融合处理,得到待融合表征特征Sj对应的融合表征特征Rj
当确定出每个待融合表征特征分别对应的融合表征特征时,基于每个待融合表征特征分别对应的融合表征特征,对目标初始表征特征进行语义约束处理,得到业务表层活动特征针对配置影响因素Si的因素语义表征特征。
在一个实施例中,特征分析模块基于每个待融合表征特征分别对应的融合表征特征,对目标初始表征特征进行语义约束处理,得到业务表层活动特征针对配置影响因素Si的因素语义表征特征的具体方式,可以包括:
获取待聚类对象集合;待聚类对象集合中包括至少两个待聚类对象;
基于目标初始表征特征,对至少两个待聚类对象进行聚类处理,得到第一类簇分布结果;第一类簇分布结果中包含第一类簇与第二类簇;第一类簇所属的类簇类别为基于配置影响因素Si所衍生的第一因素类别;第二类簇所属的类簇类别为基于配置影响因素Si所衍生的第二因素类别;第一因素类别与第二因素类别不同;
基于融合表征特征Rj,对至少两个待聚类对象进行聚类处理,得到第二类簇分布结果;第二类簇分布结果中包含第三类簇与第四类簇;第三类簇所属的类簇类别为第一因素类别;第四类簇所属的类簇类别为第二因素类别;
根据第一类簇、第二类簇、第三类簇以及第四类簇,确定目标初始表征特征针对融合表征特征Rj的特征区分属性;
当确定出目标初始表征特征分别针对每个融合表征特征的特征区分属性时,基于每个特征区分属性,确定业务表层活动特征针对配置影响因素Si的因素语义表征特征。
在一个实施例中,特征分析模块根据第一类簇、第二类簇、第三类簇以及第四类簇,确定目标初始表征特征针对融合表征特征Rj的特征区分属性的具体方式,可以包括:
获取至少两个待聚类对象中,每个待聚类对象分别对应的真实因素类别标签;
将真实因素类别标签为第一因素类别的待聚类对象,组合得到第一真实标签类簇,将真实因素类别标签为第二因素类别的待聚类对象,组合得到第二真实标签类簇;
基于第一类簇、第二类簇、第一真实标签类簇以及第二真实标签类簇,确定目标初始表征特征对应的第一聚类误差;
基于第三类簇、第四类簇、第一真实标签类簇以及第二真实标签类簇,确定融合表征特征Rj对应的第二聚类误差;
在第一聚类误差大于第二聚类误差,且第一聚类误差与第二聚类误差之间的误差差值绝对值大于差值阈值时,确定目标初始表征特征,针对融合表征特征Rj的特征区分属性为特征异常区分属性;
在第一聚类误差小于第二聚类误差,或第一聚类误差与第二聚类误差之间的误差差值绝对值小于差值阈值时,确定目标初始表征特征,针对融合表征特征Rj的特征区分属性为特征正常区分属性。
在一个实施例中,特征分析模块基于每个特征区分属性,确定业务表层活动特征针对配置影响因素Si的因素语义表征特征的具体方式,可以包括:
将每个特征区分属性所组成的集合确定为属性集合;
遍历属性集合;
若属性集合中存在特征异常区分属性,则确定目标初始表征特征的特征约束属性为约束不足属性,基于误差差值绝对值对深层挖掘分析模型进行优化,在优化后的深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征;
若属性集合中不存在特征异常区分属性,则确定目标初始表征特征的特征约束属性为约束充足属性,将目标初始表征特征语义表征特征,确定为业务表层活动特征针对配置影响因素Si的因素语义表征特征。
在一个实施例中,业务为媒体数据推荐业务;业务策略是指针对对象的推荐媒体数据;策略解释信息是指针对推荐媒体数据的推荐解释信息;
策略输出模块基于业务表层活动特征针对每个配置影响因素的因素语义表征特征,输出对象针对业务的业务策略,以及针对业务策略的策略解释信息的具体方式,可以包括:
将业务表层活动特征针对每个配置影响因素的因素语义表征特征,所组成的集合确定为因素语义表征特征集合;
将因素语义表征特征集合输入至媒体数据推荐模型;媒体数据推荐模型是基于样本对象在媒体数据推荐业务的样本因素语义表征特征集合,对样本媒体数据推荐模型进行训练优化后所得到的;样本因素语义表征特征集合包含样本业务表层活动特征,针对每个配置影响因素的样本因素语义表征特征;样本业务表层活动特征,是指样本对象在媒体数据推荐模型中的表层活动特征;
通过媒体数据推荐模型,输出因素语义表征特征集合对应的推荐媒体数据;
基于媒体数据推荐模型的模型属性,确定针对推荐媒体数据的推荐解释信息。
在一个实施例中,媒体数据推荐模型的模型属性为黑盒属性;
策略输出模块通过基于媒体数据推荐模型的模型属性,确定针对推荐媒体数据的推荐解释信息的具体方式,可以包括:
获取用于对媒体数据推荐模型所输出的模型结果进行结果解释的可解释模型;
将因素语义表征特征集合与推荐媒体数据,输入至可解释模型,通过可解释模型输出因素语义表征特征集合中,每个因素语义表征特征分别对应的特征影响值,得到特征影响值集合;特征影响值集合中的一个特征影响值,用于表征对应的因素语义表征特征对推荐媒体数据的影响程度;
基于特征影响值集合,生成针对推荐媒体数据的推荐解释信息。
在一个实施例中,策略输出模块基于特征影响值集合,生成针对推荐媒体数据的推荐解释信息的具体方式,可以包括:
按照特征影响值集合中每个特征影响值的大小顺序,对每个特征影响值进行排序,得到影响值序列;
将影响值序列中的前K个特征影响值所分别对应的因素语义表征特征,均确定为高影响表征特征;
基于高影响表征特征所反映的因素语义,生成针对推荐媒体数据的推荐解释信息。
本申请实施例一方面提供了另一种数据处理装置,包括:
样本特征输入模块,用于获取样本对象在业务中的样本业务表层活动特征,将样本业务表层活动特征输入至样本深层挖掘分析模型;样本深层挖掘分析模型具备基于业务的配置影响因素体系,为表层活动特征深层挖掘一个或多个因素语义表征特征的性能;配置影响因素体系中包含一个或多个配置影响因素,每个配置影响因素是指会对表层活动特征产生影响的因素;
特征挖掘模块,用于在样本深层挖掘分析模型中,基于配置影响因素体系对样本业务表层活动特征进行深层挖掘分析处理,得到样本业务表层活动特征针对每个配置影响因素的初始样本因素语义表征特征;
模型优化模块,用于基于样本业务表层活动特征针对每个配置影响因素的初始样本因素语义表征特征,对样本深层挖掘分析模型进行训练优化,得到深层挖掘分析模型;深层挖掘分析模型用于基于配置影响因素体系,对对象在业务中的业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征。
在一个实施例中,配置影响因素体系中包括配置影响因素Si,i为正整数;
模型优化模块基于样本业务表层活动特征针对每个配置影响因素的初始样本因素语义表征特征,对样本深层挖掘分析模型进行训练优化,得到深层挖掘分析模型的具体方式,可以包括:
将样本业务表层活动特征针对配置影响因素Si的初始样本因素语义表征特征,确定为目标初始样本表征特征;
对目标初始样本表征特征进行语义约束处理,得到目标初始样本表征特征对应的样本特征约束属性;
当确定出每个初始样本因素语义表征特征分别对应的样本特征约束属性时,将每个初始样本因素语义表征特征分别对应的样本特征约束属性,所组成的集合确定为样本约束属性集合;
若样本约束属性集合中存在约束不足属性,则基于约束不足属性所对应的初始样本因素语义表征特征,对样本深层挖掘分析模型的模型参数进行调整,得到调整后的模型参数,将包含调整后的模型参数的样本深层挖掘分析模型确定为深层挖掘分析模型;
若样本约束属性集合中不存在约束不足属性,则将样本深层挖掘分析模型确定为深层挖掘分析模型。
本申请实施例一方面提供了一种计算机设备,包括:处理器和存储器;
存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行本申请实施例中的方法。
本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序包括程序指令,程序指令当被处理器执行时,执行本申请实施例中的方法。
本申请的一个方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该计算机设备执行本申请实施例中一方面提供的方法。
在本申请实施例中,在为某个对象制定针对某个业务的业务策略时,可以先获取到该对象在该业务中的业务表层活动特征,通过深层挖掘分析模型可以对该业务表层活动特征进行深层挖掘分析处理,从而可以将业务表层活动特征转换为一个或多个深层次的因素语义表征特征;随后即可基于这些因素语义表征特征,来确定该对象在该业务的业务策略,除此之外,还可以基于因素语义表征特征,输出该业务策略的策略解释信息(用于解释该业务策略的信息)。应当理解,本申请可以构建业务的配置影响因素体系,再通过深层挖掘分析模型可以将对象在业务中的业务表层活动特征,转换为深层次的因素语义表征特征,对于对象针对业务的业务策略,是基于深层次的因素语义表征特征所确定输出的,并不是就表层的活动特征所确定的,可以很好地提升业务策略的准确性;此外,在本申请中,在确定输出业务策略的同时,还可以输出该业务策略的策略解释信息,该策略解释信息可以很好地解释确定该业务策略的缘由,由此可以直观呈现该业务策略的确定逻辑,可以很好地提升业务策略的可信度,同时,由于该策略解释信息是基于深层次的因素语义表征特征所确定的,该策略解释信息的解释层次也是较高的,由此可以进一步提升该业务策略的可信度。综上,本申请可以在业务策略的确定任务中,提升所确定的业务策略的可信性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种网络架构图;
图2是本申请实施例提供的一种数据处理方法的流程示意图;
图3是本申请实施例提供的一种表层活动特征与因素语义表征特征之间的对应关系示意图;
图4是本申请实施例提供的一种细节表层特征与因素语义表征特征之间的对应关系示意图;
图5是本申请实施例提供的一种对因素语义表征特征进行语义约束处理的流程示意图;
图6是本申请实施例提供的另一种数据处理方法的流程示意图;
图7是本申请实施例提供的一种系统流程示意图;
图8是本申请实施例提供的一种构建可解释任务模型的系统架构图;
图9是本申请实施例提供的一种数据处理装置的结构示意图;
图10是本申请实施例提供的另一种数据处理装置的结构示意图;
图11是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例涉及人工智能及其相关概念,为便于理解,以下将优先对人工智能及其相关概念进行简要阐述:
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案属于人工智能领域下属的机器学习((MachineLearning,ML)。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
为便于理解,请参见图1,图1是本申请实施例提供的一种网络架构图。如图1所示,该网络架构可以包括业务服务器1000和终端设备集群,终端设备集群可以包括一个或者多个终端设备,这里将不对终端设备的数量进行限制。如图1所示,多个终端设备可以包括终端设备100a、终端设备100b、终端设备100c、…、终端设备100n;如图1所示,终端设备100a、终端设备100b、终端设备100c、…、终端设备100n可以分别与业务服务器1000进行网络连接,以便于每个终端设备可以通过该网络连接与业务服务器1000之间进行数据交互。
可以理解的是,如图1所示的每个终端设备均可以安装有目标应用,当该目标应用运行于各终端设备中时,可以分别与图1所示的业务服务器1000之间进行数据交互,使得业务服务器1000可以接收来自于每个终端设备的业务数据。其中,该目标应用可以包括具有显示文字、图像、音频以及视频等数据信息功能的应用,其中,应用可以包括多媒体应用(例如,视频类应用),可以用于用户上传图片或视频,也可以用于用户播放观看他人上传的图像或视频;应用也可以为娱乐类应用(如游戏应用),可以用于用户进行游戏;除此之外,应用还可以为其他任一具备数据处理功能的应用,如教育类应用、通信应用、购物应用、浏览器应用等等,这些应用均可以具有多媒体数据(例如,图片、视频、音乐)加载和播放功能。示例性地,该应用可以为通信应用、教育应用、短视频应用、游戏应用等等。其中,应用可以为小程序,即只需要下载到浏览器环境中就可以运行的程序独立的程序,当然,应用可以为独立应用,也可以为嵌入在某一应用中的子应用(如小程序),该子应用可以由用户控制运行或关闭。总而言之,应用可以为任意形式的应用、模块或插件,对此不进行限定。
本申请实施例可以在多个终端设备中选择一个终端设备作为目标终端设备,该终端设备可以包括:智能手机、平板电脑、笔记本电脑、桌上型电脑、智能电视、智能音箱、台式计算机、智能手表、智能车载、智能语音交互设备、智能家电等携带多媒体数据处理功能(例如,视频数据播放功能、音乐数据播放功能、文本数据播放功能)的智能终端,但并不局限于此。例如,本申请实施例可以将图1所示的终端设备100a作为该目标终端设备,该目标终端设备中可以集成有上述目标应用,此时,该目标终端设备可以通过该目标应用与业务服务器1000之间进行数据交互。本申请中的业务服务器1000可以根据这些应用获取到业务数据,如,业务服务器1000可通过用户的绑定账号获取到业务数据。其中,绑定账号可以是指用户在应用中绑定的账号;用户可以通过其对应的绑定账号登录应用、上传数据、获取数据等等,而业务服务器也可以通过其绑定账号获取用户的登录状态、上传的数据、向用户发送数据等等。
应当理解,用户在使用终端设备中的目标应用(如动作检测应用)时,业务服务器1000通过该终端设备,可以检测并收集到该用户(以下将称之为对象)在该目标应用中所产生的表层活动特征(上述业务服务器1000所获取到的业务数据即可理解为表层活动特征),例如,以目标应用为购物应用为例,对象启动运行购物应用的频率、对象在购物应用对某个物品(如粉底液)的浏览频率、对象在购物应用中对某个物品(如面膜)的购买频率均可以作为该对象在该购物应用中的表层活动特征,也就是说,表层活动特征可以是指在目标应用中能够观察到的行为活动特征,该表层活动特征用于描述目标应用中能够观察到的表面现象(表象),该表层活动特征可以直接采集获取得到。应当理解,随着计算机技术的发展,在目标应用中,可基于对象的表层活动特征为该对象推荐相关信息,例如,在购物应用中,可以基于对象购买频率较高的物品(可称之为高频率购买物品),向该对象推荐与该高频率购买物品相关联的其他物品(例如,高频率购买物品为粉底液为例,基于该粉底液,可以向该对象推荐定妆产品)。
应当理解,一个对象的表象行为,可能基于不同的影响因素所产生,例如,以购物应用为例,某个对象在该购物应用中购买物品的频率较高、且每一次购买的物品均需消耗大量的虚拟资源(虚拟资源可以是指货币,例如,可将美金等具有价值波动范围的通用货币称为虚拟资源;本申请也可将游戏货币统称为虚拟资源,例如,可将游戏场景中的游戏金币、游戏经验值、游戏积分以及游戏钻石等游戏货币称为虚拟资源;本申请还可以将虚拟物品统称为虚拟资源,例如,可以将虚拟烟花、虚拟气球、虚拟飞机等等称为虚拟资源),那么对于该对象在购物应用中发生这些行为的影响因素可能是该对象具备充足的虚拟资源(该对象所拥有的虚拟资源较多);仍以购物应用为例,某个对象在该购物应用中购买美妆类物品的频率较高,那么对于该对象在购物应用中发生这些行为的影响因素可能是该对象存在美妆喜好。也就是说,某个对象产生表层活动特征的原因,包括有多个因素,相比于表层活动特征,这些影响因素可以深层次的更精准的反映目标应用中的相关信息。
基于此,为了提升目标应用中,为对象推荐物品的合理性,本申请中,可以预先为目标应用中的活动预先配置构建一个影响因素体系,得到一个配置影响因素体系,在该配置影响因素体系中可以包含有不同的会对目标应用中所发生的行为活动造成影响的配置影响因素(一个配置影响因素可以是指一个影响维度,例如,对象的虚拟资源状态维度、产品质量维度、宏观环境维度等等)。而业务服务器1000在获取到对象在目标应用中的表层活动特征后,可以基于该配置影响因素体系,对该表层活动特征进行深层挖掘分析,以得到该表层活动特征在各个配置影响因素上的因素语义表征特征(因素语义表征特征是指用于反映配置影响因素的语义的深层特征),随后,即可基于深层次的因素语义表征特征,来确定该对象在该目标应用中的业务策略(例如,在购物应用中,确定针对该对象的推荐物品)。当然,对于业务服务器1000所确定的针对对象的业务策略,可以作为一个辅助参考值,用于目标应用中的相关对象(制定策略的对象)进行参考,以确定该对象的最终策略。那么,在本申请中,为了提升业务服务器1000所确定的业务策略的可信度,业务服务器1000在输出该对象的业务策略的同时,还可以同时输出针对该业务策略的策略解释信息,该策略解释信息可用于描述确定该业务策略的缘由(该业务策略是基于因素语义表征特征所确定的),该策略解释信息在一定程度上可以反映该业务服务器1000确定该业务策略的逻辑,基于该策略解释信息,可以很好地提升业务策略的可信度,由此可以提升目标应用的策略制定对象(制定策略的对象)所确定的最终策略的准确性与合理性。
应当理解,一个目标应用可以对应一个或多个(多个是指两个及两个以上)业务,例如,购物应用可以对应购物业务,短视频应用可以对应媒体数据推荐业务,游戏应用可以对应资讯推送应用等等。对象在目标应用中的表层活动特征,可以理解为对象在业务中的表层活动特征,那么可以将某个对象的表层活动特征,称为业务表层活动特征。对于某个对象的业务表层活动特征,业务服务器1000具体可以通过深层挖掘分析模型来对业务表层活动特征进行深层挖掘分析处理,以得到业务表层活动特征的深层次的因素语义表征特征。其具体实现方式,可以参见后续实施例中的描述。
应当理解,本申请实施例所提供的方法,可应用于不同的领域。例如,可以应用于金融领域(在金融领域中,可以预先配置可能会对金融活动产生影响的影响因素体系,那么在获取到对象对不同的金融产品的表层活动特征后,可以通过深层挖掘分析模型,对表层活动特征进行深层挖掘分析处理,得到该表层活动特征在各个影响因素上的因素语义表征特征后,即可基于该深层次的因素语义表征特征为该对象制定金融领域中的相关策略,例如,为该对象确定所推荐的金融产品或金融资讯等;即,本申请可应用于金融领域中的金融产品推荐、金融资讯推荐等)、医疗领域(在医疗领域中,可以预先配置可能会对医疗活动产生影响的影响因素体系,那么在获取到对象在医疗领域中的表层活动特征后,可以通过深层挖掘分析模型,对表层活动特征进行深层挖掘分析处理,得到该表层活动特征在各个影响因素上的因素语义表征特征后,即可基于该深层次的因素语义表征特征为该对象制定医疗领域中的相关策略,例如,为该对象推荐医疗资讯、医疗产品等;即,本申请可应用于医疗领域中的医疗产品推荐、医疗资讯推荐等)。当然,上述的应用领域仅是举例说明,对于本申请所提供的方法的应用领域,并不限制于此,例如,还可以应用于任一决策领域,如广告推荐领域中,这里将不再一一进行举例说明。
应当理解,本申请可以构建业务的配置影响因素体系,再通过深层挖掘分析模型可以将对象在业务中的业务表层活动特征,转换为深层次的因素语义表征特征,对于对象针对业务的业务策略,是基于深层次的因素语义表征特征所确定输出的,并不是就表层的活动特征所确定的,可以很好地提升业务策略的准确性;此外,在本申请中,在确定输出业务策略的同时,还可以输出该业务策略的策略解释信息,该策略解释信息可以很好地解释确定该业务策略的缘由(受哪些深层次的特征所影响),由此可以直观呈现该业务策略的确定逻辑,可以很好地提升业务策略的可信度,同时,由于该策略解释信息是基于深层次的因素语义表征特征所确定的,该策略解释信息的解释层次也是较高的,由此可以进一步提升该业务策略的可信度,由此可以很好地辅助相关独享制定最终的业务策略。
可以理解的是,本申请实施例提供的方法可以由计算机设备执行,计算机设备包括但不限于终端设备或业务服务器。其中,业务服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
其中,终端设备以及业务服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
可选的,可以理解的是,上述计算机设备(如上述业务服务器1000、终端设备100a、终端设备100b等等)可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成的点对点(P2P,Peer To Peer)网络,P2P协议是一个运行在传输控制协议(TCP,Transmission Control Protocol)协议之上的应用层协议。在分布式系统中,任意形式的计算机设备,比如业务服务器、终端设备等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。为便于理解,以下将对区块链的概念进行说明:区块链是一种分布式数据存储、点对点传输、共识机制以及加密算法等计算机技术的新型应用模式,主要用于对数据按时间顺序进行整理,并加密成账本,使其不可被篡改和伪造,同时可进行数据的验证、存储和更新。当计算机设备为区块链节点时,由于区块链的不可被篡改特性与防伪造特性,可以使得本申请中的数据(如用户的表层活动特征等等)具备真实性与安全性,从而可以使得基于这些数据进行相关数据处理后,得到的结果更为可靠。
需要说明的是,在本申请的具体实施方式中,涉及到用户信息、用户数据(如用户所执行的操作、用户的表层活动特征等数据)等相关的数据,均是需要经过用户授权许可(即经过用户同意)才进行获取得到的。也就是说,当本申请以上实施例运用到具体产品或技术中时,本申请实施例所提供的方法与相关功能(如推荐功能)是在获得用户许可或者同意下所运行的(可以由用户主动开启本申请实施例所提供的功能),且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
进一步地,为便于理解,请参见图2,图2是本申请实施例提供的一种数据处理方法的流程示意图。本申请实施例所提供的方法可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。该方法可以由终端设备(例如,上述图1所示的终端设备集群中的任一终端设备,如终端设备100a)执行,也可以由上述业务服务器(如上述图1所对应实施例中的业务服务器1000)所执行,还可以由终端设备和业务服务器共同执行。为便于理解,本实施例以该方法由上述业务服务器执行为例进行说明。如图2所示,该数据处理方法至少可以包括以下步骤S101-步骤S103:
步骤S101,获取对象在业务中的业务表层活动特征,将业务表层活动特征输入至深层挖掘分析模型;深层挖掘分析模型具备基于业务的配置影响因素体系,为表层活动特征深层挖掘一个或多个因素语义表征特征的性能;配置影响因素体系中包含一个或多个配置影响因素,每个配置影响因素是指会对表层活动特征产生影响的因素。
本申请中,业务可以是指某个应用领域中服务于用户的功能业务,例如,业务可以是指金融领域中的金融资讯推荐业务、金融产品推荐业务、搜索查询关键词指引业务(可以理解为搜索Query建议业务)、关联产品展示业务等等;也可以是指医疗领域中的医疗建议业务、医疗产品推荐业务等等;还可以是指健康领域中食物搭配推荐业务等等。以上应用领域以及应用领域中的业务仅是举例描述,对于本申请中的应用领域以及应用领域中的业务,当然并不限制于此,例如,应用领域还可以为保险领域、多媒体领域,而业务可以是指保险领域中的保险项目推荐业务、多媒体领域中的广告推荐业务等等,这里将不再一一进行举例描述。
应当理解,在不同业务中,不同对象(如用户)会产生不同的行为,本申请可以将对象在某个业务中所产生的行为理解为该对象在该业务中的行为活动,而这些行为活动是能够直观观察到或直接采集获取得到的,那么可以将其理解为对象在该业务中的表象行为活动(或表层行为活动),基于此,本申请将对象在业务中的表象行为活动(或表层行为活动)称之为表层活动特征。也就是说,对象在业务中的表层活动特征,可以是指该对象在业务中能够观察到的浮于表面的行为活动特征,该表层活动特征用于描述对象在业务中能够观察到的表面现象。例如,以业务为购物业务为例,对象在购物业务中,对不同物品(商品)的浏览时长、对不同物品(商品)的浏览频率、对携带物品的广告的点击率、对不同物品的收藏率、对不同物品的购买频率等等活动行为,均可以作为该对象在该购物业务中的表层活动特征。
基于上述可知,表层活动特征是指仅描述表层现象的行为活动特征,在一定程度上,该表层活动特征的特征层次是表面层次,其并不能够准确的对业务中的本质规律进行表征,基于此,本申请在获取到对象在业务中的表层活动特征后,可以对其进行深层挖掘分析处理,以得到表层活动特征对应的深层特征。其中,应当理解,对象的一个表层行为活动,可能会受多种因素的影响,而这里的深层特征,即可为用于反映不同因素的语义的特征,换言之,深层特征是指深层次的会对对象的表层行为活动造成影响的特征,一个表层活动特征可能对应多个深层特征(一个表层活动特征可能会受多种因素的影响,那么一个表层活动特征可能会受多个深层特征的影响),一个深层特征也可能反映在多个表层活动特征上(即同一个深层特征可能产生不同的行为活动)。以业务为购物业务为例,假设对象的表层活动特征为“对某个价格很高的商品的广告页面的点击率很高”,那么造成该表层行为活动的因素可能包含虚拟资源状态因素(如,该对象的虚拟资源充足)、商品类型匹配因素(如,该商品的商品类型符合该对象的购买喜好)、商品质量因素(如,该商品的质量较好)等等,而每个因素,本申请可以生成一个表征其因素语义的深层特征(可理解为因素语义表征特征,因素语义表征特征用于表征某个影响因素的语义)。
也就是说,本申请中,表层特征(如表层活动特征)是指描述表层现象的特征,而为了透过表层现象了解业务的本质规律,本申请可以对表层活动特征进行深层挖掘处理,以确定出影响该表层活动特征的因素,进而得到用于表征该因素的深层特征(称之为因素语义表征特征),由此,即可基于表层活动特征的因素语义表征特征,来精准的反映业务的本质。具体的,对于各个对象的表层活动特征,本申请可以通过深层挖掘分析模型来对表层活动特征进行深层挖掘处理,以得到用于表征表层活动特征的深层特征,而为了提升深层挖掘分析模型通过表层活动特征分析本质的性能,本申请可以预先为不同的业务构建一个影响因素体系,例如,本申请可以通过人工或半自动的方式预先为不同的业务,配置可能会对业务中的表层行为活动造成影响的因素,由此得到配置影响因素体系,随后,深层挖掘分析模型即可基于该配置影响因素体系,来对表层活动特征进行深层挖掘分析处理,以得到表层活动特征在每个配置影响因素上的因素语义表征特征(一个因素语义表征特征用于表征一个配置影响因素的语义)。
也就是说,本申请中的配置影响因素体系,可以通过人工或半自动的方式预先进行配置,由于在不同的业务场景中,对对象的表层行为活动造成影响的因素会存在不同,那么不同业务的配置影响因素体系也是不同的,即配置影响因素体系会随着业务的不同而不同,每个配置影响因素体系用于完整刻画会对业务中的表层行为活动造成影响的因素。例如,以应用领域为金融领域为例,对于金融领域的金融产品推荐业务而言,会对金融产品推荐业务中的表层行为活动造成影响的因素可能会有对象的虚拟资源状态因素、对象对金融产品的投资偏好因素、对象对金融产品的类型偏好因素、活动时间规律因素、宏观环境因素等等,那么这些因素均可作为该金融产品推荐业务的配置影响因素,而这些配置影响因素即可组成该金融产品推荐业务的配置影响因素体系。
需要说明的是,为了提升深层挖掘分析模型所输出的因素语义表征特征的准确性,本申请可以对深层挖掘分析模型进行训练优化处理,其中,对于对深层挖掘分析模型进行训练优化处理的过程,可以采用机器学习(如深度学习)的方式来对深层挖掘分析模型进行训练优化,对深层挖掘分析模型进行训练优化的具体方式可以参见后续实施例中的相关描述。
步骤S102,在深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征。
本申请中,基于上述可知,对象在业务中的表层活动特征可称之为业务表层活动特征,而对于对象在的业务表层活动特征,可能包含有通过不同影响因素所影响而产生的表层行为活动,那么在深层挖掘分析模型中,即可基于配置影响因素体系,来对该业务表层活动特征进行深层挖掘分析处理,以挖掘为该业务表层活动特征带来影响的因素有哪些,从而生成用于表征每个因素的因素语义表征特征,也就是说,深层挖掘分析模型最终输出的因素语义表征特征,可以包含有每个配置影响因素分别对应的因素语义表征特征(一个因素语义表征特征用于表征一个配置影响因素的语义)。需要说明的是,配置影响因素体系中所包含的配置影响因素,是预先配置的可能会对不同对象在业务中的行为活动造成影响的因素,而实际上,对于某个对象而言,并不是所有的配置影响因素均会影响其在业务中的行为活动,那么对于对象的业务表层活动特征而言,对于业务表层活动特征实际造成影响的配置影响因素可能仅为配置影响因素体系中的部分因素(即某些配置影响因素可能并未对该业务表层活动特征造成影响,或造成的影响非常小),那么对于这种情况,可以将这些未造成影响或造成的影响极小的配置影响因素,理解为业务表层活动特征的无效配置影响因素,那么由于无效配置影响因素并未对业务表层活动特征造成影响,深层挖掘分析模型在进行深层挖掘分析后,所输出的因素语义表征特征中,这些无效配置影响因素的因素语义表征特征可能为无效值(如输出空值)。换言之,深层挖掘分析模型通过对业务表层活动特征进行深层挖掘分析处理,会分析出配置影响因素体系中,对业务表层活动特征带来影响的因素有哪些,随后即可生成用于表征这些配置影响因素的语义的深层特征(因素语义表征特征),而未对业务表层活动特征带来影响的因素,深层挖掘分析模型即可输出空值,通过深层挖掘分析模型的输出结果,即可确定出对业务表层活动特征带来影响的因素有哪些。
为便于理解在深层挖掘分析模型中对业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征的具体方式,以下将以业务为物品推荐业务(购物领域中的物品推荐业务)、配置影响因素包含会对虚拟资源状态因素为例,对在深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征的具体方式进行说明。其具体方式可为:在业务表层活动特征中,可以获取对象与虚拟资源状态因素相关联的虚拟资源活动特征;其中,虚拟资源活动特征可以包含对象所属的地域信息、对象针对高价值物品的兑换频率;其中,高价值物品是指具备高价值属性的物品;随后,即可基于这些虚拟资源活动特征进行判断,例如,在地域信息所属的地域类型为优质地域类型,且兑换频率大于频率阈值时,即可将对象的虚拟资源状态确定为充足状态,并生成用于反映充足状态的第一因素语义表征特征,且将第一因素语义表征特征确定为业务表层活动特征针对虚拟资源状态因素的因素语义表征特征;而在地域信息所属的地域类型为普通地域类型,或兑换频率小于频率阈值时,即可将对象的虚拟资源状态确定为欠缺状态,并生成用于反映欠缺状态的第二因素语义表征特征,且将第二因素语义表征特征确定为业务表层活动特征针对虚拟资源状态因素的因素语义表征特征。
应当理解,虚拟资源状态可以理解为对象所拥有的虚拟资源的总量的状态,若某个对象所拥有的虚拟资源的总量较多,即可确定该对象的虚拟资源状态为资源充足状态,那么该对象大概率会在购物领域中购买较多的物品,也很有可能会在购物领域中购买价格较贵的物品(即具备高价值属性的物品,本申请称之为高价值物品),此外,在某个对象的虚拟资源充足的情况下,该对象的活动区域可能也会在较为优质的地域(即其所属地域类型属于优质地域类型。本申请可以将各个对象所属的地域进行类型划分,例如,可以将活跃性较差、位置较为偏远的、低消费的地域的类型划分为普通地域类型,将活跃性较高、位置较为靠近中心地域的高消费的地域的类型划分为优质地域类型,具体的地域类型划分的方法可以基于实际情况来确定,这里将不进行限制),那么在获取到业务表层活动特征后,若期望确定虚拟资源状态因素是否对其造成了影响,此时即可在业务表层活动特征中查询是否存在由虚拟资源状态因素影响才会产生的这些行为特征也就是查询业务表层活动特征中是否存在虚拟资源活动特征,即对象所属的地域信息、对象针对高价值物品的兑换频率(兑换频率可以理解为采用虚拟资源去兑换高价值物品的频率,也就是购买高价值物品的频率)等等,基于这些虚拟资源活动特征,即可确定该对象的虚拟资源状态为充足状态还是欠缺状态(某个对象所拥有的虚拟资源的总量较少,即可确定该对象的虚拟资源状态为资源欠缺状态)。
进一步地,在确定出对象的虚拟资源状态后,即可生成用于反映该对象的虚拟资源状态的深层特征,该深层特征即可作为该对象虚拟资源状态因素上的因素语义表征特征。例如,在对象的虚拟资源状态为资源充足状态(也可称为充足状态)时,即可生成用于反映充足状态的深层特征,作为该对象虚拟资源状态因素上的因素语义表征特征;在对象的虚拟资源状态为资源欠缺状态(也可称为欠缺状态)时,即可生成用于反映欠缺状态的深层特征,作为该对象虚拟资源状态因素上的因素语义表征特征。
应当理解,资源充足状态与资源欠缺状态,均可作为虚拟资源状态因素的一个因素类别,而不同的配置影响因素可以存在不同的因素类别,例如,以配置影响因素为宏观环境为例,宏观环境具体可以包含环境良好与环境差这两种状态,那么对于宏观环境这一配置影响因素而言,其因素类别为“环境良好”与“环境差”,宏观环境的因素类别,与虚拟资源状态因素的因素类别,并不一致。也就是说,配置影响因素的因素类别,是基于配置影响因素自身所衍生的,不同配置影响因素的因素类别,可能并不一致。
需要说明的是,以上是为便于理解对业务表层活动特征进行深层挖掘分析处理的方式所作出的举例说明,并非是限定虚拟资源活动特征仅包含对象所属的地域信息与针对高价值物品的兑换频率,也并非是限定配置影响因素包含有虚拟资源状态因素,对于业务的配置影响因素体系,可以通过人工经验所实际确定,对于某个配置影响因素体系的活动特征,也是基于实际所灵活确定,本申请对其并不进行限制。
应当理解,基于上述可知,表层活动特征可能受多个配置影响因素所影响,即表层活动特征可能对应不同的因素语义表征特征,而表层活动特征中包含有不同类型的活动特征(如上述虚拟资源活动特征),表层活动特征中的部分特征可能是由配置影响因素A所影响,部分特征可能是由配置影响因素B所影响,即,那么基于表层活动特征中不同的活动特征,可以挖掘分析得到不同的因素语义表征特征。为便于理解,请一并参见图3,图3是本申请实施例提供的一种表层活动特征与因素语义表征特征之间的对应关系示意图。如图3所示,假设对于某个业务表层活动特征而言,其由表层活动特征U、表层活动特征V以及表层活动特征W所组成,将表层活动特征U、表层活动特征V以及表层活动特征W输入至深层挖掘分析模型后,通过该深层挖掘分析模型可以输出表层活动特征U对应的因素语义表征特征A、表层活动特征V对应的因素语义表征特征A以及表层活动特征W对应的因素语义表征特征C,也就是说,基于表层活动特征中不同的活动特征,可以挖掘分析得到不同的因素语义表征特征。
应当理解,在业务表层活动特征中,同一类型的活动特征可以包含有不同的内容(如对于上述虚拟资源活动特征而言,其可以包含有对象的地域信息,还可以包含有对象对高价值物品的兑换频率等等),本申请也可以将这些内容均作为业务表层活动特征的组成部分(更细节的组成部分),即这些内容也可以称为表层活动特征(实际上为业务表层活动特征中的细节表层特征)。那么此时,多个细节表层特征可以是受同样的影响因素所影响的,那么多个细节表层表征可以对应同一个因素语义表征特征。为便于理解,请一并参见图4,图4是本申请实施例提供的一种细节表层特征与因素语义表征特征之间的对应关系示意图。如图4所示,假设对于某个业务表层活动特征而言,其由表层活动特征R、表层活动特征O以及表层活动特征X所组成,而对于表层活动特征R而言,其包含有细节表层特征Q、细节表层特征P以及细节表层特征Z,那么细节表层特征Q、细节表层特征P以及细节表层特征Z输入至深层挖掘分析模型后,通过该深层挖掘分析模型可以输出细节表层特征Q、细节表层特征P以及细节表层特征Z共同对应的因素语义表征特征E,也就是说,基于表层活动特征中不同的细节表层特征,可以挖掘分析得到同一个因素语义表征特征。
可以理解的是,基于上述可知,对于业务表层活动特征而言,其可以由不同的配置影响因素所影响,那么该业务表层活动特征对应的因素语义表征特征,是会反映不同的配置影响因素的语义的,即不同的因素语义表征特征之间所表征的语义不同,为了能够提升因素语义表征特征彼此之间的差异性,使得因素语义表征特征能够更为精准的独立的反映某个配置影响因素的语义,本申请可以对深层挖掘分析模型所输出的因素语义表征特征进行语义约束,随后再将进行语义约束后的各个因素语义表征特征作为业务表层活动特征最终的因素语义表征特征。具体的,对于深层挖掘分析模型所输出的表征特征,可以作为初始因素语义表征特征,随后,可以对每个初始因素语义表征特征分别进行语义约束处理,由此即可得到最终的各个因素语义表征特征。
也就是说,以配置影响因素体系中包括配置影响因素Si(i为正整数)为例,对于在深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征的具体方式可为:在深层挖掘分析模型中,可以基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,由此可以输出业务表层活动特征针对每个配置影响因素的初始因素语义表征特征;随后,可以对业务表层活动特征针对配置影响因素Si的初始因素语义表征特征进行语义约束处理,由此可以得到业务表层活动特征针对配置影响因素Si的因素语义表征特征。采用相同方式,可以得到业务表层活动特征针对每个配置影响因素的因素语义表征特征。对于对业务表层活动特征针对配置影响因素Si的初始因素语义表征特征进行语义约束处理,得到业务表层活动特征针对配置影响因素Si的因素语义表征特征的具体实现方式,可以参见后续图5所对应实施例中的描述。
步骤S103,基于业务表层活动特征针对每个配置影响因素的因素语义表征特征,输出对象针对业务的业务策略,以及针对业务策略的策略解释信息。
本申请中,在确定出业务表层活动特征的因素语义表征特征后,即可将该深层次的因素语义表征特征输入至业务的业务策略模型中,通过该业务策略模型即可对该深层次的因素语义表征特征进行计算分析,得到该对象在业务中的业务策略,同时,为了提升该业务策略的可信度,还可以输出该业务策略的策略解释信息,该策略解释信息用于对该业务策略的计算逻辑进行解释,以解释输出该业务策略的缘由,由此可以使得该业务策略具备可解释性,且该业务策略的策略解释信息是基于深层次的因素语义表征特征来进行解释的,具备较高的准确性。
其中,需要说明的是,该业务策略是基于业务的不同而不同的,例如,业务为物品推荐业务时,该业务策略即可为向对象所推荐的物品策略(即输出结果为针对对象的推荐物品);业务为资讯推送业务时,该业务策略即可为向对象所推荐的资讯信息(即输出结果为针对对象的推荐资讯)。也就是说,业务策略可以基于业务有不同的形式。以业务为媒体数据推荐业务为例,该业务策略是指针对对象的推荐媒体数据,而该策略解释信息可以是指针对推荐媒体数据的推荐解释信息,此种情况下,对于基于业务表层活动特征针对每个配置影响因素的因素语义表征特征,输出对象针对业务的业务策略,以及针对业务策略的策略解释信息的具体实现方式可为:可以将业务表层活动特征针对每个配置影响因素的因素语义表征特征,所组成的集合确定为因素语义表征特征集合;随后,可以将因素语义表征特征集合输入至媒体数据推荐模型;其中,媒体数据推荐模型是基于样本对象在媒体数据推荐业务的样本因素语义表征特征集合,对样本媒体数据推荐模型进行训练优化后所得到的;其中,样本因素语义表征特征集合包含样本业务表层活动特征,针对每个配置影响因素的样本因素语义表征特征;样本业务表层活动特征,是指样本对象在媒体数据推荐模型中的表层活动特征;通过媒体数据推荐模型,即可输出因素语义表征特征集合对应的推荐媒体数据;而基于媒体数据推荐模型的模型属性,可确定针对推荐媒体数据的推荐解释信息。
可以理解的是,为了提升媒体数据推荐模型的性能,本申请可以预先基于样本对象的样本因素语义表征特征集合(先获取样本对象的样本业务表层活动特征,再通过深层挖掘分析模型对该样本业务表层活动特征进行深层挖掘分析处理,来得到样本业务表层活动特征针对每个配置影响因素的样本因素语义表征特征),随后即可基于样本因素语义表征特征集合(由样本业务表层活动特征针对每个配置影响因素的样本因素语义表征特征所组成),对样本媒体数据推荐模型进行训练优化。具体的,对于样本媒体数据推荐模型可以采用任一神经网络模型(白盒模型或黑盒模型),对于模型的训练优化过程可以采用常规的模型训练优化方式(如,采用有标签训练方式、强化学习训练方式等等),这里将不再对具体的模型训练优化过程进行赘述。
应当理解,对于白盒模型而言,其自身具备可解释性,通过白盒模型即可直接输出针对该业务策略的策略解释信息;而对于黑盒模型而言,其是不具备可解释性的,那么在媒体数据推荐模型为黑盒模型时,需要采用可解释模型对其业务策略进行解释,例如,可采用Global Surrogate模型、LIME(Local interpretable model-agnostic explanations)模型、SHAP(SHapley Additive exPlanations)模型等等。也就是说,在媒体数据推荐模型为黑盒模型时,对于策略解释信息,可以由可解释模型来进行输出。即,在媒体数据推荐模型的模型属性为黑盒属性时,对于通过基于媒体数据推荐模型的模型属性,确定针对推荐媒体数据的推荐解释信息的具体实现方式可为:可以获取用于对媒体数据推荐模型所输出的模型结果进行结果解释的可解释模型(如SHAP模型);随后,可以将因素语义表征特征集合与推荐媒体数据,共同输入至可解释模型,通过可解释模型可以输出因素语义表征特征集合中,每个因素语义表征特征分别对应的特征影响值,由此可以得到特征影响值集合;其中,特征影响值集合中的一个特征影响值,用于表征对应的因素语义表征特征对推荐媒体数据的影响程度;基于特征影响值集合,即可生成针对推荐媒体数据的推荐解释信息。
其中,对于基于特征影响值集合,生成针对推荐媒体数据的推荐解释信息的具体实现方式,可以为:按照特征影响值集合中每个特征影响值的大小顺序,可以对每个特征影响值进行排序,由此可以得到影响值序列;随后,可以将影响值序列中的前K(K可以为正整数,K可基于人工经验进行取值,通常情况下,K的取值通常大于1)个特征影响值所分别对应的因素语义表征特征,均确定为高影响表征特征;基于高影响表征特征所反映的因素语义,即可生成针对推荐媒体数据的推荐解释信息。
应当理解,通过可解释模型,可以确定因素语义表征特征集合中,到底哪些因素语义表征特征对模型结果(即业务策略)最具影响性,即对业务策略进行结果解释。其中,这里的结果解释是指用于解释每个模型输入对模型输出的重要程度(即影响程度),例如,可解释模型可为可加性解释模型(Shapley Additive exPlanation,SHAP),通过可解释模型可以输出每个模型输入对模型输出的贡献度(即影响程度)。那么在本申请中,通过可解释模型即可输出每个因素语义表征特征分别对应的影响值(可称之为特征影响值,用于表征对应的因素语义表征特征对模型输出结果的影响程度,特征影响值越大,可表征对应的因素语义表征特征对模型输出结果的影响程度越大。例如,因素语义表征特征1对应的特征影响值为30,因素语义表征特征2对应的特征影响值为20,那么通过两个特征影响值,即可确定因素语义表征特征1对模型输出结果的影响程度越大)。基于此,可以按照特征影响值集合中每个特征影响值的大小顺序(通常来说,是按照从大到小的顺序),对每个特征影响值进行排序,得到影响值序列,前K(K可为正整数,K可为基于人工经验所预设的一个数值,通常来说,K大于1)个特征影响值所分别对应的因素语义表征特征,即可确定为最影响表征特征(或高影响表征特征)。应当理解,特征影响值越大,可表示其因素语义表征特征对模型输出结果(业务策略)的影响程度越高。
进一步地,需要说明的是,若上述对每个特征影响值进行排序时,是按照从小到大的顺序进行排序的,那么在影响值序列中,可以获取后K个特征影响值,该后K个特征影响值分别对应的因素语义表征特征即可为最影响表征特征(或高影响表征特征)。
随后,通过该高影响表征特征,即可确定出推荐媒体数据的推荐解释信息。例如,某个高影响表征特征所反映的因素类别为“虚拟资源充足”,那么对于该策略解释信息中,即可包含有“该对象的虚拟资源很充足”的信息。换言之,该策略解释信息中可以包含有高影响表征特征所反映的因素语义。
应当理解,无论媒体数据推荐模型采用白盒模型还是黑盒模型,由于媒体数据推荐模型的输入特征为深层次的因素语义表征特征,对于媒体数据推荐模型的输出结果(业务策略)是基于深层次的特征所计算得到的,那么该媒体数据推荐模型的输出结果会更具备准确性;此外,对于媒体数据推荐模型的输出结果的解释性方面,不是从业务的表层现象进行解释,而是基于深层次的因素语义表征特征来进行了本质性的解释,相比于表层现象的解释,显然深层次的进行本质性的解释的可信度更高,由此可以提升媒体数据推荐模型的输出结果的可信度。
在本申请实施例中,本申请可以构建业务的配置影响因素体系,再通过深层挖掘分析模型可以将对象在业务中的业务表层活动特征,转换为深层次的因素语义表征特征,对于对象针对业务的业务策略,是基于深层次的因素语义表征特征所确定输出的,并不是就表层的活动特征所确定的,可以很好地提升业务策略的准确性;此外,在本申请中,在确定输出业务策略的同时,还可以输出该业务策略的策略解释信息,该策略解释信息可以很好地解释确定该业务策略的缘由,由此可以直观呈现该业务策略的确定逻辑,可以很好地提升业务策略的可信度,同时,由于该策略解释信息是基于深层次的因素语义表征特征所确定的,该策略解释信息的解释层次也是较高的,由此可以进一步提升该业务策略的可信度。综上,本申请可以在业务策略的确定任务中,提升所确定的业务策略的可信性。
进一步地,请参见图5,图5是本申请实施例提供的一种对因素语义表征特征进行语义约束处理的流程示意图。该流程可以对应于上述图2所对应实施例中,对于对业务表层活动特征针对配置影响因素Si的初始因素语义表征特征进行语义约束处理,得到业务表层活动特征针对配置影响因素Si的因素语义表征特征的流程。如图5所示,该流程可以至少包括以下步骤S501-步骤S503:
步骤S501,将业务表层活动特征针对配置影响因素Si的初始因素语义表征特征,确定为目标初始表征特征,将业务表层活动特征针对每个配置影响因素的初始因素语义表征特征中,除目标初始表征特征以外的每个初始深层语义表征特征,均确定为目标初始表征特征对应的待融合表征特征;目标初始表征特征对应的待融合表征特征包含待融合表征特征Sj,j为正整数。
具体的,为便于区别,对于深层挖掘分析模型所输出的针对配置影响因素Si的初始因素语义表征特征,可将其作为目标初始表征特征,而对于除目标初始表征特征以外的每个初始深层语义表征特征,均可以确定为目标初始表征特征对应的待融合表征特征。而为了便于说明,后续是以目标初始表征特征对应的待融合表征特征包含待融合表征特征Sj为例进行说明。
步骤S502,将目标初始表征特征与待融合表征特征Sj进行融合处理,得到待融合表征特征Sj对应的融合表征特征Rj
具体的,这里的融合处理,可以是指任意形式的融合处理,例如,可以是指拼接处理、相加计算处理等等。对于每个待融合表征特征,均可以与目标初始表征特征进行融合,由此即可得到某个待融合表征特征所对应的融合表征特征。
步骤S503,当确定出每个待融合表征特征分别对应的融合表征特征时,基于每个待融合表征特征分别对应的融合表征特征,对目标初始表征特征进行语义约束处理,得到业务表层活动特征针对配置影响因素Si的因素语义表征特征。
具体的,对于基于每个待融合表征特征分别对应的融合表征特征,对目标初始表征特征进行语义约束处理,得到业务表层活动特征针对配置影响因素Si的因素语义表征特征的具体实现方式可为:可以获取待聚类对象集合;其中,待聚类对象集合中可以包括至少两个待聚类对象(如,可以包含至少两个用户);随后,基于目标初始表征特征,可以对至少两个待聚类对象进行聚类处理,由此可以得到第一类簇分布结果;其中,第一类簇分布结果中可以包含有第一类簇与第二类簇;第一类簇所属的类簇类别为基于配置影响因素Si所衍生的第一因素类别;第二类簇所属的类簇类别为基于配置影响因素Si所衍生的第二因素类别;其中,第一因素类别与第二因素类别不同;随后,基于融合表征特征Rj,对至少两个待聚类对象进行聚类处理,得到第二类簇分布结果;第二类簇分布结果中包含第三类簇与第四类簇;第三类簇所属的类簇类别为第一因素类别;第四类簇所属的类簇类别为第二因素类别;根据第一类簇、第二类簇、第三类簇以及第四类簇,可以确定目标初始表征特征针对融合表征特征Rj的特征区分属性;当确定出目标初始表征特征分别针对每个融合表征特征的特征区分属性时,即可基于每个特征区分属性,确定业务表层活动特征针对配置影响因素Si的因素语义表征特征。
其中,对于根据第一类簇、第二类簇、第三类簇以及第四类簇,确定目标初始表征特征针对融合表征特征Rj的特征区分属性的具体实现方式可为:可以获取至少两个待聚类对象中,每个待聚类对象分别对应的真实因素类别标签;随后,可以将真实因素类别标签为第一因素类别的待聚类对象,组合得到第一真实标签类簇,将真实因素类别标签为第二因素类别的待聚类对象,组合得到第二真实标签类簇;基于第一类簇、第二类簇、第一真实标签类簇以及第二真实标签类簇,可以确定目标初始表征特征对应的第一聚类误差;基于第三类簇、第四类簇、第一真实标签类簇以及第二真实标签类簇,可以确定融合表征特征Rj对应的第二聚类误差;在第一聚类误差大于第二聚类误差,且第一聚类误差与第二聚类误差之间的误差差值绝对值大于差值阈值时,可以确定目标初始表征特征,针对融合表征特征Rj的特征区分属性为特征异常区分属性;而在第一聚类误差小于第二聚类误差,或第一聚类误差与第二聚类误差之间的误差差值绝对值小于差值阈值时,可以确定目标初始表征特征,针对融合表征特征Rj的特征区分属性为特征正常区分属性。
应当理解,为了保证所得到的每个因素语义表征特征,能够有效反映预先配置的配置影响因素的因素语义,本申请实施例可以采用对比学习的方法,来对不同的因素语义表征特征进行语义约束。具体的,对于某个初始因素语义表征特征(如上述目标初始表征特征)而言,可以将该目标初始表征特征与其他每个初始因素语义表征特征进行融合,由此得到融合表征特征后,可以将某个融合表征特征与该目标初始表征特征,均对待聚类对象集合进行聚类划分,在得到两个划分结果后,可以基于待聚类对象集合中每个待聚类对象的真实因素类别标签,来判断两个特征的划分效果。例如,基于每个待聚类对象的真实因素类别标签,可以将待聚类对象集合进行划分,得到真实划分结果(包含有第一真实标签类簇与第二真实标签类簇),基于目标初始表征特征的划分结果(包含有第一类簇与第二类簇)与真实划分结果,可以确定出一个聚类误差(可称之为第一聚类误差,通过该聚类误差,即可呈现出该目标初始表示特征的划分效果,如聚类误差较小,即可表征该目标初始表征特征的划分效果较好);同理,基于融合表征特征对待聚类对象集合的划分结果与真实划分结果,也可以确定出一个聚类误差(为便于区别,可称之为第二聚类误差,通过该第二聚类误差,也可以呈现出该融合表征特征的划分效果)。当目标初始表征特征与融合表征特征的划分效果相差不大时(即目标初始表征特征的划分效果仅略优于融合表征特征的划分效果,或目标初始表征特征的划分效果仅略次于融合表征特征的划分效果)时,那么此时可以确定,加上另外的初始因素语义表征特征来共同对待聚类对象集合进行聚类划分,与该目标初始表征特征单独对待聚类对象集合进行聚类划分,所得到的划分效果是近似的效果,也就是说,对于该配置影响因素Si,该目标初始表征特征已经可以很好地将待聚类对象集合进行因素类别的划分,该融合表征特征中所包含的另外的初始因素语义表征,对该待聚类对象集合在配置影响因素Si上的划分任务上并未产生较大作用,此时即可证明相比于该融合表征特征中所包含的另外的初始因素语义表征而言,该目标初始表征特征已经可以很好地有效地反映出该配置影响因素Si的因素语义,该目标初始表征与其他初始因素语义表征特征相比,具备足够的区分性;同理,当目标初始表征特征的划分效果,是优于融合表征特征的划分效果时,也可以证明相比于该融合表征特征中所包含的另外的初始因素语义表征而言,该目标初始表征特征已经可以很好地有效地反映出该配置影响因素Si的因素语义,该目标初始表征与其他初始因素语义表征特征相比,具备足够的区分性;而当目标初始表征特征的划分效果,是远次于融合表征特征的划分效果时,即可证明相比于该目标初始表征特征,加上另外的初始因素语义表征特征的融合表征特征,能够更好地对待聚类对象集合进行划分,那么此时即可证明相比于该融合表征特征中所包含的另外的初始因素语义表征而言,该目标初始表征特征并不能很好地有效地反映出该配置影响因素Si的因素语义,该目标初始表征与其他初始因素语义表征特征相比,其他初始因素语义表征特征中可能也包含有该配置影响因素的相关因素语义,该目标初始表征与其他初始因素语义表征特征相比,并不具备足够的区分性。
也就是说,对于融合表征特征Rj而言,以配置影响因素Si为虚拟资源状态因素为例,待聚类对象集合中所包含的待聚类对象中,可以包含有资源充足(即虚拟资源状态为充足状态,真实因素标签为资源充足标签)的待聚类对象,也可以包含有资源欠缺(即虚拟资源状态为欠缺状态,真实因素标签为资源欠缺标签)的待聚类对象,基于目标初始表征特征,可以对这些待聚类对象集合进行分类,由此可以得到第一类簇(因素类别为第一因素类别,如资源充足类别)与第二类簇(因素类别为第二因素类别,如资源欠缺类别),而根据目标初始表征特征的类簇分布结果,以及待聚类对象集合的真实因素类别标签,即可确定出该目标初始表征特征的聚类效果(可以得到一个聚类误差,称之为第一聚类误差);同理,基于融合表征特征Rj,也可以对这些待聚类对象集合进行分类,由此可以得到第三类簇(因素类别为第一因素类别,如资源充足类别)与第四类簇(因素类别为第二因素类别,如资源欠缺类别),而根据融合表征特征Rj的类簇分布结果,以及待聚类对象集合的真实因素类别标签,即可确定出该融合表征特征Rj的聚类效果(可以得到一个聚类误差,称之为第二聚类误差)。基于该第一聚类误差与该第二聚类误差,即可判断相比于融合表征特征Rj,目标初始表征特征在虚拟资源状态因素上是否更能有效聚类相同因素类别的对象。若目标初始表征特征在虚拟资源状态因素上确实更能有效聚类相同因素类别的对象(例如,第一聚类误差小于第二聚类误差,或第一聚类误差与第二聚类误差之间的误差差值绝对值小于差值阈值,此时可以说明目标初始表征特征的划分效果优于融合表征特征的划分效果,或目标初始表征特征的划分效果略优于(或略次于)融合表征特征的划分效果),则可以将目标初始表征特征与融合表征特征Rj之间的特征区分属性确定为特征正常区分属性;而若目标初始表征特征在虚拟资源状态因素上不能有效聚类相同因素类别的对象(例如,第一聚类误差大于第二聚类误差,且第一聚类误差与第二聚类误差之间的误差差值绝对值大于差值阈值,此时可以说明目标初始表征特征的划分效果远次于融合表征特征的划分效果),则可以将目标初始表征特征与融合表征特征Rj之间的特征区分属性确定为特征异常区分属性。
需要说明的是,本申请实施例中所涉及到的阈值(如差值阈值)的具体数值,可以为人工预先配置的值,也可以由机器经过相关规则的训练所确定的值。通常情况下,该差值阈值为一个较小的值,由此即可使得目标初始表征特征与融合表征特征的划分结果在非常接近时,才会被确定为二者的效果相差不大。
进一步地,当确定出目标初始表征特征针对每个融合表征特征的特征区分属性时,即可基于每个特征区分属性,确定业务表层活动特征针对配置影响因素Si的因素语义表征特征。其具体实现方式可为:可以将每个特征区分属性所组成的集合确定为属性集合;随后,可以遍历属性集合;若属性集合中存在特征异常区分属性,则可以确定目标初始表征特征的特征约束属性为约束不足属性,进而可以基于误差差值绝对值对深层挖掘分析模型进行优化,随后即可在优化后的深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,由此得到业务表层活动特征针对每个配置影响因素的因素语义表征特征;而若属性集合中不存在特征异常区分属性,则可以确定目标初始表征特征的特征约束属性为约束充足属性,可以将目标初始表征特征语义表征特征,直接确定为业务表层活动特征针对配置影响因素Si的因素语义表征特征。
在本申请实施例中,通过对比学习的方式,可以对因素语义表征特征进行语义约束,由此可以很好地提升因素语义表征特征的有效性与唯一表征性,一个因素语义表征特征可以很好地有效反映一个配置影响因素。
进一步地,请参见图6,图6是本申请实施例提供的另一种数据处理方法的流程示意图。具体的,该流程可以是指对深层挖掘分析模型进行训练优化的流程。该方法可以由终端设备(例如,上述图1所示的终端设备集群中的任一终端设备,如终端设备100a)执行,也可以由上述业务服务器(如上述图1所对应实施例中的业务服务器1000)所执行,还可以由终端设备和业务服务器共同执行。为便于理解,本实施例以该方法由上述业务服务器执行为例进行说明。
如图6所示,该数据处理方法至少可以包括以下步骤S601-步骤S603:
步骤S601,获取样本对象在业务中的样本业务表层活动特征,将样本业务表层活动特征输入至样本深层挖掘分析模型;样本深层挖掘分析模型具备基于业务的配置影响因素体系,为表层活动特征深层挖掘一个或多个因素语义表征特征的性能;配置影响因素体系中包含一个或多个配置影响因素,每个配置影响因素是指会对表层活动特征产生影响的因素。
具体的,样本对象可以是指作为训练样本的对象,样本业务表层活动特征可以是指样本对象在业务中的业务表层活动特征,对于获取样本业务表层活动特征的方式,可以参见上述图2所对应实施例中获取对象的业务表层活动特征的描述。这里的样本深层挖掘分析模型可以是指训练优化前的深层挖掘分析模型。
步骤S602,在样本深层挖掘分析模型中,基于配置影响因素体系对样本业务表层活动特征进行深层挖掘分析处理,得到样本业务表层活动特征针对每个配置影响因素的初始样本因素语义表征特征。
具体的,对于得到初始样本因素语义表征特征的具体实现方式,可以参见上述图2所对应实施例中,对于在深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征的描述,两者原理相同,这里将不再进行赘述。
步骤S603,基于样本业务表层活动特征针对每个配置影响因素的初始样本因素语义表征特征,对样本深层挖掘分析模型进行训练优化,得到深层挖掘分析模型;深层挖掘分析模型用于基于配置影响因素体系,对对象在业务中的业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征。
具体的,以配置影响因素体系中包括配置影响因素Si(i为正整数)为例,对于对样本深层挖掘分析模型进行训练优化,得到深层挖掘分析模型的具体实现方式可为:可以将样本业务表层活动特征针对配置影响因素Si的初始样本因素语义表征特征,确定为目标初始样本表征特征;随后,可以对目标初始样本表征特征进行语义约束处理,由此可以得到目标初始样本表征特征对应的样本特征约束属性;当确定出每个初始样本因素语义表征特征分别对应的样本特征约束属性时,可以将每个初始样本因素语义表征特征分别对应的样本特征约束属性,所组成的集合确定为样本约束属性集合;若样本约束属性集合中存在约束不足属性,则可以基于约束不足属性所对应的初始样本因素语义表征特征,对样本深层挖掘分析模型的模型参数进行调整,由此可以得到调整后的模型参数,可以将包含调整后的模型参数的样本深层挖掘分析模型确定为深层挖掘分析模型;而若样本约束属性集合中不存在约束不足属性,则可以直接将样本深层挖掘分析模型确定为深层挖掘分析模型。
应当理解,对于样本深层挖掘分析模型所输出的初始样本因素语义表征特征,本申请实施例可以对其进行语义约束处理,以检测各个初始样本因素语义表征特征是否能够有效的准确的反映某个配置影响因素,若通过语义约束处理,确定每个初始样本因素语义表征特征均能有效准确的反映配置影响因素(即不存在约束不足属性的初始样本因素语义表征特征),那么即可确定该样本深层挖掘分析模型所输出的结果已具备较高的准确性,可以不再对模型的模型参数进行调整;而若通过语义约束处理,确定部分初始样本因素语义表征特征不能有效准确的反映配置影响因素(即存在约束不足属性的初始样本因素语义表征特征),那么即可确定该样本深层挖掘分析模型所输出的结果并不具备较高的准确性,需要对样本深层挖掘分析模型的模型参数进行调整,直至确定每个初始样本因素语义表征特征均能有效准确的反映配置影响因素。
应当理解,对初始样本因素语义表征特征进行语义约束处理的具体方式,可以参见上述图5所对应实施例中的描述,原理是相同的,这里将不再进行赘述。需要说明的是,在通过语义约束的方式对样本深层挖掘分析模型进行训练优化后,所得到的深层挖掘分析模型已经具备较高的性能,所以在应用时,将对象的因素语义表征特征输入至深层挖掘分析模型后,深层挖掘分析模型所输出的初始因素语义表征特征可以直接确定为最终的因素语义表征特征,无需再进行语义约束处理。
在本申请实施例中,可以构建业务的配置影响因素体系,再通过深层挖掘分析模型可以将对象在业务中的业务表层活动特征,转换为深层次的因素语义表征特征,对于对象针对业务的业务策略,是基于深层次的因素语义表征特征所确定输出的,并不是就表层的活动特征所确定的,可以很好地提升业务策略的准确性;此外,在本申请中,在确定输出业务策略的同时,还可以输出该业务策略的策略解释信息,该策略解释信息可以很好地解释确定该业务策略的缘由,由此可以直观呈现该业务策略的确定逻辑,可以很好地提升业务策略的可信度,同时,由于该策略解释信息是基于深层次的因素语义表征特征所确定的,该策略解释信息的解释层次也是较高的,由此可以进一步提升该业务策略的可信度。
为便于理解,请参见图7,图7是本申请实施例提供的一种系统流程示意图。如图7所示,该流程可以至少包括以下步骤S71-步骤S75:
步骤S71,获取表层活动特征。
步骤S72,基于表层活动特征对深层挖掘分析模型进行训练。
步骤S73,通过训练后的深层挖掘分析模型输出因素语义表征特征。
步骤S74,基于因素语义表征特征对任务模型进行训练优化。
具体的,这里的任务模型可以是指业务中的决策模型(如上述媒体数据推荐模型)。该任务模型可以为白盒模型,也可以为黑盒模型。
步骤S75,基于训练优化后的任务模型输出预测结果以及结果解释信息。
具体的,这里的预测结果可以是指任务模型输出的结果(如业务策略);结果解释信息可以是指用于对预测结果进行解释的信息(如针对业务策略的策略解释信息)。当任务模型为白盒模型时,该白盒模型具备解释性,可以自动输出结果解释信息;而当任务模型而黑盒模型时,该黑盒模型并不具备解释性,那么可以借助可解释模型(如SHAP模型)来对任务模型的预测结果进行解释。
具体的,对于步骤S71-步骤S75的具体实现方式,可以参见上述图2-图6所对应实施例中的描述,这里将不再进行赘述。其所带来的有益效果,也不再进行过于赘述。
进一步地,为便于理解,请参见图8,图8是本申请实施例提供的一种构建可解释任务模型的系统架构图。如图8所示,该系统架构可以包含配置影响因素体系构建模块、表层特征输入模块、知识图谱输入模块、挖掘分析模型训练模块、深层特征输入模块以及可解释任务模型训练模块。以下将对各个模块进行阐述:
配置影响因素体系构建模块:基于上述各个实施例可知,为了提升可解释任务模型通过表层现象分析业务的本质的性能,本申请可以通过人工或半自动的方式来构建系统性的配置影响因素体系,而配置影响因素体系构建模块即可用于构建配置影响因素体系。
表层特征输入模块:表层特征输入模块可以获取对象在业务中的表层活动特征(可为离散值特征、连续值特征、序列特征、图结构特征等等,这里将不对表层活动特征的具体形式进行限定),并将其输入至挖掘分析模型训练模块中,以在挖掘分析模型训练模块中,基于表层活动特征,对深层挖掘分析模型进行训练。
知识图谱输入模块:知识图谱输入模块用于获取业务的知识图谱,并将之输入至挖掘分析模型训练模块中,以提升训练效果。具体的,知识图谱中可以包含有业务中,各个数据之间的关联关系,通过知识图谱,可以加强所输出的因素语义表征特征的有效性。以业务为购物业务为例,在购物业务所包含的商品中,一个商品品牌(如美妆品牌A)可能包含有不同的产品,这些产品均与美妆品牌A相关联,那么这些产品之间也存在有关联关系。也就是说,通过知识图谱,可以直观的了解到业务中不同数据之间的关联关系。需要说明的是,对于知识图谱是一个可选项,在训练深层挖掘分析模型时也可以不采用知识图谱。
挖掘分析模型训练模块:挖掘分析模型训练模块可以基于配置影响因素体系构建模块的输入内容、表层特征输入模块所输入的内容、知识图谱输入模块所输入的内容,来对深层挖掘分析模型进行训练,以提升深层挖掘分析模型具备基于业务的配置影响因素体系,为表层活动特征深层挖掘一个或多个因素语义表征特征的性能。
深层特征输入模块:深层特征输入模块可以接收挖掘分析模型训练模块输入的内容(表层活动特征的因素语义表征特征),并将其输入至可解释任务模型训练模块。
可解释任务模型训练模块:可解释任务模型训练模块可以基于深层特征输入模块的输入内容(表层活动特征的因素语义表征特征),对可解释任务模型(白盒模型,或包含可解释模型的黑盒模型)进行训练,而基于训练后的可解释任务模型,即可输出预测结果(业务策略)以及结果解释信息(策略解释信息)。
在本申请实施例中,可以将业务中的特征划分为表层特征(如表层活动特征)与深层特征(如因素语义表征特征),由此可以构建配置影响因素体系,通过配置影响因素体系可以将表层特征转换为深层特征,由此,可以使得后续具体任务的任务模型具备理解任务领域的深层知识的能力。对于具体任务的重要决策,任务模型可以提供更为深刻和本质的预测结果(所输出的业务策略更为深刻),也可以提供深层次的结果解释,从而很好地提升任务模型的输出结果的可信度,进而可以提升决策对象(如用户)的决策效率,降低决策对象决策失误的概率。
进一步地,请参见图9,图9是本申请实施例提供的一种数据处理装置的结构示意图。该数据处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如该数据处理装置为一个应用软件;该数据处理装置可以用于执行图2所示的方法。如图9所示,该数据处理装置1可以包括:特征获取模块11、特征输入模块12、特征分析模块13以及策略输出模块14。
特征获取模块11,用于获取对象在业务中的业务表层活动特征;
特征输入模块12,用于将业务表层活动特征输入至深层挖掘分析模型;深层挖掘分析模型具备基于业务的配置影响因素体系,为表层活动特征深层挖掘一个或多个因素语义表征特征的性能;配置影响因素体系中包含一个或多个配置影响因素,每个配置影响因素是指会对表层活动特征产生影响的因素;
特征分析模块13,用于在深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征;
策略输出模块14,用于基于业务表层活动特征针对每个配置影响因素的因素语义表征特征,输出对象针对业务的业务策略,以及针对业务策略的策略解释信息。
其中,特征获取模块11、特征输入模块12、特征分析模块13以及策略输出模块14的具体实现方式,可以参见上述图2所对应实施例中步骤S101-步骤S103的描述,这里将不再进行赘述。
在一个实施例中,业务为物品推荐业务;配置影响因素包含虚拟资源状态因素;
特征分析模块13,还具体用于在业务表层活动特征中,获取对象与虚拟资源状态因素相关联的虚拟资源活动特征;虚拟资源活动特征包含对象所属的地域信息、对象针对高价值物品的兑换频率;高价值物品是指具备高价值属性的物品;
特征分析模块13,还具体用于在地域信息所属的地域类型为优质地域类型,且兑换频率大于频率阈值时,将对象的虚拟资源状态确定为充足状态,生成用于反映充足状态的第一因素语义表征特征,将第一因素语义表征特征确定为业务表层活动特征针对虚拟资源状态因素的因素语义表征特征;
特征分析模块13,还具体用于在地域信息所属的地域类型为普通地域类型,或兑换频率小于频率阈值时,将对象的虚拟资源状态确定为欠缺状态,生成用于反映欠缺状态的第二因素语义表征特征,将第二因素语义表征特征确定为业务表层活动特征针对虚拟资源状态因素的因素语义表征特征。
在一个实施例中,配置影响因素体系中包括配置影响因素Si,i为正整数;
特征分析模块13,还具体用于在深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,输出业务表层活动特征针对每个配置影响因素的初始因素语义表征特征;
特征分析模块13,还具体用于对业务表层活动特征针对配置影响因素Si的初始因素语义表征特征进行语义约束处理,得到业务表层活动特征针对配置影响因素Si的因素语义表征特征。
在一个实施例中,特征分析模块13,还具体用于将业务表层活动特征针对配置影响因素Si的初始因素语义表征特征,确定为目标初始表征特征,将业务表层活动特征针对每个配置影响因素的初始因素语义表征特征中,除目标初始表征特征以外的每个初始深层语义表征特征,均确定为目标初始表征特征对应的待融合表征特征;目标初始表征特征对应的待融合表征特征包含待融合表征特征Sj,j为正整数;
特征分析模块13,还具体用于将目标初始表征特征与待融合表征特征Sj进行融合处理,得到待融合表征特征Sj对应的融合表征特征Rj
特征分析模块13,还具体用于当确定出每个待融合表征特征分别对应的融合表征特征时,基于每个待融合表征特征分别对应的融合表征特征,对目标初始表征特征进行语义约束处理,得到业务表层活动特征针对配置影响因素Si的因素语义表征特征。
在一个实施例中,特征分析模块13,还具体用于获取待聚类对象集合;待聚类对象集合中包括至少两个待聚类对象;
特征分析模块13,还具体用于基于目标初始表征特征,对至少两个待聚类对象进行聚类处理,得到第一类簇分布结果;第一类簇分布结果中包含第一类簇与第二类簇;第一类簇所属的类簇类别为基于配置影响因素Si所衍生的第一因素类别;第二类簇所属的类簇类别为基于配置影响因素Si所衍生的第二因素类别;第一因素类别与第二因素类别不同;
特征分析模块13,还具体用于基于融合表征特征Rj,对至少两个待聚类对象进行聚类处理,得到第二类簇分布结果;第二类簇分布结果中包含第三类簇与第四类簇;第三类簇所属的类簇类别为第一因素类别;第四类簇所属的类簇类别为第二因素类别;
特征分析模块13,还具体用于根据第一类簇、第二类簇、第三类簇以及第四类簇,确定目标初始表征特征针对融合表征特征Rj的特征区分属性;
特征分析模块13,还具体用于当确定出目标初始表征特征分别针对每个融合表征特征的特征区分属性时,基于每个特征区分属性,确定业务表层活动特征针对配置影响因素Si的因素语义表征特征。
在一个实施例中,特征分析模块13,还具体用于获取至少两个待聚类对象中,每个待聚类对象分别对应的真实因素类别标签;
特征分析模块13,还具体用于将真实因素类别标签为第一因素类别的待聚类对象,组合得到第一真实标签类簇,将真实因素类别标签为第二因素类别的待聚类对象,组合得到第二真实标签类簇;
特征分析模块13,还具体用于基于第一类簇、第二类簇、第一真实标签类簇以及第二真实标签类簇,确定目标初始表征特征对应的第一聚类误差;
特征分析模块13,还具体用于基于第三类簇、第四类簇、第一真实标签类簇以及第二真实标签类簇,确定融合表征特征Rj对应的第二聚类误差;
特征分析模块13,还具体用于在第一聚类误差大于第二聚类误差,且第一聚类误差与第二聚类误差之间的误差差值绝对值大于差值阈值时,确定目标初始表征特征,针对融合表征特征Rj的特征区分属性为特征异常区分属性;
特征分析模块13,还具体用于在第一聚类误差小于第二聚类误差,或第一聚类误差与第二聚类误差之间的误差差值绝对值小于差值阈值时,确定目标初始表征特征,针对融合表征特征Rj的特征区分属性为特征正常区分属性。
在一个实施例中,特征分析模块13,还具体用于将每个特征区分属性所组成的集合确定为属性集合;
特征分析模块13,还具体用于遍历属性集合;
特征分析模块13,还具体用于若属性集合中存在特征异常区分属性,则确定目标初始表征特征的特征约束属性为约束不足属性,基于误差差值绝对值对深层挖掘分析模型进行优化,在优化后的深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征;
特征分析模块13,还具体用于若属性集合中不存在特征异常区分属性,则确定目标初始表征特征的特征约束属性为约束充足属性,将目标初始表征特征语义表征特征,确定为业务表层活动特征针对配置影响因素Si的因素语义表征特征。
在一个实施例中,业务为媒体数据推荐业务;业务策略是指针对对象的推荐媒体数据;策略解释信息是指针对推荐媒体数据的推荐解释信息;
策略输出模块14,还具体用于将业务表层活动特征针对每个配置影响因素的因素语义表征特征,所组成的集合确定为因素语义表征特征集合;
策略输出模块14,还具体用于将因素语义表征特征集合输入至媒体数据推荐模型;媒体数据推荐模型是基于样本对象在媒体数据推荐业务的样本因素语义表征特征集合,对样本媒体数据推荐模型进行训练优化后所得到的;样本因素语义表征特征集合包含样本业务表层活动特征,针对每个配置影响因素的样本因素语义表征特征;样本业务表层活动特征,是指样本对象在媒体数据推荐模型中的表层活动特征;
策略输出模块14,还具体用于通过媒体数据推荐模型,输出因素语义表征特征集合对应的推荐媒体数据;
策略输出模块14,还具体用于基于媒体数据推荐模型的模型属性,确定针对推荐媒体数据的推荐解释信息。
在一个实施例中,媒体数据推荐模型的模型属性为黑盒属性;
策略输出模块14,还具体用于获取用于对媒体数据推荐模型所输出的模型结果进行结果解释的可解释模型;
策略输出模块14,还具体用于将因素语义表征特征集合与推荐媒体数据,输入至可解释模型,通过可解释模型输出因素语义表征特征集合中,每个因素语义表征特征分别对应的特征影响值,得到特征影响值集合;特征影响值集合中的一个特征影响值,用于表征对应的因素语义表征特征对推荐媒体数据的影响程度;
策略输出模块14,还具体用于基于特征影响值集合,生成针对推荐媒体数据的推荐解释信息。
在一个实施例中,策略输出模块14,还具体用于按照特征影响值集合中每个特征影响值的大小顺序,对每个特征影响值进行排序,得到影响值序列;
策略输出模块14,还具体用于将影响值序列中的前K个特征影响值所分别对应的因素语义表征特征,均确定为高影响表征特征;
策略输出模块14,还具体用于基于高影响表征特征所反映的因素语义,生成针对推荐媒体数据的推荐解释信息。
根据本申请的一个实施例,图2所示的数据处理方法所涉及的步骤可由图9所示的数据处理装置1中的各个模块来执行。例如,图2中所示的步骤S101可由图9中的特征获取模块11以及特征输入模块12来执行,图2中所示的步骤S102可由图9中的特征分析模块13来执行;图2中所示的步骤S103可由图9中的策略输出模块14来执行。
在本申请实施例中,在为某个对象制定针对某个业务的业务策略时,可以先获取到该对象在该业务中的业务表层活动特征,通过深层挖掘分析模型可以对该业务表层活动特征进行深层挖掘分析处理,从而可以将业务表层活动特征转换为一个或多个深层次的因素语义表征特征;随后即可基于这些因素语义表征特征,来确定该对象在该业务的业务策略,除此之外,还可以基于因素语义表征特征,输出该业务策略的策略解释信息(用于解释该业务策略的信息)。应当理解,本申请可以构建业务的配置影响因素体系,再通过深层挖掘分析模型可以将对象在业务中的业务表层活动特征,转换为深层次的因素语义表征特征,对于对象针对业务的业务策略,是基于深层次的因素语义表征特征所确定输出的,并不是就表层的活动特征所确定的,可以很好地提升业务策略的准确性;此外,在本申请中,在确定输出业务策略的同时,还可以输出该业务策略的策略解释信息,该策略解释信息可以很好地解释确定该业务策略的缘由,由此可以直观呈现该业务策略的确定逻辑,可以很好地提升业务策略的可信度,同时,由于该策略解释信息是基于深层次的因素语义表征特征所确定的,该策略解释信息的解释层次也是较高的,由此可以进一步提升该业务策略的可信度。综上,本申请所提出的装置可以在业务策略的确定任务中,提升所确定的业务策略的可信性。
根据本申请的一个实施例,图9所示的数据处理装置1中的各个模块可以分别或全部合并为一个或若干个单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个子单元,可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由多个单元来实现,或者多个模块的功能由一个单元实现。在本申请的其它实施例中,数据处理装置1也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
根据本申请的一个实施例,可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用计算机设备上运行能够执行如图2中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图9中所示的数据处理装置1,以及来实现本申请实施例的数据处理方法。上述计算机程序可以记载于例如计算机可读记录介质上,并通过计算机可读记录介质装载于上述计算设备中,并在其中运行。
进一步地,请参见图10,图10是本申请实施例提供的另一种数据处理装置的结构示意图。该数据处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如该数据处理装置为一个应用软件;该数据处理装置可以用于执行图6所示的方法。如图10所示,该数据处理装置2可以包括:样本特征输入模块21、特征挖掘模块22以及模型优化模块23。
样本特征输入模块21,用于获取样本对象在业务中的样本业务表层活动特征,将样本业务表层活动特征输入至样本深层挖掘分析模型;样本深层挖掘分析模型具备基于业务的配置影响因素体系,为表层活动特征深层挖掘一个或多个因素语义表征特征的性能;配置影响因素体系中包含一个或多个配置影响因素,每个配置影响因素是指会对表层活动特征产生影响的因素;
特征挖掘模块22,用于在样本深层挖掘分析模型中,基于配置影响因素体系对样本业务表层活动特征进行深层挖掘分析处理,得到样本业务表层活动特征针对每个配置影响因素的初始样本因素语义表征特征;
模型优化模块23,用于基于样本业务表层活动特征针对每个配置影响因素的初始样本因素语义表征特征,对样本深层挖掘分析模型进行训练优化,得到深层挖掘分析模型;深层挖掘分析模型用于基于配置影响因素体系,对对象在业务中的业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征。
其中,样本特征输入模块21、特征挖掘模块22以及模型优化模块23的具体实现方式,可以参见上述图6所对应实施例中步骤S601-步骤S603的描述,这里将不再进行赘述。
在一个实施例中,配置影响因素体系中包括配置影响因素Si,i为正整数;
模型优化模块23,还具体用于将样本业务表层活动特征针对配置影响因素Si的初始样本因素语义表征特征,确定为目标初始样本表征特征;
模型优化模块23,还具体用于对目标初始样本表征特征进行语义约束处理,得到目标初始样本表征特征对应的样本特征约束属性;
模型优化模块23,还具体用于当确定出每个初始样本因素语义表征特征分别对应的样本特征约束属性时,将每个初始样本因素语义表征特征分别对应的样本特征约束属性,所组成的集合确定为样本约束属性集合;
模型优化模块23,还具体用于若样本约束属性集合中存在约束不足属性,则基于约束不足属性所对应的初始样本因素语义表征特征,对样本深层挖掘分析模型的模型参数进行调整,得到调整后的模型参数,将包含调整后的模型参数的样本深层挖掘分析模型确定为深层挖掘分析模型;
模型优化模块23,还具体用于若样本约束属性集合中不存在约束不足属性,则将样本深层挖掘分析模型确定为深层挖掘分析模型。
在本申请实施例中,可以构建业务的配置影响因素体系,再通过深层挖掘分析模型可以将对象在业务中的业务表层活动特征,转换为深层次的因素语义表征特征,对于对象针对业务的业务策略,是基于深层次的因素语义表征特征所确定输出的,并不是就表层的活动特征所确定的,可以很好地提升业务策略的准确性;此外,在本申请中,在确定输出业务策略的同时,还可以输出该业务策略的策略解释信息,该策略解释信息可以很好地解释确定该业务策略的缘由,由此可以直观呈现该业务策略的确定逻辑,可以很好地提升业务策略的可信度,同时,由于该策略解释信息是基于深层次的因素语义表征特征所确定的,该策略解释信息的解释层次也是较高的,由此可以进一步提升该业务策略的可信度。
根据本申请的一个实施例,图10所示的数据处理装置2中的各个模块可以分别或全部合并为一个或若干个单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个子单元,可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由多个单元来实现,或者多个模块的功能由一个单元实现。在本申请的其它实施例中,数据处理装置2也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
根据本申请的一个实施例,可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用计算机设备上运行能够执行如图6中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图10中所示的数据处理装置2,以及来实现本申请实施例的数据处理方法。上述计算机程序可以记载于例如计算机可读记录介质上,并通过计算机可读记录介质装载于上述计算设备中,并在其中运行。
进一步地,请参见图11,图11是本申请实施例提供的一种计算机设备的结构示意图。如图11所示,上述图9所对应实施例中的数据处理装置1,或图10所对应实施例中的数据处理装置2可以应用于上述计算机设备8000,上述计算机设备8000可以包括:处理器8001,网络接口8004和存储器8005,此外,上述计算机设备8000还包括:用户接口8003,和至少一个通信总线8002。其中,通信总线8002用于实现这些组件之间的连接通信。其中,用户接口8003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口8003还可以包括标准的有线接口、无线接口。网络接口8004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器8005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。存储器8005可选的还可以是至少一个位于远离前述处理器8001的存储装置。如图11所示,作为一种计算机可读存储介质的存储器8005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图11所示的计算机设备8000中,网络接口8004可提供网络通讯功能;而用户接口8003主要用于为用户提供输入的接口;而处理器8001可以用于调用存储器8005中存储的设备控制应用程序,以实现:
获取对象在业务中的业务表层活动特征,将业务表层活动特征输入至深层挖掘分析模型;深层挖掘分析模型具备基于业务的配置影响因素体系,为表层活动特征深层挖掘一个或多个因素语义表征特征的性能;配置影响因素体系中包含一个或多个配置影响因素,每个配置影响因素是指会对表层活动特征产生影响的因素;
在深层挖掘分析模型中,基于配置影响因素体系对业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征;
基于业务表层活动特征针对每个配置影响因素的因素语义表征特征,输出对象针对业务的业务策略,以及针对业务策略的策略解释信息。
或实现:
获取样本对象在业务中的样本业务表层活动特征,将样本业务表层活动特征输入至样本深层挖掘分析模型;样本深层挖掘分析模型具备基于业务的配置影响因素体系,为表层活动特征深层挖掘一个或多个因素语义表征特征的性能;配置影响因素体系中包含一个或多个配置影响因素,每个配置影响因素是指会对表层活动特征产生影响的因素;
在样本深层挖掘分析模型中,基于配置影响因素体系对样本业务表层活动特征进行深层挖掘分析处理,得到样本业务表层活动特征针对每个配置影响因素的初始样本因素语义表征特征;
基于样本业务表层活动特征针对每个配置影响因素的初始样本因素语义表征特征,对样本深层挖掘分析模型进行训练优化,得到深层挖掘分析模型;深层挖掘分析模型用于基于配置影响因素体系,对对象在业务中的业务表层活动特征进行深层挖掘分析处理,得到业务表层活动特征针对每个配置影响因素的因素语义表征特征。
应当理解,本申请实施例中所描述的计算机设备8000可执行前文图2到图6所对应实施例中对该数据处理方法的描述,也可执行前文图9所对应实施例中对该数据处理装置1,或前文图10所对应实施例中对该数据处理装置2的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且上述计算机可读存储介质中存储有前文提及的数据处理的计算机设备8000所执行的计算机程序,且上述计算机程序包括程序指令,当上述处理器执行上述程序指令时,能够执行前文图2到图6所对应实施例中对上述数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
上述计算机可读存储介质可以是前述任一实施例提供的数据处理装置或者上述计算机设备的内部存储单元,例如计算机设备的硬盘或内存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例中一方面提供的方法。
本申请实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例提供的方法及相关装置是参照本申请实施例提供的方法流程图和/或结构示意图来描述的,具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或结构示意一个方框或多个方框中指定的功能的步骤。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (16)

1.一种数据处理方法,其特征在于,包括:
获取对象在业务中的业务表层活动特征,将所述业务表层活动特征输入至深层挖掘分析模型;所述深层挖掘分析模型具备基于所述业务的配置影响因素体系,为表层活动特征深层挖掘一个或多个因素语义表征特征的性能;所述配置影响因素体系中包含一个或多个配置影响因素,每个配置影响因素是指会对所述表层活动特征产生影响的因素;
在所述深层挖掘分析模型中,基于所述配置影响因素体系对所述业务表层活动特征进行深层挖掘分析处理,得到所述业务表层活动特征针对每个配置影响因素的因素语义表征特征;
基于所述业务表层活动特征针对每个配置影响因素的因素语义表征特征,输出所述对象针对所述业务的业务策略,以及针对所述业务策略的策略解释信息。
2.根据权利要求1所述的方法,其特征在于,所述业务为物品推荐业务;所述配置影响因素包含虚拟资源状态因素;
所述在所述深层挖掘分析模型中,基于所述配置影响因素体系对所述业务表层活动特征进行深层挖掘分析处理,得到所述业务表层活动特征针对每个配置影响因素的因素语义表征特征,包括:
在所述业务表层活动特征中,获取所述对象与所述虚拟资源状态因素相关联的虚拟资源活动特征;所述虚拟资源活动特征包含所述对象所属的地域信息、所述对象针对高价值物品的兑换频率;所述高价值物品是指具备高价值属性的物品;
在所述地域信息所属的地域类型为优质地域类型,且所述兑换频率大于频率阈值时,将所述对象的虚拟资源状态确定为充足状态,生成用于反映所述充足状态的第一因素语义表征特征,将所述第一因素语义表征特征确定为所述业务表层活动特征针对虚拟资源状态因素的因素语义表征特征;
在所述地域信息所属的地域类型为普通地域类型,或所述兑换频率小于频率阈值时,将所述对象的虚拟资源状态确定为欠缺状态,生成用于反映所述欠缺状态的第二因素语义表征特征,将所述第二因素语义表征特征确定为所述业务表层活动特征针对虚拟资源状态因素的因素语义表征特征。
3.根据权利要求1所述的方法,其特征在于,所述配置影响因素体系中包括配置影响因素Si,i为正整数;
所述在所述深层挖掘分析模型中,基于所述配置影响因素体系对所述业务表层活动特征进行深层挖掘分析处理,得到所述业务表层活动特征针对每个配置影响因素的因素语义表征特征:
在所述深层挖掘分析模型中,基于所述配置影响因素体系对所述业务表层活动特征进行深层挖掘分析处理,输出所述业务表层活动特征针对每个配置影响因素的初始因素语义表征特征;
对所述业务表层活动特征针对配置影响因素Si的初始因素语义表征特征进行语义约束处理,得到所述业务表层活动特征针对配置影响因素Si的因素语义表征特征。
4.根据权利要求3所述的方法,其特征在于,所述对所述业务表层活动特征针对配置影响因素Si的初始因素语义表征特征进行语义约束处理,得到所述业务表层活动特征针对配置影响因素Si的因素语义表征特征,包括:
将所述业务表层活动特征针对配置影响因素Si的初始因素语义表征特征,确定为目标初始表征特征,将所述业务表层活动特征针对每个配置影响因素的初始因素语义表征特征中,除所述目标初始表征特征以外的每个初始深层语义表征特征,均确定为所述目标初始表征特征对应的待融合表征特征;所述目标初始表征特征对应的待融合表征特征包含待融合表征特征Sj,j为正整数;
将所述目标初始表征特征与所述待融合表征特征Sj进行融合处理,得到所述待融合表征特征Sj对应的融合表征特征Rj
当确定出每个待融合表征特征分别对应的融合表征特征时,基于所述每个待融合表征特征分别对应的融合表征特征,对所述目标初始表征特征进行语义约束处理,得到所述业务表层活动特征针对配置影响因素Si的因素语义表征特征。
5.根据权利要求4所述的方法,其特征在于,所述基于所述每个待融合表征特征分别对应的融合表征特征,对所述目标初始表征特征进行语义约束处理,得到所述业务表层活动特征针对配置影响因素Si的因素语义表征特征,包括:
获取待聚类对象集合;所述待聚类对象集合中包括至少两个待聚类对象;
基于所述目标初始表征特征,对所述至少两个待聚类对象进行聚类处理,得到第一类簇分布结果;所述第一类簇分布结果中包含第一类簇与第二类簇;所述第一类簇所属的类簇类别为基于所述配置影响因素Si所衍生的第一因素类别;所述第二类簇所属的类簇类别为基于所述配置影响因素Si所衍生的第二因素类别;所述第一因素类别与所述第二因素类别不同;
基于所述融合表征特征Rj,对所述至少两个待聚类对象进行聚类处理,得到第二类簇分布结果;所述第二类簇分布结果中包含第三类簇与第四类簇;所述第三类簇所属的类簇类别为所述第一因素类别;所述第四类簇所属的类簇类别为所述第二因素类别;
根据所述第一类簇、所述第二类簇、所述第三类簇以及所述第四类簇,确定所述目标初始表征特征针对所述融合表征特征Rj的特征区分属性;
当确定出所述目标初始表征特征分别针对每个融合表征特征的特征区分属性时,基于每个特征区分属性,确定所述业务表层活动特征针对配置影响因素Si的因素语义表征特征。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一类簇、所述第二类簇、所述第三类簇以及所述第四类簇,确定所述目标初始表征特征针对所述融合表征特征Rj的特征区分属性,包括:
获取所述至少两个待聚类对象中,每个待聚类对象分别对应的真实因素类别标签;
将真实因素类别标签为所述第一因素类别的待聚类对象,组合得到第一真实标签类簇,将真实因素类别标签为所述第二因素类别的待聚类对象,组合得到第二真实标签类簇;
基于所述第一类簇、所述第二类簇、所述第一真实标签类簇以及所述第二真实标签类簇,确定所述目标初始表征特征对应的第一聚类误差;
基于所述第三类簇、所述第四类簇、所述第一真实标签类簇以及所述第二真实标签类簇,确定所述融合表征特征Rj对应的第二聚类误差;
在所述第一聚类误差大于所述第二聚类误差,且所述第一聚类误差与所述第二聚类误差之间的误差差值绝对值大于差值阈值时,确定所述目标初始表征特征,针对所述融合表征特征Rj的特征区分属性为特征异常区分属性;
在所述第一聚类误差小于所述第二聚类误差,或所述第一聚类误差与所述第二聚类误差之间的误差差值绝对值小于差值阈值时,确定所述目标初始表征特征,针对所述融合表征特征Rj的特征区分属性为特征正常区分属性。
7.根据权利要求5所述的方法,其特征在于,所述基于每个特征区分属性,确定所述业务表层活动特征针对配置影响因素Si的因素语义表征特征,包括:
将每个特征区分属性所组成的集合确定为属性集合;
遍历所述属性集合;
若所述属性集合中存在特征异常区分属性,则确定所述目标初始表征特征的特征约束属性为约束不足属性,基于所述误差差值绝对值对所述深层挖掘分析模型进行优化,在优化后的深层挖掘分析模型中,基于所述配置影响因素体系对所述业务表层活动特征进行深层挖掘分析处理,得到所述业务表层活动特征针对每个配置影响因素的因素语义表征特征;
若所述属性集合中不存在特征异常区分属性,则确定所述目标初始表征特征的特征约束属性为约束充足属性,将所述目标初始表征特征语义表征特征,确定为所述业务表层活动特征针对配置影响因素Si的因素语义表征特征。
8.根据权利要求1所述的方法,其特征在于,所述业务为媒体数据推荐业务;所述业务策略是指针对所述对象的推荐媒体数据;所述策略解释信息是指针对所述推荐媒体数据的推荐解释信息;
所述基于所述业务表层活动特征针对每个配置影响因素的因素语义表征特征,输出所述对象针对所述业务的业务策略,以及针对所述业务策略的策略解释信息,包括:
将所述业务表层活动特征针对每个配置影响因素的因素语义表征特征,所组成的集合确定为因素语义表征特征集合;
将所述因素语义表征特征集合输入至媒体数据推荐模型;所述媒体数据推荐模型是基于样本对象在所述媒体数据推荐业务的样本因素语义表征特征集合,对样本媒体数据推荐模型进行训练优化后所得到的;所述样本因素语义表征特征集合包含样本业务表层活动特征,针对每个配置影响因素的样本因素语义表征特征;所述样本业务表层活动特征,是指所述样本对象在所述媒体数据推荐模型中的表层活动特征;
通过所述媒体数据推荐模型,输出所述因素语义表征特征集合对应的推荐媒体数据;
基于所述媒体数据推荐模型的模型属性,确定针对所述推荐媒体数据的推荐解释信息。
9.根据权利要求8所述的方法,其特征在于,所述媒体数据推荐模型的模型属性为黑盒属性;
通过基于所述媒体数据推荐模型的模型属性,确定针对所述推荐媒体数据的推荐解释信息,包括:
获取用于对所述媒体数据推荐模型所输出的模型结果进行结果解释的可解释模型;
将所述因素语义表征特征集合与所述推荐媒体数据,输入至所述可解释模型,通过所述可解释模型输出所述因素语义表征特征集合中,每个因素语义表征特征分别对应的特征影响值,得到特征影响值集合;所述特征影响值集合中的一个特征影响值,用于表征对应的因素语义表征特征对所述推荐媒体数据的影响程度;
基于所述特征影响值集合,生成针对所述推荐媒体数据的推荐解释信息。
10.根据权利要求9所述的方法,其特征在于,所述基于所述特征影响值集合,生成针对所述推荐媒体数据的推荐解释信息,包括:
按照所述特征影响值集合中每个特征影响值的大小顺序,对所述每个特征影响值进行排序,得到影响值序列;
将所述影响值序列中的前K个特征影响值所分别对应的因素语义表征特征,均确定为高影响表征特征;
基于所述高影响表征特征所反映的因素语义,生成针对所述推荐媒体数据的推荐解释信息。
11.一种数据处理方法,其特征在于,包括:
获取样本对象在所述业务中的样本业务表层活动特征,将所述样本业务表层活动特征输入至样本深层挖掘分析模型;所述样本深层挖掘分析模型具备基于所述业务的配置影响因素体系,为表层活动特征深层挖掘一个或多个因素语义表征特征的性能;所述配置影响因素体系中包含一个或多个配置影响因素,每个配置影响因素是指会对所述表层活动特征产生影响的因素;
在所述样本深层挖掘分析模型中,基于所述配置影响因素体系对所述样本业务表层活动特征进行深层挖掘分析处理,得到所述样本业务表层活动特征针对每个配置影响因素的初始样本因素语义表征特征;
基于所述样本业务表层活动特征针对每个配置影响因素的初始样本因素语义表征特征,对所述样本深层挖掘分析模型进行训练优化,得到深层挖掘分析模型;所述深层挖掘分析模型用于基于所述配置影响因素体系,对对象在所述业务中的业务表层活动特征进行深层挖掘分析处理,得到所述业务表层活动特征针对每个配置影响因素的因素语义表征特征。
12.根据权利要求11所述的方法,其特征在于,所述配置影响因素体系中包括配置影响因素Si,i为正整数;
所述基于所述样本业务表层活动特征针对每个配置影响因素的初始样本因素语义表征特征,对所述样本深层挖掘分析模型进行训练优化,得到深层挖掘分析模型,包括:
将所述样本业务表层活动特征针对所述配置影响因素Si的初始样本因素语义表征特征,确定为目标初始样本表征特征;
对所述目标初始样本表征特征进行语义约束处理,得到所述目标初始样本表征特征对应的样本特征约束属性;
当确定出每个初始样本因素语义表征特征分别对应的样本特征约束属性时,将每个初始样本因素语义表征特征分别对应的样本特征约束属性,所组成的集合确定为样本约束属性集合;
若所述样本约束属性集合中存在约束不足属性,则基于所述约束不足属性所对应的初始样本因素语义表征特征,对所述样本深层挖掘分析模型的模型参数进行调整,得到调整后的模型参数,将包含所述调整后的模型参数的样本深层挖掘分析模型确定为所述深层挖掘分析模型;
若所述样本约束属性集合中不存在约束不足属性,则将所述样本深层挖掘分析模型确定为所述深层挖掘分析模型。
13.一种数据处理装置,其特征在于,包括:
特征获取模块,用于获取对象在业务中的业务表层活动特征;
特征输入模块,用于将所述业务表层活动特征输入至深层挖掘分析模型;所述深层挖掘分析模型具备基于所述业务的配置影响因素体系,为表层活动特征深层挖掘一个或多个因素语义表征特征的性能;所述配置影响因素体系中包含一个或多个配置影响因素,每个配置影响因素是指会对所述表层活动特征产生影响的因素;
特征分析模块,用于在所述深层挖掘分析模型中,基于所述配置影响因素体系对所述业务表层活动特征进行深层挖掘分析处理,得到所述业务表层活动特征针对每个配置影响因素的因素语义表征特征;
策略输出模块,用于基于所述业务表层活动特征针对每个配置影响因素的因素语义表征特征,输出所述对象针对所述业务的业务策略,以及针对所述业务策略的策略解释信息。
14.一种计算机设备,其特征在于,包括:处理器、存储器以及网络接口;
所述处理器与所述存储器、所述网络接口相连,其中,所述网络接口用于提供网络通信功能,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以使所述计算机设备执行权利要求1-12任一项所述的方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序适于由处理器加载并执行权利要求1-12任一项所述的方法。
16.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中,所述计算机程序适于由处理器读取并执行,以使得具有所述处理器的计算机设备执行权利要求1-12任一项所述的方法。
CN202310328766.1A 2023-03-24 2023-03-24 一种数据处理方法、装置、设备以及可读存储介质 Pending CN116976353A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310328766.1A CN116976353A (zh) 2023-03-24 2023-03-24 一种数据处理方法、装置、设备以及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310328766.1A CN116976353A (zh) 2023-03-24 2023-03-24 一种数据处理方法、装置、设备以及可读存储介质

Publications (1)

Publication Number Publication Date
CN116976353A true CN116976353A (zh) 2023-10-31

Family

ID=88478466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310328766.1A Pending CN116976353A (zh) 2023-03-24 2023-03-24 一种数据处理方法、装置、设备以及可读存储介质

Country Status (1)

Country Link
CN (1) CN116976353A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117421462A (zh) * 2023-12-18 2024-01-19 中信证券股份有限公司 一种数据处理方法、装置及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117421462A (zh) * 2023-12-18 2024-01-19 中信证券股份有限公司 一种数据处理方法、装置及电子设备
CN117421462B (zh) * 2023-12-18 2024-03-08 中信证券股份有限公司 一种数据处理方法、装置及电子设备

Similar Documents

Publication Publication Date Title
Berryhill et al. Hello, World: Artificial intelligence and its use in the public sector
Bhatia Data mining and data warehousing: principles and practical techniques
Pierson Data science for dummies
Barga et al. Predictive analytics with Microsoft Azure machine learning
Akerkar et al. Intelligent techniques for data science
CN112749749B (zh) 基于分类决策树模型的分类方法、装置及电子设备
WO2022252363A1 (zh) 数据处理方法、计算机设备以及可读存储介质
Singh Deploy machine learning models to production
Johnsen The future of Artificial Intelligence in Digital Marketing: The next big technological break
US20230034820A1 (en) Systems and methods for managing, distributing and deploying a recursive decisioning system based on continuously updating machine learning models
CN116976353A (zh) 一种数据处理方法、装置、设备以及可读存储介质
Alaimo Computational Consumption: Social media and the construction of digital consumers
CN116821516B (zh) 资源推荐方法、装置、设备及存储介质
Wodecki et al. Artificial intelligence methods and techniques
CN117251586A (zh) 多媒体资源推荐方法、装置及存储介质
US20230186117A1 (en) Automated cloud data and technology solution delivery using dynamic minibot squad engine machine learning and artificial intelligence modeling
CN110347916A (zh) 跨场景的项目推荐方法、装置、电子设备及存储介质
Trivedi How to Speak Tech
Pawlus et al. Hands-On Deep Learning with R: A practical guide to designing, building, and improving neural network models using R
Mittal et al. Social Network Analysis using interest mining: A critical review
Soh et al. Data science solutions on Azure
Rao Keras to Kubernetes: The journey of a machine learning model to production
CN116764236A (zh) 游戏道具推荐方法、装置、计算机设备和存储介质
Wang et al. Semi-automatic service value network modeling approach based on external public data
Rivera Practical TensorFlow. js

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication