CN114461869A - 业务特征数据处理方法、装置、电子设备及存储介质 - Google Patents
业务特征数据处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114461869A CN114461869A CN202111570134.3A CN202111570134A CN114461869A CN 114461869 A CN114461869 A CN 114461869A CN 202111570134 A CN202111570134 A CN 202111570134A CN 114461869 A CN114461869 A CN 114461869A
- Authority
- CN
- China
- Prior art keywords
- service
- data
- importance
- analysis
- importance analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开关于一种业务特征数据处理方法、装置、电子设备及存储介质,该方法包括获取目标业务的第一数量个业务特征数据在多个重要性分析维度的分析指标数据;根据多个重要性分析维度的分析指标数据,分别从第一数量个业务特征数据中,筛选出多个重要性分析维度各自对应的目标业务特征数据;基于多个重要性分析维度各自对应预设模型,对各自对应的目标业务特征数据进行业务处理,得到多个重要性分析维度各自对应的指标权重信息;基于指标权重信息,对多个重要性分析维度的分析指标数据进行加权融合,得到第一数量个业务特征数据的目标分析指标数据。利用本公开实施例可以提升业务特征数据对业务模型进行业务处理的重要程度的表征精准性和全面性。
Description
技术领域
本公开涉及人工智能技术领域,尤其涉及一种业务特征数据处理方法、装置、电子设备及存储介质。
背景技术
随着人工智能技术的飞速发展和大数据时代的到来,机器学习模型在越来越多的领域得到了应用。但随着数据规模的越来越大,机器学习模型越来越复杂的模型结构也引发了无法解释的黑盒问题,暴露出了安全风险和不公正问题,不利于机器学习模型的大规模使用。
相关技术中,为了应对黑盒模型的不可解释的问题,提出了可解释机器学习的方法,具体的,是通过将机器学习模型的模型参数作为,用于表征相关业务场景中业务特征数据对模型进行业务处理的重要程度的指标数据。但相关技术中的方法对模型要求较高,只有符合要求的线性机器学习模型(白盒模型)才可以直接从模型参数中,获得能够表征业务特征数据对模型进行业务处理的重要程度的指标数据,其他的复杂模型(特别是黑盒模型)无法使用此方法,且上述以模型参数来作为表征业务特征数据对模型进行业务处理的重要程度的指标数据的方法重要性分析维度单一,不能准确表征业务特征数据对模型进行业务处理的重要程度,导致后续模型的通用性和鲁棒性较差,无法有效的进行业务处理,而大量无效的业务处理也带来了计算资源浪费,设备性能差等问题。
发明内容
本公开提供一种业务特征数据处理方法、装置、电子设备及存储介质,以至少解决相关技术中重要性分析维度单一,不能准确表征业务特征数据对模型进行业务处理的重要程度,导致后续模型的通用性和鲁棒性较差,无法有效的进行业务处理,而大量无效的业务处理也带来了计算资源浪费,设备性能差等问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种业务特征数据处理方法,包括:
获取目标业务的第一数量个业务特征数据在多个重要性分析维度的分析指标数据,所述分析指标数据用于从多个所述重要性分析维度,分别表征所述第一数量个业务特征数据,对所述目标业务对应的业务模型进行业务处理的重要程度;
根据多个所述重要性分析维度的分析指标数据,分别从所述第一数量个业务特征数据中,筛选出多个所述重要性分析维度各自对应的目标业务特征数据,所述目标业务特征数据为对所述业务模型进行业务处理的重要程度满足预设条件的业务特征数据;
基于多个所述重要性分析维度各自对应预设模型,对多个所述重要性分析维度各自对应的目标业务特征数据进行业务处理,得到多个所述重要性分析维度各自对应的指标权重信息;
基于多个所述重要性分析维度各自对应的指标权重信息,对多个所述重要性分析维度的分析指标数据进行加权融合,得到所述第一数量个业务特征数据的目标分析指标数据。
在一个可选的实施例中,所述基于多个所述重要性分析维度各自对应预设模型,对多个所述重要性分析维度各自对应的目标业务特征数据进行业务处理,得到多个所述重要性分析维度各自对应的指标权重信息包括:
将多个所述重要性分析维度各自对应的目标业务特征数据,分别拆分成训练业务特征数据和测试业务特征数据;
基于多个所述重要性分析维度各自对应的训练业务特征数据对预设模型进行训练,得到目标模型;
将多个所述重要性分析维度各自对应的测试业务特征数据,分别输入多个所述重要性分析维度对应目标模型进行业务处理,得到所述目标业务特征数据在多个所述重要性分析维度对应的预测业务处理数据;
根据所述预测业务处理数据和所述预设业务标注数据,确定所述多个所述重要性分析维度对应的业务损失信息;
根据多个所述重要性分析维度对应的业务损失信息,生成多个所述重要性分析维度的指标权重信息。
在一个可选的实施例中,所述根据多个所述重要性分析维度对应的业务损失信息,生成多个所述重要性分析维度的指标权重信息包括:
基于预设函数,确定多个所述重要性分析维度对应的业务损失信息的目标反比数据;
根据多个所述重要性分析维度对应的目标反比数据,确定所述多个所述重要性分析维度的指标权重信息。
在一个可选的实施例中,所述方法还包括:
从多个所述重要性分析维度各自对应的目标业务特征数据,分别选取第二数量个业务特征数据;
所述基于多个所述重要性分析维度各自对应预设模型,对多个所述重要性分析维度各自对应的目标业务特征数据进行业务处理,得到多个所述重要性分析维度各自对应的指标权重信息包括:
基于多个所述重要性分析维度各自对应预设模型,对多个所述重要性分析维度各自对应的所述第二数量个业务特征数据进行业务处理,得到多个所述重要性分析维度各自对应的指标权重信息。
在一个可选的实施例中,所述方法还包括:
基于所述目标分析指标数据,对所述第一数量个业务特征数据进行排序,得到业务特征数据序列;
展示所述业务特征数据序列。
在一个可选的实施例中,所述方法还包括:
对多个所述重要性分析维度的分析指标数据进行归一化处理,得到归一化后的分析指标数据;
所述基于多个所述重要性分析维度各自对应的指标权重信息,对多个所述重要性分析维度的分析指标数据进行加权融合,得到所述第一数量个业务特征数据的目标分析指标数据包括:
基于多个所述重要性分析维度各自对应的指标权重信息,对所述归一化后的分析指标数据进行加权融合,得到所述目标分析指标数据。
在一个可选的实施例中,所述方法还包括:
确定所述业务模型的模型类型;
在所述模型类型为预设模型类型的情况下,所述获取目标业务的第一数量个业务特征数据在多个重要性分析维度的分析指标数据包括:
获取所述第一数量个业务特征数据在原生重要性分析维度的分析指标数据,在置换重要性分析维度的分析指标数据,以及在加性解释重要性分析维度的分析指标数据;
其中,所述预设模型类型为具有所述原生重要性分析维度的分析指标数据的模型类型。
在一个可选的实施例中,在所述模型类型不为所述预设模型类型的情况下,所述获取目标业务的第一数量个业务特征数据在多个重要性分析维度的分析指标数据包括:
获取所述第一数量个业务特征数据在所述置换重要性分析维度的分析指标数据,以及在所述加性解释重要性分析维度的分析指标数据。
在一个可选的实施例中,多个所述重要性分析维度包括:原生重要性分析维度、置换重要性分析维度和加性解释重要性分析维度中的至少两个重要性分析维度。
根据本公开实施例的第二方面,提供一种业务特征数据处理装置,包括:
分析指标数据获取模块,被配置为执行获取目标业务的第一数量个业务特征数据在多个重要性分析维度的分析指标数据,所述分析指标数据用于从多个所述重要性分析维度,分别表征所述第一数量个业务特征数据,对所述目标业务对应的业务模型进行业务处理的重要程度;
业务特征数据筛选模块,被配置为执行根据多个所述重要性分析维度的分析指标数据,分别从所述第一数量个业务特征数据中,筛选出多个所述重要性分析维度各自对应的目标业务特征数据,所述目标业务特征数据为对所述业务模型进行业务处理的重要程度满足预设条件的业务特征数据;
业务处理模块,被配置为执行基于多个所述重要性分析维度各自对应预设模型,对多个所述重要性分析维度各自对应的目标业务特征数据进行业务处理,得到多个所述重要性分析维度各自对应的指标权重信息;
加权融合模块,被配置为执行基于多个所述重要性分析维度各自对应的指标权重信息,对多个所述重要性分析维度的分析指标数据进行加权融合,得到所述第一数量个业务特征数据的目标分析指标数据,所述目标分析指标数据用于从多个所述重要性分析维度,融合表征所述第一数量个业务特征数据,对所述业务模型进行业务处理的重要程度。
在一个可选的实施例中,所述业务处理模块包括:
业务特征数据拆分单元,被配置为执行将多个所述重要性分析维度各自对应的目标业务特征数据,分别拆分成训练业务特征数据和测试业务特征数据;
模型训练单元,被配置为执行基于多个所述重要性分析维度各自对应的训练业务特征数据对预设模型进行训练,得到目标模型;
业务处理单元,被配置为执行将多个所述重要性分析维度各自对应的测试业务特征数据,分别输入多个所述重要性分析维度对应目标模型进行业务处理,得到所述目标业务特征数据在多个所述重要性分析维度对应的预测业务处理数据;
业务损失信息确定单元,被配置为执行根据所述预测业务处理数据和所述预设业务标注数据,确定所述多个所述重要性分析维度对应的业务损失信息;
指标权重信息生成单元,被配置为执行根据多个所述重要性分析维度对应的业务损失信息,生成多个所述重要性分析维度的指标权重信息。
在一个可选的实施例中,所述指标权重信息生成单元包括:
反比数据确定单元,被配置为执行基于预设函数,确定多个所述重要性分析维度对应的业务损失信息的目标反比数据;
指标权重信息确定单元,被配置为执行根据多个所述重要性分析维度对应的目标反比数据,确定所述多个所述重要性分析维度的指标权重信息。
在一个可选的实施例中,所述装置还包括:
业务特征数据选取模块,被配置为执行从多个所述重要性分析维度各自对应的目标业务特征数据,分别选取第二数量个业务特征数据;
所述业务处理模块730还被配置为执行:基于多个所述重要性分析维度各自对应预设模型,对多个所述重要性分析维度各自对应的所述第二数量个业务特征数据进行业务处理,得到多个所述重要性分析维度各自对应的指标权重信息。
在一个可选的实施例中,所述装置还包括:
业务特征数据排序模块,被配置为执行基于所述目标分析指标数据,对所述第一数量个业务特征数据进行排序,得到业务特征数据序列;
业务特征数据序列展示模块,被配置为执行展示所述业务特征数据序列。
在一个可选的实施例中,所述装置还包括:
归一化处理模块,被配置执行对多个所述重要性分析维度的分析指标数据进行归一化处理,得到归一化后的分析指标数据;
所述加权融合模块还被配置为执行基于多个所述重要性分析维度各自对应的指标权重信息,对所述归一化后的分析指标数据进行加权融合,得到所述目标分析指标数据。
在一个可选的实施例中,所述装置还包括:
模型类型确定模块,被配置为执行确定所述业务模型的模型类型;
在所述模型类型为预设模型类型的情况下,所述分析指标数据获取模块还被配置为执行:
获取所述第一数量个业务特征数据在原生重要性分析维度的分析指标数据,在置换重要性分析维度的分析指标数据,以及在加性解释重要性分析维度的分析指标数据;
其中,所述预设模型类型为具有所述原生重要性分析维度的分析指标数据的模型类型。
在一个可选的实施例中,在所述模型类型不为所述预设模型类型的情况下,所述分析指标数据获取模块还被配置为执行:获取所述第一数量个业务特征数据在所述置换重要性分析维度的分析指标数据,以及在所述加性解释重要性分析维度的分析指标数据。
在一个可选的实施例中,多个所述重要性分析维度包括:原生重要性分析维度、置换重要性分析维度和加性解释重要性分析维度中的至少两个重要性分析维度。
根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如上述第一方面中任一项所述的方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行本公开实施例的第一方面中任一项所述方法。
根据本公开实施例的第五方面,提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行本公开实施例的第一方面中任一项所述方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
通过第一数量个业务特征数据在多个重要性分析维度的分析指标数据,分别确定出每个重要性分析维度下对业务模型进行业务处理的重要程度满足预设条件的目标业务特征数据;接着,结合多个重要性分析维度各自对应的预设模型,对结合分析指标数据确定出的目标业务特征数据进行业务处理,可以快速准确的确定出多个重要性分析维度各自对应的指标权重信息,进而可以基于多个重要性分析维度各自对应的指标权重信息,对多个重要性分析维度的分析指标数据进行加权融合,可以得到能更全面精准表征第一数量个业务特征数据,对业务模型进行业务处理的重要程度的目标分析指标数据,帮助用户更好的了解第一数量个业务特征数据,对业务模型进行业务处理的重要程度,有效避免单一重要性分析维度的分析指标数据存在的片面、不能准确表征第一数量个业务特征数据,对业务模型进行业务处理的重要程度的问题,进而可以更好的提升后续业务模型的通用性和鲁棒性,提升业务处理的精准性和有效性,避免无效的业务处理,减少无效业务处理带来的计算资源浪费,提升设备性能。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种应用环境的示意图;
图2是根据一示例性实施例示出的一种业务特征数据处理方法的流程图;
图3是根据一示例性实施例示出的一种基于多个重要性分析维度各自对应预设模型,对多个重要性分析维度各自对应的目标业务特征数据进行业务处理,得到多个重要性分析维度各自对应的指标权重信息法的流程图;
图4是根据一示例性实施例示出的另一种业务特征数据处理方法的流程图;
图5是根据一示例性实施例示出的另一种业务特征数据处理方法的流程图;
图6是根据一示例性实施例提供的一种确定第一数量个业务特征数据的目标分析指标数据的示意图;
图7是根据一示例性实施例示出的一种业务特征数据处理装置框图;
图8是根据一示例性实施例示出的一种用于业务特征数据处理的电子设备的框图;
图9是根据一示例性实施例示出的一种用于业务特征数据处理的电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
请参阅图1,图1是根据一示例性实施例示出的一种应用环境的示意图,如图1所示,该应用环境可以包括终端100和服务器200。
在一个可选的实施例中,服务器100可以为用于训练业务模型,以及用于进行业务特征数据处理,确定出业务特征数据的目标分析指标数据。具体的,服务器100可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
在一个可选的实施例中,终端200可以用于结合业务模型和目标分析指标数据,向用户提供业务服务。具体的,终端200可以包括但不限于智能手机、台式计算机、平板电脑、笔记本电脑、智能音箱、数字助理、增强现实(augmented reality,AR)/虚拟现实(virtualreality,VR)设备、智能可穿戴设备等类型的电子设备,也可以为运行于上述电子设备的软体,例如应用程序等。可选的,电子设备上运行的操作系统可以包括但不限于安卓系统、IOS系统、linux、windows等。
此外,需要说明的是,图1所示的仅仅是本公开提供的一种应用环境,在实际应用中,还可以包括其他应用环境,例如进行业务特征数据处理,确定出业务特征数据的目标分析指标数据的操作可以在终端实现。
本说明书实施例中,上述服务器100以及终端200可以通过有线或无线通信方式进行直接或间接地连接,本公开在此不做限制。
图2是根据一示例性实施例示出的一种业务特征数据处理方法的流程图,如图2所示,该业务特征数据处理方法用于终端、或服务器等设备中,包括以下步骤。
在步骤S201中,获取目标业务的第一数量个业务特征数据在多个重要性分析维度的分析指标数据。
在一个具体的实施例中,上述第一数量个业务特征数据在多个重要性分析维度分析指标数据可以用于从多个重要性分析维度,分别表征第一数量个业务特征数据,对目标业务对应的业务模型进行业务处理的重要程度。
在一个具体的实施例中,目标业务可以结合实际应用场景的不同而不同,例如多媒体资源推荐业务,分类业务等。具体的,业务特征数据可以是目标业务对应场景中客观存在的业务数据中每一项数据的特征表征。可选的,以多媒体资源推荐业务为例,业务数据可以为样本对象(用户账号)的对象数据,样本对象对应的多媒体资源的资源数据(执行过预设操作的第一多媒体资源的资源数据和未执行过预设操作的第二多媒体资源的资源数据)。可选的,多媒体资源可以包括文本、图像等静态资源,也可以包括短视频等动态资源。在一个具体的实施例中,资源数据可以为用于描述多媒体资源的数据,以多媒体资源为视频为例,资源数据可以包括多媒体资源的发布者信息、资源标识、发布日期、视频帧图像、音频信息、播放时长、标题信息等数据。对象数据可以为用于描述样本对象兴趣喜好的数据,具体的,对象数据可以包括但不限于用户性别、年龄、学历、地域等数据。上述预设操作可以包括但不限于浏览、点击、转化(例如基于多媒体资源购买了相关产品,或基于多媒体资源下载了相关应用等)等。可选的,以分类业务为例,业务特征数据可以为待分类图像(业务数据)的特征表征。具体的,业务模型可以为用于处理目标业务的机器学习模型。
在一个可选的实施例中,上述多个重要性分析维度可以结合实际应用进行设置。可选的,多个重要性分析维度可以包括:原生重要性分析维度、置换重要性分析维度和加性解释重要性分析维度中的至少两个重要性分析维度。
在一个具体的实施例中,原生重要性分析维度可以为结合业务模型自带的参数来分析业务特征数据对业务模型进行业务处理的重要程度的维度。置换重要性分析维度可以为结合业务特征数据置换后,业务模型的业务处理误差情况,来分析业务特征数据对业务模型进行业务处理的重要程度的维度。加性解释重要性分析维度可以为结合业务特征数据对业务处理结果的影响程度,来分析业务特征数据对业务模型进行业务处理的重要程度的维度。
在一个具体的实施例中,业务特征数据在原始重要性分析维度的分析指标数据可以为业务模型自带的,能表征第一数量个业务特征数据对业务模型进行业务处理的重要程度的参数。业务特征数据在置换重要性分析维度的分析指标数据可以为能够表征业务特征数据置换后,业务模型的业务处理误差情况的参数。业务特征数据在加性解释重要性分析维度的分析指标数据可以为能够表征业务特征数据对业务处理结果的影响程度的参数。
在一个可选的实施例中,上述业务特征数据在多个重要性分析维度的分析指标数据可以预先生成,并存储到相应的数据库;相应的,可以在业务特征数据处理过程中,可以从数据库请求业务特征数据在多个重要性分析维度的分析指标数据。在另一个可选的实施例中,业务特征数据在多个重要性分析维度的分析指标数据也可以在业务特征数据处理过程中生成。具体的,业务特征数据在原始重要性分析维度的分析指标数据可以结合具体业务场景中的训练数据进行业务模型的训练后,从训练好的业务模型中获取。业务特征数据在置换重要性分析维度的分析指标数据可以通过比较业务特征数据在置换前后业务模型的业务处理差异情况来确定;业务特征数据在加性解释重要性分析维度的分析指标数据可以结合SHAP(SHapley Additive ExPlanations,沙普利加性解释模型)来确定。
本说明书实施例中,结合原生重要性分析维度、置换重要性分析维度和加性解释重要性分析维度中的至少两个重要性分析维度的分析指标数据,可以更全面准确的来表征业务特征数据,对业务模型进行业务处理的重要程度,进而可以更好的提升后续业务模型进行业务处理的精准性和有效性,避免无效的业务处理,减少无效业务处理带来的计算资源浪费,提升设备性能。
在一个可选的实施例中,上述方法还可以包括:
确定业务模型的模型类型;
在模型类型为预设模型类型的情况下,获取目标业务的第一数量个业务特征数据在多个重要性分析维度的分析指标数据包括:
获取第一数量个业务特征数据在原生重要性分析维度的分析指标数据,在置换重要性分析维度的分析指标数据,以及在加性解释重要性分析维度的分析指标数据。
在实际应用中,存在某些类型的模型具有业务特征数据在原生重要性分析维度的分析指标数据,某些类型的模型不具有业务特征数据在原生重要性分析维度的分析指标数据。可选的,在多个重要性分析维度包括原始重要性分析维度的情况下,可以先确定上述处理目标业务的业务模型的模型类型;可选的,假设多个重要性分析维度还包括置换重要性分析维度和加性解释重要性分析维度,相应的,在业务模型的模型类型为预设模型类型的情况下,可以获取第一数量个业务特征数据在原生重要性分析维度的分析指标数据,在置换重要性分析维度的分析指标数据,以及在加性解释重要性分析维度的分析指标数据。
在一个具体的实施例中,上述预设模型类型可以为预先设置的具有原生重要性分析维度的分析指标数据的模型类型,即自带可以表征业务特征数据对业务模型进行业务处理的重要程度的模型。具体的,预设模型类型可以包括但不限于回归模型、决策树模型等。具体的,不同类型的模型对应的原始重要性分析维度的分析指标数据可以不同,例如,回归模型对应的原始重要性分析维度的分析指标数据可以为回归模型的加权系数,决策树模型对应的原始重要性分析维度的分析指标数据可以为通过计算基尼系数或熵的减少量所得的分析指标数据。
在一个可选的实施例中,上述方法还可以包括:
在模型类型不为预设模型类型的情况下,上述获取目标业务的第一数量个业务特征数据在多个重要性分析维度的分析指标数据包括:
获取第一数量个业务特征数据在置换重要性分析维度的分析指标数据,以及在加性解释重要性分析维度的分析指标数据。
上述实施例中,结合模型类型预先确定业务模型是否具有业务特征数据在原生重要性分析维度的分析指标数据,在模型类型为预设模型类型的情况下,获取第一数量个业务特征数据在原生重要性分析维度的分析指标数据,在置换重要性分析维度的分析指标数据,以及在加性解释重要性分析维度的分析指标数据,提升获取的能够表征业务特征数据,对业务模型进行业务处理的重要程度的业务指标数据的全面性;且在模型类型不为预设模型类型的情况下,获取第一数量个业务特征数据在置换重要性分析维度的分析指标数据,以及在加性解释重要性分析维度的分析指标数据,可以避免不必要的数据请求或计算,进而降低计算资源浪费,提升设备性能。
在步骤S203中,根据多个重要性分析维度的分析指标数据,分别从第一数量个业务特征数据中,筛选出多个重要性分析维度各自对应的目标业务特征数据。
在一个具体的实施例中,上述目标业务特征数据可以为对业务模型进行业务处理的重要程度满足预设条件的业务特征数据。具体的,预设条件可以为预先设置的目标业务特征数据的筛选条件,具体的,预设条件可以用于筛选出对业务模型进行业务处理的重要程度较高的目标业务特征数据。
在一个可选的实施例中,针对某一重要性分析维度,可以将分析指标数据降序排序后,排在前第三数量位的分析指标数据对应的业务特征数据作为目标业务特征数据。可选的,针对某一重要性分析维度,可以将分析指标数据大于等于预设阈值的业务特征数据作为目标业务特征数据。具体的,预设阈值可以结合实际应用预先设置。
在步骤S205中,基于多个重要性分析维度各自对应预设模型,对多个重要性分析维度各自对应的目标业务特征数据进行业务处理,得到多个重要性分析维度各自对应的指标权重信息。
在一个具体的实施例中,每个重要性分析维度对应的指标权重信息可以表征该重要性分析维度的分析指标数据在多个重要性分析维度融合的分析指标数据中的重要程度。
在一个具体的实施例中,每个重要性分析维度对应的预设模型可以用于结合该重要性分析维度对应的目标业务特征数据进行业务处理,以生成该重要性分析维度对应的指标权重信息。多个重要性分析维度各自对应预设模型可以为同一类模型,具体的,上述预设模型可以为可解释模型,例如线性回归、逻辑回归、决策树等等常见的可解释模型。
在一个可选的实施例中,如图3所示,上述基于多个重要性分析维度各自对应预设模型,对多个重要性分析维度各自对应的目标业务特征数据进行业务处理,得到多个重要性分析维度各自对应的指标权重信息可以包括以下步骤:
在步骤S301中,将多个重要性分析维度各自对应的目标业务特征数据,分别拆分成训练业务特征数据和测试业务特征数据;
在步骤S303中,基于多个重要性分析维度各自对应的训练业务特征数据对预设模型进行训练,得到目标模型;
在步骤S305中,将多个重要性分析维度各自对应的测试业务特征数据,分别输入多个重要性分析维度对应目标模型进行业务处理,得到目标业务特征数据在多个重要性分析维度对应的预测业务处理数据;
在步骤S307中,根据预测业务处理数据和预设业务标注数据,确定多个重要性分析维度对应的业务损失信息;
在步骤S309中,根据多个重要性分析维度对应的业务损失信息,生成多个重要性分析维度的指标权重信息。
在一个具体的实施例中,可以结合实际应用需求,按照预设比例分别拆分每个重要性分析维度对应的目标业务特征数据,得到每个重要性分析维度对应的训练业务特征数据和测试业务特征数据。
在一个具体的实施例中,上述基于多个重要性分析维度各自对应的训练业务特征数据对预设模型进行训练,得到目标模型可以包括:将多个重要性分析维度各自对应的训练业务特征数据,分别输入多个重要性分析维度对应预设模型进行业务处理,得到训练业务特征数据在多个重要性分析维度对应的训练业务处理数据;根据训练业务处理数据和预设业务标注数据,确定多个重要性分析维度对应的训练业务损失信息;基于每个重要性分析维度对应的训练业务损失信息更新该重要性分析维度对应的预设模型的模型参数;基于更新后的预设模型重复上述将多个重要性分析维度各自对应的训练业务特征数据,分别输入多个重要性分析维度对应预设模型进行业务处理,得到训练业务特征数据在多个重要性分析维度对应的训练业务处理数据,至基于每个重要性分析维度对应的训练业务损失信息更新该重要性分析维度对应的预设模型的模型参数的训练迭代操作,直至满足预设训练收敛条件,并将满足预设训练收敛条件时,每个重要性分析维度对应的预设模型作为该重要性分析维度对应的目标模型。
在一个具体的实施例中,预设业务标注数据可以结合实际业务进行设置。训练业务特征数据在每个重要性分析维度对应的训练业务处理数据可以为该重要性分析维度对应预设模型输出的业务处理结果。
在一个可选的实施例中,以多媒体资源推荐业务为例,在业务特征数据为样本对象的对象数据和样本对象执行过预设操作的第一多媒体资源的资源数据的情况下,预设业务标注数据可以为1,1用于表征样本对象会对第一多媒体资源执行预设操作。在业务特征数据为样本对象的对象数据和样本对象未执行过预设操作的第二多媒体资源的资源数据的情况下,预设业务标注数据可以为0,0用于表征样本对象不会对第一多媒体资源执行预设操作。相应的,训练业务特征数据在每个重要性分析维度对应的训练业务处理数据可以为该重要性分析维度对应预设模型输出的样本对象是否会对对应的多媒体资源执行预设操作的概率。
在另一个可选的实施例中,以分类业务为例,业务特征数据可以为待分类图像的特征表征,预设业务标注数据可以为待分类图像对应的类别信息。具体的,类别信息可以结合具体的业务场景设置,例如在识别玻璃是否有裂痕的业务场景中,业务特征数据为玻璃图像的特征表征,类别信息可以为表征玻璃图像中玻璃是否有裂痕的信息,例如类别信息为0,表征玻璃图像中玻璃无裂痕;类别信息为1,表征玻璃图像中玻璃有裂痕。相应的,训练业务特征数据在每个重要性分析维度对应的训练业务处理数据可以为该重要性分析维度对应预设模型输出的玻璃图像是否有裂痕的概率。
在一个具体的实施例中,上述根据训练业务处理数据和预设业务标注数据,确定多个重要性分析维度对应的训练业务损失信息可以包括基于预设损失函数,计算每个训练业务特征数据在每个重要性分析维度对应的训练业务处理数据和对应的预设业务标注数据间的训练业务损失信息。具体的,每一重要性分析维度对应的训练业务损失信息可以表征该重要性分析维度的训练业务处理数据与对应的预设业务标注数据间的差异程度。
在一个具体的实施例中,上述预设损失函数可以结合实际应用设置,具体的,可以包括但不限于均方误差损失函数、交叉熵损失函数、L2损失函数等。
在一个可选的实施例中,上述满足预设训练收敛条件可以为训练迭代操作的次数达到预设训练次数。可选的,满足预设训练收敛条件也可以为训练业务损失信息小于预设阈值。可选的,满足预设训练收敛条件也可以为前后两次得到的训练业务损失信息间的差值小于指定阈值。本说明书实施例中,预设训练次数、预设阈值和指定阈值可以结合实际应用中对模型的训练速度和精准度预先设置。
在一个具体的实施例中,测试业务特征数据在每个重要性分析维度对应的预测业务处理数据可以为该重要性分析维度对应目标模型输出的业务处理结果。具体的,根据预测业务处理数据和预设业务标注数据,确定多个重要性分析维度对应的业务损失信息的具体细化可以参见上述根据训练业务处理数据和预设业务标注数据,确定多个重要性分析维度对应的训练业务损失信息的具体细化,在此不再赘述。
在一个可选的实施例中,上述根据多个所述重要性分析维度对应的业务损失信息,生成多个所述重要性分析维度的指标权重信息可以包括:
基于预设函数,确定多个所述重要性分析维度对应的业务损失信息的目标反比数据;
根据多个所述重要性分析维度对应的目标反比数据,确定所述多个所述重要性分析维度的指标权重信息。
在实际应用中,某一重要性分析维度对应的业务损失信息越小,业务模型的业务处理精准度越高,相应的,该重要性分析维度的指标权重信息越大。可选,可以结合预设函数,建立业务损失信息与指标权重信息间的反比关系,在一个具体的实施例中,如下述公式所示,预设函数可以包括:
其中,g(x)为任一重要性分析维度对应的目标反比数据,x可以为任一重要性分析维度对应的业务损失信息。
此外,需要说明的是,上述仅仅是两种预设函数的示例,在实际应用中,也可以采用其他满足自变量与因变量成反比的函数。
在一个具体的实施例中,假设多个重要性分析维度包括:原生重要性分析维度、置换重要性分析维度和加性解释重要性分析维度;可选的,上述多个重要性分析维度的指标权重信息可以结合下述公式获取:
其中,α表示原生重要性分析维度的指标权重信息;β表示置换重要性分析维度的指标权重信息;γ表示加性解释重要性分析维度的指标权重信息;lossself表示原生重要性分析维度对应的业务损失信息;lossperm表示置换重要性分析维度对应的业务损失信息;lossshap表示加性解释重要性分析维度对应的业务损失信息;g(lossself)可以为原生重要性分析维度对应的目标反比数据;g(lossperm)可以为置换重要性分析维度对应的目标反比数据;g(lossshap)可以为加性解释重要性分析维度对应的目标反比数据。
上述实施例中,结合每个重要性分析维度对应的预测业务处理数据和预设业务标注数据确定业务损失信息,可以通过业务损失信息有效反映每个重要性分析维度的分析指标数据在业务特征数据,对业务模型进行业务处理的重要程度的表征能力,且结合预设函数将业务损失转换成与该业务损失信息成反比的目标反比数据,可以使得结合目标反比数据确定的指标权重信息,能够准确的表征每个重要性分析维度的分析指标数据,在多个重要性分析维度融合的分析指标数据中的重要程度的指标权重信息。
在一个可选的实施例中,如图4所示,上述方法还可以包括以下步骤:
在步骤S209中,从多个重要性分析维度各自对应的目标业务特征数据,分别选取第二数量个业务特征数据;
相应的,上述基于多个重要性分析维度各自对应预设模型,对多个重要性分析维度各自对应的目标业务特征数据进行业务处理,得到多个重要性分析维度各自对应的指标权重信息可以包括:
基于多个重要性分析维度各自对应预设模型,对多个重要性分析维度各自对应的第二数量个业务特征数据进行业务处理,得到多个重要性分析维度各自对应的指标权重信息。
在一个具体的实施例中,每个重要性分析维度对应的目标业务特征数据中业务特征数据的数量大于第二数量;可选的,可以随机从每个重要性分析维度对应的目标业务特征数据中选取第二数量个业务特征数据,输入该重要性分析维度对应预设模型进行业务处理,得到多个重要性分析维度各自对应的指标权重信息。具体的,基于多个重要性分析维度各自对应预设模型,对多个重要性分析维度各自对应的第二数量个业务特征数据进行业务处理,得到多个重要性分析维度各自对应的指标权重信息。
上述实施例中,从每个重要性分析维度对应的目标业务特征数据中选取第二数量个业务特征数据,来参与业务处理,可以降低业务处理复杂度,提升业务处理效率,进而也可以提升设备性能。
在步骤S207中,基于多个重要性分析维度各自对应的指标权重信息,对多个重要性分析维度的分析指标数据进行加权融合,得到第一数量个业务特征数据的目标分析指标数据。
在一个具体的实施例中,上述目标分析指标数据可以用于从多个重要性分析维度,融合表征第一数量个业务特征数据,对业务模型进行业务处理的重要程度。
在一个具体的实施例中,假设多个重要性分析维度包括:原生重要性分析维度、置换重要性分析维度和加性解释重要性分析维度。可选的,上述任一业务特征数据的目标分析指标数据可以结合下述公式得到:
FIcom=αFIself+βFIperm+γFIshap
其中,FIcom表示目标分析指标数据,FIself表示原生重要性分析维度的分析指标数据;FIperm表示置换重要性分析维度的分析指标数据;FIshap表示加性解释重要性分析维度的分析指标数据。
由以上本说明书实施例提供的技术方案可见,本说明书中通过第一数量个业务特征数据在多个重要性分析维度的分析指标数据,分别确定出每个重要性分析维度下对业务模型进行业务处理的重要程度满足预设条件的目标业务特征数据;接着,结合多个重要性分析维度各自对应的预设模型,对结合分析指标数据确定出的目标业务特征数据进行业务处理,可以快速准确的确定出多个重要性分析维度各自对应的指标权重信息,进而可以基于多个重要性分析维度各自对应的指标权重信息,对多个重要性分析维度的分析指标数据进行加权融合,可以得到能更全面精准表征第一数量个业务特征数据,对业务模型进行业务处理的重要程度的目标分析指标数据,帮助用户更好的了解第一数量个业务特征数据,对业务模型进行业务处理的重要程度,有效避免单一重要性分析维度的分析指标数据存在的片面、不能准确表征第一数量个业务特征数据,对业务模型进行业务处理的重要程度的问题,进而可以更好的提升后续业务模型的通用性和鲁棒性,提升业务处理的精准性和有效性,避免无效的业务处理,减少无效业务处理带来的计算资源浪费,提升设备性能。
将在一个可选的实施例中,如图5所示,上述方法还可以包括以下步骤:
在步骤S211中,对多个重要性分析维度的分析指标数据进行归一化处理,得到归一化后的分析指标数据;
相应的,上述基于多个重要性分析维度各自对应的指标权重信息,对多个重要性分析维度的分析指标数据进行加权融合,得到第一数量个业务特征数据的目标分析指标数据包括:
基于多个重要性分析维度各自对应的指标权重信息,对归一化后的分析指标数据进行加权融合,得到目标分析指标数据。
在实际应用中,可能存在多个重要性分析维度的分析指标数据不在同一数量级的情况,可以对多个重要性分析维度的分析指标数据进行归一化处理,进而可以在同一数量级,结合多个重要性分析维度对应的指标权重信息,对相应的分析指标数据进行加权融合,得到第一数量个业务特征数据的目标分析指标数据。
上述实施例中,通过对多个重要性分析维度的分析指标数据进行归一化处理后,结合多个重要性分析维度对应的指标权重信息,对相应的分析指标数据进行加权融合,可以大大提升加权融合得到的目标分析指标数据对第一数量个业务特征数据各自对业务模型进行业务处理的重要程度表征精准度,进而可以更好的提升后续业务模型进行业务处理的精准性和有效性,避免无效的业务处理,减少无效业务处理带来的计算资源浪费,提升设备性能。
在一个可选的实施例中,上述方法还可以包括:
基于目标分析指标数据,对第一数量个业务特征数据进行排序,得到业务特征数据序列;展示业务特征数据序列。
在一个具体的实施例中,可以基于目标分析指标数据对第一数量个业务特征数据进行降序排序,并将排序后的第一数量个业务特征数据作为业务特征数据序列;也可以基于目标分析指标数据对第一数量个业务特征数据进行降序排序,并将排序前第四数量个业务特征数据作为业务特征数据序列。第四数量可以结合实际应用进行设置。进一步的,可以将业务特征数据序列进行展示,以便业务方可以结合需求选择相同的业务特征数据进行业务模型的训练。
上述实施例中,结合目标分析指标数据,来对第一数量个业务特征数据进行排序,可以有效避免单一重要性分析维度的分析指标数据存在的片面、不能准确表征第一数量个业务特征数据,对业务模型进行业务处理的重要程度的问题,更好的帮助用户了解第一数量个业务特征数据,对业务模型进行业务处理的重要程度,进而可以更好的提升后续业务模型的通用性和鲁棒性,提升业务处理的精准性和有效性,避免无效的业务处理,减少无效业务处理带来的计算资源浪费,提升设备性能。
在一个具体的实施例中,假设多个重要性分析维度包括:原生重要性分析维度、置换重要性分析维度和加性解释重要性分析维度,如图6所示,图6是根据一示例性实施例提供的一种确定第一数量个业务特征数据的目标分析指标数据的示意图。具体的,结合图6所示,结合原生重要性分析维度、置换重要性分析维度和加性解释重要性分析维度各自的分析指标数据,可以从第一数量个业务特征数据,分别筛选出每个重要性分析维度对应的目标业务特征数据,进而可以基于每个重要性分析维度对应的目标业务特征数据分别输入相应重要性分析维度对应预设模型中进行业务处理,并结合业务处理的结果确定出每个重要性分析维度对应的指标权重信息;接着,可以基于每个重要性分析维度对应的指标权重信息,对原生重要性分析维度、置换重要性分析维度和加性解释重要性分析维度的分析指标数据进行加权融合,得到上述目标分析指标数据。
图7是根据一示例性实施例示出的一种业务特征数据处理装置框图。参照图7,该装置包括:
分析指标数据获取模块710,被配置为执行获取目标业务的第一数量个业务特征数据在多个重要性分析维度的分析指标数据,分析指标数据用于从多个重要性分析维度,分别表征第一数量个业务特征数据,对目标业务对应的业务模型进行业务处理的重要程度;
业务特征数据筛选模块720,被配置为执行根据多个重要性分析维度的分析指标数据,分别从第一数量个业务特征数据中,筛选出多个重要性分析维度各自对应的目标业务特征数据,目标业务特征数据为对业务模型进行业务处理的重要程度满足预设条件的业务特征数据;
业务处理模块730,被配置为执行基于多个重要性分析维度各自对应预设模型,对多个重要性分析维度各自对应的目标业务特征数据进行业务处理,得到多个重要性分析维度各自对应的指标权重信息;
加权融合模块740,被配置为执行基于多个重要性分析维度各自对应的指标权重信息,对多个重要性分析维度的分析指标数据进行加权融合,得到第一数量个业务特征数据的目标分析指标数据,目标分析指标数据用于从多个重要性分析维度,融合表征第一数量个业务特征数据,对业务模型进行业务处理的重要程度。
在一个可选的实施例中,业务处理模块730包括:
业务特征数据拆分单元,被配置为执行将多个重要性分析维度各自对应的目标业务特征数据,分别拆分成训练业务特征数据和测试业务特征数据;
模型训练单元,被配置为执行基于多个重要性分析维度各自对应的训练业务特征数据对预设模型进行训练,得到目标模型;
业务处理单元,被配置为执行将多个重要性分析维度各自对应的测试业务特征数据,分别输入多个重要性分析维度对应目标模型进行业务处理,得到目标业务特征数据在多个重要性分析维度对应的预测业务处理数据;
业务损失信息确定单元,被配置为执行根据预测业务处理数据和预设业务标注数据,确定多个重要性分析维度对应的业务损失信息;
指标权重信息生成单元,被配置为执行根据多个重要性分析维度对应的业务损失信息,生成多个重要性分析维度的指标权重信息。
在一个可选的实施例中,上述指标权重信息生成单元包括:
反比数据确定单元,被配置为执行基于预设函数,确定多个所述重要性分析维度对应的业务损失信息的目标反比数据;
指标权重信息确定单元,被配置为执行根据多个所述重要性分析维度对应的目标反比数据,确定所述多个所述重要性分析维度的指标权重信息。
在一个可选的实施例中,上述装置还包括:
业务特征数据选取模块,被配置为执行从多个重要性分析维度各自对应的目标业务特征数据,分别选取第二数量个业务特征数据;
业务处理模块730还被配置为执行:基于多个重要性分析维度各自对应预设模型,对多个重要性分析维度各自对应的第二数量个业务特征数据进行业务处理,得到多个重要性分析维度各自对应的指标权重信息。
在一个可选的实施例中,上述装置还包括:
业务特征数据排序模块,被配置为执行基于目标分析指标数据,对第一数量个业务特征数据进行排序,得到业务特征数据序列;
业务特征数据序列展示模块,被配置为执行展示所述业务特征数据序列。
在一个可选的实施例中,上述装置还包括:
归一化处理模块,被配置执行对多个重要性分析维度的分析指标数据进行归一化处理,得到归一化后的分析指标数据;
加权融合模块740还被配置为执行基于多个重要性分析维度各自对应的指标权重信息,对归一化后的分析指标数据进行加权融合,得到目标分析指标数据。
在一个可选的实施例中,上述装置还包括:
模型类型确定模块,被配置为执行确定业务模型的模型类型;
在模型类型为预设模型类型的情况下,分析指标数据获取模块710还被配置为执行:
获取第一数量个业务特征数据在原生重要性分析维度的分析指标数据,在置换重要性分析维度的分析指标数据,以及在加性解释重要性分析维度的分析指标数据;
其中,所述预设模型类型为具有所述原生重要性分析维度的分析指标数据的模型类型。
在一个可选的实施例中,在模型类型不为预设模型类型的情况下,分析指标数据获取模块710还被配置为执行:获取第一数量个业务特征数据在置换重要性分析维度的分析指标数据,以及在加性解释重要性分析维度的分析指标数据。
在一个可选的实施例中,多个重要性分析维度包括:原生重要性分析维度、置换重要性分析维度和加性解释重要性分析维度中的至少两个重要性分析维度。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8是根据一示例性实施例示出的一种用于业务特征数据处理的电子设备的框图,该电子设备可以是终端,其内部结构图可以如图8所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种业务特征数据处理方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
图9是根据一示例性实施例示出的一种用于业务特征数据处理的电子设备的框图,该电子设备可以是服务器,其内部结构图可以如图9所示。该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种业务特征数据处理方法。
本领域技术人员可以理解,图8或图9中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在示例性实施例中,还提供了一种电子设备,包括:处理器;用于存储该处理器可执行指令的存储器;其中,该处理器被配置为执行该指令,以实现如本公开实施例中的业务特征数据处理方法。
在示例性实施例中,还提供了一种计算机可读存储介质,当该存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行本公开实施例中的业务特征数据处理方法。
在示例性实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行本公开实施例中的业务特征数据处理方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种业务特征数据处理方法,其特征在于,包括:
获取目标业务的第一数量个业务特征数据在多个重要性分析维度的分析指标数据,所述分析指标数据用于从多个所述重要性分析维度,分别表征所述第一数量个业务特征数据,对所述目标业务对应的业务模型进行业务处理的重要程度;
根据多个所述重要性分析维度的分析指标数据,分别从所述第一数量个业务特征数据中,筛选出多个所述重要性分析维度各自对应的目标业务特征数据,所述目标业务特征数据为对所述业务模型进行业务处理的重要程度满足预设条件的业务特征数据;
基于多个所述重要性分析维度各自对应预设模型,对多个所述重要性分析维度各自对应的目标业务特征数据进行业务处理,得到多个所述重要性分析维度各自对应的指标权重信息;
基于多个所述重要性分析维度各自对应的指标权重信息,对多个所述重要性分析维度的分析指标数据进行加权融合,得到所述第一数量个业务特征数据的目标分析指标数据。
2.根据权利要求1所述的业务特征数据处理方法,其特征在于,所述基于多个所述重要性分析维度各自对应预设模型,对多个所述重要性分析维度各自对应的目标业务特征数据进行业务处理,得到多个所述重要性分析维度各自对应的指标权重信息包括:
将多个所述重要性分析维度各自对应的目标业务特征数据,分别拆分成训练业务特征数据和测试业务特征数据;
基于多个所述重要性分析维度各自对应的训练业务特征数据对预设模型进行训练,得到目标模型;
将多个所述重要性分析维度各自对应的测试业务特征数据,分别输入多个所述重要性分析维度对应目标模型进行业务处理,得到所述目标业务特征数据在多个所述重要性分析维度对应的预测业务处理数据;
根据所述预测业务处理数据和所述预设业务标注数据,确定所述多个所述重要性分析维度对应的业务损失信息;
根据多个所述重要性分析维度对应的业务损失信息,生成多个所述重要性分析维度的指标权重信息。
3.根据权利要求2所述的业务特征数据处理方法,其特征在于,所述根据多个所述重要性分析维度对应的业务损失信息,生成多个所述重要性分析维度的指标权重信息包括:
基于预设函数,确定多个所述重要性分析维度对应的业务损失信息的目标反比数据;
根据多个所述重要性分析维度对应的目标反比数据,确定所述多个所述重要性分析维度的指标权重信息。
4.根据权利要求1所述的业务特征数据处理方法,其特征在于,所述方法还包括:
从多个所述重要性分析维度各自对应的目标业务特征数据,分别选取第二数量个业务特征数据;
所述基于多个所述重要性分析维度各自对应预设模型,对多个所述重要性分析维度各自对应的目标业务特征数据进行业务处理,得到多个所述重要性分析维度各自对应的指标权重信息包括:
基于多个所述重要性分析维度各自对应预设模型,对多个所述重要性分析维度各自对应的所述第二数量个业务特征数据进行业务处理,得到多个所述重要性分析维度各自对应的指标权重信息。
5.根据权利要求1所述的业务特征数据处理方法,其特征在于,所述方法还包括:
基于所述目标分析指标数据,对所述第一数量个业务特征数据进行排序,得到业务特征数据序列;
展示所述业务特征数据序列。
6.根据权利要求1所述的业务特征数据处理方法,其特征在于,所述方法还包括:
对多个所述重要性分析维度的分析指标数据进行归一化处理,得到归一化后的分析指标数据;
所述基于多个所述重要性分析维度各自对应的指标权重信息,对多个所述重要性分析维度的分析指标数据进行加权融合,得到所述第一数量个业务特征数据的目标分析指标数据包括:
基于多个所述重要性分析维度各自对应的指标权重信息,对所述归一化后的分析指标数据进行加权融合,得到所述目标分析指标数据。
7.一种业务特征数据处理装置,其特征在于,包括:
分析指标数据获取模块,被配置为执行获取目标业务的第一数量个业务特征数据在多个重要性分析维度的分析指标数据,所述分析指标数据用于从多个所述重要性分析维度,分别表征所述第一数量个业务特征数据,对所述目标业务对应的业务模型进行业务处理的重要程度;
业务特征数据筛选模块,被配置为执行根据多个所述重要性分析维度的分析指标数据,分别从所述第一数量个业务特征数据中,筛选出多个所述重要性分析维度各自对应的目标业务特征数据,所述目标业务特征数据为对所述业务模型进行业务处理的重要程度满足预设条件的业务特征数据;
业务处理模块,被配置为执行基于多个所述重要性分析维度各自对应预设模型,对多个所述重要性分析维度各自对应的目标业务特征数据进行业务处理,得到多个所述重要性分析维度各自对应的指标权重信息;
加权融合模块,被配置为执行基于多个所述重要性分析维度各自对应的指标权重信息,对多个所述重要性分析维度的分析指标数据进行加权融合,得到所述第一数量个业务特征数据的目标分析指标数据,所述目标分析指标数据用于从多个所述重要性分析维度,融合表征所述第一数量个业务特征数据,对所述业务模型进行业务处理的重要程度。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的业务特征数据处理方法。
9.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至6中任一项所述的业务特征数据处理方法。
10.一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1至6中任一项所述的业务特征数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111570134.3A CN114461869B (zh) | 2021-12-21 | 2021-12-21 | 业务特征数据处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111570134.3A CN114461869B (zh) | 2021-12-21 | 2021-12-21 | 业务特征数据处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114461869A true CN114461869A (zh) | 2022-05-10 |
CN114461869B CN114461869B (zh) | 2022-11-22 |
Family
ID=81405285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111570134.3A Active CN114461869B (zh) | 2021-12-21 | 2021-12-21 | 业务特征数据处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114461869B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115130621A (zh) * | 2022-08-31 | 2022-09-30 | 支付宝(杭州)信息技术有限公司 | 一种模型训练方法、装置、存储介质及电子设备 |
CN117573728A (zh) * | 2024-01-17 | 2024-02-20 | 杭银消费金融股份有限公司 | 一种数据信息的信息维度升维处理方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111340244A (zh) * | 2020-05-15 | 2020-06-26 | 支付宝(杭州)信息技术有限公司 | 预测方法、训练方法、装置、服务器及介质 |
US20210217117A1 (en) * | 2019-01-25 | 2021-07-15 | Southeast University | Automatic urban land identification system integrating business big data with building form |
CN113392293A (zh) * | 2020-03-13 | 2021-09-14 | 北京达佳互联信息技术有限公司 | 一种数据处理方法、装置、设备及存储介质 |
US20210287111A1 (en) * | 2020-03-12 | 2021-09-16 | Capital One Services, Llc | Aggregated feature importance for finding influential business metrics |
CN113408582A (zh) * | 2021-05-17 | 2021-09-17 | 支付宝(杭州)信息技术有限公司 | 特征评估模型的训练方法及装置 |
CN113642669A (zh) * | 2021-08-30 | 2021-11-12 | 平安医疗健康管理股份有限公司 | 基于特征分析的防欺诈检测方法、装置、设备及存储介质 |
-
2021
- 2021-12-21 CN CN202111570134.3A patent/CN114461869B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210217117A1 (en) * | 2019-01-25 | 2021-07-15 | Southeast University | Automatic urban land identification system integrating business big data with building form |
US20210287111A1 (en) * | 2020-03-12 | 2021-09-16 | Capital One Services, Llc | Aggregated feature importance for finding influential business metrics |
CN113392293A (zh) * | 2020-03-13 | 2021-09-14 | 北京达佳互联信息技术有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN111340244A (zh) * | 2020-05-15 | 2020-06-26 | 支付宝(杭州)信息技术有限公司 | 预测方法、训练方法、装置、服务器及介质 |
CN113408582A (zh) * | 2021-05-17 | 2021-09-17 | 支付宝(杭州)信息技术有限公司 | 特征评估模型的训练方法及装置 |
CN113642669A (zh) * | 2021-08-30 | 2021-11-12 | 平安医疗健康管理股份有限公司 | 基于特征分析的防欺诈检测方法、装置、设备及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115130621A (zh) * | 2022-08-31 | 2022-09-30 | 支付宝(杭州)信息技术有限公司 | 一种模型训练方法、装置、存储介质及电子设备 |
CN115130621B (zh) * | 2022-08-31 | 2022-12-27 | 支付宝(杭州)信息技术有限公司 | 一种模型训练方法、装置、存储介质及电子设备 |
CN117573728A (zh) * | 2024-01-17 | 2024-02-20 | 杭银消费金融股份有限公司 | 一种数据信息的信息维度升维处理方法及系统 |
CN117573728B (zh) * | 2024-01-17 | 2024-04-23 | 杭银消费金融股份有限公司 | 一种数据信息的信息维度升维处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114461869B (zh) | 2022-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111680219B (zh) | 内容推荐方法、装置、设备及可读存储介质 | |
US8942470B2 (en) | Sentiment classification using out of domain data | |
US20180032890A1 (en) | Method and system for improving content searching in a question and answer customer support system by using a crowd-machine learning hybrid predictive model | |
CN114461869B (zh) | 业务特征数据处理方法、装置、电子设备及存储介质 | |
WO2022148186A1 (zh) | 行为序列数据处理方法及装置 | |
CN113641835B (zh) | 多媒体资源推荐方法、装置、电子设备及介质 | |
CN113918738B (zh) | 多媒体资源推荐方法、装置、电子设备及存储介质 | |
CN114399396A (zh) | 保险产品推荐方法、装置、计算机设备及存储介质 | |
CN111191677B (zh) | 用户特征数据生成方法、装置及电子设备 | |
US20180089154A1 (en) | Computer implemented system and method for transforming web content for display on multiple form factors | |
CN115329131A (zh) | 素材标签推荐方法、装置、电子设备及存储介质 | |
CN114860892A (zh) | 层次类目预测方法、装置、设备和介质 | |
CN111177500A (zh) | 数据对象分类方法、装置、计算机设备和存储介质 | |
CN113343024A (zh) | 对象推荐方法、装置、电子设备及存储介质 | |
CN114549849A (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN114491093B (zh) | 多媒体资源推荐、对象表征网络的生成方法及装置 | |
CN109951859B (zh) | 无线网络连接推荐方法、装置、电子设备及可读介质 | |
CN116661936A (zh) | 页面数据的处理方法、装置、计算机设备及存储介质 | |
CN116955797A (zh) | 资源推荐方法、装置、电子设备及存储介质 | |
CN114139046B (zh) | 对象推荐方法、装置、电子设备及存储介质 | |
CN115222112A (zh) | 一种行为预测方法、行为预测模型的生成方法及电子设备 | |
CN113610215B (zh) | 任务处理网络生成、任务处理方法、装置及电子设备 | |
CN115186173A (zh) | 多媒体资源推送、智能体网络生成方法及装置 | |
CN114021739B (zh) | 业务处理、业务处理模型训练方法、装置及电子设备 | |
CN114048392B (zh) | 多媒体资源推送方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |