CN114021739B - 业务处理、业务处理模型训练方法、装置及电子设备 - Google Patents
业务处理、业务处理模型训练方法、装置及电子设备 Download PDFInfo
- Publication number
- CN114021739B CN114021739B CN202210010629.9A CN202210010629A CN114021739B CN 114021739 B CN114021739 B CN 114021739B CN 202210010629 A CN202210010629 A CN 202210010629A CN 114021739 B CN114021739 B CN 114021739B
- Authority
- CN
- China
- Prior art keywords
- service
- information
- training
- preset number
- feature information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开关于一种业务处理、业务处理模型训练方法、装置及电子设备,该业务处理方法包括获取目标业务对应的目标业务特征信息;将目标业务特征信息输入目标业务处理模型进行业务处理,得到目标业务指标数据,目标业务处理模型为基于目标业务对应的业务训练特征信息分类后的预设数量个特征信息组,对初始业务处理模型进行业务处理训练得到的,初始业务处理模型的模型参数为基于预设数量个分布差异信息配置的,预设数量个分布差异信息表征预设数量个特征信息组与业务训练特征信息中正负样本特征信息的分布差异;基于目标业务指标数据执行目标业务。利用本公开实施例可以提升业务处理效果,降低计算资源的消耗,提升系统性能。
Description
技术领域
本公开涉及人工智能技术领域,尤其涉及一种业务处理、业务处理模型训练方法、装置及电子设备。
背景技术
随着人工智能技术的迅猛发展,人工智能相关的模型在计算机视觉、自然语言处理、推荐搜索等领域占据着越来越重要的地位。
相关技术中,在结合模型进行业务处理的场景中,需要先训练相应的模型,该模型的模型参数在初始状态下往往是随机设置的预设数值;然后,结合相应的训练数据对模型进行业务处理训练,接着,结合训练好的模型进行业务处理。但上述相关技术中,由于进行业务处理的模型在训练过程中是随机设置的模型参数,模型训练迭代的速度较慢,需要耗费的计算资源较多,导致无法平衡训练迭代速度和模型的业务处理效果,进而也存在无效业务处理的情况,造成系统资源浪费和系统性能下降等问题。
发明内容
本公开提供一种业务处理、业务处理模型训练方法、装置及电子设备,以至少解决相关技术中模型训练迭代的速度较慢,需要耗费的计算资源较多,导致无法平衡训练迭代速度和模型的业务处理效果,进而也存在无效业务处理的情况,造成系统资源浪费和系统性能下降等问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种业务处理方法,包括:
获取目标业务对应的目标业务特征信息;
将目标业务特征信息输入目标业务处理模型进行业务处理,得到目标业务指标数据,所述目标业务处理模型为基于所述目标业务对应的业务训练特征信息分类后的预设数量个特征信息组,对初始业务处理模型进行业务处理训练得到的,所述初始业务处理模型的模型参数为基于所述预设数量个分布差异信息配置的,所述预设数量个分布差异信息表征所述预设数量个特征信息组与所述业务训练特征信息中正负样本特征信息的分布差异;
基于所述目标业务指标数据执行所述目标业务。
在一个可选的实施例中,所述方法还包括:
获取所述目标业务对应的业务训练特征信息,所述业务训练特征信息包括正负样本业务数据特征信息;
对所述业务训练特征信息进行分类处理,得到预设数量个特征信息组;
对所述预设数量个特征信息组和所述业务训练特征信息进行分布差异分析,得到所述预设数量个分布差异信息,所述预设数量个分布差异信息表征所述预设数量个特征信息组与所述业务训练特征信息中正负样本特征信息的分布差异;
基于所述预设数量个分布差异信息,对所述目标业务对应的待训练业务模型进行模型参数配置,得到初始业务处理模型;
基于所述预设数量个特征信息组对所述初始业务处理模型进行业务处理训练,得到所述目标业务处理模型。
根据本公开实施例的第二方面,提供一种业务处理模型训练方法,包括:
获取目标业务对应的业务训练特征信息,所述业务训练特征信息包括正负样本业务数据特征信息;
对所述业务训练特征信息进行分类处理,得到预设数量个特征信息组;
对所述预设数量个特征信息组和所述业务训练特征信息进行分布差异分析,得到所述预设数量个分布差异信息,所述预设数量个分布差异信息表征所述预设数量个特征信息组与所述业务训练特征信息中正负样本特征信息的分布差异;
基于所述预设数量个分布差异信息,对所述目标业务对应的待训练业务模型进行模型参数配置,得到初始业务处理模型;
基于所述预设数量个特征信息组对所述初始业务处理模型进行业务处理训练,得到所述目标业务对应的目标业务处理模型。
在一个可选的实施例中,所述对所述预设数量个特征信息组和所述业务训练特征信息进行分布差异分析,得到所述预设数量个分布差异信息包括:
确定所述预设数量个特征信息组中正样本特征信息和负样本特征信息对应的第一分布信息;
确定所述业务训练特征信息中正样本特征信息和负样本特征信息对应的第二分布信息;
基于所述第一分布信息和所述第二分布信息,确定所述预设数量个分布差异信息。
在一个可选的实施例中,所述确定所述预设数量个特征信息组中正样本特征信息和负样本特征信息对应的第一分布信息包括:
获取所述预设数量个特征信息组中正样本特征信息的第一数量和所述预设数量个特征信息组中负样本特征信息的第二数量;
根据所述第一数量和所述第二数量,确定所述预设数量个特征信息组对应的第一分布信息。
在一个可选的实施例中,所述确定所述业务训练特征信息中正样本特征信息和负样本特征信息对应的第二分布信息包括:
获取所述业务训练特征信息中正样本特征信息的第三数量和所述业务训练特征信息中负样本特征信息的第四数量;
根据所述第三数量和所述第四数量,确定所述业务训练特征信息对应的第二分布信息。
在一个可选的实施例中,所述获取目标业务对应的业务训练特征信息包括:
获取所述目标业务对应的正样本业务数据和所述目标业务对应的负样本业务数据;
对所述正样本业务数据和所述负样本业务数据进行编码处理,得到所述业务训练特征信息。
在一个可选的实施例中,所述对所述业务训练特征信息进行分类处理,得到预设数量个特征信息组包括:
确定所述业务训练特征信息对应多个特征位中的目标特征位;
基于所述目标特征位对应的特征信息,对所述业务训练特征信息进行分组,得到所述预设数量个特征信息组。
在一个可选的实施例中,所述基于所述预设数量个分布差异信息,对所述目标业务对应的待训练业务模型进行模型参数配置,得到初始业务处理模型包括:
获取所述待训练业务模型;
将所述待训练业务模型的模型参数配置为所述预设数量个分布差异信息,得到所述初始业务处理模型。
在一个可选的实施例中,所述基于所述预设数量个特征信息组对所述初始业务处理模型进行业务处理训练,得到所述目标业务对应的目标业务处理模型包括:
将所述预设数量个特征信息组输入所述初始业务处理模型进行业务处理,得到预测业务指标数据;
根据所述预测业务指标数据和所述预设数量个特征信息组对应的预设业务指标数据,确定业务处理损失;
基于所述业务处理损失,对所述初始业务处理模型进行训练,得到所述目标业务处理模型。
根据本公开实施例的第三方面,提供一种业务处理装置,包括:
目标业务特征信息获取模块,被配置为执行获取目标业务对应的目标业务特征信息;
业务处理模块,被配置为执行将目标业务特征信息输入目标业务处理模型进行业务处理,得到目标业务指标数据,所述目标业务处理模型为基于所述目标业务对应的业务训练特征信息分类后的预设数量个特征信息组,对初始业务处理模型进行业务处理训练得到的,所述初始业务处理模型的模型参数为基于所述预设数量个分布差异信息配置的,所述预设数量个分布差异信息表征所述预设数量个特征信息组与所述业务训练特征信息中正负样本特征信息的分布差异;
目标业务执行模块,被配置为执行基于所述目标业务指标数据执行所述目标业务。
在一个可选的实施例中,所述装置还包括:
第一训练特征获取模块,被配置为执行获取所述目标业务对应的业务训练特征信息,所述业务训练特征信息包括正负样本业务数据特征信息;
第一分类处理模块,被配置为执行对所述业务训练特征信息进行分类处理,得到预设数量个特征信息组;
第一分布差异分析模块,被配置为执行对所述预设数量个特征信息组和所述业务训练特征信息进行分布差异分析,得到所述预设数量个分布差异信息,所述预设数量个分布差异信息表征所述预设数量个特征信息组与所述业务训练特征信息中正负样本特征信息的分布差异;
第一模型参数配置模块,被配置为执行基于所述预设数量个分布差异信息,对所述目标业务对应的待训练业务模型进行模型参数配置,得到初始业务处理模型;
第一业务处理训练模块,被配置为执行基于所述预设数量个特征信息组对所述初始业务处理模型进行业务处理训练,得到所述目标业务处理模型。
根据本公开实施例的第四方面,提供一种业务处理模型训练装置,包括:
第二训练特征获取模块,被配置为执行获取目标业务对应的业务训练特征信息,所述业务训练特征信息包括正负样本业务数据特征信息;
第二分类处理模块,被配置为执行对所述业务训练特征信息进行分类处理,得到预设数量个特征信息组;
第二分布差异分析模块,被配置为执行对所述预设数量个特征信息组和所述业务训练特征信息进行分布差异分析,得到所述预设数量个分布差异信息,所述预设数量个分布差异信息表征所述预设数量个特征信息组与所述业务训练特征信息中正负样本特征信息的分布差异;
第二模型参数配置模块,被配置为执行基于所述预设数量个分布差异信息,对所述目标业务对应的待训练业务模型进行模型参数配置,得到初始业务处理模型;
第二业务处理训练模块,被配置为执行基于所述预设数量个特征信息组对所述初始业务处理模型进行业务处理训练,得到所述目标业务对应的目标业务处理模型。
在一个可选的实施例中,所述第二分布差异分析模块包括:
第一分布信息确定单元,被配置为执行确定所述预设数量个特征信息组中正样本特征信息和负样本特征信息对应的第一分布信息;
第二分布信息确定单元,被配置为执行确定所述业务训练特征信息中正样本特征信息和负样本特征信息对应的第二分布信息;
分布差异信息确定单元,被配置为执行基于所述第一分布信息和所述第二分布信息,确定所述预设数量个分布差异信息。
在一个可选的实施例中,所述第一分布信息确定单元包括:
第一特征数量确定单元,被配置为执行获取所述预设数量个特征信息组中正样本特征信息的第一数量和所述预设数量个特征信息组中负样本特征信息的第二数量;
第一分布信息确定子单元,被配置为执行根据所述第一数量和所述第二数量,确定所述预设数量个特征信息组对应的第一分布信息。
在一个可选的实施例中,所述第一分布信息确定单元包括:
第二特征数量确定单元,被配置为执行获取所述业务训练特征信息中正样本特征信息的第三数量和所述业务训练特征信息中负样本特征信息的第四数量;
第二分布信息确定子单元,被配置为执行根据所述第三数量和所述第四数量,确定所述业务训练特征信息对应的第二分布信息。
在一个可选的实施例中,所述第二训练特征获取模块包括:
样本业务数据获取单元,被配置为执行获取所述目标业务对应的正样本业务数据和所述目标业务对应的负样本业务数据;
编码处理单元,被配置为执行对所述正样本业务数据和所述负样本业务数据进行编码处理,得到所述业务训练特征信息。
在一个可选的实施例中,所述第二分类处理模块包括:
目标特征位确定单元,被配置为执行确定所述业务训练特征信息对应多个特征位中的目标特征位;
分组单元,被配置为执行基于所述目标特征位对应的特征信息,对所述业务训练特征信息进行分组,得到所述预设数量个特征信息组。
在一个可选的实施例中,所述第二模型参数配置模块包括:
待训练业务模型获取单元,被配置为执行获取所述待训练业务模型;
模型参数配置单元,被配置为执行将所述待训练业务模型的模型参数配置为所述预设数量个分布差异信息,得到所述初始业务处理模型。
在一个可选的实施例中,所述第二业务处理训练模块包括:
业务处理单元,被配置为执行将所述预设数量个特征信息组输入所述初始业务处理模型进行业务处理,得到预测业务指标数据;
业务处理损失确定单元,被配置为执行根据所述预测业务指标数据和所述预设数量个特征信息组对应的预设业务指标数据,确定业务处理损失;
模型训练单元,被配置为执行基于所述业务处理损失,对所述初始业务处理模型进行训练,得到所述目标业务处理模型。
根据本公开实施例的第五方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如上述第一方面或第二方面中任一项所述的方法。
根据本公开实施例的第六方面,提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行本公开实施例的第一方面或第二方面中任一项所述方法。
根据本公开实施例的第七方面,提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行本公开实施例的第一方面或第二方面中任一项所述方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
在业务处理过程中,将目标业务对应的目标业务特征信息输入目标业务处理模型进行业务处理,该目标业务处理模型为基于目标业务对应的业务训练特征信息分类后的预设数量个特征信息组,对初始业务处理模型进行业务处理训练得到的,且初始业务处理模型的模型参数为基于预设数量个特征信息组与业务训练特征信息中正负样本特征信息的分布差异配置的,可以在提升模型训练迭代的速度的基础上,提升业务处理效果,有效平衡训练迭代速度和模型的业务处理效果,减少无效的业务处理情况,降低系统资源消耗,提升系统性能。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种应用环境的示意图;
图2是根据一示例性实施例示出的一种业务处理方法的流程图;
图3是根据一示例性实施例示出的一种业务处理模型训练方法的流程图;
图4是根据一示例性实施例示出的一种对预设数量个特征信息组和业务训练特征信息进行分布差异分析,得到预设数量个分布差异信息的流程图;
图5是根据一示例性实施例示出的一种基于预设数量个特征信息组对初始业务处理模型进行业务处理训练,得到目标业务对应的目标业务处理模型的流程图;
图6是根据一示例性实施例示出的一种业务处理装置框图;
图7是根据一示例性实施例示出的一种业务处理模型训练装置框图;
图8是根据一示例性实施例示出的一种用于业务处理模型训练的电子设备的框图;
图9是根据一示例性实施例示出的一种用于业务处理模型训练的电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
请参阅图1,图1是根据一示例性实施例示出的一种应用环境的示意图,如图1所示,该应用环境可以包括服务器100和终端200。
在一个可选的实施例中,服务器100可以为用于训练目标业务处理模型。具体的,服务器100可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是边缘计算节点,还可以是提供云服务、云数据库、云计算、云函数、云存储、模型服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发模型)、以及大数据和人工智能平台等基础云计算服务的云服务器。
在一个可选的实施例中,终端200可以基于服务器100训练好的目标业务处理模型进行业务处理。具体的,终端200可以包括但不限于智能手机、台式计算机、平板电脑、笔记本电脑、智能音箱、数字助理、增强现实(augmented reality,AR)/虚拟现实(virtualreality,VR)设备、智能可穿戴设备等类型的电子设备,也可以为运行于上述电子设备的软体,例如应用程序等。可选的,电子设备上运行的操作系统可以包括但不限于安卓系统、IOS系统、linux、windows等。
此外,需要说明的是,图1所示的仅仅是本公开提供的一种应用环境,在实际应用中,还可以包括其他应用环境,例如目标业务处理模型的训练也可以在终端200上实现。
本说明书实施例中,上述服务器100以及终端200可以通过有线或无线通信方式进行直接或间接地连接,本公开在此不做限制。
图2是根据一示例性实施例示出的一种业务处理方法的流程图,如图2所示,该业务处理模型训练方法用于终端、服务器电子设备中,包括以下步骤。
在步骤S201中,获取目标业务对应的目标业务特征信息;
在步骤S203中,将目标业务特征信息输入目标业务处理模型进行业务处理,得到目标业务指标数据;
在步骤S205中,基于目标业务指标数据执行目标业务。
在一个具体的实施例中,目标业务处理模型可以为基于目标业务对应的业务训练特征信息分类后的预设数量个特征信息组,对初始业务处理模型进行业务处理训练得到的,初始业务处理模型的模型参数为基于预设数量个分布差异信息配置的,预设数量个分布差异信息表征预设数量个特征信息组与业务训练特征信息中正负样本特征信息的分布差异。
本说明书实施例中,目标业务可以结合实际应用场景的不同而不同,例如多媒体资源推荐业务、用户账号推荐业务、分类业务等。具体的,目标业务对应的目标业务特征信息可以为目标业务对应的目标业务数据的特征信息。目标业务数据可以为目标业务对应业务场景中客观存在的业务属性数据。
在一个具体的实施例中,以目标业务为多媒体资源推荐业务,目标业务处理模型为资源推荐分析模型为例,目标业务数据可以为需要推荐多媒体资源的用户账号的用户属性信息和待推荐多媒体资源的资源信息;相应的,目标业务指标数据可以为任一待推荐多媒体资源被推荐给用户账号的概率(推荐指标数据)。具体的,用户属性信息可以包括但不限于用户性别、年龄等表征用户属性的信息,多媒体资源的资源信息可以为用于描述多媒体资源的信息,以多媒体资源为视频为例,资源属性信息可以包括发布者信息、播放时长等文本属性信息,还可以包括封面、视频帧图像等图像属性信息。相应的,在多媒体资源推荐业务处理过程中,可以获取待推荐用户账号的用户属性特征信息和待推荐多媒体资源的资源特征信息,将用户属性特征信息和资源特征信息输入目标业务处理模型进行推荐处理,得到目标推荐指标数据;基于目标推荐指指标数据,将待推荐多媒体资源中目标多媒体资源推荐给待推荐用户账号。
具体的,上述基于目标推荐指指标数据,将待推荐多媒体资源中目标多媒体资源推荐给待推荐用户账号可以包括:基于目标推荐指标数据从待推荐多媒体资源中筛选出,推荐给用户账号的目标多媒体资源,并将目标多媒体资源推送给用户账号对应的终端。
在一个具体的实施例中,可以将待推荐多媒体资源中目标推荐指标数据大于等于第一预设阈值的多媒体资源,作为目标多媒体资源;也可以基于目标推荐指标数据对待推荐多媒体资源中多个多媒体资源进行降序排序,可选的,可以将排序前第五数量个多媒体资源作为目标多媒体资源。具体的,第一预设阈值和第五数量可以结合实际应用进行设置。
在一个具体的实施例中,以目标业务为用户账号推荐业务,即向对象用户账号推荐推送用户账号的业务,具体的,对象用户账号可以为待推荐对象对应的用户账号,待推荐对象可以包括商品、应用程序、小说等需要推广的对象;推送用户账号可以为能够在其推送的多媒体资源中融入待推荐对象的用户账号。相应的,目标业务处理模型为推送分析模型为例,目标业务数据可以为对象用户账号的用户属性信息和可以在推送的多媒体资源中融入待推荐对象的推送用户账号的用户属性信息;相应的,目标业务指标数据可以为任一推送用户账号将融入有对象用户账号对应的待推荐对象的多媒体资源推送后,推送效果满足预设条件的概率。相应的,在用户账号推荐业务处理过程中,可以获取对象用户账号的第一用户属性特征信息和多个推送用户账号的第二用户属性特征信息;将第一用户属性特征信息和第二用户属性特征信息输入目标业务处理模型进行推送处理,得到目标推送指标数据;基于目标推送指标数据,将多个推送用户账号中目标推送用户账号,推送给对象用户账号。
具体的,上述基于目标推送指标数据,将多个推送用户账号中目标推送用户账号,推送给对象用户账号可以包括基于目标业务指标数据从推送用户账号中筛选出,目标推送用户账号,并将目标推送用户账号推荐给对象用户账号对应的终端。
在一个具体的实施例中,可以将多个推送用户账号中目标推送指标数据大于等于第二预设阈值的推送用户账号,作为目标推送用户账号;也可以基于目标推送指标数据对多个推送用户账号进行降序排序,可选的,可以将排序前第六数量个推送用户账号作为目标推送用户账号。具体的,第二预设阈值和第六数量可以结合实际应用进行设置。
由以上本说明书实施例提供的技术方案可见,本说明书中,在业务处理过程中,将目标业务对应的目标业务特征信息输入目标业务处理模型进行业务处理,该目标业务处理模型为基于目标业务对应的业务训练特征信息分类后的预设数量个特征信息组,对初始业务处理模型进行业务处理训练得到的,且初始业务处理模型的模型参数为基于预设数量个特征信息组与业务训练特征信息中正负样本特征信息的分布差异配置的,可以在提升模型训练迭代的速度的基础上,提升业务处理效果,有效平衡训练迭代速度和模型的业务处理效果,减少无效的业务处理情况,降低系统资源消耗,提升系统性能。
在一个可选的实施例中,上述方法还可以包括:
获取目标业务对应的业务训练特征信息,业务训练特征信息包括正负样本业务数据特征信息;
对业务训练特征信息进行分类处理,得到预设数量个特征信息组;
对预设数量个特征信息组和业务训练特征信息进行分布差异分析,得到预设数量个分布差异信息,预设数量个分布差异信息表征预设数量个特征信息组与业务训练特征信息中正负样本特征信息的分布差异;
基于预设数量个分布差异信息,对目标业务对应的待训练业务模型进行模型参数配置,得到初始业务处理模型;
基于预设数量个特征信息组对初始业务处理模型进行业务处理训练,得到目标业务处理模型。
本说明书实施例中,上述训练目标业务处理模型的具体细化,可以参见下述业务处理模型训练方法的实施例。
上述实施例中,在训练业务处理模型过程中,将业务训练特征信息进行分类处理,得到预设数量个特征信息组;接着,通过对预设数量个特征信息组和业务训练特征信息进行分布差异分析,确定出表征预设数量个特征信息组与业务训练特征信息中正负样本特征信息分布差异的预设数量个分布差异信息,并结合预设数量个特征信息组对应的分布差异信息,来配置待训练业务模型的模型参数,可以结合特征信息组对应的分布差异信息,提前有针对的进行特征信息组特征权重大小的配置,进而可以在提升业务处理效果的基础上,提升配置好的初始业务处理模型的业务处理训练速度,快速达到训练收敛条件,有效降低计算资源的消耗,提升系统性能。
图3是根据一示例性实施例示出的一种业务处理模型训练方法的流程图,如图3所示,该业务处理模型训练方法用于终端、服务器电子设备中,包括以下步骤。
在步骤S301中,获取目标业务对应的业务训练特征信息。
在一个具体的实施例中,上述业务训练特征信息可以包括正负样本特征信息(正样本特征信息和负样本特征信息)。具体的,正样本特征信息为目标业务对应的正样本业务数据的特征信息,负样本特征信息为目标业务对应的负样本业务数据的特征信息。正样本业务数据和负样本业务数据为目标业务对应业务场景中客观存在的业务属性数据。
在一个具体的实施例中,以多媒体资源推荐业务为例,正样本业务数据可以为样本用户账号的用户属性信息和样本用户账号执行过预设操作的多媒体资源的资源信息;负样本业务数据可以为样本用户账号的用户属性信息和样本用户账号未执行过预设操作的多媒体资源的资源信息。上述预设操作可以包括浏览、点击、转化(例如基于多媒体资源购买了相关产品,或基于多媒体资源下载了相关应用等)等。
在另一个具体的实施例中,以用户账号推荐业务为例,正样本业务数据可以为对象用户账号的用户属性信息和推送效果满足预设条件的推送用户账号的用户属性信息;负样本业务数据可以为待推荐对象对应的对象用户账号的用户属性信息和推送效果未满足预设条件的推送用户账号的用户属性信息。具体的,预设条件可以结合实际应用中对推送效果的要求进行设置。
在一个可选的实施例中,上述获取目标业务对应的业务训练特征信息包括:
获取目标业务对应的正样本业务数据和目标业务对应的负样本业务数据;
对正样本业务数据和负样本业务数据进行编码处理,得到业务训练特征信息。
在一个具体的实施例中,可以对正样本业务数据和负样本业务数据进行独热编码处理,得到业务训练特征信息。具体的,通过独热编码的方式,得到业务训练特征信息,可以将不同样本业务数据的特征打散,进而提升后续模型的拟合能力,且独热编码得到的业务训练特征信息可以通过0或1来表征相应的特征信息,针对需要将特征信息归一化到0-1之间的逻辑回归模型等,可以有效降低运算量,提升模型训练的运算效率。
此外,需要说明的是,在实际应用中也可以采用其他方式,将正样本业务数据和负样本业务数据转换成相应的特征信息,本说明书实施例并不以上述为限。
上述实施例中,通过对正负样本业务数据进行编码处理,得到业务训练特征信息,可以提升后续进行模型训练的运算效率。
在步骤S303中,对业务训练特征信息进行分类处理,得到预设数量个特征信息组。
在一个可选的实施例中,上述对业务训练特征信息进行分类处理,得到预设数量个特征信息组可以包括:
确定业务训练特征信息对应多个特征位中的目标特征位;
基于目标特征位对应的特征信息,对业务训练特征信息进行分组,得到预设数量个特征信息组。
在一个具体的实施例中,目标特征位可以为预设的用于对业务训练特征信息进行分组的特征位。具体的,业务训练特征信息中包括多个样本业务数据(包括正样本业务数据和负样本业务数据)的特征信息;在实际应用中,不同样本业务数据往往存在某些业务属性数据是一致的,例如,上述用户账号推荐业务场景中,某些对象用户账号的用户属性信息中性别(业务属性数据)是一致的;可选的,业务训练特征信息对应多个特征位可以对应样本业务数据的多种业务属性数据;相应的,可以结合目标特征位对应的特征信息,将在目标特征位对应的特征信息一致的样本业务数据的特征划分到同一特征信息组。
上述实施例中,结合目标特征位对应的特征信息,对业务训练特征信息进行分组,得到预设数量个特征信息组,便于后续将模型的输入特征信息与模型参数相对应,进而便于提前有针对的进行输入的特征信息的特征权重大小的配置,进而提升后续训练速度,降低计算资源的消耗,提升系统性能。
在步骤S305中,对预设数量个特征信息组和业务训练特征信息进行分布差异分析,得到预设数量个分布差异信息。
在一个具体的实施例中,上述预设数量个分布差异信息表征预设数量个特征信息组与业务训练特征信息中正负样本特征信息的分布差异;
在一个可选的实施例中,如图4所示,上述对预设数量个特征信息组和业务训练特征信息进行分布差异分析,得到预设数量个分布差异信息包括:
在步骤S401中,确定预设数量个特征信息组中正样本特征信息和负样本特征信息对应的第一分布信息;
本说明书实施例中,任一特征信息组对应的第一分布信息可以表征该特征信息组中正样本特征信息和负样本特征信息的分布情况。
在一个可选的实施例中,确定预设数量个特征信息组中正样本特征信息和负样本特征信息对应的第一分布信息包括:
获取预设数量个特征信息组中正样本特征信息的第一数量和预设数量个特征信息组中负样本特征信息的第二数量;
根据第一数量和第二数量,确定预设数量个特征信息组对应的第一分布信息。
在一个具体的实施例中,第一数量可以为每个特征信息组中正样本特征信息的数量(一个正样本业务数据对应一个正样本特征信息)。第二数量可以为每个特征信息组中负样本特征信息的数量(一个负样本业务数据对应一个负样本特征信息)。
在一个具体的实施例中,可以将第一数量和第二数量的比值作为上述第一分布信息。
上述实施例中,结合特征信息组中正样本特征信息的数量和负样本特征信息的数量,可以快速准确的确定出特征信息组中正负样本特征信息的分布情况,进而可以提升后续确定出的预设数量个特征信息组与业务训练特征信息中正负样本特征信息的分布差异的准确性。
在步骤S403中,确定业务训练特征信息中正样本特征信息和负样本特征信息对应的第二分布信息。
本说明书实施例中,业务训练特征信息对应的第二分布信息可以表征业务训练特征信息中正样本特征信息和负样本特征信息的分布情况。
在一个可选的实施例中,上述确定业务训练特征信息中正样本特征信息和负样本特征信息对应的第二分布信息可以包括:
获取业务训练特征信息中正样本特征信息的第三数量和业务训练特征信息中负样本特征信息的第四数量;
根据第三数量和第四数量,确定业务训练特征信息对应的第二分布信息。
在一个具体的实施例中,第三数量可以为业务训练特征信息中正样本特征信息的数量。第四数量可以为业务训练特征信息中负样本特征信息的数量。
在一个具体的实施例中,可以将第三数量和第四数量的比值作为上述第二分布信息。
上述实施例中,结合业务训练特征信息中正样本特征信息的数量和负样本特征信息的数量,可以快速准确的确定出业务训练特征信息中正负样本特征信息的分布情况,进而可以提升后续确定出的预设数量个特征信息组与业务训练特征信息中正负样本特征信息的分布差异的准确性。
在步骤S405中,基于第一分布信息和第二分布信息,确定预设数量个分布差异信息。
在一个具体的实施例中,可以确定预设数量个特征信息组各自对应的第一分布信息和第二分布信息的比值,并分别取预设数量个比值的对数,可以得到上述预设数量个分布差异信息。
上述实施例中,结合能够反映特征信息组中正负样本特征信息分布情况的第一分布信息和能够反映业务训练特征信息中正负样本特征信息分布情况的第二分布信息,可以快速准确的确定出预设数量个特征信息组与业务训练特征信息中正负样本特征信息的分布差异。
在步骤S307中,基于预设数量个分布差异信息,对目标业务对应的待训练业务模型进行模型参数配置,得到初始业务处理模型;
在一个可选的实施例中,上述基于预设数量个分布差异信息,对目标业务对应的待训练业务模型进行模型参数配置,得到初始业务处理模型包括:
获取待训练业务模型;
将待训练业务模型的模型参数配置为预设数量个分布差异信息,得到初始业务处理模型。
在一个具体的实施例中,待训练业务模型可以为机器学习模型,例如逻辑回归模型等,具体的模型结构可以结合实际应用进行设置。可选的,待训练业务模型可以预先存储在相应的数据库,相应的,可以在业务处理模型训练过程中,从数据库获取该待训练业务模型。
在实际应用中,业务训练特征信息会以分组后的预设数量个特征信息组的形式输入初始业务处理模型,初始业务处理模型中的模型参数可以为分别与预设数量个特征信息组对应的特征权重,任一特征信息组对应的特征权重可以表征该特征信息组中特征信息在业务处理过程中的重要程度;相应的,可以将预设数量个特征信息组对应的分布差异信息,分别配置为预设数量个特征信息组各自对应的模型参数。
上述实施例中,结合预设数量个特征信息组对应的分布差异信息,来配置待训练业务模型的模型参数,可以结合特征信息组对应的分布差异信息,提前有针对的进行特征信息组特征权重大小的配置,进而提升后续训练速度,快速达到收敛,在提升业务处理效果的基础上,可以降低计算资源的消耗,提升系统性能。
在步骤S309中,基于预设数量个特征信息组对初始业务处理模型进行业务处理训练,得到目标业务对应的目标业务处理模型。
在一个具体的实施例中,目标业务处理模型可以结合目标业务的不同而不同。可选的,以目标业务为多媒体资源推荐业务为例,目标业务处理模型可以为资源推荐分析模型;以目标业务为用户账号推荐业务为例,目标业务处理模型可以为推送分析模型。
在一个可选的实施例中,如图5所示,上述基于预设数量个特征信息组对初始业务处理模型进行业务处理训练,得到目标业务对应的目标业务处理模型可以包括以下步骤:
在步骤S501中,将预设数量个特征信息组输入初始业务处理模型进行业务处理,得到预测业务指标数据;
在步骤S503中,根据预测业务指标数据和预设数量个特征信息组对应的预设业务指标数据,确定业务处理损失;
在步骤S505中,基于业务处理损失,对初始业务处理模型进行训练,得到目标业务处理模型。
在一个具体的实施例中,预测业务指标数据可以为初始业务处理模型结合预设数量个特征信息组确定的业务指标数据。预设业务指标数据可以为与预设数量个特征信息组对应的实际的业务指标数据。
在一个具体的实施例中,业务指标数据可以结合实际业务场景不同而不同,业务指标数据可以为业务执行过程中的指标数据。在一个具体的实施例中,以多媒体资源推荐场景为例,业务指标数据可以为多媒体资源被推荐给用户账号的概率,可选的,正样本业务数据对应的预设业务指标数据可以为1,负样本业务数据对应的预设业务指标数据可以为0。在另一个具体的实施例中,以用户账号推荐业务为例,业务指标数据可以为推送用户账号将融入有对象用户账号对应的待推荐对象的多媒体资源推送后,推送效果满足预设条件的概率;可选的,正样本业务数据对应的预设业务指标数据可以为1,负样本业务数据对应的预设业务指标数据可以为0。
在一个具体的实施例中,业务处理损失可以表征预测业务指标数据和预设业务指标数据间的差异程度。具体的实施例中,根据预测业务指标数据和预设数量个特征信息组对应的预设业务指标数据,确定业务处理损失可以包括结合预设损失函数,确定预测兴趣指标数据和预设兴趣指标数据对应的业务处理损失。
在一个具体的实施例中,预设损失函数可以结合实际应用进行设置,例如交叉熵损失函数、逻辑损失函数、指数损失函数等。
在一个具体的实施例中,基于业务处理损失,对初始业务处理模型进行训练,得到目标业务处理模型可以包括:基于业务处理损失,更新初始业务处理模型的模型参数;基于更新后的初始业务处理模型,重复步骤S503至基于业务处理损失,更新初始业务处理模型的模型参数的训练迭代操作,直至达到训练收敛条件;将达到训练收敛条件的情况下得到的初始业务处理模,作为目标业务处理模型。
在一个具体的实施例中,上述达到训练收敛条件可以为训练迭代操作的次数达到预设训练次数。可选的,达到预设收敛条件也可以为目标损失信息小于指定阈值。本说明书实施例中,预设训练次数和指定阈值可以结合实际应用中对模型的训练速度和识别准确性预先设置。
上述实施例中,在业务处理模型训练过程中,结合基于预测业务指标数据和预设业务指标数据确定的业务处理损失,对初始业务处理模型进行训练,可以快速达到训练收敛条件,提升训练速度,进而降低计算资源的消耗,提升系统性能。
由以上本说明书实施例提供的技术方案可见,本说明书中在训练业务处理模型过程中,将业务训练特征信息进行分类处理,得到预设数量个特征信息组;接着,通过对预设数量个特征信息组和业务训练特征信息进行分布差异分析,确定出表征预设数量个特征信息组与业务训练特征信息中正负样本特征信息分布差异的预设数量个分布差异信息,并结合预设数量个特征信息组对应的分布差异信息,来配置待训练业务模型的模型参数,可以结合特征信息组对应的分布差异信息,提前有针对的进行特征信息组特征权重大小的配置,进而可以在提升业务处理效果的基础上,提升配置好的初始业务处理模型的业务处理训练速度,快速达到训练收敛条件,有效降低计算资源的消耗,提升系统性能。
图6是根据一示例性实施例示出的一种业务处理装置框图。参照图6,该装置包括:
目标业务特征信息获取模块610,被配置为执行获取目标业务对应的目标业务特征信息;
业务处理模块620,被配置为执行将目标业务特征信息输入目标业务处理模型进行业务处理,得到目标业务指标数据,目标业务处理模型为基于目标业务对应的业务训练特征信息分类后的预设数量个特征信息组,对初始业务处理模型进行业务处理训练得到的,初始业务处理模型的模型参数为基于预设数量个分布差异信息配置的,预设数量个分布差异信息表征预设数量个特征信息组与业务训练特征信息中正负样本特征信息的分布差异;
目标业务执行模块630,被配置为执行基于目标业务指标数据执行目标业务。
在一个可选的实施例中,上述装置还包括:
第一训练特征获取模块,被配置为执行获取目标业务对应的业务训练特征信息,业务训练特征信息包括正负样本业务数据特征信息;
第一分类处理模块,被配置为执行对业务训练特征信息进行分类处理,得到预设数量个特征信息组;
第一分布差异分析模块,被配置为执行对预设数量个特征信息组和业务训练特征信息进行分布差异分析,得到预设数量个分布差异信息,预设数量个分布差异信息表征预设数量个特征信息组与业务训练特征信息中正负样本特征信息的分布差异;
第一模型参数配置模块,被配置为执行基于预设数量个分布差异信息,对目标业务对应的待训练业务模型进行模型参数配置,得到初始业务处理模型;
第一业务处理训练模块,被配置为执行基于预设数量个特征信息组对初始业务处理模型进行业务处理训练,得到目标业务处理模型。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图7是根据一示例性实施例示出的一种业务处理模型训练装置框图。参照图7,该装置包括:
第二训练特征获取模块710,被配置为执行获取目标业务对应的业务训练特征信息,业务训练特征信息包括正负样本业务数据特征信息;
第二分类处理模块720,被配置为执行对业务训练特征信息进行分类处理,得到预设数量个特征信息组;
第二分布差异分析模块730,被配置为执行对预设数量个特征信息组和业务训练特征信息进行分布差异分析,得到预设数量个分布差异信息,预设数量个分布差异信息表征预设数量个特征信息组与业务训练特征信息中正负样本特征信息的分布差异;
第二模型参数配置模块740,被配置为执行基于预设数量个分布差异信息,对目标业务对应的待训练业务模型进行模型参数配置,得到初始业务处理模型;
第二业务处理训练模块750,被配置为执行基于预设数量个特征信息组对初始业务处理模型进行业务处理训练,得到目标业务对应的目标业务处理模型。
在一个可选的实施例中,第二分布差异分析模块730包括:
第一分布信息确定单元,被配置为执行确定预设数量个特征信息组中正样本特征信息和负样本特征信息对应的第一分布信息;
第二分布信息确定单元,被配置为执行确定业务训练特征信息中正样本特征信息和负样本特征信息对应的第二分布信息;
分布差异信息确定单元,被配置为执行基于第一分布信息和第二分布信息,确定预设数量个分布差异信息。
在一个可选的实施例中,第一分布信息确定单元包括:
第一特征数量确定单元,被配置为执行获取预设数量个特征信息组中正样本特征信息的第一数量和预设数量个特征信息组中负样本特征信息的第二数量;
第一分布信息确定子单元,被配置为执行根据第一数量和第二数量,确定预设数量个特征信息组对应的第一分布信息。
在一个可选的实施例中,第一分布信息确定单元包括:
第二特征数量确定单元,被配置为执行获取业务训练特征信息中正样本特征信息的第三数量和业务训练特征信息中负样本特征信息的第四数量;
第二分布信息确定子单元,被配置为执行根据第三数量和第四数量,确定业务训练特征信息对应的第二分布信息。
在一个可选的实施例中,第二训练特征获取模块710包括:
样本业务数据获取单元,被配置为执行获取目标业务对应的正样本业务数据和目标业务对应的负样本业务数据;
编码处理单元,被配置为执行对正样本业务数据和负样本业务数据进行编码处理,得到业务训练特征信息。
在一个可选的实施例中,第二分类处理模块720包括:
目标特征位确定单元,被配置为执行确定业务训练特征信息对应多个特征位中的目标特征位;
分组单元,被配置为执行基于目标特征位对应的特征信息,对业务训练特征信息进行分组,得到预设数量个特征信息组。
在一个可选的实施例中,第二模型参数配置模块740包括:
待训练业务模型获取单元,被配置为执行获取待训练业务模型;
模型参数配置单元,被配置为执行将待训练业务模型的模型参数配置为预设数量个分布差异信息,得到初始业务处理模型。
在一个可选的实施例中,第二业务处理训练模块750包括:
业务处理单元,被配置为执行将预设数量个特征信息组输入初始业务处理模型进行业务处理,得到预测业务指标数据;
业务处理损失确定单元,被配置为执行根据预测业务指标数据和预设数量个特征信息组对应的预设业务指标数据,确定业务处理损失;
模型训练单元,被配置为执行基于业务处理损失,对初始业务处理模型进行训练,得到目标业务处理模型。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8是根据一示例性实施例示出的一种用于业务处理模型训练或用于业务处理的电子设备的框图,该电子设备可以是终端,其内部结构图可以如图8所示。该电子设备包括通过系统总线连接的处理器、存储器、模型接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的模型接口用于与外部的终端通过模型连接通信。该计算机程序被处理器执行时以实现一种业务处理模型训练方法或业务处理方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
图9是根据一示例性实施例示出的一种用于业务处理模型训练或用于业务处理的电子设备的框图,该电子设备可以是服务器,其内部结构图可以如图9所示。该电子设备包括通过系统总线连接的处理器、存储器和模型接口。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的模型接口用于与外部的终端通过模型连接通信。该计算机程序被处理器执行时以实现一种业务处理模型训练方法或业务处理方法。
本领域技术人员可以理解,图8或图9中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在示例性实施例中,还提供了一种电子设备,包括:处理器;用于存储该处理器可执行指令的存储器;其中,该处理器被配置为执行该指令,以实现如本公开实施例中的业务处理模型训练方法或业务处理方法。
在示例性实施例中,还提供了一种计算机可读存储介质,当该存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行本公开实施例中的业务处理模型训练方法或业务处理方法。
在示例性实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行本公开实施例中的业务处理模型训练方法或业务处理方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (20)
1.一种业务处理方法,其特征在于,包括:
获取目标业务对应的目标业务特征信息,所述目标业务包括多媒体
资源推荐业务、用户账号推荐业务、分类业务中的至少一种;
将目标业务特征信息输入目标业务处理模型进行业务处理,得到目标业务指标数据,所述目标业务处理模型为基于所述目标业务对应的业务训练特征信息分类后的预设数量个特征信息组,对初始业务处理模型进行业务处理训练得到的,所述初始业务处理模型的模型参数为基于所述预设数量个分布差异信息配置的,所述预设数量个分布差异信息表征所述预设数量个特征信息组与所述业务训练特征信息中正负样本特征信息的分布差异,所述预设数量个分布差异信息是根据所述预设数量个特征信息组中正负样本特征信息对应的第一分布信息,以及所述业务训练特征信息中正负样本特征信息对应的第二分布信息的比值确定的;
基于所述目标业务指标数据执行所述目标业务。
2.根据权利要求1所述的业务处理方法,其特征在于,所述方法还包括:
获取所述目标业务对应的业务训练特征信息,所述业务训练特征信息包括正负样本业务数据特征信息;
对所述业务训练特征信息进行分类处理,得到预设数量个特征信息组;
对所述预设数量个特征信息组和所述业务训练特征信息进行分布差异分析,得到所述预设数量个分布差异信息,所述预设数量个分布差异信息表征所述预设数量个特征信息组与所述业务训练特征信息中正负样本特征信息的分布差异;
基于所述预设数量个分布差异信息,对所述目标业务对应的待训练业务模型进行模型参数配置,得到初始业务处理模型;
基于所述预设数量个特征信息组对所述初始业务处理模型进行业务处理训练,得到所述目标业务处理模型。
3.一种业务处理模型训练方法,其特征在于,包括:
获取目标业务对应的业务训练特征信息,所述业务训练特征信息包括正负样本业务数据特征信息,所述目标业务包括多媒体资源推荐业务、用户账号推荐业务、分类业务中的至少一种;
对所述业务训练特征信息进行分类处理,得到预设数量个特征信息组;
对所述预设数量个特征信息组和所述业务训练特征信息进行分布差异分析,得到所述预设数量个分布差异信息,所述预设数量个分布差异信息表征所述预设数量个特征信息组与所述业务训练特征信息中正负样本特征信息的分布差异,所述预设数量个分布差异信息是根据所述预设数量个特征信息组中正负样本特征信息对应的第一分布信息,以及所述业务训练特征信息中正负样本特征信息对应的第二分布信息的比值确定的;
基于所述预设数量个分布差异信息,对所述目标业务对应的待训练业务模型进行模型参数配置,得到初始业务处理模型;
基于所述预设数量个特征信息组对所述初始业务处理模型进行业务处理训练,得到所述目标业务对应的目标业务处理模型。
4.根据权利要求3所述的业务处理模型训练方法,其特征在于,所述对所述预设数量个特征信息组和所述业务训练特征信息进行分布差异分析,得到所述预设数量个分布差异信息包括:
确定所述预设数量个特征信息组中正样本特征信息和负样本特征信息对应的第一分布信息;
确定所述业务训练特征信息中正样本特征信息和负样本特征信息对应的第二分布信息;
基于所述第一分布信息和所述第二分布信息,确定所述预设数量个分布差异信息。
5.根据权利要求4所述的业务处理模型训练方法,其特征在于,所述确定所述预设数量个特征信息组中正样本特征信息和负样本特征信息对应的第一分布信息包括:
获取所述预设数量个特征信息组中正样本特征信息的第一数量和所述预设数量个特征信息组中负样本特征信息的第二数量;
根据所述第一数量和所述第二数量,确定所述预设数量个特征信息组对应的第一分布信息。
6.根据权利要求4所述的业务处理模型训练方法,其特征在于,所述确定所述业务训练特征信息中正样本特征信息和负样本特征信息对应的第二分布信息包括:
获取所述业务训练特征信息中正样本特征信息的第三数量和所述业务训练特征信息中负样本特征信息的第四数量;
根据所述第三数量和所述第四数量,确定所述业务训练特征信息对应的第二分布信息。
7.根据权利要求3至6任一所述的业务处理模型训练方法,其特征在于,所述获取目标业务对应的业务训练特征信息包括:
获取所述目标业务对应的正样本业务数据和所述目标业务对应的负样本业务数据;
对所述正样本业务数据和所述负样本业务数据进行编码处理,得到所述业务训练特征信息。
8.根据权利要求3至6任一所述的业务处理模型训练方法,其特征在于,所述对所述业务训练特征信息进行分类处理,得到预设数量个特征信息组包括:
确定所述业务训练特征信息对应多个特征位中的目标特征位;
基于所述目标特征位对应的特征信息,对所述业务训练特征信息进行分组,得到所述预设数量个特征信息组。
9.根据权利要求3至6任一所述的业务处理模型训练方法,其特征在于,所述基于所述预设数量个分布差异信息,对所述目标业务对应的待训练业务模型进行模型参数配置,得到初始业务处理模型包括:
获取所述待训练业务模型;
将所述待训练业务模型的模型参数配置为所述预设数量个分布差异信息,得到所述初始业务处理模型。
10.根据权利要求3至6任一所述的业务处理模型训练方法,其特征在于,所述基于所述预设数量个特征信息组对所述初始业务处理模型进行业务处理训练,得到所述目标业务对应的目标业务处理模型包括:
将所述预设数量个特征信息组输入所述初始业务处理模型进行业务处理,得到预测业务指标数据;
根据所述预测业务指标数据和所述预设数量个特征信息组对应的预设业务指标数据,确定业务处理损失;
基于所述业务处理损失,对所述初始业务处理模型进行训练,得到所述目标业务处理模型。
11.一种业务处理装置,其特征在于,包括:
目标业务特征信息获取模块,被配置为执行获取目标业务对应的目标业务特征信息,所述目标业务包括多媒体资源推荐业务、用户账号推荐业务、分类业务中的至少一种;
业务处理模块,被配置为执行将目标业务特征信息输入目标业务处理模型进行业务处理,得到目标业务指标数据,所述目标业务处理模型为基于所述目标业务对应的业务训练特征信息分类后的预设数量个特征信息组,对初始业务处理模型进行业务处理训练得到的,所述初始业务处理模型的模型参数为基于所述预设数量个分布差异信息配置的,所述预设数量个分布差异信息表征所述预设数量个特征信息组与所述业务训练特征信息中正负样本特征信息的分布差异,所述预设数量个分布差异信息是根据所述预设数量个特征信息组中正负样本特征信息对应的第一分布信息,以及所述业务训练特征信息中正负样本特征信息对应的第二分布信息的比值确定的;
目标业务执行模块,被配置为执行基于所述目标业务指标数据执行所述目标业务。
12.根据权利要求11所述的业务处理装置,其特征在于,所述装置还包括:
第一训练特征获取模块,被配置为执行获取所述目标业务对应的业务训练特征信息,所述业务训练特征信息包括正负样本业务数据特征信息;
第一分类处理模块,被配置为执行对所述业务训练特征信息进行分类处理,得到预设数量个特征信息组;
第一分布差异分析模块,被配置为执行对所述预设数量个特征信息组和所述业务训练特征信息进行分布差异分析,得到所述预设数量个分布差异信息,所述预设数量个分布差异信息表征所述预设数量个特征信息组与所述业务训练特征信息中正负样本特征信息的分布差异;
第一模型参数配置模块,被配置为执行基于所述预设数量个分布差异信息,对所述目标业务对应的待训练业务模型进行模型参数配置,得到初始业务处理模型;
第一业务处理训练模块,被配置为执行基于所述预设数量个特征信息组对所述初始业务处理模型进行业务处理训练,得到所述目标业务处理模型。
13.一种业务处理模型训练装置,其特征在于,包括:
第二训练特征获取模块,被配置为执行获取目标业务对应的业务训练特征信息,所述业务训练特征信息包括正负样本业务数据特征信息;
第二分类处理模块,被配置为执行对所述业务训练特征信息进行分类处理,得到预设数量个特征信息组,所述目标业务包括多媒体资源推荐业务、用户账号推荐业务、分类业务中的至少一种;
第二分布差异分析模块,被配置为执行对所述预设数量个特征信息组和所述业务训练特征信息进行分布差异分析,得到所述预设数量个分布差异信息,所述预设数量个分布差异信息表征所述预设数量个特征信息组与所述业务训练特征信息中正负样本特征信息的分布差异,所述预设数量个分布差异信息是根据所述预设数量个特征信息组中正负样本特征信息对应的第一分布信息,以及所述业务训练特征信息中正负样本特征信息对应的第二分布信息的比值确定的;
第二模型参数配置模块,被配置为执行基于所述预设数量个分布差异信息,对所述目标业务对应的待训练业务模型进行模型参数配置,得到初始业务处理模型;
第二业务处理训练模块,被配置为执行基于所述预设数量个特征信息组对所述初始业务处理模型进行业务处理训练,得到所述目标业务对应的目标业务处理模型。
14.根据权利要求13所述的业务处理模型训练装置,其特征在于,所述第二分布差异分析模块包括:
第一分布信息确定单元,被配置为执行确定所述预设数量个特征信息组中正样本特征信息和负样本特征信息对应的第一分布信息;
第二分布信息确定单元,被配置为执行确定所述业务训练特征信息中正样本特征信息和负样本特征信息对应的第二分布信息;
分布差异信息确定单元,被配置为执行基于所述第一分布信息和所述第二分布信息,确定所述预设数量个分布差异信息。
15.根据权利要求13至14任一所述的业务处理模型训练装置,其特征在于,所述第二训练特征获取模块包括:
样本业务数据获取单元,被配置为执行获取所述目标业务对应的正样本业务数据和所述目标业务对应的负样本业务数据;
编码处理单元,被配置为执行对所述正样本业务数据和所述负样本业务数据进行编码处理,得到所述业务训练特征信息。
16.根据权利要求13至14任一所述的业务处理模型训练装置,其特征在于,所述第二分类处理模块包括:
目标特征位确定单元,被配置为执行确定所述业务训练特征信息对应多个特征位中的目标特征位;
分组单元,被配置为执行基于所述目标特征位对应的特征信息,对所述业务训练特征信息进行分组,得到所述预设数量个特征信息组。
17.根据权利要求13至14任一所述的业务处理模型训练装置,其特征在于,所述第二模型参数配置模块包括:
待训练业务模型获取单元,被配置为执行获取所述待训练业务模型;
模型参数配置单元,被配置为执行将所述待训练业务模型的模型参数配置为所述预设数量个分布差异信息,得到所述初始业务处理模型。
18.根据权利要求13至14任一所述的业务处理模型训练装置,其特征在于,所述第二业务处理训练模块包括:
业务处理单元,被配置为执行将所述预设数量个特征信息组输入所述初始业务处理模型进行业务处理,得到预测业务指标数据;
业务处理损失确定单元,被配置为执行根据所述预测业务指标数据和所述预设数量个特征信息组对应的预设业务指标数据,确定业务处理损失;
模型训练单元,被配置为执行基于所述业务处理损失,对所述初始业务处理模型进行训练,得到所述目标业务处理模型。
19.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至2中任一项所述的业务处理方法,或如权利要求3至10任一所述的业务处理模型训练方法。
20.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至2中任一项所述的业务处理方法,或如权利要求3至10任一所述的业务处理模型训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210010629.9A CN114021739B (zh) | 2022-01-06 | 2022-01-06 | 业务处理、业务处理模型训练方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210010629.9A CN114021739B (zh) | 2022-01-06 | 2022-01-06 | 业务处理、业务处理模型训练方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114021739A CN114021739A (zh) | 2022-02-08 |
CN114021739B true CN114021739B (zh) | 2022-04-15 |
Family
ID=80069576
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210010629.9A Active CN114021739B (zh) | 2022-01-06 | 2022-01-06 | 业务处理、业务处理模型训练方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114021739B (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108108821B (zh) * | 2017-12-29 | 2022-04-22 | Oppo广东移动通信有限公司 | 模型训练方法及装置 |
CN111444255B (zh) * | 2018-12-29 | 2023-09-22 | 杭州海康存储科技有限公司 | 一种数据模型的训练方法及装置 |
CN112380319B (zh) * | 2020-11-12 | 2023-10-17 | 平安科技(深圳)有限公司 | 一种模型训练的方法及相关装置 |
CN113420165B (zh) * | 2021-06-11 | 2024-03-05 | 北京达佳互联信息技术有限公司 | 二分类模型的训练、多媒体数据的分类方法及装置 |
-
2022
- 2022-01-06 CN CN202210010629.9A patent/CN114021739B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114021739A (zh) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109165249B (zh) | 数据处理模型构建方法、装置、服务器和用户端 | |
WO2021027595A1 (zh) | 用户画像生成方法、装置、计算机设备和计算机可读存储介质 | |
CN109509010B (zh) | 一种多媒体信息处理方法、终端及存储介质 | |
CN112395500B (zh) | 内容数据推荐方法、装置、计算机设备及存储介质 | |
CN112328909B (zh) | 信息推荐方法、装置、计算机设备及介质 | |
CN111563218B (zh) | 一种页面的修复方法及装置 | |
CN114461869B (zh) | 业务特征数据处理方法、装置、电子设备及存储介质 | |
CN113918738B (zh) | 多媒体资源推荐方法、装置、电子设备及存储介质 | |
CN112148952A (zh) | 一种任务执行方法、装置、设备及计算机可读存储介质 | |
WO2023024408A1 (zh) | 用户特征向量确定方法、相关设备及介质 | |
CN113343024A (zh) | 对象推荐方法、装置、电子设备及存储介质 | |
CN114491093B (zh) | 多媒体资源推荐、对象表征网络的生成方法及装置 | |
CN111651666A (zh) | 用户主题推荐方法、装置、计算机设备及存储介质 | |
CN109951859B (zh) | 无线网络连接推荐方法、装置、电子设备及可读介质 | |
CN114021739B (zh) | 业务处理、业务处理模型训练方法、装置及电子设备 | |
CN113610215B (zh) | 任务处理网络生成、任务处理方法、装置及电子设备 | |
CN112087473A (zh) | 文档下载方法、装置、计算机可读存储介质和计算机设备 | |
CN115756821A (zh) | 在线任务处理模型训练、任务处理方法及装置 | |
CN112269942B (zh) | 一种推荐对象的方法、装置、系统及电子设备 | |
CN111078972B (zh) | 提问行为数据的获取方法、装置和服务器 | |
CN113868516A (zh) | 对象推荐方法、装置、电子设备及存储介质 | |
CN114048392B (zh) | 多媒体资源推送方法、装置、电子设备及存储介质 | |
CN112199571A (zh) | 一种人工智能信息处理系统、方法及可读存储介质 | |
CN114996482B (zh) | 知识图谱构建、视频搜索方法、装置及电子设备 | |
CN115409151A (zh) | 图神经网络训练、任务处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |