CN115130561A - 池化算子的处理方法、装置、设备及存储介质 - Google Patents
池化算子的处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115130561A CN115130561A CN202210655564.3A CN202210655564A CN115130561A CN 115130561 A CN115130561 A CN 115130561A CN 202210655564 A CN202210655564 A CN 202210655564A CN 115130561 A CN115130561 A CN 115130561A
- Authority
- CN
- China
- Prior art keywords
- pooling
- target
- feature
- pooling operator
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种池化算子的处理方法、装置、设备及存储介质,相关实施例可应用于人工智能、地图、智能交通等各种场景,用于提高模型预测的准确性。该方法包括:获取每个目标特征域的中的每个目标特征值对应的第一特征向量;基于池化算子搜索空间,为每个目标特征域匹配目标池化算子,池化算子搜索空间包括K个候选池化算子,目标池化算子为权重值最大的候选池化算子,将每个目标特征值对应的第一特征向量经过目标池化算子进行池化压缩,得到每个目标特征域对应的目标池化特征向量,基于每个目标特征域对应的目标池化特征向量进行损失计算,得到目标损失值,基于目标损失值对推荐模型进行模型参数更新,得到目标推荐模型。
Description
技术领域
本申请实施例涉及人工智能技术领域,尤其涉及一种池化算子的处理方法、装置、设备及存储介质。
背景技术
随着信息技术的发展,推荐模型常被用来建模目标对象与物品的关系,在建模的过程中,模型的输入通常是一条由一个目标对象和一个物品组成的样本,模型的输出是用于反映该目标对象对物品的喜爱程度。
一条样本可以由上百个特征域组成,而每个特征域可以包含不同数量的特征值,例如,有些特征域只会有一个特征值的特征域被称为单值特征域,相对的,如果一条样本中某个特征域可能包含多个特征值,那么该特征域被称为多值特征域。
目前的模型方案会对特征值对应的嵌入向量进行统一的池化操作,转成一个固定长度的向量后才进行后续模型计算,但是,由于多值特征域中包含的特征值数量是不确定的,因此给所有特征域都用同一个池化算子,容易对模型优化造成干扰,导致模型预测的准确性降低。
发明内容
本申请实施例提供了一种池化算子的处理方法、装置、设备及存储介质,用于在每个目标特征域的目标池化特征向量的生成过程中,自动化为每个目标特征域匹配合适的目标池化算子,能够增强模型的表达能力,以避免所有特征域都用同一个池化算子,容易对模型优化造成干扰的情况,再对模型进行迭代优化,从而提高模型预测的准确性。
本申请实施例一方面提供了一种池化算子的处理方法,包括:
获取每个目标特征域的中的每个目标特征值对应的第一特征向量;
基于池化算子搜索空间,为每个所述目标特征域匹配目标池化算子,其中,所述池化算子搜索空间包括K个候选池化算子,所述目标池化算子为权重值最大的候选池化算子,所述K为大于等于1的整数;
针对于每个所述目标特征域,将每个所述目标特征值对应的第一特征向量经过所述目标池化算子进行池化压缩,得到每个所述目标特征域对应的目标池化特征向量;
基于每个所述目标特征域对应的目标池化特征向量进行损失计算,得到目标损失值;
基于所述目标损失值对推荐模型进行模型参数更新,得到目标推荐模型。
本申请另一方面提供了一种池化算子的处理装置,包括:
获取单元,用于获取每个目标特征域的中的每个目标特征值对应的第一特征向量;
确定单元,用于基于池化算子搜索空间,为每个目标特征域匹配目标池化算子,其中,池化算子搜索空间包括K个候选池化算子,目标池化算子为权重值最大的候选池化算子,K为大于等于1的整数;
处理单元,用于针对于每个目标特征域,将每个目标特征值对应的第一特征向量经过目标池化算子进行池化压缩,得到每个目标特征域对应的目标池化特征向量;
处理单元,还用于基于每个目标特征域对应的目标池化特征向量进行损失计算,得到目标损失值;
处理单元,还用于基于目标损失值对推荐模型进行模型参数更新,得到目标推荐模型。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,
处理单元,还用于基于池化算子搜索空间,使用目标样本集合对推荐模型的池化算子搜索结构进行多轮训练;
确定单元,还用于当池化算子搜索结构中的结构模型参数以及权重参数满足收敛条件时,从K个候选池化算子中,为目标样本集合中每个特征域选择权重参数最大值对应的候选池化算子作为目标池化算子。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,处理单元具体可以用于:
将验证样本集合中的验证样本通过池化算子搜索结构,对池化算子搜索结构中的权重参数进行调整;
将训练样本集合中的训练样本通过池化算子搜索结构,对池化算子搜索结构中的结构模型参数进行调整。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,处理单元具体可以用于:
获取验证样本的每个特征域中每个特征值对应的第二特征向量;
将第二特征向量输入到池化算子搜索结构,得到每个特征域对应的加权池化特征向量;
基于每个特征域对应的加权池化特征向量获取验证样本对应的预测值;
通过目标损失函数对验证样本的实际值和验证样本的预测值进行计算,得到验证样本对应的预测损失值;
在验证样本对应的预测损失值不满足收敛条件时,对池化算子搜索结构中的权重参数进行调整。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,处理单元具体可以用于:
获取训练样本的每个特征域中每个特征值对应的第三特征向量;
将第三特征向量输入到池化算子搜索结构,得到每个特征域对应的加权池化特征向量;
基于每个特征域对应的加权池化特征向量获取验证样本对应的预测值;
通过目标损失函数对训练样本的实际值和训练样本的预测值进行计算,得到训练样本对应的预测损失值;
在训练样本对应的预测损失值不满足收敛条件时,对池化算子搜索结构中的结构模型参数进行调整。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,处理单元具体可以用于:
将每个第二特征向量分别经过池化算子搜索空间中的K个候选池化算子进行池化压缩,得到每个特征值对应的K个池化特征向量;
基于每个候选池化算子对应的权重参数,对每个特征值对应的K个池化特征向量进行加权求和,得到每个特征域对应的加权池化特征向量。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,处理单元具体可以用于:
将每个第三特征向量分别经过池化算子搜索空间中的K个候选池化算子进行池化压缩,得到每个特征值对应的K个池化特征向量;
基于每个候选池化算子对应的权重参数,对每个特征值对应的K个池化特征向量进行加权求和,得到每个特征域对应的加权池化特征向量。
本申请另一方面提供了一种计算机设备,包括:存储器、处理器以及总线系统;
其中,存储器用于存储程序;
处理器用于执行存储器中的程序时实现如上述各方面的方法;
总线系统用于连接存储器以及处理器,以使存储器以及处理器进行通信。
本申请的另一方面提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面的方法。
从以上技术方案可以看出,本申请实施例具有以下有益效果:
通过获取每个目标特征域的中的每个目标特征值对应的第一特征向量,基于包括K个候选池化算子的池化算子搜索空间,为每个目标特征域匹配权重值最大的目标池化算子,将每个目标特征域中的每个目标特征值对应的第一特征向量经过目标池化算子进行池化压缩,以获取到每个目标特征域对应的目标池化特征向量,基于每个目标特征域对应的目标池化特征向量进行损失计算,以获取到目标损失值,然后,基于目标损失值对推荐模型进行模型参数更新,以获取到目标推荐模型。通过上述方式,能够在每个目标特征域的目标池化特征向量的生成过程中,自动化为每个目标特征域匹配合适的目标池化算子,来获取到表达能力更强的目标池化特征向量,使得特征域表征更加多样和准确,进而增强模型的表达能力,以避免所有特征域都用同一个池化算子,容易对模型优化造成干扰的情况,再对模型进行迭代优化,从而提高模型预测的准确性。
附图说明
图1是本申请实施例中数据对象控制系统的一个架构示意图;
图2是本申请实施例中池化算子的处理方法的一个实施例流程图;
图3是本申请实施例中池化算子的处理方法的另一个实施例流程图;
图4是本申请实施例中池化算子的处理方法的另一个实施例流程图;
图5是本申请实施例中池化算子的处理方法的另一个实施例流程图;
图6是本申请实施例中池化算子的处理方法的另一个实施例流程图;
图7是本申请实施例中池化算子的处理方法的另一个实施例流程图;
图8是本申请实施例中池化算子的处理方法的另一个实施例流程图;
图9是本申请实施例中池化算子的处理方法的一个原理流程示意图;
图10是本申请实施例中池化算子的处理方法的另一个原理流程示意图;
图11是本申请实施例中池化算子的处理方法的另一个原理流程示意图;
图12是本申请实施例中池化算子的处理方法的一个池化算子搜索原理流程示意图;
图13是本申请实施例中池化算子的处理方法的一个推荐信息的流程示意图;
图14是本申请实施例中池化算子的处理装置的一个实施例示意图;
图15是本申请实施例中计算机设备的一个实施例示意图。
具体实施方式
本申请实施例提供了一种池化算子的处理方法、装置、设备及存储介质,用于在每个目标特征域的目标池化特征向量的生成过程中,自动化为每个目标特征域匹配合适的目标池化算子,能够增强模型的表达能力,以避免所有特征域都用同一个池化算子,容易对模型优化造成干扰的情况,再对模型进行迭代优化,从而提高模型预测的准确性。
本申请的说明书和权利要求书及附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了便于理解,先对本申请实施例涉及到的一些术语或概念进行解释。
1、推荐模型
推荐模型指的是在推荐系统中,给目标对象推荐感兴趣的内容所使用的数学模型。
2、特征ID(feature id)
特征ID(即特征值)是为了更方便的处理特征,一般会把原始特征离散化,并用唯一的ID来标识它。
3、特征域(feature field):
特征域用于表示一类特征ID,比如“目标对象的属性信息”,一个特征域包含多个特征ID;
4、嵌入向量Embedding
嵌入向量指的是推荐模型一般会把高维度的特征ID,映射到低纬度向量上,这个向量被称为Embedding向量;
5、嵌入向量维度Embedding Size:Embedding向量的维度。
6、AutoML
AutoML是一种用来自动化构建机器学习流程的方法,用来解决机器学习与深度学习中过度依赖专家经验的问题。
7、池化(Pooling)
池化操作在推荐领域一般是指将多个向量压缩成一个向量。
8、池化算子
池化算子指的是向量压缩的方法,比如ave-pooling,是对所有候选向量每个坐标求平均值。
可以理解的是,在本申请的具体实施方式中,涉及到模型参数以及池化算子、目标特征域以及目标样本集等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
可以理解的是,如本申请所公开的池化算子的处理方法,具体涉及智能车路协同系统(Intelligent Vehicle Infrastructure Cooperative Systems,IVICS),下面进一步地对智能车路协同系统进行介绍。智能车路协同系统简称车路协同系统,是智能交通系统(ITS)的一个发展方向。车路协同系统是采用先进的无线通信和新一代互联网等技术,全方位实施车车、车路动态实时信息交互,并在全时空动态交通信息采集与融合的基础上开展车辆主动安全控制和道路协同管理,充分实现人车路的有效协同,保证交通安全,提高通行效率,从而形成的安全、高效和环保的道路交通系统。
可以理解的是,如本申请所公开的池化算子的处理方法,还涉及人工智能(Artificial Intelligence,AI)技术,下面进一步地对人工智能技术进行介绍。人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
其次,自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
其次,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
应理解的是,本申请提供的池化算子的处理方法可应用于各种场景,包括但不限于人工智能、地图、智慧交通、云技术等,用于通过在池化特征向量的生成过程中匹配合适的池化算子,完成对推荐模型的优化,以应用于信息流推荐、智能语音交互、智能导航推荐等场景。
为了解决上述问题,本申请提出了一种池化算子的处理方法,该方法应用于图1所示的数据对象控制系统,请参阅图1,图1为本申请实施例中数据对象控制系统的一个架构示意图,如图1所示,服务器通过获取终端设备提供的每个目标特征域的中的每个目标特征值对应的第一特征向量,基于包括K个候选池化算子的池化算子搜索空间,为每个目标特征域匹配权重值最大的目标池化算子,将每个目标特征域中的每个目标特征值对应的第一特征向量经过目标池化算子进行池化压缩,以获取到每个目标特征域对应的目标池化特征向量,基于每个目标特征域对应的目标池化特征向量进行损失计算,以获取到目标损失值,然后,基于目标损失值对推荐模型进行模型参数更新,以获取到目标推荐模型。通过上述方式,能够在每个目标特征域的目标池化特征向量的生成过程中,自动化为每个目标特征域匹配合适的目标池化算子,来获取到表达能力更强的目标池化特征向量,使得特征域表征更加多样和准确,进而增强模型的表达能力,以避免所有特征域都用同一个池化算子,容易对模型优化造成干扰的情况,再对模型进行迭代优化,从而提高模型预测的准确性。
可以理解的是,图1中仅示出了一种终端设备,在实际场景中可以由更多种类的终端设备参与到数据处理的过程中,终端设备包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端等,具体数量和种类因实际场景而定,具体此处不做限定。另外,图1中示出了一个服务器,但在实际场景中,也可以有多个服务器的参与,特别是在多模型训练交互的场景中,服务器的数量因实际场景而定,具体此处不做限定。
需要注意的是,本实施例中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(contentdelivery network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,终端设备以及服务器可以连接组成区块链网络,本申请在此不做限制。
结合上述介绍,下面将对本申请中池化算子的处理方法进行介绍,请参阅图2,本申请实施例中池化算子的处理方法一个实施例包括:
在步骤S101中,获取每个目标特征域的中的每个目标特征值对应的第一特征向量;
在本实施例中,可以从数据库中读取到目标样本集,进而可以将目标样本集中的每个样本中的每个目标特征域对应的原始特征转化为相应的目标特征值即特征ID,然后,可以将每个样本的每个目标特征域对应的至少一个的目标特征值输入至推荐模型中,可以通过推荐模型的特征ID嵌入层获取到每个目标特征域的中的每个目标特征值对应的第一特征向量。
其中,目标特征域来源于目标样本集,目标特征域包括单值特征域和多值特征域。目标样本集中包含有多个样本,每个样本是由一个目标对象和一个物品组成的,每个样本可以由上百个特征域组成,比如“目标对象属性信息”、“目标对象历史行为”、“目标对象标签”、“短视频ID”或“短视频标签”等。每个目标特征域包含不同数量的目标特征值(即特征ID),比如一个“目标对象属性信息”特征域内包含{男,女,未知}三个特征ID,其中,特征ID(即特征值)是为了更方便的处理特征,一般会把原始特征离散化,并用唯一的ID来标识它。
可以理解的是,单值特征域指的是只有一个特征ID,比如“目标对象属性信息”特征域,每个目标对象只能从{男,女,未知}三个值中选择一个,这类特征域被称为单值特征域,相对的,如果一条样本中某个特征域可能包含多个特征ID,该特征域被称为多值特征域。
可以理解的是,样本中可以包括单值特征域和多值特征域,每条样本由M个特征域组成x=[x1,x2,...,xM],其中,x=x1:[0,1,0,...,0],...,xj:[1,0,1,0,0],...,xM:[0,1,0,...,1,0,1],其中,xi是特征域对应的独热向量编码(one-hot encoding)。
具体地,假设目标特征域为多值特征域,假设共有N条样本,每条样本由M个目标特征域组成,其中,第j个目标特征域对应的目标特征值即特征ID为其中,nj表示第j目标特征域内包含的特征ID数量即目标特征值的个数,这里需要注意本身跟样本也有关系,即不同的样本中同一个目标特征域下的特征值数量可能不同,这里为了方便省略样本的下标,然后,可以经过推荐模型的特征ID嵌入层Embedding lookup之后,以获取到相应的第j个目标特征域的每个目标特征值对应的第一特征向量,即Embedding向量:
其中,特征ID嵌入层是以特征ID的输入为原始数据,例如,一个“目标对象标签”特征域内包含{音乐,影视,游戏,动漫,美妆}五个特征ID,特征嵌入层用于对{音乐,影视,游戏,动漫,美妆}五个特征ID进行Embedding,作为一种示例,特征嵌入层的输出可以但不限于上述第三样本特征向量。
在步骤S102中,基于池化算子搜索空间,为每个目标特征域匹配目标池化算子,其中,池化算子搜索空间包括K个候选池化算子,目标池化算子为权重值最大的候选池化算子,K为大于等于1的整数;
在本实施例中,在获取到每个目标特征域的中的每个目标特征值对应的第一特征向量之后,可以在池化算子搜索空间中自动为每个目标特征域搜索最优的池化算子,即为每个目标特征域匹配目标池化算子。
其中,池化算子搜索空间包括K个候选池化算子,目标池化算子为权重值最大的候选池化算子,K为大于等于1的整数,如下表1列举了几种常见的池化算子:
表1
具体地,如图10所示,在对特征域嵌入层中的网络结构增加的池化算子搜索结构pooling layer的训练完成后,可以针对每个特征域,选择权重值最大的候选算子作为该特征域的最优池化算子,并剔除其它算子,重新对推荐模型进行微调,具体可以是在池化搜索空间中遍历到与目标特征域相同的特征域,并将遍历到的特征域所对应的权重值最大的候选算子作为该目标池化算子。
在步骤S103中,针对于每个目标特征域,将每个目标特征值对应的第一特征向量经过目标池化算子进行池化压缩,得到每个目标特征域对应的目标池化特征向量;
在本实施例中,在获取到每个目标特征域适配的目标池化算子之后,可以将同一个特目标征域下的所有目标特征值对应的第一特征向量经过目标池化算子进行池化压缩,以获取到每个目标特征域对应的目标池化特征向量。
具体地,如图9所示,在获取到每个目标特征域适配的目标池化算子之后,可以将同一个目标特征域下的所有目标特征值对应的第一特征向量Embedding向量:经过目标池化算子进行压缩,可以得到目标特征域对应的特征域Embedding:即目标池化特征向量,其中,p表示目标特征域对应的目标池化算子。
在步骤S104中,基于每个目标特征域对应的目标池化特征向量进行损失计算,得到目标损失值;
在本实施例中,在获取到每个目标特征域对应的目标池化特征向量之后,可以基于目标损失函数,对每个目标特征域对应的目标池化特征向量进行损失计算,以获取到目标损失值。
其中,目标损失函数具体可以表现为如下公式(1)所示的交叉熵损失函数,还可以是其他损失函数,此处不作具体限制:
具体地,如图9所示,当获取到每个目标特征域对应的目标池化特征向量即特征域Embedding确定后,可以将所有目标特征域的Embedding向量进行拼接,并将拼接后的向量输入至后续的如图9所示意的网络交叉层,最终输出一个预估值,进一步地,可以按照上述公式(1)的目标损失函数,通过样本预估值与样本真实值计算得到目标损失值loss。
其中,网络交叉层包括至少一个MLP结构,网络交叉层的输入为所有目标特征域的Embedding向量经过拼接后的向量;
其中,如下公式(2)为网络交叉层的输出样本预估值:
logits=MLP(V) (2);
其中,其中,u表示目标特征域的个数,V为所有目标特征域的Embedding向量经过拼接后的向量。
其中,在MLP结构中,先基于如下公式(3)获取所有目标特征域的Embedding向量经过拼接后的向量所对应的隐向量:
hk=σk(Wk*hk-1+bk) (3);
其中,k表示K个全连接层,Wk表示权重矩阵,bk表示偏差向量,σk表示一个激活函数。
其中,hout是隐藏层的输出,Wout表示权重矩阵,bout表示偏差向量,σout表示一个激活函数。
在步骤S105中,基于目标损失值对推荐模型进行模型参数更新,得到目标推荐模型。
具体地,在获取到目标损失值之后,基于目标损失值对推荐模型进行模型参数更新,可以采用梯度下降反向传播的方式进行模型参数更新,也可以采用其他更新方式,此处不作具体限制,其中,可以通过判断推荐模型对应的目标损失值是否满足预设的收敛条件,并在满足预设的收敛条件的情况下,停止训练,将结束训练时的待训练的推荐模型确定为目标推荐模型;在不满足预设的收敛条件的情况下,对待训练的推荐模型中的参数进行调整。
为了更好的理解上述池化算子的处理方法,下面结合图9和图13所示的具体实施例进一步解释说明。
可以理解的是,如图13所示,向目标对象推送的媒体资源(如图13所示意的文章或广告等),是从千万级别的候选媒体资源库(例如,文章池或广告库等)里筛选出来的,选择的过程一般包括两个阶段,第一阶段称为召回,通过召回算法从千万级别的广告库中选出上千个候选集;第二阶段称为排序,通过排序模型给召回后的上千个候选广告进行精准排序,最后选出最优的1条或多条文章或广告(可以理解为一个或多个媒体资源,如最优的10个左右的文章或广告进行展示),并推送给目标对象。
例如,如图13所示的,通过上述目标推荐模型,将满足推送条件的文章1推送至目标对象所在的应用1中,并在应用1的页面中显示文章1的缩略信息(例如,链接、标题以及图片等),然后通过目标对象对“了解更多”或“跳过”按钮进行点击,确定是否查看为该目标对象推送的广告1。
需要说明的是,本申请实施例中的池化算子的处理方法可以应用在如图13所示的召回阶段和/或排序阶段,召回阶段上使用的召回模型或者排序阶段上使用的排序模型通常包括如图9中所示的特征ID嵌入层、特征域嵌入层和网络交叉层中的网络结构,本申请实施例中的池化算子的处理方法主要针对特征域嵌入层中的网络结构进行了改进,让特征域表征更加多样和准确,从而提升整个推荐的体验。
进一步地,在如图13所示的应用场景中,通过上述目标推荐模型,将满足推送条件的文章1推送至目标对象所在的应用1中,具体过程可以包括如下步骤:
S-1)获取目标帐号数据,其中,目标帐号数据可以但不限于目标对象数据或目标对象数据集合,例如,目标对象的属性信息、目标对象的兴趣爱好、目标对象查看过的广告等;
S-2)将目标账号数据输入至上述目标推荐模型,通过目标推荐模型(如文章推荐模型或广告推荐模型等多媒体资源推荐模型)的特征ID嵌入层对目标帐号数据进行特征值提取,得到目标特征域(例如,目标对象查看过的广告)、目标特征域对应的目标特征值(例如,所访问的广告类别及访问时间等)、每个目标特征值对应的特征向量;
S-3)在搜索空间中搜索与每个目标特征域匹配的目标池化算子;
S-4)将每个目标特征域对应的所有特征向量分别经过目标池化算子进行池化处理,得到,每个目标特征域Embedding,并将目标特征域Embedding进行拼接,得到目标账号数据对应的拼接Embedding;
S-5)将拼接后的拼接Embedding输入至后续的如图9所示意的网络交叉层,最终通过目标推荐模型(如文章推荐模型或广告推荐模型等多媒体资源推荐模型)输出一个目标预估值;
S-6),基于目标预估值,通过召回算法从千万级别的候选媒体资源库(例如,如图13所示意的文章池或广告库等)中选出上千个候选集(如广告候选集、文章集合等),然后,可以通过排序模型给召回后的上千个候选集(如广告候选集、文章集合等)中的上千个候选文章或广告进行精准排序,最后选出最优的1条或多条文章或广告(如最优的10个左右的文章或广告进行展示),并推送至目标对象的目标账号。
在本申请实施例中,提供了一种池化算子的处理方法,通过上述方式,能够在每个目标特征域的目标池化特征向量的生成过程中,自动化为每个目标特征域匹配合适的目标池化算子,来获取到表达能力更强的目标池化特征向量,使得特征域表征更加多样和准确,进而增强模型的表达能力,以避免所有特征域都用同一个池化算子,容易对模型优化造成干扰的情况,再对模型进行迭代优化,从而提高模型预测的准确性。
可选地,在上述图2对应的实施例的基础上,本申请实施例提供的池化算子的处理方法另一个可选实施例中,如图3所示,在步骤S102基于池化算子搜索空间,为每个目标特征域匹配目标池化算子之前,该方法还包括:
在步骤S301中,基于池化算子搜索空间,使用目标样本集合对推荐模型的池化算子搜索结构进行多轮训练;
在步骤S302中,当池化算子搜索结构中的结构模型参数以及权重参数满足收敛条件时,从K个候选池化算子中,为目标样本集合中每个特征域选择权重参数最大值对应的候选池化算子作为目标池化算子。
在本实施例中,在基于池化算子搜索空间,为每个目标特征域匹配目标池化算子之前,可以对特征域嵌入层中的网络结构增加的池化算子搜索结构(如图10右边所示意的pooling layer),基于池化算子搜索空间,使用目标样本集合对推荐模型的池化算子搜索结构进行多轮训练,当池化算子搜索结构中的结构模型参数以及权重参数满足收敛条件时,从K个候选池化算子中,为目标样本集合中每个特征域选择权重参数最大值对应的候选池化算子作为目标池化算子,以使推荐模型可以更好地学习到搜索最优池化算子的能力,使得特征域嵌入层中的网络结构得到改进,以增强特征域表征的表达能力,从而可以在一定程度上提高模型预测的准确性。
具体地,如图10右边所示,在特征域嵌入层中的网络结构增加的池化算子搜索结构pooling layer,使用目标样本集合对推荐模型的池化算子搜索结构进行多轮训练,具体可以是通过将目标样本集合的验证样本集合中的验证样本通过池化算子搜索结构,对池化算子搜索结构中的权重参数进行调整;同时,可以将目标样本集合的训练样本集合中的训练样本通过池化算子搜索结构,对池化算子搜索结构中的结构模型参数进行调整,重复以上述两个参数调整步骤直到收敛,收敛后,即当池化算子搜索结构中的结构模型参数以及权重参数满足收敛条件时,可以为每个特征域选择最大权重池化算子,再重新训练推荐模型至收敛。
可选地,在上述图3对应的实施例的基础上,本申请实施例提供的池化算子的处理方法另一个可选实施例中,如图4所示,目标样本集合包括验证样本集合和训练样本集合;
步骤S301基于池化算子搜索空间,使用目标样本集合对推荐模型的池化算子搜索结构进行多轮训练,包括:
在步骤S401中,将验证样本集合中的验证样本通过池化算子搜索结构,对池化算子搜索结构中的权重参数进行调整;
在步骤S402中,将训练样本集合中的训练样本通过池化算子搜索结构,对池化算子搜索结构中的结构模型参数进行调整。
在本实施例中,基于池化算子搜索空间,可以结合DARTS算法,将验证样本集合中的验证样本通过池化算子搜索结构,对池化算子搜索结构中的权重参数进行调整,将训练样本集合中的训练样本通过池化算子搜索结构,对池化算子搜索结构中的结构模型参数进行调整,直至收敛,以实现最优池化算子搜索,也可以使用遗传算法、强化学习算法、基于代理模型的算法等,在已经定义好的池化算子搜索空间中搜索最优池化算子,此处不作具体限制,能够分别利用验证样本及训练样本对推荐模型的池化算子搜索结构进行训练,并在验证样本对应的预测损失值不满足预设的收敛条件的情况下,对待训练的池化算子搜索结构中的权重参数进行调整;在训练样本、训练样本对应的预测损失值不满足预设的收敛条件的情况下,对池化算子搜索结构中的结构模型参数进行调整,提高了模型训练过程中对参数调整的灵活性。
具体地,按照一定比例,可以将目标样本集合{X1,X2,X3…}划分为验证样本集合{Xv1,Xv2,Xv3…}、训练样本集合{Xt1,Xt2,Xt3…}。
将验证样本集合中的验证样本通过池化算子搜索结构,对池化算子搜索结构中的权重参数进行调整,同时,将训练样本集合中的训练样本通过池化算子搜索结构,对池化算子搜索结构中的结构模型参数进行调整,具体可以是依次将验证样本及训练样本交替出现的Xv1,Xt1,Xv2,Xt2…输入待训练的推荐模型的池化算子搜索结构,对待训练的推荐模型进行训练,得到验证样本的预测值Yv1',Yv2',Yv3'…,并得到训练样本的预测值Yt1',Yt2',Yt3'…;然后,根据验证样本的实际值、预测值及损失函数,计算验证样本对应的预测损失值,并在验证样本对应的预测损失值不满足收敛条件时,对池化算子搜索结构中的权重参数进行调整,同理,根据训练样本的实际值、预测值及损失函数,计算训练样本对应的预测损失值,并在验证样本对应的预测损失值不满足收敛条件时,对池化算子搜索结构中的权重参数进行调整。
可选地,在上述图4对应的实施例的基础上,本申请实施例提供的池化算子的处理方法另一个可选实施例中,如图5所示,步骤S401将验证样本集合中的验证样本通过池化算子搜索结构,对池化算子搜索结构中的权重参数进行调整,包括:
在步骤S501中,获取验证样本的每个特征域中每个特征值对应的第二特征向量;
在步骤S502中,将第二特征向量输入到池化算子搜索结构,得到每个特征域对应的加权池化特征向量;
在步骤S503中,基于每个特征域对应的加权池化特征向量获取验证样本对应的预测值;
在步骤S504中,通过目标损失函数对验证样本的实际值和验证样本的预测值进行计算,得到验证样本对应的预测损失值;
在步骤S505中,在验证样本对应的预测损失值不满足收敛条件时,对池化算子搜索结构中的权重参数进行调整。
为了便于理解,下面结合图11所示的推荐模型进行详细描述。
如图11下边所示,采用一般模型选择池化算子的过程(TraditionalPooling)包括:
1-1)获取每个特征域中每个特征值(如x1,x2以及x3等)的嵌入向量Embedding;
1-2)对所有特征域都选择同一个池化算子p;
1-3)将所有特征域的每个特征值的嵌入向量Embedding都经过同一个池化算子p进行统一的池化操作,转成一个固定长度的一维向量(如v1,v2以及v3等)。
相比于上述流程,本申请实施例提出了一种改进的池化算子的处理方法,如图11中的上边所示的基于AutoML(自动化选择最优池化算子的池化算子搜索结构)选择池化算子的过程(AutoMLPooling)包括如下步骤:
2-1)预先定义池化算子搜索空间,P={p1,p2,...,pK},K为候选池化算子的个数;
2-3)针对第j个特征域,获取每个特征域中每个特征值(如x1,x2以及x3等)的嵌入向量Embedding;
2-4)针对第j个特征域,将每个特征值的嵌入向量Embedding分别M个池化算子进行池化操作,得到每个候选池化算子对应的Embedding:例如,特征值x1在一个候选池化算子p1的池化操作下对应的Embedding为V1 1=p1(v1,v2,v3);
2-6)针对每个特征域,选择权重最大的候选池化算子作为该特征域的最优池化算子,剔除其它候选池化算子,重新对推荐模型进行微调。
具体地,基于上述基于AutoML(自动化选择最优池化算子的池化算子搜索结构)选择池化算子的过程(AutoMLPooling),将验证样本集合中的验证样本通过池化算子搜索结构,对池化算子搜索结构中的权重参数进行调整,具体可以是通过将验证样本集合中的验证样本输入至推荐模型,先通过特征ID嵌入层获取验证样本的每个特征域中每个特征值对应的第二特征向量,进一步地,将第二特征向量输入到池化算子搜索结构,按照上述步骤2-4)至步骤2-5),基于每个候选池化算子对应的权重参数,以获取到每个特征域对应的加权池化特征向量。
进一步地,由于目标损失函数的确定主要包括:有两组参数需要学习:1)深度学习模型参数,标记为W;2)池化算子搜索结构中的所有的权重参数,标记为a,该参数与W通过DARTS算法求解。求解的优化问题为:
s.t.W*(a)=argminW Ltrain(W,a) (6);
其中,Lval表示验证集上的交叉熵损失函数,Ltrain表示训练集上的交叉熵损失函数,交叉熵损失函数的计算公式为如下公式(7):
其中,pi是推荐模型的预测概率值。
进一步地,可以基于上述公式(7)每个特征域对应的加权池化特征向量获取验证样本对应的预测值,并通过目标损失函数对验证样本的实际值和验证样本的预测值进行计算,以获取到验证样本对应的预测损失值;
进一步地,可以基于上述公式(5)和公式(6)判断验证样本对应的预测损失值是否满足预设的收敛条件,并在满足预设的收敛条件的情况下,停止训练,为每个特征域选择最大权重池化算子,并剔除其他候选池化算子,重新训练推荐模型至收敛;反之,在验证样本对应的预测损失值不满足收敛条件时,对池化算子搜索结构中的权重参数a进行调整。
可选地,在上述图4对应的实施例的基础上,本申请实施例提供的池化算子的处理方法另一个可选实施例中,如图6所示,步骤S402将训练样本集合中的训练样本通过池化算子搜索结构,对池化算子搜索结构中的结构模型参数进行调整,包括:
在步骤S601中,获取训练样本的每个特征域中每个特征值对应的第三特征向量;
在步骤S602中,将第三特征向量输入到池化算子搜索结构,得到每个特征域对应的加权池化特征向量;
在步骤S603中,基于每个特征域对应的加权池化特征向量获取验证样本对应的预测值;
在步骤S604中,通过目标损失函数对训练样本的实际值和训练样本的预测值进行计算,得到训练样本对应的预测损失值;
在步骤S605中,在训练样本对应的预测损失值不满足收敛条件时,对池化算子搜索结构中的结构模型参数进行调整。
具体地,基于上述基于AutoML(自动化选择最优池化算子的池化算子搜索结构)选择池化算子的过程(AutoMLPooling),将验证样本集合中的训练样本通过池化算子搜索结构,对池化算子搜索结构中的结构模型参数进行调整,具体可以是通过将训练样本集合中的验证样本输入至推荐模型,先通过特征ID嵌入层获取训练样本的每个特征域中每个特征值对应的第三特征向量,进一步地,将第三特征向量输入到池化算子搜索结构,按照上述步骤2-4)至步骤2-5),基于每个候选池化算子对应的权重参数,以获取到每个特征域对应的加权池化特征向量。
进一步地,可以基于上述公式(7)每个特征域对应的加权池化特征向量获取训练样本对应的预测值,并通过目标损失函数对训练样本的实际值和训练样本的预测值进行计算,以获取到训练样本对应的预测损失值;
进一步地,可以基于上述公式(5)和公式(6)判断训练样本对应的预测损失值是否满足预设的收敛条件,并在满足预设的收敛条件的情况下,停止训练,为每个特征域选择最大权重池化算子,并剔除其他候选池化算子,重新训练推荐模型至收敛;反之,在训练样本对应的预测损失值不满足收敛条件时,对池化算子搜索结构中的权重参数a进行调整。
可选地,在上述图5对应的实施例的基础上,本申请实施例提供的池化算子的处理方法另一个可选实施例中,如图7所示,步骤S502将第二特征向量输入到池化算子搜索结构,得到每个特征域对应的加权池化特征向量,包括:
在步骤S701中,将每个第二特征向量分别经过池化算子搜索空间中的K个候选池化算子进行池化压缩,得到每个特征值对应的K个池化特征向量;
在步骤S702中,基于每个候选池化算子对应的权重参数,对每个特征值对应的K个池化特征向量进行加权求和,得到每个特征域对应的加权池化特征向量。
具体地,如图12上边所示意的参数搜索过程,也是基于上述基于AutoML(自动化选择最优池化算子的池化算子搜索结构)选择池化算子的过程(AutoMLPooling),将第二特征向量输入到池化算子搜索结构,按照上述步骤2-4)对每个第二特征向量分别经过K个候选池化算子进行池化压缩,得到每个候选池化算子(如图12上边所示意的p1,p2,p3)对应的池化特征向量,进一步地可以整合得到每个特征值对应的K个池化特征向量;
进一步地,如图12下边所示意的参数搜索完成后,可以理解为在验证样本对应的预测损失值及训练样本对应的预测损失值均满足预设的收敛条件时,停止训练,按照上述步骤2-6)针对每个特征域,选择权重最大的候选池化算子作为该特征域的最优池化算子(如图12下边所示意的选定池化算子p1),剔除其它候选池化算子,重新对推荐模型进行微调。
可选地,在上述图6对应的实施例的基础上,本申请实施例提供的池化算子的处理方法另一个可选实施例中,如图8所示,步骤S602将第三特征向量输入到池化算子搜索结构,得到每个特征域对应的加权池化特征向量,包括:
在步骤S801中,将每个第三特征向量分别经过池化算子搜索空间中的K个候选池化算子进行池化压缩,得到每个特征值对应的K个池化特征向量;
在步骤S802中,基于每个候选池化算子对应的权重参数,对每个特征值对应的K个池化特征向量进行加权求和,得到每个特征域对应的加权池化特征向量。
具体地,如图12上边所示意的参数搜索过程,也是基于上述基于AutoML(自动化选择最优池化算子的池化算子搜索结构)选择池化算子的过程(AutoMLPooling),将第三特征向量输入到池化算子搜索结构,按照上述步骤2-4)对每个第三特征向量分别经过K个候选池化算子进行池化压缩,得到每个候选池化算子(如图12上边所示意的p1,p2,p3)对应的池化特征向量,进一步地可以整合得到每个特征值对应的K个池化特征向量;
进一步地,如图12下边所示意的参数搜索完成后,可以理解为在验证样本对应的预测损失值及训练样本对应的预测损失值均满足预设的收敛条件时,停止训练,按照上述步骤2-6)针对每个特征域,选择权重最大的候选池化算子作为该特征域的最优池化算子(如图12下边所示意的选定池化算子p1),剔除其它候选池化算子,重新对推荐模型进行微调。
下面对本申请中的池化算子的处理装置进行详细描述,请参阅图14,图14为本申请实施例中池化算子的处理装置的一个实施例示意图,池化算子的处理装置20包括:
获取单元201,用于获取每个目标特征域的中的每个目标特征值对应的第一特征向量;
确定单元202,用于基于池化算子搜索空间,为每个目标特征域匹配目标池化算子,其中,池化算子搜索空间包括K个候选池化算子,目标池化算子为权重值最大的候选池化算子,K为大于等于1的整数;
处理单元203,用于针对于每个目标特征域,将每个目标特征值对应的第一特征向量经过目标池化算子进行池化压缩,得到每个目标特征域对应的目标池化特征向量;
处理单元203,还用于基于每个目标特征域对应的目标池化特征向量进行损失计算,得到目标损失值;
处理单元203,还用于基于目标损失值对推荐模型进行模型参数更新,得到目标推荐模型。
可选地,在上述图14对应的实施例的基础上,本申请实施例提供的池化算子的处理装置的另一实施例中,
处理单元203,还用于基于池化算子搜索空间,使用目标样本集合对推荐模型的池化算子搜索结构进行多轮训练;
确定单元202,还用于当池化算子搜索结构中的结构模型参数以及权重参数满足收敛条件时,从K个候选池化算子中,为目标样本集合中每个特征域选择权重参数最大值对应的候选池化算子作为目标池化算子。
可选地,在上述图14对应的实施例的基础上,本申请实施例提供的池化算子的处理装置的另一实施例中,处理单元203具体可以用于:
将验证样本集合中的验证样本通过池化算子搜索结构,对池化算子搜索结构中的权重参数进行调整;
将训练样本集合中的训练样本通过池化算子搜索结构,对池化算子搜索结构中的结构模型参数进行调整。
可选地,在上述图14对应的实施例的基础上,本申请实施例提供的池化算子的处理装置的另一实施例中,处理单元203具体可以用于:
获取验证样本的每个特征域中每个特征值对应的第二特征向量;
将第二特征向量输入到池化算子搜索结构,得到每个特征域对应的加权池化特征向量;
基于每个特征域对应的加权池化特征向量获取验证样本对应的预测值;
通过目标损失函数对验证样本的实际值和验证样本的预测值进行计算,得到验证样本对应的预测损失值;
在验证样本对应的预测损失值不满足收敛条件时,对池化算子搜索结构中的权重参数进行调整。
可选地,在上述图14对应的实施例的基础上,本申请实施例提供的池化算子的处理装置的另一实施例中,处理单元203具体可以用于:
获取训练样本的每个特征域中每个特征值对应的第三特征向量;
将第三特征向量输入到池化算子搜索结构,得到每个特征域对应的加权池化特征向量;
基于每个特征域对应的加权池化特征向量获取验证样本对应的预测值;
通过目标损失函数对训练样本的实际值和训练样本的预测值进行计算,得到训练样本对应的预测损失值;
在训练样本对应的预测损失值不满足收敛条件时,对池化算子搜索结构中的结构模型参数进行调整。
可选地,在上述图14对应的实施例的基础上,本申请实施例提供的池化算子的处理装置的另一实施例中,处理单元203具体可以用于:
将每个第二特征向量分别经过池化算子搜索空间中的K个候选池化算子进行池化压缩,得到每个特征值对应的K个池化特征向量;
基于每个候选池化算子对应的权重参数,对每个特征值对应的K个池化特征向量进行加权求和,得到每个特征域对应的加权池化特征向量。
可选地,在上述图14对应的实施例的基础上,本申请实施例提供的池化算子的处理装置的另一实施例中,处理单元203具体可以用于:
将每个第三特征向量分别经过池化算子搜索空间中的K个候选池化算子进行池化压缩,得到每个特征值对应的K个池化特征向量;
基于每个候选池化算子对应的权重参数,对每个特征值对应的K个池化特征向量进行加权求和,得到每个特征域对应的加权池化特征向量。
本申请另一方面提供了另一种计算机设备示意图,如图15所示,图15是本申请实施例提供的一种计算机设备结构示意图,该计算机设备300可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)310(例如,一个或一个以上处理器)和存储器320,一个或一个以上存储应用程序331或数据332的存储介质330(例如一个或一个以上海量存储设备)。其中,存储器320和存储介质330可以是短暂存储或持久存储。存储在存储介质330的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对计算机设备300中的一系列指令操作。更进一步地,中央处理器310可以设置为与存储介质330通信,在计算机设备300上执行存储介质330中的一系列指令操作。
计算机设备300还可以包括一个或一个以上电源340,一个或一个以上有线或无线网络接口350,一个或一个以上输入输出接口360,和/或,一个或一个以上操作系统333,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述计算机设备300还用于执行如图2至图8对应的实施例中的步骤。
本申请的另一方面提供了一种计算机可读存储介质,其上存储有计算机程序,当计算机程序被处理器执行时实现如图2至图8所示实施例描述的方法中的步骤。
本申请的另一方面提供了一种包含计算机程序的计算机程序产品,当计算机程序被处理器执行时实现如图2至图8所示实施例描述的方法中的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (11)
1.一种池化算子的处理方法,其特征在于,包括:
获取每个目标特征域的中的每个目标特征值对应的第一特征向量;
基于池化算子搜索空间,为每个所述目标特征域匹配目标池化算子,其中,所述池化算子搜索空间包括K个候选池化算子,所述目标池化算子为权重值最大的候选池化算子,所述K为大于等于1的整数;
针对于每个所述目标特征域,将每个所述目标特征值对应的第一特征向量经过所述目标池化算子进行池化压缩,得到每个所述目标特征域对应的目标池化特征向量;
基于每个所述目标特征域对应的目标池化特征向量进行损失计算,得到目标损失值;
基于所述目标损失值对推荐模型进行模型参数更新,得到目标推荐模型。
2.根据权利要求1所述的方法,其特征在于,所述基于池化算子搜索空间,为每个所述目标特征域匹配目标池化算子之前,所述方法还包括:
基于所述池化算子搜索空间,使用目标样本集合对所述推荐模型的池化算子搜索结构进行多轮训练;
当所述池化算子搜索结构中的结构模型参数以及权重参数满足收敛条件时,从K个所述候选池化算子中,为所述目标样本集合中每个特征域选择权重参数最大值对应的候选池化算子作为目标池化算子。
3.根据权利要求2所述的方法,其特征在于,所述目标样本集合包括验证样本集合和训练样本集合;
所述基于所述池化算子搜索空间,使用目标样本集合对所述推荐模型的池化算子搜索结构进行多轮训练,包括:
将所述验证样本集合中的验证样本通过所述池化算子搜索结构,对所述池化算子搜索结构中的权重参数进行调整;
将所述训练样本集合中的训练样本通过所述池化算子搜索结构,对所述池化算子搜索结构中的结构模型参数进行调整。
4.根据权利要求3所述的方法,其特征在于,所述将所述验证样本集合中的验证样本通过所述池化算子搜索结构,对所述池化算子搜索结构中的权重参数进行调整,包括:
获取所述验证样本的每个特征域中每个特征值对应的第二特征向量;
将所述第二特征向量输入到所述池化算子搜索结构,得到所述每个特征域对应的加权池化特征向量;
基于每个所述特征域对应的加权池化特征向量获取所述验证样本对应的预测值;
通过所述目标损失函数对所述验证样本的实际值和所述验证样本的预测值进行计算,得到所述验证样本对应的预测损失值;
在所述验证样本对应的预测损失值不满足所述收敛条件时,对所述池化算子搜索结构中的权重参数进行调整。
5.根据权利要求3所述的方法,其特征在于,所述将所述训练样本集合中的训练样本通过所述池化算子搜索结构,对所述池化算子搜索结构中的结构模型参数进行调整,包括:
获取所述训练样本的每个特征域中每个特征值对应的第三特征向量;
将所述第三特征向量输入到所述池化算子搜索结构,得到所述每个特征域对应的加权池化特征向量;
基于每个所述特征域对应的加权池化特征向量获取所述验证样本对应的预测值;
通过所述目标损失函数对所述训练样本的实际值和所述训练样本的预测值进行计算,得到所述训练样本对应的预测损失值;
在所述训练样本对应的预测损失值不满足所述收敛条件时,对所述池化算子搜索结构中的结构模型参数进行调整。
6.根据权利要求4所述的方法,其特征在于,所述将所述第二特征向量输入到所述池化算子搜索结构,得到所述每个特征域对应的加权池化特征向量,包括:
将每个所述第二特征向量分别经过所述池化算子搜索空间中的K个所述候选池化算子进行池化压缩,得到每个所述特征值对应的K个池化特征向量;
基于每个所述候选池化算子对应的权重参数,对每个所述特征值对应的K个池化特征向量进行加权求和,得到每个特征域对应的加权池化特征向量。
7.根据权利要求5所述的方法,其特征在于,所述将所述第三特征向量输入到所述池化算子搜索结构,得到所述每个特征域对应的加权池化特征向量,包括:
将每个所述第三特征向量分别经过所述池化算子搜索空间中的K个所述候选池化算子进行池化压缩,得到每个所述特征值对应的K个池化特征向量;
基于每个所述候选池化算子对应的权重参数,对每个所述特征值对应的K个池化特征向量进行加权求和,得到每个特征域对应的加权池化特征向量。
8.一种池化算子的处理装置,其特征在于,包括:
获取单元,用于获取每个目标特征域的中的每个目标特征值对应的第一特征向量;
确定单元,用于基于池化算子搜索空间,为每个所述目标特征域匹配目标池化算子,其中,所述池化算子搜索空间包括K个候选池化算子,所述目标池化算子为权重值最大的候选池化算子,所述K为大于等于1的整数;
处理单元,用于针对于每个所述目标特征域,将每个所述目标特征值对应的第一特征向量经过所述目标池化算子进行池化压缩,得到每个所述目标特征域对应的目标池化特征向量;
所述处理单元,还用于基于每个所述目标特征域对应的目标池化特征向量进行损失计算,得到目标损失值;
所述处理单元,还用于基于所述目标损失值对推荐模型进行模型参数更新,得到目标推荐模型。
9.一种计算机设备,包括存储器、处理器以及总线系统,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤;
所述总线系统用于连接所述存储器以及所述处理器,以使所述存储器以及所述处理器进行通信。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
11.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210655564.3A CN115130561A (zh) | 2022-06-10 | 2022-06-10 | 池化算子的处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210655564.3A CN115130561A (zh) | 2022-06-10 | 2022-06-10 | 池化算子的处理方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115130561A true CN115130561A (zh) | 2022-09-30 |
Family
ID=83378168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210655564.3A Pending CN115130561A (zh) | 2022-06-10 | 2022-06-10 | 池化算子的处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115130561A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116747521A (zh) * | 2023-08-17 | 2023-09-15 | 腾讯科技(深圳)有限公司 | 控制智能体进行对局的方法、装置、设备及存储介质 |
-
2022
- 2022-06-10 CN CN202210655564.3A patent/CN115130561A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116747521A (zh) * | 2023-08-17 | 2023-09-15 | 腾讯科技(深圳)有限公司 | 控制智能体进行对局的方法、装置、设备及存储介质 |
CN116747521B (zh) * | 2023-08-17 | 2023-11-03 | 腾讯科技(深圳)有限公司 | 控制智能体进行对局的方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111931062B (zh) | 一种信息推荐模型的训练方法和相关装置 | |
CN108694225A (zh) | 一种图像搜索方法、特征向量的生成方法、装置及电子设备 | |
CN116756574B (zh) | 多模态预训练模型的训练方法、使用方法、装置和设备 | |
CN111506820B (zh) | 推荐模型、方法、装置、设备及存储介质 | |
CN111046275A (zh) | 基于人工智能的用户标签确定方法及装置、存储介质 | |
CN110414581B (zh) | 图片检测方法和装置、存储介质及电子装置 | |
CN114329029B (zh) | 对象检索方法、装置、设备及计算机存储介质 | |
CN113641811B (zh) | 促进购买行为的会话推荐方法、系统、设备及存储介质 | |
CN111291170A (zh) | 一种基于智能客服的会话推荐方法及相关装置 | |
CN113391992B (zh) | 测试数据的生成方法和装置、存储介质及电子设备 | |
CN113641797A (zh) | 数据处理方法、装置、设备、存储介质及计算机程序产品 | |
CN115129883B (zh) | 实体链接方法和装置、存储介质及电子设备 | |
CN112084307A (zh) | 一种数据处理方法、装置、服务器及计算机可读存储介质 | |
CN117711001B (zh) | 图像处理方法、装置、设备和介质 | |
CN111897943A (zh) | 会话记录搜索方法、装置、电子设备及存储介质 | |
CN115130561A (zh) | 池化算子的处理方法、装置、设备及存储介质 | |
CN115131058A (zh) | 账号识别方法、装置、设备及存储介质 | |
CN110516153B (zh) | 视频的智能推送方法和装置、存储介质及电子装置 | |
CN116956996A (zh) | 数据处理方法、装置、介质及设备 | |
CN113705247B (zh) | 主题模型效果评估方法、装置、设备、存储介质和产品 | |
CN116957128A (zh) | 业务指标预测方法、装置、设备和存储介质 | |
CN111935259B (zh) | 目标帐号集合的确定方法和装置、存储介质及电子设备 | |
CN114625986A (zh) | 对搜索结果进行排序的方法、装置、设备及存储介质 | |
CN112749711B (zh) | 视频获取方法和装置及存储介质 | |
CN110727705A (zh) | 信息推荐方法、装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20221124 Address after: 100084 No. 1 Tsinghua Yuan, Beijing, Haidian District Applicant after: TSINGHUA University Applicant after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. Address before: 518057 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 floors Applicant before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. |
|
TA01 | Transfer of patent application right |