CN116151392B - 训练样本生成方法、训练方法、推荐方法以及装置 - Google Patents

训练样本生成方法、训练方法、推荐方法以及装置 Download PDF

Info

Publication number
CN116151392B
CN116151392B CN202310176896.8A CN202310176896A CN116151392B CN 116151392 B CN116151392 B CN 116151392B CN 202310176896 A CN202310176896 A CN 202310176896A CN 116151392 B CN116151392 B CN 116151392B
Authority
CN
China
Prior art keywords
resource
initial
attribute
information
evaluation information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310176896.8A
Other languages
English (en)
Other versions
CN116151392A (zh
Inventor
孙桐霖
卢玉奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202310176896.8A priority Critical patent/CN116151392B/zh
Publication of CN116151392A publication Critical patent/CN116151392A/zh
Application granted granted Critical
Publication of CN116151392B publication Critical patent/CN116151392B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本公开提供了训练样本生成方法、训练方法、推荐方法以及装置,涉及数据处理技术领域,尤其涉及人工智能技术领域和大数据技术领域。具体实现方案为:对多个初始资源各自对应的资源属性信息进行属性特征提取,得到初始资源属性特征;基于进化算法处理初始资源属性特征,得到与初始资源对应的目标评估信息;根据目标评估信息,确定初始资源的样本标签;以及根据样本标签和与样本标签对应的资源属性信息,生成训练样本。

Description

训练样本生成方法、训练方法、推荐方法以及装置
技术领域
本公开涉及数据处理技术领域,尤其涉及人工智能技术领域和大数据技术领域。
背景技术
随着互联网技术的快速发展,用户可以通过手机、平板电脑等终端设备便捷地浏览视频、图片等资源信息。相关应用服务资源也会在用户授权的情况下,通过分析用户的偏好信息等数据信息向用户推荐更加贴近用户需求的资源信息,以满足用户需求。
发明内容
本公开提供了一种训练样本生成方法、训练方法、推荐方法、装置、电子设备、存储介质及程序产品。
根据本公开的一方面,提供了一种训练样本生成方法,包括:对多个初始资源各自对应的资源属性信息进行属性特征提取,得到初始资源属性特征;基于进化算法处理所述初始资源属性特征,得到与所述初始资源对应的目标评估信息;根据所述目标评估信息,确定所述初始资源的样本标签;以及根据所述样本标签和与所述样本标签对应的资源属性信息,生成训练样本。
根据本公开的另一方面,提供了一种深度学习模型的训练方法,包括:获取训练样本,其中,所述训练样本为根据如上所述的训练样本生成方法得到的,所述训练样本包括与样本资源对应的资源属性信息,以及与所述样本资源对应的样本标签;利用所述资源属性信息和所述样本标签,训练初始深度学习模型,得到训练后的深度学习模型。
根据本公开的另一方面,提供了一种资源推荐方法,包括:获取待推荐资源,以及与所述待推荐资源对应的资源属性信息;将所述资源属性信息输入至深度学习模型中,输出所述待推荐资源的资源评价信息;以及基于所述资源评价信息,向目标对象推荐所述待推荐资源;其中,所述深度学习模型是利用根据如上所述的训练方法训练得到的。
根据本公开的另一方面,提供了一种训练样本生成装置,包括:属性特征提取模块,用于对多个初始资源各自对应的资源属性信息进行属性特征提取,得到初始资源属性特征;进化算法处理模块,用于基于进化算法处理所述初始资源属性特征,得到与所述初始资源对应的目标评估信息;样本标签确定模块,用于根据所述目标评估信息,确定所述初始资源的样本标签;以及训练样本生成模块,用于根据所述样本标签和与所述样本标签对应的资源属性信息,生成训练样本。
根据本公开的另一方面,提供了一种深度学习模型的训练装置,包括:训练样本获取模块,用于获取训练样本,其中,所述训练样本为根据如上所述的训练样本生成方法得到的,所述训练样本包括与样本资源对应的资源属性信息,以及与所述样本资源对应的样本标签;训练模块,用于利用所述资源属性信息和所述样本标签,训练初始深度学习模型,得到训练后的深度学习模型。
根据本公开的另一方面,提供了一种资源推荐装置,包括:待推荐资源获取模块,用于获取待推荐资源,以及与所述待推荐资源对应的资源属性信息;资源评价信息确定模块,用于将所述资源属性信息输入至深度学习模型中,输出所述待推荐资源的资源评价信息;以及推荐模块,用于基于所述资源评价信息,向目标对象推荐所述待推荐资源;其中,所述深度学习模型是利用根据如上所述的深度学习模型的训练方法训练得到的。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如上所述的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1示意性示出了根据本公开实施例的可以应用训练样本生成方法及装置的示例性系统架构;
图2示意性示出了根据本公开实施例的训练样本生成方法的流程图;
图3示意性示出了根据本公开实施例的训练样本生成方法的应用场景图;
图4示意性示出了根据本公开实施例的对多个初始资源各自对应的资源属性信息进行属性特征提取,得到初始资源属性特征的流程图;
图5示意性示出了根据本公开另一实施例的训练样本生成方法的应用场景图;
图6示意性示出了根据本公开实施例的深度学习模型的训练方法的流程图;
图7示意性示出了根据本公开实施例的资源推荐方法的流程图;
图8示意性示出了根据本公开实施例的训练样本生成装置的框图;
图9示意性示出了根据本公开实施例的深度学习模型的训练装置的框图;
图10示意性示出了根据本公开实施例的资源推荐装置的框图;以及
图11示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
在实现本公开的发明构思过程中,发明人发现相关技术中用于向用户推荐视频等资源的资源推荐模型的推荐准确率较低,难以满足用户的需求。同时发明人发现,用于训练资源推荐模型的训练样本通常需要耗费大量时间来进行样本标签的标注,且样本标签标注的准确率较低,这将导致资源推荐模型的训练效果较差,难以实现准确地向用户推荐符合其需求的资源信息。
本公开提供了训练样本生成方法、训练方法、推荐方法、装置、电子设备、存储介质及程序产品。
根据本公开的实施例,训练样本生成方法包括:对多个初始资源各自对应的资源属性信息进行属性特征提取,得到初始资源属性特征;基于进化算法处理初始资源属性特征,得到与初始资源对应的目标评估信息;根据目标评估信息,确定初始资源的样本标签;以及根据样本标签和与样本标签对应的资源属性信息,生成训练样本。
根据本公开的实施例,通过基于进化算法处理从资源属性信息中提取的初始资源属性特征,可以实现初始资源属性特征的不断进化,以提升初始资源属性特征表征资源属性信息的精确性,根据不断进化的资源属性特征来确定目标评估信息,可以使目标评估信息更加准确的表征初始资源各自的资源属性,从而根据目标评估信息来生成样本标签,并进一步生成训练样本,可以实现样本标签标注的精准程度,提升训练样本的样本质量,进而提升相关资源推荐模型的训练效果。从而根据该训练样本训练得到的相关资源推荐模型,可以提升资源推荐的准确性,满足用户的实际需求。
图1示意性示出了根据本公开实施例的可以应用训练样本生成方法及装置的示例性系统架构。
需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。例如,在另一实施例中,可以应用训练样本生成方法及装置的示例性系统架构可以包括终端设备,但终端设备可以无需与服务器进行交互,即可实现本公开实施例提供的训练样本生成方法及装置。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如知识阅读类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的内容提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的训练样本生成方法一般可以由服务器105执行。相应地,本公开实施例所提供的训练样本生成装置一般可以设置于服务器105中。本公开实施例所提供的训练样本生成方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的训练样本生成装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
或者,本公开实施例所提供的训练样本生成方法一般也可以由终端设备101、102、或103执行。相应地,本公开实施例所提供的训练样本生成装置也可以设置于终端设备101、102、或103中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本公开实施例的训练样本生成方法的流程图。
如图2所示,该训练样本生成方法包括操作S210~S240。
操作S210,对多个初始资源各自对应的资源属性信息进行属性特征提取,得到初始资源属性特征。
操作S220,基于进化算法处理初始资源属性特征,得到与初始资源对应的目标评估信息。
操作S230,根据目标评估信息,确定初始资源的样本标签。
操作S240,根据样本标签和与样本标签对应的资源属性信息,生成训练样本。
根据本公开的实施例,初始资源可以包括任意类型的资源,例如视频资源、图像资源、文本资源、应用资源等等,本公开的实施例对初始资源的类型不做限定,本领域技术人员可以根据实际需求进行选择。
根据本公开的实施例,资源属性信息可以包括资源所具有的属性,例如在初始资源为视频资源的情况下,资源属性信息可以包括视频资源的分辨率、视频时长等资源属性信息。但不仅限于此,还可以包括视频资源的播放流畅度等其他类型的资源属性信息。相应地,其他类型初始资源还可以具有与该类型对应的资源属性信息,例如图像资源的水印位置、文本资源的乱码程度等等,本公开的实施例对资源所具有的属性不做限定,本领域技术人员可以根据实际需求进行选择。
根据本公开的实施例,资源属性信息还可以包括基于相关用户操作生成的属性信息,例如基于相关用户的关注操作、点赞操作、屏蔽操作、播放操作生成的关注数量、点赞数量、屏蔽数量、播放时长等。需要说明的是,可以基于任意类型的用户操作来生成相应的资源属性信息,本公开的实施例对生成资源属性信息的用户操作的类型不做限定,本领域技术人员可以根据实际需求进行选择。
根据本公开的实施例,初始资源属性特征可以包括能够表征资源属性信息的数值、向量、标识等任意类型的特征信息。可以基于相关算法来实现属性特征提取,例如基于相似度算法、神经网络算法等,本公开的实施例对属性特征提取的具体算法不做限定,本领域技术人员可以根据实际需求进行选择。
根据本公开的实施例,基于进化算法处理初始资源属性特征,可以使初始资源属性特征被优化为更精确表征资源属性信息的资源属性特征,从而根据被优化后的(即进化后的)资源属性特征生成的目标评估信息,可以精确地表征初始资源的资源属性。
根据本公开的实施例,可以基于相关技术中的任意方式来处理目标评估信息,进而确定初始资源的样本标签。例如可以基于目标评估信息与评估阈值的比较来确定样本标签,但不仅限于此,还可以基于多个初始资源各自的目标评估信息来排序,并根据排序结果来确定样本标签,或者还可以基于目标评估信息查询相关查询表,以获取对应的样本标签。本公开的实施例对确定样本标签的具体方式不做限定,本领域技术人员可以根据实际需求进行选择。
根据本公开的实施例,通过基于进化算法处理从资源属性信息中提取的初始资源属性特征,可以实现初始资源属性特征的不断进化,以提升初始资源属性特征表征资源属性信息的精确性,根据不断进化的资源属性特征来确定目标评估信息,可以使目标评估信息更加准确的表征初始资源各自的资源属性,从而根据目标评估信息来生成样本标签,并进一步生成训练样本,可以实现样本标签标注的精准程度,提升训练样本的样本质量,进而提升相关资源推荐模型的训练效果。从而根据该训练样本训练得到的相关资源推荐模型,可以提升资源推荐的准确性,满足用户的实际需求。
需要说明的是,在本公开的任意实施例中,对初始资源、资源属性信息等信息的获取是经过了相关用户或其他对象授权后进行的,或者通过其他合法合规的方式获取对初始资源、资源属性信息等信息,例如基于公开数据库来获取初始资源、资源属性信息等信息,信息处理过程已提前告知相关用户或授权机构,且处理过程采取必要的保密措施,例如采用去标识化处理,随机编码标识处理。同时生成的训练样本的用途符合相关法律法规的要求,且不违背公序良俗。
根据本公开的实施例,资源属性信息可以包括以下至少一项:
资源质量属性信息、资源偏好属性信息。
根据本公开的实施例,资源质量属性信息可以包括能够表征初始资源的质量属性的相关信息,例如视频资源的播放时长信息、视频分辨率信息、历史关注度信息、历史评分信息等等,本公开的实施例对资源质量属性信息的具体类型不做限定,本领域技术人员可以根据实际需求进行选择,只要能够表征资源的质量属性即可。
根据本公开的实施例,通过对包含有资源质量属性信息的资源属性信息进行属性特征提取,并基于进化算法处理包含有资源质量属性特征的资源属性特征,可以进一步保障得到目标评估信息是在充分考虑多个初始资源各自的资源质量属性的条件下生成的,因此目标评估信息可以充分反映初始资源各自的质量属性,使后续的样本标签可以真实体现初始资源各自的质量,以避免将质量较差的,劣质的资源确定为评分较高的样本标签,从而实现提升后续的资源推荐模型的训练效果,提升资源推荐准确性。
根据本公开的实施例,资源偏好属性信息可以包括用户等目标对象对于初始资源的评价、关注、点赞等正面偏好属性信息,还可以包括屏蔽、举报等负面偏好属性信息。
应该理解的是,资源偏好属性信息和/或资源质量属性信息可以根据相关算法来进行归一化处理,实现资源属性信息的预处理过程,以消除不同类型的属性信息之间的数量级差异,减少后续生成的目标评估信息的误差。相应地,还可以基于相关编码方法来对资源属性信息进行预处理,本公开的实施例对资源属性信息的预处理方式不做限定。
根据本公开的实施例,进化算法包括以下至少一项:
遗传算法、进化策略算法、进化编程算法、遗传编程算法。
根据本公开的实施例,可以基于相关技术中的进化算法来不断迭代生成进化后的资源属性特征,进化迭代的频次可以基于预设频次确定,或者还可以基于后续目标评估信息的收敛情况来确定,本公开的实施例对确定进化迭代的频次的具体方式不做限定,本领域技术人员可以根据实际需求进行选择。
根据本公开的实施例,操作S210中,对多个初始资源各自对应的资源属性信息进行属性特征提取,得到初始资源属性特征可以包括如下操作。
将与初始资源对应的资源属性信息输入至机器学习模型的属性特征提取层,输出初始资源属性特征。
根据本公开的实施例,属性特征提取层可以基于神经网络算法构建得到,例如可以基于卷积神经网络算法构建属性特征提取层,但不仅限于此,还可以基于其他类型的神经网络算法构建属性特征提取层,本公开的实施例对构建属性特征提取层的具体算法类型不做限定,本领域技术人员可以根据实际需求进行选择。
根据本公开的实施例,属性特征提取层可以基于循环神经网络构建得到的,但不仅限于此还可以基于长短期记忆网络、门控循环网络等其他类型的神经网络层构建得到。在资源属性信息包含有时序性信息的情况下,通过属性特征提取层来提取得到的初始资源属性特征可以更加准确地表征资源属性信息中的时序属性,从而避免初始资源属性特征的信息丢失问题,进而提升后续确定的目标评估信息的精确程度。
根据本公开的实施例,操作S220中,基于进化算法处理初始资源属性特征,得到与初始资源对应的目标评估信息可以包括如下操作。
基于进化算法,对初始资源属性特征执行N次迭代操作,得到N个评估信息,N为大于1的整数;以及根据N个评估信息,确定与初始资源对应的目标评估信息。
其中,N次迭代操作中的第n次迭代操作可以包括如下操作。
根据初始资源的第n-1资源变异属性特征执行第n变异操作,得到第n资源变异属性特征;以及根据第n资源变异属性特征,确定初始资源的第n评估信息,其中,n大于1且小于等于N。
根据本公开的实施例,变异操作可以包括相关进化算法中用于对种群进行的变异处理操作,例如基于高斯噪声的变异处理操作,或者基于随机规则修改资源变异属性特征中的部分编码特征信息的变异处理操作。通过N次迭代操作,生成的进化后的N个资源变异属性特征可以相对于初始资源属性特征产生一定程度的变异,进而根据N个资源变异属性特征各自确定对应的评估信息来生成目标评估信息,使目标评估信息综合考虑多个资源变异属性特征所表征的资源属性信息,实现评估信息的去趋势化,实现对于初始资源的高精度评估。
在本公开的一个实施例中,可以基于全连接网络层来处理N个评估信息,确定与初始资源对应的目标评估信息。
在本公开的另一个实施例中,可以基于N个评估信息与各自的权重参数的乘积,来确定目标评估信息,以提升针对目标评估信息的计算精度。
根据本公开的实施例,N次迭代操作中的第1次迭代操作包括如下操作。
对初始资源属性特征执行第1变异操作,得到第1资源变异属性特征;以及根据第1资源变异属性特征,确定初始资源的第1评估信息。
在本公开的另一个实时例中,还可以基于第N评估信息,以及根据初始资源属性特征生成的初始评估信息来确定目标评估信息,以重点考虑N次进化后的第n资源变异属性特征所表征的资源属性与初始资源属性特征之间的差异,提升目标评估信息的生成效率和对于初始资源的评估效率。
图3示意性示出了根据本公开实施例的基于进化算法处理初始资源属性特征,得到与初始资源对应的目标评估信息的应用场景图。
如图3所示,该应用场景300中,可以包括初始资源属性特征310。该初始资源属性特征310可以是基于属性特征提取层对资源属性信息进行属性特征提取后得到的。
将初始资源属性特征310输入至第1变异层321,可以基于第1变异层321对初始资源属性特征310执行第1变异操作,生成第1资源变异属性特征311。该第1变异操作例如可以是基于相关变异策略确定的,例如翻转初始资源属性特征310的部分字符,或者替换初始资源属性特征310中的部分矩阵元素,或者还可以是基于高斯噪声对初始资源属性特征310进行扰动来实现第1变异操作。
将第1资源变异属性特征311输入至评估信息检测层331,输出初始资源的第1评估信息341,从而实现第1次迭代操作。
需要说明的是,在第1资源变异属性特征311为特征向量的情况下,评估信息检测层331可以基于相关技术中的激活函数来构建得到,从而实现对第1资源变异属性特征311的评估,生成第1评估信息341。
相应地,初始资源属性特征310也可以输入至评估信息检测层331,输出初始资源的初始评估信息340。
基于相同或相似的方式,可以将第1资源变异属性特征311输入至第2变异层322,输出第2资源变异属性特征312。第2资源变异属性特征312输入至评估信息检测层331,输出初始资源的第2评估信息342,从而实现第2次迭代操作。将第2资源变异属性特征312输入至第3变异层323,可以输出第3资源变异属性特征313。第3资源变异属性特征313输入至评估信息检测层331,输出初始资源的第3评估信息343,从而实现第3次迭代操作。
需要说明的是,第2变异层322和/或第3变异层323可以与第1变异层321基于相同或相似的方式来执行变异操作,本公开的实施例在此不再赘述。
在预设迭代频次为3的情况下,即设定N=3的情况下,可以停止迭代操作。并将初始评估信息340、第1评估信息341、第2评估信息342和第3评估信息343输入至目标评估信息输出层351,输出初始资源的目标评估信息360。
目标评估信息输出层351可以基于加权算法来构建得到,对初始评估信息340、第1评估信息341、第2评估信息342和第3评估信息343分别设置对应的权重参数,并可以基于加权算法计算得到目标评估信息360。
根据本公开的实施例,通过对初始评估信息340、第1评估信息341、第2评估信息342和第3评估信息343分别设置相应的权重参数,实现对于初始资源的综合评估,可以提升目标评估信息的计算精度,进而提升针对初始资源的评估准确性,实现提升样本标签的生成精度的技术效果。
图4示意性示出了根据本公开实施例的对多个初始资源各自对应的资源属性信息进行属性特征提取,得到初始资源属性特征的流程图。
如图4所示,操作S210中,对多个初始资源各自对应的资源属性信息进行属性特征提取,得到初始资源属性特征包括操作S410~S430。
操作S410,确定初始资源集中,具有目标属性类型的目标资源属性信息,其中,初始资源集包括多个初始资源。
操作S420,根据目标资源属性信息,以及与目标属性类型对应的初始评估权重参数,确定与目标属性类型对应的初始资源属性特征元素。
操作S430,基于初始资源属性特征元素,确定与初始资源集对应的初始资源属性特征。
根据本公开的实施例,通过将多个初始资源确定为初始资源集,并根据多个初始资源各自具有相同的目标属性类型的目标资源属性信息,可以生成该初始资源集的目标资源集属性信息。例如,多个初始资源各自具有的目标属性类型可以为资源质量评分类型,通过将多个初始资源各自的资源质量评分累加,生成该初始资源集的资源质量评分类型的目标资源集属性信息。在获取目标资源集属性信息的情况下,可以将初始评估权重参数与目标资源集属性信息的乘积作为初始资源属性特征元素。
根据本公开的实施例,还可以基于相关技术中的计算标准差算法、累加算法等算法来处理多个初始资源各自的目标资源属性信息和初始评估权重参数,进而得到初始资源属性特征元素。
需要说明的是,本公开的实施例对确定初始转属性特征元素的具体方式不做限定,本领域技术人员可以根据实际需求进行选择。
根据本公开的实施例,不同的目标属性类型可以对应有不同的初始评估权重参数,例如基于专家经验对不同的目标属性类型设置对应的初始评估权重参数。或者不同的目标属性类型也可以对应有相同的初始评估权重参数,本公开的实施例对初始权重参数的具体设定方式不做限定,本领域技术人员可以根据实际需求进行选择。
根据本公开的实施例,在初始资源集对应有多个目标属性类型的情况下,多个目标属性类型各自对应的初始资源属性特征元素可以构建为向量、数组等格式的初始资源属性特征。在初始资源集仅对应有一个目标属性类型的情况下,该初始资源属性特征元素可以确定为初始资源属性特征。
根据本公开的实施例,操作S220中,基于进化算法处理初始资源属性特征,得到与初始资源对应的目标评估信息可以包括如下操作。
基于进化算法,对初始资源属性特征执行M次迭代操作,得到M个样本集评估信息,其中,M为大于1的整数;以及根据M个样本集评估信息,确定与初始资源集对应的目标评估信息。
其中,M次迭代操作中的第m次迭代操作可以包括如下操作。
对与初始资源集对应的第m-1变异评估权重参数执行第m变异操作,得到第m变异评估权重参数;根据第m变异评估权重参数,确定第m资源变异属性特征;以及根据第m资源变异属性特征,确定初始资源集的第m样本集评估信息,其中,m大于1且小于等于M。
根据本公开的实施例,通过对迭代操作依次进化出M个变异评估权重参数,并进一步基于M个变异评估权重参数生成与变异评估权重参数各自对应的资源变异属性特征,可以实现根据初始资源集各自的资源属性信息按照目标属性类型进行分类,并针对初始资源集中的目标属性类型来确定该目标属性类型对应的资源变异属性特征元素,进而通过变异评估权重参数来综合处理该初始资源集的一个或多个资源变异属性特征元素,生成资源变异属性特征。
根据本公开的实施例,与初始资源集对应的目标评估信息可以用于表征该初始资源集中多个初始资源各自的目标评估信息,或者还可以基于预设的权重参数来根据与初始资源集对应的目标评估信息,生成多个初始资源各自的目标评估信息。通过生成与初始资源集对应的目标评估信息,可以对不同的目标属性类型的目标资源属性信息进行评估,并从初始资源集的整体来评估多个初始资源,使生成的目标评估信息更贴近相关被推荐对象对于待推荐资源的评估标准,以提升训练样本的精确度,进而实现提升资源推荐模型的训练效果,以及提升资源推荐准确性的技术效果。
根据本公开的实施例,M次迭代操作中的第1次迭代操作可以包括如下操作。
对初始资源属性特征中的初始评估权重参数执行第1变异操作,得到第1变异评估权重参数;根据第1变异评估权重参数,确定第1资源变异属性特征;以及根据第1资源变异属性特征,确定初始资源集的第1样本集评估信息。
图5示意性示出了根据本公开另一实施例的训练样本生成方法的应用场景图。
如图5所示,该应用场景500中可以包括初始资源属性特征5100。该初始资源属性特征5100可以包含有初始评估权重参数A和初始评估权重参数B,以及与初始评估权重参数A和初始评估权重参数B各自对应的目标资源集属性信息X和目标资源集属性信息Y。目标资源集属性信息X可以是初始资源集中多个初始资源各自对应的具有质量属性类型的目标资源属性信息累加后得到的,相应地,目标资源集属性信息Y可以是初始资源集中多个初始资源各自对应的具有关注属性类型的目标资源属性信息累加后得到的。
初始评估权重参数A和目标资源集属性信息X可以构成初始资源属性特征元素5101,初始评估权重参数B和目标资源集属性信息Y可以构成初始资源属性特征元素5102。初始资源属性特征元素5101和初始资源属性特征元素5102可以确定为与初始资源集对应的初始资源属性特征5100。
将初始资源属性特征5100中的初始评估权重参数A和初始评估权重参数B输入至第1变异层521,可以基于第1变异层521对初始评估权重参数A和初始评估权重参数B分别执行第1变异操作,生成第1变异评估权重参数A1和第1变异评估权重参数A2。根据第1变异评估权重参数A1和第1变异评估权重参数A2,可以确定第1资源变异属性特征5110,该第1资源变异属性特征5110可以包含有第1资源变异属性特征元素5111和第1资源变异属性特征元素5112。该第1变异操作例如可以是基于高斯噪声对初始评估权重参数A和初始评估权重参数B进行扰动来实现。
将第1资源变异属性特征5110输入至样本集评估信息检测层531,输出初始资源集的第1样本集评估信息541,从而实现第1次迭代操作。
样本集评估信息检测层531可以基于如下公式(1)来确定。
A1×X+B1×Y;(1)
公式(1)中,A1表示第1变异评估权重参数,X表示与第1变异评估权重参数A1对应的目标资源集属性信息;B1表示第1变异评估权重参数,Y表示与第1变异评估权重参数B1对应的目标资源集属性信息。
基于相同或相似的方式,可以将第1资源变异属性特征5110中,第1变异评估权重参数A1和第1变异评估权重参数A2输入至第2变异层522,输出第2变异评估权重参数A2和第2变异评估权重参数B2。根据第2变异评估权重参数A2和目标资源集属性信息X可以确定第2资源变异属性特征元素5121;根据第2变异评估权重参数B2和目标资源集属性信息Y可以确定第2资源变异属性特征元素5122。根据第2资源变异属性特征元素5121和第2资源变异属性特征元素5122可以确定第2资源变异属性特征5120。将第2资源变异属性特征5120输入至样本集评估信息检测层531,输出初始资源集的第2样本集评估信息542,从而实现第2次迭代操作。
将第2资源变异属性特征5120中,第2变异评估权重参数A2和第2变异评估权重参数B2输入至第3变异层523,可以输出第3变异评估权重参数A3和第3变异评估权重参数B3。根据第3变异评估权重参数A3和目标资源集属性信息X可以确定第3资源变异属性特征元素5131;根据第3变异评估权重参数B3和目标资源集属性信息Y可以确定第3资源变异属性特征元素5132。根据第3资源变异属性特征元素5131和第3资源变异属性特征元素5132可以确定第3资源变异属性特征5130。将第3资源变异属性特征5130输入至样本集评估信息检测层531,输出初始资源集的第3样本集评估信息543,从而实现第3次迭代操作。
需要说明的是,第2变异层522和/或第3变异层523可以与第1变异层521基于相同或相似的方式来执行变异操作,本公开的实施例在此不再赘述。
在预设迭代频次为3的情况下,即设定M=3的情况下,可以停止迭代操作。并将第1样本集评估信息541、第2样本集评估信息542和第3样本集评估信息543输入至目标评估信息输出层551,输出初始资源的目标评估信息560。
目标评估信息输出层551可以最小值筛选法构建得到,确定第1样本集评估信息541、第2样本集评估信息542和第3样本集评估信息543中评估信息值最小的样本评估信息确定为目标评估信息560。
在本公开的一个实施例中,例如可以将构建30个初始资源集,每个初始资源集可以包含有100个初始资源。通过本公开实施例提供的训练样本生成方法,可以确定30个初始资源集各自对应的目标评估信息。根据根据30个初始资源集各自对应的目标评估信息,对30个初始资源集进行排序,得到排序结果。将排序结果中排列前40%的初始资源集中的初始资源标注为正标签,将将排序结果中排列后40%的初始资源集中的初始资源标注为负标签,并删除没有标注过的初始资源集。这样可以实现对于初始资源集的筛选,以及对于初始资源的精准标注,提升样本标签的标注精度并提升训练样本的样本质量。
根据本公开的实施例,样本标签可以包括正标签和负标签。
操作S230中,根据目标评估信息,确定初始资源的样本标签可以包括如下操作。
在目标评估信息大于预设评估阈值的情况下,对初始资源标注为正标签;以及在目标评估信息小于或等于预设评估阈值的情况下,对初始资源标注为负标签。
根据本公开的实施例,在目标评估信息为与初始资源集对应的目标评估信息的情况下,可以在目标评估信息大于预设评估阈值的情况下将初始资源集中的多个初始资源均标注为正标签。相应地,还可以在与初始资源集对应的目标评估信息小于或等于预设评估阈值的情况下,将初始资源集中的多个初始资源均标注为负标签。
根据本公开的实施例,预设评估阈值的类型可以包括评估值或评估值区间,在预设评估阈值的类型为评估值区间的情况下,可以在目标评估信息大于评估值区间的上限的情况下,对初始资源标注为正标签。在目标评估信息小于或等于评估值区间的下限的情况下,对初始资源标注为负标签。
根据本公开的实施例,样本标签还可以包括其他类型,例如可以为不同的数据标识标签来表征不同的待推荐层级,这样可以实现对于初始资源的待推荐层级的精准分类标注,进一步提升训练样本的准确度与样本质量,提升后续资源推荐模型的训练效果和资源推荐效果。
需要说明的是,本领域技术人员可以根据实际需求来确定样本标签的具体类型,本公开的实施例对此不做限定,只要能够满足提升训练样本的数据质量即可。
图6示意性示出了根据本公开实施例的深度学习模型的训练方法的流程图。
如图6所示,深度学习模型的训练方法包括操作S610~S620。
操作S610,获取训练样本,其中,训练样本为根据上文描述的训练样本生成方法得到的,训练样本包括与样本资源对应的资源属性信息,以及与样本资源对应的样本标签。
操作S620,利用资源属性信息和样本标签,训练初始深度学习模型,得到训练后的深度学习模型。
根据本公开的实施例,样本资源可以包括任意类型的资源,例如视频资源、图像资源、文本资源、应用资源等等,本公开的实施例对样本资源的类型不做限定,本领域技术人员可以根据实际需求进行选择。
根据本公开的实施例,资源属性信息可以包括资源所具有的属性,例如在样本资源为视频资源的情况下,资源属性信息可以包括视频资源的分辨率、视频时长等资源属性信息。但不仅限于此,还可以包括视频资源的播放流畅度等其他类型的资源属性信息。相应地,其他类型样本资源还可以具有与该类型对应的资源属性信息,例如图像资源的水印位置、文本资源的乱码程度等等,本公开的实施例对资源所具有的属性不做限定,本领域技术人员可以根据实际需求进行选择。
根据本公开的实施例,资源属性信息还可以包括基于相关用户操作生成的属性信息,例如基于相关用户的关注操作、点赞操作、屏蔽操作、播放操作生成的关注数量、点赞数量、屏蔽数量、播放时长等。需要说明的是,可以基于任意类型的用户操作来生成相应的资源属性信息,本公开的实施例对生成资源属性信息的用户操作的类型不做限定,本领域技术人员可以根据实际需求进行选择。
根据本公开的实施例,上述任意实施例中提供的训练样本生成方法生成的训练样本均可以应用于该实施例中的训练方法。通过本公开实施例提供的训练样本生成方法可以进一步提升训练样本的样本质量,使从而基于本公开实施例提供的训练方法可以提升深度学习模型的鲁棒性和预测精度,提升深度学习模型的训练效果。从而使训练后的深度学习模型应用于资源推荐等场景中,可以提升资源推荐的准确性,满足用户的实际需求。
需要说明的是,在本公开的任意实施例中,对样本资源、资源属性信息等信息的获取是经过了相关用户或其他对象授权后进行的,或者通过其他合法合规的方式获取对样本资源、资源属性信息等信息,例如基于公开数据库来获取样本资源、资源属性信息等信息,信息处理过程已提前告知相关用户或授权机构,且处理过程采取必要的保密措施,例如采用去标识化处理,随机编码标识处理。同时生成的训练样本的用途符合相关法律法规的要求,且不违背公序良俗。
需要说明的是,本公开实施例中的样本资源与上述实施例中提供的训练样本生成方法所描述的初始资源可以具有相同或相应的技术属性,本公开的实施例对此不再赘述。
根据本公开的实施例,深度学习模型包括以下至少一项:
人工神经网络模型、长短期记忆网络模型、循环神经网络模型、门控循环网络模型。
根据本公开的实施例,深度学习模型还可以包括基于注意力机制构建得到的神经网络模型,例如基于Transformer模型、BERT(Bidirectional Encoder Representationfrom Transformers)模型等。
根据本公开的实施例,根据本公开的实施例利用资源属性信息和样本标签,训练初始深度学习模型可以包括如下操作。
将资源属性信息输入至初始深度学习模型,输出检测评估信息;利用损失函数处理检测评估信息和样本标签,得到损失值;基于损失值调整初始深度学习模型的参数,直至损失函数收敛;以及将损失函数收敛的情况下对应的初始深度学习模型确定为训练后的深度学习模型。
根据本公开的实施例,样本标签可以包括正标签和负标签,或者还可以包括其他类型的样本标签,例如可以包括能够表征待推荐层级的层级标签,相应地可以通过不同的层级标识或层级数值来表征层级标签,以提升深度学习模型的针对待推荐资源的待推荐层级的预测精度,进而提升后续的资源推荐精度。
图7示意性示出了根据本公开实施例的资源推荐方法的流程图。
如图7所示,该实施例的资源推荐方法包括操作S710~S730。
操作S710,获取待推荐资源,以及与待推荐资源对应的资源属性信息。
操作S720,将资源属性信息输入至深度学习模型中,输出待推荐资源的资源评价信息。
操作S730,基于资源评价信息,向目标对象推荐待推荐资源;其中,深度学习模型是利用上文描述的深度学习模型的训练方法训练得到的。
根据本公开的实施例,与待推荐资源对应的资源属性信息可以是基于目标对象针对相同的待推荐资源的浏览、关注、点赞、评价等操作生成的,或者还可以包括针对不同的待推荐资源的浏览、关注、点赞、评价等操作生成的,或者还可以基于其他的对象针对待推荐资源的浏览、关注、点赞、评价等操作生成的,或者还可以包括相关质量评估方对待推荐资源进行质量评估后生成的,本公开的实施例对与待推荐资源对应的资源属性信息的具体类型不做限定,本领域技术人员可以根据实际需求进行选择。
根据本公开的实施例,资源评价信息可以包括针对待推荐资源的资源评价值、资源评价层级标识等,本公开的实施例对资源评价信息的具体类型不做限定,只要能够满足实际需求即可。
根据本公开的实施例,可以通过设定资源评价阈值的方式,筛选出资源评价信息大于或的等于资源评价阈值的待推荐资源,并将该些待推荐资源按照各自的资源评价信息排序,向目标对象推送待推荐资源以实现向目标对象推荐待推荐资源。
根据本公开的实施例,还可以针对多个待推荐资源,按照待推荐资源各自的资源评价信息进行排序,并根据排序结果向目标对象推送表征排序结果的资源列表,以实现向目标对象推荐待推荐资源。
需要说明的是,本公开的实施例对向目标对象推荐待推荐资源的具体方式不做限定,本领域技术人员可以根据实际需求进行设计。
根据本公开的实施例,资源属性信息包括以下至少一项:
资源质量属性信息、资源偏好属性信息。
根据本公开的实施例,资源质量属性信息可以包括能够表征资源的质量属性的相关信息,例如视频资源的播放时长信息、视频分辨率信息、历史关注度信息、历史评分信息等等,本公开的实施例对资源质量属性信息的具体类型不做限定,本领域技术人员可以根据实际需求进行选择,只要能够表征资源的质量属性即可。
根据本公开的实施例,通过对包含有资源质量属性信息的资源属性信息进行属性特征提取,并基于进化算法处理包含有资源质量属性特征的资源属性特征,可以进一步保障得到目标评估信息是在充分考虑多个待推荐资源各自的资源质量属性的条件下生成的,因此目标评估信息可以充分反映初始资源各自的质量属性,使后续的样本标签可以真实体现初始资源各自的质量,以避免将质量较差的,劣质的资源确定为评分较高的样本标签,从而实现提升后续的资源推荐模型的训练效果,提升资源推荐准确性。
根据本公开的实施例,资源偏好属性信息可以包括用户等目标对象对于初始资源的评价、关注、点赞等正面偏好属性信息,还可以包括屏蔽、举报等负面偏好属性信息。
应该理解的是,资源偏好属性信息和/或资源质量属性信息可以根据相关算法来进行归一化处理,实现资源属性信息的预处理过程,以消除不同类型的属性信息之间的数量级差异,减少后续生成的目标评估信息的误差。相应地,还可以基于相关编码方法来对资源属性信息进行预处理,本公开的实施例对资源属性信息的预处理方式不做限定。
需要说明的是,在本公开的任意实施例中,对待推荐资源、资源属性信息等信息的获取是经过了相关用户或其他对象授权后进行的,或者通过其他合法合规的方式获取对待推荐资源、资源属性信息等信息,信息处理过程已提前告知相关用户或授权机构,且处理过程采取必要的保密措施,例如采用去标识化处理,随机编码标识处理。同时生成的资源评价信息的用途符合相关法律法规的要求,且不违背公序良俗。
图8示意性示出了根据本公开实施例的训练样本生成装置的框图。
如图8所示,训练样本生成装置800包括:属性特征提取模块81 0、进化算法处理模块820、样本标签确定模块830和训练样本生成模块840。
属性特征提取模块810,用于对多个初始资源各自对应的资源属性信息进行属性特征提取,得到初始资源属性特征。
进化算法处理模块820,用于基于进化算法处理初始资源属性特征,得到与初始资源对应的目标评估信息。
样本标签确定模块830,用于根据目标评估信息,确定初始资源的样本标签。
训练样本生成模块840,用于根据样本标签和与样本标签对应的资源属性信息,生成训练样本。
根据本公开的实施例,进化算法处理模块包括:第一评估信息确定单元和第一目标评估信息确定单元。
第一评估信息确定单元,用于基于进化算法,对初始资源属性特征执行N次迭代操作,得到N个评估信息,N为大于1的整数。
第一目标评估信息确定单元,用于根据N个评估信息,确定与初始资源对应的目标评估信息。
其中,N次迭代操作中的第n次迭代操作包括:根据初始资源的第n-1资源变异属性特征执行第n变异操作,得到第n资源变异属性特征;以及根据第n资源变异属性特征,确定初始资源的第n评估信息,其中,n大于1且小于等于N。
根据本公开的实施例,N次迭代操作中的第1次迭代操作包括:对初始资源属性特征执行第1变异操作,得到第1资源变异属性特征;以及根据第1资源变异属性特征,确定初始资源的第1评估信息。
根据本公开的实施例,属性特征提取模块包括第一属性特征提取单元。
第一属性特征提取单元,用于将与初始资源对应的资源属性信息输入至机器学习模型的属性特征提取层,输出初始资源属性特征。
根据本公开的实施例,属性特征提取模块包括:目标资源属性信息确定单元、初始资源属性特征元素确定单元和初始资源属性特征确定单元。
目标资源属性信息确定单元,用于确定初始资源集中,具有目标属性类型的目标资源属性信息,其中,初始资源集包括多个初始资源。
初始资源属性特征元素确定单元,用于根据目标资源属性信息,以及与目标属性类型对应的初始评估权重参数,确定与目标属性类型对应的初始资源属性特征元素。
初始资源属性特征确定单元,用于基于初始资源属性特征元素,确定与初始资源集对应的初始资源属性特征。
根据本公开的实施例,进化算法处理模块包括:第二评估信息确定单元和第二目标评估信息确定单元。
第二评估信息确定单元,用于基于进化算法,对初始资源属性特征执行M次迭代操作,得到M个样本集评估信息,其中,M为大于1的整数。
第二目标评估信息确定单元,用于根据M个样本集评估信息,确定与初始资源集对应的目标评估信息。
其中,M次迭代操作中的第m次迭代操作包括:对与初始资源集对应的第m-1变异评估权重参数执行第m变异操作,得到第m变异评估权重参数;根据第m变异评估权重参数,确定第m资源变异属性特征;以及根据第m资源变异属性特征,确定初始资源集的第m样本集评估信息,其中,m大于1且小于等于M。
根据本公开的实施例,M次迭代操作中的第1次迭代操作包括:对初始资源属性特征中的初始评估权重参数执行第1变异操作,得到第1变异评估权重参数;根据第1变异评估权重参数,确定第1资源变异属性特征;以及根据第1资源变异属性特征,确定初始资源集的第1样本集评估信息。
根据本公开的实施例,样本标签包括正标签和负标签;
样本标签确定模块包括:正标签标注模块和负标签标注模块。
正标签标注模块,用于在目标评估信息大于预设评估阈值的情况下,对初始资源标注为正标签。
负标签标注模块,用于在目标评估信息小于或等于预设评估阈值的情况下,对初始资源标注为负标签。
根据本公开的实施例,资源属性信息包括以下至少一项:
资源质量属性信息、资源偏好属性信息。
根据本公开的实施例,进化算法包括以下至少一项:
遗传算法、进化策略算法、进化编程算法、遗传编程算法。
图9示意性示出了根据本公开实施例的深度学习模型的训练装置的框图。
如图9所示,深度学习模型的训练装置900包括:训练样本获取模块910和训练模块920。
训练样本获取模块910,用于获取训练样本,其中,训练样本为根据上文描述的训练样本生成方法得到的,训练样本包括与样本资源对应的资源属性信息,以及与样本资源对应的样本标签。
训练模块920,用于利用资源属性信息和样本标签,训练初始深度学习模型,得到训练后的深度学习模型。
根据本公开的实施例,深度学习模型包括以下至少一项:
人工神经网络模型、长短期记忆网络模型、循环神经网络模型、门控循环网络模型。
根据本公开的实施例,训练模块包括:检测评估信息确定单元、损失值确定单元、参数调整单元和深度学习模型确定单元。
检测评估信息确定单元,用于将资源属性信息输入至初始深度学习模型,输出检测评估信息。
损失值确定单元,用于利用损失函数处理检测评估信息和样本标签,得到损失值。
参数调整单元,用于基于损失值调整初始深度学习模型的参数,直至损失函数收敛。
深度学习模型确定单元,用于将损失函数收敛的情况下对应的初始深度学习模型确定为训练后的深度学习模型。
图10示意性示出了根据本公开实施例的资源推荐装置的框图。
如图10所示,资源推荐装置1000包括:待推荐资源获取模块1010、资源评价信息确定模块1020和推荐模块1030。
待推荐资源获取模块1010,用于获取待推荐资源,以及与待推荐资源对应的资源属性信息。
资源评价信息确定模块1020,用于将资源属性信息输入至深度学习模型中,输出待推荐资源的资源评价信息。
推荐模块1030,用于基于资源评价信息,向目标对象推荐待推荐资源。
其中,深度学习模型是利用根据上文描述的深度学习模型的训练方法训练得到的。
根据本公开的实施例,资源属性信息包括以下至少一项:
资源质量属性信息、资源偏好属性信息。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
根据本公开的实施例,一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如上所述的方法。
根据本公开的实施例,一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行如上所述的方法。
根据本公开的实施例,一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如上所述的方法。
图11示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图11所示,设备1100包括计算单元1101,其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序,来执行各种适当的动作和处理。在RAM 1103中,还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。
设备1100中的多个部件连接至I/O接口1105,包括:输入单元1106,例如键盘、鼠标等;输出单元1107,例如各种类型的显示器、扬声器等;存储单元1108,例如磁盘、光盘等;以及通信单元1109,例如网卡、调制解调器、无线通信收发机等。通信单元1109允许设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理,例如训练样本生成方法。例如,在一些实施例中,训练样本生成方法、训练方法或资源推荐方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1108。在一些实施例中,计算机程序的部分或者全部可以经由ROM1102和/或通信单元1109而被载入和/或安装到设备1100上。当计算机程序加载到RAM 1103并由计算单元1101执行时,可以执行上文描述的训练样本生成方法、训练方法或资源推荐方法的一个或多个步骤。备选地,在其他实施例中,计算单元1101可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行训练样本生成方法、训练方法或资源推荐方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以是分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (28)

1.一种训练样本生成方法,包括:
对多个初始资源各自对应的资源属性信息进行属性特征提取,得到初始资源属性特征,其中,所述资源属性信息包括以下至少一项:资源质量属性信息、资源偏好属性信息,所述初始资源包括能够通过终端设备浏览的资源信息;
基于进化算法处理所述初始资源属性特征,得到与所述初始资源对应的目标评估信息,所述目标评估信息表征所述初始资源的资源属性,所述目标评估信息是根据进化后的资源属性特征确定的,所述进化后的资源属性特征是基于所述进化算法处理所述初始资源属性特征后得到的;
根据所述目标评估信息,确定所述初始资源的样本标签,所述样本标签表征与所述初始资源相关的资源评价信息;以及
根据所述样本标签和与所述样本标签对应的资源属性信息,生成训练样本。
2. 根据权利要求1所述的方法,其中,基于进化算法处理所述初始资源属性特征,得到与所述初始资源对应的目标评估信息包括:
基于所述进化算法,对所述初始资源属性特征执行N次迭代操作,得到N个评估信息,N为大于1的整数;以及
根据所述N个评估信息,确定与所述初始资源对应的目标评估信息;
其中,所述N次迭代操作中的第n次迭代操作包括:
根据所述初始资源的第n-1资源变异属性特征执行第n变异操作,得到第n资源变异属性特征;以及
根据所述第n资源变异属性特征,确定所述初始资源的第n评估信息,其中,n大于1且小于等于N。
3. 根据权利要求2所述的方法,其中,所述N次迭代操作中的第1次迭代操作包括:
对所述初始资源属性特征执行第1变异操作,得到第1资源变异属性特征;以及
根据所述第1资源变异属性特征,确定所述初始资源的第1评估信息。
4.根据权利要求2所述的方法,其中,对多个初始资源各自对应的资源属性信息进行属性特征提取,得到初始资源属性特征包括:
将与所述初始资源对应的资源属性信息输入至机器学习模型的属性特征提取层,输出所述初始资源属性特征。
5.根据权利要求1所述的方法,其中,对多个初始资源各自对应的资源属性信息进行属性特征提取,得到初始资源属性特征包括:
确定初始资源集中,具有目标属性类型的目标资源属性信息,其中,所述初始资源集包括多个所述初始资源;
根据所述目标资源属性信息,以及与所述目标属性类型对应的初始评估权重参数,确定与所述目标属性类型对应的初始资源属性特征元素;以及
基于所述初始资源属性特征元素,确定与所述初始资源集对应的初始资源属性特征。
6. 根据权利要求5所述的方法,其中,基于进化算法处理所述初始资源属性特征,得到与所述初始资源对应的目标评估信息包括:
基于所述进化算法,对所述初始资源属性特征执行M次迭代操作,得到M个样本集变异评估信息,其中,M为大于1的整数;以及
根据所述M个样本集变异评估信息,确定与所述初始资源集对应的目标评估信息;
其中,所述M次迭代操作中的第m次迭代操作包括:
对与所述初始资源集对应的第m-1变异评估权重参数执行第m变异操作,得到第m变异评估权重参数;
根据所述第m变异评估权重参数,确定第m资源变异属性特征;以及
根据所述第m资源变异属性特征,确定所述初始资源集的第m样本集变异评估信息,其中,m大于1且小于等于M。
7.根据权利要求6所述的方法,其中,所述M次迭代操作中的第1次迭代操作包括:
对所述初始资源属性特征中的初始评估权重参数执行第1变异操作,得到第1变异评估权重参数;
根据所述第1变异评估权重参数,确定第1资源变异属性特征;以及
根据所述第1资源变异属性特征,确定所述初始资源集的第1样本集评估信息。
8.根据权利要求1所述的方法,其中,所述样本标签包括正标签和负标签;
根据所述目标评估信息,确定所述初始资源的样本标签包括:
在所述目标评估信息大于预设评估阈值的情况下,对所述初始资源标注为所述正标签;以及
在所述目标评估信息小于或等于所述预设评估阈值的情况下,对所述初始资源标注为所述负标签。
9.根据权利要求1所述的方法,其中,所述进化算法包括以下至少一项:
遗传算法、进化策略算法、进化编程算法、遗传编程算法。
10.一种深度学习模型的训练方法,包括:
获取训练样本,其中,所述训练样本为根据权利要求1至9中任一项所述的方法得到的,所述训练样本包括与样本资源对应的资源属性信息,以及与所述样本资源对应的样本标签;
利用所述资源属性信息和所述样本标签,训练初始深度学习模型,得到训练后的深度学习模型。
11.根据权利要求10所述的训练方法,其中,所述深度学习模型包括以下至少一项:
人工神经网络模型、长短期记忆网络模型、循环神经网络模型、门控循环网络模型。
12.根据权利要求10所述的训练方法,其中,利用所述资源属性信息和样本标签,训练初始深度学习模型包括:
将所述资源属性信息输入至所述初始深度学习模型,输出检测评估信息;
利用损失函数处理所述检测评估信息和所述样本标签,得到损失值;
基于所述损失值调整所述初始深度学习模型的参数,直至所述损失函数收敛;以及
将所述损失函数收敛的情况下对应的所述初始深度学习模型确定为所述训练后的深度学习模型。
13.一种资源推荐方法,包括:
获取待推荐资源,以及与所述待推荐资源对应的资源属性信息,其中,所述资源属性信息包括以下至少一项:资源质量属性信息、资源偏好属性信息,所述待推荐资源包括能够通过终端设备浏览的资源信息;
将所述资源属性信息输入至深度学习模型中,输出所述待推荐资源的资源评价信息;以及
基于所述资源评价信息,向目标对象推荐所述待推荐资源;
其中,所述深度学习模型是利用根据权利要求10至12中任一项所述的方法训练得到的。
14.一种训练样本生成装置,包括:
属性特征提取模块,用于对多个初始资源各自对应的资源属性信息进行属性特征提取,得到初始资源属性特征,其中,所述资源属性信息包括以下至少一项:资源质量属性信息、资源偏好属性信息,所述初始资源包括能够通过终端设备浏览的资源信息;
进化算法处理模块,用于基于进化算法处理所述初始资源属性特征,得到与所述初始资源对应的目标评估信息,所述目标评估信息表征所述初始资源的资源属性,所述目标评估信息是根据进化后的资源属性特征确定的,所述进化后的资源属性特征是基于所述进化算法处理所述初始资源属性特征后得到的;
样本标签确定模块,用于根据所述目标评估信息,确定所述初始资源的样本标签,所述样本标签表征与所述初始资源相关的资源评价信息;以及
训练样本生成模块,用于根据所述样本标签和与所述样本标签对应的资源属性信息,生成训练样本。
15. 根据权利要求14所述的装置,其中,进化算法处理模块包括:
第一评估信息确定单元,用于基于所述进化算法,对所述初始资源属性特征执行N次迭代操作,得到N个评估信息,N为大于1的整数;以及
第一目标评估信息确定单元,用于根据所述N个评估信息,确定与所述初始资源对应的目标评估信息;
其中,所述N次迭代操作中的第n次迭代操作包括:
根据所述初始资源的第n-1资源变异属性特征执行第n变异操作,得到第n资源变异属性特征;以及
根据所述第n资源变异属性特征,确定所述初始资源的第n评估信息,其中,n大于1且小于等于N。
16. 根据权利要求15所述的装置,其中,所述N次迭代操作中的第1次迭代操作包括:
对所述初始资源属性特征执行第1变异操作,得到第1资源变异属性特征;以及
根据所述第1资源变异属性特征,确定所述初始资源的第1评估信息。
17.根据权利要求15所述的装置,其中,属性特征提取模块包括:
第一属性特征提取单元,用于将与所述初始资源对应的资源属性信息输入至机器学习模型的属性特征提取层,输出所述初始资源属性特征。
18.根据权利要求14所述的装置,其中,属性特征提取模块包括:
目标资源属性信息确定单元,用于确定初始资源集中,具有目标属性类型的目标资源属性信息,其中,所述初始资源集包括多个所述初始资源;
初始资源属性特征元素确定单元,用于根据所述目标资源属性信息,以及与所述目标属性类型对应的初始评估权重参数,确定与所述目标属性类型对应的初始资源属性特征元素;以及
初始资源属性特征确定单元,用于基于所述初始资源属性特征元素,确定与所述初始资源集对应的初始资源属性特征。
19. 根据权利要求18所述的装置,其中,进化算法处理模块包括:
第二评估信息确定单元,用于基于所述进化算法,对所述初始资源属性特征执行M次迭代操作,得到M个样本集评估信息,其中,M为大于1的整数;以及
第二目标评估信息确定单元,用于根据所述M个样本集评估信息,确定与所述初始资源集对应的目标评估信息;
其中,所述M次迭代操作中的第m次迭代操作包括:
对与所述初始资源集对应的第m-1变异评估权重参数执行第m变异操作,得到第m变异评估权重参数;
根据所述第m变异评估权重参数,确定第m资源变异属性特征;以及
根据所述第m资源变异属性特征,确定所述初始资源集的第m样本集评估信息,其中,m大于1且小于等于M。
20.根据权利要求19所述的装置,其中,所述M次迭代操作中的第1次迭代操作包括:
对所述初始资源属性特征中的初始评估权重参数执行第1变异操作,得到第1变异评估权重参数;
根据所述第1变异评估权重参数,确定第1资源变异属性特征;以及
根据所述第1资源变异属性特征,确定所述初始资源集的第1样本集评估信息。
21.根据权利要求14所述的装置,其中,所述样本标签包括正标签和负标签;
样本标签确定模块包括:
正标签标注模块,用于在所述目标评估信息大于预设评估阈值的情况下,对所述初始资源标注为所述正标签;以及
负标签标注模块,用于在所述目标评估信息小于或等于所述预设评估阈值的情况下,对所述初始资源标注为所述负标签。
22.根据权利要求14所述的装置,其中,所述进化算法包括以下至少一项:
遗传算法、进化策略算法、进化编程算法、遗传编程算法。
23.一种深度学习模型的训练装置,包括:
训练样本获取模块,用于获取训练样本,其中,所述训练样本为根据权利要求1至9中任一项所述的方法得到的,所述训练样本包括与样本资源对应的资源属性信息,以及与所述样本资源对应的样本标签;
训练模块,用于利用所述资源属性信息和所述样本标签,训练初始深度学习模型,得到训练后的深度学习模型。
24.根据权利要求23所述的训练装置,其中,所述深度学习模型包括以下至少一项:
人工神经网络模型、长短期记忆网络模型、循环神经网络模型、门控循环网络模型。
25.根据权利要求23所述的训练装置,其中,训练模块包括:
检测评估信息确定单元,用于将所述资源属性信息输入至所述初始深度学习模型,输出检测评估信息;
损失值确定单元,用于利用损失函数处理所述检测评估信息和所述样本标签,得到损失值;
参数调整单元,用于基于所述损失值调整所述初始深度学习模型的参数,直至所述损失函数收敛;以及
深度学习模型确定单元,用于将所述损失函数收敛的情况下对应的所述初始深度学习模型确定为所述训练后的深度学习模型。
26.一种资源推荐装置,包括:
待推荐资源获取模块,用于获取待推荐资源,以及与所述待推荐资源对应的资源属性信息,其中,所述资源属性信息包括以下至少一项:资源质量属性信息、资源偏好属性信息,所述待推荐资源包括能够通过终端设备浏览的资源信息;
资源评价信息确定模块,用于将所述资源属性信息输入至深度学习模型中,输出所述待推荐资源的资源评价信息;以及
推荐模块,用于基于所述资源评价信息,向目标对象推荐所述待推荐资源;
其中,所述深度学习模型是利用根据权利要求10至12中任一项所述的方法训练得到的。
27. 一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至13中任一项所述的方法。
28.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至13中任一项所述的方法。
CN202310176896.8A 2023-02-28 2023-02-28 训练样本生成方法、训练方法、推荐方法以及装置 Active CN116151392B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310176896.8A CN116151392B (zh) 2023-02-28 2023-02-28 训练样本生成方法、训练方法、推荐方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310176896.8A CN116151392B (zh) 2023-02-28 2023-02-28 训练样本生成方法、训练方法、推荐方法以及装置

Publications (2)

Publication Number Publication Date
CN116151392A CN116151392A (zh) 2023-05-23
CN116151392B true CN116151392B (zh) 2024-01-09

Family

ID=86350553

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310176896.8A Active CN116151392B (zh) 2023-02-28 2023-02-28 训练样本生成方法、训练方法、推荐方法以及装置

Country Status (1)

Country Link
CN (1) CN116151392B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107103601A (zh) * 2017-04-14 2017-08-29 成都知识视觉科技有限公司 一种乳腺癌评分系统中的细胞有丝分裂检测方法
CN107194073A (zh) * 2017-05-24 2017-09-22 郑州航空工业管理学院 用于室内挂钟设计的模糊适应值交互式进化优化方法
CN110852379A (zh) * 2019-11-11 2020-02-28 北京百度网讯科技有限公司 训练样本生成方法、装置以及电子设备
CN111652267A (zh) * 2020-04-21 2020-09-11 清华大学 对抗样本的生成方法、装置、电子设备及存储介质
CN113627513A (zh) * 2021-08-05 2021-11-09 重庆度小满优扬科技有限公司 一种训练数据生成方法、系统、电子设备及存储介质
CN114139059A (zh) * 2021-12-07 2022-03-04 中国建设银行股份有限公司 资源推荐模型的训练方法、资源推荐方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11074337B2 (en) * 2018-07-31 2021-07-27 Microsoft Technology Licensing, Llc Increasing security of a password-protected resource based on publicly available data

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107103601A (zh) * 2017-04-14 2017-08-29 成都知识视觉科技有限公司 一种乳腺癌评分系统中的细胞有丝分裂检测方法
CN107194073A (zh) * 2017-05-24 2017-09-22 郑州航空工业管理学院 用于室内挂钟设计的模糊适应值交互式进化优化方法
CN110852379A (zh) * 2019-11-11 2020-02-28 北京百度网讯科技有限公司 训练样本生成方法、装置以及电子设备
CN111652267A (zh) * 2020-04-21 2020-09-11 清华大学 对抗样本的生成方法、装置、电子设备及存储介质
CN113627513A (zh) * 2021-08-05 2021-11-09 重庆度小满优扬科技有限公司 一种训练数据生成方法、系统、电子设备及存储介质
CN114139059A (zh) * 2021-12-07 2022-03-04 中国建设银行股份有限公司 资源推荐模型的训练方法、资源推荐方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A Recommender System for Metaheuristic Algorithms for Continuous Optimization Based on Deep Recurrent Neural Networks;Ye Tian et.al;《JOURNAL OF IEEE TRANSACTIONS ON ARTIFICIAL INTELLIGENCE》;第1-15页 *
基于深度学习的智能学习资源推荐算法;宋菲菲 等;《南京理工大学学报》;第46卷(第2期);第185-191页 *

Also Published As

Publication number Publication date
CN116151392A (zh) 2023-05-23

Similar Documents

Publication Publication Date Title
CN107436875B (zh) 文本分类方法及装置
CN110390408B (zh) 交易对象预测方法和装置
CN111667056B (zh) 用于搜索模型结构的方法和装置
CN109993627B (zh) 推荐方法、推荐模型的训练方法、装置和存储介质
US10606910B2 (en) Ranking search results using machine learning based models
CN113240510B (zh) 异常用户预测方法、装置、设备及存储介质
CN114494784A (zh) 深度学习模型的训练方法、图像处理方法和对象识别方法
CN114036398B (zh) 内容推荐和排序模型训练方法、装置、设备以及存储介质
CN107291774B (zh) 错误样本识别方法和装置
CN112149699A (zh) 用于生成模型的方法、装置和用于识别图像的方法、装置
CN112989146A (zh) 向目标用户推荐资源的方法、装置、设备、介质和程序产品
CN114429633A (zh) 文本识别方法、模型的训练方法、装置、电子设备及介质
CN114037059A (zh) 预训练模型、模型的生成方法、数据处理方法及装置
CN114360027A (zh) 一种特征提取网络的训练方法、装置及电子设备
CN116151392B (zh) 训练样本生成方法、训练方法、推荐方法以及装置
CN110895781A (zh) 菜品类别推荐方法、装置、电子设备及存储介质
CN113612777B (zh) 训练方法、流量分级方法、装置、电子设备以及存储介质
CN113806541A (zh) 情感分类的方法和情感分类模型的训练方法、装置
CN112966108A (zh) 检测数据和训练分类模型的方法、装置、设备和存储介质
CN114821801B (zh) 动作识别方法、模型训练方法、装置、电子设备和存储介质
US11907508B1 (en) Content analytics as part of content creation
CN113963234B (zh) 数据标注处理方法、装置、电子设备和介质
CN116342183A (zh) 信息推荐方法、训练方法、装置、电子设备以及存储介质
CN117851546A (zh) 资源检索方法、训练方法、装置、电子设备、存储介质及程序产品
CN115563390A (zh) 一种课程推荐列表的确定方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant