CN117473153A - 推送指数预测模型的训练方法和推送内容的获取方法 - Google Patents
推送指数预测模型的训练方法和推送内容的获取方法 Download PDFInfo
- Publication number
- CN117473153A CN117473153A CN202311385453.6A CN202311385453A CN117473153A CN 117473153 A CN117473153 A CN 117473153A CN 202311385453 A CN202311385453 A CN 202311385453A CN 117473153 A CN117473153 A CN 117473153A
- Authority
- CN
- China
- Prior art keywords
- sample
- resource
- candidate
- sub
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 260
- 238000000034 method Methods 0.000 title claims abstract description 98
- 230000000873 masking effect Effects 0.000 claims abstract description 90
- 238000000605 extraction Methods 0.000 claims description 63
- 238000004590 computer program Methods 0.000 claims description 12
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 10
- 230000000694 effects Effects 0.000 abstract description 9
- 238000003058 natural language processing Methods 0.000 abstract description 8
- 238000013135 deep learning Methods 0.000 abstract description 5
- 238000012545 processing Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000011160 research Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提出了一种推送指数预测模型的训练方法和推送内容的获取方法,涉及自然语言处理和深度学习等人工智能领域,包括获取待训练的候选组合模型,对第一资源样本和第二资源样本分别进行部分特征掩盖,得到第一资源样本的第一子样本集合以及第二资源样本的第二子样本集合,以对候选组合模型进行模型训练得到训练损失;根据训练损失对候选组合模型进行整体的参数调整,返回获取下一第一资源样本和下一第二资源样本对参数调整后的候选组合模型继续进行训练,直至训练结束得到训练好的目标推送指数预测模型和目标相似度识别模型。优化了模型的训练效果,提高了获取的中长尾用户的推送内容与中长尾用户的实际需求的匹配程度。
Description
技术领域
本公开涉及数据处理领域,尤其涉及自然语言处理和深度学习等人工智能领域。
背景技术
实现中,网站可以通过向用户推送其感兴趣的资源内容,提高用户的粘性以及网站内容的转化率。相关技术中,可以获取用户的大量历史数据作为学习样本,并通过对学习样本的分析从而识别用户需求,并基于识别到的用户需求对用户进行针对性的资源内容的推送。
可选地,针对在网站上的浏览痕迹较少的中长尾用户,相较于浏览痕迹较多的头部用户的历史数据量,中长尾用户的历史数据量明显较少,在基于中长尾用户的少量历史数据进行分析识别该类用户的用户需求的场景下,较少的历史数据量可能会对用户需求的识别准确度存在一定程度的影响,从而导致网站针对中长尾用户推送的资源内容与该类用户实际需求之间的匹配程度欠佳,影响用户体验。
发明内容
本公开提出了一种推送指数预测模型的推送指数预测模型的训练方法和推送内容的获取方法。
根据本公开的第一方面,提出了一种推送指数预测模型的训练方法,方法包括:获取待训练的候选组合模型,其中,所述候选组合模型包括候选推送指数预测模型和候选相似度识别模型;获取样本用户的第一资源样本和对应的第二资源样本,并对所述第一资源样本和所述第二资源样本分别进行部分特征掩盖,得到所述第一资源样本掩盖后的第一子样本集合以及所述第二资源样本掩盖后的第二子样本集合,其中,所述第一资源样本和所述第二资源样本不同;根据所述第一资源样本和所述第一子样本集合,以及所述第二资源样本和所述第二子样本集合,对所述候选组合模型进行模型训练,得到所述候选组合模型的训练损失;根据所述训练损失对所述候选组合模型进行整体的参数调整,得到参数调整后的候选组合模型;返回获取下一第一资源样本和下一第二资源样本对参数调整后的候选组合模型继续进行训练,直至训练结束,得到训练好的目标推送指数预测模型和目标相似度识别模型组成的目标组合模型,其中,所述目标推送指数预测模型用于进行线上推送内容的确定。
根据本公开的第二方面,提出了一种推送内容的获取方法,方法包括:获取训练好的目标推送指数预测模型,其中,所述目标推送指数预测模型基于上述第一方面提出的推送指数预测模型的训练方法得到;获取用户端待推送的候选资源内容集合,并通过所述目标推送指数预测模型输出所述候选资源内容集合中各候选资源内容的目标推送指数;根据所述目标推送指数由高至低的顺序对各候选资源内容进行排序,得到排序后的候选资源内容队列,并从所述候选资源内容队列中获取推送给所述用户端的目标推送资源内容。
根据本公开的第三方面,提出了一种推送指数预测模型的训练装置,装置包括:第一获取模块,用于获取待训练的候选组合模型,其中,所述候选组合模型包括候选推送指数预测模型和候选相似度识别模型;第二获取模块,用于获取样本用户的第一资源样本和对应的第二资源样本,并对所述第一资源样本和所述第二资源样本分别进行部分特征掩盖,得到所述第一资源样本掩盖后的第一子样本集合以及所述第二资源样本掩盖后的第二子样本集合,其中,所述第一资源样本和所述第二资源样本不同;第一训练模块,用于根据所述第一资源样本和所述第一子样本集合,以及所述第二资源样本和所述第二子样本集合,对所述候选组合模型进行模型训练,得到所述候选组合模型的训练损失;调整模块,用于根据所述训练损失对所述候选组合模型进行整体的参数调整,得到参数调整后的候选组合模型;第二训练模块,用于返回获取下一第一资源样本和下一第二资源样本对参数调整后的候选组合模型继续进行训练,直至训练结束,得到训练好的目标推送指数预测模型和目标相似度识别模型组成的目标组合模型,其中,所述目标推送指数预测模型用于进行线上推送内容的确定。
根据本公开的第四方面,提出了一种推送内容的获取装置,装置包括:第三获取模块,用于获取训练好的目标推送指数预测模型,其中,所述目标推送指数预测模型基于上述第三方面提出的推送指数预测模型的训练装置得到;第四获取模块,用于获取用户端待推送的候选资源内容集合,并通过所述目标推送指数预测模型输出所述候选资源内容集合中各候选资源内容的目标推送指数;推送模块,用于根据所述目标推送指数由高至低的顺序对各候选资源内容进行排序,得到排序后的候选资源内容队列,并从所述候选资源内容队列中获取推送给所述用户端的目标推送资源内容。
根据本公开的第五方面,提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面提出的推送指数预测模型的训练方法和/或第二方面提出的推送内容的获取方法。
根据本公开的第四方面,提出了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述第一方面提出的推送指数预测模型的训练方法和/或第二方面提出的推送内容的获取方法。
根据本公开的第五方面,提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述第一方面提出的推送指数预测模型的训练方法和/或第二方面提出的推送内容的获取方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1为本公开一实施例的推送指数预测模型的训练方法的流程示意图;
图2为本公开另一实施例的推送指数预测模型的训练方法的流程示意图;
图3为本公开一实施例的样本特征掩盖的示意图;
图4为本公开另一实施例的推送指数预测模型的训练方法的流程示意图;
图5为本公开另一实施例的推送指数预测模型的训练方法的流程示意图;
图6为本公开一实施例的推送内容的获取方法的流程示意图;
图7为本公开一实施例的推送指数预测模型的训练装置的结构示意图;
图8为本公开一实施例的推送内容的获取装置的结构示意图;
图9为本公开一实施例的电子设备的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
数据处理(data processing),是系统工程和自动控制的基本环节,数据是对事实、概念或指令的一种表达形式,可由人工或自动化装置进行处理。数据经过解释并赋予一定的意义之后,便成为信息。数据处理(data processing)是对数据的采集、存储、检索、加工、变换和传输,数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。
深度学习(Deep Learning,DL),是机器学习领域中一个新的研究方向,深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
自然语言处理(Natural Language Processing,NLP),是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统。
人工智能(Artificial Intelligence,AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。
图1为本公开一实施例的推送指数预测模型的训练方法的流程示意图,如图1所示,该方法包括:
S101,获取待训练的候选组合模型,其中,候选组合模型包括候选推送指数预测模型和候选相似度识别模型。
实现中,可以获取待推送的资源内容的推送指数,并根据获取到的推送指数确定最终推送给用户端的资源内容。
可选地,可以通过用户端对推送内容的转化行为参数表征资源内容的推送指数,可以理解为,可以获取用户端对待推送的资源内容的预测转化操作参数,并通过预测转化操作参数的具体值,确定资源内容的推送指数。
其中,用户端对资源内容的预测转化操作参数可以包括点击率、浏览时长、互动时长等相关参数,此处不做具体限定。
本公开实施例中,可以通过待训练的推送指数预测模型,并对其进行模型训练,进而通过训练好的推送指数预测模型获取推送内容的预测推送指数,其中,可以将待训练的推送指数预测模型标记为候选推送指数预测模型。
可选地,针对中长尾用户端,可以获取中长尾用户端的历史数据,并根据该部分历史数据对待训练的候选推送指数预测模型进行训练。
其中,中长尾用户端的历史数据量存在可能无法支撑候选推送指数预测模型的正常训练,在该场景下,可以针对候选推送指数预测模型的特征提取能力进行优化,从而使得训练好的推送指数预测模型可以在少量数据量的场景下实现准确的特征提取。
作为一种可能地实现方式,可以基于候选推送指数预测模型构建对应的组合模型,通过对组合模型中包括的多个模型的联合训练,实现对候选推送指数预测模型的特征提取能力的优化。
作为一种示例,如图2所示,可以将图2示出的候选推送指数预测模型与图2示出的相似度识别模型进行组合,从而得到图2示出的组合模型,其中,可以将图2示出的相似度识别模型标记为待训练的候选相似度识别模型,以及,将图2示出的候选推送指数预测模型和候选相似度识别模型的组合模型标记为待训练的候选组合模型。
可选地,通过对候选推送指数预测模型和候选相似度模型组成的候选组合模型的训练,实现对候选推送指数预测模型的特征提取能力的优化。
S102,获取样本用户的第一资源样本和对应的第二资源样本,并对第一资源样本和第二资源样本分别进行部分特征掩盖,得到第一资源样本掩盖后的第一子样本集合以及第二资源样本掩盖后的第二子样本集合,其中,第一资源样本和第二资源样本不同。
本公开实施例中,可以将中长尾用户作为样本用户,并获取样本用户在历史时间范围内的历史推送资源内容相关数据,以及样本用户对历史推送资源内容的相关转化操作数据,并根据该部分数据得到模型训练所采用的样本,其中,可以将基于该部分数据所得到的样本用户的样本数据,标记为样本用户的第一资源样本。
相应地,候选组合模型中包括有候选相似度识别模型,在该场景下,可以获取与第一资源样本不同的其他资源样本,作为第一资源样本对应的第二资源样本。
在一些实现中,中长尾用户可能存在数量较少和/或信息不完整的情况,由此可知,基于中长尾用户的历史数据所得到的样本可能存在数量较少或者样本信息不完整的情况。
在该场景下,可以对样本用户的第一资源样本和第二资源样本进行相应地的处理,使得基于第一资源样本和第二资源样本进行训练的模型可以在中长尾用户对应的数据量较少和/或信息不完整的情况下,实现对输入数据的准确特征提取以及准确推送指数预测。
可选地,可以基于相关技术中的特征掩盖方法对第一资源样本进行部分特征掩盖,并将进行部分特征掩盖后的样本标记为第一资源样本的第一子样本。
作为一种示例,如图3所示,设定图3示出的N1为样本用户的第一资源样本,可以对图3示出的N1进行部分特征掩盖,从而得到部分特征掩盖后的第一子样本,其中,针对N1进行部分特征掩盖所得到的第一子样本可以为图3示出的N1-A,以及图3示出的N1-B。
如图3所示,N1-A为第一资源样本N1的特征类型1下的特征、特征类型3下的特征以及特征类型5下的特征进行部分特征掩盖后得到的第一子样本,以及,N1-B为第一资源样本N1的特征类型2下的特征以及特征类型4下的特征进行部分特征掩盖得到的第一子样本。
本公开实施例中,可以对第一资源样本进行多次的部分特征掩盖,从而得到部分特征掩盖后的多个第一子样本,进而将多个第一子样本的组合标记为第一资源样本的第一子样本集合。
相应地,针对第二资源样本,可以通过采用与第一资源样本的特征掩盖方法进行部分特征掩盖,并将掩盖后得到的样本标记为第二资源样本的第二子样本。
作为一种示例,依然如图3所示,设定图3示出的NX为第一资源样本N1不同的第二资源样本,可以对图3示出的NX进行部分特征掩盖,从而得到NX的第二子样本,其中,针对NX进行部分特征掩盖所得到的第二子样本可以为图3示出的NX-A。
如图3所示,NX-A为第二资源样本NX的特征类型1下的特征以及特征类型2下的特征进行部分特征掩盖后得到的第二子样本。
本公开实施例中,可以对第二资源样本进行多次的部分特征掩盖,从而得到部分特征掩盖后的多个第二子样本,进而将多个第二子样本的组合标记为第二资源样本的第二子样本集合。
需要说明的是,在第一资源样本和第二资源样本分别进行多次的部分特征掩盖时,针对任意两次掩盖的部分特征,二者之间不同。
S103,根据第一资源样本和第一子样本集合,以及第二资源样本和第二子样本集合,对候选组合模型进行模型训练,得到候选组合模型的训练损失。
本公开实施例中,可以从第一资源样本和第一资源样本的第一子样本集合,以及第二资源样本和第二资源样本的第二子样本集合中,分别获取候选组合模型中包括的候选推送指数预测模型的训练样本,以及候选相似度识别模型的训练样本。
可选地,可以基于从第一资源样本和第一资源样本的第一子样本集合,以及第二资源样本和第二资源样本的第二子样本集合中获取到的训练样本对候选推送指数预测模型进行模型训练,从而得到候选推送指数预测模型的训练的损失值。
以及,基于从第一资源样本和第一资源样本的第一子样本集合,以及第二资源样本和第二资源样本的第二子样本集合中获取到的训练样本对候选相似度识别模型进行模型训练,得到候选相似度识别模型的训练的损失值。
在该场景下,可以对候选推送指数预测模型的损失值以及候选相似度识别模型的损失值进行整合,并将整合后得到的损失值确定为包括候选推送指数预测模型以及候选相似度模型的候选组合模型的训练损失。
S104,根据训练损失对候选组合模型进行整体的参数调整,得到参数调整后的候选组合模型。
可选地,可以基于获取到的训练损失,对候选组合模型中包括的候选推送指数预测模型以及候选相似度识别模型进行整体的模型参数的调整优化,进而得到参数调整后的候选组合模型。
其中,可以获取候选组合模型参与模型迭代优化的至少部分模型参数,并基于相关技术中的模型参数调整方法对该部分模型参数进行调整,从而得到参数调整后的候选组合模型。
S105,返回获取下一第一资源样本和下一第二资源样本对参数调整后的候选组合模型继续进行训练,直至训练结束,得到训练好的目标推送指数预测模型和目标相似度识别模型组成的目标组合模型,其中,目标推送指数预测模型用于进行线上推送内容的确定。
本公开实施例中,获取参数调整后的候选组合模型后,可以返回从训练样本集合中获取下一第一资源样本以及对应的下一第二资源样本,并根据下一第一资源样本和下一第二资源样本对参数调整后的候选组合模型继续进行训练,直至训练结束,得到训练好的目标组合模型。
可选地,可以基于训练轮次设置候选组合模型的训练结束条件,针对当前轮次的模型训练,若当前模型训练的轮次满足了预设的训练结束条件,即可结束对候选组合模型的模型训练,并将当前轮次训练结束得到的候选推送指数预测模型以及候选相似度识别模型确定为训练好的目标推送指数预测模型以及目标相似度识别模型,进而得到目标推送指数预测模型以及目标相似度识别模型组成的训练好的目标组合模型。
可选地,可以基于模型的训练损失设置对应的训练结束条件,针对当前轮次的模型训练,若当前轮次的模型的输出结果对应的训练损失满足了预设的训练结束条件,即可结束对候选组合模型的模型训练,并将当前轮次训练结束得到的候选推送指数预测模型以及候选相似度识别模型确定为训练好的目标推送指数预测模型以及目标相似度识别模型,进而得到目标推送指数预测模型以及目标相似度识别模型组成的训练好的目标组合模型。
需要说明的是,相较于候选推送指数预测模型的单独训练,本公开实施例提出的候选组合模型中的候选推送指数预测模型以及候选相似度识别模型的联合训练,可以实现对候选推送指数预测模型的模型参数更好的迭代优化,从而使得在联合训练场景下得到的训练好的目标推送指数预测模型可以具备精度更高的推送指数预测效果。
在该场景下,候选相似度识别模型可以仅用于优化候选推送指数预测模型的训练效果,由此,在进行推送内容的获取时,可以仅通过目标推送指数预测模型进行线上推送内容的获取,无需对训练好的目标相似度识别模型进行上线处理。
本公开提出的推送指数预测模型的训练方法,获取待训练的包括候选推送指数预测模型和候选相似度识别模型的候选组合模型,以及获取样本用户的第一资源样本和第一资源样本进行部分特征掩盖后的第一子样本集合,以及第二资源样本和第二资源样本进行部分特征掩盖后的第二子样本集合,通过第一资源样本和第一子样本集合、第二资源样本和第二子样本集合进行候选组合模型的模型训练,得到候选组合模型的训练损失,进一步地,根据训练损失对候选组合模型进行整体的参数调整,得到参数调整后的候选组合模型,并返回获取下一第一资源样本和下一第二资源样本,对参数调整后的候选组合模型继续进行模型训练,直至训练结束,得到训练好的包括目标推送指数预测模型以及目标相似度识别模型的目标组合模型。本公开中,通过对第一资源样本和第二资源样本进行部分特征掩盖,提高了候选组合模型的训练样本数量,避免了中长尾用户的少量历史数据所导致的模型学习效果欠佳的情况发生,优化了候选推送指数预测模型以及候选相似度识别模型的训练效果,针对中长尾用户的数据量少和/或信息不完整的情况,相较于候选推送指数预测模型的单独训练,通过对候选推送指数预测模型以及候选相似度识别模型的联合训练场景下得到的目标候选推送指数预测模型对于少量数据和/或信息不完整的数据的特征提取能力更强,推送指数预测准确率更高,提高了基于目标推送指数预测模型获取的中长尾用户的推送内容与中长尾用户的实际需求的匹配程度,优化了用户体验。
上述实施例中,关于第一资源样本和第二资源样本的部分特征掩盖,可结合图4进一步理解,图4为本公开另一实施例的推送指数预测模型的训练方法的流程示意图,如图4所示,该方法包括:
S401,获取预设置的样本分级目录,并从资源样本库中获取样本用户的第一资源样本和第二资源样本,其中,第一资源样本在样本分级目录中所属的第一分级目录与第二资源样本在样本分级目录中所属的第二分级目录不同。
在待推送的资源内容为产品链接的场景下,资源内容存在预设置的产品分级目录,在该场景下,可以将产品分级目录标记为基于资源内容得到的资源样本库的样本分级目录。
其中,样本分级目录包括一级目录和二级目录。
作为一种示例,设定样本分级目录中的一级目录可以为电子产品类和生活用品类等,在该场景下,电子产品类下的二级目录可以为手机产品类、耳机产品类等,以及生活用品类下的二级目录可以为母婴生活用品类等。
本公开实施例中,可以将样本用户的第一资源样本所属的分级目录标记为第一分级目录,以及将第二资源目录所属的分级目录标记为第二分级目录。
为了实现候选相似度模型的有效训练,第一资源样本所属的第一分级目录和第二资源样本所属的第二分级目录之间不同,可以理解为,可以从样本分级目录中获取不同目录路径下对应的资源样本,并分别作为第一资源样本和第二资源样本。
作为一种示例,可以从样本分级目录中获取电子产品类下的手机产品类对应的资源样本作为第一资源样本,以及获取生活用品类想的母婴生活用品类对应的资源样本作为第二资源样本。
S402,获取第一资源样本中的多个第一掩盖特征组合,以及第二资源样本中的多个第二掩盖特征组合。
本公开实施例中,在对第一资源样本进行部分特征掩盖时,可以获取第一资源样本中需要进行掩盖的特征组合,并标记为第一掩盖特征组合。
其中,关于第一资源样本中的多个第一掩盖特征组合的获取可结合下述内容理解:
可选地,获取第一资源样本中的第一资源样本特征集合,以及第一资源样本特征集合中各第一资源样本特征所属的第一候选特征类型。
本公开实施例中,可以将第一资源样本中包括的全部的特征标记为第一资源样本特征,并将全部的第一资源样本特征所组成的集合标记为第一资源样本中的第一资源样本特征集合。
其中,第一资源样本特征集合中的各第一资源样本特征存在各自所属的特征类型,可以将该特征类型标记为第一候选特征类型。
需要说明的是,第一资源样本特征集合中的各第一资源样本特征所属的第一候选特征类型可以包括id特征类型、分级目录特征类型、统计特征类型、会话(session)特征类型以及上下文特征类型等,此处不做具体限定。
可选地,从各第一候选特征类型中,获取第一资源样本特征集合的多个第一掩盖特征类型组合。
本公开实施例中,可以通过对第一资源样本进行多次的部分特征掩盖,得到第一资源样本的第一子样本集合,在该场景下,可以从各第一特征类型中,获取第一资源样本特征集合的多个第一掩盖特征类型组合。
其中,针对任一第一掩盖特征组合,从各第一候选特征类型中,获取至少一个第一掩盖特征类型,以得到至少一个第一掩盖特征类型组成的第一掩盖特征类型组合。
作为一种示例,设定第一候选特征类型包括特征类型1、特征类型2、特征类型3、特征类型4和特征类型5,在该示例中,获取特征类型1、特征类型3和特征类型5三个特征类型作为第一候选特征类型中的第一掩盖特征类型,并将特征类型1、特征类型3和特征类型5三个特征类型组成的组合标记为第一掩盖特征类型组合。
本公开实施例中,多个第一掩盖特征类型组合各自包括的特征类型不同,作为另一种示例,依然设定第一候选特征类型包括特征类型1、特征类型2、特征类型3、特征类型4和特征类型5,则在该示例中,可以获取特征类型2和特征类型4两个特征类型作为第一候选特征类型中的第一掩盖特征类型,并将特征类型2和特征类型4两个特征类型组成的组合标记为第一掩盖特征类型组合。
需要说明的是,基于第一候选特征类型得到的多个第一掩盖特征组类型组合各自包括的特征类型不同。
可选地,针对任一第一掩盖特征类型组合的任一第一掩盖特征类型,获取第一掩盖特征类型在第一资源样本特征集合中的至少一个第一掩盖特征,以得到至少一个第一掩盖特征组成的第一掩盖特征组合。
本公开实施例中,获取多个第一掩盖特征类型组合后,针对任一第一掩盖特征类型组合,可以从第一资源样本中获取属于该第一掩盖特征类型组合中包括的掩盖特征类型的至少一个特征,并将该至少一个特征标记为第一资源样本中的第一掩盖特征,进而得到至少一个第一掩盖特征组成的第一掩盖特征组合。
作为一种示例,如图3所示,图3中的N1为第一资源样本,N1的第一掩盖特征类型组合分别为特征类型1、特征类型3和特征类型5组成的第一掩盖特征类型组合,以及特征类型2和特征类型4组成的第一掩盖特征类型组合。
如图3所示,可以分别获取N1中属于特征类型1、特征类型3和特征类型5的部分特征,并将该部分特征组成的组合标记为N1的第一掩盖特征组合。
相应地,可以分别获取N1中属于特征类型2和特征类型3的部分特征,并将该部分特征组成的组合标记为N1的第一掩盖特征组合。
本公开实施例中,在对第二资源样本进行部分特征掩盖时,可以获取第二资源样本中需要进行掩盖的特征组合,并标记为第二掩盖特征组合。
其中,关于第二资源样本中的多个第二掩盖特征组合的获取可结合下述内容理解:
可选地,获取第二资源样本中的第二资源样本特征集合,以及第二资源样本特征集合中各第二资源样本特征所属的第二候选特征类型。
本公开实施例中,可以将第二资源样本中的全部特征组成的组合标记为第二资源样本特征集合,在该场景下,可以将各第二资源样本特征所属的特征类型标记为第二候选特征类型。
其中,关于第二候选特征类型的具体获取过程,可结合上述关于第一候选特征类型的获取过程进行理解,此处不在赘述。
可选地,从各第二候选特征类型中,获取第二资源样本特征集合的多个第二掩盖特征类型组合。
本公开实施例中,针对任一第二掩盖特征组合,从各第二候选特征类型中,获取至少一个第二掩盖特征类型,以得到至少一个第二掩盖特征类型组成的第二掩盖特征组合。
作为一种示例,设定第二候选特征类型包括特征类型1、特征类型2、特征类型3、特征类型4和特征类型5,在该示例中,获取特征类型1和特征类型2两个特征类型作为第二候选特征类型中的第二掩盖特征类型,并将特征类型1和特征类型2两个特征类型组成的组合标记为第二掩盖特征类型组合。
需要说明的是,基于第二候选特征类型得到的多个第二掩盖特征组类型组合各自包括的特征类型不同。
可选地,针对任一第二掩盖特征类型组合的任一第二掩盖特征类型,获取第二掩盖特征类型在第二资源样本特征集合中的至少一个第二掩盖特征,以得到至少一个第二掩盖特征组成的第二掩盖特征组合。
作为一种示例,如图3所示,图3中的NX为第二资源样本,NX的第二掩盖特征类型组合为特征类型1和特征类型2组成的第二掩盖特征类型组合。
S403,针对任一第一掩盖特征组合,从第一资源样本中对第一掩盖特征组合中的各第一掩盖特征进行删除,得到第一资源样本掩盖后的第一子样本。
作为一种示例,如图3所示,设定图3示出的第一资源样本N1的第一掩盖特征组合为属于特征类型1、特征类型3和特征类型5的第一掩盖特征组成的特征组合,以及属于特征类型2和特征类型4的第一掩盖特征组成的特征组合。
在该示例下,可以对特征类型1、特征类型3和特征类型5下的各第一掩盖特征从N1中删除,从而得到图3示出的N1的第一子样本N1-A。
以及,对特征类型2和特征类型4下的各第一掩盖特征从N1中删除,从而得到图3示出的N1的第一子样本N1-B。
S404,针对任一第二掩盖特征组合,从第二资源样本中对第二掩盖特征组合中的各第二掩盖特征进行删除,得到第二资源样本掩盖后的第二子样本。
作为一种示例,如图3所示,设定图3示出的第二资源样本NX的第二掩盖特征组合为属于特征类型1和特征类型2的第二掩盖特征组成的特征组合。
在该示例下,可以对特征类型1和特征类型2下的各第二掩盖特征从NX中删除,从而得到图3示出的NX的第二子样本NX-A。
本公开提出的推送指数预测模型的训练方法,获取第一资源样本和对应的第二资源样本,并获取第一资源样本中的多个第一掩盖特征组合,并基于多个第一掩盖特征组合得到第一资源样本进行多次的部分特征掩盖后得到的第一子样本集合,以及获取第二资源样本中的多个第二掩盖特征组合,并基于多个第二掩盖特征组合得到第二资源样本进行多次的部分特征掩盖后得到的第二子样本集合。本公开中,通过获取不同的第一资源样本和第二资源样本,实现了对候选相似度识别模型的有效训练,通过分别对第一资源样本和第二资源样本进行部分特征掩盖,得到第一资源样本的第一子样本集合和第二资源样本的第二子样本集合,提高了候选推送指数预测模型和候选相似度识别模型的训练样本的数量,进而优化了候选推送指数预测模型和候选相似度识别模型的训练效果。
上述实施例中,关于候选组合模型中的候选推送指数预测模型和候选相似度识别模型的模型训练,还可以结合图5进一步理解,图5为本公开另一实施例的推送指数预测模型的训练方法的流程示意图,如图5所示,该方法包括:
S501,根据第一资源样本和第一子样本集合,以及第二资源样本和第二子样本集合,获取候选推送指数预测模型的第一训练样本以及候选相似度识别模型的第二训练样本。
可选地,获取样本用户的样本用户信息,并根据样本用户信息和第一资源样本,得到候选推送指数预测模型的第一训练样本。
本公开实施例中,候选推送指数预测模型可以基于输入模型的样本用户信息以及资源内容,对资源内容推送给样本用户的推送指数进行预测。
在该场景下,可以获取样本用户信息以及样本用户的第一资源样本,并将样本用户信息和第一资源样本作为输入候选推送指数预测模型的第一训练样本。
作为一种示例,如图2所示,图2示出的用户信息为样本用户的样本用户信息,图2示出的N1为样本用户的第一资源样本,在图2示出的候选推送指数预测模型的训练场景下,可以将图2示出的用户信息与N1作为输入候选推送指数预测模型进行训练的第一训练样本。
可选地,对第一子样本集合中的各第一子样本以及第二子样本集合中的各第二子样本进行两两配对,得到候选相似度识别模型的第二训练样本。
其中,可以获取第一子样本集合中获取任意两个第一子样本并组成第一子样本对,以及获取第一子样本集合中的任一第一子样本和第二子样本集合中的任一第二子样本并组成第二子样本对,以及获取第二子样本集合中获取任意两个第二子样本并组成第三子样本对,并根据第一子样本对和/或第二子样本对和/或第三子样本对生成候选相似度识别模型的第二训练样本,其中,第一子样本对和第三子样本对的标签信息为相似标签,第二子样本对的标签信息为不相似标签。
本公开实施例中,候选相似度识别模型可以对输入模型的多个样本进行相似度的识别,进而根据识别结果实现候选相似度识别模型的迭代优化。
在该场景下,可以从第一子样本集合中获取任意两个第一子样本组成第一子样本对,并将第一子样本对作为候选相似度识别模型的第二训练样本。
其中,第一子样本对中的两个第一子样本均基于同一第一资源样本得到,由此可知,在基于第一子样本对生成候选相似度识别模型的第二训练样本时,其标签信息为相似标签。
以及,也可以从第一子样本集合中获取任一第一子样本,从第二子样本集合中获取任一第二子样本,以得到该第一子样本和该第二子样本组成的第二子样本对,并将第二子样本对作为候选相似度识别模型的第二训练样本。
其中,第二子样本对中的第一子样本是基于第一资源样本得到,第二子样本是基于第二资源样本得到,由此可知,在基于第二子样本对生成候选相似度识别模型的第二训练样本时,其标签信息为不相似标签。
相应地,还可以从第二子样本集合中获取任意两个第二子样本组成第三子样本对,并将第三子样本对作为候选相似度识别模型的第二训练样本。
其中,第三子样本对中的两个第二子样本均基于同一第二资源样本得到,由此可知,在基于第三子样本对生成候选相似度识别模型的第二训练样本时,其标签信息为相似标签。
作为一种示例,如图2所示,图2示出的N1-A和N1-B为第一资源样本N1的第一子样本,可以将图2示出的N1-A和N1-B组成的第一子样本对作为图2示出的候选相似度识别模型的第二训练样本。
作为另一种示例,如图3所示,图3示出的N1-A为第一资源样本N1的第一子样本,图3示出的NX-A为第二资源样本NX的第二子样本,可以将N1-A和NX-A组成的第二子样本对作为图3示出的候选相似度识别模型的第二训练样本。
S502,基于第一训练样本获取候选推送指数预测模型的第一损失值,以及基于第二训练样本获取候选相似度识别模型的第二损失值。
可选地,可以获取第一训练样本中的样本用户信息和第一资源样本,并通过候选推送指数预测模型的第一模型支线提取样本用户信息中的样本用户特征,以及通过候选推送指数预测模型的第二模型支线提取第一资源样本中的第一资源样本特征。
作为一种示例,如图2所示,可以将图2示出的特征嵌入层1-全连接层1和嵌入层1组成的模型支线标记为候选推送指数预测模型的第一模型支线,在该场景下,可以将样本用户的用户信息输入第一模型支线,通过第一模型支线对样本用户信息中的样本用户特征进行提取。
相应地,可以将图2示出的特征嵌入层2-全连接层2-嵌入层2组成的模型支线标记为候选推送指数预测模型的第二模型支线,在该场景下,可以将第一资源样本N1输入至第二模型支线,进行第一资源样本中的第一资源样本特征的提取。
可选地,基于样本用户特征和第一资源样本特征,输出第一资源样本基于样本用户的预测资源推送指数。
本公开实施例中,通过候选推送指数预测模型的各模型层基于样本用户特征以及第一资源样本特征,可以对第一资源样本推送给样本用户的推送指数进行预测,并将模型的输出的预测指数标记为第一资源样本基于样本用户的预测资源推送指数。
作为一种示例,如图2所示,可以通过图2示出的全连接层1、嵌入层1以及全连接层2和嵌入层2对第一资源样本基于样本用户的推送指数进行预测,从而得到图2示出的候选推送指数预测模型输出的第一资源样本N1基于样本用户的预测资源推送指数。
可选地,获取第一训练样本的标签资源推送指数,以得到预测资源推送指数基于标签资源推送指数的第一损失值。
本公开实施例中,可以从第一训练样本的标签信息中,获取标签资源推送指数,并基于相关技术中的损失值获取算法对标签资源推送指数和预测资源推送指数进行算法处理,从而得到预测资源推送指数基于标签资源推送指数的损失值,作为第一损失值。
其中,第一损失值可以为有监督损失值(supervised loss),也可以为其他类型的损失值,此处不做具体限定。
可选地,获取第二训练样本中的第三子样本和第四子样本,并通过候选相似度识别模型的第三模型支线提取第三子样本中的第二资源样本特征,以及通过第四模型支线提取第四子样本中的第三资源样本特征。
本公开实施例中,可以将第二训练样本中的样本对分别标记为第三子样本和第四子样本,在该场景下,可以通过候选相似度识别模型识别第三子样本与第四子样本的相似度,进而根据相似度识别结果实现候选相似度识别模型的迭代优化。
作为一种示例,如图3所示,可以将图3示出的特征嵌入层3-全连接层3-嵌入层3组成的模型支线标记为候选相似度识别模型的第三模型支线,在该场景下,设定第三子样本为图3示出的N1-A,则可以将N1-A输入至图3示出的候选相似度识别模型,通过候选相似度识别模型中的第三模型支线对第三子样本进行特征提取,得到N1-A中的第二资源样本特征。
相应地,可以将图3示出的特征嵌入层4-全连接层4-嵌入层4组成的模型支线标记为候选相似度识别模型的第四模型支线,在该场景下,设定第四子样本为图3示出的N1-B,则可以将N1-B输入至图3示出的候选相似度识别模型,通过候选相似度识别模型中的第四模型支线对第四子样本进行特征提取,得到N1-B中的第三资源样本特征。
可选地,根据第二资源样本特征和第三资源样本特征,得到候选相似度识别模型输出的第三子样本和第四子样本的预测相似度。
本公开实施例中,通过候选相似度识别模型的各模型层识别第二资源样本特征和第三资源样本特征的特征相似度,从而输出第三子样本和第四子样本的预测相似度。
作为一种示例,如图3所示,可以通过图3示出的全连接层3、嵌入层3以及全连接层4和嵌入层4获取第三子样本N1-A的第二资源样本特征和第四子样本N1-B的第三资源样本特征之间的相似度,从而得到图3示出的候选相似度势必模型输出的第三子样本N1-A和第四子样本N1-B的预测相似度。
可选地,获取第二训练样本的标签相似度,以得到预测相似度基于标签相似度的第二损失值。
本公开实施例中,可以从第二训练样本的标签信息中获取第二训练样本中的第三子样本和第四子样本的标签相似度,并基于相关技术中的损失值获取算法对预测相似度和标签相似度进行算法处理,从而得到预测相似度基于标签相似度的第二损失值。
其中,第二损失值可以为对比损失值(contrastive loss),也可以为其他类型的损失值,此处不做具体限定。
S503,基于第一损失值和第二损失值,获取候选推送指数预测模型和候选相似度识别模型的组合模型的训练损失。
本公开实施例中,可以获取第一损失值的第一权重,和第二损失值的第二权重,并根据第一权重和第二权重对第一损失值和第二损失值进行加权,得到候选推送指数预测模型和候选相似度识别模型组成的候选组合模型的训练损失。
可选地,可以分别对候选推送指数预测模型的训练得到的第一损失值以及候选相似度识别模型的训练得到的第二损失值进行权重设置,并分别标记为第一损失值的第一权重,以及第二损失值的第二权重。
在该场景下,可以基于相关技术中的加权算法基于第一权重和第二权重对第一损失值和第二损失值进行加权处理,并将加权处理后得到的损失值确定为候选推送指数预测模型和候选相似度识别模型组成的候选组合模型的训练损失。
S504,根据训练损失对候选组合模型进行整体的参数调整,得到参数调整后的候选组合模型。
针对中长尾用户的数据量少和/或信息不完整的情况,本公开实施例中,可以对候选推送指数预测模型的特征提取能力进行优化。
可选地,获取候选组合模型的候选资源特征提取层集合,其中,候选资源特征提取层集合基于候选推送指数预测模型和候选相似度识别模型各自的资源特征提取层组成。
本公开实施例中,候选推送指数预测模型中包括有提取用户特征的用户特征提取层,以及提取资源样本特征的资源特征提取层,其中,可以将候选推送指数预测模型中用于提取资源特征的资源特征提取层以及候选相似度识别模型的资源特征提取层分别标记为候选资源特征提取层,并将该部分候选资源特征提取层所组成的组合标记为候选组合模型中的候选资源特征提取层集合。
作为一种示例,如图2所示,可以将图2示出的候选推送指数预测模型中用于提取N1的资源样本特征的特征嵌入层2,以及候选相似度识别模型中用户提取N1-A的资源样本特征的特征嵌入层3和提取N1-B的资源样本特征的特征嵌入层4,标记为图2示出的候选组合模型中的候选姿态特征提取层集合。
可选地,根据训练损失对候选资源特征提取层集合中的各候选资源特征提取层进行层参数调整,得到调整后的候选资源特征提取层集合,其中,候选资源特征提取层集合中各候选资源特征提取层的层参数相同。
本公开实施例中,可以通过训练损失对候选资源特征提取层集合中的各候选资源特征提取层的层参数进行整体的调整优化,从而得到调整后的候选资源特征提取层集合。
作为一种示例,如图2所示,设定图2示出的候选组合模型的候选资源特征提取层集合包括图2示出的特征嵌入层2、特征嵌入层3和特征嵌入层4,则可以基于训练损失对图2示出的特征嵌入层2、特征嵌入层3和特征嵌入层4进行整体的层参数的调整,从而得到调整后的候选资源特征提取层集合。
需要说明的是,候选资源特征提取层集合中各候选资源特征提取层的层参数相同,可以理解为,针对图2示出的包括特征嵌入层2、特征嵌入层3和特征嵌入层4的候选资源特征提取层集合,该集合中的特征嵌入层2、特征嵌入层3和特征嵌入层4各自的层参数相同。
可选地,基于层参数调整后的候选资源特征提取层集合,得到参数调整后的候选组合模型。
本公开实施例中,基于训练损失对候选组合模型进行参数调整时,还需要对除了候选资源特征提取层集合之外的剩余模型部分进行参数调整,进而基于调整后的候选资源特征提取层集合,以及候选组合模型中的调整后的剩余模型部分,进而得到参数调整后的候选组合模型。
S505,返回获取下一第一资源样本和下一第二资源样本对参数调整后的候选组合模型继续进行训练,直至训练结束,得到训练好的目标推送指数预测模型和目标相似度识别模型组成的目标组合模型,其中,目标推送指数预测模型用于进行线上推送内容的确定。
本公开实施例中,关于步骤S505的详细信息可参见上述相关内容理解,此处不再赘述。
本公开提出的推送指数预测模型的训练方法,根据第一资源样本和第一子样本集合,以及第二资源样本和第二子样本集合,得到候选推送指数预测模型的第一训练样本以及候选相似度识别模型的第二训练样本,以得到候选推送指数预测模型基于第一训练样本得到的第一损失值,以及候选相似度识别模型基于第二训练样本得到的第二损失值,进而得到候选组合模型的训练损失。进一步地,基于训练损失对候选组合模型进行参数调整,得到参数调整后的候选组合模型,并返回对候选组合模型继续进行模型训练,直至训练结束,得到训练好的目标组合模型。本公开中,通过第一资源样本和第一子样本集合以及第二资源样本和第二子样本集合得到第一训练样本和第二训练样本,提高了候选组合模型的训练样本数量,通过候选组合模型的总的训练损失,对候选推送指数预测模型和候选相似度识别模型的资源特征提取层进行整体的层参数调整,提高了候选推送指数预测模型的资源特征提取层的特征提取能力,优化了候选推送指数预测模型的训练效果。
本公开还提出一种推送内容的获取方法,可结合图6理解,图6为本公开一实施例的推送内容的获取方法的流程示意图,如图6所示,该方法包括:
S601,获取训练好的目标推送指数预测模型。
其中,目标推送指数预测模型基于上述图1至图5实施例提出的推送指数预测模型的训练方法得到。
本公开实施例中,可以对待推送给用户端的资源内容进行推送指数的预测,其中,可以通过训练好的目标推送指数预测模型得到资源内容的预测推送指数。
S602,获取用户端待推送的候选资源内容集合,并通过目标推送指数预测模型输出候选资源内容集合中各候选资源内容的目标推送指数。
本公开实施例中,可以将待推送给用户端的资源内容标记为候选资源内容,并将全部的候选资源内容组成的集合标记为待推送的候选资源内容集合。
可选地,针对任一候选资源内容,可以获取用户端的用户信息,并将用户信息与待推送的候选资源内容输入至训练好的目标推送指数预测模型中,通过目标推送指数预测模型输出该候选资源内容基于该用户端的目标推送指数。
可以理解为,目标推送指数可以用于表征候选资源内容与用户端的实际需求的匹配程度。
S603,根据目标推送指数由高至低的顺序对各候选资源内容进行排序,得到排序后的候选资源内容队列,并从候选资源内容队列中获取推送给用户端的目标推送资源内容。
本公开实施例中,可以基于目标推送指数由高至低的顺序,对各候选资源内容进行排序,并将排序后得到的队列标记为候选资源内容队列。
可选地,可以获取预设置的推送给用户端的资源内容数量,并从候选资源内容队列的首位开始获取该数量的候选资源内容,并将该部分候选资源内容确定为推送给用户端的目标推送资源内容。
本公开提出的推送内容的获取方法,获取训练好的目标推送指数预测模型以及待推送的候选资源内容集合,并通过目标推送指数预测模型得到候选资源内容集合中各候选资源内容的目标推送指数。进一步地,根据目标推送指数进行各候选资源内容的排序,得到排序后的候选资源内容队列,并从候选资源内容队列中获取推送给用户端的目标资源内容。本公开中,目标推送指数预测模型基于图1至图5实施例提出的方法训练得到,在针对中长尾用户对应的用户端的推送内容获取的场景下,提高了中长尾用户的用户需求识别的准确率,通过目标推送指数预测模型得到各候选资源内容基于用户端的需求信息的目标推送指数,进而根据目标推送指数得到目标资源内容,提高了目标资源内容与用户端的实际需求的匹配程度,优化了推送内容的获取方法,提高了用户体验。
上述几种实施例提出的推送指数预测模型的训练方法相对应,本公开的一个实施例还提出了一种推送指数预测模型的训练装置,由于本公开实施例提出的推送指数预测模型的训练装置与上述几种实施例提出的推送指数预测模型的训练方法相对应,因此上述的推送指数预测模型的训练方法的实施方式也适用于本公开实施例提出的推送指数预测模型的训练装置,在下述实施例中不再详细描述。
图7为本公开一实施例的推送指数预测模型的训练装置的结构示意图,如图7所示,推送指数预测模型的训练装置700,包括第一获取模块71、第二获取模块72、第一训练模块73、调整模块74和第二训练模块75,其中:
第一获取模块71,用于获取待训练的候选组合模型,其中,候选组合模型包括候选推送指数预测模型和候选相似度识别模型。
第二获取模块72,用于获取样本用户的第一资源样本和对应的第二资源样本,并对第一资源样本和第二资源样本分别进行部分特征掩盖,得到第一资源样本掩盖后的第一子样本集合以及第二资源样本掩盖后的第二子样本集合,其中,第一资源样本和第二资源样本不同。
第一训练模块73,用于根据第一资源样本和第一子样本集合,以及第二资源样本和第二子样本集合,对候选组合模型进行模型训练,得到候选组合模型的训练损失。
调整模块74,用于根据训练损失对候选组合模型进行整体的参数调整,得到参数调整后的候选组合模型。
第二训练模块75,用于返回获取下一第一资源样本和下一第二资源样本对参数调整后的候选组合模型继续进行训练,直至训练结束,得到训练好的目标推送指数预测模型和目标相似度识别模型组成的目标组合模型,其中,目标推送指数预测模型用于进行线上推送内容的确定。
本公开实施例中,调整模块74,还用于:获取候选组合模型的候选资源特征提取层集合,其中,候选资源特征提取层集合基于候选推送指数预测模型和候选相似度识别模型各自的资源特征提取层组成。根据训练损失对候选资源特征提取层集合中的各候选资源特征提取层进行层参数调整,得到调整后的候选资源特征提取层集合,其中,候选资源特征提取层集合中各候选资源特征提取层的层参数相同。基于层参数调整后的候选资源特征提取层集合,得到参数调整后的候选组合模型。
本公开实施例中,第二获取模块72,还用于:获取预设置的样本分级目录,并从资源样本库中获取样本用户的第一资源样本和第二资源样本,其中,第一资源样本在样本分级目录中所属的第一分级目录与第二资源样本在样本分级目录中所属的第二分级目录不同。获取第一资源样本中的多个第一掩盖特征组合,以及第二资源样本中的多个第二掩盖特征组合。针对任一第一掩盖特征组合,从第一资源样本中对第一掩盖特征组合中的各第一掩盖特征进行删除,得到第一资源样本掩盖后的第一子样本。针对任一第二掩盖特征组合,从第二资源样本中对第二掩盖特征组合中的各第二掩盖特征进行删除,得到第二资源样本掩盖后的第二子样本。
本公开实施例中,第二获取模块72,还用于:获取第一资源样本中的第一资源样本特征集合,以及第一资源样本特征集合中各第一资源样本特征所属的第一候选特征类型。从各第一候选特征类型中,获取第一资源样本特征集合的多个第一掩盖特征类型组合。针对任一第一掩盖特征类型组合的任一第一掩盖特征类型,获取第一掩盖特征类型在第一资源样本特征集合中的至少一个第一掩盖特征,以得到至少一个第一掩盖特征组成的第一掩盖特征组合。
本公开实施例中,第二获取模块72,还用于:针对任一第一掩盖特征组合,从各第一候选特征类型中,获取至少一个第一掩盖特征类型,以得到至少一个第一掩盖特征类型组成的第一掩盖特征类型组合。
本公开实施例中,第二获取模块72,还用于:获取第二资源样本中的第二资源样本特征集合,以及第二资源样本特征集合中各第二资源样本特征所属的第二候选特征类型。从各第二候选特征类型中,获取第二资源样本特征集合的多个第二掩盖特征类型组合。针对任一第二掩盖特征类型组合的任一第二掩盖特征类型,获取第二掩盖特征类型在第二资源样本特征集合中的至少一个第二掩盖特征,以得到至少一个第二掩盖特征组成的第二掩盖特征组合。
本公开实施例中,第二获取模块72,还用于:针对任一第二掩盖特征组合,从各第二候选特征类型中,获取至少一个第二掩盖特征类型,以得到至少一个第二掩盖特征类型组成的第二掩盖特征类型组合。
本公开实施例中,第一训练模块73,还用于:根据第一资源样本和第一子样本集合,以及第二资源样本和第二子样本集合,获取候选推送指数预测模型的第一训练样本以及候选相似度识别模型的第二训练样本。基于第一训练样本获取候选推送指数预测模型的第一损失值,以及基于第二训练样本获取候选相似度识别模型的第二损失值。基于第一损失值和第二损失值,获取候选推送指数预测模型和候选相似度识别模型组成的候选组合模型的训练损失。
本公开实施例中,第一训练模块73,还用于:获取样本用户的样本用户信息,并根据样本用户信息和第一资源样本,得到候选推送指数预测模型的第一训练样本。对第一子样本集合中的各第一子样本以及第二子样本集合中的各第二子样本进行两两配对,得到候选相似度识别模型的第二训练样本。
本公开实施例中,第一训练模块73,还用于:获取第一子样本集合中获取任意两个第一子样本并组成第一子样本对,以及获取第一子样本集合中的任一第一子样本和第二子样本集合中的任一第二子样本并组成第二子样本对,以及获取第二子样本集合中获取任意两个第二子样本并组成第三子样本对,。根据第一子样本对和/或第二子样本对和/或第三子样本对生成候选相似度识别模型的第二训练样本,其中,第一子样本对和第三子样本对的标签信息为相似标签,第二子样本对的标签信息为不相似标签。
本公开实施例中,第一训练模块73,还用于:获取第一训练样本中的样本用户信息和第一资源样本。通过候选推送指数预测模型的第一模型支线提取样本用户信息中的样本用户特征,以及通过候选推送指数预测模型的第二模型支线提取第一资源样本中的第一资源样本特征。基于样本用户特征和第一资源样本特征,输出第一资源样本基于样本用户的预测资源推送指数。获取第一训练样本的标签资源推送指数,以得到预测资源推送指数基于标签资源推送指数的第一损失值。
本公开实施例中,第一训练模块73,还用于:获取第二训练样本中的第三子样本和第四子样本。通过候选相似度识别模型的第三模型支线提取第三子样本中的第二资源样本特征,以及通过第四模型支线提取第四子样本中的第三资源样本特征。根据第二资源样本特征和第三资源样本特征,得到候选相似度识别模型输出的第三子样本和第四子样本的预测相似度。获取第二训练样本的标签相似度,以得到预测相似度基于标签相似度的第二损失值。
本公开实施例中,第一训练模块73,还用于:获取第一损失值的第一权重,和第二损失值的第二权重。根据第一权重和第二权重对第一损失值和第二损失值进行加权,得到候选推送指数预测模型和候选相似度识别模型组成的候选组合模型的训练损失。
本公开提出的推送指数预测模型的训练装置,获取待训练的包括候选推送指数预测模型和候选相似度识别模型的候选组合模型,以及获取样本用户的第一资源样本和第一资源样本进行部分特征掩盖后的第一子样本集合,以及第二资源样本和第二资源样本进行部分特征掩盖后的第二子样本集合,通过第一资源样本和第一子样本集合、第二资源样本和第二子样本集合进行候选组合模型的模型训练,得到候选组合模型的训练损失,进一步地,根据训练损失对候选组合模型进行整体的参数调整,得到参数调整后的候选组合模型,并返回获取下一第一资源样本和下一第二资源样本,对参数调整后的候选组合模型继续进行模型训练,直至训练结束,得到训练好的包括目标推送指数预测模型以及目标相似度识别模型的目标组合模型。本公开中,通过对第一资源样本和第二资源样本进行部分特征掩盖,提高了候选组合模型的训练样本数量,避免了中长尾用户的少量历史数据所导致的模型学习效果欠佳的情况发生,优化了候选推送指数预测模型以及候选相似度识别模型的训练效果,针对中长尾用户的数据量少和/或信息不完整的情况,相较于候选推送指数预测模型的单独训练,通过对候选推送指数预测模型以及候选相似度识别模型的联合训练场景下得到的目标候选推送指数预测模型对于少量数据和/或信息不完整的数据的特征提取能力更强,推送指数预测准确率更高,提高了基于目标推送指数预测模型获取的中长尾用户的推送内容与中长尾用户的实际需求的匹配程度,优化了用户体验。
上述几种实施例提出的推送内容的获取方法相对应,本公开的一个实施例还提出了一种推送内容的获取装置,由于本公开实施例提出的推送内容的获取装置与上述几种实施例提出的推送内容的获取方法相对应,因此上述的推送内容的获取方法的实施方式也适用于本公开实施例提出的推送内容的获取装置,在下述实施例中不再详细描述。
图8为本公开一实施例的推送内容的获取装置的结构示意图,如图8所示,推送内容的获取装置800,包括第三获取模块81、第四获取模块82和推送模块83,其中:
第三获取模块81,用于获取训练好的目标推送指数预测模型,其中,目标推送指数预测模型基于上述权利要求15-27任一项的推送指数预测模型的训练装置得到。
第四获取模块82,用于获取用户端待推送的候选资源内容集合,并通过目标推送指数预测模型输出候选资源内容集合中各候选资源内容的目标推送指数。
推送模块83,用于根据目标推送指数由高至低的顺序对各候选资源内容进行排序,得到排序后的候选资源内容队列,并从候选资源内容队列中获取推送给用户端的目标推送资源内容。
本公开提出的推送内容的获取装置,获取训练好的目标推送指数预测模型以及待推送的候选资源内容集合,并通过目标推送指数预测模型得到候选资源内容集合中各候选资源内容的目标推送指数。进一步地,根据目标推送指数进行各候选资源内容的排序,得到排序后的候选资源内容队列,并从候选资源内容队列中获取推送给用户端的目标资源内容。本公开中,目标推送指数预测模型基于图1至图5实施例提出的方法训练得到,在针对中长尾用户对应的用户端的推送内容获取的场景下,提高了中长尾用户的用户需求识别的准确率,通过目标推送指数预测模型得到各候选资源内容基于用户端的需求信息的目标推送指数,进而根据目标推送指数得到目标资源内容,提高了目标资源内容与用户端的实际需求的匹配程度,优化了推送内容的获取方法,提高了用户体验。
根据本公开的实施例,本公开还提出了一种电子设备、一种可读存储介质和一种计算机程序产品。
图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图9所示,设备900包括计算单元901,其可以根据存储在只读存储器(ROM)902中的计算机程序或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序,来执行各种适当的动作和处理。在RAM 903中,还可存储设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
设备900中的多个部件连接至I/O接口905,包括:输入单元906,例如键盘、鼠标等;输出单元906,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如推送指数预测模型的训练方法和/或推送内容的获取方法。例如,在一些实施例中,推送指数预测模型的训练方法和/或推送内容的获取方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由计算单元901执行时,可以执行上文描述的推送指数预测模型的训练方法和/或推送内容的获取方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行推送指数预测模型的训练方法和/或推送内容的获取方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提出给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提出与用户账号的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户账号显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户账号可以通过该键盘和该指向装置来将输入提出给计算机。其它种类的装置还可以用于提出与用户账号的交互;例如,提出给用户账号的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户账号的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户账号界面或者网络浏览器的用户账号计算机,用户账号可以通过该图形用户账号界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (31)
1.一种推送指数预测模型的训练方法,其中,所述方法包括:
获取待训练的候选组合模型,其中,所述候选组合模型包括候选推送指数预测模型和候选相似度识别模型;
获取样本用户的第一资源样本和对应的第二资源样本,并对所述第一资源样本和所述第二资源样本分别进行部分特征掩盖,得到所述第一资源样本掩盖后的第一子样本集合以及所述第二资源样本掩盖后的第二子样本集合,其中,所述第一资源样本和所述第二资源样本不同;
根据所述第一资源样本和所述第一子样本集合,以及所述第二资源样本和所述第二子样本集合,对所述候选组合模型进行模型训练,得到所述候选组合模型的训练损失;
根据所述训练损失对所述候选组合模型进行整体的参数调整,得到参数调整后的候选组合模型;
返回获取下一第一资源样本和下一第二资源样本对参数调整后的候选组合模型继续进行训练,直至训练结束,得到训练好的目标推送指数预测模型和目标相似度识别模型组成的目标组合模型,其中,所述目标推送指数预测模型用于进行线上推送内容的确定。
2.根据权利要求1所述的方法,其中,所述根据所述训练损失对所述候选组合模型进行整体的参数调整,得到参数调整后的候选组合模型,包括:
获取所述候选组合模型的候选资源特征提取层集合,其中,所述候选资源特征提取层集合基于所述候选推送指数预测模型和候选相似度识别模型各自的资源特征提取层组成;
根据所述训练损失对所述候选资源特征提取层集合中的各候选资源特征提取层进行层参数调整,得到调整后的候选资源特征提取层集合,其中,所述候选资源特征提取层集合中各候选资源特征提取层的层参数相同;
基于层参数调整后的候选资源特征提取层集合,得到参数调整后的候选组合模型。
3.根据权利要求1所述的方法,其中,所述获取样本用户的第一资源样本和对应的第二资源样本,并对所述第一资源样本和所述第二资源样本分别进行部分特征掩盖,得到所述第一资源样本掩盖后的第一子样本集合以及所述第二资源样本掩盖后的第二子样本集合,其中,所述第一资源样本和所述第二资源样本不同,包括:
获取预设置的样本分级目录,并从资源样本库中获取所述样本用户的所述第一资源样本和所述第二资源样本,其中,所述第一资源样本在所述样本分级目录中所属的第一分级目录与所述第二资源样本在所述样本分级目录中所属的第二分级目录不同;
获取所述第一资源样本中的多个第一掩盖特征组合,以及所述第二资源样本中的多个第二掩盖特征组合;
针对任一第一掩盖特征组合,从所述第一资源样本中对所述第一掩盖特征组合中的各第一掩盖特征进行删除,得到所述第一资源样本掩盖后的第一子样本;
针对任一第二掩盖特征组合,从所述第二资源样本中对所述第二掩盖特征组合中的各第二掩盖特征进行删除,得到所述第二资源样本掩盖后的第二子样本。
4.根据权利要求3所述的方法,其中,所述获取所述第一资源样本中的多个第一掩盖特征组合,包括:
获取所述第一资源样本中的第一资源样本特征集合,以及所述第一资源样本特征集合中各第一资源样本特征所属的第一候选特征类型;
从各第一候选特征类型中,获取所述第一资源样本特征集合的多个第一掩盖特征类型组合;
针对任一第一掩盖特征类型组合的任一第一掩盖特征类型,获取所述第一掩盖特征类型在所述第一资源样本特征集合中的至少一个第一掩盖特征,以得到所述至少一个第一掩盖特征组成的第一掩盖特征组合。
5.根据权利要求4所述的方法,其中,所述从各第一特征类型中,获取所述第一资源样本特征集合的多个第一掩盖特征类型组合,包括:
针对任一第一掩盖特征组合,从各第一候选特征类型中,获取至少一个第一掩盖特征类型,以得到所述至少一个第一掩盖特征类型组成的所述第一掩盖特征类型组合。
6.根据权利要求3所述的方法,其中,所述获取所述第二资源样本中的多个第二掩盖特征组合,包括:
获取所述第二资源样本中的第二资源样本特征集合,以及所述第二资源样本特征集合中各第二资源样本特征所属的第二候选特征类型;
从各第二候选特征类型中,获取所述第二资源样本特征集合的多个第二掩盖特征类型组合;
针对任一第二掩盖特征类型组合的任一第二掩盖特征类型,获取所述第二掩盖特征类型在所述第二资源样本特征集合中的至少一个第二掩盖特征,以得到所述至少一个第二掩盖特征组成的第二掩盖特征组合。
7.根据权利要求6所述的方法,其中,所述从各第二候选特征类型中,获取所述第二资源样本特征集合的多个第二掩盖特征类型组合,包括:
针对任一第二掩盖特征组合,从各第二候选特征类型中,获取至少一个第二掩盖特征类型,以得到所述至少一个第二掩盖特征类型组成的所述第二掩盖特征类型组合。
8.根据权利要求1所述的方法,其中,所述根据所述第一资源样本和所述第一子样本集合,以及所述第二资源样本和所述第二子样本集合,对所述候选组合模型进行模型训练,得到所述候选组合模型的训练损失,包括:
根据所述第一资源样本和所述第一子样本集合,以及所述第二资源样本和所述第二子样本集合,获取所述候选推送指数预测模型的第一训练样本以及所述候选相似度识别模型的第二训练样本;
基于所述第一训练样本获取所述候选推送指数预测模型的第一损失值,以及基于所述第二训练样本获取所述候选相似度识别模型的第二损失值;
基于所述第一损失值和所述第二损失值,获取所述候选推送指数预测模型和所述候选相似度识别模型组成的所述候选组合模型的所述训练损失。
9.根据权利要求8所述的方法,其中,所述根据所述第一资源样本和所述第一子样本集合,以及所述第二资源样本和所述第二子样本集合,获取所述候选推送指数预测模型的第一训练样本以及所述候选相似度识别模型的第二训练样本,包括:
获取所述样本用户的样本用户信息,并根据所述样本用户信息和所述第一资源样本,得到所述候选推送指数预测模型的所述第一训练样本;
对所述第一子样本集合中的各第一子样本以及所述第二子样本集合中的各第二子样本进行两两配对,得到所述候选相似度识别模型的所述第二训练样本。
10.根据权利要求9所述的方法,其中,所述对所述第一子样本集合中的各第一子样本以及所述第二子样本集合中的各第二子样本进行两两配对,得到所述候选相似度识别模型的所述第二训练样本,包括:
获取所述第一子样本集合中获取任意两个第一子样本并组成第一子样本对,以及获取所述第一子样本集合中的任一第一子样本和所述第二子样本集合中的任一第二子样本并组成第二子样本对,以及获取第二子样本集合中获取任意两个第二子样本并组成第三子样本对,;
根据所述第一子样本对和/或所述第二子样本对和/或所述第三子样本对生成所述候选相似度识别模型的所述第二训练样本,其中,所述第一子样本对和所述第三子样本对的标签信息为相似标签,所述第二子样本对的标签信息为不相似标签。
11.根据权利要求8所述的方法,其中,所述基于所述第一训练样本获取所述候选推送指数预测模型的第一损失值,包括:
获取所述第一训练样本中的样本用户信息和所述第一资源样本;
通过所述候选推送指数预测模型的第一模型支线提取所述样本用户信息中的样本用户特征,以及通过所述候选推送指数预测模型的第二模型支线提取所述第一资源样本中的第一资源样本特征;
基于所述样本用户特征和所述第一资源样本特征,输出所述第一资源样本基于所述样本用户的预测资源推送指数;
获取所述第一训练样本的标签资源推送指数,以得到所述预测资源推送指数基于所述标签资源推送指数的所述第一损失值。
12.根据权利要求8所述的方法,其中,所述基于所述第二训练样本获取所述候选相似度识别模型的第二损失值,包括:
获取所述第二训练样本中的第三子样本和第四子样本;
通过所述候选相似度识别模型的第三模型支线提取所述第三子样本中的第二资源样本特征,以及通过第四模型支线提取所述第四子样本中的第三资源样本特征;
根据所述第二资源样本特征和所述第三资源样本特征,得到所述候选相似度识别模型输出的所述第三子样本和所述第四子样本的预测相似度;
获取所述第二训练样本的标签相似度,以得到所述预测相似度基于所述标签相似度的所述第二损失值。
13.根据权利要求8所述的方法,其中,所述基于所述第一损失值和所述第二损失值,获取所述候选推送指数预测模型和所述候选相似度识别模型的所述候选组合模型的所述训练损失,包括:
获取所述第一损失值的第一权重,和所述第二损失值的第二权重;
根据所述第一权重和所述第二权重对所述第一损失值和所述第二损失值进行加权,得到所述候选推送指数预测模型和所述候选相似度识别模型组成的所述候选组合模型的所述训练损失。
14.一种推送内容的获取方法,其中,所述方法包括:
获取训练好的目标推送指数预测模型,其中,所述目标推送指数预测模型基于上述权利要求1-13任一项所述的推送指数预测模型的训练方法得到;
获取用户端待推送的候选资源内容集合,并通过所述目标推送指数预测模型输出所述候选资源内容集合中各候选资源内容的目标推送指数;
根据所述目标推送指数由高至低的顺序对各候选资源内容进行排序,得到排序后的候选资源内容队列,并从所述候选资源内容队列中获取推送给所述用户端的目标推送资源内容。
15.一种推送指数预测模型的训练装置,其中,所述装置包括:
第一获取模块,用于获取待训练的候选组合模型,其中,所述候选组合模型包括候选推送指数预测模型和候选相似度识别模型;
第二获取模块,用于获取样本用户的第一资源样本和对应的第二资源样本,并对所述第一资源样本和所述第二资源样本分别进行部分特征掩盖,得到所述第一资源样本掩盖后的第一子样本集合以及所述第二资源样本掩盖后的第二子样本集合,其中,所述第一资源样本和所述第二资源样本不同;
第一训练模块,用于根据所述第一资源样本和所述第一子样本集合,以及所述第二资源样本和所述第二子样本集合,对所述候选组合模型进行模型训练,得到所述候选组合模型的训练损失;
调整模块,用于根据所述训练损失对所述候选组合模型进行整体的参数调整,得到参数调整后的候选组合模型;
第二训练模块,用于返回获取下一第一资源样本和下一第二资源样本对参数调整后的候选组合模型继续进行训练,直至训练结束,得到训练好的目标推送指数预测模型和目标相似度识别模型组成的目标组合模型,其中,所述目标推送指数预测模型用于进行线上推送内容的确定。
16.根据权利要求15所述的装置,其中,所述调整模块,还用于:
获取所述候选组合模型的候选资源特征提取层集合,其中,所述候选资源特征提取层集合基于所述候选推送指数预测模型和候选相似度识别模型各自的资源特征提取层组成;
根据所述训练损失对所述候选资源特征提取层集合中的各候选资源特征提取层进行层参数调整,得到调整后的候选资源特征提取层集合,其中,所述候选资源特征提取层集合中各候选资源特征提取层的层参数相同;
基于层参数调整后的候选资源特征提取层集合,得到参数调整后的候选组合模型。
17.根据权利要求15所述的装置,其中,所述第二获取模块,还用于:
获取预设置的样本分级目录,并从资源样本库中获取所述样本用户的所述第一资源样本和所述第二资源样本,其中,所述第一资源样本在所述样本分级目录中所属的第一分级目录与所述第二资源样本在所述样本分级目录中所属的第二分级目录不同;
获取所述第一资源样本中的多个第一掩盖特征组合,以及所述第二资源样本中的多个第二掩盖特征组合;
针对任一第一掩盖特征组合,从所述第一资源样本中对所述第一掩盖特征组合中的各第一掩盖特征进行删除,得到所述第一资源样本掩盖后的第一子样本;
针对任一第二掩盖特征组合,从所述第二资源样本中对所述第二掩盖特征组合中的各第二掩盖特征进行删除,得到所述第二资源样本掩盖后的第二子样本。
18.根据权利要求17所述的装置,其中,所述第二获取模块,还用于:
获取所述第一资源样本中的第一资源样本特征集合,以及所述第一资源样本特征集合中各第一资源样本特征所属的第一候选特征类型;
从各第一候选特征类型中,获取所述第一资源样本特征集合的多个第一掩盖特征类型组合;
针对任一第一掩盖特征类型组合的任一第一掩盖特征类型,获取所述第一掩盖特征类型在所述第一资源样本特征集合中的至少一个第一掩盖特征,以得到所述至少一个第一掩盖特征组成的第一掩盖特征组合。
19.根据权利要求18所述的装置,其中,所述第二获取模块,还用于:
针对任一第一掩盖特征组合,从各第一候选特征类型中,获取至少一个第一掩盖特征类型,以得到所述至少一个第一掩盖特征类型组成的所述第一掩盖特征类型组合。
20.根据权利要求17所述的装置,其中,所述第二获取模块,还用于:
获取所述第二资源样本中的第二资源样本特征集合,以及所述第二资源样本特征集合中各第二资源样本特征所属的第二候选特征类型;
从各第二候选特征类型中,获取所述第二资源样本特征集合的多个第二掩盖特征类型组合;
针对任一第二掩盖特征类型组合的任一第二掩盖特征类型,获取所述第二掩盖特征类型在所述第二资源样本特征集合中的至少一个第二掩盖特征,以得到所述至少一个第二掩盖特征组成的第二掩盖特征组合。
21.根据权利要求20所述的装置,其中,所述第二获取模块,还用于:
针对任一第二掩盖特征组合,从各第二候选特征类型中,获取至少一个第二掩盖特征类型,以得到所述至少一个第二掩盖特征类型组成的所述第二掩盖特征类型组合。
22.根据权利要求15所述的装置,其中,所述第一训练模块,还用于:
根据所述第一资源样本和所述第一子样本集合,以及所述第二资源样本和所述第二子样本集合,获取所述候选推送指数预测模型的第一训练样本以及所述候选相似度识别模型的第二训练样本;
基于所述第一训练样本获取所述候选推送指数预测模型的第一损失值,以及基于所述第二训练样本获取所述候选相似度识别模型的第二损失值;
基于所述第一损失值和所述第二损失值,获取所述候选推送指数预测模型和所述候选相似度识别模型组成的所述候选组合模型的所述训练损失。
23.根据权利要求22所述的装置,其中,所述第一训练模块,还用于:
获取所述样本用户的样本用户信息,并根据所述样本用户信息和所述第一资源样本,得到所述候选推送指数预测模型的所述第一训练样本;
对所述第一子样本集合中的各第一子样本以及所述第二子样本集合中的各第二子样本进行两两配对,得到所述候选相似度识别模型的所述第二训练样本。
24.根据权利要求23所述的装置,其中,所述第一训练模块,还用于:
获取所述第一子样本集合中获取任意两个第一子样本并组成第一子样本对,以及获取所述第一子样本集合中的任一第一子样本和所述第二子样本集合中的任一第二子样本并组成第二子样本对,以及获取第二子样本集合中获取任意两个第二子样本并组成第三子样本对,;
根据所述第一子样本对和/或所述第二子样本对和/或所述第三子样本对生成所述候选相似度识别模型的所述第二训练样本,其中,所述第一子样本对和所述第三子样本对的标签信息为相似标签,所述第二子样本对的标签信息为不相似标签。
25.根据权利要求22所述的装置,其中,所述第一训练模块,还用于:
获取所述第一训练样本中的样本用户信息和所述第一资源样本;
通过所述候选推送指数预测模型的第一模型支线提取所述样本用户信息中的样本用户特征,以及通过所述候选推送指数预测模型的第二模型支线提取所述第一资源样本中的第一资源样本特征;
基于所述样本用户特征和所述第一资源样本特征,输出所述第一资源样本基于所述样本用户的预测资源推送指数;
获取所述第一训练样本的标签资源推送指数,以得到所述预测资源推送指数基于所述标签资源推送指数的所述第一损失值。
26.根据权利要求22所述的装置,其中,所述第一训练模块,还用于:
获取所述第二训练样本中的第三子样本和第四子样本;
通过所述候选相似度识别模型的第三模型支线提取所述第三子样本中的第二资源样本特征,以及通过第四模型支线提取所述第四子样本中的第三资源样本特征;
根据所述第二资源样本特征和所述第三资源样本特征,得到所述候选相似度识别模型输出的所述第三子样本和所述第四子样本的预测相似度;
获取所述第二训练样本的标签相似度,以得到所述预测相似度基于所述标签相似度的所述第二损失值。
27.根据权利要求22所述的装置,其中,所述第一训练模块,还用于:
获取所述第一损失值的第一权重,和所述第二损失值的第二权重;
根据所述第一权重和所述第二权重对所述第一损失值和所述第二损失值进行加权,得到所述候选推送指数预测模型和所述候选相似度识别模型组成的所述候选组合模型的所述训练损失。
28.一种推送内容的获取装置,其中,所述装置包括:
第三获取模块,用于获取训练好的目标推送指数预测模型,其中,所述目标推送指数预测模型基于上述权利要求15-27任一项所述的推送指数预测模型的训练装置得到;
第四获取模块,用于获取用户端待推送的候选资源内容集合,并通过所述目标推送指数预测模型输出所述候选资源内容集合中各候选资源内容的目标推送指数;
推送模块,用于根据所述目标推送指数由高至低的顺序对各候选资源内容进行排序,得到排序后的候选资源内容队列,并从所述候选资源内容队列中获取推送给所述用户端的目标推送资源内容。
29.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-13和/或权利要求14中任一项所述的方法。
30.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-13和/或权利要求14中任一项所述的方法。
31.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-13和/或权利要求14中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311385453.6A CN117473153A (zh) | 2023-10-24 | 2023-10-24 | 推送指数预测模型的训练方法和推送内容的获取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311385453.6A CN117473153A (zh) | 2023-10-24 | 2023-10-24 | 推送指数预测模型的训练方法和推送内容的获取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117473153A true CN117473153A (zh) | 2024-01-30 |
Family
ID=89632374
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311385453.6A Pending CN117473153A (zh) | 2023-10-24 | 2023-10-24 | 推送指数预测模型的训练方法和推送内容的获取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117473153A (zh) |
-
2023
- 2023-10-24 CN CN202311385453.6A patent/CN117473153A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113590796B (zh) | 排序模型的训练方法、装置和电子设备 | |
CN113722493B (zh) | 文本分类的数据处理方法、设备、存储介质 | |
CN113590776B (zh) | 基于知识图谱的文本处理方法、装置、电子设备及介质 | |
CN113190702B (zh) | 用于生成信息的方法和装置 | |
CN112506864B (zh) | 文件检索的方法、装置、电子设备及可读存储介质 | |
CN114861889A (zh) | 深度学习模型的训练方法、目标对象检测方法和装置 | |
CN114036398A (zh) | 内容推荐和排序模型训练方法、装置、设备以及存储介质 | |
CN114037059A (zh) | 预训练模型、模型的生成方法、数据处理方法及装置 | |
CN112560461A (zh) | 新闻线索的生成方法、装置、电子设备及存储介质 | |
CN115048505A (zh) | 语料筛选方法和装置、电子设备、计算机可读介质 | |
CN112989170A (zh) | 应用于信息搜索的关键词匹配方法、信息搜索方法及装置 | |
CN113961765B (zh) | 基于神经网络模型的搜索方法、装置、设备和介质 | |
CN117370524A (zh) | 答复生成模型的训练方法、答复语句生成方法和装置 | |
CN113919424A (zh) | 文本处理模型的训练、文本处理方法、装置、设备和介质 | |
CN117493595A (zh) | 基于大模型的图像搜索方法、装置、设备和介质 | |
CN112925912A (zh) | 文本处理方法、同义文本召回方法及装置 | |
CN112906368A (zh) | 行业文本增量方法、相关装置及计算机程序产品 | |
CN117271884A (zh) | 确定推荐内容的方法、装置、电子设备及存储介质 | |
CN113792230B (zh) | 服务链接方法、装置、电子设备和存储介质 | |
CN112052402B (zh) | 信息推荐方法、装置、电子设备及存储介质 | |
CN114969371A (zh) | 一种联合知识图谱的热度排序方法及装置 | |
CN114817476A (zh) | 语言模型的训练方法、装置、电子设备和存储介质 | |
CN117473153A (zh) | 推送指数预测模型的训练方法和推送内容的获取方法 | |
CN114417886A (zh) | 热点数据的处理方法、装置、电子设备及存储介质 | |
CN113806541A (zh) | 情感分类的方法和情感分类模型的训练方法、装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |